Name		Name	Last commit message	Last commit date
parent directory ..
1.MoE论文		1.MoE论文
1.attention		1.attention
2.MoE经典论文简牍		2.MoE经典论文简牍
2.layer_normalization		2.layer_normalization
3.LLM MoE ：Switch Transformers		3.LLM MoE ：Switch Transformers
3.位置编码		3.位置编码
4.tokenize分词		4.tokenize分词
5.token及模型参数		5.token及模型参数
6.激活函数		6.激活函数
MHA_MQA_GQA		MHA_MQA_GQA
Transformer架构细节		Transformer架构细节
bert变种		bert变种
bert细节		bert细节
chatglm系列模型		chatglm系列模型
llama 2代码详解		llama 2代码详解
llama 3		llama 3
llama系列模型		llama系列模型
解码策略（Top-k & Top-p & Temperatu		解码策略（Top-k & Top-p & Temperatu
README.md		README.md

README.md

02.大语言模型架构

2.1 Transformer模型

2.layer_normalization

4.tokenize分词

5.token及模型参数

2.2 注意力

2.3 解码部分

解码策略（Top-k & Top-p & Temperature）

2.4 BERT

Transformer架构细节

2.5 常见大模型

llama系列模型

chatglm系列模型

llama 2代码详解

2.6 MoE

2.MoE经典论文简牍

3.LLM MoE ：Switch Transformers