Awesome Pretrained Chinese NLP Models

图片来自于论文: [A Survey of Large Language Models](https://arxiv.org/pdf/2303.18223.pdf)

在自然语言处理领域中，预训练语言模型（Pretrained Language Models）已成为非常重要的基础技术，本仓库主要收集目前网上公开的一些高质量中文预训练模型、中文多模态模型、中文大语言模型等内容(感谢分享资源的大佬)，并将持续更新......

Expand Table of Contents

更新日志
基础大模型
对话大模型
多模态对话大模型
大模型评估基准
在线体验大模型
开源模型库平台
开源数据集库
开源中文指令数据集
Other-Awesome
NLU系列
- BERT
- RoBERTa
- ALBERT
- NEZHA
- XLNET
- MacBERT
- WoBERT
- ELECTRA
- ZEN
- ERNIE
- ERNIE3
- RoFormer
- StructBERT
- Lattice-BERT
- Mengzi-BERT
- ChineseBERT
- TaCL
- MC-BERT
- 二郎神
- PERT
- MobileBERT
- GAU-α
- DeBERTa
- GlyphBERT
- CKBERT
- LERT
- RoCBert
- m3e
- LEALLA

NLG系列
- GPT
- GPT-3
- NEZHA-GEN
- CPM-Generate
- T5
- T5-PEGASUS
- Mengzi-T5
- 盘古α
- EVA
- BART
- 闻仲
- 余元
- RWKV
- Bloom
- PromptCLUE
- ChatYuan
- SkyText
- ProphetNet

NLU-NLG系列
- UniLM
- Simbert
- RoFormer-sim
- CPM-2
- CPT
- 周文王
- GLM
- PLUG
- OPD
Multi-Modal
- WenLan
- CogView
- 紫东太初
- Mengzi-oscar
- R2D2
- Chinese-CLIP
- TaiYi-CLIP
- AltCLIP
- AltDiffusion
- Taiyi-Stable-Diffusion
- wukong
- OFA
- QA-CLIP

Table
- SDCUP

LLM

大规模基础模型：表格中只罗列出参数量大于7B以上模型。

ND: Non-Causal Decoder or Prefix LM

CD: Causal Decoder

ED: Encoder-Decoder

模型	大小	时间	语言	领域	下载	项目地址	机构/个人	架构	文献
CodeLLAma	7/13/34B	2023-08	多语	代码	ckpt	codellama	Meta Research	CD	Paper
Aquila-Base-33B	33B	2023-08	中英	通用	TODO	Aquila	FlagAI	CD
Chinese-LLaMA-2	13B	2023-08	中英	通用	ckpt	Chinese-LLaMA-Alpaca-2	Yiming Cui	CD
TigerBot-Base-13B	13B	2023-08	多语	通用	ckpt	TigerBot	虎博科技	CD
通义千问-base	7B	2023-08	中英	通用	ckpt	Qwen-7B	阿里云	CD	Report
Linly-Chinese-LLaMA-2	7/13B	2023-07	中英	通用	ckpt-7B ckpt-13B	Linly	深圳大学计算机视觉研究所	CD
Chinese-LLaMA-2	7B	2023-07	中英	通用	ckpt	Chinese-LLaMA-Alpaca-2	Yiming Cui	CD
Jiang-base	13B	2023-07	中文	通用	ckpt	/	知未智能	CD
bwx	7/13B	2023-07	中文	通用	ckpt-7B ckpt-13B	/	蓝鲸国数	CD
Llama2	7/13/70B	2023-07	多语	通用	ckpt-7B ckpt-13B ckpt-70B	llama	Meta	CD	Paper
PolyLM	13B	2023-07	多语	通用	ckpt	PolyLM	达摩院	CD	Paper
Baichuan-13B	13B	2023-07	中文	通用	ckpt	Baichuan-13B	百川智能	CD
TigerBot	7B	2023-07	多语	通用	ckpt	TigerBot	虎博科技	CD
书生·浦语-lm	7B	2023-07	中文	通用	ckpt	InternLM	上海人工智能实验室	CD	InternLM-techreport
MPT	7/30B	2023-06	多语	通用	ckpt-7B ckpt-30B	llm-foundry	MosaicML	CD
educhat-base-002	7/13B	2023-06	中英	教育	ckpt-13B ckpt-7B	EduChat	华东师范大学	CD
Baichuan	7B	2023-06	中英	通用	ckpt	baichuan-7B	百川智能	CD
Chinese-Falcon	7B	2023-06	中英	通用	ckpt	Linly	深圳大学计算机视觉研究所	CD	Blog
AtomGPT	13B	2023-06	中英	通用	ckpt	AtomGPT	原子回声	CD
AquilaCode-NV	7B	2023-06	中英	代码	ckpt	Aquila	FlagAI	CD
AquilaCode-TS	7B	2023-06	中英	代码	ckpt	Aquila	FlagAI	CD
Aquila	7B	2023-06	中英	通用	ckpt	Aquila	FlagAI	CD
Chinese-LLaMA	33B	2023-06	中英	通用	ckpt	Chinese-LLaMA-Alpaca	Yiming Cui	CD
TigerBot	7B	2023-06	多语	通用	ckpt	TigerBot	虎博科技	CD
Panda-OpenLLaMA	7B	2023-05	中英	通用	ckpt	pandallm	dandelionsllm	CD
Panda	7/13B	2023-05	中英	通用	ckpt-13B ckpt-7B	pandallm	dandelionsllm	CD
OpenLLaMA	13B	2023-05	中英	通用	ckpt	Linly	深圳大学计算机视觉研究所	CD
LaWGPT	7B	2023-05	中英	法律	ckpt	LawGPT	Pengxiao Song	CD
BiLLa-LLM	7B	2023-05	中英	通用	ckpt	BiLLa	Zhongli Li	CD
Ziya-LLaMA-Reward	7B	2023-05	中英	通用	ckpt	Fengshenbang-LM	IDEA研究院	CD
YuYan	11B	2023-04	中文	通用	ckpt	/	网易伏羲	CD	Paper
Chinese-LLaMA	33B	2023-04	中文	通用	ckpt	Linly	深圳大学计算机视觉研究所	CD	Blog
Chinese-LLaMA	13B	2023-04	中文	通用	ckpt	Linly	深圳大学计算机视觉研究所	CD	Blog
Chinese-LLaMA	7B	2023-04	中文	通用	ckpt	Linly	深圳大学计算机视觉研究所	CD	Blog
OpenChineseLLaMA	7B	2023-04	中英	通用	ckpt	OpenChineseLLaMA	OpenLMLab	CD
MOSS-003	16B	2023-04	中英	通用	ckpt	MOSS	复旦大学	CD
BBT-2-Text	13B	2023-04	中文	通用	申请下载	BBT-FinCUGE-Applications	超对称	CD	Paper
BBT-2-12B-Text	12B	2023-04	中文	通用	申请下载	BBT-FinCUGE-Applications	超对称	CD	Paper
Chinese-LLaMA	13B	2023-04	中英	通用	ckpt	Chinese-LLaMA-Alpaca	Yiming Cui	CD
flan-ul2	20B	2023-03	多语	通用	ckpt	ul2	Google	ED	Paper
CPM-Bee	10B	2023-01	中英	通用	ckpt-10B ckpt-5B	CPM-Bee	OpenBMB	CD
BLOOM	176B	2022-11	多语	通用	ckpt-95000	Megatron-DeepSpeed	BigScience	CD	Paper
BLOOMZ	176B	2022-11	多语	通用	ckpt-498	Megatron-DeepSpeed	BigScience	CD	Paper
flan-t5-xxl	11B	2022-11	多语	通用	ckpt	t5x	Google	ED	paper
CPM-Ant+	10B	2022-10	中英	通用	ckpt	CPM-Live	OpenBMB	CD	blog
GLM	130B	2022-10	中英	通用	申请下载	GLM-130B	清华大学	ND	paper
CPM-Ant	10B	2022-09	中文	通用	ckpt	CPM-Live	OpenBMB	CD	blog
GLM	10B	2022-09	中文	通用	ckpt	GLM	清华大学	ND	paper
CodeGeeX	13B	2022-06	多语	代码	申请下载	CodeGeeX	清华大学	CD	blog
源1.0	245B	2021-09	中文	通用	API申请	Yian-1.0	浪潮	CD	paper
CPM-2	11B	2021-06	中文	通用	申请下载	CPM	智源研究院	ED	paper
CPM-2	10B	2021-06	中英	通用	申请下载	CPM	智源研究院	ED	paper
CPM-2	200B	2021-06	中英	通用	申请下载	CPM	智源研究院	ED	paper
PanGu-Alpha	13B	2021-05	中文	通用	ckpt	PanGu-Alpha	鹏城实验室	CD	paper
PanGu-Alpha	200B	2021-05	中文	通用	待发布	PanGu-Alpha	鹏城实验室	CD	paper
PLUG	27B	2021-04	中文	通用	申请下载	AliceMind	阿里巴巴	ED
GPT-3	13B	2021-04	中文	通用	待发布	GPT-3	达摩院	CD
GPT-3	30B	2021-04	中文	通用	待发布	GPT-3	达摩院	CD

模型	大小	时间	语言模型	非语言模型	语言	领域	下载	项目地址	机构/个人	文献
IDEFICS	9/80B	2023-08	llama	CLIP-ViT	中英	图文-通用	ckpt-9B ckpt-80B	m4-logs	HuggingFaceM4	Paper
Qwen-VL	7B	2023-08	Qwen-7B	Openclip ViT-bigG	中英	通用	ckpt	Qwen-VL	阿里云
Qwen-VL-chat	7B	2023-08	Qwen-7B	Openclip ViT-bigG	中英	通用	ckpt	Qwen-VL	阿里云
LLasM	7B	2023-07	Chinese-Llama2	whisper-large-v2	中英	语音	ckpt	LLaSM	北京灵琐
Chinese-LLaVA	7B	2023-07	Chinese-Llama2	Clip-vit	中英	视觉	ckpt	Chinese-LLaVA	北京灵琐
RemoteGLM	6B	2023-07	VisualGLM-6B	VisualGLM-6B	中文	遥感	TODO	RemoteGLM	lzw-lzw
VisualCLA	7B	2023-07	Chinese-Alpaca-Plus	CLIP-ViT-L/14	中文	视觉	ckpt	Visual-Chinese-LLaMA-Alpaca	Ziqing Yang
yuren	7B	2023-07	baichuan-7B	CLIP	中英	视觉	ckpt	yuren-baichuan-7b	Pleisto
VisCPM-Chat	10B	2023-06	CPM-Bee	Q-Former	中英	视觉	ckpt	VisCPM	OpenBMB
VisCPM-Paint	10B	2023-06	CPM-Bee	Stable Diffusion 2.1	中英	视觉	ckpt	VisCPM	OpenBMB
XrayPULSE	7B	2023-06	PULSE	MedCLIP	中文	医学	ckpt	XrayPULSE	OpenMEDLab
SEEChat	6B	2023-06	ChatGLM	CLIP-ViT	中文	/	ckpt	SEEChat	360
Ziya-BLIP2-14B-Visual-v1	14B	2023-06	LLaMA-13B	BLIP2	中英	通用	ckpt	Fengshenbang-LM	IDEA研究院
Video-LLaMA-BiLLA	7B	2023-05	BiLLa-7B	MiniGPT-4	中英	通用	ckpt	Video-LLaMA	达摩院多语言NLP	Paper
Video-LLaMA-Ziya	13B	2023-05	Ziya-13B	MiniGPT-4	中英	通用	ckpt	Video-LLaMA	达摩院多语言NLP	Paper
XrayGLM	6B	2023-05	ChatGLM-6B	BLIP2-Qformer	中英	医学	ckpt-300 ckpt-3000	XrayGLM	澳门理工大学
X-LLM		2023-05	ChatGLM	ViT-g	中文	/	TODO	X-LLM	中科院自动化所	Paper
VisualGLM	6B	2023-05	ChatGLM-6B	BLIP2-Qformer	中英	视觉	ckpt	VisualGLM-6B	清华大学

名称	大小	时间	语言	下载	项目地址	作者	备注
TransGPT-sft	346k	2023-07	中文	dataset	TransGPT	北京交通大学
TransGPT-pt	58k	2023-07	中文	dataset	TransGPT	北京交通大学
ShareGPT-Chinese-English	90K	2023-07	中英	dataset	llama2-Chinese-chat	Ke Bai
educhat-sft-002-data-osm	400w	2023-06	中英	dataset	EduChat	华东师范大学	教育
chatgpt-corpus	3M	2023-06	中文	dataset	chatgpt-corpus	plex
Simle	350k	2023-06	中文	dataset	smile	qiuhuachuan	心理健康
QiZhen	20k	2023-06	中文	dataset	QiZhenGPT	浙江大学	医学
BayLing-80	80	2023-06	中英	dataset	BayLing	中国科学院	多轮指令
Tigerbot-dataset	120k	2023-06	中英	dataset	TigerBot	虎博科技
lawyer-llama	/	2023-05	中文	dataset	lawyer-llama	Quzhe Huang	法律
Bactrian-X	67K	2023-05	多语	dataset	bactrian-x	MBZUAI
CrimeKgAssitant	52k	2023-05	中文	dataset	LAW-GPT	hongchengliu	法律
moss-002-sft-data	1.1M	2023-04	中英	dataset	MOSS	复旦大学
moss-003-sft-data	1.1M	2023-04	中英	dataset	MOSS	复旦大学
moss-003-sft-plugin-data	300K	2023-04	中英	dataset	MOSS	复旦大学
Safety-Prompts	100K	2023-04	中文	dataset	Safety-Prompts	清华大学	评测平台
OASST1	/	2023-04	多语	dataset	Open-Assistant	OpenAssistant
ShareChat	90K	2023-04	中英	dataset	ShareChat	czhko
GPT-4-LLM	52K	2023-04	中文	dataset	GPT-4-LLM	Instruction-Tuning-with-GPT-4	paper
COIG	200K	2023-04	中文	dataset	FlagInstruct	BAAI	paper
RedGPT	50k	2023-04	中文	dataset	RedGPT	MiniGPT
shareGPT_cn	20k	2023-04	中文	dataset	shareGPT_cn	shareAI
generated_chat_0.4M	0.4M	2023-04	中文	dataset	BELLE	Ke Technologies	角色对话
multiturn_chat_0.8M	0.8M	2023-04	中文	dataset	BELLE	Ke Technologies	多轮任务
school_math_0.25M	0.25M	2023-04	中文	dataset	BELLE	Ke Technologies	数学题
Zhihu-KOL	/	2023-03	中文	dataset	Zhihu-KOL	Rui Wang
InstructionWild	104k	2023-03	中英	dataset	InstructionWild	Xue Fuzhao
Alpaca-CoT	/.	2023-03	中英	dataset	Alpaca-CoT	Qingyi Si
GuanacoDataset	/	2023-03	多语	dataset	guanaco-model	Guanaco
Traditional-Chinese-alpaca	52K	2023-03	中文	dataset	Traditional-Chinese Alpaca	NTU NLP Lab	gpt翻译
alpaca_chinese_dataset	/	2023-03	中文	dataset	alpaca_chinese_dataset	akou	人工校验
alpaca-chinese-dataset	/	2023-03	中文	dataset	alpaca-chinese-dataset	carbonz	机器翻译
train_2M_CN	2M	2023-03	中文	dataset	BELLE	Ke Technologies
train_1M_CN	1M	2023-03	中文	dataset	BELLE	Ke Technologies
train_0.5M_CN	0.5M	2023-03	中文	dataset	BELLE	Ke Technologies
HC3 人类-ChatGPT 问答	/	2023-03	中文	dataset	chatgpt-comparison-detection	SimpleAI
firefly-train-1.1M	1.1M	2023-03	中文	dataset	Firefly	Jianxin Yang

模型	版本	TensorFlow	PyTorch	作者	源地址	应用领域
BERT-Base	base	Google Drive		Google Research	github	通用
BERT-wwm	base	Google Drive 讯飞云-07Xj	Google Drive	Yiming Cui	github	通用
BERT-wwm-ext	base	Google Drive 讯飞云-4cMG	Google Drive	Yiming Cui	github	通用
bert-base-民事	base	阿里云		THUNLP	github	司法
bert-base-刑事	base	阿里云		THUNLP	github	司法
BAAI-JDAI-BERT	base	京东云		JDAI	github	电商客服对话
FinBERT	base	Google Drive 百度网盘-1cmp	Google Drive 百度网盘-986f	Value Simplex	github	金融科技领域
EduBERT	base	好未来AI	好未来AI	tal-tech	github	教育领域
guwenbert-base	base		百度网盘-4jng huggingface	Ethan	github	古文领域
guwenbert-large	large		百度网盘-m5sz huggingface	Ethan	github	古文领域
BERT-CCPoem	small		thunlp	THUNLP-AIPoet	github	古典诗歌

模型	版本	TensorFlow	PyTorch	作者	源地址	应用领域
ChineseBERT	base		huggingface	ShannonAI	github	通用
ChineseBERT	large		huggingface	ShannonAI	github	通用

模型	版本	TensorFlow	PyTorch	作者	源地址	应用领域
RoBERTa-tiny-clue	tiny	Google Drive	百度网盘-8qvb	CLUE	github	通用
RoBERTa-tiny-pair	tiny	google drive	百度网盘-8qvb	CLUE	github	通用
RoBERTa-tiny3L768-clue	tiny	Google Drive		CLUE	github	通用
RoBERTa-tiny3L312-clue	tiny	google drive	百度网盘-8qvb	CLUE	github	通用
RoBERTa-large-pair	large	Google Drive	百度网盘-8qvb	CLUE	github	通用
RoBERTa-large-clue	large	google drive	百度网盘-8qvb	CLUE	github	通用
RBT3	3层base	Google Drive 讯飞云-b9nx	Google Drive	Yiming Cui	github	通用
RBTL3	3层large	Google Drive 讯飞云-vySW	Google Drive	Yiming Cui	github	通用
RBTL4	4层large	讯飞云-e8dN		Yiming Cui	github	通用
RBTL6	6层large	讯飞云-XNMA		Yiming Cui	github	通用
RoBERTa-wwm-ext	base	Google Drive 讯飞云-Xe1p	Google Drive	Yiming Cui	github	通用
RoBERTa-wwm-ext-large	large	Google Drive 讯飞云-u6gC	Google Drive	Yiming Cui	github	通用
RoBERTa-base	base	Google Drive 百度网盘	Google Drive 百度网盘	brightmart	github	通用
RoBERTa-Large	large	Google Drive 百度网盘	Google Drive	brightmart	github	通用
RoBERTa-tiny	tiny	huggingface	huggingface	DBIIR @ RUC	UER	通用
RoBERTa-mini	mini	huggingface	huggingface	DBIIR @ RUC	UER	通用
RoBERTa-small	small	huggingface	huggingface	DBIIR @ RUC	UER	通用
RoBERTa-medium	medium	huggingface	huggingface	DBIIR @ RUC	UER	通用
RoBERTa-base	base	huggingface	huggingface	DBIIR @ RUC	UER	通用

模型	版本	TensorFlow	PyTorch	作者	源地址	应用领域
Albert_tiny	tiny	Google Drive	Google Drive	brightmart	github	通用
Albert_base_zh	base	Google Drive	Google Drive	brightmart	github	通用
Albert_large_zh	large	Google Drive	Google Drive	brightmart	github	通用
Albert_xlarge_zh	xlarge	Google Drive	Google Drive	brightmart	github	通用
Albert_base	base	Google Drive		Google Research	github	通用
Albert_large	large	Google Drive		Google Research	github	通用
Albert_xlarge	xlarge	Google Drive		Google Research	github	通用
Albert_xxlarge	xxlarge	Google Drive		Google Research	github	通用

模型	版本	TensorFlow	PyTorch	作者	源地址	应用领域
NEZHA-base	base	Google Drive 百度网盘-ntn3	lonePatient	HUAWEI	github	通用
NEZHA-base-wwm	base	Google Drive 百度网盘-f68o	lonePatient	HUAWEI	github	通用
NEZHA-large	large	Google Drive 百度网盘-7thu	lonePatient	HUAWEI	github	通用
NEZHA-large-wwm	large	Google Drive 百度网盘-ni4o	lonePatient	HUAWEI	github	通用
WoNEZHA (word-base)	base	百度网盘-qgkq		ZhuiyiTechnology	github	通用

模型	版本	TensorFlow	PyTorch	作者	源地址	应用领域
MacBERT-base	base	Google Drive 讯飞云-E2cP		Yiming Cui	github	通用
MacBERT-large	large	Google Drive 讯飞云-3Yg3		Yiming Cui	github	通用

模型	版本	TensorFlow	PyTorch	作者	源地址	应用领域
WoBERT	base	百度网盘-kim2		ZhuiyiTechnology	github	通用
WoBERT-plus	base	百度网盘-aedw		ZhuiyiTechnology	github	通用

模型	版本	TensorFlow	PyTorch	作者	源地址	应用领域
XLNet-base	base	Google Drive 讯飞云-uCpe	Google Drive	Yiming Cui	github	通用
XLNet-mid	middle	Google Drive 讯飞云-68En	Google Drive	Yiming Cui	github	通用
XLNet_zh_Large	large	百度网盘		brightmart	github	通用

模型	版本	PaddlePaddle	PyTorch	作者	源地址	应用领域
ernie-3.0-base	12-layer, 768-hidden, 12-heads	link	huggingface	PaddlePaddle	github	通用
ernie-3.0-medium	6-layer, 768-hidden, 12-heads	link	huggingface	PaddlePaddle	github	通用
ernie-3.0-mini	6-layer, 384-hidden, 12-heads	link	huggingface	PaddlePaddle	github	通用
ernie-3.0-micro	4-layer, 384-hidden, 12-heads	link	huggingface	PaddlePaddle	github	通用
ernie-3.0-nano	4-layer, 312-hidden, 12-heads	link	huggingface	PaddlePaddle	github	通用

模型	版本	PyTorch	作者	源地址	备注
m3e-base	base	m3e-base	Moka-AI	uniem	文本嵌入模型
M3e-small	Small	m3e-small	Moka-AI	uniem	文本嵌入模型

模型	版本	TensorFlow	作者	源地址	应用领域
ELECTRA-180g-large	large	Google Drive 讯飞云-Yfcy	Yiming Cui	github	通用
ELECTRA-180g-small-ex	small	Google Drive 讯飞云-GUdp	Yiming Cui	github	通用
ELECTRA-180g-base	base	Google Drive 讯飞云-Xcvm	Yiming Cui	github	通用
ELECTRA-180g-small	small	Google Drive 讯飞云-qsHj	Yiming Cui	github	通用
legal-ELECTRA-large	large	Google Drive 讯飞云-7f7b	Yiming Cui	github	司法领域
legal-ELECTRA-base	base	Google Drive 讯飞云-7f7b	Yiming Cui	github	司法领域
legal-ELECTRA-small	small	Google Drive 讯飞云-7f7b	Yiming Cui	github	司法领域
ELECTRA-tiny	tiny	Google Drive 百度网盘-rs99	CLUE	github	通用

模型	版本	TensorFlow	PyTorch	作者	源地址	应用领域
ZEN-Base	base		Google Drive 百度网盘	Sinovation Ventures AI Institute	github	通用
Erlangshen-ZEN2	large		huggingface	IDEA-CCNL	github	通用

模型	版本	PaddlePaddle	作者	源地址	应用领域
ernie-1.0-base	base	link	PaddlePaddle	github	通用
ernie_1.0_skep_large	large	link	Baidu	github	情感分析
ernie-gram	base	link	Baidu	github	通用

模型	版本	TensorFlow	作者	源地址	应用领域
roformer	base(L12)	百度网盘-xy9x	ZhuiyiTechnology	github	通用
roformer	small(L6)	百度网盘-gy97	ZhuiyiTechnology	github	通用
roformer-char	base(L12)	百度网盘-bt94	ZhuiyiTechnology	github	通用
roformerV2	small(L6)	百度网盘-ttn4 追一	ZhuiyiTechnology	github	通用
roformerV2	base(L12)	百度网盘-pfoh 追一	ZhuiyiTechnology	github	通用
roformerV2	large(L24)	百度网盘-npfv 追一	ZhuiyiTechnology	github	通用

模型	版本	PyTorch	作者	源地址	应用领域
LatticeBERT	tiny(L4)	阿里云	Alibaba	github	通用
LatticeBERT	small(L6)	阿里云	Alibaba	github	通用
LatticeBERT	base(L12)	阿里云	Alibaba	github	通用

模型	版本	TensorFlow	PyTorch	作者	源地址	应用领域
Mengzi-BERT	base(L12)		huggingface	Langboat	github	通用
Mengzi-BERT-fin	base(L12)		huggingface	Langboat	github	金融财经

模型	版本	TensorFlow	PyTorch	作者	源地址	应用领域
PERT-base	base(12L)	百度网盘-rcsw	huggingface	Yiming Cui	github	通用
PERT-large	large(24L)	百度网盘-e9hs	huggingface	Yiming Cui	github	通用

模型	版本	TensorFlow	作者	源地址	应用领域
Chinese-MobileBERT-base-f2	base	百度网盘-56bj	Yiming Cui	github	通用
Chinese-MobileBERT-base-f4	base	百度网盘-v2v7	Yiming Cui	github	通用
Chinese-MobileBERT-large-f2	large	百度网盘-6m5a	Yiming Cui	github	通用
Chinese-MobileBERT-large-f4	large	百度网盘-3h9b	Yiming Cui	github	通用

模型	版本	PyTorch	作者	源地址	应用领域
DeBERTa-v2-Large	large	huggingface	IDEA-CCNL	github	通用
DeBERTa-v2-xLarge	xlarge	huggingface	IDEA-CCNL	github	通用
DeBERTa-v2	base	huggingface	IDEA-CCNL	github	通用

模型	版本	PyTorch	作者	源地址	应用领域
pai-ckbert-base-zh	base	huggingface	Alibaba	github	通用
pai-ckbert-large-zh	large	huggingface	Alibaba	github	通用
pai-ckbert-huge-zh	huge	huggingface	Alibaba	github	通用

Files

README.md

Latest commit

History

README.md

File metadata and controls

Awesome Pretrained Chinese NLP Models

Expand Table of Contents

LLM

ChatLLM

MultiModal-ChatLLM

中文指令数据集

大模型评估基准

1. C-Eval

2. FlagEval

3. SuperCLUElyb

4. XiezhiBenchmark

5. Open LLM Leaderboard

6. 中文大模型安全评测平台

在线体验大模型

1. ChatGPT--OpenAI

2. New bing--微软

3. 文心一言--百度

4. 通义大模型--阿里

5. 星火认知大模型--科大讯飞

6. Claude--Anthropic

7. ChatGLM--智谱AI

8. 天工大模型--昆仑万维

9. 序列猴子大模型--出门问问

10. MOSS--复旦大学

11. 360智脑大模--360

12. 曹植GPT大语言模型--达观数据

13. 日日新--商汤

14. 天燕大模型--APUS

15. 元乘象--智子引擎

16. 西湖大模型--西湖心辰

17. Dongni--深思考

18. 山海大模型--云知声

19. MiniMax大模型--MiniMax

开源模型库平台

开源数据集库

other-awesome

1. Awesome-Chatgpt github

2. Awesome-ChatGPT-Prompts github

3. Awesome-LLM github

4. Awesome-LangChain github

5. Awesome-Open-Gpt github

6. Awesome-Multimodal-Large-Language-Models github

7. Awesome-Transformer-Attention github

8. Awesome-Prompt-Engineering github

9. Awesome-AITools github

10. Awesome-Chinese-LLM github

11. Awesome-LLM4Tool github

12. Awesome LLM Security github

13. Awesome AI Agents github

14. Awesome-LLM-Large-Language-Models-Notes github

15. Awesome-Efficient-LLM github

16. Awesome Datasets for LLM Training github

17. Awesome-Align-LLM-Human github

18. Awesome RLHF (RL with Human Feedback) github

19. Prompt-in-context-learning github

20. Awesome Instruction Learning github

21. Awesome-Foundation-Models github

22. Awesome-AI-Devtools github

23. Awesome-Autonomous-GPT github

NLU系列

BERT

ChineseBERT

RoBERTa

ALBERT

NEZHA

MacBERT

WoBERT

XLNET

ELECTRA

ZEN

ERNIE

ERNIE3

RoFormer

StructBERT

模型	版本	TensorFlow	PyTorch	作者	源地址	应用领域
Chinese-LERT-small	15m	百度网盘-4vuy	huggingface	Yiming Cui	github	通用
Chinese-LERT-base	400m	百度网盘-9jgi	huggingface	Yiming Cui	github	通用
Chinese-LERT-large	1.2G	百度网盘-s82t	huggingface	Yiming Cui	github	通用

模型	版本	PyTorch	作者	源地址	备注
LEALLA-base	base	LEALLA-base	Google Research	/	文本嵌入模型
LEALLA-large	large	LEALLA-large	Google Research	/	文本嵌入模型

模型	版本	TensorFlow	PyTorch	作者	源地址	应用领域
GPT2	30亿语料		Google Drive 百度网盘-ffz6	Caspar ZHANG	gpt2-ml	通用
GPT2	15亿语料		Google Drive 百度网盘-q9vr	Caspar ZHANG	gpt2-ml	通用
CDial-GPTLCCC-base	base		huggingface	thu-coai	CDial-GPT	中文对话
CDial-GPT2LCCC-base	base		huggingface	thu-coai	CDial-GPT	中文对话
CDial-GPTLCCC-large	large		huggingface	thu-coai	CDial-GPT	中文对话
GPT2-dialogue	base		Google Drive 百度网盘-osi6	yangjianxin1	GPT2-chitchat	闲聊对话
GPT2-mmi	base		Google Drive 百度网盘-1j88	yangjianxin1	GPT2-chitchat	闲聊对话
GPT2-散文模型	base		Google Drive 百度网盘-fpyu	Zeyao Du	GPT2-Chinese	散文
GPT2-诗词模型	base		Google Drive 百度网盘-7fev	Zeyao Du	GPT2-Chinese	诗词
GPT2-对联模型	base		Google Drive 百度网盘-i5n0	Zeyao Du	GPT2-Chinese	对联
roformer-gpt	base(L12)	百度网盘-2nnn		ZhuiyiTechnology	github	通用

模型	版本	TensorFlow	PyTorch	作者	源地址	应用领域
NEZHA-Gen	base	Google Drive 百度网盘-rb5m		HUAWEI	github	通用
NEZHA-Gen	base	Google Drive 百度网盘-ytim		HUAWEI	github	诗歌

模型	版本	Keras	PyTorch	作者	源地址	应用领域
T5 PEGASUS	base	百度网盘-3sfn		ZhuiyiTechnology	github	通用
T5 PEGASUS	small	百度网盘-qguk		ZhuiyiTechnology	github	通用

模型	版本	资源	下载地址	作者	源地址	应用领域
盘古α-2.6B	2.6G	项目首页	模型下载	PCL-Platform.Intelligence	github	通用
盘古α-13B	12G	项目首页	模型下载	PCL-Platform.Intelligence	github	通用
盘古α-2.6B pytorch版本	2.6G	项目首页	模型下载	PCL-Platform.Intelligence	github	通用
盘古α-13B pytorch版本	12G	项目首页	模型下载	PCL-Platform.Intelligence	github	通用

模型	版本	介绍	模型下载	作者	源地址	应用领域	备注
EVA	28亿参数	项目首页	模型下载	thu-coai	github	中文开放域对话	需要登陆才能下载
EVA2.0-xLarge	xlarge	项目首页	huggingface	thu-coai	github	中文开放域对话
EVA2.0-large	large	项目首页	huggingface	thu-coai	github	中文开放域对话
EVA2.0-base	base	项目首页	huggingface	thu-coai	github	中文开放域对话

模型	版本	TensorFlow	PyTorch	作者	源地址	应用领域
BART-base	base		huggingface	fastNLP	github	中文通用
BART-large	large		huggingface	fastNLP	github	中文通用

模型	版本	PyTorch	作者	源地址	应用领域
RWKV	base(L12)	github	PENG Bo	github	小说
RWKV	7B	huggingface	PENG Bo	github	小说
RWKV	14B	huggingface	PENG Bo	github	小说

模型	版本	PyTorch	作者	源地址	应用领域
PromptCLUE	base(L12)	huggingface	ClueAI	github	通用
PromptCLUE-v1-5	base(L12)	huggingface	ClueAI	github	通用
PromptCLUE-large	large	API在线调用	ClueAI	github	通用