Skip to content

enze5088/ChineseliteratureDataset

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

35 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

ChineseliteratureDataset-中华经典文献数据集

中华经典文献数据集

项目简介

本项目旨在收集整理尽可能多的中华古籍和古文献文本数据,供相关学科研究人员使用。由于优质古文相关的自然语言处理数据集较少,本项目试图填报相关方向的空白。

参考传统四部分类方法,以经史子集四大类和四库全书目录为基础分类方式,并做出适度调整。

四书五经

正史类、编年史类等12类

先秦诸子单独划分为诸子类,汉后相关学科划为对应学科类

其他

本项目参考自中华经典古籍库、国学导航、中国哲学书电子书计划。试图收集整理数据化中华经典古文献与书籍并制作相关数据集。由于校勘与收集工作庞大驳杂,本项目还在逐步完善当中。

公益性质项目,有兴趣一起完善的朋友可以在issue里留言,或者私信共同协作。

古籍资源站参考

引用

@misc{ChineseliteratureDataset,
  author = {Nursery},
  title = {ChineseliteratureDataset},
  year = {2023},
  publisher = {GitHub},
  journal = {GitHub repository},
  howpublished = {\url{https://github.com/enze5088/ChineseliteratureDataset}},
}

About

中华经典文献数据集

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published