中华经典文献数据集
本项目旨在收集整理尽可能多的中华古籍和古文献文本数据,供相关学科研究人员使用。由于优质古文相关的自然语言处理数据集较少,本项目试图填报相关方向的空白。
参考传统四部分类方法,以经史子集四大类和四库全书目录为基础分类方式,并做出适度调整。
四书五经
正史类、编年史类等12类
先秦诸子单独划分为诸子类,汉后相关学科划为对应学科类
本项目参考自中华经典古籍库、国学导航、中国哲学书电子书计划。试图收集整理数据化中华经典古文献与书籍并制作相关数据集。由于校勘与收集工作庞大驳杂,本项目还在逐步完善当中。
公益性质项目,有兴趣一起完善的朋友可以在issue里留言,或者私信共同协作。
@misc{ChineseliteratureDataset,
author = {Nursery},
title = {ChineseliteratureDataset},
year = {2023},
publisher = {GitHub},
journal = {GitHub repository},
howpublished = {\url{https://github.com/enze5088/ChineseliteratureDataset}},
}