本项目是山东大学软件学院2021年学生实训项目的创新项目成果,在本项目中,基于知网等论文网站的计算机科学类论文,构建出的面向计算机科学科研方向的知识图谱。
科技全书项目团队组
团队成员:
队长:陈思辰:
队员:谢海逸:
队员:闫硕:
队员:马龙飞:
队员:汪汝毅:
Python
Selenium
Neo4J
Inverted Index
Py2neo
jieba
Word2vec
Naive Bayesian
Vue
Flask
Cytoscape.js
ECharts.js
√ 对于论文网站的数据爬虫
√ 基本的数据库架构
√ 10万数据规模级别的数据库
√ 自动爬取更新的数据爬虫
√ 更高效的Neo4J数据库
O 优化之后的数据库架构
O 实际部署在超大数据库上
√ 实体识别算法
√ 智能问答算法
O 模糊查询算法
√ 基本的前端页面框架
√ 关键词/作者查询文章
√ 查询文章属性
√ 查询文章二级关系网
O 知识问答模块
O 模糊查询功能
O 优化的数据库查询与功能逻辑
O 优化的更美观的前端页面
1.优化了数据库结构;
2.文章查询关系网可以查询二级关系网了;
3.关键词查询文章功能可以使用了;
4.现在可以点击文章节点弹出下载链接了;
5.对CSS和JS进行了本地化处理,使加载速度更快了。
1.整合了当前已经实现的功能至前端;
2.优化了项目的结构,使得更加易于了解与修改;
3.修复了大量的已知问题。
1.新增了文章查询关系网功能;
2.修复了部分已知问题。
1.新增了查询文章属性功能;
2.修复了部分已知问题。
1.修复了部分已知问题。
1.新增了关键词/作者查询文章功能;
2.修改了前端界面;
3.项目能够实际运行了。
1.项目实际创建与基本框架确立。