KBQA-culture

图数据库：neo4j

TO DO:

~~1.本体构建~~

~~2.poetry数据集的读取~~

~~3.爬虫爬取相关数据~~

~~4.知识抽取，生成实体和关系~~

~~4.知识融合，设计实体对齐算法~~

5.实现可视化

6.实现问答系统

step1 生成数据

1.读取数据集

运行"build_graph.py"

3090跑完大概要2h(没有优化)

或

直接下载已经生成好的数据,下载好后可直接跳到第四步链接： https://pan.baidu.com/s/1mvyxhAPaiEp_qAd7v4jwIw 提取码: i75s

2.爬虫爬取

已爬好的文件会在后续给出

运行spider_tools文件夹下的run.py，按提示爬取四个网站，生成四个文件夹，请让每个文件夹仅保留一个csv文件。

step2 知识抽取

1.关系抽取

1.跑Knowledge_Extraction下的train.py得到模型model.pt 2.运行Run.py抽取关系

step3 知识融合

运行Entity_Normalization下的normalize.py

step4 知识存储

离线导入:

1.复制data下的poetry.csv和Entity_Normalization下的所有csv 到neo4j项目的import文件夹

Neo4j Destop可直接点击项目的“Open”->"Open folder"->"Import"快速定位

2.关闭neo4j项目

3.打开neo4j项目终端，执行以下命令

bin\neo4j-admin database import full
--multiline-fields=true
--nodes import\character.csv 
--nodes import\poetry.csv 
--nodes import\location.csv
--nodes import\area.csv
--nodes import\calligraphy.csv
--relationships import\total_rels.csv
dbName

注意!输入命令时参数之间只有空格没有换行，Linux需用/分隔路径

4.启动neo4j项目，并创建名为dbName的数据库

step5 应用

TO DO

Name		Name	Last commit message	Last commit date
Latest commit History 19 Commits
.idea		.idea
Entity_Normalization		Entity_Normalization
Knowledge_Extraction		Knowledge_Extraction
data/Poetry-master		data/Poetry-master
spider_tools		spider_tools
LICENSE		LICENSE
README.md		README.md
build_graph.py		build_graph.py
main.py		main.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

KBQA-culture

step1 生成数据

1.读取数据集

2.爬虫爬取

step2 知识抽取

1.关系抽取

step3 知识融合

step4 知识存储

离线导入:

step5 应用

About

Releases

Packages

Languages

License

YaoKong/KBQA-culture

Folders and files

Latest commit

History

Repository files navigation

KBQA-culture

step1 生成数据

1.读取数据集

2.爬虫爬取

step2 知识抽取

1.关系抽取

step3 知识融合

step4 知识存储

离线导入:

step5 应用

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages