Skip to content

Latest commit

 

History

History
37 lines (23 loc) · 1.31 KB

README.md

File metadata and controls

37 lines (23 loc) · 1.31 KB

如何使用本工具

介绍

这个工具用于清洗 Ownthink 的知识图谱 RDF 数据,将它变成属性图模型。产出结果为一个 vertex.csv 文件和 edge.csv 文件, 分别是清洗后的顶点数据和边数据。目前只对数据进行了简单去重。

你也可以直接去 kaggle 下载完全去重后的数据(包涵原始数据和 Nebula 1.x 版本数据)。

如何使用

使用 --path 参数指定知识图谱的三元组数据的路径

$ go build

$ head rdf_data.csv
猫,捕食,老鼠

$ ./rdf-converter --path rdf_data.csv

这条命令会在当前目录下生成 vertex.csv 文件和 edge.csv 文件。

$ head vertex.csv
猫
老鼠

$ head edge.csv
猫,老鼠,捕食

之后, 就可以使用nebula-importer来导入到 Nebula 图数据库 中啦。

说明:nebula-importer要求使用一个yaml配置文件去导入数据,你可以直接使用我写好的这个rdf-import.yaml。

特殊说明:这个分支的 rdf-converter 适用于 Nebula 2.x 和 3.x,如果你使用的是 Nebula 1.x 版本,请访问 https://github.com/jievince/rdf-converter/blob/v1/