diff --git a/README.md b/README.md index 1de8ca0..0ad8aa9 100644 --- a/README.md +++ b/README.md @@ -1,32 +1,36 @@ -该工程代码主要是实现自己阅读过的和知识图谱相关的经典算法的代码: -1.TransE是知识图谱中知识表示的经典算法,工程实现了训练代码(多进程通信版)和测试代码 -后续如继续进行论文阅读会补充相应的代码 -2.由于data文件过大,无法上传,请至https://github.com/thunlp/KB2E下载data.zip并解压至工程的data路径 -3.TransE论文地址: https://www.utc.fr/~bordesan/dokuwiki/_media/en/transe_nips13.pdf -###训练部分 -####Simple版本 +璇ュ伐绋嬩唬鐮佷富瑕佹槸瀹炵幇鑷繁闃呰杩囩殑鍜岀煡璇嗗浘璋辩浉鍏崇殑缁忓吀绠楁硶鐨勪唬鐮侊細 + +1.TransE鏄煡璇嗗浘璋变腑鐭ヨ瘑琛ㄧず鐨勭粡鍏哥畻娉曪紝宸ョ▼瀹炵幇浜嗚缁冧唬鐮侊紙澶氳繘绋嬮氫俊鐗堬級鍜屾祴璇曚唬鐮 +鍚庣画濡傜户缁繘琛岃鏂囬槄璇讳細琛ュ厖鐩稿簲鐨勪唬鐮 + +2.鐢变簬data鏂囦欢杩囧ぇ锛屾棤娉曚笂浼狅紝璇疯嚦https://github.com/thunlp/KB2E涓嬭浇data.zip骞惰В鍘嬭嚦宸ョ▼鐨刣ata璺緞 + +3.TransE璁烘枃鍦板潃锛 https://www.utc.fr/~bordesan/dokuwiki/_media/en/transe_nips13.pdf + +###璁粌閮ㄥ垎 +####Simple鐗堟湰 ./train_fb15k.sh 0 -仅仅使用Python完成对应的训练代码 -####Manager版本 +浠呬粎浣跨敤Python瀹屾垚瀵瑰簲鐨勮缁冧唬鐮 +####Manager鐗堟湰 ./train_fb15k.sh 1 -将TransE类的实例在多进程之间传递 -####Queue版本 +灏員ransE绫荤殑瀹炰緥鍦ㄥ杩涚▼涔嬮棿浼犻 +####Queue鐗堟湰 ./train_fb15k.sh 2 -将TransE类的训练数据传入队列,减小进程开销,加快训练速度 +灏員ransE绫荤殑璁粌鏁版嵁浼犲叆闃熷垪锛屽噺灏忚繘绋嬪紑閿锛屽姞蹇缁冮熷害 -当训练完成之后,再进行测试 -###测试部分 +褰撹缁冨畬鎴愪箣鍚庯紝鍐嶈繘琛屾祴璇 +###娴嬭瘯閮ㄥ垎 ####TestTransEMqQueue python TestTransEMpQueue.py -多进程队列测试加速,效果不明显,单个测试例0.5s,测试结束需要近5h。 +澶氳繘绋嬮槦鍒楁祴璇曞姞閫燂紝鏁堟灉涓嶆槑鏄撅紝鍗曚釜娴嬭瘯渚0.5s锛屾祴璇曠粨鏉熼渶瑕佽繎5h銆 ####TestMainTF python TestMainTF.py -tf与多进程测试加速,效果显著,测试结束仅需要8min左右。 -###最终测试结果 +tf涓庡杩涚▼娴嬭瘯鍔犻燂紝鏁堟灉鏄捐憲锛屾祴璇曠粨鏉熶粎闇瑕8min宸﹀彸銆 +###鏈缁堟祴璇曠粨鏋 FB15k epochs:2000 MeanRank Hits@10 raw filter raw filter -head 320.743 192.152 29.7 41.2 -tail 236.984 153.431 36.1 46.2 -average 278.863 172.792 32.9 43.7 -paper 243 125 34.9 47.1 \ No newline at end of file +head 320.743 192.152 29.7 41.2 +tail 236.984 153.431 36.1 46.2 +average 278.863 172.792 32.9 43.7 +paper 243 125 34.9 47.1