Skip to content

Latest commit

 

History

History
33 lines (22 loc) · 1.01 KB

DataFoundatain_2021数字中国创新大赛_肝癌病理解析.md

File metadata and controls

33 lines (22 loc) · 1.01 KB

比赛地址

点击这里

特色分析

  • 训练数据需要自己标注

    • 增加选手的医学知识
    • 帮助主办方做高质量的数据标注
    • 帮助参赛者熟悉标注工具(个人经验,推荐的标注工具)
      • brat:比较经典的工具,支持分类,序列标注和关系抽取等,天池瑞金比赛官方使用的标注工具
      • doccano:风格比较清新,支持分类,序列标注,文本生成等,此外,亮点是支持多人系统标注
  • 特定病种的结构化任务

    • 专注肝癌,与主办方来自福建医科大学孟超肝胆医院有关

数据分析

类型 数量 备注
train 1000份病历 需要比赛选手自己标注(比赛特色)
参考train标注样本 100份病历 5人标注,一致通过;不一致,需协商确定
test 1050份病历
实体类型 10种 有对应的解释

建模分析

标准的序列标注任务

评测指标

P/R/F1