2020语言与智能技术竞赛-关系抽取-第三名方案
总体方案:遵循论文《A Novel Cascade Binary Tagging Framework for Relational Triple Extraction》
针对数据:将复杂三元组分解为简单三元组
针对训练:若一个文本种有多个主体,本方案在识别出主体后,会复制多份文本向量序列分别拼接各自的主体向量,达到在一个batch中训练全部主体的目的。
trick:swa
多模型集成:先将多个模型预测主体的概率做加权平均,得到主体。然后,根据将主体预测结果,再输入到各个模型中的到客体的预测结果。
代码没有认真调整过,比较混乱。误删除了一些文件,应该是运行不起来了,仅供参考吧。