no code implementations • CCL 2020 • Huijun Hu, Cong Wang, Jianhua Dai, Maofu Liu
社会突发事件的分类和等级研判作为应急处置中的一环, 其重要性不言而喻。然而, 目前研究多数采用人工或规则的方法识别证据进行研判, 由于社会突发事件的构成的复杂性和语言描述的灵活性, 这对于研判证据识别有很大局限性。本文参考“事件抽取”思想, 事件类型和研判证据作为事件中元素, 以BiLSTM-CRF方法细粒度的识别, 并将二者结合, 分类结果作为等级研判的输入, 识别出研判证据。最终将识别结果结合注意力机制进行等级研判, 通过对研判证据的精准识别从而来增强等级研判的准确性。实验表明, 相比人工或规则识别研判证据, 本文提出的方法有着更好的鲁棒性, 社会突发事件研判时也达到了较好的效果。 关键词:事件分类 ;研判证据识别 ;等级研判 ;BiLSTM-CRF
no code implementations • CCL 2020 • Junyi Xiang, Huijun Hu, Ruibin Mao, Maofu Liu
目前的搜索引擎仍然存在“重形式, 轻语义”的问题, 无法做到对搜索关键词和文本的深层次语义理解, 因此语义检索成为当代搜索引擎中亟需解决的问题。为了提高搜索引擎的语义理解能力, 提出一种语义相关度的计算方法。首先标注金融类新闻标题实体与新闻正文语义相关度语料1万条, 然后建立新闻实体与正文语义相关度计算的BERTCA(Bidirectional Encoder Representation from Transformers Co-Attention)模型, 通过使用BERT预训练模型, 综合考虑细粒度的实体和粗粒度的正文的语义信息, 然后经过协同注意力, 实现实体与正文的语义匹配, 不仅能计算出金融新闻实体与新闻正文之间的相关度, 还能根据相关度阈值来判定相关度类别, 实验表明该模型在1万条标注语料上准确率超过95%, 优于目前主流模型, 最后通过具体搜索示例展现该模型的优秀性能。