admin管理员组

文章数量:1558102

Abstract

针对事件抽取(Event Extraction)目前面临着训练数据缺乏和文档级别事件抽取两大问题,文章开创性的提出相应的解决方案。第一,训练数据缺乏。ACE 2005 中,各语言的文档数不过几百篇,对深度学习来说,这样的数据量是不足够的。第二,事件抽取还局限于单个句子。而事实上,一个事件往往涉及到触发词和多种事件元素,触发词和所有的事件元素都出现在同一个句子中的理想情况并不常见,因此篇章级的事件提取非常有必要。

下图是论文中给出的一个例子,图中的事件

Introduction

金融事件对投资者来说十分有用,通过有针对性的对不同金融事件作出相应的操作,可以为投资者带来巨大的利润。而目前针对中文金融事件抽取的研究还比较少。

Methodology

远程监督扩充训练语料

远程监督是一种训练集扩充的方法,在关系抽取和事件抽取任务中都已经得到了应用。为了减少模型对人工标注数据的依赖,基于以下假设:两个实体如果在知识库中存在某种关系,则包含该两个实体的非结构化句子均能表示出这种关系,人们提出了远程监督的概念。例如,“Steve Jobs”, "Apple"在 Freebase 中存在 founder 的关系,那么“Steve Jobs was the co-founder and CEO of Apple.”可以

本文标签: ChineseFinancialEventDCFEEDocument