1. 苏州大学 计算机科学与技术学院, 苏州 215006;
2. 江苏省计算机信息处理技术重点实验室, 苏州 215006
收稿日期:2016-12-08
基金项目:国家自然科学基金资助项目(61472265,61331011);江苏省前瞻性联合研究项目(BY2014059-08)
作者简介:李培峰(1971-), 男, 教授。E-mail:pfli@suda.edu.cn
摘要:分类器模型是目前识别因果关系的主要模型,该方法存在的问题是只考虑2个事件之间的关系,没有考虑同一文档中其他关联事件所包含的信息,识别结果往往存在逻辑矛盾。该文提出了一个中文事件因果关系识别的全局优化方法,该方法采用整数线性规划(integer linear programming,ILP)的推理方法,对基本逻辑关系、因果标志词、事件类型、论元信息进行有效约束,以文档为单位来优化因果关系识别。在该文标注语料上的实验结果表明:与分类器方法相比,该文提出的全局优化方法的F1值提升了5.54%。
关键词:事件关系因果关系整数线性规划(ILP)全局优化
Global optimization to recognize causal relations between events
LI Peifeng1,2, HUANG Yilong1,2, ZHU Qiaoming1,2
1.School of Computer Science and Technology, Soochow University, Suzhou 215006, China;
2.Province Key Lab of Computer Information Processing Technology of Jiangsu, Suzhou 215006, China
Abstract: Classifier-based models are widely used to identify causal relations between events. However, these models only consider the relationship between two specified events while ignoring related events. Thus, the results may have many logical contradictions. This paper presents a global optimization approach to recognize causal relations between events using an inference method based on integer linear programming (ILP). This approach introduces various kinds of constraints, i.e., a basic logical relationship, causal signal words, event types and argument information constraints to improve the performance. Tests on an annotated corpus show that this global optimization approach improves the F1 score by 5.54% compared with a classifier-based model.
Key words: event relationcausal relationinteger linear programming (ILP)global optimization
事件是描述特定目标在某个时间、地点的某种状态。ACE(automatic content extraction)对事件作如下定义:事件是包含参与者的具体发生的事情,常被用来描述状态的改变。一篇文章通常由多个事件组成,这些事件描述了文章的核心内容。而且,这些事件不是孤立存在的,往往由某一主题相串联,存在各种联系。
识别事件关系是篇章理解的重要内容。事件之间存在多种关系,如因果关系、时序关系、部分全部关系、主次关系等。其中,因果关系是较为复杂的关系,它不仅是语言学概念,也是理解知识后进行推理的过程。识别事件因果关系,不仅有利于获取文章主旨,有助于完成篇章理解、文本摘要、自动问答等任务,也可用于预测事件未来发展趋势。
Wolff[1]从语言学角度分析人们对因果关系的认知方式,用条件概率之差表示因果关系强度,使用多维特征方法表示因果、促进、抑制3类事件关系。目前,事件因果关系识别研究大多针对英文语料,研究方法主要可分为模板匹配方法和机器学习方法。
在模板匹配方面,Mirza等[2]提出了一种事件对显式因果关系标注方法,并综合考虑事件事实性、极性等属性。Girju[3]抽取显式因果关系,并使用规则和语言学方法抽取部分隐式因果关系用于问答系统。Khoo等[4]利用句法树信息,抽取特定结构的子树,使用文本特征与句法树结构对训练语料得到的模板进行匹配来识别因果关系。Ittoo等[5]使用半监督方法,使用少量已知的因果关系模板寻找新的因果关系,再利用新找到的因果关系扩展出新的模板,在语料库中循环迭代。Radinsky等[6]收集大量新闻语料,使用因果关系构成事件网络,对于给定事件找出与其相似的历史事件,利用历史事件的演化发展过程预测该事件的发展趋势。
在机器学习方法方面,Bethard等[7]将因果关系与时序关系相关联,提取事件之间文本特征与时序关系构造分类器模型进行识别。Rink等[8]使用文本特征和最大频繁子图方法识别事件因果关系,其使用的特征中包括人工标注的事件时序关系特征,实验结果表明,时序关系特征能够大大提高因果关系识别性能。Do等[9]使用多种相似度度量方法计算事件之间相似度,并提出事件之间的基本约束条件识别事件因果关系。
由于机器学习方法的事件关系识别结果可能造成逻辑矛盾,因此有部分****提出使用全局优化方法,构建事件对的时序关系的约束提升识别性能。Chambers等[10]在机器学习方法的基础上,使用整数线性规划方法,使用时序关系的传递性来提升事件时序关系识别性能。郑新[11]使用整数线性规划方法,使用文本信息提出多种事件约束,提升中文事件时序关系识别性能。Denis等[12]使用整数线性规划方法,提出共指与回指之间的多种约束,提升共指消解任务的识别性能。
分类器模型是目前识别因果关系的主要模型,该方法存在的问题是只考虑2个事件之间的关系,没有考虑同一文档中其他关联事件所包含的信息,识别结果往往存在逻辑矛盾。本文提出一种中文事件因果关系识别的全局优化方法,该方法采用整数线性规划(integer linear programming, ILP)推理方法,加入基本约束条件,解决分类器识别结果不一致性;加入扩展约束条件引入篇章级信息进一步提升系统识别性能。
1 语料库标注及基准系统由于没有可用的中文因果关系语料库,本文首先基于ACE事件语料库标注了因果关系语料库。另外,为了验证本文方法的有效性,设计了一个使用分类器方法的基准系统。
1.1 因果语料库标注在因果关系研究中,现有的因果关系语料库都是基于英文标注,且主要标注同一句子内的因果事件关系,不考虑篇章中不同句的因果关系。为了研究中文事件的因果关系,本文标注一个中文事件因果关系语料库。其中,事件因果关系分为显式因果关系和隐式因果关系。
显式因果关系由一个表示因果关系的词连接2个事件,且通常在同一句子内,因此易于标注,如例1所示。
例1:此外一名日本籍管工殴打(E1)工人也是工人们罢工(E2)的原因之一。
本文构建一个中文因果标志词词表,如果2个事件在同一句子内,且事件之间连接词在词表中,则标注为因果关系。常用的中文因果标志词有:因为、由于、因此、以致于、于是、致使、导致、因、造成、结果、所以、因而、故、原因、引发、之所以等。
文章中的事件通常分布在各个句子或段落中。而对于跨句子或者段落的事件,一般不存在明确表示因果关系的词语,需要根据文章内容和语义知识判别因果关系,如例2所示。
例2: 1) 因为机师误闯跑道冲撞护栏,造成机身爆炸起火,目前已经确定有82人死亡(E1)。2) 并不排除以“业务过失致死”罪起诉(E2) 3位机师。
从例2看出,因为事故造成人员死亡,所以起诉机师。在2个句子中,没有明确因果关系词连接“死亡”与“起诉”事件,这类关系称为隐式因果关系。针对隐式因果关系标注,本文参考Wolff[1]提出的2个因果关系判别模型进行标注,对于2个事件C和E:
1) 当C发生时,E发生的概率远远大于C不发生时E发生的概率,则认为C与E为因果关系:
$P\left( {E|C} \right) \gg P\left( {E|\neg C} \right) \Rightarrow C \to E.$ | (1) |
$C \to E \Leftrightarrow \neg C \to \neg E.$ | (2) |
1) 2个事件相互对应,一个事件发生,则另一事件必然会发生。
例3:他于22号凌晨因为胸部疼痛住进(E1)了乔治华盛顿大学医院。目前康复良好,很快就可以出院(E2)。
2) 2个事件互为共现事件,即2个事件经常共同出现。
例4:这起冲突结果造成2名巴勒斯坦人丧生(E1)和10多人受伤(E2)。
3) 2个事件为目的关系。
例5:在朝鲜政府高级官员访问(E1)华盛顿的前期,美国和朝鲜就国际恐怖主义进行了一次会谈(E2)。
1.2 语料库标注结果本文使用ACE2005中文语料库作为基础语料,该语料按照来源由3部分组成,分别为Broadcast news、Newswire和Weblog。为增大因果关系比例,需用事件之间联系较大的语料,因此本文选取其中来源为Broadcast news的文档作为实验语料。语料共包含298篇文档,1 398个事件实例,按文档组成事件对,共9 300个事件对。
标注结果如表 1所示,其中23.72%存在因果关系。其中,显式因果关系和隐式因果关系数量如表 2所示。从表 2可以发现,文中的隐式因果关系比例达到93.02%,这充分说明了在因果关系识别中识别隐式因果关系的重要性,如何识别这些隐式因果关系是本文研究的重点。很明显,充分利用各种篇章知识和语义信息是识别隐式因果关系的关键。
表 1 语料标注结果
参数 | 因果关系 | 非因果关系 |
数量 | 2 206 | 7 094 |
所占比例 | 23.72% | 76.28% |
表选项
表 2 显式、隐式因果关系比例
参数 | 显式因果关系 | 隐式因果关系 |
数量 | 154 | 2 052 |
所占比例 | 6.98% | 93.02% |
表选项
1.3 基准系统本文参考Bethard等[7]和Rink等[8]使用的特征,结合黄一龙等[13]在识别中文事件相关性方面使用的特征, 作为本文的基准系统,使用的特征如表 3所示。
表 3 因果关系识别特征
特征类别 | 具体特征 |
词汇特征 | 事件触发词 |
触发词左右窗口词性 | |
触发词词性 | |
触发词相似度 | |
事件之间因果词 | |
事件特征 | 事件属性(类型、形态、极性、泛型、时态) |
是否存在相同论元 | |
事件地点是否相同 | |
句法特征 | 事件所在句子距离 |
事件对句法树路径 | |
事件对依存树路径 |
表选项
2 全局优化模型分类器独立地对每一对事件进行因果关系识别,而没有利用文档内其他事件对的信息,识别结果容易产生矛盾。为此,本文提出使用整数线性规划的方法进行事件因果关系识别,特别是隐式因果关系识别。该方法结合多种约束条件,达到事件对概率之和最大化。
2.1 目标函数本文以文档为单位,对文档内的所有事件对进行优化,具体的优化目标函数如下:
$\mathop {\arg \;\max }\limits_x \sum\limits_{{e_i}, {e_j} \in E} {\sum\limits_{r \in \left\{ {c, \bar c} \right\}} {x\left( {{e_i}, {e_j}, r} \right)} } \cdot \lg P\left( {r|{e_i}, {e_j}} \right), $ | (3) |
$s.t.\;\;\;\;\;\;\;\;\;\;\;\;x\left( {{e_i}, {e_j}, r} \right) \in \left\{ {0, 1} \right\}.$ | (4) |
2.2 基本约束条件基本约束条件是文档内事件对之间必须满足的约束条件。本文提出4个基本约束条件,分别是唯一性、非自反性、同指传递性、非传递性。
唯一性:事件对(ei, ej)非之间的关系是唯一的,即因果或非因果关系,
$x\left( {{e_i}, {e_j}, c} \right) + x\left( {{e_i}, {e_j}, \bar c} \right) = 1\;\;\;\forall {e_i}, {e_j} \in E.$ | (5) |
$x\left( {{e_i}, {e_j}, c} \right) + x\left( {{e_i}, {e_j}, c} \right) = 1\;\;\;\forall {e_i}, {e_j} \in E.$ | (6) |
$\begin{gathered} x\left( {{e_i}, {e_j}, c} \right) = 1 \wedge {\text{coreference}}\left( {{e_j}, {e_k}} \right) \hfill \\ \Rightarrow x\left( {{e_j}, {e_k}, c} \right)1\;\;\;\;\;\;\forall {e_i}, {e_j}, {e_k} \in E. \hfill \\ \end{gathered} $ | (7) |
非传递性:对于3个互相不同指的事件ei, ej, ek,如果ei→ej且ei→ek,则
$\begin{gathered} x\left( {{e_i}, {e_j}, c} \right) + x\left( {{e_i}, {e_k}, c} \right) + x\left( {{e_j}, {e_k}, c} \right) \leqslant 2 \hfill \\ \;\;\;\;\;\;\;\;\forall {e_i}, {e_j}, {e_k} \in E. \hfill \\ \end{gathered} $ | (8) |
$\begin{gathered} {\text{Dist}}\left( {{e_i}, {e_j}} \right) = 1 \wedge {\text{conj}} \in {\text{Causal_Set}} \hfill \\ \Rightarrow x\left( {{e_i}, {e_j}, c} \right) = 1\;\;\;\;\forall {e_i}, {e_j} \in E. \hfill \\ \end{gathered} $ | (9) |
事件类型约束:文章表达内容往往以句子为单位,一句话内的事件有强烈的相关性。而由于中文表达方式的特点经常省略主语等信息,从而无法完整获取事件的论元。因此,提出事件类型约束,描述如下:如果2个事件在同一句子内,且2个事件类型typei和typej在开发集内的共现次数大于某个阈值T,且2种类型之间为因果关系的比率大于某个阈值α1,则将其关系置为因果关系,
$\begin{gathered} {\text{Dist}}\left( {{e_i}, {e_j}} \right) = 1 \wedge {\text{Count}}\left( {{\text{typ}}{{\text{e}}_i}, {\text{typ}}{{\text{e}}_j}} \right) \geqslant \hfill \\ T \wedge {\text{Rate}}\left( {r\left( {c|{\text{typ}}{{\text{e}}_i}, {\text{typ}}{{\text{e}}_j}} \right)} \right) \geqslant {\alpha _1} \hfill \\ \Rightarrow x\left( {{e_i}, {e_j}, c} \right) = 1\;\;\;\;\forall {e_i}, {e_j} \in E. \hfill \\ \end{gathered} $ | (10) |
事件发生会涉及若干论元,而如果2个事件有相同论元,则它们之间为因果关系的可能性更大,如例6所示。
例6:他被控(E1)于1989年同其他几名成员一道将一名试图脱离这个组织的21岁的成员谋杀(E2)。
在上例中,“他”是事件“控”与“谋杀”事件的论元之一,且这2个事件之间为因果关系。但是,也有大量有相同论元的事件对之间为非因果关系,如例7所示。
例7:行政院长唐飞上午7点多钟就抵达(E1) 行政院,召开财经会谈(E2)。
每个论元在事件中都有其特定的角色,当论元角色是“攻击者”“受害者”等与语境有强烈相关性的角色时,本文认为该论元是重要论元角色。本文构建重要论元角色列表,构造方法如下:在训练集中对每个事件抽取其论元所属的论元角色,统计每类论元角色在因果关系中的比率α2,当大于某一阈值时,认为其为关键论元角色;最终构建重要论元角色列表Arg_Set。
论元角色约束:如果第1个事件中的关键论元角色的同指论元(即同指实体)在第2个事件所在句子中出现,则认为事件对之间为因果关系,
$\begin{gathered} {\arg _k} \in {e_i} \wedge {\arg _k} \in {\text{Arg_Set}} \wedge {\text{Dist}}\left( {\arg _k^{\text{T}}, {e_j}} \right) = 1 \hfill \\ \Rightarrow x\left( {{e_i}, {e_j}, c} \right) = 1\;\;\;\;\;\forall {e_i}, {e_j} \in E. \hfill \\ \end{gathered} $ | (11) |
3 实验结果3.1 实验设置本文使用ICTCLAS 2015工具进行分词和Stanford Parser进行句法分析和依存分析, 使用Mallet工具包中的最大熵分类器和Gurobi工具进行全局优化。语料库为节1.1中标注的语料库,按照文档将事件组成事件对,进行5倍交叉验证。使用准确率(precision)、召回率(recall)和F1值作为系统的性能评价指标。
3.2 实验结果及分析经开发集调试,实验参数事件类型对出现次数取10,阈值α1取0.8,重要论元角色阈值α2取0.2。表 4给出了因果关系识别的结果,本文方法比基准系统在F1值上提高了5.54%。这充分说明了本文提出的全局优化方法在识别事件因果关系,特别是隐式因果关系方面的作用。
表 4 因果关系识别结果
参数 | 准确率/% | 召回率/% | F1/% |
基准系统 | 59.71 | 52.14 | 55.67 |
+基本约束 | 60.91 | 52.13 | 56.18 |
+标志词 | 59.90 | 55.94 | 57.85 |
+事件类型 | 62.82 | 53.49 | 57.59 |
+论元角色 | 62.26 | 53.40 | 57.49 |
总体性能 | 60.94 | 61.47 | 61.21 |
表选项
从表 4可看出,本文使用的4种约束均为有效约束,在基准系统上性能都有所提高。基本约束条件能够保证分类结果之间保持一致,F1值提升了0.51%。其中,同指传递性能够跨句子或者段落进行信息传递:假设2个事件所处位置不在同一句子内,且存在该事件对的2个同指事件,它们在同一句子内,由于同一句子内识别性能较高,可以提升总体性能。
因果标志词显式表示了句子内事件之间的因果关系,对F1值提升最大,达到2.18%。但如果简单地认为2个事件之间存在因果标志词就存在因果关系,会引入大量噪声。考虑如下句子顺序结构:e1, Causal_Signal, e2, …, e3,很显然,因果标志词连接的是事件e1和e2,不是e1和e3。因此,需要根据结合句法树信息,只有具有特定句法树结构的事件对之间才能限定为因果关系,结构如图 1所示,一个事件在NP中,另外一个事件在VP中,那么如果这2个事件之间存在因果标志词,就认为存在因果关系。
图 1 因果关系句法结构 |
图选项 |
加入事件类型约束后,F1值提升了1.92%。其中,准确率和召回率都有所提升,且准确率提升较大,达到3.11%。这一结果与预期相符,即有部分事件对之间因论元信息的缺省而造成无法识别,但是事件类型信息可以提供有效信息来识别这类事件之间是否存在因果关系,如一个攻击事件和随后的死亡事件往往存在因果关系。
论元角色信息约束提高了F1值1.82%。该约束针对跨句子和跨段落进行事件关系识别。在不同句子内事件联系较少,且有相同论元的事件较少。但是事件论元往往在另一事件所在的句子中作为实体出现,因此关键论元信息是连接2个句子的重要线索。实验结果表明加入该特征能有效提升系统识别性能。
表 5列出了各个约束条件组合后的贡献。任意2个约束条件组合后的性能要比每个约束条件提升性能之和小,这是因为这2个约束条件有时能同时纠正同一对事件的关系。这个结果也说明了本文提出的约束条件针对不同的问题提出了解决方法,具有良好的互补性。
表 5 各约束贡献度
参数 | 准确率/% | 召回率/% | F1/% |
基本约束 | 60.91 | 52.13 | 56.18 |
+标志词+事件类型 | 60.62 | 58.48 | 59.53 |
+标志词+论元角色 | 60.27 | 58.93 | 59.59 |
+事件类型+论元角色 | 63.17 | 56.75 | 59.75 |
+所有约束 | 60.94 | 61.47 | 61.21 |
表选项
4 结论本文提出一种基于全局优化的中文事件因果关系识别方法,实验结果表明本文提出的方法性能比基准系统有一定提升。本文提出的基本约束条件能够有效消除单纯使用分类器识别造成的结果矛盾, 而限定性约束条件能够利用事件对之外的其他事件信息有效提升系统识别性能。下一步工作可以考虑更多有效的事件之间的特征,提升基准系统性能。其次,考虑更多有效的事件之间的联系,引入更多语义信息提升系统性能,使用全局优化方法进一步提升系统性能。
参考文献
[1] | Wolff P. Representing causation[J]. Journal of Experimental Psychology:General, 2007, 136(1): 82–111. DOI:10.1037/0096-3445.136.1.82 |
[2] | Mirza P, Sprugnoli R, Tonelli S, et al. Annotating causality in the TempEval-3 corpus[C]//Proceedings of EACL 2014 Workshop on Computational Approaches to Causality in Language. Gothenburg, Sweden:Association for Computational Linguistics, 2014:10-19. http://www.aclweb.org/anthology/W14-0702 |
[3] | Girju R. Automatic detection of causal relations for question answering[C]//Proceedings of the ACL 2003 Workshop on Multilingual Summarization and Question Answering. Sapporo, Japan:Association for Computational Linguistics, 2003:76-83. http://dl.acm.org/citation.cfm?id=1119312.1119322 |
[4] | Khoo C S G, Chan S, Niu Y. Extracting causal knowledge from a medical database using graphical patterns[C]//Proceedings of the 38th Annual Meeting on Association for Computational Linguistics. Hong Kong, China:Association for Computational Linguistics, 2000:336-343. https://wenku.baidu.com/view/d704dd000740be1e650e9a0d.html |
[5] | Ittoo A, Bouma G. Extracting Explicit and Implicit Causal Relations from Sparse, Domain-specific Texts[M]. Berlin Heidelberg: Springer, 2011. |
[6] | Radinsky K, Davidovich S, Markovitch S. Learning causality for news events prediction[C]//International Conference on World Wide Web. Lyon, France:ACM, 2012:909-918. http://doi.acm.org/10.1145/2187836.2187958 |
[7] | Bethard S, Corvey W J, Klingenstein S, et al. Building a corpus of temporal-causal structure[C]//Proceedings of the 6th International Conference on Language Resources and Evaluation. Marrakech, Morocco:European Language Resources Association, 2008:908-915. http://www.lrec-conf.org/proceedings/lrec2008/pdf/229_paper.pdf |
[8] | Rink B, Bejan C A, Harabagiu S M. Learning textual graph patterns to detect causal event relations[C]//The 23rd International Florida Artificial Intelligence Research Society Conference. Florida, FL, USA:Association for the Advancement of Artificial Intelligence, 2010:265-270. |
[9] | Do Q X, Chan Y S, Roth D. Minimally supervised event causality identification[C]//Proceedings of the 2011 Conference on Empirical Methods in Natural Language Processing. Edinburgh, UK:Association for Computational Linguistics, 2011:294-303. http://www.academia.edu/10816042/Discourse_structure_and_language_technology |
[10] | Chambers N, Jurafsky D. Jointly combining implicit constraints improves temporal ordering[C]//Proceedings of the 2008 Conference on Empirical Methods in Natural Language Processing. Honolulu, HI, USA:Association for Computational Linguistics, 2008:698-706. http://www.academia.edu/1401855/Evaluating_temporal_graphs_built_from_texts_via_transitive_reduction |
[11] | 郑新. 中文事件时序关系识别与推理方法研究[D]. 苏州: 苏州大学, 2015. ZHENG Xin. Research on Temporal Relation Recognition and Inference Between Chinese Events[D]. Suzhou:Soochow University, 2015. (in Chinese) http://cdmd.cnki.com.cn/Article/CDMD-10285-1015400854.htm |
[12] | Denis P, Baldridge J. Joint determination of anaphoricity and coreference resolution using integer programming[C]//Proceedings of the Human Language Technologies:The Annual Conference of the North American Chapter of the Association for Computational Linguistics (NAACL-HLT 2007). Rochester, NY, USA:Association for Computational Linguistics, 2007:236-243. http://www.academia.edu/15158786/Joint_determination_of_anaphoricity_and_coreference_resolution_using_integer_programming |
[13] | 黄一龙, 李培峰, 朱巧明. 中文事件相关性语料库构建及识别方法[J]. 计算机工程与科学, 2015, 37(12): 2306–2311.HUANG Yilong, LI Peifeng, ZHU Qiaoming. The construction of Chinese relevant event corpus and its recognition approach[J]. Computer Engineering and Science, 2015, 37(12): 2306–2311. DOI:10.3969/j.issn.1007-130X.2015.12.017(in Chinese) |