摘要:篇章结构分析是自然语言处理领域的一个重要研究方向.篇章结构分析有助于理解篇章的结构和语义,并为自然语言处理的应用(如自动文摘、信息抽取、问答系统等)提供有力的支撑.目前,篇章结构分析主要集中在微观的层面,分析的重点是句子内部或句子与句子之间的关系和结构,而宏观层面的研究相对较少.因此,以篇章结构作为研究对象,并将研究重点放在宏观篇章结构的表示体系和语料资源建设上.探讨了篇章结构分析的重要性,从理论体系、语料资源、计算模型这3个方面阐述了篇章结构分析的研究现状,提出了以篇章主次关系为媒介的宏观和微观统一的篇章结构表示框架,并分别构建了宏观篇章的逻辑语义结构和功能语用结构.在此基础上,标注了规模为720篇新闻报道的宏观篇章结构语料,并对标注的结果进行了一致性分析和标注统计分析.
Abstract:Discourse structure analysis is an important research topic in natural language processing. Discourse structure analysis not only helps to understand the discourse structure and semantics, but also provides strong support for deep applications of natural language processing, such as automatic summarization, information extraction, question answering, etc. At present, the analysis of discourse structure is mainly concentrated on the micro level. The analysis focuses on the relations and structures between sentences or sentences groups, while the analysis on macro level is less. Therefore, this study takes discourse structure as the research object, and focuses on the construction of representation schema and corpus resources on the macro level. This study discusses the importance of discourse structure analysis, expounds the research status of discourse structure analysis from three aspects, namely, theory system, corpora resource, and computing model, and puts forward the macro-micro unified discourse structure representation framework with the primary-secondary relation as the carrier. Furthermore, this study constructs the logical semantic structure and functional pragmatic structure of macro discourse level respectively. On this basis, this study annotates a macro Chinese discourse structure corpus, consisting of 720 newswire articles, and analyzes the results of the annotations in consistency and statistical data.
PDF全文下载地址:
http://jos.org.cn/jos/article/pdf/5868
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
宏观篇章结构表示体系和语料建设
本站小编 Free考研考试/2022-01-02
相关话题/结构 资源 系统 计算 逻辑
MAS环境中一种基于反馈可信度的多维信誉计算方法
摘要:在分布式体系结构的MAS(multi-agentsystem)中,Agent之间通过彼此的交互,协调完成共同的任务,但是由于没有中心化的管理权威可以依赖,导致对网络中Agent信誉信息进行判断存在一定的困难.传统的基于评价反馈的信誉评估方法存在反馈评价属性信息利用不足以及缺少确保反馈评价信息可 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于语义标签生成和偏序结构的图像层级分类
摘要:智能电子设备和互联网的普及,使得图像数据爆炸性膨胀.为了有效管理复杂图像资源,提出一种基于加权语义邻近集和形式概念偏序结构的图像层级分类方法.首先,根据图像语义相关分数,对不同程度语义设定自适应权系数,从训练图库中构建加权语义邻近集,通过对语义邻近集中图像的词频分布进行判决,自动生成图像的多个 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02描述逻辑ALC中关于伪子概念极小改变的R-演算
摘要:AGM公设是用于信念修正的(被一个单一信念修正),而DP公设是用于迭代修正的(被一个有限的信念序列修正).李未给出了对于R-构型(configuration)△|Γ的R-演算,其中,△是一个原子公式或原子公式否定的集合,而Γ是一个有限的公式集合.为了在修正过程中能够保留断言中尽可能多的信息,将 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于代码结构知识的软件文档语义搜索方法
摘要:自然语言文本形式的文档是软件项目的重要组成部分.如何帮助开发者在大量文档中进行高效、准确的信息定位,是软件复用领域中的一个重要研究问题.提出了一种基于代码结构知识的软件文档语义搜索方法.该方法从软件项目的源代码中解析出代码结构图,并以此作为领域特定的知识来帮助机器理解自然语言文本的语义.这一语 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于模型学习的OpenVPN系统脆弱性分析
摘要:OpenVPN在现实网络中有广泛应用,对其安全性进行评估具有重要的现实意义.基于自动机理论中模型学习的方法,利用协议状态模糊测试的技术对OpenVPN系统进行黑盒测试分析,自动化推演出目标OpenVPN系统的状态机.提出了状态机时间压缩模型并进行冗余状态和迁移化简,可以准确得到协议状态机中的行 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02ICOMDT:一个面向动态任务的交互计算模型
摘要:近年来,包含动态任务的交互式系统得到了广泛的应用.基于现有对用户与动态任务交互的研究,提出一个面向动态任务的定量化可计算的交互模型ICOMDT,用于解释用户与动态任务的交互行为,并实现用户意图预测.更具体地,将ICOMDT应用于运动目标选择任务,设计了两个实验以验证模型的有效性.实验1收集用户 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02面向比特币交易网络的拓扑结构可视探索方法
摘要:分析比特币交易网络有助于人们理解交易者在比特币交易中的交易模式.比特币交易网络的匿名性和其巨大的规模使得用户很难在分析前对整个交易网络产生大致的认知.提出了一种基于拓扑结构推荐的比特币交易网络可视分析方法.核心思想是为每个节点生成一个向量化表达,在用户交互的基础上,所提算法即可检测一系列相似的 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02存储容量可扩展区块链系统的高效查询模型
摘要:区块链技术是目前计算机领域的研究热点,其实现了去中心化,并且能够安全地存储数字信息,有效降低现实经济的信任成本.提出一种区块链存储容量可扩展模型的高效查询方法——ElasticQM.此查询模型由用户层、查询层、存储层和数据层这4个模块组成.在用户层,模型将查询结果缓存,加快再次查询相同数据时的 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02群组密码的对等VPN系统及多播密钥分发协议
摘要:互联网经济的发展,使得企业在大范围内建立连接各种分支机构网络的需求日益强烈,原有采用集中式网关模式的VPN逐渐转向采用对等技术的VPN系统.现有采用两方密钥交换方法的对等VPN技术更适用于两两通信,而在多节点通信中,由于隧道密钥相互独立,不同隧道加密的累计延迟将增加消息同步接收的困难.针对这一 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02NSFC计算机图像与视频处理领域项目关键词分析
摘要:关键词能够反映出一份项目申请书的主要研究内容.统计了国家自然科学基金计算机图像与视频处理领域2014年~2018年申请与资助项目关键词,并分别从关键词标引量、关键词词频等方面进行分析,探讨其与资助率的关系.最后,运用定量的方法,透过热频关键词的内容变化,分析近5年来的计算机图像与视频处理领域的 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02