摘要小说是以刻画人物为中心,通过完整的故事情节和具体的环境描写反映社会生活的一种文学体裁。对小说人物进行建模,是小说文本理解和小说文本挖掘的基础性工作。该文构建了大规模的小说语料库,抽取人物及其依存特征,提出基于skip-gram的人物向量训练方法,以人物为目标,以依存特征为上下文,基于训练出的人物向量,探索了小说人物相似度计算、小说人物聚类分析及小说人物画像等应用。实验结果表明,小说人物的分布表示有较好的应用效果。
PDF全文下载地址:
http://jcip.cipsc.org.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3064
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
小说人物的分布表示及其应用研究
本站小编 Free考研考试/2022-01-02
相关话题/工作 计算 环境 文学 实验
基于长时间跨度语料的词义演变计算研究
摘要该文收集了自晚清到21世纪间长达144年的连续历时报刊语料,通过统计分析和词语分布式表示两类方法展开研究,计算并辅助识别汉语词语的词义历时演变现象。采用TF-IDF、词频比例等多种统计分析的评价指标和目标词语在文段中的共现实词及其重合度挖掘出现词义演变的词语。针对历时语料上不同时间段的词向量对齐 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于多头注意力机制Tree-LSTM的句子语义相似度计算
摘要针对现有句子语义相似度计算由于缺乏语义结构信息导致精度低的问题,该文在依存关系树的基础上,提出了一种基于多头注意力机制Tree-LSTM(multi-headattentionTree-LSTM,MA-Tree-LSTM)的句子语义相似度计算方法。首先,MA-Tree-LSTM将外部具有指导意义 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于局部和全局语义融合的跨语言句子语义相似度计算模型
摘要跨语言句子语义相似度计算旨在计算不同语言句子之间的语义相似程度。近年来,前人提出了基于神经网络的跨语言句子语义相似度模型,这些模型多数使用卷积神经网络来捕获文本的局部语义信息,缺少对句子中远距离单词之间语义相关信息的获取。该文提出一种融合门控卷积神经网络和自注意力机制的神经网络结构,用于获取跨语 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02韩国语句子结构相似度计算方法研究
摘要句子相似度计算是信息处理领域一项基础技术,在基于实例的机器翻译中直接影响译文质量。该文以韩国语句子为研究对象,结合韩国语的句子特点提出了一种句子结构相似度的计算方法。该方法通过先提取句子的骨架结构,然后结合韩国语的句法特点制定标记转换规则,最后用转换后的句子结构与实例库中句子匹配得到与之相似的句 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于门控卷积机制与层次注意力机制的多语义词向量计算方法
摘要现有的将词映射为单一向量的方法没有考虑词的多义性,从而会引发歧义问题;映射为多个向量或高斯分布的方法虽然考虑了词的多义性,但或多或少没能有效利用词序、句法结构和词间距离等信息对词在某一固定语境中语义表达的影响。综合考虑以上存在的问题,该文提出了一种基于非残差块封装的门控卷积机制加以层次注意力机制 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02小说人物性格的文学智能分析: 以《平凡的世界》为例
摘要以往小说人物心理分析主要是对人物性格的定性分析,易受研究者个人主观经验影响;而相比于描述繁杂的性格而言,更加稳定系统的人格能够更好地描述并传达小说人物心理。该文采用基于数据挖掘的文学智能分析方法,通过中文心理分析系统对《平凡的世界》人物对话进行处理,得到人物的大五人格预测分数;进而,考察文艺学文 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02面向情感聚类的文本相似度计算方法研究
摘要在文本情感分析时,使用无监督的聚类方法,可以有效节省人力和数据资源,但同时也面临聚类精度不高的问题。相似性是文本聚类的主要依据,该文从文本相似度计算的角度,针对情感聚类中文本—特征向量的高维和稀疏问题,以及对评论文本潜在情感因素的表示问题,提出一种基于子空间的文本语义相似度计算方法(RESS)。 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02向量模型和多源词汇分类体系相结合的词语相似性计算
摘要现有的词语语义相似性计算主要包括基于向量模型以及基于词汇分类体系两类方法,但这两类方法都存在自身的缺点。向量模型所依赖的文本共现中的上下文信息不等同于真正意义上的语义,而词汇分类体系方法则存在构建代价大,并且在一定程度上还不够完善的问题。该文提出一种向量模型与多源词汇分类体系相结合的词语相似性计 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于共现词映射的中英韩跨语种文档相似度计算
摘要该文采用中英韩跨语种文本数据研究不同语种文档间相似度的计算方法。首先,通过共现词映射将某语种空间中的文档向量表示成另一语种空间中的文档向量;其次,利用潜在语义分析补充了不同语言间一词多义现象造成的向量缺失;最后,在具有等价语义信息的同一语种空间中计算了两个文档之间的余弦相似度。该文工作避开了外部 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02开放域上基于深度语义计算的复述模板获取方法
摘要利用实体关系从网络大规模单语语料获取复述模板的方法可以规避对单语平行语料或可比语料的依赖,但是后期需要人工对有语义差异的关系模板分类后获取复述模板。针对这一遗留问题,该文提出基于深度语义计算的复述模板自动获取方法,首先设计基于统计特征的模板裁剪方法,从非复述语料中获取高质量的关系模板,然后设计基 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02