摘要该文从鲁迅书信、小说和杂文中提取出376个语言特征,采用随机森林和k-means聚类算法筛选出58个能够对三种文体取得较好区别效果的特征。该文采用比伯的多维度分析法对这些语言特征进行因子分析,得到7个比较重要的因子。根据每个因子中具有显著负荷值的语言特征,该文将7个因子解释为4个能够体现文体在写作角度、叙述视角、形式、语言系统等方面差异的维度,以及3个能够体现文体存在某种特点的特征组合。书信和小说在互动性上相似,然而书信更具议论性、文言性和详细的写作特征,小说更具描写性、白话性和简短的写作特征;书信和杂文在议论性和详细的写作特征上相似,而书信互动性较强,杂文互动性较弱;小说和杂文则没有相似的维度。
PDF全文下载地址:
http://jcip.cipsc.org.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3040
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
基于多维度分析法的鲁迅三种文体比较研究
本站小编 Free考研考试/2022-01-02
相关话题/语言 写作 系统 特征 书信
基于特征扩展卷积神经网络的案件微博观点句识别
摘要通常的微博观点句识别主要根据微博评论本身是否带有观点来进行判断,而案件微博的观点句识别需要进一步考虑该评论是否讨论与特定案件相关的主题。针对这一任务,该文提出一种结合微博原文进行特征扩展的观点句识别模型。以卷积神经网络分类模型为基本框架,在嵌入层加入案件微博原文中的关键词向量,与对应评论词向量进 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02语言知识驱动的词嵌入向量的可解释性研究
摘要神经网络语言模型应用广泛但可解释性较弱,其可解释性的一个重要而直接的方面表现为词嵌入向量的维度取值和语法语义等语言特征的关联状况。先前的可解释性工作集中于对语料库训得的词向量进行知识注入,以及基于训练和任务的算法性能分析,对词嵌入向量和语言特征之间的关联缺乏直接的验证和探讨。该文应用基于语言知识 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02汉语委婉语语言资源建设
摘要委婉语是语言交流中不可或缺的交际手段,委婉语研究一直是语言学界的热门话题之一,但在自然语言处理领域,尚未有委婉语相关研究。该文借助现有纸质词典,基于语料库检索和专家人工判别的方式,初步构建了规模为63000余条语料的汉语委婉语语言资源;并根据自然语言处理的相关任务需求,结合词典释义对委婉语进行分 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于粗糙集和多通道词向量的中文文本情感特征分析
摘要粗糙集是一种能够有效处理不精确、不完备和不确定信息的数学工具,粗糙集的属性约简可以在保持文本情感分类能力不变的情况下对文本情感词特征进行约简。针对情感词特征空间维数过高、情感词特征表示缺少语义信息的问题,该文提出了RS-WvGv中文文本情感词特征表示方法。利用粗糙集决策表对整个语料库进行情感词特 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02卷积重提取特征的文档列表排序学习方法
摘要在许多信息检索任务中,为了进一步提高检索性能,通常需要对检索到的文档进行重新排序,目前的排序学习方法主要集中在损失函数的构造上,而没有考虑特征之间的关系。该文将多通道深度卷积神经网络作用于文档列表排序学习方法,即ListCNN,实现了信息检索的精确重排序。由于从文档中提取的多个特征中有一些特征具 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02Q2SM: 基于BERT的多领域任务型对话系统状态跟踪算法
摘要基于管道的方法是目前任务型对话系统的主要构建方式,在工业界具有广泛应用,而对话状态跟踪(dialoguestatetracking,DST)是任务型对话系统中的核心任务。面对传统的方法在多领域场景下表现较差的问题,该文结合语言模型预训练的最新研究成果,该文提出了一种基于BERT的对话状态跟踪算法 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于性格情绪特征的改进主题情感模型
摘要近年来,以微博为代表的社交媒体在情感分析中备受关注。然而,绝大多数现有的主题情感模型并没有充分考虑到用户性格特征,导致情感分析结果难尽人意。故该文在现有的JST模型基础上进行改进,提出一种基于时间的性格建模方法,将用户性格特征纳入主题情感模型中;鉴于微博数据包含大量的表情符号之类的特有信息,为了 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于历时语料库的在线词典编纂系统设计
摘要语料库语言学是借助大规模语料库对语言现象进行发现、挖掘的学科,目前已经存在很多在线语料库辅助语言学的研究。该文提供了一个按时间分片进行管理的语料库,并基于此提出了一个由社区维护的在线词典编纂系统,该系统将语料库查询结果动态结合在被编辑的词条中。该文还介绍了一个多义词词义发现和层次化聚类算法,用以 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02双特征空间的实体排序学习
摘要随着大规模知识图谱的出现以及企业高效管理领域知识图谱的需求,知识图谱中的自组织实体检索成为研究热点。给定知识图谱以及用户查询,实体检索的目标在于从给定的知识图谱中返回实体的排序列表。从匹配的角度来看,传统的实体检索模型大都将用户查询和实体统一映射到词的特征空间。这样做具有明显的缺点,例如,将同属 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于BERT的任务导向对话系统自然语言理解的改进模型与调优方法
摘要任务导向对话系统的自然语言理解,其目的就是解析用户以自然语言形式输入的语句,并提取出可以被计算机所理解的结构化信息,其包含意图识别和槽填充两个子任务。BERT是近期提出来的一种自然语言处理预训练模型,已有研究者提出基于BERT的任务导向对话系统自然语言理解模型。在此基础上,该文提出一种改进的自然 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02