删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于主题模型的微博评论方面观点褒贬态度挖掘

本站小编 Free考研考试/2022-01-02

摘要在新浪微博中,原创微博下存在着很多用户评论。这些评论能反映原创微博的内容,用户的态度以及与其相关的一些话题。因此,对这些评论进行细粒度信息的提取与褒贬态度的分类很有必要。基于上述原因,该文首先提出与原创无关的评论判别方法,通过三个相似度方法得到原创微博与评论之间的相关度,从而判断评论对象是否为原创微博。其次,提出一种用于评论集褒贬态度和方面观点挖掘的新模型,该模型在LDA中加入了表情符号层与文本情感层,实现评论集方面和褒贬态度的同步检测。实验表明: 表情符号情感层的融入能提高新模型褒贬态度识别能力。

PDF全文下载地址:

http://jcip.cipsc.org.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=2789
相关话题/实验 信息 褒贬 态度 模型

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 基于语义规则与RNN模型的在线评论情感分类研究
    摘要为提高互联网中在线评论文本的情感倾向分类准确率,方便消费者和商家准确高效地获取信息,该文提出一种将语义规则方法与深度学习方法相结合的在线评论文本情感分类模型,对基于情感词典的语义规则信息进行扩展,嵌入到常用特征模板中组合成更有效的混合特征模板;采用Fisher判别准则方法对混合特征模板进行降维以 ...
    本站小编 Free考研考试 2022-01-02
  • 基于笔画中文字向量模型设计与研究
    摘要中文汉字在横向、纵向展开具有二维的复杂结构。现有的中文词向量研究大都止步于汉字字符,没有利用中文笔画序列生成字向量,且受限于统计模型本质,无法为低频、未登录字词生成高质量向量表示。为此,该文提出了一种依靠中文笔画序列生成字向量的模型Stroke2Vec,扩展Word2Vec模型CBOW结构,使用 ...
    本站小编 Free考研考试 2022-01-02
  • 融入汉字字形特征的中英神经机器翻译模型
    摘要神经机器翻译技术是目前机器翻译应用中取得效果最好的方法。将外部语言学知识如单词词性、依存句法标签引入神经机器翻译系统以提高翻译性能已经被很多****证明是一种行之有效的途径。相较于其他表音文字,汉字是一种形声字,其构造方法具有一半表音、一半表意的特殊结构,这种特殊的构造法使得汉字含有丰富的语义、 ...
    本站小编 Free考研考试 2022-01-02
  • 基于视觉特征的网页信息抽取方法研究
    摘要面对大规模异构网页,基于视觉特征的网页信息抽取方法普遍存在通用性较差、抽取效率较低的问题。针对通用性较差的问题,该文提出了基于视觉特征的使用有监督机器学习的网页信息抽取框架WEMLVF。该框架具有良好的通用性,通过对论坛网站和新闻评论网站的信息抽取实验,验证了该框架的有效性。然后,针对视觉特征提 ...
    本站小编 Free考研考试 2022-01-02
  • 采用拼音降维的中文对话模型
    摘要对话是自然语言处理的一个重要研究领域,其成果已经得到广泛的应用。然而中文对话模型训练时由于字词数量庞大,必然会面临模型复杂度过高的问题。为解决此问题,该文首先将对话模型的汉字输入转化为拼音输入并将拼音分为声母、韵母和声调三个部分,以此减小输入的字词数量。然后以嵌入编码的方法将拼音信息组合为图像形 ...
    本站小编 Free考研考试 2022-01-02
  • 注意力的端到端模型生成藏文律诗
    摘要文本自动撰写在自然语言处理中是一个重要的研究领域,可通过人工智能的方法来提升文本的生成结果。目前主流的生成方法是基于深度学习的方法,而该文则提出了一种基于注意力的端到端模型生成藏文律诗法。该方法基本框架是一个双向LSTM的编码—解码模型,在此基础上引入了藏文字嵌入、注意力机制和多任务学习法。实验 ...
    本站小编 Free考研考试 2022-01-02
  • 一种针对成分树的混合神经网络模型
    摘要为了提高自然语言处理的准确度,很多工作将句法成分树与LSTM相结合,提出了各种针对成分树的LSTM模型(文中用C-TreeLSTM统称这类模型)。考虑到C-TreeLSTM模型在计算内部节点隐藏状态的过程中,由于一个重要信息来源(即单词)的缺失导致文本建模的准确度不高,该文提出一种针对成分树的混 ...
    本站小编 Free考研考试 2022-01-02
  • 神经机器翻译中英语单词及其大小写联合预测模型
    摘要英文中单词有大小写之分,如果使用不规范,会降低语句的可读性,甚至造成语义上的根本变化。当前的机器翻译处理流程一般先翻译生成小写的英文译文,再采用独立的大小写恢复工具进行还原,这种方式步骤繁琐且没有考虑上下文信息。另一种方式是抽取包含大小写的词表,但这种方式扩大了词表,增加了模型参数。该文提出了一 ...
    本站小编 Free考研考试 2022-01-02
  • 基于主题模型的古典乐器诗词文本挖掘
    摘要古代先贤将乐器按其制作材料分为八类,《周礼·春官·大师》中记载“皆播之以八音:金石土革丝木匏竹。”该文将《全唐诗》、《全宋词》中有关“八音”的诗句、词句作为研究对象,使用基于LDA和NMF的主题挖掘、基于Author-Topic-Model的作者相似度计算等方法。从宏观到微观,从整体诗词到具体诗 ...
    本站小编 Free考研考试 2022-01-02
  • 基于注意力机制与文本信息的用户关系抽取
    摘要随着社交媒体的发展,用户之间的关系网络对于社交媒体的分析有很大的帮助。因此,该文主要研究用户好友关系检测。以往的关于用户好友关系抽取的研究主要基于社交媒体上的结构化信息,比如其他好友关系,用户的不同属性等。但是,很多时候用户本身并没有大量的好友信息存在,同时也不一定有很多确定的属性。因此,我们希 ...
    本站小编 Free考研考试 2022-01-02