删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于N-Gram语言模型的并行自适应新闻话题追踪算法

本站小编 Free考研考试/2022-02-06

基于N-Gram语言模型的并行自适应新闻话题追踪算法

屈庆涛(),刘其成*(),牟春晓
烟台大学计算机与控制工程学院, 山东 烟台 264005
收稿日期:2018-05-25出版日期:2018-12-20发布日期:2018-12-26
通讯作者:刘其成E-mail:992883600@qq.com;ytliuqc@163.com
作者简介:屈庆涛(1992—),男,山东滕州人,硕士研究生,主要研究方向为云计算和大数据.E-mail:992883600@qq.com
基金资助:山东省自然科学基金(ZR2016FM42);山东省重点研发计划(2016GGX109004);国家海洋局“十三五”海洋经济创新发展示范重点项目(YHC-ZB-P201701);国家自然科学基金(61702439)

A parallel adaptive news topic tracking algorithm based on N-Gram language model

Qingtao QU(),Qicheng LIU*(),Chunxiao MU
School of Computer and Control Engineering, Yantai University, Yantai 264005, Shandong, China
Received:2018-05-25Online:2018-12-20Published:2018-12-26
Contact:Qicheng LIU E-mail:992883600@qq.com;ytliuqc@163.com

Supported by:山东省自然科学基金(ZR2016FM42);山东省重点研发计划(2016GGX109004);国家海洋局“十三五”海洋经济创新发展示范重点项目(YHC-ZB-P201701);国家自然科学基金(61702439)




摘要/Abstract


摘要: 针对传统的向量空间模型及一元语法模型表示话题的文本特征时忽略词语之间语序关系的问题,提出一种基于N-Gram语言模型的并行自适应新闻话题追踪算法。使用N-Gram语言模型,利用新闻报道中词语间的语序关系进行文本表示,根据贝叶斯分类算法进行话题追踪,利用最小特征平均可信度阈值更新策略,采用测试新闻报道更新训练集,完善话题模型,并在MapReduce分布式计算模型上予以实现。试验表明,该算法不仅有效地提高了话题追踪效果,而且具有良好的并行加速比和可扩展性。


PDF全文下载地址:

http://gxbwk.njournal.sdu.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=1772
相关话题/语言 创新 新闻 山东 计算

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 基于粒计算的语言概念决策形式背景分析
    基于粒计算的语言概念决策形式背景分析庞阔(),陈思琪,宋笑迎,邹丽()辽宁师范大学计算机与信息技术学院,辽宁大连116081收稿日期:2018-05-25出版日期:2018-12-20发布日期:2018-12-26通讯作者:邹丽E-mail:pangkuolnnu@163.com;zoulicn@1 ...
    本站小编 Free考研考试 2022-02-06
  • 水资源绝对资产负债计算方法
    水资源绝对资产负债计算方法曹升乐(),于翠松山东大学土建与水利学院,山东济南250061收稿日期:2018-07-06出版日期:2018-10-01发布日期:2018-07-06作者简介:曹升乐(1960—),男,陕西蒲城人,博士生导师,博士,主要研究方向为水资源开发,利用与管理.E-mail:Ca ...
    本站小编 Free考研考试 2022-02-06
  • 基于卷积神经网络的中文财经新闻分类方法
    基于卷积神经网络的中文财经新闻分类方法谢志峰1,2,吴佳萍1,马利庄2,31.上海大学影视工程系,上海200072;2.上海电影特效工程技术研究中心,上海200072;3.上海交通大学计算机科学与工程系,上海200240收稿日期:2017-08-29出版日期:2018-06-20发布日期:2017- ...
    本站小编 Free考研考试 2022-02-06
  • 基于语言值相似度推理的网络商家自评价方法
    基于语言值相似度推理的网络商家自评价方法崔晓松,王颖,孟佳,邹丽*辽宁师范大学计算机与信息技术学院,辽宁大连116081收稿日期:2017-08-29出版日期:2018-02-20发布日期:2017-08-29通讯作者:邹丽(1971—),女,辽宁大连人,教授,博士,硕士生导师,主要研究方向为智能信 ...
    本站小编 Free考研考试 2022-02-06
  • 复合Bessel函数零点数值计算方法及分布规律
    复合Bessel函数零点数值计算方法及分布规律姬安召,王玉风*,刘雪芬陇东学院能源工程学院,甘肃庆阳745000收稿日期:2017-03-10出版日期:2018-02-20发布日期:2017-03-10通讯作者:王玉风(1986—),女,河北石家庄人,讲师,硕士,主要研究方向为应用地球物理.E-ma ...
    本站小编 Free考研考试 2022-02-06
  • 山东孔林植物群落动态变化及演替分析
    山东孔林植物群落动态变化及演替分析张文馨1,王蕙2,范小莉1,王强3,房用1,梁玉1*1.山东省林业科学研究院,山东济南250014;2.山东大学生命科学学院,山东青岛266237;3.山东省林业外资与工程项目管理站,山东济南250014发布日期:2021-11-15作者简介:张文馨(1989—), ...
    本站小编 Free考研考试 2022-02-06
  • 山东省珍稀濒危植物分布及其影响因素
    山东省珍稀濒危植物分布及其影响因素张秀华1,齐海鹰1,刘建2,王仁卿2,3,4,赵静51.山东城市建设职业学院,山东济南250103;2.山东大学环境研究院,山东青岛266237;3.山东大学生命科学学院生态学与生物多样性研究所,山东青岛266237;4.山东省植被生态工程技术研究中心,山东青岛26 ...
    本站小编 Free考研考试 2022-02-06
  • 上下游企业绿色创新的稳定性分析——基于演化博弈的视角
    上下游企业绿色创新的稳定性分析——基于演化博弈的视角曹平(),王智林,郝慧()广西大学商学院,广西南宁530004收稿日期:2020-02-19出版日期:2021-03-20发布日期:2021-03-16通讯作者:郝慧E-mail:caopingson@163.com;haohui@st.gxu.e ...
    本站小编 Free考研考试 2022-02-06
  • 非确定模糊有穷自动机的ε-语言逼近
    非确定模糊有穷自动机的ε-语言逼近王海辉(),赵路瑶,李平()陕西师范大学数学与信息科学学院,陕西西安710119收稿日期:2020-07-13出版日期:2021-03-20发布日期:2021-03-16通讯作者:李平E-mail:wanghaihui@snnu.edu.cn;liping@snnu ...
    本站小编 Free考研考试 2022-02-06
  • 品牌社群成员资源禀赋对企业双元创新的作用机理
    品牌社群成员资源禀赋对企业双元创新的作用机理马闻远1(),李秋彤2,张耀耀2,朱瑾2,()1.齐鲁师范学院经济与管理学院,山东济南2502002.山东师范大学商学院,山东济南250358收稿日期:2019-09-02出版日期:2020-01-20发布日期:2020-01-10通讯作者:朱瑾E-mai ...
    本站小编 Free考研考试 2022-02-06