删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于网络文本的汉语多词表达抽取方法

本站小编 Free考研考试/2022-02-06

基于网络文本的汉语多词表达抽取方法

龚双双,陈钰枫*,徐金安,张玉洁
北京交通大学计算机与信息技术学院, 北京 100044
收稿日期:2017-12-12出版日期:2018-09-20发布日期:2018-09-10

作者简介:龚双双(1990— ),女,硕士研究生,研究方向为自然语言处理、信息抽取. E-mail:15120393@bjtu.edu.cn*通信作者简介:陈钰枫(1981— ),女,博士,副教授,研究方向为自然语言处理、人工智能. E-mail:chenyf@bjtu.edu.cn
基金资助:国家自然科学基金资助项目(61473294,61370130);北京市自然科学基金资助项目(4172047);中央高校基本科研业务费专项资金资助项目(2015JBM033)

Extraction of Chinese multiword expressions based on Web text

GONG Shuang-shuang, CHEN Yu-feng*, XU Jin-an, ZHANG Yu-jie
College of Computer and Information Technology, Beijing Jiaotong University, Beijing 100044, China
Received:2017-12-12Online:2018-09-20Published:2018-09-10







摘要/Abstract


摘要: 多词表达(multiword expressions, MWEs)是自然语言中一类固定或半固定搭配的语言单元,特别在网络文本中,多词表达频繁出现,给分词和后续文本理解带来了巨大挑战,因此,面向网络文本提出了一种双层抽取策略来实现多词表达的识别。第一层次,利用基于左右熵联合增强互信息的算法来实现多词表达的初步抽取;第二层次,在第一层次获得的多词表达候选列表的基础上,利用SVM分类器,构建上下文和词向量特征,进行多词表达与非多词表达的分类,实现多词表达候选列表的进一步过滤。经过实验测试,在5 000条微博语料上,第一层次获得的多词表达的F值为84.92%,第二层次多词表达识别的F值为89.58%,相比于基线系统,性能有很大的提升。实验结果表明,双层抽取策略能够实现网络多词表达的有效抽取,并能有效改善分词结果。


PDF全文下载地址:

http://lxbwk.njournal.sdu.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=2833
相关话题/网络 实验 词表 语言 汉语

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 基于Bernstein多项式的SISO三层前向神经网络的设计与逼近
    基于Bernstein多项式的SISO三层前向神经网络的设计与逼近肖炜茗,王贵君*天津师范大学数学科学学院,天津300387收稿日期:2017-11-24出版日期:2018-09-20发布日期:2018-09-10作者简介:肖炜茗(1993—),女,硕士研究生,研究方向为模糊系统与神经网络研究.E- ...
    本站小编 Free考研考试 2022-02-06
  • 考虑零售商横向公平的二层供应链网络均衡决策
    考虑零售商横向公平的二层供应链网络均衡决策郑英杰,周岩*青岛大学商学院,山东青岛266071收稿日期:2018-01-23出版日期:2018-09-20发布日期:2018-09-10作者简介:郑英杰(1993—),男,硕士研究生,研究方向为供应链管理.E-mail:624414376@qq.com* ...
    本站小编 Free考研考试 2022-02-06
  • 基于网络有效阻抗的社区发现算法
    基于网络有效阻抗的社区发现算法张军1,李竞飞2,4,张瑞1,3*,阮兴茂2,张烁21.呼伦贝尔学院计算机学院,内蒙古呼伦贝尔021008;2.天津大学计算机科学与技术学院,天津300350;3.天津大学管理与经济学部,天津300072;4.国家计算机网络应急技术处理协调中心,北京100029收稿日期 ...
    本站小编 Free考研考试 2022-02-06
  • 基于深度表示学习的多语言文本情感分析
    基于深度表示学习的多语言文本情感分析余传明1,冯博琳1,田鑫1,安璐2*1.中南财经政法大学信息与安全工程学院,湖北武汉430073;2.武汉大学信息管理学院,湖北武汉430072收稿日期:2017-04-15出版日期:2018-03-20发布日期:2018-03-13通讯作者:安璐(1979—), ...
    本站小编 Free考研考试 2022-02-06
  • 一种基于浅层卷积神经网络的隐写分析方法
    一种基于浅层卷积神经网络的隐写分析方法刘明明,张敏情,刘佳,高培贤武警工程大学网络与信息安全武警部队重点实验室,陕西西安710086收稿日期:2017-08-28出版日期:2018-03-20发布日期:2018-03-13作者简介:刘明明(1992—),男,硕士,研究方向为信息隐藏、深度学习.E-m ...
    本站小编 Free考研考试 2022-02-06
  • 一种软件定义APT攻击移动目标防御网络架构
    一种软件定义APT攻击移动目标防御网络架构谭韧,殷肖川*,焦贤龙,廉哲,陈玉鑫空军工程大学信息与导航学院,陕西西安710077收稿日期:2017-08-28出版日期:2018-01-20发布日期:2018-01-19通讯作者:殷肖川(1961—),男,博士,硕士生导师,研究方向为网络与信息安全.E- ...
    本站小编 Free考研考试 2022-02-06
  • 基于OpenStack的云计算网络性能测量与分析
    基于OpenStack的云计算网络性能测量与分析王小艳1,陈兴蜀1,2*,王毅桐2,葛龙21.四川大学网络空间安全学院,四川成都610065;2.四川大学计算机学院,四川成都610065收稿日期:2017-08-28出版日期:2018-01-20发布日期:2018-01-19通讯作者:陈兴蜀(196 ...
    本站小编 Free考研考试 2022-02-06
  • 最大距离可分码在网络编码纠错中的应用
    最大距离可分码在网络编码纠错中的应用章广志1,2,蔡绍斌1*,马春华2,张东秋21.哈尔滨工程大学计算机学院,黑龙江哈尔滨150001;2.绥化学院信息工程学院,黑龙江绥化152000收稿日期:2017-08-28出版日期:2018-01-20发布日期:2018-01-19通讯作者:蔡绍滨(1973 ...
    本站小编 Free考研考试 2022-02-06
  • 基于P2P的网络测量云平台的设计与实现
    基于P2P的网络测量云平台的设计与实现赵光远1,秦丰林2,郭晓东2*1.山东理工大学计算机学院,山东淄博255000;2.山东大学信息化工作办公室,山东济南250100收稿日期:2017-07-10出版日期:2017-12-20发布日期:2017-12-22通讯作者:郭晓东(1980—),男,工程师 ...
    本站小编 Free考研考试 2022-02-06
  • DLNM和LSTM神经网络对临沂市手足口病发病的预测效果比较
    DLNM和LSTM神经网络对临沂市手足口病发病的预测效果比较冯一平1,2,孙大鹏3,王显军3,纪伊曼1,2,刘云霞1,2收稿日期:2021-06-22发布日期:2022-01-25通讯作者:刘云霞.E-mail:yunxialiu@163.com基金资助:科技部“十三五”重大专项子课题(2017ZX ...
    本站小编 Free考研考试 2022-02-06