针对中国学生英文文章的词性标注方法
谭咏梅, 杨林, 胡单北京邮电大学 智能科学与技术中心, 北京 100876
收稿日期:
2016-03-29出版日期:
2017-04-28发布日期:
2017-04-26作者简介:
谭咏梅(1975-),女,副教授,E-mail:ymtan@bupt.edu.cn.A Part-of-Speech Tagging Algorithm for Essay Written by Chinese English Learner
TAN Yong-mei, YANG Lin, HU DanIntelligence Science and Technology Center, Beijing University of Posts and Telecommunications, Beijing 100876, China
Received:
2016-03-29Online:
2017-04-28Published:
2017-04-26摘要/Abstract
摘要: 提出了一种基于词向量的两层词性标注方法,使用少量人工提取的特征,大部分特征可使用词向量和第1层标注向量自动训练得到.该方法将标注集分成两类,分别作为不同层的标注集.首先,对容易标注的类别进行标注;然后,对难以标注的动词或者名词进行第2层标注,将其标注为具体的某类动词或名词.利用该方法对中国学生写的英语文章进行词性标注的准确率可从95.23%提高到95.63%,超过了现有基于词向量词性标注器对相同语料词性标注的准确率.
中图分类号:
TN911.22
引用本文
谭咏梅, 杨林, 胡单. 针对中国学生英文文章的词性标注方法[J]. 北京邮电大学学报, 2017, 40(2): 16-20.
TAN Yong-mei, YANG Lin, HU Dan. A Part-of-Speech Tagging Algorithm for Essay Written by Chinese English Learner[J]. JOURNAL OF BEIJING UNIVERSITY OF POSTS AND TELECOM, 2017, 40(2): 16-20.
PDF全文下载地址:
https://journal.bupt.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=2993