一种基于Hownet的词向量表示方法
陈洋1, 罗智勇2,† 1. 北京语言大学信息科学学院, 北京 1000832. 北京语言大学语言信息处理研究所, 北京 100083
收稿日期:
2018-04-15修回日期:
2018-08-18出版日期:
2019-01-20A Word Representation Method Based on Hownet
CHEN Yang1, LUO Zhiyong2,† 1. College of Information Science, Beijing Language and Culture University, Beijing 1000832. Institute of Linguistic Information Processing, Beijing Language and Culture University, Beijing 100083
Received:
2018-04-15Revised:
2018-08-18Published:
2019-01-20RichHTML
0
可视化
0复制本文网址
1. 探讨2016版国际胰瘘研究小组定义和分级系统对胰腺术后患者胰瘘分级的影响.PDF(500KB)
-->
摘要/Abstract
摘要: 针对基于预训练得到的词向量在低频词语表示质量和稳定性等方面存在的缺陷, 提出一种基于Hownet的词向量表示方法(H-WRL)。首先, 基于义原独立性假设, 将 Hownet中所有N个义原指定为欧式空间的一个标准正交基, 实现Hownet义原向量初始化; 然后, 根据Hownet中词语与义原之间的定义关系, 将词语向量表示视为相关义原所张成的子空间中的投影, 并提出学习词向量表示的深度神经网络模型。实验表明, 基于Hownet的词向量表示在词相似度计算和词义消歧两项标准评测任务中均取得很好的效果。
引用本文
陈洋, 罗智勇. 一种基于Hownet的词向量表示方法[J]. 北京大学学报自然科学版, 2019, 55(1): 22-28.
CHEN Yang, LUO Zhiyong. A Word Representation Method Based on Hownet[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2019, 55(1): 22-28.
PDF全文下载地址:
http://xbna.pku.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3297