大规模中文具体度词典的构建及推理技术
谢志鹏?, 毕冉 复旦大学计算机科学技术学院, 上海 200433收稿日期:
2021-06-08修回日期:
2021-08-14出版日期:
2022-01-20基金资助:
国家重点研发计划(2018YFB1005100)和国家自然科学基金(62076072)资助Construction and Inference Technique of Large-ScaleChinese Concreteness Lexicon
XIE Zhipeng?, BI Ran School of Computer Science, Fudan University, Shanghai 200433Received:
2021-06-08Revised:
2021-08-14Published:
2022-01-20摘要/Abstract
摘要: 针对中文词语具体度资源的匮乏, 提出一种自动的中文词语具体度词典构造方法。该方法充分利用已有的英文词语具体度资源, 基于在线翻译工具和预训练词向量, 训练出中文词语具体度的多层感知器回归模型, 构造大规模的中文词语具体度词典。为了评估该中文词语具体度词典的性能, 设计两项基本的具体度推理任务: 词语级具体度推理和句子级具体度推理, 并通过人工标注的方式构造相应的评测数据集。实验结果表明构造的词语具体度词典可以有效地完成这两项推理任务。
引用本文
谢志鹏, 毕冉. 大规模中文具体度词典的构建及推理技术[J]. 北京大学学报自然科学版, 2022, 58(1): 1-6.
XIE Zhipeng, BI Ran. Construction and Inference Technique of Large-ScaleChinese Concreteness Lexicon[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2022, 58(1): 1-6.
PDF全文下载地址:
http://xbna.pku.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3691