1(Faculty of Information Technology, Beijing University of Technology, Beijing 100124); 2(Beijing Municipal Key Laboratory of Multimedia and Intelligent Software Technology (Beijing University of Technology), Beijing 100124)
出版日期:
2018-11-01基金资助:
国家重点研发计划项目(2017YFC0803300);国家自然科学基金项目(91546111,91646201,61672071);北京市教委重点项目(KZ201610005009)Domain Alignment Based on Multi-Viewpoint Domain-Shared Feature for Cross-Domain Sentiment Classification
Jia Xibin1,2, Jin Ya1,2, Chen Juncheng11(北京工业大学信息学部 北京 100124); 2(多媒体与智能软件技术北京市重点实验室(北京工业大学) 北京 100124) (jiaxibin@bjut.edu.cn)
Online:
2018-11-01摘要/Abstract
摘要: 大量有效样本标注是有监督学习性能的重要保证,但又存在耗时且人力成本高的问题.加之,在实际应用环境,很难在每个应用领域都有足够的标定样本数据支持分类器的训练.而将源领域所获的训练模型直接用于目标领域,又由于目标领域和源领域信息分布差异,会导致跨领域分类器应用准确率降低的问题.针对以上问题,提出一种基于多视角共享特征的领域空间对齐的跨领域情感分类(domain alignment based on multi-viewpoint domain-shared feature for cross-domain sentiment classification, DAMF)算法.该算法首先通过融合多个情感词典,消除通过互信息值所选择的领域共享特征中情感词的极性分歧问题.在此基础上,以领域间无歧义共享特征为桥梁,结合通过语法规则提取的各领域中有相同极性的情感词对和通过关联规则学习的各领域中有强关联关系的特征词对,进行领域间相同极性的专有情感词对和强关联关系的特征词对的提取,构建目标领域和源领域数据的统一特征表示空间,减小了领域间因极性分歧和特征分布不同造成的差异,实现不同领域空间对齐.同时在公共数据集上的跨领域实验表明,基于多视角共享特征的领域空间对齐跨领域倾向性分析算法一定程度上提高了跨领域情感分类的准确率.
参考文献
相关文章 15
[1] | 吴志军, 张入丹, 岳猛. 一种联合检测命名数据网络中攻击的方法[J]. 计算机研究与发展, 2021, 58(3): 569-582. |
[2] | 李松, 胡晏铭, 郝晓红, 张丽平, 郝忠孝. 基于维度分组降维的高维数据近似k近邻查询[J]. 计算机研究与发展, 2021, 58(3): 609-623. |
[3] | 苏锦钿,欧阳志凡,余珊珊. 基于依存树及距离注意力的句子属性情感分类[J]. 计算机研究与发展, 2019, 56(8): 1731-1745. |
[4] | 张祥文,陆紫耀,杨静,林倩,卢宇,王鸿吉,苏劲松. 基于带权词格的循环神经网络句子语义表示建模[J]. 计算机研究与发展, 2019, 56(4): 854-865. |
[5] | 张春,周静. 动车组运维效率关联规则挖掘优化算法[J]. 计算机研究与发展, 2017, 54(9): 1958-1965. |
[6] | 陈龙,管子玉,何金红,彭进业. 情感分类研究进展[J]. 计算机研究与发展, 2017, 54(6): 1150-1170. |
[7] | 牛新征,王崇屹,叶志佳,佘堃. 基于簇和阈值区间的高效关联规则隐藏算法[J]. 计算机研究与发展, 2017, 54(12): 2785-2796. |
[8] | 王炜,李彤,何云,李浩. 一种软件演化活动波及效应混合分析方法[J]. 计算机研究与发展, 2016, 53(3): 503-516. |
[9] | 张志飞,苗夺谦,聂建云,岳晓冬. 否定句的情感不确定性度量及分类[J]. 计算机研究与发展, 2015, 52(8): 1806-1816. |
[10] | 申彦,朱玉全,刘春华. 基于磁盘存储1项集计数的增量FP_GROWTH算法[J]. 计算机研究与发展, 2015, 52(3): 569-578. |
[11] | 赵传君,王素格,李德玉,李欣. 基于分组提升集成的跨领域文本情感分类[J]. 计算机研究与发展, 2015, 52(3): 629-638. |
[12] | 顾 鑫, 王士同,. 大样本多源域与小目标域的跨领域快速分类学习[J]. 计算机研究与发展, 2014, 51(3): 519-535. |
[13] | 吴 琼 刘 悦 沈华伟 张 瑾 许洪波 程学旗. 面向跨领域情感分类的统一框架[J]. , 2013, 50(8): 1683-1689. |
[14] | 李素科 蒋严冰. 基于情感特征聚类的半监督情感分类[J]. 计算机研究与发展, 2013, 50(12): 2570-2577. |
[15] | 董 杰 沈国杰. 一种基于模糊关联分类的遥感图像分类方法[J]. , 2012, 49(7): 1500-1506. |
PDF全文下载地址:
https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3811