1(云南大学软件学院 昆明 650091); 2(云南省软件工程重点实验室(云南大学) 昆明 650091) (hey@ynu.edu.cn)
出版日期:
2019-02-01基金资助:
国家自然科学基金项目(61462092,61379032,61662085);云南省自然科学基金重点项目(2015FA014);云南省数据驱动的软件工程创新团队项目(2017HC012);云南大学研究生科研创新基金项目(YDY17094)A Semantic Similarity Integration Method for Software Feature Location Problem
He Yun1, Li Tong1,2, Wang Wei1,2, Li Xiang1, Lan Wei11(College of Software, Yunnan University, Kunming 650091); 2(Key Laboratory for Software Engineering of Yunnan Province (Yunnan University), Kunming 650091)
Online:
2019-02-01摘要/Abstract
摘要: 特征是软件系统中被需求所定义的可执行功能实体.识别软件特征与源代码间映射关系的过程被称作特征定位.基于信息检索的特征定位方法由于高易用性和低开销等优点,被广泛应于软件维护、代码搜索等领域.所有基于信息检索的特征定位方法均建立在语义相似度计算基础之上,当前语义相似度计算存在2个主要问题:第一,源代码数据中大量噪声信息对相似度计算的干扰;第二,不同索引方法局限性导致的相似度计算结果失准.针对这2个问题,提出了一种面向软件特征定位问题的语义相似度集成方法.该方法在预处理过程引入词性过滤,有效过滤源代码中噪声数据,提升相似性计算的准确度.然后,以源代码数据自身结构特性为依据,集成不同索引方法进行相似度计算.在公开数据集上进行了实验,与现有方法相比,词性过滤和相似度集成在平均排序倒数性能上分别带来了30.88%和10.28%的提升,验证了所提方法的有效性.
参考文献
相关文章 15
[1] | 侯朋朋, 张珩, 武延军, 于佳耕, 邰阳, 苗玉霞. 基于多标签的内核配置图及其应用[J]. 计算机研究与发展, 2021, 58(3): 651-667. |
[2] | 王继娜, 陈军华, 高建华. 基于排序损失的ECC多标签代码异味检测方法[J]. 计算机研究与发展, 2021, 58(1): 178-188. |
[3] | 贺一笑, 庞明, 姜远. 蒙德里安深度森林[J]. 计算机研究与发展, 2020, 57(8): 1594-1604. |
[4] | 张莹莹, 钱胜胜, 方全, 徐常胜. 基于多模态知识感知注意力机制的问答方法[J]. 计算机研究与发展, 2020, 57(5): 1037-1045. |
[5] | 冯志勇, 徐砚伟, 薛霄, 陈世展. 微服务技术发展的现状与展望[J]. 计算机研究与发展, 2020, 57(5): 1103-1122. |
[6] | 程光, 钱德鑫, 郭建伟, 史海滨, 吴桦, 赵玉宇. 基于散度的网络流概念漂移分类方法[J]. 计算机研究与发展, 2020, 57(12): 2673-2682. |
[7] | 徐耀丽, 李战怀, 陈群, 王艳艳, 樊峰峰. 基于因子图的不一致记录对消歧方法[J]. 计算机研究与发展, 2020, 57(1): 175-187. |
[8] | 艾科,马国帅,杨凯凯,钱宇华. 一种基于集成学习的科研合作者潜力预测分类方法[J]. 计算机研究与发展, 2019, 56(7): 1383-1395. |
[9] | 郭嘉丰,范意兴. 深度学习检索框架的前沿探索[J]. 计算机研究与发展, 2018, 55(9): 1987-1999. |
[10] | 郭颖婕,刘晓燕,吴辰熙,郭茂祖,李傲. 基于U统计量和集成学习的基因互作检测方法[J]. 计算机研究与发展, 2018, 55(8): 1683-1693. |
[11] | 韩朝,苗夺谦,任福继,张红云. 基于粗糙集知识发现的开放领域中文问答检索[J]. 计算机研究与发展, 2018, 55(5): 958-967. |
[12] | 孟军,张晶,姜丁菱,何馨宇,李丽双. 结合近邻传播聚类的选择性集成分类方法[J]. 计算机研究与发展, 2018, 55(5): 986-993. |
[13] | 杨梅芳, 车永刚, 高翔. 基于OpenMP 4.0的发动机燃烧模拟软件异构并行优化[J]. 计算机研究与发展, 2018, 55(2): 400-408. |
[14] | 张恒山,高宇坤,陈彦萍,王忠民. 基于群体智慧的簇连接聚类集成算法[J]. 计算机研究与发展, 2018, 55(12): 2611-2619. |
[15] | 许行,王文剑,任丽芳. 一种基于决策森林的单调分类方法[J]. 计算机研究与发展, 2017, 54(7): 1477-1487. |
PDF全文下载地址:
https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3873