删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

一种面向软件特征定位问题的语义相似度集成方法

本站小编 Free考研考试/2022-01-01

何云1,李彤1,2,王炜1,2,李响1,兰微1
1(云南大学软件学院 昆明 650091); 2(云南省软件工程重点实验室(云南大学) 昆明 650091) (hey@ynu.edu.cn)
出版日期: 2019-02-01


基金资助:国家自然科学基金项目(61462092,61379032,61662085);云南省自然科学基金重点项目(2015FA014);云南省数据驱动的软件工程创新团队项目(2017HC012);云南大学研究生科研创新基金项目(YDY17094)

A Semantic Similarity Integration Method for Software Feature Location Problem

He Yun1, Li Tong1,2, Wang Wei1,2, Li Xiang1, Lan Wei1
1(College of Software, Yunnan University, Kunming 650091); 2(Key Laboratory for Software Engineering of Yunnan Province (Yunnan University), Kunming 650091)
Online: 2019-02-01







摘要/Abstract


摘要: 特征是软件系统中被需求所定义的可执行功能实体.识别软件特征与源代码间映射关系的过程被称作特征定位.基于信息检索的特征定位方法由于高易用性和低开销等优点,被广泛应于软件维护、代码搜索等领域.所有基于信息检索的特征定位方法均建立在语义相似度计算基础之上,当前语义相似度计算存在2个主要问题:第一,源代码数据中大量噪声信息对相似度计算的干扰;第二,不同索引方法局限性导致的相似度计算结果失准.针对这2个问题,提出了一种面向软件特征定位问题的语义相似度集成方法.该方法在预处理过程引入词性过滤,有效过滤源代码中噪声数据,提升相似性计算的准确度.然后,以源代码数据自身结构特性为依据,集成不同索引方法进行相似度计算.在公开数据集上进行了实验,与现有方法相比,词性过滤和相似度集成在平均排序倒数性能上分别带来了30.88%和10.28%的提升,验证了所提方法的有效性.






[1]侯朋朋, 张珩, 武延军, 于佳耕, 邰阳, 苗玉霞. 基于多标签的内核配置图及其应用[J]. 计算机研究与发展, 2021, 58(3): 651-667.
[2]王继娜, 陈军华, 高建华. 基于排序损失的ECC多标签代码异味检测方法[J]. 计算机研究与发展, 2021, 58(1): 178-188.
[3]贺一笑, 庞明, 姜远. 蒙德里安深度森林[J]. 计算机研究与发展, 2020, 57(8): 1594-1604.
[4]张莹莹, 钱胜胜, 方全, 徐常胜. 基于多模态知识感知注意力机制的问答方法[J]. 计算机研究与发展, 2020, 57(5): 1037-1045.
[5]冯志勇, 徐砚伟, 薛霄, 陈世展. 微服务技术发展的现状与展望[J]. 计算机研究与发展, 2020, 57(5): 1103-1122.
[6]程光, 钱德鑫, 郭建伟, 史海滨, 吴桦, 赵玉宇. 基于散度的网络流概念漂移分类方法[J]. 计算机研究与发展, 2020, 57(12): 2673-2682.
[7]徐耀丽, 李战怀, 陈群, 王艳艳, 樊峰峰. 基于因子图的不一致记录对消歧方法[J]. 计算机研究与发展, 2020, 57(1): 175-187.
[8]艾科,马国帅,杨凯凯,钱宇华. 一种基于集成学习的科研合作者潜力预测分类方法[J]. 计算机研究与发展, 2019, 56(7): 1383-1395.
[9]郭嘉丰,范意兴. 深度学习检索框架的前沿探索[J]. 计算机研究与发展, 2018, 55(9): 1987-1999.
[10]郭颖婕,刘晓燕,吴辰熙,郭茂祖,李傲. 基于U统计量和集成学习的基因互作检测方法[J]. 计算机研究与发展, 2018, 55(8): 1683-1693.
[11]韩朝,苗夺谦,任福继,张红云. 基于粗糙集知识发现的开放领域中文问答检索[J]. 计算机研究与发展, 2018, 55(5): 958-967.
[12]孟军,张晶,姜丁菱,何馨宇,李丽双. 结合近邻传播聚类的选择性集成分类方法[J]. 计算机研究与发展, 2018, 55(5): 986-993.
[13]杨梅芳, 车永刚, 高翔. 基于OpenMP 4.0的发动机燃烧模拟软件异构并行优化[J]. 计算机研究与发展, 2018, 55(2): 400-408.
[14]张恒山,高宇坤,陈彦萍,王忠民. 基于群体智慧的簇连接聚类集成算法[J]. 计算机研究与发展, 2018, 55(12): 2611-2619.
[15]许行,王文剑,任丽芳. 一种基于决策森林的单调分类方法[J]. 计算机研究与发展, 2017, 54(7): 1477-1487.





PDF全文下载地址:

https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3873
相关话题/计算机 计算 数据 软件 云南大学

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 主编寄语--纪念《计算机研究与发展》创刊六十周年
    徐志伟(中国科学院计算技术研究所北京100190)出版日期:2019-01-01Online:2019-01-01摘要/Abstract摘要:时光荏苒,《计算机研究与发展》已经走过六十年,其前身为《电子计算机动态》,创刊于1958年12月,是我国第一个计算机刊物。当时我国的计算机事业刚刚起步,《电子 ...
    本站小编 Free考研考试 2022-01-01
  • 图计算中基于一致性约束条件的迭代模型研究
    孙茹君1,张鲁飞1,郝子宇1,陈左宁21(数学工程与先进计算国家重点实验室江苏无锡214125);2(国家并行计算机工程技术研究中心北京100190)(sun.rujun@meac-skl.cn)出版日期:2019-02-01基金资助:国家自然科学基金项目(9143020017);国家重点研发计划项 ...
    本站小编 Free考研考试 2022-01-01
  • 祝贺《计算机研究与发展》创刊六十周年
    陈熙霖(中国科学院计算技术研究所北京100190)出版日期:2019-01-01Online:2019-01-01摘要/Abstract摘要:今年是改革开放四十周年,也是《计算机研究与发展》创刊六十周年。《计算机研究与发展》见证了中国计算机事业从无到有、从小到大的全过程。作为国内最早的,甚至在很长一 ...
    本站小编 Free考研考试 2022-01-01
  • 和《计算机研究与发展》一起成长
    陆汝钤(中国科学院数学与系统科学研究院)出版日期:2019-01-01Online:2019-01-01摘要/Abstract摘要:每年金秋总有两个节日紧随一起:中秋节和国庆节(按时间先后)。今年可不寻常,徐主编告诉我《计算机研究与发展》(以下简称《研发》)创刊60周年了。这是我国的第一个计算机刊物 ...
    本站小编 Free考研考试 2022-01-01
  • 边缘计算:现状与展望
    施巍松1,张星洲2,3,王一帆2,3,张庆阳41(韦恩州立大学计算机科学系美国密歇根州底特律48202);2(中国科学院计算技术研究所北京100190);3(中国科学院大学北京100190);4(安徽大学计算机科学与技术学院合肥230601)(weisong@wayne.edu)出版日期:2019- ...
    本站小编 Free考研考试 2022-01-01
  • 一种视觉信息融合数据手套设计研究
    王赋攀1,吴亚东1,2,杨文超3,杨帆4,侯佳鑫1,廖竞11(西南科技大学计算机科学与技术学院四川绵阳621010);2(西南科技大学四川省军民融合研究院四川绵阳621010);3(达闼科技成都有限公司成都610100);4(法国国家科学研究中心电子、计算与成像科学实验室(勃艮第大学)法国第戎210 ...
    本站小编 Free考研考试 2022-01-01
  • 一种基于广义极值分布的非平衡数据分类算法
    付俊杰,刘功申(SchoolofElectronicInformationandElectricalEngineering,ShanghaiJiaoTongUniversity,Shanghai200240)出版日期:2018-11-01基金资助:国家“九七三”重点基础研究发展计划基金项目(2013 ...
    本站小编 Free考研考试 2022-01-01
  • 基因表达数据中的局部模式挖掘研究综述
    姜涛1,李战怀21(SchoolofComputerandInformationEngineering,HenanUniversityofEconomicsandLaw,Zhengzhou450046);2(SchoolofComputerScience,NorthwesternPolytechni ...
    本站小编 Free考研考试 2022-01-01
  • 基于联合树的隐私高维数据发布方法
    张啸剑1,陈莉2,金凯忠1,孟小峰31(河南财经政法大学计算机与信息工程学院郑州450002);2(河南财经政法大学网络信息安全研究所郑州450046);3(中国人民大学信息学院北京100872)(xjzhang82@ruc.edu.cn)出版日期:2018-12-01基金资助:国家自然科学基金项目 ...
    本站小编 Free考研考试 2022-01-01
  • HSMA:面向物联网异构数据的模式分层匹配算法
    郭帅,郭忠文,仇志金(CollegeofInformationScienceandEngineering,OceanUniversityofChina,Qingdao,Shandong266100)出版日期:2018-11-01基金资助:国家自然科学基金项目(61170258,61379127,61 ...
    本站小编 Free考研考试 2022-01-01