二维码(扫一下试试看!) | 基于改进编辑距离和LCS的同源性检测技术 | A Homology Detection Technology Based on Improved Edit Distance and LCS | 投稿时间:2014-04-21 | DOI:10.15918/j.tbit1001-0645.2017.02.011 | 中文关键词:同源性检测编辑距离最长公共字串结构化信息代码变体 | English Keywords:homology detectionedit distancelongest common sequencestructured informationcode variants | 基金项目:电子信息产业发展基金资助项目(工信部财函[2011]506号) | | 摘要点击次数:955 | 全文下载次数:662 | 中文摘要: | 传统基于Token的同源性检测算法存在代码变体结构化信息定位困难、模块提取、识别能力差、同源性度量精度低的问题.为此,提出了一种基于改进编辑距离和LCS(longest common sequence)的结构化识别同源性检测技术.在编辑距离(edit distance)计算中,引入交换算子,提高模块内部同源性度量精度.在LCS算法中,引入相似模块度量的最小尺寸监测机制和代码行间最大动态相关性度量,提供代码结构边界划分、模块行关联、代码有效结构化信息抽取的能力.实验证明,该方法是一种有效的基于结构化信息的同源性检测技术,其随机抽样检测结果的准确率、召回率及F值均有较优表现,且稳定性较好. | English Summary: | Because some problems existed in traditional token-based algorithm for homology detection in structured information location, module identification, module extraction and high precision homology measure for code variants, a structured recognition homology detection technology was proposed based on an improved edit distance algorithm and improved longest common sequence (LCS) algorithm. In the edit distance calculation, the exchange operator was introduced to improve the measurement accuracy of internal homology modules. In the LCS algorithm, a minimum size monitoring mechanism and line maximum dynamic correlation measure were introduced for similar modules, which offered the ability of code structure boundary division, module line association and structured information extraction. Experiments show that the structure information based algorithm is effective and stable for code homology detection, and the results of random sampling detection show its better performances in precision, recall rate and F values. Experiments show that the algorithm utilizing structure information for code homology detection is effective and stable, and the results of random sampling detection have better performances in precision, recall rate and F values. | 查看全文查看/发表评论下载PDF阅读器 | |
郑凤,陈艺戬.基于多径的双极化信道信息反馈方法[J].北京理工大学学报(自然科学版),2017,37(4):365~370.ZHENGFeng,CHENYi-jian.CSIFeedbackBasedonMulti-PathsInformationinDual-PolarizedMIMOSystem ... 北京理工大学科研学术 本站小编 Free考研考试 2021-12-21张真宁,孙华飞,韩希武,曹丽梅.晶粒直径的信息几何结构[J].北京理工大学学报(自然科学版),2017,37(4):436~440.ZHANGZhen-ning,SUNHua-fei,HANXi-wu,CAOLi-mei.TheInformationGeometricStructuresoftheS ... 北京理工大学科研学术 本站小编 Free考研考试 2021-12-21高原,刘辉,樊孝忠,牛振东.基于测试代码变化的重构意图推测方法[J].北京理工大学学报(自然科学版),2017,37(5):537~543.GAOYuan,LIUHui,FANXiao-zhong,NIUZhen-dong.InferringRefactoringIntentionfromTestC ... 北京理工大学科研学术 本站小编 Free考研考试 2021-12-21郑凤,陈艺戬.非理想双极化多天线系统中的信道信息反馈方法[J].北京理工大学学报(自然科学版),2017,37(8):818~823.ZHENGFeng,CHENYi-jian.CSIFeedbackforImperfectMulti-PolarizedMassiveMIMOSystem[J].Tr ... 北京理工大学科研学术 本站小编 Free考研考试 2021-12-21魏冬梅,张立人,胡楠楠,刘璐,马娜,赵曰峰.联合空谱信息和Gabor特征的高光谱人脸识别算法[J].北京理工大学学报(自然科学版),2017,37(10):1077~1083.WEIDong-mei,ZHANGLi-ren,HUNan-nan,LIULu,MANa,ZHAOYue-feng.Hype ... 北京理工大学科研学术 本站小编 Free考研考试 2021-12-21沈思,朱丹浩.基于深度学习的中文地名识别研究[J].北京理工大学学报(自然科学版),2017,37(11):1150~1155.SHENSi,ZHUDan-hao.ChinesePlaceNameRecognitionBasedonDeepLearning[J].TransactionsofBeij ... 北京理工大学科研学术 本站小编 Free考研考试 2021-12-21袁泉,李德志,王振永,郭庆,吕海波.随钻测量中连续波动信息解调技术研究与实现[J].北京理工大学学报(自然科学版),2017,37(11):1195~1199,1210.YUANQuan,LIDe-zhi,WANGZhen-yong,GUOQing,LHai-bo.ResearchandImplem ... 北京理工大学科研学术 本站小编 Free考研考试 2021-12-21大数据背景下我国纳税人信息权的法律保护研究中国人民大学法学院出版日期:2020-11-16发布日期:2020-11-11作者简介:朱大旗:中国人民大学法学院教授,博士生导师;曹阳:中国人民大学法学院博士研究生(北京100872)基金资助:国家社会科学基金重大项目“‘互联网+’背景下的税收征管模式研究 ... 中国人民大学科研学术 本站小编 Free考研考试 2021-12-21基于全局信息的卷积神经网络模型剪枝微调优化方法孙文宇,曹健?,李普,刘瑞北京大学软件与微电子学院,北京102600收稿日期:2020-06-02修回日期:2020-07-08出版日期:2021-07-20基金资助:国家自然科学基金(U20A20204)资助PruningandFine-tuningO ... 北京大学科研学术 本站小编 Free考研考试 2021-12-20中文机器阅读理解的鲁棒性研究李烨秋1,唐竑轩1,钱锦1,邹博伟1,2,洪宇1,?1.苏州大学计算机科学与技术学院,苏州2150002.新加坡资讯通信研究院,新加坡138632收稿日期:2020-06-08修回日期:2020-08-14出版日期:2021-01-20基金资助:国家自然科学基金(6170 ... 北京大学科研学术 本站小编 Free考研考试 2021-12-20
| |