删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于关键词的代码自动摘要

本站小编 Free考研考试/2022-01-01

张世琨1,谢睿1,2,叶蔚1,陈龙1,2
1(北京大学软件工程国家工程研究中心 北京 100871);2(北京大学软件与微电子学院 北京 100871) (ruixie@pku.edu.cn)
出版日期: 2020-09-01




Keyword-Based Source Code Summarization

Zhang Shikun1, Xie Rui1,2, Ye Wei1, Chen Long1,2
1(National Engineering Research Center for Software Engineering, Peking University, Beijing 100871);2(School of Software and Microelectronics, Peking University, Beijing 100871)
Online: 2020-09-01







摘要/Abstract


摘要: 代码摘要(code summary)是对一段源代码简短的自然语言描述,代码自动摘要(code summarization)技术通过自动化地生成代码摘要辅助开发者更好地理解程序代码,该技术在许多软件开发活动中都具有重要的应用价值.代码自动摘要同时结合了机器翻译和文本摘要2个任务,如何更好地对代码建模以及如何更好地筛选代码中的关键信息是代码摘要所面临的主要挑战.受人类写摘要时的习惯和相关研究的启发,提出了一种基于关键词的代码自动摘要方法(keyword-based source code summarization, KBCoS).该方法将函数签名和API(application programming interface)调用视为关键词,并利用关键词序列来优化解码器注意力机制中的权重分布,使模型在生成摘要时更集中地关注代码中的重要信息.此外,为克服代码符号词汇表过大的问题,提出了符号部分拆分算法,即当符号不在词表中时,依据常用命名规则将符号拆成子符号的序列.该算法简单有效,能很好地平衡代码符号序列长度和未登录词数目之间的矛盾.选用了带有注意力机制的序列到序列模型作为基准模型,并在公开的Java代码摘要数据集上进行了评估.实验表明,基于关键词的注意力机制和部分拆分算法在BLEU-4,METEOR,ROUGE-L这3个评测指标上均能提升基准模型的表现.同时,在另一个Python数据集上也取得了一致的实验结果.最后,将KBCoS与现有模型相结合,在Java数据集上取得了当前最好的结果,该结果表明KBCoS也能改进现有的其他模型.评测结果和注意力权重的热力图都表明了KBCoS的有效性.






[1]廖海斌, 徐斌. 基于性别和年龄因子分析的鲁棒性人脸表情识别[J]. 计算机研究与发展, 2021, 58(3): 528-538.
[2]杜圣东, 李天瑞, 杨燕, 王浩, 谢鹏, 洪西进. 一种基于序列到序列时空注意力学习的交通流预测模型[J]. 计算机研究与发展, 2020, 57(8): 1715-1728.
[3]李梦莹, 王晓东, 阮书岚, 张琨, 刘淇. 基于双路注意力机制的学生成绩预测模型[J]. 计算机研究与发展, 2020, 57(8): 1729-1740.
[4]陈彦敏, 王皓, 马建辉, 杜东舫, 赵洪科. 基于层级注意力机制的互联网用户信用评估框架[J]. 计算机研究与发展, 2020, 57(8): 1755-1768.
[5]李若南, 李金宝. 一种无源被动室内区域定位方法的研究[J]. 计算机研究与发展, 2020, 57(7): 1381-1392.
[6]郭丽峰, 李智豪, 胡磊. 面向云存储的带关键词搜索的公钥加密方案[J]. 计算机研究与发展, 2020, 57(7): 1404-1414.
[7]张艺璇, 郭斌, 刘佳琪, 欧阳逸, 於志文. 基于多级注意力机制网络的app流行度预测[J]. 计算机研究与发展, 2020, 57(5): 984-995.
[8]张莹莹, 钱胜胜, 方全, 徐常胜. 基于多模态知识感知注意力机制的问答方法[J]. 计算机研究与发展, 2020, 57(5): 1037-1045.
[9]程艳, 尧磊波, 张光河, 唐天伟, 项国雄, 陈豪迈, 冯悦, 蔡壮. 基于注意力机制的多通道CNN和BiGRU的文本情感倾向性分析[J]. 计算机研究与发展, 2020, 57(12): 2583-2595.
[10]尉桢楷, 程梦, 周夏冰, 李志峰, 邹博伟, 洪宇, 姚建民. 基于类卷积交互式注意力机制的属性抽取研究[J]. 计算机研究与发展, 2020, 57(11): 2456-2466.
[11]杨宁滨, 周权, 许舒美. 无配对公钥认证可搜索加密方案[J]. 计算机研究与发展, 2020, 57(10): 2125-2135.
[12]张志昌,张珍文,张治满. 基于IndRNN-Attention的用户意图分类[J]. 计算机研究与发展, 2019, 56(7): 1517-1524.
[13]石乐义,朱红强,刘祎豪,刘佳. 基于相关信息熵和CNN-BiLSTM的工业控制系统入侵检测[J]. 计算机研究与发展, 2019, 56(11): 2330-2338.
[14]孙小婉,王英,王鑫,孙玉东. 面向双注意力网络的特定方面情感分析模型[J]. 计算机研究与发展, 2019, 56(11): 2384-2395.
[15]齐乐,张宇,刘挺. 基于关键信息的问题相似度计算[J]. 计算机研究与发展, 2018, 55(7): 1539-1547.





PDF全文下载地址:

https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4263
相关话题/计算机 代码 序列 数据 信息

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 数据挖掘与知识发现专题前言
    陈恩红1,梁吉业2,张敏灵31(中国科学技术大学合肥230027);2(山西大学太原030006);3(东南大学南京210096)出版日期:2020-08-01ChenEnhong1,LiangJiye2,ZhangMinling3Online:2020-08-01摘要/Abstract摘要:数据挖 ...
    本站小编 Free考研考试 2022-01-01
  • 基于随机投影的高维数据流聚类
    朱颖雯1,2,3,陈松灿1,21(南京航空航天大学计算机科学与技术学院南京211106);2(模式分析与机器智能工业和信息化部重点实验室(南京航空航天大学)南京211106);3(三江学院计算机科学与工程学院南京210012)(yingwen.zhu@nuaa.edu.cn)出版日期:2020-08 ...
    本站小编 Free考研考试 2022-01-01
  • 一种基于序列到序列时空注意力学习的交通流预测模型
    杜圣东1,李天瑞1,杨燕1,王浩1,谢鹏1,洪西进21(西南交通大学信息科学与技术学院成都610031);2(台湾科技大学计算机科学与信息工程系台北10607)(sddu@swjtu.edu.cn)出版日期:2020-08-01基金资助:国家重点研发计划项目(2019YFB2101801);国家自然 ...
    本站小编 Free考研考试 2022-01-01
  • 一种基于智能手机传感器数据的地图轮廓生成方法
    陶涛1,孙玉娥2,5,陈冬梅1,杨文建1,黄河1,3,罗永龙4,51(苏州大学计算机科学与技术学院江苏苏州215006);2(苏州大学轨道交通学院江苏苏州215131);3(中国科学技术大学苏州研究院江苏苏州215123);4(安徽师范大学计算机与信息学院安徽芜湖241002);5(网络与信息安全安 ...
    本站小编 Free考研考试 2022-01-01
  • 计算机体系结构前沿技术2020专题前言
    刘志勇1,窦勇21(中国科学院计算技术研究所北京100190);2(国防科技大学长沙410073)出版日期:2020-06-01Online:2020-06-01摘要/Abstract摘要:我们高兴地向读者推出本刊“计算机体系结构前沿技术”专题!本专题收录的6篇文章既包含不同技术领域和方向的综述,也 ...
    本站小编 Free考研考试 2022-01-01
  • 基于Spark的大数据访存行为跨层分析工具
    许丹亚1,王晶1,2,王利3,张伟功2,31(首都师范大学信息工程学院北京100048);2(高可靠嵌入式技术北京市工程研究中心(首都师范大学)北京100048);3(北京成像理论与技术高精尖创新中心(首都师范大学)北京100048)(xudanya@cnu.edu.cn)出版日期:2020-06- ...
    本站小编 Free考研考试 2022-01-01
  • 面向高通量计算机的图算法优化技术
    张承龙1,2,曹华伟1,王国波1,2,郝沁汾1,张洋1,叶笑春1,范东睿1,21(计算机体系结构国家重点实验室(中国科学院计算技术研究所)北京100190);2(中国科学院大学计算机与控制学院北京100049)(caohuawei@ict.ac.cn)出版日期:2020-06-01基金资助:国家重点 ...
    本站小编 Free考研考试 2022-01-01
  • 基于多视角RGB-D图像帧数据融合的室内场景理解
    李祥攀1,张彪1,孙凤池2,刘杰31(南开大学计算机学院天津300750);2(南开大学软件学院天津300750);3(南开大学人工智能学院天津300750)(xiangpan.li@qq.com)出版日期:2020-06-01基金资助:国家自然科学基金项目(61873327)IndoorScene ...
    本站小编 Free考研考试 2022-01-01
  • 基于Jacobi ADMM的传感网分布式压缩感知数据重构算法
    李国瑞1,孟婕1,彭三城2,王聪11(东北大学计算机科学与工程学院沈阳110819);2(广东外语外贸大学语言工程与计算实验室广州510006)(lgr@neuq.edu.cn)出版日期:2020-06-01基金资助:国家自然科学基金项目(61876205);中央高校基本科研业务费专项资金(N172 ...
    本站小编 Free考研考试 2022-01-01
  • 融合多元信息的多关系社交网络节点重要性研究
    罗浩1,闫光辉1,张萌1,包峻波1,李俊成1,刘婷1,杨波2,魏军21(兰州交通大学电子与信息工程学院兰州730070);2(国网甘肃省电力公司信通公司兰州730050)(luoh382@163.com)出版日期:2020-05-01基金资助:国家自然科学基金项目(61662066,61163010 ...
    本站小编 Free考研考试 2022-01-01