删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于代码结构知识的软件文档语义搜索方法

本站小编 Free考研考试/2022-01-02

摘要:自然语言文本形式的文档是软件项目的重要组成部分.如何帮助开发者在大量文档中进行高效、准确的信息定位,是软件复用领域中的一个重要研究问题.提出了一种基于代码结构知识的软件文档语义搜索方法.该方法从软件项目的源代码中解析出代码结构图,并以此作为领域特定的知识来帮助机器理解自然语言文本的语义.这一语义信息与信息检索技术相结合,从而实现了对软件文档的语义检索.在StackOverflow问答文档数据集上的实验表明,与多种文本检索方法相比,该方法在平均准确率(mean average precision,简称MAP)上可以取得至少13.77%的提升.



Abstract:Natural language text is a common form of knowledge representation in various software artifacts. During the practice of software reuse, software developers usually need to search the large amount of textual resource. This paper presents a software text semantic search approach based on code structure knowledge. This approach extracts a code structure graph from software source code and leverages it as a domain-specific knowledge base to analyze the semantic meanings of natural language texts. The semantic information is combined with information retrieval technology to re-rank text search results semantically. Experimental results on StackOverflow dataset show that this approach achieves at least 13.77% improvement in mean average precision (MAP) comparing to several text retrieval approaches.



PDF全文下载地址:

http://jos.org.cn/jos/article/pdf/5609
相关话题/软件 知识 信息 代码 实验

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 引入序列信息的残基相互作用网络比对算法
    摘要:残基相互作用网络比对,对于研究蛋白质结构与功能的关系具有重要意义.在基于网络拓扑信息进行网络比对的MAGNA算法基础上,将蛋白质的序列信息(即残基匹配度)引入到其优化函数中,确定拓扑信息和序列信息对比对的影响程度,提出适合于残基相互作用网络比对的SI-MAGNA算法.实验结果表明,SI-MAG ...
    本站小编 Free考研考试 2022-01-02
  • 软件定义网络中延迟满足的路由选择与实时调度更新
    摘要:由于数据流的动态性和流量负载转移,软件定义网络(softwaredefinednetworking,简称SDN)需要频繁更新数据平面以优化网络性能.大多数已有路由更新策略首先根据网络当前流量状态确定目标路由配置,然后更新数据流的路由.然而,由于交换机基于TCAM(ternarycontenta ...
    本站小编 Free考研考试 2022-01-02
  • 基于运行特征监控的代码复用攻击防御
    摘要:针对代码复用的攻击与防御已成为网络安全领域研究的热点,但当前的防御方法普遍存在防御类型单一、易被绕过等问题.为此,提出一种基于运行特征监控的代码复用攻击防御方法RCMon.该方法在分析代码复用攻击实现原理的基础上定义了描述程序正常运行过程的运行特征模型RCMod,并提出了验证程序当前运行状态是 ...
    本站小编 Free考研考试 2022-01-02
  • 面向DevOps的软件工程新技术专题前言
    摘要:Abstract:PDF全文下载地址:http://jos.org.cn/jos/article/pdf/5798 ...
    本站小编 Free考研考试 2022-01-02
  • 软件缺陷预测技术研究进展
    摘要:随着软件规模的扩大和复杂度的不断提高,软件的质量问题成为关注的焦点,软件缺陷是软件质量的对立面,威胁着软件质量,如何在软件开发的早期挖掘出缺陷模块成为一个亟需解决的问题.软件缺陷预测通过挖掘软件历史仓库,设计出与缺陷相关的内在度量元,然后借助机器学习等方法来提前发现与锁定缺陷模块,从而合理地分 ...
    本站小编 Free考研考试 2022-01-02
  • 体现使用反馈的APP软件用户评论挖掘
    摘要:随着APP软件应用的普及,针对APP软件的用户评论数量急剧增加,基于用户评论挖掘有价值的软件使用反馈,可以帮助开发人员有针对性地维护和改进APP软件.针对不同类型的APP软件使用反馈,提出了评价对象和评价观点抽取规则,给出了评论模式和评论种子的定义;应用评论种子挖掘与之相同或相似的体现相同使用 ...
    本站小编 Free考研考试 2022-01-02
  • 差分信息熵的网络时序型隐蔽信道检测
    摘要:网络隐蔽信道是以合法网络通信信道作为载体建立的一种隐蔽通信技术.相比信息加密,网络隐蔽信道不仅隐藏了传输信息的内容,同时还隐藏了传输信息的行为,因而具有更强的隐蔽性.隐蔽信道技术的出现,使得网络通信中的信息安全和隐私保护受到了极大的威胁,尤其是间谍和其他不法分子可以利用隐蔽信道绕过系统的安全检 ...
    本站小编 Free考研考试 2022-01-02
  • 运行时代码随机化防御代码复用攻击
    摘要:代码复用攻击日趋复杂,传统的代码随机化方法已无法提供足够的防护.为此,提出一种基于运行时代码随机化的代码复用攻击防御方法LCR.该方法在目标程序正常运行时,实时监控攻击者企图获取或利用gadgets的行为,当发现监控的行为发生时,立即触发对代码进行函数块级的随机化变换,使攻击者最终获取或利用的 ...
    本站小编 Free考研考试 2022-01-02
  • 融合多种数据信息的餐馆推荐模型
    摘要:餐馆推荐可以利用用户的签到信息、时间上下文、地理上下文、餐馆属性信息以及用户的人口统计信息等挖掘用户的饮食偏好,为用户生成餐馆推荐列表.为了更加有效地融合这些数据信息,提出一种融合了多种数据信息的餐馆推荐模型,该模型首先利用签到信息和时间上下文构建“用户-餐馆-时间片”的三维张量,同时利用其他 ...
    本站小编 Free考研考试 2022-01-02
  • 恶意代码演化与溯源技术研究
    摘要:恶意代码溯源是指通过分析恶意代码生成、传播的规律以及恶意代码之间衍生的关联性,基于目标恶意代码的特性实现对恶意代码源头的追踪.通过溯源可快速定位攻击来源或者攻击者,对攻击者产生一定的震慑打击作用,具有遏制黑客攻击、完善网络安全保障体系的重要作用和价值.近年来,网络安全形势愈加严峻,归类总结了学 ...
    本站小编 Free考研考试 2022-01-02