删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于StackOverflow数据的软件功能特征挖掘组织方法

本站小编 Free考研考试/2022-01-02

濠电偞鍨堕幐鎾磻閹剧粯鐓涘鑸得悘鐘绘煏閸繄鍩i柟宕囧█瀹曟粍鎷呴崷顓熸闂傚倷娴囧Λ鍕暦椤掆偓椤繈濡搁埡浣虹厬濡炪倖鐗楅悷銈囪姳閺夊簱妲堥柡鍐e亾婵犮垺锕㈠畷鍝勭暆閸曨剙娈岄梺鍛婂姦娴滅偤宕洪垾鏂ユ闁规儳鐡ㄧ亸顐ょ磼濡ゅ啫鏋旈柟椋庡█楠炴垿骞囬鍝勪航闂備礁鎼崐褰掓偡鏉堚晜顫曢柨鐕傛嫹
2濠电偞鍨堕幐绋棵洪妸鈺嬬稏闁圭儤顨嗛崵鈧梺鍛婂姦娴滅偤宕洪敓鐘崇厽闁靛繈鍊栧☉褔鏌i埄鍐噭缂佸锕弫鍌炴嚃閳哄喚妲卞┑鈽嗗亞婢ф鏁嬬紓浣靛姂娴滆埖淇婄€涙ɑ濯寸紒娑橆儐缂嶅﹥淇婇銈咁暭闁割煈鍨堕崺鈧い鎴f硶椤︼箓鏌涘▎蹇曠缂侀缚妫勮灃闁告洦鍘归崑鎺楁⒑閸濆嫬鈧綊鎮锋潏鈺傤潟婵ǹ娉涢惌妤€鈹戦悩鎻掆偓鎼佸锤婵犲喚娈介柣鎰▕閸ょ喐绻濋埀顒勫焺閸愯法鐭楀┑顔筋殔閻楀繒绮堟径瀣闁瑰濮甸弳鈺傜箾鐠囇勫547闂備礁婀遍。浠嬪磻閹剧粯鈷掗柛鏇楁櫅閻忣亪鏌eΔ瀣4濠电偞鍨堕幐绋棵洪敐鍥╃闁瑰鍋熼埢鏃€銇勮箛鎾寸闁稿鎹囧畷姗€顢旈崱妤冨幐闂備礁鍚嬪姗€宕銏㈡殾闁靛濡囬埢鏃堟煙閹规劕鐨洪柣鐔锋贡缁辨帗寰勭€n亞浠煎┑鐐跺紦閸楄櫕淇婄€涙ɑ濯撮悷娆欑到娴滈箖鏌涢幇鍏哥敖闁糕晪绻濋弻娑滅疀閿濆懎顫╅梺鍛婄懕缁辨洟骞忛悩璇茬闁告侗鍨抽ˇ鈺呮⒑鐞涒€充壕闂佸湱枪缁ㄨ偐绮径鎰厾闁哄嫬绻掔花鎸庛亜閺囨ê鐏茬€殿噮鍋婂璺衡枎閹兾ら梻浣瑰缁嬫垿藝椤撱垹鐒垫い鎺戯攻鐎氾拷40缂傚倷绀侀ˇ顖滅矓瀹曞洨绠旈柟鎯ь嚟閳绘梹鎱ㄥ鈧涵鎼佸极鐎n亶鐔嗛悹鍥b偓鍏呭缂備浇椴搁悷鈺呭蓟瀹€鍕闁挎繂娲犻崑鎾绘惞鐟欏嫬鍘归梺鍝勬川閸庢垹妲愬⿰鍫熺厪闁糕剝娲栫花绫匒闂備線娼уΛ鏃傜矆娴h鐟拔旈崨顔规寖闂佸憡渚楅崢钘夆枍瀹€鍕厱闁哄啯鎸剧壕鎸庛亜閵忥紕顣茬紒鏃傚枛椤㈡洟鎮╅顫婵炶揪缍€椤鎮¢埀顒勬⒒閸屾艾鈧粙顢欐繝鍕潟闁割偅娲栫粻缁樸亜閹捐泛顎岄柡浣割儏椤法鎷犻垾鍏呯按闂侀€炲苯鍘搁柤鍐茬埣婵$敻鎮欓弶鎴殼濠殿喗锕╅崗娑氭閿濆悿褰掓晲閸℃瑧鐓傚銈冨灪绾板秶绮╅悢纰辨晝闁靛牆娲﹂幆锝夋⒑閹稿海鈽夋い锔诲弮閸┾偓妞ゆ帒锕ョ€氾拷28缂傚倷绶¢崑澶愵敋瑜旈獮鍐箻閸撲線鈹忔繝銏f硾楗挳宕濋崨瀛樼厱闁哄啠鍋撶紒瀣崌瀵偊鎮介崹顐㈠幑闂佸搫娲﹀銊╂偡閳轰讲妲堥柟鐐綑閹兼悂鏌嶈閸撱劑骞忛敓锟�1130缂傚倷绀侀ˇ顖滅矓閸撲礁鍨濋柨鐔哄Т缁€鍌炴煕濞戞﹫鏀绘繛鍫濈焸閺屸剝寰勭€n亜顫囬梺閫炲苯澧鹃柟鍑ゆ嫹
摘要:软件的功能描述文档是开发人员了解软件的重要基础.现有的软件项目并不都是具备全面描述软件功能的文档,但软件项目开发和应用过程中的各种交流记录蕴含了讨论其功能的大量信息.为此,提出了一种基于StackOverflow问答数据的软件功能特征挖掘组织方法.该方法提出以动宾短语形式描述软件功能特征,挖掘并组织蕴含在StackOverflow数据中的软件功能特征,自动生成一种以层次化方式展示的软件项目功能特征文档.在针对真实项目的实验中,该方法生成的软件功能文档可以覆盖官方文档中列举的97.6%的软件常用功能.同时,该方法可以扩展从不同形式的项目交流记录中生成全面描述软件功能特征的文档.



Abstract:Functional specification documents are very important for the developers who want to understand and reuse unfamiliar software libraries. Due to high cost of human effort and time, lots of software do not provide the official functional documentation. However, some software communication records produced in software developing processes contain valuable information regarding software functions and usages. In this paper, an approach is proposed to automatically mining and organizing functional features for open source software based on StackOverflow data. By describing functional features in the form of verb phrases, this approach generates hierarchical list of software functional features as the supplement of software documentation. In the experimental evaluation on some real-world subjects, the automatically generated documents have covered 97.6% of the frequent-used functional features in the official documents. At the same time, the proposed approach can be adapted to different types of software communication records, and applied to software in different domains.



PDF全文下载地址:

http://jos.org.cn/jos/article/pdf/5533
相关话题/软件 组织 数据 交流 基础

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 面向开源生态的软件数据挖掘技术研究综述
    摘要:全球开源软件生态中孕育的大众化软件生产模式正在快速形成一种新型的软件生产力,在软件开发和应用各个环节发挥了巨大作用.大众化软件生产的数据规模日趋庞大、协同范围不断扩展、管理模式高度精简,这些全球化特征使其在软件复用、协同开发、知识管理等环节面临诸多挑战,迫切需要新的理论指导和工具支持.首先,界 ...
    本站小编 Free考研考试 2022-01-02
  • 基于贡献分配的开源软件核心开发者评估
    摘要:开源软件中如何真实评估所有开发者的贡献度并有效区分核心开发者和外围开发者,是一个重要的研究问题.通过设计开发文件的贡献度分配算法,以9个Apache项目为基础,分析了开发者对项目的贡献度,并以此有效地区分核心开发者和外围开发者.实验结果通过Apache官方主页公布的开发者地位名单进行考证,同时 ...
    本站小编 Free考研考试 2022-01-02
  • 一种多特征融合的软件开发者推荐
    摘要:软件开发者能力评价和协作关系推荐,是大数据环境下软件智能化开发领域的一个研究热点.通过分析互联网开发者社区和企业内部开发环境,设计出基于模糊综合评价的开发者能力模型.随后,通过挖掘开发者与任务的动态交互行为、静态匹配度以及开发者能力这3个不同维度的特征并结合矩阵分解技术,提出一种能力与行为感知 ...
    本站小编 Free考研考试 2022-01-02
  • 面向位置大数据的快速密度聚类算法
    摘要:面向位置大数据聚类,提出了一种简单但高效的快速密度聚类算法CBSCAN,以快速发现位置大数据中任意形状的聚类簇模式和噪声.首先,定义了Cell网格概念,并提出了基于Cell的距离分析理论,利用该距离分析,无需距离计算,可快速确定高密度区域的核心点和密度相连关系;其次,给出了网格簇定义,将基于位 ...
    本站小编 Free考研考试 2022-01-02
  • 基于时隙传输的数据中心路由算法设计
    摘要:基于软件定义网络(softwaredefinednetwork,简称SDN)的数据中心流量工程,能够通过对全局视图的网络管控,动态选择路由路径,规避拥塞发生的风险.但是在制定路由策略时,经常会对数据流进行迁移,尤其是针对大流的迁移容易造成数据流丢包以及接收端数据包乱序的问题.提出了基于时隙的流 ...
    本站小编 Free考研考试 2022-01-02
  • 基于离线密钥分发的加密数据重复删除方法
    摘要:重复数据删除技术受到工业界和学术界的广泛关注.研究者致力于将云服务器中的冗余数据安全地删除,明文数据的重复删除方法较为简单.而用户为了保护隐私,会使用各自的密钥将数据加密后上传至云服务器,形成不同的加密数据.在保证安全性的前提下,加密数据的重复删除较难实现.目前已有的方案较多依赖于在线的可信第 ...
    本站小编 Free考研考试 2022-01-02
  • 面向云数据的隐私度量研究进展
    摘要:隐私保护技术是云计算环境中防止隐私信息泄露的重要保障,通过度量这种泄露风险可反映隐私保护技术的隐私保护强度,以便构建更好的隐私保护方案.因此,隐私度量对隐私保护具有重大意义.主要对现有面向云数据的隐私度量方法进行综述:首先,对隐私保护技术和隐私度量进行概述,给出攻击者背景知识的量化方法,提出云 ...
    本站小编 Free考研考试 2022-01-02
  • 形式化方法的理论基础专题前言
    摘要:Abstract:PDF全文下载地址:http://jos.org.cn/jos/article/pdf/5473 ...
    本站小编 Free考研考试 2022-01-02
  • 自动分析递归数据结构的归纳性质
    摘要:提出了一种对递归数据结构的归纳性质进行自动化分析的框架.工作分为3个主要部分.首先,它将递归数据结构的归纳性质分为两个主要类别,并提出对应的处理模式,从而帮助简化对于程序中的递归数据结构上的相关性质的分析.其次,提出了一种称为分割与拼接的技术来发现和描述递归数据结构是如何被程序修改的:递归数据 ...
    本站小编 Free考研考试 2022-01-02
  • 基于类型理论的领域数据建模和验证及案例
    摘要:数据作为软件系统的主要处理对象,其规范性有助于软件系统的设计开发和软件系统之间的数据交换.面向行业数据规范及其验证,提出了一种基于类型理论的领域数据建模语言(DDML)和领域建模方法(DDMM).DDML语言通过定义类型和项的语法和语义,描述领域数据类型和对象的结构,通过定义类型规则及其类型检 ...
    本站小编 Free考研考试 2022-01-02
闂備礁缍婂ḿ褔顢栭崱妞绘敠闁逞屽墴閻擃偊宕剁捄杞板枈闂侀€炲苯澧伴柛鐘查叄瀹曘垽濡堕崶銊ヮ伕闁荤喐鐟ョ€氼參寮抽崼銉︾厱闁归偊鍓欓〃娆戠磼閸欐ê宓嗙€规洏鍔戦弫鎾绘晸閿燂拷闂備焦瀵х粙鎴︽儔婵傚憡鍋熸繛鎴欏灩绾偓闁诲骸婀辨慨瀵哥不椤栫偞鐓曟繛鍡樺姉婢ь剚绻濋埀顒勫箥椤旀儳宕ュ┑鐐叉鐢偤濡堕锔界厸闁稿本绋撻幊鍡欐偖濞嗘挻鐓曟俊顖欒閸庢垹绱撻崒姘兼Ш闁逞屽墴濞佳兾涘☉銏″亯婵犲﹤鐗婇弲顒勬煥閻曞倹瀚�