摘要:为了解决软件过程数据因活动信息及案例属性的缺失而无法应用传统过程挖掘方法的问题,以软件过程数据为研究对象,提出了一种双层次的软件过程挖掘方法.在活动层,提出加权结构连接向量模型对过程日志进行向量化,通过平均活动熵来确定过程日志模糊聚类的结果,将聚类结果作为活动信息支持后续挖掘工作的开展;在过程层,以启发式关系度量为基础,针对非完全循环进行研究,提出了过程层单触发序列循环划分的日志完备性条件,并进一步给出了循环归属的度量方法.基于大量真实软件过程数据的实验结果表明了双层次的软件过程挖掘方法的可行性及正确性.
Abstract:To address the issue of difficulty in applying the traditional process mining on software process data due to the deficiency of activity and case attribute, this paper focus on the software process data and proposes a bilayer software process mining approach. In the mining activity layer, a weighted structured linked vector mode is proposed to vectorize the process log. The result of fuzzy clustering, which can be regarded as activity information, is determined by the average activity entropy. In the process layer, based on the heuristic relation metrics, this paper studies the non-complete cycle situation and presents the single firing sequence of loop dividing condition of log completeness, and then proposes a method to measure the affiliation of loop. The real-world data sets are used to show the effectiveness and correctness of the proposed bilayer software process mining.
PDF全文下载地址:
http://jos.org.cn/jos/article/pdf/5304
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
数据驱动的双层次软件过程挖掘方法
本站小编 Free考研考试/2022-01-02
相关话题/过程 软件 数据 信息 结构
良结构下推系统的可覆盖性问题的下界
摘要:良结构下推系统是下推系统和良结构迁移系统的结合,该系统允许状态和栈字符是向量的形式,因而它们是无限的.状态迁移的同时允许栈进行入栈出栈的操作.它"非常接近不可判定的边缘".利用重置0操作,提出了一种模型可覆盖性问题复杂度下界的一般性证明方法,并且证明了状态是三维向量的子集和一般性的良结构下推系 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02面向对象软件内聚度度量数据分布的实证研究
摘要:度量数据的分布信息对于理解和使用面向对象软件度量有重要意义.人们对面向对象软件规模度量、耦合度度量乃至继承维度的度量数据的分布都有研究,但对除内聚度缺乏度LCOM之外的内聚度度量数据的分布却缺乏研究.已有的实证研究表明,LCOM并不是好的内聚度度量,因此探讨其他内聚度度量数据分布很有必要.对包 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于用户轨迹数据的移动推荐系统研究
摘要:近年来,随着移动智能设备的普及,移动社交网络方兴未艾,用户习惯和朋友分享自己的精彩经历,因此产生了大规模具有时空属性的用户轨迹数据.从狭义的角度来看,轨迹数据是指连续采样的GPS数据.从广义的角度来看,在时空域存在连续性的序列,都可以称作轨迹.例如:在社交网络上的用户签到序列就可以认为是粗粒度 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02一种不确定图数据库上的相似性连接方法
摘要:在确定图上进行的相似性连接已有许多研究成果.然而,在实际应用中会有许多因素使得图结构数据变得不确定.研究了不确定图数据库上的相似性连接问题.采用联合概率分布表示法来描述图中边的不确定性,结合一种新的图的相似性度量方法,给出了不确定图数据库上的相似性连接的形式化定义,并设计了一组过滤策略来减少连 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02联合建模异构社交和内容信息的活动推荐模型
摘要:随着基于活动的社交网络的迅速发展,活动推荐已成为一个重要的工具,帮助人们在线上发现有趣的活动,并在线下面对面地参与活动.但是,相对于传统的推荐系统,活动推荐面临着很多挑战.(1)用户只能参与很少的活动,这就导致一个非常稀疏的用户-活动矩阵;(2)用户对活动的响应是隐性反馈;(3)活动本身有生命 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于邻域差分和协方差信息的单目标进化算法
摘要:复杂的单目标优化问题是进化计算领域的一个研究热点问题,已有差分进化和协方差进化被认为是处理该问题的较有效方法,其中,差分信息类似于梯度可以有效地指导算法朝着最优解方向搜索,而协方差则是基于统计的方式来生成较优的子代种群.引入了协方差信息对差分算子进行改进,提出了一种基于邻域差分和协方差信息的进 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于混合智能优化算法的复杂软件可靠性分配
摘要:软件可靠性是系统设计、研究和运行过程中必须考虑的关键因素之一.与目前大多数软件可靠性分配的研究主要局限于简单的串并联模型不同,是将最优化算法应用于大型复杂软件系统的可靠性分配.针对分布估计算法收敛速度快、全局搜索能力强但易于陷入局部最优,且差分进化算法局部搜索能力强,但搜索速度略慢的问题,提出 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于逻辑Petri网的服务流程结构演化研究
摘要:流程结构演化是实现服务流程重构的一种有效手段,可以充分利用已有流程资源快速定制满足新业务需求的服务流程.然而,当前服务演化研究多关注于流程局部组成服务以及接口参数的兼容替换,对于流程结构演化所提供的操作过于简单,难以应对复杂流程演化场景.针对上述问题,提出一种基于逻辑Petri网的服务流程结构 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02软件定义无线传感器网络研究综述
摘要:研究了分布式无线传感器网络在异构互连和资源管理等方面存在的问题,深入分析了软件定义网络与无线传感器网络结合的必要性,在总结大量软件定义无线传感器网络架构后,给出了通用架构,并对应用面、控制面和数据面进行了详细阐述.进一步,从异构互连、资源管理、可靠控制、网络安全这4个方面梳理出当前存在的挑战及 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02数据广播调度自适应信道划分与分配方法
摘要:随着移动网络的不断发展,移动终端设备的计算能力与日俱增,越来越多的用户倾向于通过移动网络获取信息资源,这使得实时按需数据广播面临新的挑战:(1)数据内容和规模的多样化;(2)用户请求的实时性与需求多样性使得热点数据增加,直接导致广播数据总量的剧增;(3)用户对服务质量和水平的要求越来越高.当前 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02