文献详情
大规模RDF图数据上高效率分布式查询处理
外文标题:Efficient Distributed Query Processing on Large Scale RDF Graph Data
文献类型:期刊
期刊名称:软件学报
年:2019
卷:30
期:3
页码:498-514
ISSN:1000-9825
关键词:星形分解;分布式;基本图模式匹配;大规模RDF图;MapReduce
所属部门:信息学院
链接地址:http://d.oldg.wanfangdata.com.cn/Periodical_rjxb201903002.aspx
摘要:知识图谱是智能数据的主要表现形式,随着知识图谱领域的不断发展,大量的智能图数据以资源描述框架(resource description framework,简称RDF)形式发布出来.RDF图上的SPARQL查询语义对应于图同态,是一个NP-完全问题.因此,如何使用分布式方法在大规模PDF图上有效回答SPARQL查询是一个富有挑战性的问题.目前已有研究使用MapReduce计算模型处理大规模RDF数据,但其将SPARQL查询拆分成单个的查询子句,没有考虑RDF数据的丰富语义和自身的图特性,导致MapReduce迭代次数过多.首先,利用RDF数据内嵌的语义和结构信息作为启发式信息,将查询图分解为星形的集合,可以在更少次迭代内得到查询结果.同时,分解算法给出中间结果较少的星形匹配顺序,基于此顺序,每轮MapReduce操作通过连接操作匹配一个新的星形,直至产生最终的答案.最后,在标准合成数据集WatDiv和真实数据集DBpedia上进行大量的实验评估.实验结果表明:所提基于星形分解的分布式SPARQL BGP匹配算法能够高效回答查询,查询时间比SHARD和S2X算法的查询时间平均提高一个数量 ...More
知识图谱是智能数据的主要表现形式,随着知识图谱领域的不断发展,大量的智能图数据以资源描述框架(resource description framework,简称RDF)形式发布出来.RDF图上的SPARQL查询语义对应于图同态,是一个NP-完全问题.因此,如何使用分布式方法在大规模PDF图上有效回答SPARQL查询是一个富有挑战性的问题.目前已有研究使用MapReduce计算模型处理大规模RDF数据,但其将SPARQL查询拆分成单个的查询子句,没有考虑RDF数据的丰富语义和自身的图特性,导致MapReduce迭代次数过多.首先,利用RDF数据内嵌的语义和结构信息作为启发式信息,将查询图分解为星形的集合,可以在更少次迭代内得到查询结果.同时,分解算法给出中间结果较少的星形匹配顺序,基于此顺序,每轮MapReduce操作通过连接操作匹配一个新的星形,直至产生最终的答案.最后,在标准合成数据集WatDiv和真实数据集DBpedia上进行大量的实验评估.实验结果表明:所提基于星形分解的分布式SPARQL BGP匹配算法能够高效回答查询,查询时间比SHARD和S2X算法的查询时间平均提高一个数量级,且优化算法的查询时间与基本算法相比缩短了49.63%~78.71%. ...Hide
DOI:10.13328/j.cnki.jos.005696
百度学术:大规模RDF图数据上高效率分布式查询处理
语言:中文
人气指数:1
浏览次数:1
基金:国家自然科学基金; 天津市自然科学基金; 数字出版技术国家重点实验室开放课题; 北京自然科学基金
作者其他论文
供给侧改革背景下区域经济发展的机遇分析和对策探讨.王鑫,.现代营销. 2019, 110-111.
面向SSD寿命优化的访问序列折叠缓存替换算法.唐琪, 王吉磊, 柴云鹏,.计算机科学与探索. 2019, 13(1), 35-44.
"数据科学"课程群与 "数据科学导论"课程建设初探.覃雄派, 陈跃国, 李翠平, et al. .大数据. 2018, 4(6), 19-28.
数据科学课程群与 数据科学导论课程建设初探.覃雄派, 陈跃国, 李翠平, et al. .大数据. 2018, 4(6), 19-28.
一种面向多租户的混合存储设备资源隔离的自适应方法.柴云鹏, 王传雯, 孙殿森,.2018.
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
大规模RDF图数据上高效率分布式查询处理
本站小编 Free考研/2020-04-17
相关话题/数据 信息
国际视阈下创新理论研究脉络与热点分析 ——基于Wos的SSCI/SCI数据源
文献详情国际视阈下创新理论研究脉络与热点分析——基于Wos的SSCI/SCI数据源外文标题:ResearchContextandHotspotAnalysisofInnovationTheoryfromtheInternationalPerspective——SSCI/SCIDataSourceba ...中国人民大学科研学术 本站小编 Free考研 2020-04-17居家社区养老服务质量及其影响因素分析——基于陕西省三市调查数据
文献详情居家社区养老服务质量及其影响因素分析——基于陕西省三市调查数据外文标题:QualityandInfluencingFactorsofHome-basedCommunityCareService——BasedonSurveyDataofThreeCitiesinShaanxi文献类型:期刊期刊 ...中国人民大学科研学术 本站小编 Free考研 2020-04-17信息资源管理理论的继承与创新:大数据与数据科学视角
文献详情信息资源管理理论的继承与创新:大数据与数据科学视角外文标题:DevelopingInformationResourcesManagementStudies:BigDataandDataSciencePerspectives文献类型:期刊期刊名称:中国图书馆学报年:2019卷:45期:2页码: ...中国人民大学科研学术 本站小编 Free考研 2020-04-17《民法总则》个人信息保护条文研究
文献详情《民法总则》个人信息保护条文研究文献类型:期刊期刊名称:中外法学年:2019卷:31期:1页码:54-75ISSN:1002-4875关键词:个人信息;个人信息权(权益);《民法总则》第111条;《个人信息保护法》所属部门:法学院链接地址:http://d.oldg.wanfangdata. ...中国人民大学科研学术 本站小编 Free考研 2020-04-17经验取样法的数据分析:方法及应用
文献详情经验取样法的数据分析:方法及应用外文标题:DataAnalysisforExperienceSampling:MethodandApplication文献类型:期刊期刊名称:中国人力资源开发年:2019卷:36期:1页码:35-52ISSN:1004-4124关键词:经验取样法;嵌套结构;数 ...中国人民大学科研学术 本站小编 Free考研 2020-04-17刑事司法中的公民个人信息保护
文献详情刑事司法中的公民个人信息保护外文标题:ProtectingPersonalInformationinCriminalJustice文献类型:期刊期刊名称:中国人民大学学报年:2019卷:33期:1页码:104-113ISSN:1000-5420关键词:个人信息;隐私权;技术侦查;记录监控链接 ...中国人民大学科研学术 本站小编 Free考研 2020-04-17政府数据开放的有偿模式辨析:合法性根基与执行路径选择
文献详情政府数据开放的有偿模式辨析:合法性根基与执行路径选择外文标题:AStudyofOpenGovernmentDatawithFees:LegitimacyandApproachesforApplication文献类型:期刊期刊名称:中国行政管理年:2019期:1页码:30-36ISSN:100 ...中国人民大学科研学术 本站小编 Free考研 2020-04-17旅游休闲、社会经济、生态环保耦合协调发展—基于北京市数据的实证
文献详情旅游休闲、社会经济、生态环保耦合协调发展—基于北京市数据的实证文献类型:期刊期刊名称:商业经济研究年:2019期:24页码:169-174ISSN:1002-5863关键词:旅游休闲;社会经济;生态环保;耦合协调度链接地址:http://d.oldg.wanfangdata.com.cn/P ...中国人民大学科研学术 本站小编 Free考研 2020-04-17大数据时代企业管理工作面临的困境及对策分析
文献详情大数据时代企业管理工作面临的困境及对策分析文献类型:期刊期刊名称:商情年:2019期:35页码:103-104ISSN:1673-4041关键词:大数据时代;企业;管理模式链接地址:http://d.oldg.wanfangdata.com.cn/Periodical_sq-zh201935 ...中国人民大学科研学术 本站小编 Free考研 2020-04-17大数据背景下财务会计向管理会计转型的策略
文献详情大数据背景下财务会计向管理会计转型的策略文献类型:期刊期刊名称:消费导刊年:2019期:35页码:223-224ISSN:1672-5719关键词:大数据背景;财务会计;管理会计;转型策略链接地址:http://d.oldg.wanfangdata.com.cn/Periodical_xfd ...中国人民大学科研学术 本站小编 Free考研 2020-04-17