删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于大数据技术的地学文档关键词提取算法研发

本站小编 Free考研考试/2022-01-02

摘要/Abstract


摘要: 地学文档中蕴含了丰富的信息与专家知识,缺少关键词支持的地学文档给分类管理、信息检索与共享带来不便.为了发挥大数据技术处理非结构化地学数据优势,本文基于Hadoop平台设计并开发了一款地学文档关键词自动提取算法软件,将各类Word、PDF格式地学文档资料分布式存储在HDFS和HBase中,可对非结构化数据进行自动地读取、解析、处理、计算等.研发了大数据环境下的基于加权、词频的关键词提取算法,以及融合加权与词频两套方法的组合关键词提取算法.使用100余篇期刊论文对算法进行测试并与作者关键词对比,结果表明组合算法提取的复合关键词具有较高的地学类关键词命中率,有的甚至可达100%,其计算效率大大优于单机运行,可为地学文档在线查阅与检索等提供有效的辅助支持.


PDF全文下载地址:

http://www.progeophys.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=8717
相关话题/地学 数据 计算 设计 信息

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 我国矿井物探技术发展现状---基于CAJD数据源的统计与分析
    摘要/Abstract摘要:当前,矿井物探作为我国煤矿安全高效生产的一个有力保障,受到越来越多的关注.研究以矿井物探为主题,中国知网期刊数据库(CAJD)为平台,采用文献计量学方法,检索我国自1977年至今40年矿井物探专业发表论文842篇,统计分析发表年度、期刊来源、论文作者、机构来源、影响程度、 ...
    本站小编 Free考研考试 2022-01-02
  • 影响GNSS数据质量的多路径效应相关性分析
    摘要/Abstract摘要:影响GNSS数据质量因素较多,多路径效应是其中重要的因素,本文结合多路径效应数据处理模型与方法,以实测GNSS数据为基础,针对多路径效应的影响相关性进行了研究分析.结果表明:对于连续长时间观测数据而言,多路径效应具有一定的重复性与周期性;由气象变化因素引起的多路径效应可通 ...
    本站小编 Free考研考试 2022-01-02
  • 星地闪电探测系统在中国区域探测数据对比分析
    摘要/Abstract摘要:根据传感器所处位置的不同,闪电观测资料的获取主要有地面观测和卫星观测两种方式,二者各有优势,对两类资料质量的评估与对比是重要的研究课题.为此本文将我国气象部门国家级地基闪电监测网络——国家雷电监测网与低轨道卫星闪电探测器LIS(LightningImagingSensor ...
    本站小编 Free考研考试 2022-01-02
  • 透射法典型槽波数据波场分析
    摘要/Abstract摘要:煤矿井下巷道煤层中采集的槽波地震数据中包含多种类型地震波,对这些波组认识存在争议.通过正演模拟获得的槽波波场过于理想化,与现场采集槽波数据存在一定偏差.针对煤矿实际采集的典型槽波数据,采用时频域极化滤波方法,利用槽波数据中的纵波在波传播方向能量最强、垂直方向能量最弱的特点 ...
    本站小编 Free考研考试 2022-01-02
  • 基于测井数据体的页岩油储层可压裂性评价研究
    摘要/Abstract摘要:为评价页岩油储层可压裂性,以鄂尔多斯盆地长7页岩油储层为例,利用研究区部分已压裂井测井数据,计算得出脆性指数和断裂韧性指数,绘制了可压裂性剖面图,结合脆性指数和断裂韧性指数建立了一种新的页岩油储层可压裂性评价模型,为压裂选层、选井提供前期指导,为页岩油工程甜点的筛选以及压 ...
    本站小编 Free考研考试 2022-01-02
  • 西藏马扎拉矿区综合信息找矿模型建立与应用
    摘要/Abstract摘要:马扎拉金锑矿是西藏藏南地区特提斯喜马拉雅成矿带上典型的受构造控制的蚀变岩型矿床.为了查明工作区控矿构造的空间展布以及为找矿评价提供依据,在前人总结的区域成矿模式的指导下,以物性为桥梁,将成矿模式转化为地质-地球物理模型,并以此模型为指导思想,综合分析了工作区地质资料和面积 ...
    本站小编 Free考研考试 2022-01-02
  • 逆Laplace变换新算法及其在时间域电磁响应计算中的应用
    摘要/Abstract摘要:时间域电磁响应的正演计算多是由频率域响应经逆Laplace变换而得到.逆Laplace变换的计算精度和效率是时间域电磁响应计算中方法选择的重要指标.论文分析了几种逆Laplace变换的算法机制,并优选出Talbot算法计算了水平电偶源层状模型的时间域电磁响应.逆Lapla ...
    本站小编 Free考研考试 2022-01-02
  • 基于岩石物理相的泥质砂岩储层含水饱和度计算方法
    摘要/Abstract摘要:涠洲M油田位于北部湾盆地涠西南凹陷,研究区岩性复杂,储层孔隙结构差异较大.在双对数坐标下,储层电阻率增大指数随含水饱和度变化关系呈现弯曲现象,且关系较为分散,给区域含水饱和度求解带来一定困难.研究从岩石导电机理出发,实际模拟分析了弯曲现象产生的原因及影响因素,曲线弯曲程度 ...
    本站小编 Free考研考试 2022-01-02
  • 微动数据平稳性检验方法的适用性分析
    摘要/Abstract摘要:微动勘查方法基于微动数据满足平稳性的理论假设.检验数据平稳性的方法较多,各种方法有各自的适用性.本文研究了图检验法、轮次检验、逆序数检验、单位根检验、SpaceTime-Index等方法在微动数据平稳性检验中的适用性.测试了两组微动数据,一组没有受到干扰,另一组受到过往车 ...
    本站小编 Free考研考试 2022-01-02
  • 大数据时代基于物联网和云计算的地震信息化研究
    摘要/Abstract摘要:近年来,大数以其蕴含的丰富价值,得到了学术界和企业界的广泛关注.对大数据进行管理利用并构建大数据服务,是挖掘大数据价值的关键途径.本文从地震信息化工作即将进入大数据时代的角度出发,以大数据(BigData)、物联网(InternetofThings)、云计算(CloudC ...
    本站小编 Free考研考试 2022-01-02