删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

大数据开创地学研究新途径:全数据挖掘提高研究精度——《地质科学》2018“纪念孙枢先生地质大数据专题”代序

本站小编 Free考研考试/2022-01-02

摘要
随着计算机、互联网和计算技术的迅猛发展,人类已经进入大数据时代,大数据也将改变人们对自然的理解和认知方式,改变科学研究的思想和方法,成为科学研究的新引擎。大数据体量之大并非其必要条件,通过对大量数据的挖掘,研究问题并做出正确决策才是大数据的精髓所在。大数据可以在社会各个领域广泛使用,大数据是通过对大量数据的分析研究问题、做出决策,这样一个概念、一种思想同时也是一种研究方法。大数据带给我们3 个颠覆性的观念改变:大数据研究的对象是全部数据(全样本,全变量)取代传统统计学的随机抽样;大数据研究的方法、手段是查明数据间相关关系取代传统的追求因果关系的研究方法;大数据研究的特点是取向高概率做出决策取代追求精确无误。因此,大数据的研究结果更加真实、有效、精确。?
大数据/
全样本/
全变量/
深度挖掘/
结果/
真实/
有效

With the rapid development of computer science, internet and computing techniques,mankind has entered the big data age.“Big data” will revolutionise the way people understand and cognize nature, change the ideas and methods of scientific research, it will become a new engine for scientific research. However large quantity of data is not necessary but sufficient condition to big data, its essence is to analyse problems and make the correct decisions by the way of data mining. Big data could be applied in various fields in the society, it’s a kind of thought or research method which analyse problems and make the correct decisions based on mass data. Big data has brought three aspects of the change of ideas:All the data(all samples,all variables)is the study object for big data instead of traditional random sampling in statistics; Exploring the correlation between data is the method and purpose of big data instead of studying the cause and effect of the matter; The research of big data is oriented to make decisions with high probability instead of getting exact results. Accordingly, researched results of big data are more efficacious and truer.?
Big data/
All samples/
All variables/
Data mining/
Results/
True/
Efficacious



PDF全文下载地址:

http://www.dzkx.org/data/article/export-pdf?id=geology_11486
相关话题/数据 社会 计算机 概率 互联网

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 基于数据密度确定分布区域的方法:以TAS图解分析为例
    摘要摘要:为了客观地确定数据点投图后分布的主要区域,本文提出了一种基于数据密度确定数据主要分布区域的方法。利用该方法可以更加直观地了解数据分布,并可以作为数据清洗的预处理手段。本文基于GEOROC大数据,以全碱对硅(TAS)图解为例,进行了分析和验证。通过提取GEOROC数据库中与TAS图解相关的岩 ...
    本站小编 Free考研考试 2022-01-02
  • 全球苦橄岩与太古宙科马提岩对比:全数据模式的启示
    摘要摘要:苦橄岩和科马提岩都是富镁的超镁铁质火山岩,早先,学术界大多关注它们之间的相似性,而对于它们之间的差异性很少强调。于是认为二者的地球化学性质近似,成因类似,形成条件类似。本文采用全数据模式的研究方法,从数据库收集了全球太古宙全部科马提岩和后太古宙全部苦橄岩数据,对比的结果表明,太古宙科马提岩 ...
    本站小编 Free考研考试 2022-01-02
  • 太古宙TTG 能否与埃达克岩对比?——全球数据给出的结果
    摘要摘要:文中收集了全球太古宙TTG和后太古宙埃达克岩的数据,研究对比表明,太古宙TTG不同于埃达克岩,早先学术界认为太古宙TTG相当于现代的埃达克岩,是一个错误的见解,是一个伪命题。TTG术语最早出现时并没有类似于埃达克岩的见解,后来发现了埃达克岩才引出二者类似的认识。为什么会出现这种见解?推测有 ...
    本站小编 Free考研考试 2022-01-02
  • 基于空间数据挖掘的三维成矿预测定量指标体系建立方法研究——以宁芜盆地钟姑矿田为例
    摘要摘要:大数据思维是直接从数据入手的一种新的思维方式,其本质是减少甚至完全屏蔽人为因素干扰,让数据说话。以往三维成矿预测中指标体系的建立多采用经验分析法,以地质模型和先验知识指导控矿特征变量取值,其准确性易受到人为影响。本文基于大数据思维,使用数据驱动方法对三维成矿预测中的找矿指标体系进行探索性研 ...
    本站小编 Free考研考试 2022-01-02
  • 基于多源数据约束的成矿动力学模拟——以宁芜盆地钟姑矿田典型矿床为例
    摘要摘要:数据驱动是大数据分析的特点之一。成矿过程的数值模拟即采用数据驱动方式,在基本的物理化学方程及地质模型基础上,通过定量的手段,模拟不同阶段、不同条件下成矿系统的演化过程,从而能够更深入、直观的讨论各种地质要素对成矿系统的影响,验证已有的成矿理论,获得新的认识。姑山铁矿床和杨庄铁矿床是宁芜火山 ...
    本站小编 Free考研考试 2022-01-02
  • 基于高分二号卫星数据的煤矿区地质灾害信息提取研究
    摘要摘要:随着遥感数据获取技术和能力的全面提高,遥感数据呈现出明显的大数据特征。发展适应于遥感大数据的智能分析和信息挖掘技术,成为当前遥感技术研究的前沿。高分二号(GF-2)卫星数据是我国首颗自主研发的亚米级高分辨率卫星数据,具有观测幅宽、重访周期短、高辐射精度、高定位精度等优势,为未来我国地质灾害 ...
    本站小编 Free考研考试 2022-01-02
  • 大数据环境下内蒙古浩布高地区铅锌多金属矿智能矿产预测研究
    摘要摘要:传统机器学习算法已广泛应用于矿产预测,但面对地质大数据的高维稀疏、不平衡小样本等特性仍缺乏有效处理和分析的方法,设计适合地质大数据特点的机器学习算法是智能矿产预测亟需解决的新问题。本文以内蒙古浩布高地区的铅锌多金属矿产预测为例,提出了一种面向地质大数据的半监督协同训练矿产预测模型。首先对研 ...
    本站小编 Free考研考试 2022-01-02
  • 基于断层滑动数据古应力反演的影响因素及其误差分析
    摘要摘要:古构造应力场是构造动力学研究中的一个重要内容,且断层滑动数据古应力反演已经成为古构造应力场恢复研究中比较常用的重要方法之一。近年来,断层滑动数据古应力反演方法研究和应用取得了一系列重要进展,但有关反演结果的解释仍存歧义,反演结果的影响因素及其误差范围等并未得到深入研究与定量分析。本文总结指 ...
    本站小编 Free考研考试 2022-01-02
  • 冀北康保晚古生代花岗质岩浆作用年龄数据及构造意义
    摘要摘要:冀北康保位于华北克拉通北缘中段,北靠古亚洲洋构造域(中亚造山带)。区内出露有小西沟、前孟家地、石柱梁、三老虎、新村和西五福堂等6个晚古生代花岗岩体,它们的锆石U-Pb年龄分别为260.6±1.6Ma、264.1±1.7Ma、269.5±2.7Ma、276.3±1.9Ma、280.4±2.0 ...
    本站小编 Free考研考试 2022-01-02
  • 基于多组学数据的早期宫颈鳞状细胞癌分类
    从分子层面对泛癌进行研究已经得到了很大的进展,但是对宫颈鳞状细胞癌的分子分类研究仍然需要更多的探索.为了找到宫颈鳞状细胞癌潜在的子类,本文提出了一个基于多维组学数据的癌症亚型分类分析流程.通过统计学方法对癌症基因组图谱(TheCancerGenomeAtlas,TCGA)宫颈鳞状细胞癌的mRNA表达 ...
    本站小编 Free考研考试 2022-01-02