删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于数据密度确定分布区域的方法:以TAS图解分析为例

本站小编 Free考研考试/2022-01-02

摘要
为了客观地确定数据点投图后分布的主要区域,本文提出了一种基于数据密度确定数据主要分布区域的方法。利用该方法可以更加直观地了解数据分布,并可以作为数据清洗的预处理手段。本文基于GEOROC大数据,以全碱对硅(TAS)图解为例,进行了分析和验证。通过提取GEOROC 数据库中与TAS 图解相关的岩石样本中SiO2、Na2O、K2O 和烧失量含量数据,通过数据常规清洗和归算,最终获得24 个种类合计13.3 万条有效数据。通过数据投点、分区统计和提取80% 数据的分布区域,验证了24种岩石样品与TAS图解的吻合程度。通过综合研究分析发现,有6类岩石的数据分布与TAS图解定义区域基本一致,18类岩石的数据分布与TAS图解定义区域有系统性偏差。大数据研究证明了TAS图解的不足之处,利用全碱和SiO2作为指标,难以实现提升总体分类的准确性。?
大数据数据/
分布区域提取/
密度分布/
TAS图解

In order to determine the main distribution areas of data points after mapping, this paper proposes an automatic distribution area determination method based on data density. The method can be used to understand the data distribution more intuitively and can be used as a preprocessing means for data cleaning. Based on GEOROC database, the total alkali vs. silicon(TAS)diagram is analyzed and verified in this paper. By extracting SiO2, Na2O, K2O and LOI of rock samples related to TAS diagram in GEOROC database, about 133 thousand valid data of 24 rock types were obtained through routine data cleaning and reduction. The agreement between 24 rock samples and TAS diagram was verified by data points mapping, partition statistics and 80% data distribution area extraction. Through comprehensive research and analysis, it is found that the data distribution of 9 rock types is basically consistent with TAS diagram definition area, and the data distribution of 15 rock types has systematic deviation in TAS diagram definition area. Big data research has proved the deficiency of the TAS diagram. Using Total-Alkali and SiO2 as indicators, it is difficult to improve the accuracy of the overall classification.?
Big data/
Determination of distribution region/
Density distribution/
TAS diagram



PDF全文下载地址:

http://www.dzkx.org/data/article/export-pdf?id=geology_11489
相关话题/数据 岩石 综合 指标 统计

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 全球苦橄岩与太古宙科马提岩对比:全数据模式的启示
    摘要摘要:苦橄岩和科马提岩都是富镁的超镁铁质火山岩,早先,学术界大多关注它们之间的相似性,而对于它们之间的差异性很少强调。于是认为二者的地球化学性质近似,成因类似,形成条件类似。本文采用全数据模式的研究方法,从数据库收集了全球太古宙全部科马提岩和后太古宙全部苦橄岩数据,对比的结果表明,太古宙科马提岩 ...
    本站小编 Free考研考试 2022-01-02
  • 太古宙TTG 能否与埃达克岩对比?——全球数据给出的结果
    摘要摘要:文中收集了全球太古宙TTG和后太古宙埃达克岩的数据,研究对比表明,太古宙TTG不同于埃达克岩,早先学术界认为太古宙TTG相当于现代的埃达克岩,是一个错误的见解,是一个伪命题。TTG术语最早出现时并没有类似于埃达克岩的见解,后来发现了埃达克岩才引出二者类似的认识。为什么会出现这种见解?推测有 ...
    本站小编 Free考研考试 2022-01-02
  • 基于空间数据挖掘的三维成矿预测定量指标体系建立方法研究——以宁芜盆地钟姑矿田为例
    摘要摘要:大数据思维是直接从数据入手的一种新的思维方式,其本质是减少甚至完全屏蔽人为因素干扰,让数据说话。以往三维成矿预测中指标体系的建立多采用经验分析法,以地质模型和先验知识指导控矿特征变量取值,其准确性易受到人为影响。本文基于大数据思维,使用数据驱动方法对三维成矿预测中的找矿指标体系进行探索性研 ...
    本站小编 Free考研考试 2022-01-02
  • 基于机器学习的岩石微量元素与主量元素关系初探:以洋岛玄武岩中锆元素为例
    摘要摘要:本文尝试利用机器学习的随机森林算法分析岩石主量元素与微量元素之间的关系。大洋玄武岩几乎不受混染作用影响,各元素成分之间的关系相对稳定,其中微量元素Zr是一种稳定的高场强元素。本文采用随机森林算法对洋岛玄武岩中Zr元素和主量元素的关系进行探索。利用算法中变量重要性度量判断各个主量元素与Zr元 ...
    本站小编 Free考研考试 2022-01-02
  • 基于多源数据约束的成矿动力学模拟——以宁芜盆地钟姑矿田典型矿床为例
    摘要摘要:数据驱动是大数据分析的特点之一。成矿过程的数值模拟即采用数据驱动方式,在基本的物理化学方程及地质模型基础上,通过定量的手段,模拟不同阶段、不同条件下成矿系统的演化过程,从而能够更深入、直观的讨论各种地质要素对成矿系统的影响,验证已有的成矿理论,获得新的认识。姑山铁矿床和杨庄铁矿床是宁芜火山 ...
    本站小编 Free考研考试 2022-01-02
  • 基于高分二号卫星数据的煤矿区地质灾害信息提取研究
    摘要摘要:随着遥感数据获取技术和能力的全面提高,遥感数据呈现出明显的大数据特征。发展适应于遥感大数据的智能分析和信息挖掘技术,成为当前遥感技术研究的前沿。高分二号(GF-2)卫星数据是我国首颗自主研发的亚米级高分辨率卫星数据,具有观测幅宽、重访周期短、高辐射精度、高定位精度等优势,为未来我国地质灾害 ...
    本站小编 Free考研考试 2022-01-02
  • 大数据环境下内蒙古浩布高地区铅锌多金属矿智能矿产预测研究
    摘要摘要:传统机器学习算法已广泛应用于矿产预测,但面对地质大数据的高维稀疏、不平衡小样本等特性仍缺乏有效处理和分析的方法,设计适合地质大数据特点的机器学习算法是智能矿产预测亟需解决的新问题。本文以内蒙古浩布高地区的铅锌多金属矿产预测为例,提出了一种面向地质大数据的半监督协同训练矿产预测模型。首先对研 ...
    本站小编 Free考研考试 2022-01-02
  • 基于断层滑动数据古应力反演的影响因素及其误差分析
    摘要摘要:古构造应力场是构造动力学研究中的一个重要内容,且断层滑动数据古应力反演已经成为古构造应力场恢复研究中比较常用的重要方法之一。近年来,断层滑动数据古应力反演方法研究和应用取得了一系列重要进展,但有关反演结果的解释仍存歧义,反演结果的影响因素及其误差范围等并未得到深入研究与定量分析。本文总结指 ...
    本站小编 Free考研考试 2022-01-02
  • 冀北康保晚古生代花岗质岩浆作用年龄数据及构造意义
    摘要摘要:冀北康保位于华北克拉通北缘中段,北靠古亚洲洋构造域(中亚造山带)。区内出露有小西沟、前孟家地、石柱梁、三老虎、新村和西五福堂等6个晚古生代花岗岩体,它们的锆石U-Pb年龄分别为260.6±1.6Ma、264.1±1.7Ma、269.5±2.7Ma、276.3±1.9Ma、280.4±2.0 ...
    本站小编 Free考研考试 2022-01-02
  • 基于多组学数据的早期宫颈鳞状细胞癌分类
    从分子层面对泛癌进行研究已经得到了很大的进展,但是对宫颈鳞状细胞癌的分子分类研究仍然需要更多的探索.为了找到宫颈鳞状细胞癌潜在的子类,本文提出了一个基于多维组学数据的癌症亚型分类分析流程.通过统计学方法对癌症基因组图谱(TheCancerGenomeAtlas,TCGA)宫颈鳞状细胞癌的mRNA表达 ...
    本站小编 Free考研考试 2022-01-02