地学文献中心研究报道了21世纪地球科学数据架构

来源:地调局地学文献中心 发布时间:2022-11-16
  

信息技术和方法的发展,为地球科学这一古老的学科注入了新的生命力。在过去一个世纪里,我们从在野外用铅笔将观测结果记录在纸质笔记本中,到使用自动传感器将信息直接输入数据库中。这种进步,使得我们构建一个共享和通用访问的地球科学数据架构,深入地开展地学研究成为可能。自然资源部中国地质调查局地学文献中心近期完成的《国外地质调查管理》内部刊物,对地球科学数据架构这一概念进行了报道。

下个世纪的地球科学研究要想不被它所采集的数据所束缚,我们必须找到两个问题的答案:我们如何存储和访问这些大数据?更为重要的是,我们如何才能实现“大规模科学”,使研究人员和其他用户能够处理海量的多源数据集,而不会迷失在不兼容的系统中?如果我们能够弄清楚如何利用不断增长的数据流,那么就有可能改变我们对地球的认识。

地球科学的优势

我们从事地球科学研究的事实提供了一个有用的组织框架:根据定义,我们采集的很多数据是基于时间和地点的。地球上每个观测点,数值模拟的每个网格点,都有一个相关的时间范围,地球上的一个位置或区域,可能还有一个高程或深度范围。我们可以在多维的“地学数据架构”中组织这些数据,而不是单独的文件和集合。

解决方案的要素

如果想要创建这种地学数据架构,我们在采集数据的每一步都需要自动化和标准化;进行初步处理;传输;储存;发现、访问和分析。无论本地存储还是云存储,都要求对象存储适合于地球科学数据架构中的海量信息。如果每个数据都是孤立的,我们就不能创建地学数据架构。因此,我们需要在数据源处完成原始数据的初步处理,然后整合成可用信息。云计算正迅速成为当今大多数科学研究的可行方法,对于将数据从机构孤岛中迁移到地球科学数据架构中是至关重要的。用户应该能够通过简单的请求(或直接可视化)索取所需的数据集、时间范围和感兴趣的区域,而后台软件会自动提供用户请求的内容。

地球科学数据的未来

采用地球科学数据架构这一概念将使研究人员更多地关注科学而不是信息管道。无论未来如何,很显然,我们的地球科学数据中心必须摆脱传统的、只能访问自身数据的内部系统孤岛。我们必须集成多源数据,在更高的抽象层面进行标准化,将计算转移到数据中,从而使大容量、多样性、高速度和高可变性数据的科学研究成为可能。

中国地质调查局地学文献中心  联系我们

地址:北京市海淀区学院路29号 邮编:100083

网站标识码bm16000002  京ICP备2020044568号

京公网安备 11010202007433号

电话:办公室:(+86 10)66554848;咨询服务:66554700