科学家呼吁:强化激励机制 促进科学数据共享

发布日期:2021-08-11 来源: 字体:[ ]

  科学数据是国家科技创新和发展的基础性战略资源。实现科学数据开放共享,使其可发现、可获取、可互操作和可重复利用,对于增强数据资源利用率至关重要。 

  202185日,中国科学院青藏高原研究所研究员、国家青藏高原科学数据中心主任李新,中国科学院院士、中国科学院西北生态环境资源研究院研究员程国栋和来自国内多个地学数据中心及上海师范大学的研究人员在《自然-地球科学》(Nature Geoscience)发表评论文章:支持公开数据共享的政策和对数据贡献者的激励机制,是我国实现更为广泛的地学数据共享的关键。 

  我国科学数据共享现状 

  数据流动和信息共享对人类科技进步至关重要,地球科学数据共享对于解决全球环境问题尤为重要。然而,政策、文化和技术等方面的壁垒阻碍了科学数据的开放共享。数据中心是促进科学数据开放共享的重要载体。发达国家十分重视科学数据中心的建设,早在上世纪90年代,美国就启动了12个分布式数据存档中心的建设,主要用于存储气候领域研究产生的各类数据。目前,世界数据系统有86个数据中心,其中57%属于地球科学领域。 

  近年来,随着在应对气候变化和实现联合国可持续发展目标等全球挑战中发挥着愈加重要的作用,我国在数据共享方面实施了更为积极的政策。2018年,国务院办公厅印发的《科学数据管理办法》中指出,数据开放将是财政资金资助项目实施的基本前提。2019年,国家青藏高原科学数据中心等第一批20个国家数据中心上线,其中10个属于地球和环境科学领域。 

  这些举措到底能够在多大程度上促进我国的科学数据共享?最近,一项超过2000名我国研究学者参与的调查显示,科研人员虽有共享研究数据的意愿,但也担心数据的知识产权保护等问题。在我国,相对于广泛的公开共享,与同事和合作者私下共享数据更为普遍。可见,要提升新建科学数据中心的影响力、广泛地树立数据共享的信心,仍需大量工作。     

  我们的成功经验 

  为了推动我国科学数据广泛共享,国家自然科学基金委在地学领域的两个重大研究计划——“中国西部环境与生态科学研究”和“黑河流域生态-水文过程集成研究中提出了新要求:资助项目获取的科学数据须在国家自然科学基金委地球科学数据中心公开共享。在项目的年度评估、中期考核及验收等环节,数据共享和数据质量均为评定内容。更重要的是,这项机制的关键在于通过数字对象的唯一标识符(DOI)和相关发表论文的引用明确了数据提供者的贡献,以此给予他们激励。迄今为止,已有2500多篇科学论文引用了这些数据集。 

  “这两个重大研究计划强调数据共享的强制性,以及对数据贡献者的肯定和对知识产权的尊重。”李新说。近期,中国科学院发起了地球大数据科学工程专项,该项目旨在构建一个地球科学(资源、环境、生态、生物)数据信息平台。平台目前已存储超过5 PB的各类数据,下载量已超过50万次。     

  实现范式转变需加强激励机制 

  通过分析科学数据共享的生态系统,总结推动科学数据共享方面的成功经验,作者呼吁:我国还需要在政策、管理、技术和国际化等方面采取更为具体的行动,以更大的力度和举措激励科学家共享数据,提高我国科学数据中心的影响力,推动更为广泛的地学数据共享。 

  具体来讲,在政策层面,进一步明确敏感数据及其使用范围;在管理层面,可将科学数据质量等指标纳入评价体系,数据中心也可通过推进数据引用、利用数据重用指标来量化每个数据集的影响,以激励数据贡献者;在技术层面,数据中心可以通过提供数据集成与包括机器学习等技术在内的平台、数据搜索引擎、智能数据处理工具等措施,更为有效地为用户和机器提供更加友好、智能的服务;在国际化方面,鼓励以中英文双语发布元数据和数据,并积极参与国际认证,以增强中国数据中心的国际影响力。 

  大数据时代的数据爆炸为地球科学的发展带来了挑战和机遇。李新表示,加强和规范科学数据管理,对进一步发挥国家财政投入产出效益,提高科技创新能力和促进经济社会发展具有重要意义。虽然我国在科学数据共享方面取得进展,但要实现范式转变,仍需要政府、研究人员和数据中心的积极努力。

图1. 通过鼓励并使得数据提供者和数据使用者受益,数据共享的反馈得以加强

  引用方式:Xin Li, Guodong Cheng, Liangxu Wang, Juanle Wang, Youhua Ran, Tao Che, Guoqing Li, Honglin He, Qiang Zhang, Xiaoyi Jiang, Ziming Zou, and Guofeng Zhao. Boosting geoscience data sharing in China. Nature Geoscience, doi: 10.1038/s41561-021-00808-y, 2021. 

  原文链接:https://www.nature.com/articles/s41561-021-00808-y