中新网北京8月9日电 (记者 孙自法)包括地学数据在内,实现可发现、可获取、可互操作和可重用原则的科学数据开放共享,对增强数据资源利用至关重要。
基于此,中国专家学者呼吁国家加强激励机制,从政策、管理、技术和国际化等方面采取更为具体的行动,促进地学数据广泛共享,服务科学研究和国民经济建设。
中国科学院青藏高原研究所(中科院青藏高原所)9日发布消息说,该所研究员、国家青藏高原科学数据中心主任李新,中科院院士、中科院西北生态环境资源研究院程国栋研究员以及来自中国多个地学数据中心和上海师范大学的研究人员,近日在国际专业学术期刊《自然-地球科学》联合发表评论文章表示,对公开数据共享予以支持的政策和对数据贡献者予以激励的机制,是实现中国更为广泛的地学数据共享的关键。
为什么要推科学数据共享?
该评论文章称,数据流动和信息共享对人类科技进步至关重要,数据中心是促进科学数据开放共享的重要载体。国际上,发达国家十分重视科学数据中心建设,而地球科学数据共享对于解决全球环境问题尤为重要,目前,世界数据系统的86个数据中心,57%属于地球科学领域。
近年来,随着中国在应对气候变化和实现联合国可持续发展目标等全球挑战中发挥着越来越重要的作用,在数据共享和透明度方面已采取更积极政策。2018年,中国科技部发布《科学数据管理办法》。2019年,国家青藏高原科学数据中心、国家人口健康科学数据中心、国家天文科学数据中心等第一批20个国家数据中心上线,其中10个属于地球和环境科学领域。
不过,最近一项超过2000名中国研究学者参与的调查揭示中国科学数据开放共享的机遇和挑战:中国研究学者虽有分享研究数据的意愿,但也担心数据的误用及版权和许可受到侵犯。在中国,与同事和合作者私下共享数据的情况更为普遍,而不是更广泛的公开共享。
李新研究员指出,由此可见,要增加新建科学数据中心的影响力,并在中国研究人员中更为广泛地树立数据共享的信心,仍需大量工作。
中国共享科学数据有何基础与经验?
李新介绍说,为推动中国科学数据广泛共享,国家自然科学基金委员会已在地学领域的两个重大研究计划——“中国西部环境与生态科学研究”和“黑河流域生态-水文过程集成研究”中加入新要求:
一是受资助项目得到的科学数据都必须在该委地球科学数据中心公开共享;二是在项目的年度评估、中期考核及最终评估环节,数据提交共享和数据质量都是被评定的内容;三是通过数字对象唯一标识符(DOI)和相关发表论文的引用明确数据贡献者的工作,以此给予他们激励。迄今为止,已有2500多篇科学论文引用了这些数据集。
“这两个重大研究计划强调数据共享的强制性,以及对数据贡献者的肯定和对知识产权的尊重。”李新说。近期,中科院发起地球大数据科学工程专项,该项目旨在构建一个地球科学(资源、环境、生态、生物)数据的信息基础设施。通过收集来自专项的各类数据,其平台目前已存储超过5PB(1PB=100万GB)的数据,下载已超过50万次。
如何加强激励机制促数据广泛共享?
在国际期刊的评论文章中,专家学者通过分析科学数据共享的生态系统,并在总结成功经验的基础上呼吁,中国还需要在政策、管理、技术和国际化等方面采取更为具体的行动,以更大的力度和措施促进科学家共享数据的意愿,提高中国科学数据中心影响力,推动更广泛的地学数据共享。
政策方面,进一步明确敏感数据及其使用界限。
管理方面,可将科学数据质量等指标纳入评价机制,数据中心也可通过推进数据引用、利用数据重用指标来量化每个数据集的影响,以激励数据贡献者。
技术方面,数据中心可通过提供数据集成与包括机器学习等技术在内的平台、数据搜索引擎、智能数据处理工具等措施,更高效为用户和机器提供更加友好、智能的服务。
国际化方面,鼓励以中英文双语发布元数据和数据,并积极参与国际认证,以增强中国数据中心的国际影响力。
李新强调,落实这些行动的关键在于数据中心,数据中心作为数据管理、新技术应用和国际化等方面的实施主体,可发挥关键作用。
他表示,大数据时代的“数据爆炸”为地球科学的发展带来了挑战和机遇。虽然中国在科学数据共享方面取得进展,但要实现范式转变,仍需要政府、研究人员和数据中心积极努力。科学数据及其贡献者越受到激励,就越有利于推动地学数据共享,从而促进科学和社会的发展。(完)