开放数据状况年度调查至今已开展了7年,累计收到了来自192个国家的近27,000份调查回复,详细展现了研究人员分享数据的动机、面临的挑战、对开放数据看法和行为。今年的开放数据状况调查共收到了6,000多份可用回复,是2019年以来收到回复最多的一次。
点击此处阅读并获取《2022 年开放数据状况报告》
多样化的声音
多年来,开放数据和有效数据管理一直是欧洲众多研究人员的关注重点。欧洲研究人员在我们的开放数据状况调查中的参与度也一直很高。2022年,参与调查的研究群体变得更加多样化,让我们听到了不同的声音。
与2021年的调查结果相比,今年来自中国的受访者人数显著增加。去年,来自中国的受访者占样本的3%,而这一比例在今年上升至11%。分大洲来看,今年回复调查人数最多的是亚洲(包括中东在内为38%),其次是欧洲(33%)。来自中国科学院计算机网络信息中心的Yuanchun Zhou和Lulu Jiang在其特邀文章中指出,虽然“开放”尚未成为中国学者的常态,但随着相关法律政策的增多和培训的普及,更多的研究人员逐渐开始关注数据管理和开放数据。
中国和美国是回复本次调查人数最多的两个国家。由于美国的白宫科技政策办公室(OSTP)制定了更多关于开放数据的规定,国立卫生研究院(NIH)也即将发布数据管理与共享政策,美国的研究人员将需要更多地参与到开放数据中去。虽然美国回复调查的人数仍占样本总量的11%,但需要注意的是,自2016年首次调查启动以来,北美洲的参与度正逐年下降,而亚洲则持续上升。
决定因素和动机
尽管有越来越多的国家规定、自上而下的举措和制度,然而需要记住的是,数据共享的责任和行动往往掌握在研究人员个人手中。调查显示,最能激励受访者共享数据的三类情形分别是:研究论文的引用(67%)、增加论文的影响力和可见度(61%)、公共利益或期刊/出版机构的规定(均为56%)。
尽管研究人员普遍意识到开放数据能带来“一些公共利益”,但个人研究的引用量和可见度才是他们选择开放数据的首要动机。来自英国健康数据研究所的Holly Murray在其特邀文章中对此进行了探讨,认为这是数据共享潜在的“错位动机”。
构建支持性环境
前文提到的自上而下的举措和规定同样面向出版机构、图书馆和研究机构,因此这些机构在推进开放数据实践、推广开放数据原则等方面肩负有重要责任。根据今年的调查,72%的受访者愿意借助内部资源(同事、图书馆或科研处)来管理或实现数据开放。此外,受访者最希望获得出版机构的支持(41%),其次是所在研究机构的支持(38%)。
机构为其研究人员提供支持(包括完善的基础设施和培训),是今年的报告特邀文章中的一个热门主题。值得一提的是,南非斯泰伦博斯大学已在机构层面采取重大举措,以积极响应国家政策提案中的南非开放数据战略的核心部分。
我们很高兴地发现,相较于2021年的调查数据,表示“在遵守机构政策上需要更多指导”的研究人员的比例在今年有所下降。这表明研究机构在开放数据共享方面提供了更优质的指导、支持和培训。
不仅是机构本身,政策制定者们也对自己的职责了然于胸。NIH在其投稿文章中强调,“NIH数据科学战略办公室(ODSS)”旨在为那些遵守NIH数据共享方案的研究人员提供“领导、战略指导和协调”。考虑到越来越多的自上而下的举措和规定,政策制定者正在更多地承担起政策推动者的职责,为研究人员提供帮助和指导,这是一个可喜的趋势。直接由资助机构提供的、关于其政策遵守方面的支持和指导,正在对研究人员产生影响。在今年的调查中,36%的受访者表示正在寻求更多资助机构政策方面的帮助,相较于去年(41%)有所减少。
原文作者:Laura Day,Figshare产品市场经理;Dr. Greg Goodey,施普林格·自然高级研究分析员
点击此处阅读并获取《2022 年开放数据状况报告》
《2022 年开放数据状况报告》的更多发现:
对开放数据的支持
- 每五位研究人员中有四人赞成将数据公开获取作为一种普遍做法。
- 74%的受访者表示在出版过程中分享了他们的数据。
- 大约五分之一的受访者表示对公开分享数据没有顾虑 —— 这一比例自2018年以来一直在稳步增长。
- 88%的受访研究人员支持将研究论文的开放获取(OA)作为一种学术惯例。
动机和益处
- 作为研究人员分享其数据的动机,研究论文的引用量(67%)和增加论文影响力和可见度(61%)要胜于公共利益或期刊/出版机构的规定(均为56%)。
- 此前曾分享过数据的人中,有66%的人获得了他人对其工作的某种形式的认可 ——最常见的方式是在另一篇文章中的完整引用(41%),其次就是在使用了他们数据的论文中成为共同作者。
- 三分之一的受访者表示,由于之前分享的数据,他们得以参与科研合作。
开放数据的规定
- 70%的受访者被要求在最近的研究项目中遵守数据共享政策。
- 超过三分之二的受访者 “在某种程度上” 支持研究数据公开获取的国家规定。这个数字自2019年以来一直在下降。
- 在2022年的调查中,略高于一半(52%)的受访者认为,共享数据应该是给予研究基金的必要条件之一。同样,这个数字自2019年以来一直在下降。
不利情况
- 只有19%的受访者认为研究人员在分享其数据时获得足够认可,同时75%的受访者表示他们获得的认可太少。
- 仅有不到四分之一的受访者表示,他们以前得到过如何规划、管理或分享其研究数据方面的支持。
- 受访者最担心的是他们的数据被滥用(35%)。
- 研究人员认为其主要需求是有更多的培训或信息,以更好地理解和解释有关数据访问、共享和再利用的政策(55%),还有就是长期存储和数据管理策略(52%)—— 即影响到研究周期两端的事情。
有关受访者的主要统计数据
- 来自中国的研究人员占所有受访者的11%,与美国持平。中国和美国是回应本次调查最多的两个国家,其次是印度、日本、德国、意大利、英国、加拿大、巴西、法国和西班牙。
- 31%的受访者是处于职业生涯早期的研究人员(ECR),而另外31%的受访者将自己归为资深研究人员。
- 大多数受访者(42%)来自医学和生命科学领域;38%来自数学、物理学和应用科学领域;17%来自人文和社会科学领域(增长3%)。
- 受访者大致分为这几类:开放科学倡导者(32%),开放出版倡导者(26%),开放科学的谨慎支持者(25%),开放科学不可知论者(11%),以及不相信开放科学的人(6%)。