时间: 2025-11-06 浏览量: 2413
在回答“要不要提供数据”之前,得先弄明白期刊为什么会有这个要求。
近年来,国际学术界在开放科学数据、提升研究透明性上已达成普遍共识,“论文出版+数据发布”的新型出版形态成为重要发展趋势。业内人士指出,科学数据已成为国家科技创新的基础性和战略性资源,是科学研究中必不可少的基本要素。
从学术规范的角度看,提供原始数据有几个核心价值:它是论文研究成果和结论的重要佐证,能提升研究的可验证性和透明度;数据的共享能提升论文的受关注度和影响力;数据的重复使用可以节省人力物力,让科学家聚焦于创新研究;论文数据作为一种新型学术成果,还能促进学科领域间的创新合作和人才培养。
据统计,目前已有超过七成的国际性学术期刊建立了某种形式的论文关联数据政策。以Nature系列期刊为例,相关考察发现,这些期刊在数据可用性政策的实施上已有较好表现,论文提供数据获取途径、数据格式易于处理等指标均得到较好保障。
SCI期刊对数据提交的要求大致可以分为几个层次。
第一层次:强烈鼓励型。 这类期刊建议作者共享数据,但不作强制要求。例如,IEEE旗下的部分期刊在投稿清单中明确写道:“尽可能让源代码公开可用以支持可重复性”,这是一种建议而非强制。
第二层次:声明要求型。 这类期刊要求作者在文末提供“数据可用性声明”,说明相关数据是否可以获取以及如何获取,但不强制要求数据本身必须公开。例如,JMIR Publications的政策是“强烈建议作者在提交包含原创研究的稿件时包含数据可用性声明”,并提供了多种声明模板供作者选择。
第三层次:强制提交型。 这类期刊明确规定,作者必须在投稿时或录用后提交原始数据。以《科研管理》为例,该刊自2026年1月1日起,要求新录用的稿件提供文章的原始数据、程序代码等材料,若没有提交相关附件资料且未说明原因,期刊将对稿件做退稿处理。《无机材料学报》也发布了类似通知,要求论文关联数据在数据存储库汇交和发布。
第四层次:可重复性验证型。 部分期刊更进一步,要求在论文接受后完成可重复性验证流程才能正式发表。例如,INFORNS Journal on Data Science明确规定,包含数值或计算工作的论文,在接受时必须上传数据和代码,并在补充页面上完成可重复性验证流程。
据观察,越是高水平的期刊,对数据共享的要求往往越严格。这已经成为学术出版的大趋势。
如果期刊要求提供数据,具体要交什么东西?根据多个期刊的政策,主要包括以下几类。
论文关联数据,是指通过基础研究、应用研究、实验开放等产生的用于支撑学术论文发表的数据,以及通过观测检测、考察调查、检验检测等方法取得并用于形成论文图表、支撑论文研究结论的原始数据及其衍生数据。简单来说,就是支撑你论文结论的那些核心数据。
程序代码,如果研究中使用了软件进行数据分析、建模或模拟,相关的代码通常也需要提供。IEEE的投稿指南指出:“代码、数据拆分和实验设置应详细描述,以便能够重现结果。”
调查工具和实验材料,对于涉及问卷调查、访谈或实验的研究,相关的问卷、访谈提纲、实验刺激材料等也需要提供。Accounting Open的政策明确要求:“如果原始数据是通过实验或调查收集的,相关的实验刺激或调查工具也应包含在存档中。”
README文档,很多期刊建议作者提供详细的文档说明,包括所需硬件和软件信息、运行计算机代码和重现所有结果所需的精确步骤等。Accounting Open特别鼓励使用社会科学数据编辑的README模板。
提交数据时,格式和存储方式也有讲究。
数据格式方面,期刊通常不限制具体格式,但建议采用领域内常用格式、有开放规范或标准、独立于特定软件或供应商的格式。常见的可接受格式包括表格文件、文本文件、视频或特定格式的数据文件等。
数据存储方面,越来越多期刊要求将数据存放在第三方的公共数据存储库中,而不是作为附件随论文上传。例如,《科研管理》要求作者在“科学数据银行”网站提交附件资料。《无机材料学报》也推荐使用科学数据银行,并提供了详细的数据提交流程。
为什么要求用第三方存储库?因为这些平台能为数据分配唯一的数字对象标识符,让数据成为可引用的独立学术成果;同时提供长期保存和访问保障,避免数据丢失。
有些研究涉及的数据确实不能公开,比如涉及国家秘密、商业秘密、个人隐私,或者受保密协议限制。这种情况下怎么办?
期刊政策通常都有例外条款。Accounting Open明确规定:“专有、保密和商业许可的材料有例外情况。在这种情况下,已发表的文章将包含解释限制和材料不能共享的原因的声明。”
具体可以采取以下几种替代方案:
提供脱敏处理后的数据。 对数据进行匿名化处理,移除所有个人身份信息后再共享。有研究提供了行为与社会科学领域的两个实例,展示了如何在共享数据前对数据进行去标识化并实施FAIR原则。
提供必要统计量。 如果原始数据确实不能公开,可以提供足以填充模型的所有必要统计量,包括汇总统计和分布统计。例如有研究因与医院有保密协议无法公开原始数据集,就在论文中提供了填充模型所需的所有统计量。
设置数据保护期。 有些平台允许作者为数据设置保护期,保护期内公众仅能访问元数据而无法下载文件,保护期后自动转为开放获取。
依申请获取。 对于不宜开放共享的数据,可以在数据可用性声明中说明“可根据合理理由从作者处获取”,并提供作者联系方式。
无论采用哪种方式,都需要在数据可用性声明中明确说明情况,并提供必要的证明材料。
数据可用性声明是对论文关联数据是否可获取以及具体获取方式的说明文件,通常附在正文之后、参考文献之前。
JMIR Publications提供了几种常用的声明模板:
一般模板:“本研究生成或分析的数据集可在[存储库名称]存储库中获取,[数据DOI或URL]。”
不宜公开的数据:“本研究生成或分析的数据集因[不能公开的原因]而不公开,但可根据合理理由从通讯作者处获取。”
依申请获取:“本研究生成或分析的数据集可根据合理理由从通讯作者处获取。”
无数据生成:“本研究不适用数据共享,因为研究过程中未生成或分析任何数据集。”
数据包含在论文中:“本研究生成或分析的所有数据均包含在本论文及其补充信息文件中。”
在撰写声明时,要确保信息准确、具体,便于读者和审稿人查找和使用。
综合以上分析,对于准备投稿SCI期刊的研究者,可以给出几点实用建议。
提前了解目标期刊的数据政策。 在选定目标期刊后,第一时间查阅其官网的“作者指南”或“投稿须知”,找到关于数据提交的具体要求。不同期刊的政策差异很大,提前了解可以避免后续被动。
从研究开始就做好数据管理。 数据提交不是投稿时才需要考虑的事,而应该贯穿整个研究过程。从数据收集、整理到分析,每一步都要做好记录和备份,确保最终能够提供完整、可用的数据。
善用数据存储平台。 国内常用的科学数据银行等平台提供了完善的数据提交和发布流程。注册后可以创建数据集、填写元数据、上传文件、选择共享方式,并获得唯一的标识符和私有访问链接供审稿使用。
认真撰写数据可用性声明。 不要把它当成可有可无的附件,而要视为论文的重要组成部分。清晰、准确的声明能提升论文的可信度和可重复性。
对于不宜共享的数据,提前准备说明材料。 如果研究涉及保密或敏感数据,提前准备好书面的情况说明和相关证明材料,需要时提交给编辑部。
SCI投稿是否需要提供数据?答案已经从“有时需要”变成了“越来越多需要”。在开放科学的大趋势下,数据共享正在成为学术出版的新常态。
对于研究者来说,这既是挑战也是机遇。挑战在于需要投入额外的时间和精力来管理和提交数据;机遇在于公开的数据能让研究更可信、更易被引用,从而提升学术影响力。
从今天开始,不妨把数据管理纳入你的研究流程。当你提交的论文不仅文字清晰、逻辑严谨,还有完整、规范的数据作支撑时,你离成功发表就又近了一步。
Copyright @ 国际会议云 2026 版权所有 蜀ICP备2022018807号-3 网站地图