4月9日的 sicence 旗下的 sciencecareers 发表了专栏作家 Chelsea Wald 的文章 Scientists Embrace Openness 对 open science notebook 等 open science 的情况进行了报道,觉得对了解open science 的现状较有帮助,翻译此文。
以下为翻译内容:
历史上有很多科学家在竞争中将自己的想法隐藏起来的故事。比如达·芬奇,他那奇怪的倒向书写可能部分的源于担心小偷偷走他的想法;再如伊萨克·牛顿,他用变位词的方式来书写那些他要隐藏起来的想法。科学长久以来是个竞争激励(dog-eat-dog)的世界。
所以现在有些科学家将要近乎相同程度的不仅分享他们的结果,有些时候,还要分享他们的原始数据——甚至是他们的实验记录——还通常会在即时(real time)。他们是一个被成为 Open Science 的运动,或者更加准确的称为 Open Notebook Science 的运动的一部分,他们的格言是 “没有内部信息(No insider information)”。(文末附有一个内容更多的术语表)
初看起来,开放可能会导致严重的职业危险,数年的工作可能因为竞争者利用你的数据发表文章而化为乌有——但是很多 Open Science 的参与者表示收益还是大于风险。益处包括更多的合作的机会,更多的来自同事的反馈,和这些研究有更大的可能被可以利用它们的人得到。与很多人的直接相反,参与者们认为开放能帮助他们宣称优先权和化解被剽窃的担心。
“我确定的相信,人们越开放,科学总体上越有效率,”加州大学戴维斯分校(University of California (UC), Davis)的进化生物学家 Jonathan Eisen 说,他的大部分研究都是开放的。“无可争议的,对于那些选择开放的人们存在风险,但是对于社会的益处又是巨大的。既然纳税人为我们的研究买了单,我想除非你能证明那样是错误的不然就应该开放。”
开放起来
位于阿尔伯克基的新墨西哥大学(the University of New Mexico in Albuquerque)的实验生物学家 Steve Koch 是最为狂热的 Open Notebook Science 参与者之一。大约两年之前,他开始通过博客分享他的一些想法和结果。同时,他的一位研究生 Anthony Salvagno 进行了一项开放实验,在 OpenWetWare 网站上报告他的结果,这个网站上存放着 wiki 风格的实验室记录。两个项目都带来了来自全世界的研究者的反馈和合作。他们感到他们无意中撞见了个大项目(hit on something big),一年之后 Steve Koch 决定将他的整个实验室完全开放。
那说起来容易做起来难,具体的挑战在每个领域都不相同,但是将数据放到网络上意味着将它们转化为一种其他的科学家而且越来越多的是电脑能够使用的形式。荷兰莱顿天文台(Leiden Observatory)的天文学家 Sarah Kendrew 指出虚拟天文台(Virtual Observatory (VO) )项目——一个天文学数据的超级包括——作为那种尝试的一个典范。“如果不一开始就计划好使得 VO 的数据广泛的适用,那将需要大量的资源”她在电子邮件中写道,“我不知道较小的或较老的天文台觉得那样是否值得,即便他们提供了很好的数据。”
开放数据的挑战
开放数据可能听起来像田园诗,但是操作起来有一些真正的和实践上的挑战。比如,正如大多数发表过博客的人所认识到的,不是发表在网络上的每一件东西都得到了注意和利用。
Eisen 这样描述:“仅仅是公布数据在技术细节上就并不简单,你把数据放在哪里?…… 你使用什么样的格式? 你如何告诉别人你的数据公布的政策同其他人的不同。”即便那里已经能够有了一个预先确定的格式,比如 GenBank 格式,他说提交这些数据“也不是一个无关紧要的事情”。“那只是(基因)的序列数据,”他继续说,“想想实验数据吧,”它们来自无法计量的极宽的实验条件形成无限的格式。
然后是许可的问题,你要给数据加上限制吗?“任何时候你给数据的使用、再使用和在发布设置了限制,它就会变成一堆乱麻”Eisen 说。所以他倡议完全开放数据。“如果你发布没有任何限制的数据,它很干净,任何人可以做任何事”Panton Principles 为如何使得你的数据没有限制提供了指导原则。
把它做好可能确实是挑战,但是只是用任何形式把数据开放是个有用的步骤,德雷克塞尔(Drexel)的 Bradley 说,“如果你开放了数据自动化进入科学研究的过程就简单多了。”关键是开始行动,让你的数据能够用起来。然后“世界上的任何人可以参与进来,写一段脚本,利用人工智能和数据进行互动,而且你永远也不会知道那些数据是如何在富有成效地被使用。”
Open Notebook 的真正参与者并不将他们公开的内容局限于格式良好的数据。理想上,他们希望他们的 Open Notebook 中包括他们实验室里产生的最新的全部原始草稿。Koch 称赞宾夕法尼亚州费城(Philadelphia, Pennsylvania)的德雷克赛尔大学(Drexel University )的化学家 Jean-Claude Bradley 建立的那套一体化的系统,Bradley 也是“Open Notebook Science” 这一术语的发明人,他的实验室也是世界上最为开放的实验室之一。他利用wiki、blog、Google spreadsheets 和特殊的软件上的他的实验室的全部记录和数据及时的公开。“这是一种从信任文化走向证明文化的转变,” Bradley 说,“每个人都会犯错误,但是如果你不公开你的原始数据,没人会发现你的错误。”
而且人们确实发现了错误,Eisen 说。他第一次发布没有限制的基因组测序数据的时候,另一个科学家在几小时内就告诉他数据库里有个小错误:炭疽的序列混入了他们正在测序的组织中。“我们至少要一年才可能发现这个错误,”Eisen 说。从某种意义上说,开放这些没有限制的数据将潜在的竞争对手变成了合作者。与这些本实验室之外的人那里得到的贡献大于要大于成果被别人获取。他说。
当然,大多数科学家并不热心于承认他们的错误。Carl Boettiger, 加州大学戴维斯分校(UC Davis )的人口生物学的研究生和一个该校的 Open Science 组织的组织者,今天开始了一个 Open Notebook。“当你是为一个暴露错误的人时,那有点可怕”他说。但他想这种压力使他成为一个更好的科学家。“因为你对此有点担心,你的记录就能更好。”
Eisen 指出在采用开放的方式的意愿上存在代际的差异。那些 40 岁以下的人们更加习惯于将有关于他们的信息公开。“这和过去比如10年前的情况有很大的区别”他说,“很多年轻的科学家并不为此感到为难。”
风险与收益
Koch 说他对成果被抢先发表并不是很担心,虽然,同大多数 Open Notebook Science 的参与者不同,他并没有得到终身教职。Open Notebook Science 的提倡者声称,开放可能更能保护一个科学家的创意而不是把它暴露给剽窃者。牛顿利用变位词来隐藏他的发现的办法使得他在证明先于和莱布尼茨(Gottfried Leibniz)发明微积分变得十分困难。采用 Open Notebook 的科学家说他们要做的只是在他们的 Open Notebook 上找到是他们首先有个这个主意的证明或者是结果的。“我已经可以在同行评议的论文上引用我的(在线)实验室记录”Bradley 说,“那很清晰的说明了你的优先权”,如果出现非道德的创意剽窃行文,“这些发表了的记录可以很容易的让剽窃者蒙羞。”Koch 在他的博客上写到。
Koch 说有间开放实验室甚至可能对他得到资助也有帮助。“主要审核者(PI,principal investigator)”描述了一种不常见的和很极端有吸引力的计划来运作这个提名的研究计划为开放获取(open access)的,”一个匿名评议者在 koch 的一份申请上这样答复。另一个评议者同意。 Koch 还觉得因为他是 Open Science 的提倡者得到的注意对他获得终生教职会有帮助。
而且,很多研究者不认为 open Science 的概念能够广泛被接受。Brian Krueger,佛罗里达大学(University of Florida )的分子生物学家并非对 Open Science 持怀疑态度,他的实验室有开放的倾向,他还开创了一个社会化网络——LabSpaces.net——其目的是科学活动更加的公开和开放。他在一封电邮中写道:“我并不认为指望如科学这样的充满竞争性的领域会毁了更大的善(the geater good)而变成无私的乌托邦并不实际。”
Bradley 承认开放性的一些缺点使一些人不可能采用它。在 2005 年将他的实验室转为 Open Notebook 的实验室之前,他的研究方向是纳米科学,现在他在研究疟疾。在这之前他不可能实践 Open Notebook Science,他说,因为那样会影响他获得专利的能力。“如果你对知识产权感兴趣那不是个最理想的策略,”他说,如果你的工作涉及机密信息那也不好。尽管如此,Bradley 对采用 Open Notebook 技术的科学家的多样性感到很惊讶。“那些研究计算机科学和理论科学的人们也开始使用它,我真是一开始没能想到。”
Open Science 存在另一个缺点,特别是对那些想要获得终身教职的科学家来说,那就是很多传统的刊物并不刊发开放研究(opne research)的论文。Bradley 在开放获取(open access)的同行评审的刊物 Chemistry Central, the Journal of Cheminformatics, and the Journal of Visualized Experiments 上发表文章而不是美国化学会(American Chemical Society)的刊物上。这对他没什么问题,但是可能不能帮助年轻的科研人员获得教职。
Bradly 建议那些刚开始自己研究生涯的年轻人开放编外的研究项目,这样他们可以既从从事 Open Notebook Science 中取得益处,又能争取传统方式上的成功——如在那些最有名望的杂志上发表文章。但是即便这种缩水了的方式也不容易,他说,因为合作者和主要评审者常常对此比较的抗拒。
那样也还行,他说“不需要更大比例的科学家们采用这一方法才能产生巨大的影响,因为这是网络效应。只要你给这个网络增加了一个节点,就极大的放大了我们所能作的。”
Bradley 从2008年开始的 Open Notebook Science Challenge 是他增加节点的方法之一。本科生和研究生通过提出 Open Notebook 的解决方案来竞争 500 美元的奖金。结果是一个免费的、对全世界的化学家们都能使用的、逐渐复杂的解决方案。除了奖金,参与者还能从一个国际化的评审委员会那里得到意见。“这个方法能指导那些学生,除此之外,这些学生没有与了解 Open Scicence 的人联系的机会。”Bradley 说。
一旦人们开始了 Open Notebook Science ,Koch 说,他们就很难再回头。他的研究生参与了这些事件,有时很有热情。“当 (Koch)第一次带我走进实验室的开放策略时,我不知道这个‘开放’是什么意思,于是我想大概每个实验室都是这样吧。”Salvagno 在电邮中写道。“我才搞明白原来是说科学本身是开放的,当我发现这一真理,我为自己成为此领域的先锋感到很兴奋。我不可能再回到过去的那个状态。”
附:
与 Open Science 有关的术语表
Open Science:有时指 Open Notebook Science, Open Data, Open Access 等概念的统一体,有时指 Open Scoure。
Open Notebook Science:它最纯粹的含义,就爱那个这个研究项目的全部记录——实验室笔记、原始数据、实验意见的草案和论文都实时的在网络上公布。一般意义上的Open Notebook Science可能包括一点时间上的延迟或对发布某些类型的材料的限制,如意见草案。
Opne Data:在没有版权等限制的情况下使数据自由获取的实践。
Open Access: 在学术出版领域(包括同行评审的科学刊物)是所有的期刊文献可以免费获取的实践。
Open Source:可能是最为人们所知的“open”术语了。指示的计算机的代码可以自由的使用和修改的实践。它是 Open-science 的参与者们仿效的模型。open-source 开发已经产生了大量的合作项目,产生了如 linux 这样的成果。
哈哈,我也关注open science
译得不错,帮你推荐到豆瓣里了
http://www.douban.com/group/topic/10954013/
非常感谢。在你的 blog 上看到了有多有意思的东西,也在豆瓣上关注了你,期待能同你多交流。
呵呵,你的blog很不错,我把它放到友链里,可不?
对了,你可以加我Gtalk,那样有时间可以聊一聊。
完全可以,加了你的gtalk,只是最近比较忙,可能上的不多。