摘要: 本文讲述大规模的在线合作完成了一篇深度学习论文,共同研究深度学习在生物医学领域的开发与潜力。
2016年夏季,生物信息学教授Anthony Gitter和Casey Greene发表了一篇关于深度学习的生物医学应用的论文,该论文致力于研究一个热门的新型人工智能领域:模仿人类大脑的神经网络。
该论文完成后还引出了一个有趣的学术众包案例。如今,已有40多名在线合作者对这篇论文进行了大量的编写和修改,甚至其中大多数协作者的贡献足以成为共同作者。
2018年4月4日《皇家学会界面》杂志刊登了最新研究成果“生物学和医学深入学习的机遇与障碍”。
Gitter毕业于威斯康星-麦迪逊大学,现Morgridege研究所工作,Greene毕业于宾夕法尼亚大学,二者皆致力于研究如何用计算工具解决健康和生物方面的巨大挑战。他们希望看到深度学习在这个方面发挥作用,以及在生物医学领域尚未开发的潜力。
Gitter认为这个过程与开源软件社区的工作原理相似。他说:“我们基本上都是在用软件工程的方法撰写学术论文,而选择GitHub网站作为主要写作平台,是因为它是最受欢迎的线上协作编写代码的网站。”Gitter还补充道:“我们还采用了软件工程工作的思路,即让团队共同合作完成一个产品并自动协商下一步工作。”
新的协作作者经常通过提供一些例子来说明深度学习如何影响了他们的科学领域。Gitter举例说,低温电子显微镜技术是生物成像的一个新的必备工具,而一位科学家使用深度学习技术对低温电子显微镜技术的提升做出了重大贡献。其他人重写了这部分,使其更容易被非生物学家接受,还有人提供了关于医疗数据隐私的道德背景。
深度学习是近年来取得突破性进展的机器学习工具的一部分。它利用神经网络的结构将输入馈送到多个层来训练算法。并且可以构建方法来识别和描述数据中的循环特征,同时还能预测一些输出。当深度学习在“无监督”模式下工作时,能够自动解释或识别数据中的有趣信息。
例如一个著名的无监督深度学习案例:谷歌的神经网络在没有人为控制下,能够自动识别视频的重要组成部分,例如该视频主要由面孔、行人和猫组成。
深度学习已经改变了人脸识别、语言翻译等应用程序。例如,在众多高智能的应用程序中有一个能够完成一个项目,即识别并学习著名画家的标志性艺术特征,从而能够将日常图片转换成梵高、毕加索或莫奈的作品。
Greene说,虽然深度学习还没有完全揭示医疗数据中的“隐藏猫”,但是已经取得了一些突破性的进展。现在正在研究的深度学习项目包括,如何根据疾病亚型和最有效的治疗选择对乳腺癌患者进行分类。另一个研究项目是如何在巨大的自然图像数据库上训练深度学习,从而能够诊断糖尿病、视网膜病变和黑色素瘤。而这些应用都远超现在最先进的工具。
深度学习还能改进临床决策,不仅能提高临床试验的成功率,还能更好地预测新药候选药物的毒性。
Gitter说:“深度学习尝试通过整合信息来预测哪些人有可能罹患哪些疾病,这样可以确定谁需要做更多的筛选或测试,以及如何尽早避过这些疾病。这是一种预防性的、前瞻性的思维方式。即使当前技术无法达到这些目标,我和我的合著者仍感觉非常兴奋,因为我们知道这潜在的回报非常巨大。”
本文由北邮@爱可可-爱生活 老师推荐,阿里云云栖社区组织翻译。
文章原标题《Scholarly snowball: Deep learning paper generates big online collaboration》
作者:Morgridge Institute for Research
译者:奥特曼,审校:袁虎。
文章为简译,更为详细的内容,请查看原文