独木帆 >首页 >科学 >正文

生物学家分析图像的方式,正在被机器学习所改变

Nature自然科研 2018-02-11 09:11:55 阅读:

神经网络让处理生物图像变得更简便。

俗话说眼睛是心灵的窗户——但是谷歌的研究人员说眼睛是健康的指示。谷歌正在运用深度学习分析人的视网膜图像,预测他们的血压、年龄和吸烟状态。谷歌计算机从血管的排列中搜集线索,初步研究表明这些计算机能够应用该信息预测此人是否有即将心脏病发作的风险。

生物学家分析图像的方式,正在被机器学习所改变

计算机可以根据视网膜图像预测一个人即将心脏病发作的风险。

图像来源:Paul Parker/SPL

该研究基于卷积神经网络——一种正在改变生物学家分析图像方式的深度学习算法。科学家利用这种方法寻找基因组里的突变,并预测单细胞结构中的变异。谷歌的方法已于2017年8月发表在预印本平台上(R. Poplin et al. Preprint at https://arxiv.org/abs/1708.09843; 2017),它是深度学习新应用大军中的一员,它们使图像处理更便捷、更万能——甚至可以识别一些被忽略的生物现象。

谷歌研究院的工程设计总监Philip Nelson说:“此前,要将机器学习应用于生物学的许多方面是不现实的。但现在可以了——更加令人兴奋的是,机器如今看得到人类之前可能从未见过的景象。”

卷积神经网络允许计算机高效地、整体地处理图像,而不需要把图像拆分成几个部分。该方法在大约2012年的时候被广泛应用于技术领域,这主要得益于计算机能力和存储的进步。比如,Facebook用这种深度学习算法识别照片中的人脸。但是科学家一直无法将神经网络应用于生物学,一部分原因在于不同领域之间的文化差异。旧金山生物技术公司Calico的首席计算官Daphne Koller说:“将一组聪明的生物学家和一组聪明的计算机科学家放在一个房间,他们会用两种不同的语言交流,而且有着不同的思维方式。”

科学家还需要鉴定哪些类型的研究可以用神经网络开展,而这些网络必须先接受大量的图像训练才能开始做预测。谷歌想要用深度学习寻找基因组中的变异,其科学家必须事先把DNA碱基链转化成计算机可以识别的图像,然后利用与一个参照基因组(其变异已知)匹配的DNA片段进行训练。最终产生的成果就是DeepVariant,它已于12月发布,能够发现DNA序列中的微小变异。DeepVariant在测试中的表现绝不亚于传统工具。

西雅图艾伦细胞科学研究所的细胞生物学家正在使用卷积神经网络,将光学显微镜捕捉的平面、灰色的细胞图像转化成3D图像,且细胞中的部分细胞器用颜色标记出来。这种方法省去了为细胞染色的步骤——染色会耗费更长的时间,也需要一个精密的实验室,而且可能损害细胞。该团队于去年12月公布了一项先进技术的细节,这项技术能够只用少量数据(比如细胞的轮廓)预测更多细胞组分的形状和位置(G. R. Johnson et al. Preprint at bioRxiv http://doi.org/chwv; 2017)。

博德研究所成像平台的主任Anne Carpenter说:“你现在看到的是一场史无前例的巨变,它展现了机器学习可以如何出色地完成成像相关生物工作。”她说她的跨学科团队于2015年开始用卷积神经网络处理细胞图像,现在它的处理量约占研究中心的15%。她预测该方法将在几年内成为研究中心的主要图像处理手段。

令其他人感到更为兴奋的是,卷积神经网络分析的图像能够在不经意间揭示细微的生物现象,促使生物学家发现他们此前可能没有想到过的问题。Nelson说:“科学界最有意思的话并不是阿基米德的那句‘Eureka!’而是‘这好奇怪——是怎么回事?’”

艾伦细胞科学研究所的执行总监Rick Horwitz表示,这样的偶然发现有利于推进疾病研究。他说,如果深度学习能够揭示单个细胞中癌症的细微标记,那它就有望帮助研究人员优化对肿瘤进展的划分。这反过来会促进科学家提出关于癌细胞扩散的新假设。

因为卷积神经网络将图像处理带到了新高度,所以生物学领域的其他机器学习内行开始关注新的前沿方向。德国环境卫生研究中心的计算生物学家Alex Wolf说:“成像非常重要,但是化学和分子数据也不可忽视。”Wolf希望能通过调整神经网络来实现基因表达分析。“我认为在接下来的几年里会出现重大突破,生物学家将可以更广泛地应用神经网络。”他说。

独木帆(www.xieshudeng.com)版权所有 桂ICP备17010736号 关于我们 | 广告服务 | 诚聘英才 | 联系我们 | 免责申明 | 举报投诉须知