Moani:开放科学平台,推动深度学习研究的进展
目录
- 前言
- 什么是开放科学
- 开放科学的动机和意义
- Moani:开放科学的体现
- Moani核心功能
- Moani标签:AI辅助注释
- Moani部署:将模型投入实际运用
- Moani模型库:共享与获取预训练模型
- Moani硬件和设备兼容性
- 社区参与与反馈
🌟 引言
首先,感谢大家给我这个机会进行演讲。非常激动能够在这次人工智能大会的后续活动中与大家交流。非常荣幸能够参与先进的研究以及支持研究的软件,Moani是我职业生涯中对开源和开放科学的热情的延续。今天,我想与大家分享一些我的激情,以及创造Moani背后的动机,并向大家展示开放科学对大家的相关性,无论您是在学术界还是在工业界。
🌐 什么是开放科学?
开放科学是什么?让我先给大家讲几个背后的故事,也许大家都见过这些,我们生活在像《Dilbert》这样的世界里。情况并不少见,有14个不同的标准可以供选择。这对研究生或年轻的教授来说是一件常见的事情,可能会想:“天哪,这太糟糕了,竟然有14个不同的标准,让我们来制定一个解决所有问题的东西,把它们全部整合在一起,它将成为所有研究的伟大统一者。”接下来,突然间,又多了一个标准,这种情况再次发生。这种情况层出不穷。
然而,更严重的是,一个研究实验室和学术界的研究主管共同进行的一项研究。他们想要研究驱动临床实践的重要论文。癌症患者的治疗以及临床实践都是基于这些论文,他们想要复制这项工作,以便能够扩展这项工作。他们发现,在53篇论文中,有47篇无法复制,他们无法复制出驱动临床护理的结果,这些论文中没有恶意行为,但如果您曾经试过复制一篇论文并按照论文中所描述的算法进行实现,您会发现存在隐藏参数和其他问题,仅仅通过期刊文章进行发布无法充分传达,这是我们现在面临的一个真正的挑战,这种现象在2012年就已经存在,而且至今还存在,实际上,这种情况在更早之前就存在了。 Curie在1637年对科学方法进行了演讲,他说科学必须是可复制的,这是科学的基本原则。怀疑一切,如果不是明显正确的事情,如果无法复制的话,那就是所有科学的基本原则。无论是在一个笑话中还是在复制结果或在1633年发表的这篇最初的论文中,这都是一个基本的原则。
解决所有这些问题的真正方式是开放科学的统一主题,我在2000年或2001年的时候,通过国家医学图书馆的一次讲座第一次听到了开放科学这个词。从那以后,我一直对它着迷,开放科学是可再现的科学,其中包括对于计算机科学家和Moani等人来说,代码、源代码是可用的,并且对每个人都是免费的。你使用这些代码处理数据,然后用这些代码撰写论文,然后将这些论文公开发布。通过共享代码、数据和论文,使得科学具有可复制性,使得科学变得真实可信。这是Moani背后的真正动机。
你可能会想:“这很棒,我很高兴使用它,但是共享我的数据、共享我的论文好像很麻烦,这是很多额外工作,人们总是在谈论IRB批准和各种不同的障碍。”然而,这种情况正在被逐渐克服,根据我的经验,即使在学术界,即使在我的小团队中,也能够通过遵循开放科学的原则获得很大的回报。我发现这对我的研究实验室来说是一个很好的获得资金的途径。例如,我已经申请了关于可视化工具包vtk的一些资助,我已经连续两次获得了关于vtk的资金,总数约为700万美元,任何一家学术单位都希望有这样一个基础,用来继续开展他们的研究实验室。此外,如果来看引用次数,vtk最初发布时,有两篇论文,这两篇论文现在已经被引用了1.3万次。如果你使用vtk,我们要求你引用这两篇论文。一万三千次引用量对任何人来说,都是一个巨大的提升。这对你的影响因子和学术影响力是一笔巨大的回报,这也对您的职业发展非常有帮助。
此外,vtk的软件下载量也非常惊人,仅对于Moani 3D切片、Moani、CMake和一些其他项目,每个月的下载量就达到100万次。这个量级的用户带来的影响是巨大的,对于进入学术界和工业界的人来说,这是巨大的动力。
此外,如果你去工业界,你会发现,通过基于开源代码构建你的产品,你将减少业务风险,降低创业成本。你站在巨人的肩膀上,比如vtk原始开发的投资是1350万美元,这对于一个小企业来说,不需要投资1350万美元来建立一个软件基础,而是可以基于这个基础进行进一步的开发。我向所有人推荐这一点,这对于你们所有人来说都很有意义。
当你将这一切放在现在更小的情况下,即我们今天所处的情况,那就更有趣了,那就是 AI 和深度学习。深度学习已经彻底改变了这个领域,无论如何,它是一个广为认可的组成部分,它的性能非常出色。在过去的几天里,我们一直在看到这一点,深度学习不断打破传统界限,提升最先进的技术。然而,我认为深度学习之所以取得成功的另一个原因是因为它完全采用了开源和开放科学的方式,而这一点将在Moani中得到体现,这也是我们今天的主题。
🧠 Moani的性能
我们所有人已经看到了深度学习的性能,但是我想强调一下,Moani也在这方面表现非常出色。让我们来看一看,在左侧,我们有一个视频序列,它是一个模拟的视频序列。右侧是器械和针头以及用于此目的的线的实时分割结果。通过传统的分割技术要实现这一点是非常困难的,特别是要将针头与其他要进行分割的器械区分开来。然而,通过使用深度学习系统,我们可以很轻松地实现这一目标。Moani在各个方面都有出色的性能。
为什么选择开放科学?
那么,为什么要选择开放科学呢?希望您在幻灯片中已经看到了一些令人激动的东西,有一些能够吸引您的地方。实际上,这也是我们在Moani中所强调的,无论是在学术界还是工业界,这些都与您的兴趣领域息息相关。特别是,对于那些希望进入学术界和工业界的人来说,这是非常吸引人的。
另外,对于向工业界进军的人来说,基于开源代码的工作将降低业务风险并减少创业成本。您站在伟人的肩膀上,在这个领域中,您能够节省大量的时间和金钱。这对于进入学术界和工业界的人来说都是非常有吸引力的。
另外,对于产品的基础工作,这将降低业务风险以及降低开发成本。事实上,您是站在巨人的肩膀上,您正在利用已经建立好的基础上继续发展。我极力推荐大家这样做,这对于所有人来说都非常有意义。
而在深度学习领域,开放源代码和开放科学是深度学习能够继续取得成功的原因。因此,在Moani中我们将继续强调这一点。
🚀 Moani:开放科学的体现
Moani是什么?它是Moani开放科学理念的体现。它不是一个孤立无援的标准,而是与其他相关标准紧密合作的结果。它与其他优秀的深度学习系统完全兼容,通过合作定义了Moani并得到了其他相关标准和经验丰富的人的支持。Moani是由德意志癌症研究中心和伦敦国王学院开发的,并得到了开放科学社区的广泛支持。Moani的宗旨是降低重新实现的次数,为人们提供基准实现,以展示最佳实践,使之成为一个教育工具,可以在其基础上构建,并邀请最有能力的人参与进来。
由于Moani从一开始就注重这一点,所以它已经吸引了超过150名开发人员为Moani的发展做出贡献。通过与社区的合作,Moani不断进步。
💡 Moani的核心功能
Moani的核心功能是一个层次的方法序列,从低级的数据I/O技术开始,通过numpy基于算法来构建,结合Cuda的加速方法,提供转换网络架构、损失函数等。与此同时,在Moani中还有一些管理组件,如事件处理程序、日志记录器等。Moani还提供了一些预定义的网络,如GAN网络、自编码器、单元网络等。这些都可以通过简单的函数调用来声明,这使其在操作上非常强大。
最近,Moani还推出了Moani Label系统,它是一种AI辅助注释工具。它提供了一个用户友好的界面,可以与3D Slicer等软件进行集成。通过这个系统,您可以减少75%的专家级注释任务,并在深度学习中训练神经网络的过程中节省大量的时间。Moani Label具有巨大的研究潜力,并且可以进一步改进,甚至可以通过Federated Learning等方法来实现。
🚚 Moani部署:将模型投入实际运用
Moani还提供了Moani Deploy功能,它允许您将经过训练的模型部署到实际环境中。在临床环境中部署AI系统对于研究人员来说是一个巨大的难题,但是Moani Deploy为此提供了解决方案。它允许您在临床dicom工作流中提供您的算法作为一项服务,使您能够将图像推送到系统中进行处理,并将处理的结果返回。Moani Deploy是一个非常强大的工具,它可以节省您大量的时间和精力,将您的研究成果应用到实际环境中。
🛠️ Moani模型库:共享和获取预训练模型
借鉴Hugging Face的思想,Moani还推出了Moani模型库。该模型库是一个预训练模型的集合,您可以从Moani官网上轻松下载这些模型。模型库中包含了各种针对CT扫描、MR扫描、病理学图像等应用的预训练模型。这个模型库是一个很好的起点,让您可以更轻松地进入深度学习的领域。
未来,我们希望使Moani模型库更加易于使用,希望用户可以在3D Slicer中一键式地访问Moani模型库。我们还希望用户能够使用迁移学习来调整这些模型,以适应不同的任务。
🖥️ Moani的硬件兼容性和设备接口
为了解决使用深度学习系统时的硬件问题,我们正在开发Moani的硬件兼容层。这个兼容层不仅支持GPU加速,还与诸如机器人等设备和系统进行接口对接。我们将为设备接口开发一个开源库,这个库将允许您与各种设备进行交互,这包括医学领域的设备,例如超声成像设备。
这是进入临床环境的一个重要补充,它为将你的研究成果应用到临床提供了一种新的途径。
💬 社区参与与反馈
最后,我想提醒大家,Moani是一个开源项目,在Apache许可证下进行开源。我们非常欢迎您的参与和反馈。
如果您有任何问题、建议或意见,请加入我们的Slack频道、讨论版或提出问题。我们希望听到您的声音,因为正是通过这种反馈和互动,Moani才不断得到改进。
我们在Slack频道、讨论版和GitHub上有许多文档、教程和其他资源,希望您能够参考这些资源。
非常感谢您的时间,希望您喜欢Moani,并能够在其中找到自己感兴趣的领域。非常感谢大家。
🌟 亮点
- Moani是一个开放科学平台,通过共享代码、数据和论文来实现科学的可复制性。
- Moani通过减少重新实现的次数和提供基准实现来推动研究的进展。
- Moani Label是一个AI辅助注释工具,可以减少75%的注释时间。
- Moani Deploy可以将经过训练的模型部署到实际临床环境中,方便医生和研究人员使用。
- Moani模型库提供了许多预训练模型,可以帮助您快速开始深度学习项目。
- Moani的硬件和设备兼容性使其能够与机器人和医学设备等外部系统进行集成。
- 社区参与和反馈对于Moani的发展非常重要,我们鼓励用户积极参与讨论和提供反馈。
❓ 常见问题
Q:Moani如何保证数据隐私和安全性?
A:Moani非常注重数据隐私和安全性。在Moani Label中,数据由专家进行注释,仅在需要的情况下才会共享。在Moani Deploy中,模型和数据的传输是加密的,确保数据不会泄露。
Q:Moani是否支持多模态图像处理?
A:是的,在Moani中,我们提供了对多模态图像处理的支持。您可以使用Moani的转换网络架构来处理多种类型的图像数据。
Q:Moani是否适用于医学领域以外的其他领域?
A:当然,Moani的灵活性使其适用于各种领域。您可以根据自己的需求使用Moani来处理不同类型的数据和任务。
Q:如何获得Moani的技术支持?
A:您可以参加Moani的Slack频道或讨论版,与其他用户和开发者交流,并获取技术支持和帮助。
Q:Mona Model Zoo中的模型如何更新?
A:Moani Model Zoo中的模型会定期进行更新,以便提供更好和更准确的模型。您可以随时访问Moani官网获取最新的模型。
Q:我如何将自己的模型贡献给Moani Model Zoo?
A:如果您有自己的模型想要分享给Moani社区,您可以在Moani的GitHub页面上提交您的模型并请求将其添加到Model Zoo中。
资源