admin 发表于 2022-6-25 23:02:49

NVIDIA医疗布局日渐完善,从GTC 2022看AI+医疗的想象空间

AI在医疗健康中的应用范围越来越广泛,尤其是新兴数字技术的引入,在很多环节都需要AI的赋能。越来越多的人意识到,AI正如同传统的水、电、气和公路一样,正在成为数字经济时代必须的基础设施。

作为主要的AI算力提供者,NVIDIA(英伟达)对于AI极为重视,创立于2009年的GTC(GPU Technology Conference)如今已经完全转变为了一场AI盛会——在GTC开场固定的主题演讲中,NVIDIA创始人兼CEO黄仁勋发布了数款针对AI的新品,将AI算力提高到了一个前所未有的新高度。

这个算力的提高幅度有多高?各种复杂的术语比较可能不太容易记住,但“20个H100 GPU便可承托相当于全球互联网的流量”这样通俗且有冲击力的语句相信很快就会在整个互联网上传播开来。这样巨大的数据通信和处理能力也将会为实时运行数据推理的大型语言模型提供便利,将以往的不可能变为可能。

AI的本质是对数据的标注学习和处理。因此,占据全球数据量30%且2020-2025年数据量年均符合增长率高达36%的医疗健康领域必然是AI应用的重中之重。在黄仁勋的主题演讲中,AI在医疗健康中的应用占据了不小的篇幅。与此同时,NVIDIA医疗副总裁Kimberly Powell在专场演讲中也展示了NVIDIA在医疗健康的最新动向。动脉网对此进行了整理。

阅读提示:文末有惊喜。

从影像切入,

NVIDIA Clara医疗生态正日趋完善

自从2018年推出专门针对医疗场景的NVIDIA Clara平台以来,NVIDIA近年来一直在不断对其进行优化和拓展,以完善其在医疗健康的布局。最初,NVIDIA Clara仅是为影像学AI研究者提供一个医学影像的软件开发工具,以标准化影像数据,并提升AI训练速度。

随后,通过与业界的合作,NVIDIA Clara开始向基因组学拓展。毕竟,基因组是一个更为庞大的数据源,要处理亿级的碱基配对,必须找到更理想的算力来源,才能保证试验在成本上可行。

随着NVIDIA对医疗健康应用场景的理解越来越深入,更多的医疗行业解决方案开始被放入NVIDIA Clara平台。如同NVIDIA最初建立行业地位的“GeForce”在游戏界的地位一样,NVIDIA显然希望“Clara”能够与医疗健康绑定——这一定位于面向医疗开发者的智能计算软件平台为更想要探索医疗领域的开拓者提供高效便捷的数据分析工具。

https://p3-sign.toutiaoimg.com/tos-cn-i-tjoges91tu/T0ySMVfWyGZip~tplv-tt-large.image?x-expires=1971531975&x-signature=x2W8VoOxCaobm7VBQAbS2lQodnU%3D

截图来自官方视频直播

目前,NVIDIA Clara已经在“模型训练-模型-应用-AI边缘计算平台”的重要节点上完成了布局,基本完善了Clara整体解决方案生态的构建。

MONAI+Nemo发力AI模型构建

在模型构建上,MONAI是Clara生态的重要一环。这一开源的AI开发框架最初由NVIDIA与伦敦国王学院共同推出。MONAI具有自动标注工具来协助开发者标注数据,并能够实现自动化模型挑选和参数调优。同时,MONAI也具有自监督学习,可以利用非标注数据训练模型,从而缩短标注时间。

https://p3-sign.toutiaoimg.com/tos-cn-i-tjoges91tu/T0ySMWJHo4508j~tplv-tt-large.image?x-expires=1971531975&x-signature=28pbraJ4L0zSGLPbdi2AsE8yiBU%3D

截图来自官方视频直播

MONAI针对医疗数据的独特需求进行了专项优化,使其能够处理医学图像所特有的格式、分辨率和元信息。开发者可以利用其专门用于医疗领域的数据转换、神经网络架构和评估方法来评估医学影像模型的质量。

因其开源和易用特性,MONAI自推出后反响良好。截至2022年2月,MONAI的月下载量已经达到5万次。尤其在最近一个季度,月下载量实现了翻倍。基于MONAI产出的论文也已经超过65篇。

除了MONAI,基于联邦学习的NVIDIA Flare框架将有助于破解AI模型训练的最大困境——如何保证数据隐私。传统来说,模型训练需要将所有数据上传至中心服务器的方式,可能会涉及到敏感的临床数据及病人隐私。

联邦学习可以让多个机构利用自己的数据进行多次迭代训练模型,随后将模型上传共享。一旦在本地对模型进行了几次迭代训练,参与者就会将模型的更新版本发送回集中式服务器。在收到各地上传的更新模型后,服务器将根据各地上传的模型对全局模型进行更新。随后,服务器会与参与机构共享更新后的模型,以便它们能够继续进行本地培训。

整个过程只发送训练完成的模型,而不会像以往的方式发送病理数据。由此实现了对医疗数据隐私的保护,对破解AI模型训练的“无米之炊”有很好的帮助。

基于业界合作的结果,NVIDIA在GTC 2022上还发布了超过40种预训练模型,涵盖影像、药物发现、NLP和计算机视觉四大领域。这些模型在训练过程中均用到了NVIDIA的工具,比如用于研究大型转换语言模型高效训练的NVIDIA Nemo Megatron。

这一开源项目由NVIDIA主导,使企业能够克服训练复杂NLP模型的挑战。通过数据处理库自动处理LLM训练的复杂性,这些数据处理库可以输入、策划、组织和清理数据,并利用先进的数据、张量和管道并行化技术,使大型语言模型的训练有效地分布在成千上万的GPU上。

简单来说,原来只能分配给一个人干的活儿现在可以不受影响地派给成百上千个人,效所需时间自然大为缩短。

多方合作,

AI+医疗打造更多应用场景

此外,开发者还可以通过NVIDIA Nemo Megatron框架进一步训练它以服务新的领域和语言。在GTC 2022上,NVIDIA就展示了集中预训练模型,包括自己开发的BioMegatron以及与阿斯利康合作的MegaMolBart。

MegaMolBART主要用于反应预测、分子优化和分子生成,基于阿斯利康的MolBART Transformer模型,并在ZINC化合物数据库(这一数据库允许研究人员预训练模型来理解化学结构,无需手动标记数据)上训练而成。凭借对化学的统计理解,该模型将用于完成包括预测化学物质之间的相互作用以及生成新的分子结构等新药研发的相关任务。

借助NVIDIA Nemo Megatron框架,模型在超算基础设施上进行了大规模扩展训练,实现了高正确性和特殊性的分子生成——顺便说一句,其训练所使用的英国最大的超级计算机Cambridge-1也是基于NVIDIA芯片赋能。

Nemo训练框架具有广泛的兼容性,除了分子预测,也可用于事件侦测、临床实验匹配、生物药物研究、预授权、聊天机器人等应用场景。

https://p3-sign.toutiaoimg.com/tos-cn-i-tjoges91tu/T0ySMWyG74gTWi~tplv-tt-large.image?x-expires=1971531975&x-signature=BRZZrO3OjUwnXeM%2Bf9VJ1ej5Ex4%3D

截图来自官方视频直播

杨森制药就利用NVIDIA的BioMegatron预训练模型和Nemo框架打造针对药物不良反应的模型,以预测药物的未知不良反应。

此外,佛罗里达大学健康学院也利用最新的Megatron框架和BioMegatron 预训练模型来开发 GatorTron,这个模型由累积超过10年的200万名患者的资料形成,参数量达到50亿之多,是迄今为止最大的临床语言模型。

除了模型和预训练模型,NVIDIA的算力在基因测序上也带来了质的飞跃。传统上,从全人类基因组测序中快速表征导致遗传疾病的变异很有挑战性。全基因组测序可以更好地检测这些变异,但通常需要数天乃至数周才能返回结果。

在时间紧迫的情况下,漫长的等待时间可能会导致生死之别——例如需要对危重患者进行鉴定可疑的致病变异。

在不久前,Oxford Nanopore Technologies、NVIDIA、谷歌的科学家与斯坦福大学医学院医学、遗传学和生物医学数据科学教授Euan Ashley、MB ChB和DPhil领导的研究小组合作开发了名为“uNap”的第三代基因测序AI工作流程工具,可以在短短7小时18分钟内表征致病变异。

这一工具可在NVIDIA的云端平台NGC执行,只需要一台NVIDIA DGX A100即可执行,大大简化了基因测序所需的计算架构。这使得临床医生和研究人员不需借用外部力量即可在机构内部来分析基因数据。

最终,这一系统在5小时2分钟内就生成了整个人类基因组和变异列表。在随后的表征致病变异列表进行人工审查,可在7小时18分钟内表征致病变异。相比之前14小时的记录,uNAP将所需时间减少了一半。

之后,NVIDIA Clara以DGX-A100来对基因测序流程进行了进一步优化,只需1台服务器就能在4小时10分钟中完成全基因测序,从而使每位患者的计算成本从568美元大幅降低到183美元。

Clara Holoscan剑指医疗器械,

想象空间巨大

在平台方面,NVIDIA则推出了NVIDIA Clara Holoscan MGX,由Holoscan扩展而来。这是一个可供医疗设备行业在边缘开发和部署实时AI应用的平台。与Holascan相比,MGX最大的特点是符合专门的医疗认证,通过了IEC 60601和62304规范,并集成了嵌入式安全功能。

Clara Holoscan可以通过高吞吐量数据传输和处理使得数据实时处理成为现实。比如,病理数据的实时分析。病理图像数据量极其庞大,甚至高达数TB。基本不可能对病理数据进行实时分析。借助Clara Holoscan平台,研究人员将癌细胞病理图像的分析时间从2天变为实时,并首次实时发现了单个癌细胞分裂为三个癌细胞的画面。

Clara Holoscan可以轻松地与现有的医疗器械结合,为医疗器械提供不断升级的SaaS服务,从而获得NVIDIA在AI、加速计算和高级可视化上的能力。借助Clara Holoscan,开发者可以自定义应用将其作为设备和服务器上的一系列模块化微服务运行。

https://p3-sign.toutiaoimg.com/tos-cn-i-tjoges91tu/T0ySMXW2516xGN~tplv-tt-large.image?x-expires=1971531975&x-signature=yfy5yejJ7x4P4aubNJM9l1tqz84%3D

截图来自官方视频直播

Clara Holoscan SDK通过加速库、AI模型和超声波、数字病理学、内窥镜检查等参考应用支持此项工作,以帮助开发者利用嵌入式和可扩展的混合云计算。有了端到端的部署平台,企业可以更容易地升级应用,为医学的日常实践带来新的研究突破。同时,在这些领域共有16000家医疗器械品牌超过200万设备在全球运行。这将是一个广阔的市场。

写在最后

总的来说,NVIDIA在GTC 2022上进一步完善了其在医疗领域的布局。借助对NVIDIA Clara的内涵和外延的不断丰富,NVIDIA Clara生态正在逐渐成型,并将借助AI基础设施的构建来不断扩大其影响力。

声明:动脉网所刊载内容之知识产权为动脉网及相关权利人专属所有或持有。未经许可,禁止进行转载、摘编、复制及建立镜像等任何使用。

本文源自动脉网
页: [1]
查看完整版本: NVIDIA医疗布局日渐完善,从GTC 2022看AI+医疗的想象空间