Nvidia发布用于生物分子研究和文本处理的AI新工具

2022-09-22 12:30:21 业界动态

Nvidia今天推出了一系列新产品,让企业能够更轻松地构建先进的自然语言处理模型。     第一款产品是BioNeMo,一个开发自然语言处理模型的框架,可以帮助科学家进行生物学和化学研究。除了该框架之外,Nvidia还推出了两项基于云的AI服务,第一个服务将简化使用BioNeMo开发AI模型,另一项服务则专注于加快把神经网络应用于文本处理例如总结研究论文等。

BioNeMo     AI处理数据和做出决策的方式受配置设置(称为参数)的影响,AI模型的参数越多,处理数据的准确性就越高。     近年来,研究人员开发了多种包含数十亿参数的自然语言处理模型,这种神经网络被称为大型语言模型(LLM),最先进的LLM不仅可以应用于传统的文本处理,例如总结研究论文,还可以用于编写软件代码和执行其他各种任务。     科学家们发现,LLM的处理能力非常适合生物分子研究。这次Nvidia推出的BioNeMo框架专门用于训练能够支持生物学和化学领域研究的LLM,此外还包含了多项功能可简化在生产中部署此类神经网络的任务。     Nvidia方面表示,科学家可以使用该框架来训练具有数十亿个参数的LLM。此外,BioNeMo包含了四个预训练的语言模型,相比从零开始开发神经网络来说,能够更快速地应用于研究任务中。     首批两个预训练的语言模型ESM-1和OpenFold已经针对预测蛋白质的特性进行了优化。BioNeMo支持ProtT5,一种可用于生成新蛋白质序列的神经网络,另外一个神经网络是MegaMolBART,可用于预测分子如何相互作用等任务。     新的云服务     除了BioNeMo,Nvidia今天还推出了两项新的云服务,旨在简化构建AI应用的任务,并且都提供了一组预打包的语言模型。     第一个云服务BioNeMoService支持使用NvidiaBioNeMo框架创建的两种语言模型,这两个神经网络经过优化可以支持生物学和化学方面的研究,据称可以配置多达数十亿个参数。     Nvidia设想生物技术和制药公司可以利用BioNeMo服务来加速药物的发现,称该服务可以帮助科学家生成用于治疗用途的新生物分子,以及执行与医学研究相关的其他任务。     Nvidia创始人、首席执行官黄仁勋表示:“大型语言模型具有变革每个行业的潜力,调优基础模型的能力让数百万开发人员可以利用LLM,让他们如今可以打造各种语言服务并推动科学发现,而无需从头开始构建庞大的模型。”     Nvidia此次推出的第二项云服务名为NeMoLLMService,它提供了包含30亿到5300亿个参数的预训练语言模型集合,这些语言模型可用于生成文本摘要、支持聊天机器人和编写软件代码等任务。     NeMoLLM服务中的神经网络已经经过了Nvidia的预先训练,但企业可以选择在自己自定义的数据集上做进一步的训练。让神经网络熟悉和了解某个企业的数据,使其能够更准确地处理这些数据。     企业组织可以使用一种“提示学习”(promptLearning)的方法在NeMoLLM服务中训练AI模型。“提示学习”包括为神经网络提供部分句子,例如“Nvidia为…开发芯片”,并指示它来完成文本,通过多次重复这个过程,开发人员就可以教会神经网络执行某些计算任务。     与传统的AI训练方法相比,提示学习的主要好处是,在某些类型的机器学习项目中使用该技术可以大大加快速度。据Nvidia称,客户可以在几分钟或者是几小时内训练NeMoLLM服务提供的神经网络,而不是长达数月时间。训练完成之后,就可以把这个神经网络部署到云环境或者企业的本地基础设施中。     NeMoLLM服务和BioNeMoLLM服务将于提供早期访问,BioNeMo框架将提供测试版。

版权说明: 本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。