专栏名称: 腾讯科技
只供应最有营养的科技大餐!
目录
51好读  ›  专栏  ›  腾讯科技

SIGGRAPH 2024:英伟达“AI盒子”升级,黄仁勋想打造物理世界的数字副本

腾讯科技  · 公众号  · 科技媒体  · 2024-07-30 08:59

正文

请到「今天看啥」查看全文


理解方向,NIM可使用Llama 3.1和NeMo Retriever,提升文本数据的处理能力;数字人方向,提供了Parakeet ASR和FastPitch HiFiGAN等模型,支持高保真语音合成和自动语音识别,为构建虚拟助手和数字人类提供了强大的工具;
在三维开发方面,USD Code和USD Search等模型简化三维场景的创建和操作,帮助开发者更高效地构建数字孪生和虚拟世界;
在机器人具身方向,英伟达推出了MimicGen和Robocasa模型, 通过生成合成运动数据和模拟环境,加速了机器人技术的研发和应用。MimicGen NIM 可根据 Apple Vision Pro 等空间计算设备记录的远程操作数据,生成合成运动数据。Robocasa NIM 可在 OpenUSD (一个用于在 3D 世界中进行开发和协作的通用框架)中生成机器人任务和仿真就绪环境。
数字生物学领域的DiffDock和ESMFold等模型,则在药物发现和蛋白质折叠预测方面提供了先进的解决方案,推动了生物医学研究的进展等等。
此外,Nvidia宣布Hugging Face推理即服务平台也由Nvidia NIM提供支持,在云端运行。
通过整合这些多功能模型,Nvidia的这种生态系统不仅提升了AI开发的效率,还提供了创新的工具和解决方案。不过,尽管Nvidia NIM的诸多升级对于行业确实是一大“福音”。但从另一面来看,也给程序员们带来了很多挑战。
Nvidia NIM通过提供预训练的AI模型和标准化的API,大大简化了AI模型的开发和部署过程,这对于开发者来说确实是一大福音,但是否也意味着普通程序员的就业机会未来或将进一步收缩? 毕竟,企业可以用更少的技术人员完成同样的工作,因为这些任务已经由NIM预先完成,普通程序员可能不再需要进行复杂的模型训练和调优工作。


教AI用3D思维进行思考,构建虚拟物理世界


英伟达在SIGGRAPH大会上也展示了生成性AI在开放USD和Omniverse平台上的应用。
英伟达宣布,构建了世界上首个能够理解基于 OpenUSD(Universal Scene Description 通用场景描述)语言、几何、材料、物理和空间的生成性AI模型,并将这些模型打包为Nvidia NIM微服务。






请到「今天看啥」查看全文