As fábricas de IA têm um novo motor de inferência, NVIDIA Dynamo. Dynamo 1.0 é um "sistema operativo" de código aberto de nível de produção que aumenta o desempenho de inferência em até 7x—reduzindo o custo por token e aumentando a oportunidade de receita. Saiba como o ecossistema de IA está a implementar o Dynamo 🧵
.@CoreWeave, um Parceiro da NVIDIA Cloud, está a usar o NVIDIA Dynamo para implementar agentes de IA em produção com durabilidade e orquestração de alto desempenho.
.@nebiusai está a trazer otimizações de inferência contínuas e um tempo de implementação mais rápido para os seus clientes, impulsionado pela NVIDIA Dynamo e TensorRT-LLM.
.@Pinterest está a oferecer experiências de IA personalizadas e multimodais a centenas de milhões de seus utilizadores, utilizando o NVIDIA Dynamo para inferência escalável.
.@togethercompute está a trazer a sua pesquisa de inferência com o NVIDIA Dynamo 1.0 para fornecer uma pilha de inferência acelerada e rentável para cargas de trabalho de IA em produção.
468