Descripción General

¿Qué Es la Inferencia de IA?

La inferencia de IA es el lugar donde se implementan los modelos de IA preentrenados para generar nuevos datos y donde la IA ofrece resultados, lo que impulsa la innovación en todas los sectores. Los modelos de IA se expanden rápidamente en tamaño, complejidad y diversidad, ampliando el horizonte de lo posible. Para utilizar con éxito la inferencia de IA, las organizaciones necesitan un enfoque de pila completa que admita el ciclo de vida integral de la IA y herramientas que les permitan a los equipos cumplir sus objetivos.

Implementación de IA Generativa en Producción

Explore las principales consideraciones a la hora de implementar y escalar la IA generativa en producción, incluido el papel fundamental de la inferencia de IA.

Beneficios

Explore los Beneficios de la IA de NVIDIA para la Inferencia Acelerada

Estandarice la Implementación

Estandarice la implementación de modelos en aplicaciones, frameworks de IA, arquitecturas de modelos y plataformas.

Integre y Escale Con Facilidad

Integre fácilmente con herramientas y plataformas en instancias de cloud públicas, en data centers locales y en el edge.

Menor Costo

Disfrute de un alto caudal y nivel de utilización de la infraestructura de IA, reduciendo así el costo.

Gran Desempeño

Disfrute del mejor desempeño del sector con la plataforma que establece múltiples récords en MLPerf de forma constante, el punto de referencia líder del sector para la IA.

Software

Descubra Nuestro Software de Inferencia de IA

NVIDIA AI Enterprise consta de NVIDIA NIM™, Servidor de Inferencia NVIDIA Triton™, NVIDIA® TensorRT™ y otras herramientas para simplificar la creación, el intercambio y la implementación de aplicaciones de IA. Con soporte, estabilidad, capacidad de administración y seguridad de nivel empresarial, las empresas pueden acelerar el tiempo de generación de valor al tiempo que eliminan el tiempo de inactividad no planificado.

El Camino Más Rápido Hacia la Inferencia de IA Generativa

NVIDIA NIM es un conjunto de microservicios fáciles de usar, hechos para la implementación segura y confiable de inferencia de modelos de IA de alto desempeño en clouds, data centers y workstations.

Servidor de Inferencia Unificado para Todas Sus Cargas de Trabajo de IA

El Servidor de Inferencia NVIDIA Triton es un software de inferencia de código abierto que ayuda a las empresas a consolidar una infraestructura de servicio de modelos de IA personalizada, acortar el tiempo necesario para implementar nuevos modelos de IA en producción y aumentar la capacidad de inferencia y predicción de IA.

Un SDK para Optimizar la Inferencia y el Tiempo de Ejecución

NVIDIA TensorRT incluye un tiempo de ejecución de inferencia y optimizaciones de modelos que ofrecen baja latencia y alto rendimiento para las aplicaciones de producción. El ecosistema de TensorRT incluye TensorRT, TensorRT-LLM, TensorRT Model Optimizer y TensorRT Cloud.

Hardware

Explore Nuestra Infraestructura de Inferencia de IA

Disfrute de un desempeño de IA incomparable con el software de inferencia de IA de NVIDIA, optimizado para la infraestructura acelerada por NVIDIA. Las tecnologías NVIDIA H200, L40S y NVIDIA RTX™ ofrecen una velocidad y eficiencia excepcionales para las cargas de trabajo de inferencia de IA en data centers, clouds y workstations.

GPU NVIDIA H200 Tensor Core

La GPU NVIDIA H200 Tensor Core potencia las cargas de trabajo de IA generativa y computación de alto desempeño (HPC) con revolucionarias capacidades de desempeño y memoria. Como la primera GPU con HBM3e, la memoria de la H200, más grande y rápida, impulsa la aceleración de la IA generativa y los grandes modelos de lenguaje

GPU NVIDIA L40S

La combinación de la pila completa de software de inferencia de NVIDIA con la GPU L40S proporciona una potente plataforma para modelos entrenados listos para la inferencia. Con soporte para la escasez estructural y una amplia gama de precisiones, el L40S ofrece hasta 1,7 veces el desempeño de inferencia de la GPU NVIDIA A100 Tensor Core.

Tecnología NVIDIA RTX

La tecnología NVIDIA RTX lleva la IA a la computación visual, acelerando la creatividad mediante la automatización de tareas y la optimización de procesos de computación intensiva. Con el poder de los núcleos CUDA®, RTX mejora la renderización en tiempo real, la IA, los gráficos y el rendimiento de la computación.

Presentación de NVIDIA Project DIGITS

NVIDIA Project DIGITS lleva el poder de Grace Blackwell a las computadoras de escritorio de los desarrolladores. El superchip GB10, combinado con 128 GB de memoria de sistema unificado, permite a los investigadores de IA, científicos de datos y estudiantes trabajar con modelos de IA localmente con hasta 200 mil millones de parámetros.

Casos de Uso

Cómo Se Utiliza la Inferencia de IA

Descubre cómo la IA de NVIDIA admite casos de uso del sector y ponga rápidamente en marcha su desarrollo de IA con ejemplos seleccionados.

Humanos Digitales

NVIDIA ACE es un paquete de tecnologías que ayudan a los desarrolladores a dar vida a los humanos digitales. Varios microservicios de ACE son NIM de NVIDIA: microservicios fáciles de implementar, de alto rendimiento, optimizados para ejecutarse en PC NVIDIA RTX con IA o en NVIDIA Graphics Delivery Network (GDN), una red global de GPU que proporciona procesamiento humano digital de baja latencia a 100 países. 

Generación de Contenido

Con la IA generativa, puede generar contenido altamente relevante, personalizado y preciso, basado en la experiencia del dominio y la propiedad intelectual de su empresa.

Generación Biomolecular

Los modelos generativos biomoleculares y el poder computacional de las GPU exploran eficientemente el espacio químico, generando rápidamente diversos conjuntos de moléculas pequeñas adaptadas a objetivos o propiedades de fármacos específicos.

Detección de Fraudes

Las instituciones financieras necesitan detectar y prevenir actividades fraudulentas sofisticadas, como el robo de identidad, la toma de control de cuentas y el lavado de dinero. Las aplicaciones habilitadas por IA pueden reducir los falsos positivos en la detección de fraudes en transacciones, mejorar la precisión de la verificación de identidad para los requisitos de conocimiento del cliente (KYC) y hacer que los esfuerzos contra el lavado de dinero (AML) sean más efectivos. mejorando tanto la experiencia del cliente como la salud financiera de su empresa.

Chatbot de IA

Las organizaciones buscan crear chatbots de IA más inteligentes a través de la generación aumentada por recuperación (RAG). Con RAG, los chatbots pueden responder con exactitud a preguntas específicas de un dominio, al recuperar información de la base de conocimiento de una organización y proporcionar respuestas en tiempo real en lenguaje natural. Estos chatbots se pueden utilizar para mejorar la asistencia al cliente, personalizar avatares de IA, administrar el conocimiento empresarial, agilizar la incorporación de empleados, proporcionar asistencia de TI inteligente, crear contenido y más.

Análisis de Vulnerabilidades de Seguridad

La aplicación de parches para resolver los problemas de seguridad del software supone un creciente desafío, ya que el número de fallas de seguridad reportadas en la base de datos de vulnerabilidades y exposiciones comunes (CVE) rompió todos los récords en 2022. A través de la IA generativa, es posible mejorar la defensa contra las vulnerabilidades al tiempo que se disminuye la presión sobre los equipos de seguridad.

Historias de Clientes

Cómo Impulsan la Innovación los Líderes del Sector con la Inferencia de IA

Amdocs

Acelera el Desempeño de la IA Generativa y Reduzca los Costos

Lea cómo Amdocs creó amAIz, una plataforma de IA generativa específica de un dominio para las empresas de telecomunicaciones, mediante el uso de microservicios de inferencia NVIDIA DGX™ Cloud y NVIDIA NIM para mejorar la latencia, aumentar la precisión y reducir los costos.

Snapchat

Mejora de la Compra de Ropa con IA

Descubra cómo Snapchat mejoró la experiencia de compra de ropa y el reconocimiento óptico de caracteres compatible con emojis mediante el Servidor de Inferencia Triton para escalar, reducir los costos y acelerar el tiempo de producción.

Amazon

Acelere la Satisfacción del Cliente

Descubra cómo Amazon mejoró la satisfacción del cliente al acelerar su inferencia 5 veces más rápido con TensorRT.

Recursos

Lo Último en Recursos de Inferencia de IA

Empiece con la Inferencia en NVIDIA LaunchPad

¿Dispone de un proyecto de IA actualmente? Solicite una prueba práctica y cree prototipos de sus soluciones de IA.

Descubra las Rutas de Aprendizaje de IA Generativa y LLM

Mejore sus habilidades técnicas en IA generativa y grandes modelos de lenguaje con nuestras rutas integrales de aprendizaje.

Empiece en la Inferencia de IA Generativa con NVIDIA LaunchPad

Acelere su viaje hacia la IA generativa con acceso inmediato y a corto plazo a los microservicios de inferencia NVIDIA NIM y a los modelos de IA, todo ello de forma gratuita.

Implementación de la IA Generativa en Producción con NVIDIA NIM

Descubre el potencial de la IA generativa con NVIDIA NIM. Este video explica cómo los microservicios NVIDIA NIM pueden transformar la implementación de la IA en una fuerza impulsora lista para la producción.

Las 5 Razones Principales por las que Triton Simplifica la Inferencia

El Servidor de Inferencia Triton simplifica la implementación de modelos de IA a escala en producción. Es un software de inferencia de código abierto que permite a los equipos implementar modelos de IA entrenados desde cualquier framework, desde el almacenamiento local o la plataforma de cloud en cualquier infraestructura basada en GPU o CPU.

UneeQ

NVIDIA Presenta los NIM

¿Alguna vez se preguntó de qué es capaz la tecnología NIM de NVIDIA? Profundice en el mundo de los asombrosos humanos y robots digitales para ver lo que los NIM hacen posible.

Próximos Pasos

¿Listo para Empezar?

Explore todo lo que necesita para comenzar a desarrollar su aplicación de IA, incluyendo la documentación más reciente, los tutoriales, blogs técnicos y mucho más.

Contáctenos

Hable con un especialista en productos NVIDIA sobre el paso de la fase de pruebas a la de producción con la seguridad, la estabilidad de las API y el soporte de NVIDIA AI Enterprise.

Descubre las Últimas Novedades Sobre IA de NVIDIA

Regístrate para recibir las últimas noticias, actualizaciones y más información de NVIDIA.

OSZAR »