El analizador de modelos Triton es una herramienta que evalúa automáticamente las configuraciones de implementación de modelos en el servidor de inferencia Triton, como el tamaño del lote, la precisión y las instancias de ejecución simultánea en el procesador de destino. Además, ayuda a seleccionar la configuración óptima para satisfacer las restricciones de calidad de servicio de la aplicación, como la latencia, el rendimiento y los requisitos de memoria, y reduce el tiempo necesario para encontrar dicha configuración. Esta herramienta también admite conjuntos de modelos y análisis multimodelo.