Triton Model Analyzer è uno strumento che valuta automaticamente le configurazioni di distribuzione dei modelli in Triton Inference Server, ad esempio le dimensioni del batch, la precisione e le istanze di esecuzione simultanee sul processore di destinazione. Aiuta a selezionare la configurazione ottimale per soddisfare i vincoli di qualità del servizio (QoS) delle applicazioni, come latenza, produttività e requisiti di memoria, e riduce i tempi necessari per trovare la configurazione ottimale. Questo strumento supporta anche analisi di insiemi di modelli e multi-modello.