NVIDIA Riva предоставляет возможности автоматического распознавания речи (ASR) и преобразования текста в речь (TTS) на основе глубокого обучения для специалистов по искусственному интеллекту и разработчиков. ASR и TTS — это речевые интерфейсы в приложениях на основе ИИ для обработки речи, таких как помощники операторов колл-центра, цифровые помощники и приложения для расшифровки записей видеозвонков.
ASR преобразует речь в текст и обычно является первым этапом в конвейере обработки речи, поэтому его точность при расшифровке аудиозаписей влияет на все последующие задачи. TTS генерирует похожие на человеческие голоса на основе текста.
NVIDIA Riva используется во всех отраслях — от телекоммуникаций и финансов до здравоохранения, розничной торговли и автомобилестроения — поскольку каждой компании необходимо взаимодействовать со своими клиентами.