обзор 6 бесплатных сервисов для расшифровки аудио с помощью нейросетей. Каждый сервис имеет свои лимиты и стоимость, а также поддерживает или не поддерживает русский язык.
1. Whisper - это приложение для macOS, которое работает на нейросети Whisper от компании OpenAI. Бесплатно доступны две модели, их нужно предварительно скачать. Язык определяется автоматически. Сервис качественно и быстро транскрибирует, расставляет знаки препинания и разделяет текст на абзацы.
2. Riverside - это сервис, который позволяет расшифровывать аудио файлы. Достаточно перетащить файл на сайт, выбрать один из 100 языков и дождаться транскрибации. Корректно расшифровывает русскую речь и расставляет знаки препинания. Из минусов - не разделяет спикеров в диалоге и не поддерживает популярный формат M4A.
3. Otter.AI - это сервис, который создан для расшифровки онлайн-встреч. Записывать звонки не придется: сервис можно подключить напрямую к Google Meets или Zoom. Разделяет речь спикеров, но поддерживает только английский язык.
4. Salute Speech Bot - это телеграм-бот от Сбера, который работает на нейросети Salute Speech. В нем можно расшифровывать чужие голосовые сообщения и таким образом заменить ботом функцию из платной подписки Telegram Premium. Недостаток - не до конца расшифровывает длинные сообщения.
5. Teamlogs - это онлайн-сервис с интерфейсом на русском. Поддерживает 13 форматов аудио, разделяет речь спикеров, позволяет отредактировать расшифровку перед скачиванием. Дополнительно с помощью ИИ может составить конспект и выделить ключевые слова.
6. Писец - это сервис, который разделяет текст до пяти спикеров, расставляет знаки препинания и тайм-коды, но может ошибаться в отдельных слов