Утро, буквально пару часов ушло у меня что бы создать, протестировать и опубликовать телеграм бота для распознавания аудио сообщений.
Если вас так же как и меня раздражают собеседники, которые не уважают ваше время и надиктовывают сообщения просто перетягивайте их в бота и он их распознает. Вот ссылка
t.me/YouScriptor_bot
Используется локальная нейросеть whisper на CPU. Тестировал и на GPU, будут посещения поставлю и видеокарту, с ней в несколько раз быстрее. Но работает примелимо и так.
Так же можно использовать для заметок — надиктовываешь аудиосообщение боту, он тебе в ответ распознанный текст. Я пишу книгу, и по сути такого удобного диктофона для заметок не находил.
Так же добавил в сервис оцифровывания лекций
youscriptor.com возможность скачивать видео YouTube с выбором дорожек и субтитры в формате .srt