Как расшифровывать голосовые файлы?

Привет, кто-нибудь знает программу, которая может превращать длинные аудиозаписи в текст?

Желательно бесплатную.

Убил несколько часов на поиски в интернете, но ничего толкового не нашёл.

Есть несколько транскрибаторов с голоса — например, google.document, speechpad.ru, speechnotes.co.

Но и то все работают отвратительно: не понимают простейших слов, много пропускают, пишут тарабарщину, останавливаются…

Если это искусственный интеллект, то какой-то туповатый.

А чтобы расшифровывать аудиофайл, нашлись только платные.

Пробовать не очень хочется — они ведь могут так же тупить. Только за деньги.

Прошу совета у тех, кто сам пользуется какими-то программами: вы на чём остановились? Расшифровываете с диктовки или с аудио- или видеофайла?

В какой программе это делать лучше? Где меньше косяков?

Где интерфейс простой, понятный "для чайников"?

Приём.

подробнее о бонусах

бонус за лучший ответ: 5 кредитов
хотите увеличить?

тэги:

аудио в текст,

понятный интерфейс,

расшифровка аудиозаписей,

транскрибирование

категория:

компьютеры и интернет

ответить

комментировать

в избранное

бонус

2 ответа:

старые выше
новые выше
по рейтингу

Ира люблю длинные вопросы и ответы на БВ
[193K]

3 дня назад

Конечно же нет таких программ. Нужно резать видеофайл на клипы по голосам. Там же не один диктор, а разные люди. Затем придётся работать с каждым клипом. Микшировать голос с помощью поднятия, задавливания избранных частот, отделяя их от звука голоса.

Затем каждый клип загонять в транскрибатор (я использовала speechpad) и выуживать из голоса текст, где-то строя догадки по смыслу. Если вы 3 — 5 минутный клип расшифруете за час — два, то вам крупно повезло.

Платные бесплатные — это без разницы. От них нет толку. Важен человеческий фактор. Час звукового текста — уходят недели и даже месяцы для одного человека. Когда напрактикуетесь, будете просто печатать вслепую, а не надеяться на тупого ИИ.

комментировать

в избранное

ссылка

отблагодарить

gigabyte
[46.4K]

1 неделю назад

В целом вы правы — покупка программы или доступа ни к чему не приведет, поскольку системы распознавания голоса далеки от совершенства. Поставленный голос диктора распознаётся хорошо (на 4 из 5), обычный голос будет распознаваться в пределах "троечки", при наличии посторонних шумов проще набрать вручную.

Мой опыт в проигрывании аудиофайла смартфону с открытым Telegram и отправкой сообщения в "Избранное". Разумеется Google. Далее ручками. Экономия времени произошла когда наняли девушку лихо печатающую на клавиатуре.

комментировать

в избранное

ссылка

отблагодарить

Реклама

Добавить комментарий Отменить ответ