Привет, кто-нибудь знает программу, которая может превращать длинные аудиозаписи в текст?
Желательно бесплатную.
Убил несколько часов на поиски в интернете, но ничего толкового не нашёл.
Есть несколько транскрибаторов с голоса — например, google.document, speechpad.ru, speechnotes.co.
Но и то все работают отвратительно: не понимают простейших слов, много пропускают, пишут тарабарщину, останавливаются…
Если это искусственный интеллект, то какой-то туповатый.
А чтобы расшифровывать аудиофайл, нашлись только платные.
Пробовать не очень хочется — они ведь могут так же тупить. Только за деньги.
Прошу совета у тех, кто сам пользуется какими-то программами: вы на чём остановились? Расшифровываете с диктовки или с аудио- или видеофайла?
В какой программе это делать лучше? Где меньше косяков?
Где интерфейс простой, понятный "для чайников"?
Приём.
подробнее о бонусах
бонус за лучший ответ: 5 кредитов
хотите увеличить?
тэги:
аудио в текст,
понятный интерфейс,
расшифровка аудиозаписей,
транскрибирование
категория:
компьютеры и интернет
ответить
комментировать
в избранное
бонус
2 ответа:
старые выше
новые выше
по рейтингу
6
Ира люблю длинные вопросы и ответы на БВ
[193K]
3 дня назад
Конечно же нет таких программ. Нужно резать видеофайл на клипы по голосам. Там же не один диктор, а разные люди. Затем придётся работать с каждым клипом. Микшировать голос с помощью поднятия, задавливания избранных частот, отделяя их от звука голоса.
Затем каждый клип загонять в транскрибатор (я использовала speechpad) и выуживать из голоса текст, где-то строя догадки по смыслу. Если вы 3 — 5 минутный клип расшифруете за час — два, то вам крупно повезло.
Платные бесплатные — это без разницы. От них нет толку. Важен человеческий фактор. Час звукового текста — уходят недели и даже месяцы для одного человека. Когда напрактикуетесь, будете просто печатать вслепую, а не надеяться на тупого ИИ.
комментировать
в избранное
ссылка
отблагодарить
1
gigabyte
[46.4K]
1 неделю назад
В целом вы правы — покупка программы или доступа ни к чему не приведет, поскольку системы распознавания голоса далеки от совершенства. Поставленный голос диктора распознаётся хорошо (на 4 из 5), обычный голос будет распознаваться в пределах "троечки", при наличии посторонних шумов проще набрать вручную.
Мой опыт в проигрывании аудиофайла смартфону с открытым Telegram и отправкой сообщения в "Избранное". Разумеется Google. Далее ручками. Экономия времени произошла когда наняли девушку лихо печатающую на клавиатуре.
комментировать
в избранное
ссылка
отблагодарить