Программы для преобразования голоса в текстовый документ могут пригодиться для записи длительных лекций или для быстрого набора книг, статей. В их основе используются специальные API-движки, которые распознают тон и фонетику воспроизводимых звуков и на их основе выстраивают слова, предложения. Естественно, каждая такая программа для голосового набора и сохранения текста работает не идеально, но для создания заметки под последующее редактирование отлично сойдёт.
Перечень лучших программ для голосового набора текста
Если ориентироваться на отзывы, оставленные пользователями на тематических форумах, для перевода голоса в текст самыми лучшими являются следующие программы:
- MSpeech;
- Dictate;
- Speechpad;
- VoiceNote II;
- Speak a Message;
- Voco
Каждая указанная программа для набора и редактирования текста голосом может использоваться на ПК в сочетании с любым микрофоном. Но для повышения качества распознавания звука рекомендуется использовать конденсаторные, при этом полностью отключая шумоподавление (если имеется) и прочие надстройки для обработки голоса (через настройки драйвера звуковой карты).
MSpeech
Программа для ввода текста голосом, в качестве движка используется Google API (считается самым эффективным в плане преобразования речи в текст). Главное преимущество: распознавание на более чем 50 языках, регулярно добавляется поддержка новых. Дополнительные функции:
- поддержка голосовых команд (например, команды «старт», «стоп», «удалить»);
- коррекция текста («логика» выстраивается на основе того же Google API), который позволяет быстро заменять повторяющиеся слова синонимами;
- можно выбирать другие движки преобразования голоса (например, Microsoft Bing);
- предусмотрена синхронизация вводимых заметок с сервисами облачного хранения данных (Google Disk).
Приложение бесплатное, позволяет набирать неограниченное количество символов, но для своей работы требует наличия постоянного подключения к интернету. При этом потребляет достаточно большое количество трафика (от 1 до 5 мегабайт в минуту), а при включении синхронизации с Google Disk – и того больше.
Dictate
Преобразователь голоса в текст от компании Microsoft. Выпускается в форме дополнения для текстового редактора Word. Программа бесплатная, но требует наличие активированной лицензии для Microsoft Office. Сам плагин скачивается с официального сайта Майкрософт, устанавливается как обычное приложение. Набор заметок голосом выполняется в Word, Outlook или PowerPoint. Дополнительные функции:
- преобразование текста на компьютере на более чем 60 языков;
- автоматическое редактирование начитанных предложений (удаление ошибок, расстановка пунктуационных знаков);
- распознавание надиктованных формул (пока что тестируется, часто срабатывает некорректно).
Разработчики утверждают, что Dictate, помимо распознавания текста, умеет самообучаться. Программа учитывает специфику фонетики конкретного пользователя, поэтому при частом её использовании точность ввода увеличивается. Но для её работы тоже требуется наличие постоянного доступа в интернет (без него тоже работает, но распознаёт некорректно). После установки приложения в Microsoft Word появляется дополнительная вкладка «Dictate» – там как раз и производится работа с транскрипцией звукового ввода. Работает только в Виндовс, в облачной версии Microsoft Office функция недоступна (но в скором времени обещают добавить).
Speechpad
Плагин для браузера Google Chrome (есть способ установки для всех браузеров на движке Chromium) для записи голоса и его последующего преобразования в заметку. Голосовой ввод текста выполняется с использованием Google API, поэтому функция доступна только при активном подключении к интернету. Сервис поддерживает сохранение всех ранее введённых текстовых заметок, их экспорт в Гугл Документы.
За счёт того, что это не отдельная программа, а надстройка для браузера, использовать её можно не только в среде Windows, но и в Linux-дистрибутивах, MacOS. При этом Speechpad печатает текст не только из речи в реальном времени, но и умеет его распознавать в аудиофайлах, видео (используя звуковую дорожку). Преобразование довольно точное, но вот с пунктуационными знаками часто возникают неточности, поэтому без последующего редактирования не обойтись.
VoiceNote II
Очередная программа для написания текста голосом. Тоже использует Google API, но выпускается и как расширение для браузера Google Chrome, и как отдельная программа для Windows. При работе требует наличия активного подключения к интернету. Из дополнительных функций стоит упомянуть:
- интеграция собственных словарей пользователя (для слов, которые изначально распознаются неверно);
- настройка микрофона (громкость, частота дискретизации, можно также выбрать другое звукозаписывающее устройство);
- есть функция, когда записывающийся текст сразу же переводится на другой язык (всего поддерживается более 150 языков, в том числе и региональные диалекты).
Единственный недостаток Voice Note II – это то, что преобразующий текст в окне программы нельзя редактировать. Можно только скопировать в тот же блокнот или Microsoft Word.
Speak а Message
Программа использует собственный API, переводящий голос в текст на английском, немецком, французском или испанском языке. Русский тоже распознаёт, но только если включить в настройках «облачный перевод» и указать, какой именно API будет использоваться (корректней всего получается с Yahoo, если верить отзывам пользователей). В целом, точность распознавания голоса в данной программе средняя, но зато начитанный текст можно сразу отредактировать вручную и отправить в очередь печати (на физический или виртуальный принтер).
Разработчики утверждают, что приложение лучше всего подходит для записи подкастов с одновременным просмотром презентаций (для этого предусмотрен показ слайдов из картинок или презентации Power Point). И при голосовом вводе в отдельные файлы также сохраняется само аудио.
Voco
Программа использует собственные словари, поэтому при работе не требуется подключение к интернету. Но она является платной, выпускается в нескольких редакциях. Например, в Voco Professional поддерживаются голосовые команды, ввод знаков пунктуации. А Voco Enterprise оптимизирована для использования студентами и преподавателями: добавлены словари со сложными терминами, диктовка тематических формул. Дополнительные функции:
- программа умеет печатать документы, созданные из заметок (сразу отправляя на принтер готовую страницу);
- поддерживается автозамена любых произнесённых слов на указанные знаки, целые словосочетания;
- поддерживается написание сложных формул (но потребуется провести «обучение» программы);
- преобразование звукового файла в текст.
По качеству распознавания голоса не уступает Google API, но работает только на Windows 7 и выше. И приобретаемая лицензия – временная (есть и постоянная, но стоит недёшево).
Итак, голосовой ввод сегодня хоть и нельзя назвать идеально работающим, но он есть, и разработчиками алгоритмы распознавания текста постоянно модернизируются. Ещё лет 10 назад о таком функционале можно было лишь мечтать, сегодня же тот же Google с точностью в 80–90% правильно распознаёт вводимый голосом текст.