Используем Google Speech API в своих программах- Delphi
[Ссылки могут видеть только зарегистрированные пользователи. ]
Всем нам хорошо известно о том, что в гугл хроме появилась возможность набора текста голосом. В данной теме я покажу как это можно использовать в своих программах.
Распознавание происходит в несколько этапов :
1. Запись звука в формате FLAC
2. Отправка данных в гугл
3. Расшифровка принятых данных
И так , все по порядку.
1. Запись звука в формате FLAC. Для этого есть компонент New Audio . О нем я напомню чуть позже.
2. Отправка данных в гугл . Отправлять файл flac нужно на ссылку
[Ссылки могут видеть только зарегистрированные пользователи. ] .
Для этого можно использовать функцию :
где
Stream — это поток TFileStream в который мы читаем наш записанный файл в формате FLAC.
StrList — это TStringList с ответом от Google.
3. Расшифровка принятых данных
В ответ к нам придет строка примерно такая :
{«status»:0,«id»:«5e34348f2887c7a3cc27dc3695ab4575-1»,«hypotheses»:[{«utterance»:«привет»,«confidence»:0.7581704}]}
Если статус приходит "0" значит запись распознана. utterance — распознанная фраза .
Ну, а далее можно использовать определенную команду по определенному слову. В среднем, у меня уходит на распознавании 2 сек.
Статью написал : Stas971
Источник: [Ссылки могут видеть только зарегистрированные пользователи. ]
Re: Используем Google Speech API в своих программах- Delphi
Цитата:
Зачем прокси
Потому что функция универсальная
Цитата:
CRLF = #$0D + #$0A; ?
По коду не видно, что разделитель?
________________
Принимаются пожертвования любых размеров в фонд поддержки начинающих программистов
Кошельки: WMZ - Z276844220882; WMR - R231028582939; WMU - U394136909210; ЯД - 410011494605270.
Re: Используем Google Speech API в своих программах- Delphi
Цитата:
Сообщение от VeTaL_UA
Потому что функция универсальная
Это не прибавляет ей универсальности.
Цитата:
Сообщение от VeTaL_UA
По коду не видно, что разделитель?
Разделитель можно нормально оформить и дать нормальное название переменной... а не CRLF (которому сотни расшифровок, например: Common Runtime Language Finded)
Последний раз редактировалось Sinyss; 05.01.2014 в 02:39.
[Ссылки могут видеть только зарегистрированные пользователи. ]
________________
Принимаются пожертвования любых размеров в фонд поддержки начинающих программистов
Кошельки: WMZ - Z276844220882; WMR - R231028582939; WMU - U394136909210; ЯД - 410011494605270.