Перейти к основному содержимому

Результаты распознавания речи

Результаты распознавания речи добавляются в $request.rawRequest. Данные доступны в поле $request.rawRequest.data.

Пример:

{
"cause": "OK",
"text": "Как дела?"
}

Здесь:

  • cause — результат распознавания. Возможные значения:
    • "OK" — речь была успешно распознана.
    • "NO_INPUT" — не удалось распознать речь.
  • text — текст речи пользователя. Поле присутствует, если cause имеет значение "OK".

Данные о запросе пользователя

Результаты также могут содержать дополнительные данные о запросе пользователя, полученные от провайдера ASR. Данные доступны для следующих провайдеров:

  • 3iTech
  • SaluteSpeech
  • Tinkoff VoiceKit
  • Yandex SpeechKit v2
  • Yandex SpeechKit v3

Например, вы можете получить:

  • Гипотезы о поле пользователя в Tinkoff Voicekit.
  • Показатель вероятности, что вместо пользователя говорит автоответчик, в Yandex SpeechKit v3.
  • Эмоции пользователя в SaluteSpeech.

Данные доступны в поле $request.rawRequest.data.propertiesResponse. Пример:

{
"result": {
"recognition_result": {
"start_time": "0.510s",
"end_time": "2.550s",
"gender_identification_result": {
"male_proba": 0.991876,
"female_proba": 0.008123994
}
},
"is_final": true
}
}

Поддерживаемые поля

Поддерживается ограниченный список полей:

В $request.rawRequest.data.propertiesResponse.results доступны поля:

  • chunks:
    • alternatives:

      • text
      • confidence
    • final

    • endOfUtterance

В документации Yandex SpeechKit v2 вы можете посмотреть описание этих полей и узнать об условиях, при которых они добавляются.

предупреждение
  • Некоторые данные добавляются, только если установлены дополнительные настройки для провайдера ASR. Чтобы указать настройки, используйте метод $dialer.setAsrProperty.
  • Если вы хотите использовать данные, которые сейчас не поддерживаются в $request.rawRequest, напишите в поддержку: support@just-ai.com.