音声認識をする
- こちらからモジュールとフローをダウンロードして、[PBX] > [フローデザイナー]画面でインポートしてください。[ASR example] > [example_google]というフローがサンプルとなります。
- 「stt google」モジュール、「stt result」モジュールの各プロパティを設定してください。
[stt google]項目名 デフォルト 説明 サービスアカウントキー
(ノート)サービスアカウントキーを設定しているノート名
未設定の場合は、PBXの設定を使用。バージョン デフォルト 音声認識APIバージョン
(デフォルト/v1/v1p1beta1/v2)
デフォルトを設定した場合は、PBXの設定を使用。認識ツール 使用する認識ツール。
v2を使用する場合は以下のフォーマットで設定。<プロジェクトID>はGoogleコンソールでプロジェクトの詳細を確認。
“projects/<プロジェクトID>/locations/global/recognizers/_”
未設定の場合は、PBXの設定を使用。言語 デフォルト 音声認識言語
(デフォルト/日本語/英語(アメリカ))
“デフォルト”を設定した場合は、PBXの設定を使用。モデル 音声認識モデル
モデル名は以下を参照
未設定の場合は、PBXの設定を使用。フレーズセット 音声認識に使用するフレーズセット
使用する場合は以下のフォーマットで設定。<フレーズセット名>はGoogleコンソールで登録したフレーズセット名。
“projects/<プロジェクトID>/locations/global/phraseSets/<フレーズセット名>”
未設定の場合は、PBXの設定を使用。認識結果のパターン
グループのみ取得Yes 基本デフォルト設定のまま変更は不要。 タイムアウト(ms) 30000 音声認識のタイムアウト時間(ms)
音声認識を開始してから本時間が経過すると音声認識を終了する。延長タイムアウト(ms) 0 音声認識のタイムアウトの延長時間(ms)
音声認識開始後に音声認識がされるとタイムアウト時間が本時間分延長される。認識結果パターン 期待する音声認識結果のパターン
正規表現で設定する。
音声認識結果がパターンに一致した場合は音声認識を終了する。無音検知時間(ms) 0 音声認識されてから無音を検知する時間(ms)
“0”を設定した場合は無音検知を行わない。
無音を検知すると音声認識を終了し、音声認識結果は直前の音声認識結果となる。認識フラグ 音声開始を認識(音声開始前から) 基本デフォルト設定のまま変更は不要。 [stt result]
項目名 デフォルト 説明 音声認識モジュール 結果を判定する音声認識モジュール名 タイムアウト(ms) 30000 音声認識結果を待つタイムアウト時間(ms)
[音声認識モジュール]で設定したモジュールから設定時間内に音声認識結果が取得できないとモジュール結果は”TIMEOUT”となる。
※[音声認識モジュール]の”タイムアウト(ms)”より長くする必要がある。 - あ
