Skip to content

音声認識

Windows 10とWindows 11では、Windows音声認識を使用できます。

ダイレクトコールモード

このモードはWindows音声認識モデルを直接呼び出し、より優れたパフォーマンスを発揮し、Windows 10でも使用可能です。

WARNING

Microsoftが新しいバージョンの言語パックの暗号化方式を変更したため、システムにインストールされている言語パックとダウンロードした新しいバージョンの言語パックは直接使用できません。使用するにはこの記事をご参照ください。

Windows 11では、システムにインストールされている言語とその音声認識モデルを直接検出できます。コア設定->その他->音声認識で、認識したい言語を選択し、この機能を有効にすると使用を開始できます。必要な言語がオプションに表示されない場合は、システムに対応する言語をインストールするか、対応する言語の認識モデルを探してソフトウェアディレクトリに解凍してください。

Windows 10では、システムに必要なランタイムおよび認識モデルが不足しています。または、Windows 11のバージョンが低すぎるため、システムに組み込まれているランタイムのバージョンが低くなっています。まず、私がパッケージ化したランタイムと中日英言語認識モデルをダウンロードし、ソフトウェアディレクトリに解凍してください。そうすれば、ソフトウェアは私がパッケージ化したランタイムと認識モデルを認識し、この機能を使用できるようになります。

他の言語の認識モデルが必要な場合は、対応する言語の認識モデルを自分で探すことができます。方法は次のとおりです: https://store.rg-adguard.net/ で、PacakgeFamilyNameを使用してMicrosoftWindows.Speech.{LANGUAGE}.1_cw5n1h2txyewyを検索します。ここで、{LANGUAGE}は必要な言語名です(たとえばフランス語の場合はMicrosoftWindows.Speech.fr-FR.1_cw5n1h2txyewy)。次に、最新バージョンのmsixをダウンロードして、ソフトウェアディレクトリに解凍します。

store.rg-adguard.net

img

インダイレクトリードモード

このモードはLiveCaptionsウィンドウのテキストを読み取ることで間接的に実現され、Windows 11でのみ使用可能です。性能はやや劣りますが、ライセンスやランタイムの互換性問題が発生しません。

Windows 11では、このモードを有効にして切り替えるだけで使用可能です。