開発者コンソール

Fire TVにおけるアプリおよびコンテンツの音声対応について

Fire TVにおけるアプリおよびコンテンツの音声対応について

Fire TV Cubeのリリースと、Fire TVへのEchoデバイスのリンク機能により、ユーザーはハンズフリー(「ファーフィールド音声制御」と呼ばれます)でTVを操作できるようになります。ユーザーは、Fire TVでコンテンツの再生・検索、再生の制御、チャンネルの変更をAlexaに音声で依頼できます。Fire TV CubeやペアリングしたEchoデバイスを使用しなくても、Alexa対応音声認識リモコンのマイクボタンを押してFire TVに音声コマンドを発信することが可能です(これを「ニアフィールド」音声制御と呼びます)。

Fire TVで音声操作をサポートするために、アプリの音声対応化がますます重要になっています。アプリの音声対応化技術には、 Video Skills KitMedia Session APIアプリ内音声ナビゲーション・選択があります。

重要な用語

Alexaとの統合により、聞き慣れない用語が新たに増えてきます。次の用語集では、これらの用語の定義について説明します。

Video Skills Kit(VSK)

Fire TVアプリ対応のVideo Skills Kit(VSK)を組み込むと、ユーザーは自然言語のコマンドを使用して、アプリのコンテンツの検索、アプリの起動、メディア再生の制御、チャネルの変更などができるようになります。VSKの実装には、AlexaからのディレクティブをサポートするLambdaの作成、Alexa Client Libraryの統合、ADMによるクラウドからアプリへの通信の処理などが含まれます。Fire TV向けのVSKを実装するには、カタログ統合も必要になります。はじめに、Fire TV対応アプリ用VSK(Video Skills Kit)についてを参照してください。

Fire TV向けのVSKを統合することで、以下の機能が利用可能になります。

  • アプリの起動: ユーザーが特定のコンテンツの再生や検索を依頼すると、Alexaが自動的に適切なFire TV対応アプリを起動します。「アレクサ、<アプリ名>を開いて」と話しかけると、アプリのトップ画面に移動します。ビデオスキルを使用すると、AlexaビデオスキルAPI経由でアプリを自動的に起動できるようになります。
  • クイック再生: 「アレクサ、<番組名>を再生して」または「アレクサ、<アプリ名>で<番組名>見せて」と話しかけるだけで、ビデオを再生することができます。その際、該当コンテンツを含む適切なアプリが開き、Fire TVが自動的に再生を開始します(詳細ページへは移動しません)。
  • 検索: 「アレクサ、<番組名>を探して」と話しかければ、Alexaにコンテンツのユニバーサル検索を依頼できます。 「ユニバーサル検索」では、カタログ統合されているすべてのFire TV対応アプリを対象にコンテンツ検索が行われます。検索範囲を特定のアプリに絞る方法は「ローカル検索」と呼ばれ、 「アレクサ、<アプリ名>で<番組名>を探して」や「アレクサ、<アプリ名>で<ジャンル>を検索して」などと話しかけることで実行することができます。
  • トランスポートコントロール: 「アレクサ、早送りして」「アレクサ、5分早送りして」「アレクサ、次」「アレクサ、前」などの発話を使用すると、再生・巻き戻し・一時停止・再開・終了などの操作を音声で制御することができます。
  • チャンネル変更: ライブTV機能を搭載するアプリの場合、「アレクサ、<アプリ名>に変えて」などの発話を通じてチャンネルを切り替えることができます。

Fire TV対応アプリにVideo Skills Kit(VSK)を統合することで、ユーザーがコンテンツを簡単に見つけて再生できるようになります。

Media Session API

VSKを実装するのに必要な帯域幅やリソースがない場合や、計画された実装が数か月先である場合は、Media Session APIを使用して、アプリのメディア再生コントロールを音声対応化することができます。Media Sessionは、ストリーミングアプリでメディアコマンドを受け取れるようにするAndroid APIです。リモコン、Bluetooth、adb、Fire TVコンパニオンアプリなどからのイベントを処理する際には、これを使用することをお勧めします。

Media Sessionを統合することで、ユーザーはメディア再生で「再生」「一時停止」「巻き戻し」などの音声コマンドを使用できるようになります。これらのコマンドは、ニアフィールドデバイスとファーフィールドデバイスの両方で機能します。Media Sessionでは、Video Skills Kit(VSK)で説明されているような、アプリの起動やコンテンツの検索といった高度な音声制御は実行できません。Media Sessionを組み込むと、再生コントロールを音声対応化できるだけです。

既にMedia Sessionを実装済みであれば、Media Sessionを音声対応化するのに必要な作業はほぼありません。アプリのマニフェストに特別なAlexaパーミッションを追加するだけです。詳細については、 Fire TVにおけるMedia Session APIを使用した音声対応トランスポートコントロールを参照してください。

アプリ内音声ナビゲーション・選択

Fire TV Cube(日本未対応)では、ユーザーがAlexaの一般的な発話を使ってナビゲーションと選択を実行できます。「アプリ内音声ナビゲーション・選択」機能は、D-Padナビゲーションイベントを音声コマンドにマッピングすることで動作します。D-Padは、上下左右のスクロールに使用する、リモコンの方向キーパッドを指します。音声コマンドは、Alexaによって、アプリに送信されるD-Padナビゲーションイベントに変換されます。

Amazonは、アプリで音声コマンドがサポートされることを確認した後に、アプリのバックエンドで「アプリ内音声ナビゲーション・選択」機能を手動で有効にします。Amazonでは、音声でのナビゲーションと選択が可能なアプリを段階的に増やしています。詳細については、アプリ内の音声ナビゲーション・選択を参照してください。


Last updated: 2022年8月18日