4分で読めます
| ニュース
ジョブズ氏の発言(アイザックソン、830ページ)は、フェルマーの最終定理の比喩に匹敵するほどの影響力を持つようになった。つまり、ジョブズ氏(とフェルマー)が解を持っていたと誰もが信じているが、それが何なのか誰も解明できなかったということだ。
テレビ業界は、先見の明も研究も、原理原則の明確な理解も示さずに、音声入力こそがジョブズ氏が言及した聖杯だと決めつけ、AppleのHDTVという悪魔に先手を打つために、自社のテレビに音声入力を導入すべきだと性急に推測しているようだ。あるいは、Kinect風のジェスチャー入力もそうだ。これが世間の常識だ。

人間工学
私自身もその流れに乗る前に、歴史、テレビを見るという人間の体験、そして現代のテレビシステムに人々がなぜ問題を抱えているのかという観点から考えてみる傾向があります。問題はいくつかあります。
入力の選択
私が読んだ本や他の人と話したことから判断すると、現代の HDTV システムを使用するユーザーが抱える最大の問題は、圧倒的に入力ソースの選択です。多くの人は、AV レシーバー、またはテレビに複数のデバイスを接続しています。Blu-ray プレーヤー、Apple TV または Roku ボックス、そしておそらくケーブル/衛星放送のボックス、場合によっては DVR などです。目的の番組を視聴するには、どの入力を使用するかを理解し、適切なリモコンを選択し (Logitech Harmony を使用していない場合は)、適切なボタンを押して入力を切り替え (または選択)、視覚的に適切な入力ソースであると判断できるまで操作する必要があります。さらに悪いことに、ボタンに謎めいたラベルが付いていて見つけにくい場合があります。これは、技術に詳しくない人、特にシステムのセットアップに参加したことがなく、何が起こっているのか理解していない人をイライラさせるプロセスです。
興味深いアイテム
スティーブ・ジョブズは、音楽ファンはレーベルや彼らが制作するアルバムには興味がないことを理解していました。音楽ファンが興味を持つのは楽曲です。この理解をテレビ視聴者に当てはめてみると、人々が注目するのは番組であることは容易に理解できます。
スタジオ <=> レーベル ネットワーク <=> アルバム ショー <=> 曲
テレビを見たい気分の時に人々が探すのは、スタジオやネットワークではありません。しかし、それは頼みの綱になるかもしれません。「Justified」はFXで放送されていることはご存知でしょう。FXはDIRECTVのチャンネル248です。ですから、指定された時間にチャンネル248にチューニングすれば、その番組を再び見ることができます。(あるいはDVRをセットすればいいのです。)
多くの人が、興味のある番組なら、音声で番組名をアナウンスするだけでテレビシステムが番組を探してくれるだろうと考えがちです。しかし、微妙な違いもあります。どのエピソード?最新話?先週の?前シーズンの最終回の再放送?見たい番組を正確に認識するには、音声入力システムに慎重に言葉で伝える必要があります。これは、人間にとってもコンピューターにとっても、依然として難しいプロセスです。
アーティキュレーション
最後の問題、つまり思慮深い表現について触れておきたいと思います。ある技術が問題に適用できるからといって、それが最善の解決策であるとは限りません。正確で話者に依存しない音声認識は比較的新しい技術であり、人間同士のインタラクションについて十分な研究がされていません。それなのに、テレビメーカーは急いで開発を進めています。
歴史的に、テレビの視聴方法は「見て、やってみる」というものでした。昔は、スタートレックを見たいと思ったら、NBCで放送されていることを念頭に置き、例えばチャンネル4に合わせました。ダイヤルがチャンネル4になっているのが分かります。このコンセプトは、ケーブルテレビの登場、チャンネルの多様化、リモコンの進化など、長年にわたり進化してきましたが、それでもなお「見て、やってみる」という考え方に基づいています。
音声入力には「考えてから発音する」という作業が必要です。テレビシステムの機能に合った正しい考えをまとめ、適切なコマンドを発音しなければなりません。あるいは、正しいジェスチャーをしなければなりません。特に子供が多く、騒がしい家庭や、掃除機のようなバックグラウンドノイズのある家庭、あるいはスポーツバーなどでは、これは面倒で難しい作業になるのではないかと思います。
少なくとも、リモコンを物理的に所有している時は、自分が主導権を握っている。これは、対処が必要なヒューマンファクターの問題の一つに過ぎないと思う。広範な研究の裏付けがないまま、大きな技術的変化が起こっている。そして、コスト削減と熾烈なテレビ競争の時代において、ヒューマンファクター研究にどれだけの資金が費やされているかは、私たちも知っている。
前進への道
適切な入力を選択するという問題は、ユーザーをApple HDTVの領域に限定すれば簡単に解決できます。つまり、他の入力を使わずに顧客が望むものをすべて提供できれば、入力の問題は解決します。多くの人がケーブルテレビからの解約を切望しています。しかし、問題は残ります。DVDコレクションを捨てる人は多くなく、プレーヤーはそのまま使い続けたいと思うでしょう。私が最後に調べたところによると、ComcastはBasic Cable(「バンドル」)を解約するとインターネット速度を低下させます。つまり、希望する入力を選択する手段が依然として必要です。Apple HDTVに追加のHDMI入力が全くない限りは。おそらく無理でしょう。
Siriは小型で、小さな仮想キーボードを備えたデバイス向けに設計されています。音声入力は理にかなっています。しかし、60インチの巨大な画面では、iPhoneではできないことがたくさんあります。環境も異なります。テレビに近づき、目的の入力が表示されている「ウィンドウ」をタッチし、見たい番組やエピソードが表示されるまでスワイプする方が合理的かもしれません。あるいは、iPad/iPhoneをお持ちであれば、そちらでも同じように操作できます。音声入力は、厳密に制限されたオプションであり、必須ではありません。
Apple が HDTV を開発するなら、それは Apple のあらゆる技術の思慮深い副産物となり、人間の性質と人間工学を理解したものとなり、イライラさせるものではなく、楽しいものになることを保証します。
私が言いたいのは、テレビの技術は相当に愚かだが、MacやiOSデバイスはかなり賢いということです。課題は、あらゆるニーズを網羅し、テレビ視聴を楽しいものにする、手元にある最良の技術を選択することです。リモコンのオタク的な代替として、音声入力やジェスチャー技術だけに飛びつくのは、家庭用3Dテレビへの軽率な突進に似ています。3Dは今や機能の一つではあっても、テレビ視聴の劇的な変化ではないと考えられているように、音声入力も補助的な機能であり、スティーブ・ジョブズが亡くなる前に残した謎めいた発言への懸念から、急いで発表されるような万能の解決策にはならないと私は考えています。
Apple が HDTV を発売するなら、それは非常に重要な変更であり、非常に大きな挑戦となるため、単に Siri にその問題を解決させて終わりにするのは無理だ。