研究所紹介  

   

活動  

   

情報発信  

   

あいんしゅたいんページ  

   

スマート(AI)スピーカーと仮想アシスタント

詳細

現在、多くの人がPCやスマホではキーボード入力を利用しているが、音声入力が便利である。そのインターフェイスとなるのがSiriのような仮想アシスタントである。またその機能を単体として取り出したのがスマート(AI)スピーカーとよばれるものだ。これらを使って、インターネットを介して音楽鑑賞や調べ物、買い物といったサービスを利用できる。では、仮想アシスタントの利便性はどんなところにあるのか? また今後どのようになっていくのだろうか?

仮想アシスタントの始まり アップルSiri

仮想アシスタントの嚆矢はなんといってもアップルのSiriであろう。もともとはアメリカ国防高等研究局(DARPA)が戦場で兵士をサポートする人工知能システムとして開発をSiri社に委託した。その会社を2010年にアップルが買収した。アップル社は2011年にスマホのiPhone 4Sに初めて搭載した。当初は英語、ドイツ語、フランス語のみの対応であった。

しかし2012年になって日本語に対応した。私も早速導入して色々試してみた。私は英語でも会話を試みたが、私の発音を認識してくれなかった。例えば「結婚してください(Will you marry me?)」というと「マリーはトルクメニスタンの都市で・・・」という返事が返ってきた。どうもマリー(結婚)の発音が悪いらしい。そこで友人の奥さん(米国人)に頼むと、ちゃんと反応した。「ミャリー」みたいな発音をしないといけないらしい。仕方ないから、英語は諦めて日本語で会話することにした。家人に見せびらかしていると、いきなりSiriは「XXXに電話します」とか言い出してびっくりした。大慌てで制止したが、電話をかけられた方もびっくりするだろう。

Siriには当初にはさまざまな都市伝説が生まれた。例えば有名な話として、米国人が死体の隠し場所を聞くと、適切な場所を教えてくれるという話があった。私もさっそく聞いてみたのだが「そのサービスは日本ではやっていません」だとさ。2014-2015年には「Hey Siri」で自動起動するようになったのだが、雑音を誤解して勝手に起動してしまう事件があいついだという。

アップルの成功を受けて、グーグルはグーグル・アシスタント、マイクロソフトはコルタナを導入した。

映画の仮想アシスタント

映画に出てくる仮想アシスタントとして私が思い出すのは「アイアンマン」の仮想執事のジャービスである。主人公が自宅でくつろいでいる時にジャービスに話しかけると、適切な返事を返してくれる。これはスマホではないから、あとで述べるスマートスピーカーに相当する。

以前の回で紹介した映画「her世界で一つの彼女」にでてくるサマンサはSiriと似た仮想アシスタントである。主人公のセオドアがサマンサに恋をしてしまい、サマンサもセオドアに恋をしたので、これは仮想アシスタントというよりはもはや仮想愛人である。なぜ恋人でなく愛人かというと、セオドアは当時まだ妻と離婚していなかったからだ。めでたく妻と離婚して、さあサマンサと楽しもうとおもったら、サマンサはたくさんの男と同時に浮気をしていることがわかり、また最後にはセオドアを置いて、どこかに行ってしまった。踏んだり蹴ったりである。現状のSiriはサマンサほど賢くないので、だれもSiriに恋をすることはないであろう。もっと賢くなり、汎用人工知能が搭載されたら、その時は分からない。

どんなAIスピーカーがあるのか?

有名なものとしてはアマゾンのエコー、グーグルホーム、アップルのホームポッドがある。その他にもあるがよくは知らない。そもそもアップルのホームポッドは日本未発売なので、検討の対象にならない。私はアマゾンのエコーとグーグルホームを比較対象にした。

私が検討した時点で友人がエコーを持っていたので、テストすることができた。友人のエコーはエコードットという安い方の製品であった(5,980円)。もっとも彼が買った時点では3,000円であったそうだ。それならそっちを買うだろう。ネットの評価では応答機能は同程度だが、スピーカーの音質はエコーの高い方のモデル(11,980円)が大きさが大きい分良いという。私はこれでエコーを買うことに決めた。ちなみにグーグルホームは大きい方が9,800円でミニの方が4,000円だという。値段にこだわる人は当然グーグルミニが第一の候補になるだろう。

アマゾンエコーの使用感 

2018年3月に注文してすぐに届いた。設定は簡単で、電源に繋いで、iPhoneにアプリをダウンロードしてWiFiにつなぐだけである。そんなに面倒ではない。つなぐとすぐに反応した。使い方は最初に「アレクサ」と呼びかけて、あとは色々命令するだけである。私はそんなに色々試してはいない。よく聞くのは時間、天気である。目覚ましを頼むこともある。

音楽も時々鳴らす。タダの音楽と有料のものがある。これこれの音楽を聴かせてというと、タダの場合はすぐになるが、有料の場合は最初xxに入れとか勧誘がうるさい。

音質はそれなりである。もっとも音質にこだわる場合は、外部スピーカーに接続すれば良い。家電制御ができる製品もあるが、それには興味はない。なにもかも機械任せにすると、調子が悪くなった時に困るからだ。

ときどきびっくりすることがあるのは、YouTubeを見ていると、その音声に反応して勝手に喋り出すことだ。ある時など〇〇を注文しましょうかと言ったので、慌ててやめさせた。これは怖い。アメリカでは子供が勝手に商品を発注して問題化したことがあるとか。

電源が入っている限り、当然ではあるが家族の会話を全部聞いているのである。アマゾンが盗聴しているとは思わないが、その気になればできる設定だ。もしエコーがハックされたら、会話がダダ漏れになる。今、スパイもののアメリカ映画を観ているが、なんでもハックされてしまう。今後はそんな問題も発生するのではないだろうか。

まとめ

結局、現状のAIスピーカーは確かに多少便利だが、なければならないほどのものではない。しかし、今後搭載されているAIがもっと賢くなり、セオドアがサマンサに恋をしたように、心理的に頼ってしまうようになるかもしれない。それは危険かもしれないし、孤独な人にとっては家族の代わりになるかもしれない。その程度に賢くなるのは、多分今後5-10年のことであろう。

   
© NPO法人 知的人材ネットワーク・あいんしゅたいん (JEin). All Rights Reserved