研究所紹介  

   

活動  

   

情報発信  

   

あいんしゅたいんページ  

   

アルファ・スターの衝撃

詳細

今回は英国のロンドンにある人工知能会社ディープマインド社の開発した新しい人工知能ソフトであるアルファ・スターの話をする。これは世間ではあまり大きなニュースにはなっていないが、人工知能開発の歴史において画期的な出来事だと思う。

順を追って説明する。まずディープマインド社である。この会社は2010年にロンドンでデミス・ハッサビスたちにより設立された、人工知能ソフトを開発する会社である。その可能性に注目したアメリカの巨大IT企業であるグーグルが2014年に500億円といわれる巨額の金額で買収した。その時点でディープマインド社にはめぼしい製品は何もなかった。多分グーグルはデミス・ハサビスの天才性にかけたのであろう。その先見的な目論見は成功した。

ディープマインドを一躍有名にしたのはアルファ碁であろう。その話は「アルファ碁の衝撃」と題して以前に書いた。アルファ碁は囲碁用の人工知能ソフトで、2016年3月に韓国のチャンピオンであるイ・セドル9段に4対1で圧勝した。その後、2017年には中国の柯潔(かけつ)9段にも圧勝して、もはや人間で対抗できるものは誰もいなくなった。アルファ碁はその後アルファ碁ゼロに進化して、人間の棋譜を一切参考することなく、アルファ碁に圧勝した。さらにアルファゼロに進化して、囲碁だけでなく将棋、チェスもできるようになり、最強の人工知能ソフトに対して圧勝した。だから囲碁、将棋、チェスというボードゲームでは、人間はもはや人工知能に絶対に勝てない。

さて人工知能は大きく分けて特化型人工知能と汎用人工知能に分類できる。特化型とは特定のことしかできない人工知能である。例えば囲碁だけとか、株取引だけとかといった特定目的の人工知能である。現状の人工知能はすべて特化型人工知能である。

一方、汎用人工知能とは人間のように一応はなんでもできる人工知能である。常識を備えた人工知能である。実はこれはまだできていない概念だけの存在だ。某社は自社の製品を汎用人工知能と言っているが、過大広告である。

特化型人工知能は特定目的において人間を圧倒するが、全てにおいて人間を超えたということにはならない。例えば車は走る速さで人間を超えているが、だから車が人間を完全に超えたという人はいないだろう。そのようなものだ。

しかし映画「ブレードランナー」に登場する人間そっくりなレプリカントのようなロボットができたら、それは人間を超えたと言えるだろう。それが汎用人工知能だ。

別に人間そっくりである必要はなく、例えば映画「2001年宇宙の旅」に出てくる人工知能HAL9000も形はないが、ある意味では人間を超えている汎用人工知能である。もっとも映画では最終的には人間であるボーマン船長がHALとの戦いに勝ったのだが。

汎用人工知能の開発は人工知能研究において最大、最終的な目的であると私は思う。私自身、汎用人工知能を開発したいと考えて勉強しているが、道は遠い。

ディープマインド社のミッションは汎用人工知能を開発することである。デミス・ハッサビスはディープマインド社のミッションを次の二つにまとめる。1)知能を解明すること、2)その知識を用いてあらゆる問題を解明すること。あらゆる問題とは例えば宇宙誕生の謎とか、生命の秘密といった科学的な問題や、それを応用した技術である。つまり科学技術の研究を人工知能自体にやらせるか、あるいは人間の知能を増強して科学研究をするのだ。このような人工知能を私は超知能とよび、それを用いて行う科学を人工知能駆動型科学という。

汎用人工知能ができれば世界は変わる。これは私の信念である。ハッサビスも同じことを考えている。ハッサビスはこの計画を「知のアポロ計画」と呼んでいる。

つぎにアルファ・スターを具体的に説明していきたい。アルファ・スターはスタークラフト2というコンピュータゲームを攻略する人工知能である。スタークラフトとは二人の対戦者がコンピュータ上で対戦するゲームで、お互いが自分の基地を作り、資源を採集して相手を撃破するゲームである。信長の野望に少し似ているが、違いはリアルタイムゲームであることだ。だからプレヤーは素早く判断して戦略、戦術を決定しなければならない。実際、プレヤーはキーボードとマウスを目にも留まらぬ速さで動かしながらゲームを進めていく。そこがアルファ碁とは違う。アルファ碁にも時間制限はあるが速さを競うものではない。

ディープマインド社はアルファ碁の成功の後、つぎの目標をスタークラフト2の攻略に絞った。なぜゲームなのか? それは、ゲームは実際の人間社会と近いけれども、ゲームでは目標とルールがはっきり決まっているのでコンピュータ化しやすいからだ。例えば実際の人生で、目標は幸福になることとしよう。しかしなにが幸福なのかははっきりしていない。最も金を稼げばそれが幸福であると定義すれば、目標は明確になる。しかし大金持ちになったからといって幸福とは限らないだろう。幸福とは人により異なるだろうからだ。しかし実際の人間社会に応用する第一歩としてコンピュータゲームを選ぶのは理にかなっている。

囲碁とか将棋、チェスは高度に知的なゲームであるが、完全情報、ゼロサムゲームである。完全情報とは、盤面にあらゆる情報が明示されていて、隠れている情報はないということだ。それに対して麻雀やポーカーは不完全情報ゲームである。不完全情報ゲームの方が難しいことは予想できるであろう。その意味で囲碁に勝つ人工知能を作るよりもスタークラフトに勝つ方が難しいのである。ちなみにゼロサムゲームとは一方の得は他方の損ということである。

2016年にアルファ碁がイ・セドル9段に圧勝した時に、ディープマインド社はつぎの目標をスタークラフト2で人間に勝つことに決めた。実はフェイスブックも同じ目標を掲げていた。面白いことは囲碁でもフェイスブックは人間に勝つ人工知能を開発することを宣言していたのだ。つまりどちらの場合もフェイスブックはディープマインドに敗れたのだ。

スタークラフトを作っている会社はディープマインドに全面的に協力することにした。本来は人間対人間のゲームなのであるが、コンピュータでもできるように多少の変更を加えたのである。2016年にプロジェクトがスタートした段階では、スタークラフトで人工知能が人間に勝つには後5年は必要であろうと見積もられていた。つまり2021年頃である。ところが2019年1月24日に目標は一応達成された。この進歩の速さはすごい。

ただ今回の人工知能の勝利は圧倒的とは言えない。スタークラフトのプロプレヤー2人と対戦して、いずれも5:0で勝ったのだが、もう一度だけやって今度は人間が勝ったのだ。しかもプレヤーは世界ランキングで上位ではあるものの、トップというわけではない。つまり今回の勝利は通過点に過ぎない。それでも、これまでの圧倒的な進歩の速さを見せつけられてきた私としては、人工知能が人間に圧勝するのも時間の問題に過ぎないと思う。

ところでゲームのプロプレヤーとは何なのだろうか。そんなものが職業として成り立つのか? しかしそれを言えば、囲碁、将棋、ゴルフなど、いわば遊びが職業になっている。それはスポンサー会社が賞金を出すからである。

まとめ

ディープマインドの人工知能ソフトであるアルファ・スターが、スタークラフト2というコンピュータゲームで人間のプロ2人を相手にして、2019年1月24に11勝1敗で勝った。これは汎用人工知能開発という大きな目標の一里塚である。私の予想では後10年、つまり2029年にはほとんどの分野で人工知能は人間を超えているだろう。

   
© NPO法人 知的人材ネットワーク・あいんしゅたいん (JEin). All Rights Reserved