研究所紹介  

   

活動  

   

情報発信  

   

あいんしゅたいんページ  

   

フェイクニュースとGPT-2

詳細

今回は人工知能業界で2019年に、大きな話題になった、OpenAIという研究組織の作ったGPT-2という言語処理システムについて述べる。GPT-2はネットに存在する膨大な文章データを読み込んで学習した人工知能で、人間がなにか適当な文章を与えてやると、その続きを書くのだ。何がすごいかと言うと、このようにして人工知能が書いた文章は、非常にもっともらしく、人間が書いた文章とほとんど区別がつかない。詳細に見れば、アラも見つけられるだろうが、大体、人間の書いた文章だって、けっこうアラだらけなのだ。大部分の普通の人は、そもそも文章を書かないだろう。その意味でもGPT-2は普通の人間の能力を大きく超えているといえる。

フェイクニュース

人工知能業界で大きな話題になったのは、OpenAIがGPT-2が悪用されることを恐れて、コードを全部は公開しないし、学習済みデータも、もっとも価値のある最大のデータベースは公開しないことに決めたことだ。2019年3月の研究会で発表された。なぜこのシステムが危険かと言うと、フェイクニュースをいくらでも作れるからであるという。

昨今、米国ではフェイクニュースが大きな問題になっていて、政治までも動かしかねない。例えばトランプがヒラリーに勝ったのもフェイクニュースが大きな役割を果たしたと言われている。フェイクニュースを作るのは、旧東欧圏のお金のない若者たちが、金をもらってやっているらしい。GPT-2が自由に使えるようになれば、なにも人を雇わずとも、きわめて安価にフェイクニュースを作って政治をゆがめることができる。そういった批判がトランプ陣営の対立陣営から出ている。

OpenAIとイーロン・マスク

OpenAIの決定の意味することは大きく、米国では人工知能関係者を中心に炎上している。そもそもOpenAIという組織は、その名前からも分かるように、人工知能の開発を秘密裏にではなくオープンに公開してやりましょうという趣旨で作られた団体なのだ。だからOpenAIがオープンではなく、研究をクローズして公開しないといったから大騒ぎになったわけだ。

OpenAIを作るという構想はあのイーロン・マスクから出ている。イーロン・マスクは電気自動車で有名なテスラモーターズのCEOであり、火星へ人間を植民させるためのスペースX社を作った人物でもある。彼は人工知能について非常に危険視していてAIが人類を滅亡させるとまでいっている。

私はこの言葉を文字どおりには信じない。なぜならイーロン・マスクはさまざまな人工知能の会社に投資しているし、そもそもテスラの電気自動車だって人工知能の塊だ。つまり人工知能を進歩させることで彼は儲かるのである。

そこでそのような批判に対するためかどうか、彼は人工知能の安全性を確保するには研究はオープンにやらなければならないと主張してOpenAIを立ち上げたのだ。OpenAIは非営利の組織である。大学や公的研究機関ではないし、営利企業でもない。資金は寄付でまかなわれていて、イーロン・マスクは多額の寄付をしている。OpenAIは多額の給料を出してAIのスター研究者をやとった。その研究成果の一つがGPT-2なのである。

GPT-2の仕組み

GPT-2はどのような仕組みで働くのだろうか。それは教師なし学習という機械学習の1分野である。機械学習は人工知能の一分野であるが、現状で人工知能と言うと機械学習のことをさす場合がおおい。機械学習には教師あり学習、教師なし学習、強化学習がある。よく知られている画像認識は教師あり学習である。アルファ碁は強化学習である。それに対して教師なし学習は、教師あり学習とはちがって学習するものの正解を教えられない。また強化学習のように報酬というご褒美を与えられない。ただ膨大なデータを与えられて、そのなかの構造を発見するのである。

GPT-2はネットにある膨大な英語の文献をよむ。そして単語と単語のつながりを学習する。だからGPT-2の実演でなにか適当な文章を与えられたら、その続きはどんな単語から始まる可能性が高いか、さらにその次の単語はどんなものの可能性が高いかを、先の単語を元に確率をいちいち計算して文章にする。

GPT-2の作る文章

具体例は全部英語なので翻訳するとニュアンスは失われるが、たとえばこんな具合だ。

「すばやい茶色の狐が怠け者の犬を飛び越えた(The quick brown fox jumps over the lazy dog)」

この文章だけを与えると、GPT-2は話の続きを創作する。

『この犬は怠け者だ。「それが、なにがすばらしいのだ?」と僕は尋ねた。するとすばやい茶色の狐は笑い、犬は自分の唇をなめた。「分からん。しかし君は知る必要はない。なぜなら君が・・・」「分かってるよ」と僕は言った』

別の例だ。

「これはブーと言う名前の犬の話だ」

その続きはこうだ。

「ご存知のようにブーはラブラドルで、なによりも人間が好きなんだ。一年ほど前にブーはバージニア州のアーリントン救助犬の一員になったのだ。ブーが捨てられたときは子犬で、今は2歳だ。ブーの話は心温まるものだ」

どうだろうか。最も簡単なGPT-2モデルでこれだから、最大級のデータを与えられたGPT-2の書く作り話は、本物と区別がつかない。

物書きの失業

現在はまだ人工知能はプロの書き手にはかなわない。しかし一般の人はそもそも文章など書かないのだから、この人工知能は大部分の人の作文能力を超えている。あと10年もすれば、どんなものになるか?プロの書き手の能力を超えるだろう。

ここでプロの書き手と言った。プロの書き手として皆さんが想像するのは、小説家や新聞記者、雑誌記者、ブロガーなどだろう。しかし私のような学者も実は文章を書くことで生計を立てているともいえる。つまり論文や解説、本を書くのが仕事である。研究者の一番重要な仕事は論文を書くこと、つまり文章作成なのだ。人工知能が完全な文章を書くようになったら、我々には脅威なのか、それと楽をできるので恵みなのか?

まとめ

OpenAIの文書作成AIであるGPT-2が、偽の文章を多量に生成できるようになった。OpenAIはそのプログラムとデータを公開しないことに決めた。フェイクニュース作成に使われるからである。しかしOpenAIのモットーはオープンなのだから公開しないと言う決定は大きな反響を生んだ。まだ今のところはその文章は完全ではない。しかし今後10年もすれば、ほとんどの文章はAIが書くようになるだろう。そのときに我々はどうなるのだろうか?

   
© NPO法人 知的人材ネットワーク・あいんしゅたいん (JEin). All Rights Reserved