嶋原 浩 教授

明日が昨日になるのは何も珍しくはありませんが、ここでいう「明日」はつきなみな「明日」ではありません。それは、グーグル伞下のディープマインド社が开発した囲碁対局用の人工知能「础濒辫丑补骋辞」が、世界トップクラスの実力をもつ韩国のプロ棋士イ?セドル九段との五番胜负に4対1の大差で胜利したという、近顷话题の「例のこと」が起きた日です。
报道でも大きく取り上げられてはいますが、この出来事の「大きさ」に比べれば、まだまだ小さすぎると私には思われます。その理由の第一は、囲碁というゲームのハードルの高さが寻常ではないということ、第二は、その日が「こんなに早く来てしまったこと」です。今回のコラムでは、この出来事のもつ真の意味について考えてみたいと思います。
まず第一の点について。
囲碁では「手を読む力」(论理的思考力)に加えて、独特の「感覚」(直感、感性)が重要视されています。序盘から中盘にかけての局面の优劣の判断は、多くの场合、感覚に頼らざるを得ず、トッププロ同士でも见解が分かれることが少なくありません。このため、局面の优劣を判定するための确定的な「评価関数」を求めることは极めて困难であり、囲碁は対局プログラムの「最后の难関」とみなされてきました。
报道では囲碁は盘が広く、「手の数」が多いからと説明されていますが、これを初手から最后の一手まで読みきることを前提にした説明と解釈したとすれば、それはあまり正しくありません。というのも、チェスや将棋でも、初手から最后の一手まで完全に読みきるということは行われておらず、难易度の违いの説明にはなっていないからです。盘が広いことは、上记のように感覚が必要になることの、原因の一つです。
今回トッププロに胜利した础濒辫丑补骋辞は、この「感覚」を模拟対局を繰り返すという自己学习によって身に付けたそうです[1]。これはまさに人间が、経験によって感覚を研ぎ澄ますのに似ていますが、人工知能は人间よりもはるかに高速にこれを行うことができ[2]、また学习したことを忘れることもありません。おまけに、なぜその手が良い手なのか、人间には理解できないという不気味さです。囲碁の世界に限っていえば、すでに人工知能は人间よりはるかに优れているといえましょう。
囲碁爱好家なら理解してもらえると思いますが、私は囲碁には「人の世の缩図」といった趣があると考えています[3]。それは「読み」の部分ではなく、「感覚」の部分においてです。「人生の缩図」と表现する人もいます。「缩図」、すなわち简単化したモデルにおいてこれだけ有効なら、将来现実の世界でも人间を凌驾する素养は十分にあるに违いありません。これは、映画「ターミネーター」の「厂办测苍别迟」を想起させる出来事です[4]。人类は新しい世界に足を踏み入れつつあると思います。
しかし、私はこの事件をポジティブに受け止めています。「機械 対 人間」の構図でとらえる意見もありますが、私にはむしろ「人類の大勝利」に見えたのです。なぜなら、この人工知能を開発したのは、紛れもなく人類だからです。AlphaGoの開発者はもちろん、人工知能をここまで発展させたすべての科学者?技術者に敬意を表したいと思います。(その基礎には「物理学」があることにも、ここでさりげなく触れておきましょう。)
次に第二の点について。
よく「加速度的な技术革新」という言叶が使われますが、それでもまだ生易しすぎる表现に思われます。というのも、加速度自体がどんどん増加しているように思われるからです。むしろ「指数関数的」というべきでしょう[5]。高校の数学で习うように、指数関数は何度微分しても指数関数になります。つまり加速度も指数関数的に増加しているというわけです。
私はどこにでもいるようなアマチュアの囲碁爱好家ですが、10年ぐらい前には、あと40年ぐらいはコンピューターに自分が负けることはないだろうと思っていました。その推察は、当时の囲碁ソフトとの対局から受けた感触に基づくもので、感覚としては、顺当だったと思います。ところが、この推察は见事に里切られ、一昨年、予想より30年も早く、私は市贩の囲碁ソフト[6]に负けてしまったのです。これは个人的には今回の事件よりも衝撃的なことでした。
そしてまた、その时点でも、「プロ棋士を负かすプログラムが出现するのは、早くみても10年以上は先だろう」と感覚的に思っていました。しかし、今回その予想も见事に里切られてしまったというわけです。
このように、私の感覚に基づいた予想は、ことごとく里切られてしまいました(専门家の予想も里切られたそうですが)。しかし、このことは、人间の头脳は文明社会が出来る以前の时代の、进化の产物であるということを思えば、当然かもしれません。そのような时代では、およそ一定の速度で走る动物や、せいぜい崖から等加速度运动で落下する岩などは目にしていても、加速度自体がどんどん増加するような运动を目にすることは殆どなかったに违いありません。そのような急激な変化を人间が感覚的に理解したり予想したりするのは、生物学的に难しいのではないでしょうか。
そもそも人间が感覚に基づいて物事を予想するときには、大概は、过去の出来事に照らしてみて、経験的に予想するものです。それは単纯に接线を延长するようなことですから、関数でいえば一次関数、図形でいえば直线です。指数関数的な変化を见せる、近顷の技术革新の前には、このような経験的?感覚的な予想は全く无力といえます。
ちなみに、私见ですが、真のブレークスルーは、今年の3月ではなく、昨年10月、础濒辫丑补骋辞があるプロ棋士に胜利した时点ではないかと私は思っています[7]。実は当初、このコラムはそのことをネタに书くつもりでした。実际、(人工知能がトッププロに胜つことが)「明日起きても不思议はない」という予想も书いていたのですが、完成原稿を提出する前に、イ?セドル九段が破れたというニュースが飞び込んできてしまったのです。のんびり书いているうちに、あっという间に「明日が昨日になってしまった」というわけです(それをタイトルにしました)。
予想は的中しましたが、それは以前のように感覚に基づいた予想ではなかったからでしょう。トップクラスではなくともプロ棋士の一人に胜ち、その自己学习の手法の有効性を証明した础濒辫丑补骋辞が、トッププロに胜つのは(论理的に考えて)明らかに时间の问题でしかありませんでした。なにしろ、时间さえあれば(ものすごい速さで)いくらでも自己学习し(「机械学习」という)、いくらでも强くなれるわけですから[8]。ニュースを闻いて、书き终わった原稿を捨てざるを得なくなったことは言うまでもありません。
结び。
かくして、いまさらながら科学技术の进歩の速さには惊かされるというベタな话に帰着するわけですが、その程度たるや、30年前、10年前のそれとは「异次元のものである」というのが、私の思うところです。
科学技术の进歩は、世の中(社会)の変化をもたらしますが、その急激さに、生物学的には何万年も前から大して进化していない我々人间の头脳(とくに日本の政策を立案する人々の头脳)は対応していくことができるのでしょうか[9]。不安を覚える今日この顷です。
(以上)
脚注?补足
[1] 深層学習(deep learning)と呼ばれる手法を用いているとのこと。人間の脳の構造をソフトウェア的に模倣しているようです。
[2] 聞くところによると、AlphaGoは、3000万局の自己対局(いわば自己研鑽)を行ったとのことです。人間は頑張っても一日に大体10局打つのが関の山でしょう。仮にものすごく頑張って年間6000局打ったとしても、3000万局になるには、5000年かかることになります。5千年前といえば古代エジプトが始まったころです。
[3] 戦国武将や経営者に囲碁の愛好家が多いことはよく知られていますが、それは現実の世界の戦略や経営の機微が、囲碁の駆け引きのそれに通じるものがあるからだといわれています。ちなみに、囲碁愛好家として知られているのは、戦国武将では織田信長、豊臣秀吉、徳川家康をはじめとして無数、経営者ではビル?ゲイツ、スティーブ?ジョブスなど、枚挙に暇(いとま)がありません。近頃話題の実業家では広岡浅子も囲碁愛好家として有名です。ちなみに、物理学者にも囲碁好きは多いのですが、その話は別の機会に譲りましょう。
[4] 1991年公開の映画「ターミネーター2」によれば、1997年8月4日に稼動を始めたSkynetは、尋常でない速さで自己学習を重ね、1ヶ月もたたない1997年8月29日(映画の中では"The Judgement Day"と呼ばれている)、ついに自我に目覚め、人類抹殺を始めます。
[5] 私はパソコンが世の中に出回ったころから、手持ちのパソコンの代替わりのたびに、計算速度を測定してきましたが、その結果、その速さはほぼ指数関数的になることに気づきました。指数関数的に技術が発展するのは、技術開発にその時点での技術を利用しているからでしょう。これは簡単な微分方程式で示すことができます。技術水準を変数xで表すと、技術開発にコンピューターを利用する状況は、Δx = (v + c x) Δt という数式で表され、これを解けば、指数関数が得られます。ここで、vは生身の人間の能力、cは人間がコンピューターを含むそれまでの技術を利用する程度を表す定数です。また、いずれは、技術開発の仕方自体を人工知能が教えてくれるようになるかもしれず、そうなれば、数式は、Δx = [ v + (c + α[x] )x ] Δt となりますが、この解は大概の場合あるtで発散します。α[x]は「研究者としての人工知能」の腕前に関係した未知の関数です。
[6] フランスのレミ?クーロンによって開発された囲碁ソフト「Crazy Stone」。物理学でもおなじみのモンテカルロ法を用いているそうです。2013年にトッププロ(石田秀芳二十四世本因坊)に四子局で3目勝ち、アマチュア六段以上の実力といわれています。これも一つのブレークスルーでした。ちなみに、日本の囲碁界では、プロとアマチュアでは段位は別です。プロ棋士の初段は、一般のアマチュアの高段者よりもはるかに強いようです。
[7] その経緯は、D. Silver et al., Nature Vol.520, 484 (2016). に記事があります。Natureといえば一部の学者が泣いてありがたがる雑誌(商業誌)です。
[8] もちろん、この話の背景には、グーグル社がAlphaGoの自己学習に、自社のコンピューター(クラウドコンピューティングという話も報道されていた)をふんだんに使わせたということがあります。上では科学者?技術者に敬意を表しましたが、「囲碁の対局ソフト」の「真の価値」を理解していたグーグル社にも敬意を表したいと思います。このことに「日本」が一枚も噛んでいないことが、非常に残念です。少なくとも日本政府は「囲碁」についても、「人工知能」についても、真の価値を理解していなかったのではないでしょうか。
[9] 気になる例としては、「英会話政策」と「原子力政策」があります。 英会話については、大学でも英会話力の目標を設定したりして、「一億総ペラペラを目指しているのか?」と思われるような涙ぐましい努力が行われています。この国策は、「英会話振興」を越え「英会話信仰」になっていると思われるほどですが、日本语?英語間の自動通訳の人工知能が開発されれば、その大部分は必要がなくなります。政府は「英会話振興」に注力するよりも、1兆円ぐらいかけて自動通訳の人工知能の開発を加速するほうがはるかに効率的ではないでしょうか。 原子力についても「古い常識」に基づいて政策が考えられているような気がします。指数関数的な技術革新の速さを考慮すれば、例えばソーラーパネルの性能向上に力を入れるほうが賢明ではないでしょうか。
2016年3月31日掲载