どうしてAIに囲碁が打てるのか

人工知能 (AI) が数学の計算をするだけなら、なにも違和感はありません。
しかし、AIが囲碁の世界チャンピオンを倒す時代です。こうなるとAIの裏側で、単純な場合分け以上のなにかが行われている気配が漂ってきます。

こちらはGoogleの、自動で写真に説明をつけるAIです。これも人間らしい知性を感じさせます。


(引用元:Google Research Blog

今回はこの「AIの知性」が、どういうロジックで生まれているのかを書いてみます。計算機科学だけでも数学だけでもない、認知神経科学と哲学の交わるエキサイティングなところです。

何が知的か。何は知的でないか

創意工夫やイマジネーションがいらない作業を、僕らは「機械的」と表現します。機械 = 単純、人間 = 複雑という無意識の区分けがあるようです。この区分けについて、似たものを直感的に列挙してみます。

コンピュータは数千の部品からできているので、機械としては割と複雑です。しかしコンピュータに知性や感情があると言うとき、それは比喩的な意味でしかありません。

シリコンチップをどれだけ重ね合わせても、無機物から知性や感情は生まれないという感覚を僕らは持っています。つまり、知的か否かには、複雑性だけでは説明がつかないような「何かしらの壁」が一見ありそうです。

その壁、すなわち境界線は、どこにあるのでしょうか?

代数と幾何に境界はあるか(寄り道その1)

知性を考える上で大切な視点が2つあります。論理の飛躍を避けるため、この2点だけちょこっと補足します(飛ばしても話はつながります)。

これらは代数の式です。

\( \left\{ \begin{array}{l} y = x^2 \\ y = x + 1 \end{array} \right. \)

数式の意味を考えなくても、機械的な手順で解くことができます。その手順は現実世界から切り離された、抽象的な数式の取り扱いだけで完結します。

もし、

テヅカオサム + ヒョウタンツギ = アッチョンブリケ で、
アッチョンブリケ = テヅカオサム×2 なら、
テヅカオサム = ヒョウタンツギ です。

これらの式自体には何の意味もなく、行われているのは機械的な作業に過ぎません。

このように、もとは極めて抽象的な存在であった数式に、具体性と意味を与えたのがデカルトでした。
デカルト座標(x軸、y軸でのグラフ化)を用いることで、線や曲線、円といった 形をもつもの と、 y = x + 1 などという 形をもたない数学概念 が、本質的には同じものだと分かりました。これは数式(=抽象世界)と図形(=具体世界)という、一見正反対に見えるものが、同じものの両面であるということです。

POINT

  • 代数式と幾何図形は同じものである
  • 形のないものと形のあるものが、同じものということが有り得る

創発とは(寄り道その2)

脳細胞の集まりから意識が生まれるように、多数の集まりから新たな性質が生まれることを「創発 (emergence)」といいます。

1万個のドットで点描したモナリザを想像してみましょう。

この時、それぞれのドットが1万分の1ずつモナリザ性を持っているのでしょうか?残り全ての点を消して一つだけ残った点を虫メガネでじっくり眺めたら、ほんのちょっとだけモナリザっぽさを感じられるのでしょうか?

そんなことはありません。点はただの点で、その中には一切モナリザ性は含まれていません。それが1万個集まるというプロセスを通じて、どの点も持っていない新たな性質がそこに「創発」したことになります。

スタジアムで観客が起こすウェーブも同じで、一人ひとりは立ったり座ったりを繰り返しているだけです。横の動きはありません。しかし全体としてみると横に流れ、確かな勢いを感じさせるウェーブが生まれます。この例でも、個を足し合わせた以上の何かが、全体の関係性の中から創発しています。

このように知性もまた、脳のシナプスの複雑なつながりから創発する存在だと言えます。

POINT

  • 多くのものが集まると、個の和以上の新しい性質が生まれることがある
  • これを創発と呼ぶ

パターン処理がもつ表現力

AIの話に戻ります。

機械学習はAIの重要な要素ですが、そこで「学習」されているのは、インプットとアウトプットを結びつける法則(パターン)です。機械学習は言い換えれば、パターンを見つけ出すための手順です。



(もう少し詳しい説明はこちらのスライドへ:「イメージで理解する人工知能(入門編)」)

上の図は2次元(縦軸と横軸)のパターン処理です。

具体例で考えてみます。温度の横軸に対して、縦軸の上半分を「暑い」、下半分を「寒い」とおけば、20度以上のときに「暑い」、20度未満のときに「寒い」となる直線グラフを書くことができます (y = x  –  20) 。これは「暑いか寒いかを判定するプログラム」を数式で表現したということです。単純な数式処理、つまりパターン処理です。

これが3次元になると x, y, z と3つの文字が登場し、直線ではなく平面や曲面といった複雑なパターンが表現できます。さらに変数を4つにすれば、超平面と呼ばれる一定の形をした「立体空間」を数式で表すことができます。

機械学習では、これらを超えた数百次元の空間を取り扱えるので、その「形(グラフ)」がもつ複雑さと表現力は想像を絶するところにあります。単純な2次元のグラフですら暑いか寒いかを判定できる(表現できる)のですから、いかに囲碁が複雑とは言え、十数次元もあればAIにもそれなりの一手が判定できてしまいそうです。

ちなみに目盛りが -10から10 まであるとすると、次元(軸の数)が1つ増えるごとに、表現できる組み合わせの数は21倍(-10〜+10)になります。全体が数百次元あるとなると、宇宙の全原子の数の、更に10200 倍あっても足りないだけの組み合わせ数(表現力)をもつことになります。次元が増えると、足し算ではなく掛け算で組み合わせが増えるので、その発散速度は指数関数的です。

機械学習と高次元

機械学習は、本質的にはこの高次元グラフの「形」を決める作業です。

2次元という広い平面の中から、「暑いか寒いかを決めるにはこういう直線だけが大事だよ」と、細く頼りない一本の直線を切り出す作業もそうです。あるいは3次元に広がる空間から、「XXXを判断するにはこういう平面だね」と、平面や曲面を切り出します。

切り出すグラフが4次元以上になると僕ら人間にその「形」は想像できませんが、それでもやることは同じです。あらゆる「形」は抽象的な数式で表現できるというのがデカルトが示したことですから、あくまでも数学的な手順に従って作業すれば良いのです。4次元以上になっても、w, x, y, z と4つの文字をおいた数式で考えれば同じことです。(参考:「4次元は図示できる」)

このように人間は数学空間と現実空間、あるいは、抽象的な数式の世界と形ある図形の世界を行ったり来たりして物事を考えます。そして人間と対照的に、AIソフトは数式だけで物事を考えます。

数式と図形は同じものの2側面なので、どちらが知的でどちらは非知的ということはありません。ある感情を「幸せ」と呼ぶか、英語で “happiness” と呼ぶかという、言語の違いと同じです。図形(イメージ)も数学の式も、どちらも抽象的な概念を表現するツール、すなわち言語なのです。

まとめ

さて、知性と非知性の境界を探そうと始めたはずだったのですが、境界がなくなってしまいました。

電卓のような数式計算は非知性で、図形を用いたイメージ的考察は知性。直感的にはそう思えます。しかし、これらは翻訳可能な同じものです。高次元の数式は、シンプルな図形に留まらず絵画でも動画でも、一人の人間の経験や記憶であっても、あらゆるものを表現できます。それが高次元性のもつ表現力です。点の集まりからモナリザの姿が創発するように、数式という無機質で形のないものから、「人の記憶」のような、生き生きとした具体性をもったものを創発させることができます。AIが囲碁を打てるのも同じ理由です。

いまのAIより、人間の方が何万倍も複雑で、構造的に豊かです。しかし、人間を「知的」と呼ぶのであれば、AIは「less知的」なだけかもしれません。そこに白黒はっきりつくような境界はありません。そうなると知的さの違いは、単に構造が高次元的かどうかの差と言えてしまいそうです。

2017年現在のAIが知的だとはなかなか言い難いところがありますが、ほのかな知性をAIに感じる瞬間は多くの人にあると思います。無機物から知性が生まれるとしたら、そのとき僕らが覚える違和感の正体は、この2点にたどり着くのではないでしょうか。

  • 無機物でも、創発によって抽象的な性質を備えられること
  • 高次元性によって爆発的な表現力が生まれること

語ることは尽きませんが、知性の定義によって様々な議論ができて興味深い領域です。