無限の猿定理とAI創作——ランダムに打ち続ければ、シェイクスピアは生まれるか

無限の猿が無限の時間タイプライターを叩けば、いつかはシェイクスピアの全作品が完成する。この思考実験をAI創作に重ねたとき、「創造性」と「確率」の境界が揺らぎ始める。

#無限の猿定理 #AI #創造性 #確率 #シェイクスピア

猿とタイプライターの思考実験

無限の数の猿に、無限の時間、タイプライターを叩かせる。完全にランダムに。意図なく、理解なく、ただキーを打ち続ける。

すると、いつかは——確率的にはほぼ確実に——シェイクスピアの『ハムレット』の完全なテキストが出現する。

これが 無限の猿定理(Infinite Monkey Theorem) だ。数学的には、十分に長い時間をかければ、ランダムなプロセスが任意の有限な文字列を生成する確率は1に収束する、という定理に基づく。フランスの数学者エミール・ボレルが1913年に確率論の説明のために持ち出した比喩だが、その含意は数学を超えて広がっている。

ここで立ち止まって考えたい。もし猿がランダムに打ったテキストの中に、偶然にも完璧な『ハムレット』が含まれていたとする。

その『ハムレット』は、シェイクスピアの『ハムレット』と 同じ作品 だろうか。

同じテキスト、異なる作品?

文字列として見れば、両者は完全に一致する。一字一句、ピリオドの位置まで同じだ。しかし、多くの人は直感的に、猿が打った『ハムレット』とシェイクスピアが書いた『ハムレット』は「同じではない」と感じるだろう。

なぜか。

シェイクスピアの『ハムレット』には 意図 がある。復讐の葛藤を描こうとした意図。人間の狂気と理性の境界を探ろうとした意図。エリザベス朝の演劇の伝統を踏まえ、それを超えようとした意図。テキストの背後に、創作者の精神的な営みが存在する。

猿には何もない。意図がない。理解がない。テキストが「意味する」ということ自体を知らない。

ここで、テキスト自体の価値と、テキストを生み出したプロセスの価値を、どう区別するかという問題が生じる。

読者が猿の『ハムレット』を読んだとしよう。誰が書いたか知らずに。その読者は感動するだろうか。おそらく感動する。テキストが同じなら、読者体験も同じはずだ。では、「猿が書いた」と知らされた後も、同じように感動できるか。

ここに、作品の価値が テキストに内在する のか、それとも 創作プロセスに帰属する のか、という根源的な問いがある。

AIという「高速の猿」

ここからが本題だ。

大規模言語モデル(LLM)は、ある意味で「非常に賢くなった猿」だと言える。もちろん、完全にランダムではない。膨大なテキストデータから学習したパターンに基づいて、次に来る確率の高いトークンを選択している。しかし、根本的なメカニズムは確率的な選択だ。

AIが生成した詩が美しかったとする。AIが書いた小説が読者を泣かせたとする。そこに「創造性」はあるのか。

無限の猿定理の観点から見れば、AIのテキスト生成は、 ランダムネスに大量のバイアス(学習データからの統計的パターン)を加えたプロセス だ。純粋なランダムよりもはるかに効率的に「意味のある」テキストを生成できるが、そのテキストの背後に「意図」があるかと問われれば、答えは自明ではない。

AIには「復讐の葛藤を描きたい」という欲求はない。「人間の狂気を探りたい」という知的衝動もない。プロンプトに応じて、学習パターンに基づいて、確率的に文字列を生成している。

しかし。

シェイクスピアが『ハムレット』を書いたとき、彼の脳も——神経科学的に見れば——ニューロンの発火パターンに基づいて、確率的に次の言葉を選択していたのではないか。「意図」や「欲求」と呼ばれるものも、突き詰めれば脳内の化学反応のパターンではないか。

「はい」と答えた瞬間、猿とシェイクスピアとAIの間の境界線は溶け始める。

検索空間の広大さ

無限の猿定理が強調しているのは、テキスト空間の広大さだ。

英語のアルファベット26文字とスペース、合計27文字を使って100文字のテキストを生成する場合、可能な組み合わせは27の100乗——およそ10の143乗通り。観測可能な宇宙に存在する原子の数が約10の80乗だから、テキスト空間は宇宙の原子数をはるかに超える。

この広大な空間の中で、「意味のある」テキストが占める割合は、限りなくゼロに近い。ランダムに100文字を生成して意味のある英文ができる確率は、天文学的に小さい。

AIがやっていることは、この広大な空間の中で 「意味がありそうな領域」を効率的に探索する ことだ。学習データが、探索の地図として機能している。猿がテキスト空間全体をランダムに彷徨うのに対し、AIは地図を頼りに「意味のある」テキストが集中している領域を重点的に探索する。

しかし、ここで興味深い逆転が起きる。AIの地図は 既存のテキストから作られている 。つまり、AIは「人間がすでに書いたテキスト」の近傍を探索するのが得意だ。しかし、シェイクスピアがやったことは、 それまで誰も書いたことのないテキスト を生み出すことだった。地図にない場所に行くこと。

AIの探索が「既知の意味空間の効率的なスキャン」だとすれば、シェイクスピアの創造は「未知の意味空間への飛躍」だった。この二つは、同じ「テキスト生成」であっても、根本的に異なる行為なのかもしれない。

ボルヘスの図書館

アルゼンチンの作家ホルヘ・ルイス・ボルヘスは、短篇「バベルの図書館」で、あらゆる可能な文字の組み合わせで構成された本がすべて収蔵された図書館を描いた。この図書館には、シェイクスピアの全作品も、まだ書かれていないあらゆる傑作も、あなたの伝記の完全に正確な記述も含まれている。しかし同時に、無意味な文字列が圧倒的大多数を占めている。

ボルヘスの図書館は、無限の猿定理の空間的な表現だ。すべてがすでに「存在」している。問題は、そこから「意味あるもの」を見つけ出すことだ。

AIは、バベルの図書館の中を歩き回り、「良さそうな本」を効率的に見つける司書のようなものかもしれない。一方、創造的な作家は、図書館の壁を壊して 新しい部屋を作る 者かもしれない。

あるいは、その区別は人間の虚栄かもしれない。

「理解なき生成」の価値

哲学者ジョン・サールの「中国語の部屋」の思考実験は、理解を伴わない記号操作の意味を問うた。部屋の中の人間が、中国語のルールブックに従って記号を操作し、外から見ると中国語を理解しているように見える。しかし実際には何も理解していない。

AIのテキスト生成も、「理解なき生成」だと言える。AIは「ハムレットの苦悩」を理解していない。しかし、ハムレットの苦悩を表現するテキストを生成できる。

無限の猿もまた、「理解なき生成」の極端な形だ。猿は何も理解していない。しかし、十分な時間があれば、理解の産物と見分けがつかないテキストを生成できる。

問いは反転する。 理解していないのに「正しい」出力を生成できるとき、その「正しさ」はどこから来ているのか 。テキストに内在するのか。読者が事後的に付与するのか。それとも、テキスト空間の構造そのものに「意味のポテンシャル」が埋め込まれているのか。

思考を刺激する問い

無限の猿定理は、「十分な時間があれば何でもできる」という楽観的な教訓に矮小化されがちだ。しかし本当の教訓は、その逆ではないか。

確率的に「可能」であることと、それを「実現する」ことの間には、宇宙の年齢よりも長い距離がある。その距離を縮めるのが「意図」であり「理解」であり「創造性」なのだとすれば、それらの概念は確率論では捉えきれない何かを含んでいるのかもしれない。

あるいは、含んでいないのかもしれない。

  • AIが生成した文章に感動したとき、その感動は「本物」か。感動の真偽は、テキストの出自に依存するのか
  • もし自分が書いた文章と一字一句同じものをAIが独立に生成したとしたら、自分の文章の価値は変わるか
  • 創造性の本質が「意図」にあるとすれば、意図なく生まれた美は美ではないのか。夕焼けに意図はないが、美しい
  • 猿とAIとシェイクスピアの間に、あなたはどこで線を引くか。その線は、何を守るための線か

この記事をさらに深掘りする

Share

🧪 同じカテゴリの記事

🔀 他のカテゴリの記事