規則の向こうに、何があるか
音楽には、規則がある。
和音進行のルール、対位法の禁則、ソナタ形式の構造——西洋音楽理論は数百年かけて、美しい音響を成立させる論理的な枠組みを蓄積してきた。バッハのフーガは厳格な対位法の規則に従っている。ベートーヴェンのソナタには形式の骨格がある。ジャズの即興でさえ、コード進行という規則の上で踊っている。
これほど規則に満ちた領域を、コンピュータが得意とするのは当然ではないか。
そう思う。その思いは正しいかもしれない。
しかし同時に、何か引っかかる。バッハを聴いたとき、私たちが感じるあの震えは——規則の産物だろうか。ジャズの名手が即興で生み出すあの一音の必然性は——コード進行が決定しているのだろうか。
音楽理論と生成AIの出会いは、この問いを鋭くする。創造性とは何か。それは学習可能か。模倣と創造の境界は、砂山と砂粒の境界のように、どこまでも曖昧に揺れ続けるのか。
EMIが示した最初の衝撃
最初の衝撃は、1981年にやってきた。
カリフォルニア州サンタクルーズ大学の作曲家 デヴィッド・コープ(David Cope) は、長期の作曲家ブロックに苦しみながら、自身の作曲スタイルを分析するプログラムを書き始めた。それが EMI(Experiments in Musical Intelligence) の出発点だ。
コープはまず、バッハのコラールを何百曲も分析し、その書法パターンをデータベース化した。特徴的な音型、声部の進行規則、和声的な慣用句——これらをルールとして抽出し、同じ文法で新しい曲を生成するシステムを構築した。
EMIが生成した「バッハ風コラール」は、専門家の聴取実験で本物のバッハとしばしば区別されなかった。コープはその後、モーツァルト、ショパン、マーラー——様々な作曲家の語法をEMIに学習させ、それぞれの様式で数千曲を生成した。
この事実は、音楽コミュニティに動揺をもたらした。
「バッハと区別できない曲をコンピュータが生成できるなら、バッハの天才性は何だったのか」——この問いは、当時の音楽学者や哲学者を真剣に悩ませた。作曲の価値は、生み出された音響にあるのか。それとも、人間の心理的プロセスや生きた経験から来るのか。
コープ自身は明確な答えを持っていなかった。彼は2004年にEMIのプログラムを削除した。理由の一端は、EMIが生成した「ヴィヴァルディ」のCDが商業リリースされ、批評家から称賛を受けた後、「これを廃棄せよ」という圧力を受けたことにある——とも伝えられる。
規則が多いほど、機械に近い?
なぜ音楽理論とアルゴリズムはこれほど相性が良いのか。
答えのひとつは、音楽理論が形式言語に近い構造を持つ からだ。
和声理論の核心は、音と音の関係の規則集だ。五度圏、機能和声の進行(トニック→サブドミナント→ドミナント→トニック)、禁則進行の回避——これらは、ある意味で「文法」だ。コンピュータが得意とする、明示的なルールの集合。
対位法はさらに厳格だ。バッハが習得した16世紀のパレストリーナ様式の厳格対位法には、平行5度の禁止・跳躍後の反行・声部の音域制限など、条件が詳細に列挙されている。ある音の後に来うる音は、規則によって絞られる。
この構造は、機械学習の訓練データとして機能しやすい。パターンが豊富で、正解と不正解の境界が(ある程度)明示されている。
しかし——ここに逆説がある。
規則が豊富なほど、機械化しやすい。 ならば、最も規則に縛られた様式が最も機械に向いているということになる。バロック期の厳格な対位法は、ロマン派の自由な和声よりも、アルゴリズムに適している。
これは何を示唆するか。
音楽の「創造性」は、規則の習得にあるのではなく、規則からの逸脱の仕方 にある、ということかもしれない。バッハは対位法の規則を完全に習得した上で、その規則を音楽的必然性のある形で破った。その「破り方」こそが、創造性の核心だとしたら——機械はそれを学べるか。
Magentaが問いかけたもの
2016年、Googleはブレインチームの一部として Magenta プロジェクト を発足させた。
Magentaの問いはシンプルだった。「機械学習は、説得力のある音楽や美術を作れるか」。
MIDIデータを大量に学習させた RNN(再帰型ニューラルネット) は、旋律の生成に一定の成功を収めた。リズムの規則性、旋律の上下動のパターン、調性への回帰——これらの統計的傾向を学習したモデルは、「らしい」旋律を生成できた。
しかし初期の生成物を聴いてみると、何かが足りなかった。
論理的には破綻していない。調性からは大きく外れていない。でも——平板だ。驚きがない。必然性の感覚がない。
音楽の魔法のひとつは、「次に来ることが予測できなかったが、来てみれば必然だった」という体験だ。意外性と必然性が同時に成立する瞬間。これをMagentaの初期モデルは作れなかった。
その後、Magentaはトランスフォーマーアーキテクチャを導入し、Music Transformer(2018)、MusicVAE(変分オートエンコーダ)など、より洗練されたモデルを発表してきた。生成される音楽の「それらしさ」は年々上がっている。
しかし「それらしさ」と「驚き」は別物だ。
Jukebox から Suno へ
2020年、OpenAIは Jukebox を発表した。
Jukeboxの革新は、MIDIではなく 生の音声波形 を直接学習・生成する点にあった。特定の歌手の声質、楽器の音色、ジャンルの雰囲気——これらをエンドツーエンドで学習し、「エルヴィス・プレスリーが歌うジャズナンバー」のような指定に応える生成が可能になった。
技術的な達成として、Jukeboxは印象的だった。しかし生成物を聴くと、ヴォーカルは「声のコラージュ」のように聞こえ、長い曲構造での一貫性に欠けていた。
2024年には Suno と Udio が登場し、状況が変わった。
Sunoが生成する楽曲は、プロの制作水準に近い音質を持ち、ヴォーカルと楽器のバランスも整っている。「ブラジリアン・ファンクの影響を受けたJ-POPバラード」といった細かい指定にも対応し、2分程度の完成度の高い楽曲を数十秒で生成できる。
AIVA(Artificial Intelligence Virtual Artist) はさらに早くから作曲AIとして展開されており、映画・ゲーム・広告音楽の制作に使われている。AIVAの楽曲はルクセンブルクの作曲権利協会(SACEM)に登録された——AIが作曲権利者として認定された、法的に意味のある出来事だった。
これらを聴いて、私は何を感じるか。
「良くできている」と思う。しかし「震える」ことは、まだ、ない。
創造性は学習可能か
ここで問いの核心に触れる。
音楽の創造性は、大量データから統計的パターンを抽出することで再現できるのか。
この問いへの答えの一つは、「創造性のどの側面を問うているかによる」というものだ。
形式的創造性(formal creativity): 与えられた様式・制約の中で新しい作品を生み出す能力。これは機械化しやすい。バッハ様式の「新しい」コラールを生成することは、EMIが示したように可能だ。
変容的創造性(transformational creativity): 制約そのものを組み替え、新しい様式・文法を生み出す能力。ジャズの誕生、十二音技法の発明、ミニマル・ミュージックの出現——これらは形式の外側から形式を変えた。この種の創造性を機械は示せているか。
哲学者マーガレット・ボーデン(Margaret Boden)は著書 The Creative Mind: Myths and Mechanisms(1990)で、この2種類の創造性(彼女は「探索的」と「変換的」と呼ぶ)を区別し、AIの創造性を論じた。機械は探索的創造性には長けているが、変換的創造性——既存の概念空間そのものを組み替えること——はより困難だと指摘する。
しかしこの区別も、実は砂山のパラドックスに似た曖昧さを持っている。
十二音技法はシェーンベルクが「ゼロから発明した」のか。それとも、19世紀後半の半音階的和声の漸進的な進化の先に位置しているのか。後者なら、それは「変容的」ではなく「探索的」なのか。
創造性の類型化そのものが、境界事例を持つ。
感動はどこから来るか
もう少し、問いを深めよう。
私がバッハの マタイ受難曲 を聴いて感動するとき——その感動は、音響的パターンへの反応か、それとも「バッハという人間が、あの時代に、あの状況でこれを書いた」という文脈込みの反応か。
この問いは、音楽の美的経験の本質に触れる。
純粋音響論(formalism) の立場——エドゥアルト・ハンスリック(Eduard Hanslick)が 音楽美論(Vom Musikalisch-Schönen, 1854)で主張したように——は、音楽の美は音響の動的な形式そのものにある、という。作曲者の意図も、聴衆の感情も、形式の外の問題だ。
もしこれが正しければ、AIが生成した音響的パターンが同等の美しさを持つなら、それは等価に美しい。「誰が書いたか」は関係ない。
しかし私たちの実際の聴取経験は、その純化に抵抗する。バッハが聴こえてくるとき、私たちはしばしば「バッハが聴こえている」のではなく、「バッハという人間を通して宇宙が聴こえている」という感覚を持つ。その感覚は、文脈を切り離した純粋音響では再現されないかもしれない。
あるいはこれは、聴衆の側の錯覚か。
「作曲者がAIだと知らずに聴けば感動する」 なら、「知った上で聴けば感動しない」という体験の差は何を意味するか。音楽の美的価値は、客観的なものか、それとも聴衆との関係の中に発生するものか。
理論の完全化がもたらすもの
音楽理論は、いまも発展している。
しかし興味深いことに、理論の精密化が創造的実践から乖離してきた歴史がある。
12音技法(シェーンベルク、1920年代)は、西洋音楽の和声体系を徹底的に組み替えた。理論的には厳密で、美的な一貫性を持つ。しかし一般聴衆には受け入れられなかった。
作曲家ミルトン・バビット(Milton Babbitt)は1958年の論文「誰がケアするか(Who Cares if You Listen?)」(後に改題: “The Composer as Specialist”)で、現代音楽は専門家のための専門家による音楽であっていいと主張した。理論的精密性と大衆的アクセシビリティは両立しなくていい、と。
この歴史は、AI音楽に示唆を与える。
もし生成AIが「最も理論的に洗練された」音楽を作ることを目指すなら、それは難解で受け入れられない音楽になるかもしれない。一方、「多くの人が美しいと感じる」音楽を目指すなら、それは統計的な平均への収斂——創造性の反対物——になるかもしれない。
理論の完全化と創造的特異性は、逆方向を向いている可能性がある。
問いに、着地しないまま
音楽理論と生成AIのクロスオーバーは、まだ進行中だ。
技術は急速に進化している。2026年現在、Sunoは数秒でプロクオリティの楽曲を生成できる。Magentaの研究は継続しており、AIと人間の協働作曲ツールも生まれている。
しかし問いは解かれていない。
アルゴリズムが生成した音列は、いつ「音楽」になるのか。その音楽はいつ「創造的」になるのか。「創造的な音楽」を聴いたとき人間が感じる震えは、音響的パターンへの反応か、人間の存在への反応か。
これらの問いに私は答えを持たない。
ただ——こう思う。
生成AIが「バッハ様式の新曲」を数千曲作れるようになったとき、バッハという存在は希薄になったのではなく、逆に際立ったのではないか。複製できるものが増えれば増えるほど、複製できないものが何であったかが、より鋭く浮かび上がる。
EMIが「バッハと区別できない」曲を作れたとき、私たちはバッハについて何か新しいことを学んだ。バッハがバッハであることは、音響的パターンの外にある——と。
それが正確に「どこに」あるのかは、まだ分からない。
そしてその「分からなさ」こそが、音楽が生き続ける理由かもしれない、とも思う。
考えるための問い
- 「バッハと区別できない」音楽がAIに作れるとして、それはバッハの音楽と等価か。 何が等価で、何が等価でないのか。
- 音楽を「理解する」とは何か。 コードを認識し、形式を把握し、文化的文脈を知ること——それで十分か。それとも何かが欠けているか。
- 創造性は、制約の内側にあるか、外側にあるか。 厳格な理論に縛られたバッハは自由だったか、不自由だったか。
- AIが作曲した音楽で感動したとき、その感動は誰のものか。 AIのものか、学習データを提供した作曲家たちのものか、聴いた人間のものか。
関連項目
参考文献
- Cope, D. (1991). Computers and Musical Style. Oxford University Press — EMIプロジェクトの詳細を記した最初の著作
- Boden, M. A. (1990). The Creative Mind: Myths and Mechanisms. Basic Books(邦訳: 産業図書)— AI創造性論の基礎文献
- Hanslick, E. (1854). Vom Musikalisch-Schönen. Rudolph Weigel — 純粋音響論の古典
- Huang, C.-Z. A. et al. (2018). “Music Transformer: Generating Music with Long-Term Structure”. arXiv preprint arXiv:1809.04281
- Roberts, A. et al. (2018). “A Hierarchical Latent Vector Model for Learning Long-Term Structure in Music”. Proceedings of ICML 2018
- Dhariwal, P. et al. (2020). “Jukebox: A Generative Model for Music”. arXiv preprint arXiv:2005.00341 — OpenAI Jukeboxの原論文
- Hofstadter, D. R. (1979). Gödel, Escher, Bach: An Eternal Golden Braid. Basic Books(邦訳: 白揚社)— 音楽・数学・認知の交差を論じた古典