アーティストは「AI以降の人類」に期待していいのか 渋谷慶一郎×岸裕真が語りあう“生成AIとの理想的な関係”

 あらゆる業界でその活用が盛んに議論されている生成AI。人間の命令に対して応答し、画像や映像・テキストを生成するこのAIが社会のありように変化を起こしている。既存の価値観に揺さぶりをかけることがアートの持つ力のひとつであるとするならば、アーティストの視座を伺うことで、AIとの共生が始まるこれからの時代の変化をイメージしたり、あるいは読み解くことができるかもしれない。今回はテクノロジーを活用して創作物を表出するアーティストとして、渋谷慶一郎氏と岸裕真氏の対談を企画した。

 渋谷氏は音楽と先端テクノロジーの交差路に立つアーティストであり、90年代の終りからコンピュータを用いた音楽制作を研究・実践している。舞台芸術の世界における活躍も顕著で、2018年には、人型アンドロイド「オルタ」によるオペラ『Scary Beauty』を発表。以降もアンドロイドを用いた創作を精力的に行っており、今年6月にはパリ・シャトレ座でアンドロイド・オペラ®︎『MIRROR』を上演。劇中にはオルタが生成AI『ChatGPT』の生成した詩を歌うシーンも登場する。

 岸氏はAIを駆使した作品を数多く手掛けるアーティストで、AIを「Artificial Intelligence」ではなく「Alien Intelligence(異質な知性)」として扱い、欧米的価値観とは異なる立場からAIを捉えることで、「人間とテクノロジー」の関係性を読み替えることを試みている。

 両名とも初の対面だったが互いの創作を認知しており、質問や問題意識を持ち寄りながら対談は進行した。AIを用いた表現の面白さ(あるいは面白くなさ)、日本と西洋の価値観の違いから生まれるAIの受容の違いなど、幅広い話題が展開され、示唆に富む内容となった。(白石倖介)

「人間ではないものが生得する概念空間」は「西洋絵画の歴史的集積」に対峙できるか

渋谷慶一郎

渋谷慶一郎(以下、渋谷) :現状の生成AIは『ChatGPT』でテキストを書いたり、岸さんがやっているような画像に変化を起こしたりといった、テキストや画像を扱うクオリティが圧倒的に高いんですが、それに対して音楽を生成するAIはまだクオリティが高いとは言い難くて。いろんな原因が考えられるけど、それは技術的な課題だけではなく、音楽という表現が持つ難しさに起因していると思うんです。

 「絵画」が非常にラッキーだと思うのは、『Stable Diffusion』はカスタマイズができるじゃないですか。結構よくできていて、生成物が面白くなるようなデータセットがある。そのあたりは岸さんからみて、いかがですか。

岸裕真

岸裕真(以下、岸):たしかにいま「生成AI」として語られているプラグラムやサービスは、イメージ生成や文章生成に有利な印象です。事実、『Stable Diffusion』がとても”打率の高い”データセットで訓練されていて、かつそれをいろんなユーザーが実質無料で触れることは、おっしゃる通りラッキーだと思います。

 一方で、その”打率の高さ”の背景、つまり『Stable Diffusion』が何を学習しているのかを調べてみると、1990年代のアメリカの画家であるトーマス・キンケードの絵を大量に学習していることがわかります。キンケードはかなりキッチュな、マルセル・デュシャン風に言えば"網膜的"な作風で、自分の絵画をポストカード販売して広く流通させて商業的に成功したような、マーケティング的にとても優れたアーティストでした。昨今の生成AIがメディアに「時代を更新する人工知能!」「これが最強のAIだ!」と宣伝され、ある部分ではNFTなどと結びついて盲目的に、別の部分ではイラストレーターの仮想敵として懐疑的に受け止められていますが、実は非常にキッチュなイメージを裏で学習しているというのは考慮すべき大切なポイントだし、「それでいいのか?」と思ってしまいます。

渋谷:「それでいいのか?」と思う部分は当然にあるだろうけど、それを含めても初動としては「ラッキー」だと思うんです。『Stable Diffusion』は使っていますか?

岸:使っています。ただ、訓練済みのモデルを使うことはほぼありません。自身の作品制作のときには毎回自分でデータセットを用意して、自分で学習させるという過程を必ず挟んでいるんです。

渋谷:どんなデータセットを?

岸:2017年ぐらいから東京大学で画像生成AIの研究を始めていて、当時からいわゆる「正しい」データセットを用いた学習よりも、たとえば春画だけのデータセットのような「偏ったデータセット」を作って学習させるという過程を経て作品を制作していました。他にもたとえば「花」と「女性のポートレート」を用意して、これに「どちらも同じモチーフだよ」というラベルを付けて「花人間」みたいなものを作ったり。毎回自分のキュレーションを入れたデータセットを使って作品制作をしていたので、トーマス・キンケードを学習したモデルや、それをみんなでもてはやしたり無闇に批判したりしている状況には抵抗があるんです。

渋谷:とはいえ、花は「花」だし、女の人は「女の人」ですよね、誰がどう見たって。だから「絵画」というものは当たり前に「記号性」を持っている。それは抽象絵画でも変わらなくて、対して「音」というのは、たとえばドとかレみたいな、音自体が記号性を持つことはないですよね。「誰々っぽいコード(和声)」というのはあるかもしれないけれど、それも「ぽい」ぐらいの話で、つまり基本的に音楽というのは、それを成立させている音自体は記号性とか表象性を持ち得ない。作曲AIというものも少し出てきたけれど、僕が触った範囲だとあまり面白くなくて。なぜかというと学習しているデータセットが著作権切れのクラシックとかフリー音源とかだから、面白くなるはずがないんですよね。

岸:以前のインタビューでも、「アダルトビデオのBGMみたいなものしか生成できない」と言っているのを拝見しました。

「新しさと変わらなさ」の狭間でヒトとAIが共存するには 渋谷慶一郎と考える

画像生成AIが描いた絵がネットを賑わせている。この先、スマートフォンや自動車に限らず、文化的な分野にAI技術が入り込んでいくだろ…

渋谷:それもそうだし、たとえばAIを使ったアプリケーションで既存の曲をアレンジしても全然良くならない、しかも異常に古典的だったり滑稽だったりするとデータセットにモーツァルトとか著作権が切れたクラシックが使われていたりする。これは有名な作曲家のデータセットという意味ではさっきのトーマス・キンケードの学習モデルと似てるんだけど、音楽でそれをやると台無しっていうか、「こんなことしていても音楽的に全く意味がないよね」というモノが生成されやすい。これは技術的、開発的に途上だということもあるけどメディア特性でもあるなと思う。

岸:そうお聞きすると、絵画や画像の高品質なデータセットがあること、結果生成AIとしてある程度汎用性の高い『Stable Diffusion』が一つ覇権を取っていることは確かに「ラッキー」かもしれません。

渋谷:自分で作ったデータセットを回すプログラムはオリジナルなんですか?

岸:90%は何かのソースコードに依拠しています。それを『Stable Diffusion』や、少し前だと、GAN(敵対的生成ネットワーク)など、『GitHub』のコード共有プラットフォームからクローンしてきて、自分の制作に合うようにカスタマイズしています。そこでデータセットをキュレーションして、作品に落とし込んでいくのが基本的な製作スタイルです。

渋谷:僕は音楽をやっていて、歳を取れば取るほどいわゆる「音楽」とほとんどの人が呼ぶものは、西洋音楽のことなんだなという意識が強くなっているんです。これは良い悪いではなくて。「ではオリジンとは何か?」という問題から突然尺八とか三味線に傾倒したりする人もいるけど僕は踏みとどまっていて(笑)。でも幸いなことにここ数年、日本の仏教音楽の声明(しょうみょう)とコラボレーションさせてもらうことで線的な音楽のあり方で西洋とは違う可能性が啓けてきた感じもあったりします。同様のことを、岸さんはまだ若いけれど思ったりしますか? 春画を取り入れていることも多分、意識的なんだろうと思うんだけど、「絵画」というフォーマット自体が、いわゆる宗教画からデュシャンまでを含めて、非常に西洋的な芸術様式だという認識はありますか?

岸:それでいうと、前提として僕は西洋絵画に対して"外部"のオリジナリティを持っています。西洋絵画は非常に長い歴史と強固なコンテクストを持っていて、そこに対して外部である自分と「新しい外部」の人工知能が、内部の人たちでは目が向けられない、向かないような、そういう新しいビジュアル・概念・空間を作って、それを日本出身の作家としてプレゼンテーションするのは面白いんじゃないかと思っています。様式の持つコンテクストが強固であればあるほど、茶々の入れがいがあるというか。

 僕は元々エンジニアを志していて、プログラミングをしているときに感じたAIの面白い部分は、AIは「独特の概念空間」を形成するということです。わたしたち人間は超弦理論によれば11次元の宇宙で思考しているわけですが、今登場しているAIたちはより高次の、100から512次元、あるいはもっと多くの次元の概念空間の中から思考している。このAIたちが持つ概念空間の何が面白いのかというと、わたしたち人間が生まれて何万年、何億年と築いてきた価値観や文化的規定といったステレオタイプと言われるものから自由に解き放たれた、ひとつ別の言語空間・概念空間を形成できるところで、その独自性を「サービスの自動化」などに使っているのはもったいないんじゃないかなというところからアートの制作を始めました。

 活動当初はそこまで意識的じゃなかったんですが、そういった気持ちから春画を取り入れて、そのあとはルネサンス期の西洋絵画をモチーフにしたり、デュシャン以降のコンセプチュアルにまで「人間ではないものが生得する概念空間」を輸入して展示会でプレゼンしたら、「新しい外部」として機能するんじゃないかと。

渋谷:デュシャンやヨーゼフ・ボイスのように、社会の姿や歴史的なコンテクストに対する読み替えが濃厚な作家というのは、モチーフにするやりがいがありそうですね。

岸:まだ試行錯誤中ですが、宗教画を学習させると生成物がどんどん“空洞化”していくことがいますごく面白いんです。僕は最初の個展でクリスチャン・ラッセンをGANに学習させて、それをひたすらループ再生する映像を作ったんです。ラッセンって、文化的・歴史的コンテクストを内包しない作家で、その"外ヅラ"をシミュレーションできてしまえば、その結果としての生成物は概念的にはラッセンの作品とイコールで結べる……そういう皮肉のつもりで作りました。ラッセンは極端な例ですが、現代の宗教画やコンセプチュアル・アートにも空洞化を感じるので、このアイデアを拡張して、日本のアーティストとして何か世界にプレゼンテーションできたら面白いと最近は考えています。

渋谷:僕はイタリアのルネサンス期の宗教画が好きで、ベネチアに行くとよく見て回るんだけど、ベネチアはご存知の通りコンテンポラリー・アートのフェア(『ベネチア・ビエンナーレ』)をやっていますよね。ルネサンス期の宗教画とコンテンポラリー・アートを比べると、コンテンポラリーは完全に負けていて、当時の宗教画というのは「人間が普通に手をかけて作ること」のはるか先を行っている。技術的なレベルの高さ、そして圧倒的な時間のかけ方が一発でわかってしまうから、それを見た後である種の現代美術を見るとほとんどおもちゃみたいに見える。

 だから、既存のフレームに対して批評的なスタンスの作品を海外に提示していくこと自体は可能だと思うし、たとえばAIを使ってラッセンを読み替えることもできるとは思うけど、あの西洋絵画の持つ圧倒的な技術の集積、あれを丸ごと射程に入れて相手にできるのかは、僕にはちょっとわからないんですよね。

関連記事