穴だらけの夢

夢で見た風景をそのまま出力できたらよいのに、ということを考えたことのある人はそれなりにいると思う、一方それを実際に作る工程のほうこそ価値があるのではないかという考え方もあって、筆者は一応はその両者に理解を示すつもりではあるが、本質的には前者を望みがちだと思う。後者に関しては、むしろ夢で見た風景ではなく、いままで一度も見たことのないものを作ることに意義があると考えがちだ。まぁそんなことはともかく

ちかごろは特にイラストを中心に、AIの力でそれに近い状況が起きてきつつあるのかもしれない。まぁ近いと言っても比較的というところで、実際にはイメージそのものを脳から取り出すことができるようになるにはまだいくつもの難所があるのだと素人なりに予測するし、まして夢で見た風景となるとさらに難しいのではなかろうか。そうでもないのかな?

個人的には、言葉をあれこれ使って指示を出して出力結果を鑑賞するやりかたは、記事冒頭の前者――望むものをそのままに出力するということよりも、後者のほう、つまり偶発に予想外なものが出てくるのを待つ姿勢で臨む方がいいような気はしているのだけれど、脳を直接覗かせてそれをAIだとかあれこれの力で実現してもらうという場合にはどうなのだろう?そもそもビジュアルそのものを取り出すことができるのかという部分については感覚質云々の議論の難しさと共通するところがあるだろうけれども、それでは脳から何を取り出すんだろうか

専門的な議論をしたいわけではなくて(したくないわけではないがあまりに素人なのでそこに挑めると思っていないというニュアンス)

単に今朝見た夢について、それができたらよいなと思ったということなのだが――そしてこれは特に珍しいことではなく、週に三回くらいは思っているのだけれども。

AIに結び付けたのもそれが実現において有力そうだからという理由ではなく、筆者はたまにpixivなどを見るのだが、つまり最近はそこそこ多くのAIイラストも同時に眺めていることになるのだが、わりと好きなのである、AIイラスト。なんなら琴線に響くものを持っていることも多い。無機質というよりも、むしろ純度の高い形で、多くの人々が過去自分自身で描画する際に深層意識で望んできたあれやこれやが、邪心のない形で結晶しているように見える瞬間があるというか、なんというか「嫌気なく魅力だけが残されている」ように見える瞬間があるのだった(それはもちろん「観る側」が人間であるが故の、鑑賞時の勝手な脚色が存在していることは想像に難くないが)。

もちろん技術的に難しい部分も多くあるのは察せられ、またこれも既に議論百出ではあろうが、向いているものとそうでないものとが存在するようでもある。たとえばキャラクターによっても違う、AIに描かせるとどうしてか「そうじゃないんだよな」という表情になってしまうキャラクターもけっこういる(そして筆者はそういうキャラが好きであることも多い)。ただ、なんなら人間が描くよりよいのではないかと思うキャラクターに出会うこともままある。すべて筆者の個人的な感覚であるが

どうやらあきらかに難しいらしい部分もあって、これもまたよく言われるように「手」だ。指の本数が五本でないことがちょくちょくある(もちろん世の中にそういう人はたくさんいるけれど、最も多数を占めるのが五本なのは疑いないだろう)。だがこれも、自身で絵を描かない筆者のような解像度だと、ぱっと見では気付かないことが多い。よくよく眺めるともちろんわかるのだが、よくよく眺めないと気付かない――つまり「手」は、というか「指先の細かい整合性」は、少なくとも筆者にとっては最初に眺めるポイントではないことが多いのだろう(あるいはAIがそれを苦手としているということは、多くの人にとってもそうなのかもしれない。少なくとも「表情」に比べれば)。手というオブジェクトは好きで、その微妙なバランスのもつ感触はとても重要だと思っているのだけれども、実際たぶん「雰囲気がよければ指が五本でも四本でもそれほど問題ない」というタイプのセンサーでそれを眺めている気はする。雰囲気が悪かったらよろしくないが、よければ四本でも問題ない。とはいえこれは漠然と眺めた場合であり、実際にそれが四本であることに気付いてしまうと、そこから強烈な違和感が発せられるようにはなってしまうので、できることなら五本にしてほしい(あるいは四本にするなら意図があってほしい)けれども、そのことに気付くまでの数秒間は、なんら遜色なくそれを見れてしまうような気がする。むしろ、そういった整合性から解き放たれていることも、「邪心」のなさという部分に一役買っているような気すらしないでもない

さてこれはもともと夢の話だったので、何が言いたいかというと、もし夢の風景、感覚質をそのままに(言語的説明などによる仲介を挟まずに、風景のクオリアをそのまま)取り出すことが技術的に可能になったとして、それをモニターだのVRゴーグルだのに投影したら、たぶんAIイラストどころの騒ぎでないくらいに、穴だらけの風景が描写されるんじゃないかと思ったのだ。つまり、着目している部分の風景と状況だけがそれなりに描かれ、それ以外の部分は滅茶苦茶なものになるのではなかろうか。指の本数に気付かないのと同じように。あるいは隣に佇む人物の表情なんてまともな形をしていないかもしれない。

それでも筆者はその風景を違和感なく、琴線にふれるものとして眺めていたし、できれば出力してみたいと思うのだけれど、実際にモニタに投影されるものはおそらく見れたものでない奇怪な物理崩壊風景だろう。筆者がそのときどき注目していた部分だけがそこそこに描かれ(それすらも文脈上機能すればいいというくらいの精度でよく見ると穴だらけだ)そして筆者自身すらも、それを改めて眺めたなら、そこに筋を通すことが難しいのではないかと予想する。

同じ対象に対しても、文脈上「目」に注目するのが自然な場合と「手」に注目するのが自然な場合とがあったりする。どちらに注目するかによってその絵の精度に対する評価が分かれてくることは想像に難くない。滅茶苦茶に投影された夢の風景を、実際にそれを見ていたときと同じような琴線評価で眺めたければ、あらゆる対象を、適切な筋書で、まったく同じ気持ちの因果を以て、等量の感動をしながら眺めていかなければならないはずだ。

現実のコンテンツは、そういった受け手側の筋書の揺らぎが発生しても観測の強度が保たれるように、何処を見てもある程度物理が成立するように作る。指は五本にする、筋書において全員がここで「目」に着目すると確信できていれば指の本数は異なっていても問題とならないかもしれないが、全員がそうなる保証はない。うっかり指先に目が行った人がいたら、指の本数が異なっていたら違和感を覚え、あるいはそこから異なるメッセージを受信する。そういったことが起きないように、状況を高精度に構築するだろう

たぶん、夢ではそれが起きていない。これはおそらく、その風景の制作と、それを鑑賞する行為とが、基本的に同時に起こっているが故ではないかと、素人なりに予想する。注目される部分を予測して制作するのではない。実際に注目したから、そこが精密に制作されるのだ。注目される部分を100%的中させることができる、なぜなら注目したのと同時に制作するから(…だと思うのだけれど、もしそうでないという研究があるようであればぜひ知りたい)。夢の中では、鑑賞者がどこかに注目する行為まで含めて、制作工程の一貫なのだ

この、鑑賞行為と制作行為が同時に行われているという部分の問題を克服しない限り、夢の風景をそのままに外側に取り出すことは難しいのではなかろうか。取り出すならば、その筋書まで含めて取り出さなければならない、気持ちの流れまで含めて

さてそんなわけで、まぁ実現したらよいなという期待は含めつつも難しいだろうなと思いつつ。この手のことを考えるのも普段からよくあることなので、特に今日あらたまって何があるわけでもないのだが、ただ今日はじめて思ったことがひとつあって、もしかしてこれは生演奏に少し関係あることなのかもしれないなと思ったりもした。夢の鑑賞体験の再現の難しさは、突き詰めて言えばその一回性、その場で本当に起こっているかのような感覚にこそあるかもしれない(没入感、ということとはまた少し異なる話だと思う)。筆者は生演奏の際に、それを感じることがけっこうある。たとえば筆者の夢風景によく出てくるとある時計塔内部の風景があるのだが、それを再現した楽曲というのもあって、その演奏時には、遜色なくその現象の中にいるかのような錯覚を覚えることもあった。それを再現した曲を演奏している、という感覚ではなく、実際にそこにいるような気がする、ということだ。自身の演奏だけでなく、他人の演奏を眺めているときにもそれを感じることがある、再現ではなく、その場で実際に起こっている感覚

だからなんだと言われると特に何があるわけでもないのだが、筆者がなんだかんだ演奏行為をずっと続けてみているのも、何かしら関係ある話なのかもしれない。ちなみに、演奏をする夢も、たまにみる