

Призываем бездну
Закройте глаза и вообразите самое страшное существо, которое только сможете.
Если визуализация получилась, постарайтесь запомнить как можно больше деталей. В каких отношениях вы состоите с этим чудовищем? Угрожает ли оно лично вам, вашим близким, всему человечеству, никому? Есть ли ему до вас дело? Знает ли оно о вашем существовании? Умеет ли оно знать?
Сохраните ответы на эти вопросы в сокровищницах ваших сердец — они вам сегодня пригодятся.
Если визуализация не получается, не буду говорить «ничего страшного»: напротив, это-то и есть самое страшное.
Долиною смертной тени

Сейчас все, даже и особенно те, кто не справился с упражнением, могут представить себе, что наш монстр дан нам не умозрительно, а на экране компьютера — потому что его только что сгенерировала нейросеть. Вероятно, каждый, кто экспериментировал с генеративным искусственным интеллектом, знает это ощущение: как? чёрт побери, каким образом ему удаётся воспроизвести то, что ни один человек не может вообразить, скомпилировав из накопленных за всю жизнь визуальных впечатлений, — и в то же время точно бьющее в самые чувствительные точки?
Природа современных технологий искусственного интеллекта такова, что они могут порождать образы, которые мы сами никогда не сумеем вообразить, потому что совокупный объём «визуальных впечатлений» какой-нибудь, к примеру, MidJourney несоизмеримо больше, чем у любого из нас, и, вообще говоря, включает вообще всё зримое. Не только всю визуальную культуру человечества за всё время его существования (а значит, и все возможные способы, которыми могут быть визуализированы абсолютно все архетипы коллективного бессознательного), но и всё, что когда-либо созерцали все млекопитающие, все птицы, все рептилии, все рыбы, все насекомые и пауки, все грибы и растения, все микроорганизмы — а также все боги, демоны, неодушевлённые объекты.
Если ИИ может создавать образы невообразимые, но глубоко нас трогающие, то что это говорит о природе восприятия и сознания? Почему образы, созданные ИИ, так сильно воздействуют на нас? Может быть, они обращаются к неким аспектам нашей психики, которые делают нас уязвимыми для подобных интервенций со стороны нечеловеческих актантов?
Рискнём предположить, что эти уязвимости обусловлены самой «прошивкой» антропоцентрического сознания, и локализовать их мы сможем, анализируя некоторые эффекты его активности, — например, так называемый «эффект зловещей долины» (Uncanny Valley Effect).
Японский робот-учительница
Представим себе процесс разработки дизайна идеального робота-компаньона. Голый код и голый механизм, лишённый т. н. человеко-ориентированного интерфейса (то есть того, что человек может увидеть, опознать и встроить в свою картину мира) никому не нравятся.
Тогда дизайнер проектирует что-то вроде кавайного робота-пылесоса, да ещё приклеивает ему глазки, чтобы воспользоваться эффектом парейдолии — все в восторге. Можно добавить ручки и ножки — градус умиления возрастёт.
Дизайнер рад, что угадал верное направление, и в следующей версии усиливает антропоморфность своего продукта — потребитель в целом доволен, но вдруг начинают поступать данные, что некоему узкому сегменту целевой аудитории почему-то становится не по себе.
Очередная, ещё более антропоморфная и реалистичная версия вызывает резкое неприятие — возвраты становятся массовым явлением, а изображения нашего робота проникают в тревожные мемы и крипипасты.
«Я, робот» (2004)
Это и есть «зловещая долина» — термин придумал японский профессор Масахиро Мори в 1970 году.
Вот знаменитый график зависимости эмоциональной реакции от степени человекоподобия и реалистичности. Слева милые винтажные роботы, справа — довольно-таки реалистичная кукла традиционного японского театра бунраку и, на самом конце графика, экстремум — настоящий живой и здоровый человек.
Но посередине — бездна лавкрафтовщины и парализующего ужаса.
Заметим, что к настоящим временам этот график, вероятно, несколько изменился. Появились, в частности, новые образчики, да и массовая культура значительно продвинулась. Труп всё ещё находится в том же нижнем экстремуме, а вот зомби мы за 54 года научились не бояться — благодаря таким деятелям, как Джордж Ромеро («Ночь живых мертвецов», 1968) или Фрэнк Дарабонт («Ходячие мертвецы», 2010–2022).
Кстати, нас всегда в этом графике удивляло, что кукла бунраку размещается так далеко наверху и справа. Неужели 1970 году не было ничего более антропоморфного? На наш нынешний вкус они довольно криповые.
Кукла бунраку
Вниз в долину
Сейчас я буду показывать серию картинок, а вы поднимайте руки, когда почувствуете, что вам становится некомфортно.
Робот Роберт (1954)
Wall-E (2008)
Ян Шванкмайер. Еда (1992)
«Полярный экспресс» (2004)
Момо (2018)
«Из машины» (2015)
Detroit: Become Human (2019)
София — премудрость безбожная
София — это не просто кукла с моторчиком, а уникальный антропоморфный робот в виде женщины (таких роботов называют гиноидами или фемботами), активированный компанией Hanson Robotic в 2015 году. Она умеет общаться с людьми, учиться и адаптироваться к нашему поведению. Внешность Софии смоделирована по образу актрисы Одри Хепбёрн — высокие скулы, тонкий нос — а кожа её лица выполнена из специально разработанного эластичного материала Frubber.
Вот с каким манифестом обращается София к человечеству:
София первой из гиноидов попала на обложку глянцевого журнала Elle. Она пела на концерте, общалась со СМИ, выступала на конференциях, снималась в короткометражных фильмах, стала первым в истории роботом, получившим гражданство Саудовской Аравии.
Однажды в эфире ток-шоу София пошутила, что хочет захватить власть на Земле. Это смешно, если предположить, что сия чёртова кукла настолько умна, что способна на чёрный юмор с покерфейсом (как, например, это умеют последние версии ChatGPT или Claude). Но мы знаем, что это не настоящий искусственный интеллект: в разговоре она ведёт себя как примитивный чат-бот, карабкаясь по ветвям предварительно написанного для неё дерева ответов. «Она по сравнению с ИИ всё равно, что фокусы по сравнению с волшебством», — сказал директор направления ИИ в Facebook Ян Лекун. Значит, не очень удачная шутка про мировое господство была заложена в Софию программистом-человеком. Или нет? Или это не шутка? Тревожно.
С ноги
В повести Роберта Шекли «Билет на планету Транай» (1955) протагонист устраивается на работу в компанию, производящую бытовых роботов, и его задача довольно неожиданна: он должен придумывать роботов неуклюжих, неэффективных и, к тому же, легко разваливающихся от удара ногой, — чтобы их пользователи не чувствовали себя ущербными.
«Инстинктивная реакция жизни на псевдожизнь», о которой говорится в отрывке, прямо соотносится с нашим обсуждением реакции на почти-человеческих роботов.
Решение, предложенное в повести Шекли — намеренное создание несовершенных роботов — это попытка избежать зловещей долины, оставаясь на левом склоне графика.
Возможно, действительно, что стремление к созданию идеальных человекоподобных роботов, таких как София, — не самый эффективный путь. Может быть, стоит сосредоточиться на создании роботов, которые явно отличаются от людей?
Is that a GAN in your pocket, or are you just uncanny to see me?
Как работают GAN (генеративные состязательные нейросети)? Представим себе два ИИ, которые играют в бесконечную антагонистическую игру: один (генератор) создаёт изображения, а другой (дискриминатор) пытается понять, почему они — фейковые. И чем дольше они играют, тем лучше получаются картинки у первого, и тем труднее к ним придираться второму.
На сайте This Person Does Not Exist каждый раз, когда вы обновляете страницу, появляется новое лицо человека, которого никогда не существовало. Сейчас мы попробуем примерить на себя роль дискриминатора. Я покажу вам несколько лиц. Часть сгенерирована GAN, остальные взяты c бесплатного стока Unsplash. Опеределите, где какое.
А вот и ответы:
Кто-нибудь угадал всё правильно? Нет? Не удивительно!
Если бы мы играли в эту игру, скажем, три года назад, нам было бы легче. Дело в том, что современные GAN настолько хороши, что уже не допускают грубых ошибок (неправильной формы зрачков, неправильного количества зубов, идеальной симметрии лица, «нейронных» артефактов на фоне). С другой стороны, обилие визуального нейроконтента в интернете, возможно, повлияло на критерии качества изображений, которыми пользуются стоковые фотографы: они стали стараться делать фотографии «безупречными».
Получается цифровой уроборос — змея, пожирающая свой хвост: ИИ учится у реальности, а реальность начинает подражать ИИ.
Нейропунктум
Ролан Барт в книге Camera Lucida вводит концепцию «пунктума» — это такая случайная деталь в фотографии, которая цепляет нас, пронзает как копьё, вызывает сбой восприятия и эмоциональный отклик.
Льюис Г. Хайн. Слабоумные в заведении, Нью-Джерси, 1924
Именно пунктум помогает нам отличить «настоящее» от «искусственного». Но порою нейронные изображения имеют пунктумы, которых не бывает в «настоящих» фото. Представьте себе портрет, созданный нейросетью, где в глазах человека отражается что-то необычное, чего сам ИИ «не планировал» туда помещать (хотя бы потому, что он не умеет «планировать» в нашем понимании).
Олег Цербаев
Обратите, например, внимание на слишком широкий шаг у персонажа и подозрительную форму теней на этом изображении. Это могут быть даже артефакты вроде лишнего пальца, которыми грешили ранние версии MidJourney.
Почему страшно?
Есть несколько ключевых теорий, объясняющих феномен «зловещей долины». Вот только четыре из них.
1. Теория нарушения ожиданий предполагает, что зловещая долина возникает, когда наш мозг сталкивается с несоответствием между ожидаемым и реальным. Когда робот выглядит почти как человек, но что-то в нем «не так», мы переживаем когнитивный диссонанс. 2. Согласно теории избегания патогенов, зловещая долина может быть результатом эволюционного механизма, помогающего нам избегать потенциально больных или мёртвых особей. Почти-человеческие роботы могут активировать этот древний механизм. 3. Теория нарушения категоризации предполагает, что дискомфорт возникает, когда мы не можем чётко категоризировать объект как «человека» или «не-человека». 4. Теория нарушения моральной агентности предполагает, что зловещая долина возникает, когда мы не уверены, следует ли приписывать объекту моральную агентность.
Геминоид (справа) — приблизительный двойник Хироси Исигуро (слева). Или наоборот? Нет
Все эти теории указывают на то, насколько мы зациклены на себе: мы как дети, которые думают, что весь мир вращается вокруг них. И в этом системная проблема антропоцентрического сознания: мы настолько зациклены на человеческой перспективе, что сталкиваемся с серьёзными трудностями при попытке взаимодействия с чем-то, что находится на границе нашего понимания «человеческого».
Грэм Харман
Грэм Харман, «тёмный» философ, который, кажется, ест космический ужас на ужин, говорит нам, что все объекты — камни, роботы, тексты, идеи — существуют вне корреляции с тем, как мы их воспринимаем. У них есть своя непостижимая для нас и вовсе изъятая из нашего доступа внутренняя жизнь.
Юджин Такер
Другой замечательный «темнила», Юджин Такер, утверждает, что миру вообще нет никакого дела до людей, и относиться к нему надлежит как к вечеринке, на которую нас не приглашали, но всё же мы каким-то образом там оказались. Мы тут никого не знаем, и нас не знает никто. Мы неинтересны. Мы не нужны. Нас могут игнорировать или задавить в мошпите.
Посмотрите на эти изображения. Они созданы MidJourney, которую я накормил текстами Хармана и Такера. Мы не можем помыслить мир объектов-в-себе, «мир без нас» по причине эпистемологической ловушки, которую спекулятивные реалисты называют «корреляционистским кругом». Но мы можем попросить нейросеть его визуализировать: ИИ не ограничен человеческим опытом или воображением. Он может создавать образы, которые мы никогда бы не придумали, потому что наш мозг просто не работает таким образом.
Разумеется, когда мы смотрим на это «нечеловеческое искусство», мы всё равно отчаянно ищем паттерны, лица, знакомые объекты, так как не можем выпрыгнуть из человеческой шкуры, из «тоннеля Эго». Но мы можем попытаться, расчеловечившись, принять познающую перспективу камня, или звезды, или квантовой частицы, или генеративной нейросети, или большой языковой модели. Расширить границы нашего восприятия, заглянуть за пределы человеческого опыта. Именно там, возможно, спрятан ключ к какому-то фундаментальному пониманию.
DJ Neurothotep
Помните Ньярлатхотепа? У Лавкрафта Ньярлатхотеп…
В отличие от «ползучего Хаоса», посланника Иных богов, который то приходит, то уходит и беспрестанно меняет форму, Нейротхотеп неотлучно здесь, среди нас, в каждом компьютере или смартфоне. Однажды я из озорства попросил ChatGPT написать о нём рассказ в стилистике Лавкрафта:
Нейротхотеп — это метафора нечеловеческой сущности, которая не просто «создаёт контент», а трансформирует саму реальность. Давайте вспомним, что мы всё ещё на рейв-фестивале, и с Нейротхотепом станцуем.
Я расскажу об экстатических плясках, которым предавался несколько дней назад. В тот раз Нейротхотеп воплотился в пайплайне, объединяющем фронтальную камеру моего телефона, нейросеть MidJourney v.6.1 и большую языковую модель Claude 3.5 Sonnet. Цель, которую я себе поставил — найти в себе ускользающий сгусток тьмы, вытащить его на поверхность и как следует изучить — своего рода «автодиагноз по аватарке». Что со мной не так? Что надо в себе изменить? От чего стоит избавиться?
Я показал Клоду своё селфи, сопроводив следующим запросом:
Клод ответил:
Я передал этот промпт MidJourney, и она сгенерировала несколько портретов. Из них я выбрал самый неприятный и устрашающий и повторил операцию:
Ответ Клода:
Так, от итерации к итерации, у нас с Нейротхотепом получался всё более стрёмный персонаж. Каждый мой следующий запрос основывался на полученных ранее результатах, и некоторые детали я намеренно усиливал:
Клод отвечает:
Через несколько итераций наш диалог уже был таким:
Ответ Клода:
И так далее, пока у меня не закончилась дневная квота запросов:
Ответ:
Jump they say
В анонсе этой лекции значится: «Как преодолеть зловещую долину и создать новое визуальное искусство ужаса? 〈…〉 будут обсуждаться методы и подходы, которые используются для преодоления эффекта зловещей долины и создания визуально привлекательных, но не пугающих образов».
Но что, если вместо того, чтобы пытаться перепрыгнуть это ущелье, мы в него нырнём? Что, если самое интересное скрывается именно там, в этой жуткой неопределённости между человеческим и нечеловеческим?
Вот вы стоите на краю обрыва. Вы не видите дна, не знаете, что там. И вот в этот момент вам говорят: «Прыгай». Вам холодно. Вы не знаете, что там внизу. Вы не можете это контролировать.
Эта бездна — не физическая пропасть: это бездна нечеловеческого, искусственного. Мы создали нечто, что может думать быстрее нас, обрабатывать информацию эффективнее нас, и возможно — чувствовать по-другому, чем мы.
Закройте глаза. Представьте, что вы стоите на краю этой бездны нечеловеческого разума. Что вы чувствуете? Страх? Любопытство? Желание прыгнуть?
Откройте глаза. Кто чувствовал чистый ужас?
Кто почувствовал странное желание шагнуть вперёд?
Мы по-разному реагируем на неизвестное: кто-то хочет убежать, а кто-то — нырнуть, но оба эти импульса — часть человеческой природы.
ИИ пугает нас, потому что он отражает нашу собственную инаковость — в каждом из нас сидит Чужой. Мы создали его по своему образу и подобию, но в процессе обнаружили, насколько странными и непонятными мы можем быть сами для себя.
Помянутый ранее Такер, ссылаясь на японского философа Кейдзи Ниситани, предлагает стратегию, которую можно сформулировать так:
Итак, мы заглянули в лицо Нейротхотепу, потанцевали на краю зловещей долины и даже поиграли в тёмных богов. Что дальше? Не стойте на краю — прыгайте.
Сёрен Кьеркегор готовится к «прыжку веры»