«Передать воображение на аутсорс». Художник и программист Артем Коневских — о сути нейроискусства
Артем Коневских — один из немногих программистов, который может похвастаться участием в работе Большого адронного коллайдера. Начиная свою карьеру в фундаментальной науке, он вряд ли догадывался, что в итоге придет в современное искусство — область, кажется, предельно далекую от поисков бозона Хиггса. ForkLog решил поговорить с Артем лично, чтобы узнать, как вообще так вышло, чему арт-комьюнити может научить программистов (и наоборот) и какие предрассудки в отношении гуманитарного знания стоит преодолеть даже самому хардкорному технарю.
ForkLog: У тебя программистское образование, ты занимался фундаментальной наукой, работал в ЦЕРН. Как ты с таким жестким техническим бэкграундом пришел к современному искусству?
Артем: Да, мой путь не самый стандартный. Я работал в лаборатории, которая создавала датчик для Большого адронного коллайдера. В основном я занимался анализом данных — это не столько фундаментальная наука, сколько вспомогательный инструмент для физиков, изучающих вселенную. Этот опыт сильно на меня повлиял.
Даже сейчас, когда я занимаюсь только искусством, я помню об экспериментальной физике и стараюсь работать над проектами по тому же принципу, с каким ученые подходят к исследованиям: проводить опыты, которые можно повторить, и делиться полученными знания. В искусстве есть две категории людей. Одни делятся своим опытом, другие держат свои знания в секрете. Работа в ЦЕРН приучила меня относиться к первым. Участвуя в развитии общей среды, я не только помогаю другим, но и сам обогащаю свои знания.
Я много преподаю, потому что вижу: у художников есть большой интерес к нейросетям, но далеко не у всех есть понимание того, как они на самом деле работают. Это достаточно сложная тема — чтобы хорошо в ней разбираться, надо подучить математику и программирование. Это требует времени, и человеку без технического бэкграунда будет сложно. Поэтому, если есть возможность делиться знаниями, надо ею пользоваться.
ForkLog: Преподавать линейную алгебру деятелям современного искусства?
Артем: До такого мы со студентами не доходим, но зато они учатся, например, самостоятельно тренировать нейросети. Я структурирую курс так, чтобы мы обращались к разным медиумам — работали с картинками, видео, текстом, 3D-графикой, то есть со всем, что может понадобиться на практике.
В детстве я сам ходил в художественную школу, учился рисовать. Получалось очень плохо, но мне нравилось. Я до сих пор рисую, но для меня это скорее хобби, чем художественная практика.
Наука, техника и искусство всегда могут друг друга обогащать. И это работает далеко не в одну сторону. Искусство для науки — тоже полезный инструмент. Оно может критиковать технику, служить иллюстрацией к научным процессам. Знакомиться с художниками я начал на фестивале «Ускоритель Новой Москвы», который прошел в 2015 году в Ускорительном комплексе ФИАН. Из этого общения я понял, что многие артисты хотят говорить о науке, но им не хватает соответствующих знаний.
Генеративное искусство художники массово для себя открыли, когда вышла нейросеть DeepDream, которую можно было запускать на домашнем компьютере. Она давала очень богатый визуальный ряд. DeepDream стала первой нейросетью, из-за которой начались разговоры о том, что искусственный интеллект способен заменить художника.
ForkLog: И ты решил лично это проверить?
Артем: Я начал экспериментировать с DeepDream и data-driven art — искусством, базирующееся на анализе или визуализации данных. Однажды, увидев в новостях, как сносят памятники Ленину, я вспомнил известный скетч Сергея Курехина о том, что вождь мировой революции был грибом и одновременно радиоволной. Я нарисовал карту «ленинского радиовещания», на которой мавзолей был центром, а памятники Ильичу — антеннами. Затем напарсил массу данных о локациях памятников и на их основе визуализировал траектории распространения ленинской мысли. Юмор в том, что этот проект я реализовал на посвященном геоданным хакатоне, где от меня ждали совсем другого. Получилась своего рода арт-интервенция.
После первых шагов в творчестве я понял, что мне скучно оставаться в науке, оторванной от реальной жизни. Я отправил заявку на участие в программе института «Стрелка» The New Normal, которую курировал американский философ технологий Бенджамин Браттон. Меня приняли, и так произошел мой поворот в сторону искусства. Оно перестало быть для меня развлечением и стало серьезной работой с художниками — прежде всего с Егором Крафтом, которому я помогал с проектом Content Aware Studies, где нейросети восстанавливали разрушенные временем античные скульптуры и генерировали видео на их основе.
Вторая коллаборация, которая идет до сих пор, это проект Current, посвященный будущему кинематографа и volumetric cinema в частности.
ForkLog: Насколько тебе как человеку с техническим бэкграундом было сложно овладеть специфическим языком современного искусства?
Артем: Я бы сказал, что до сих пор учусь. Современное искусство — такая же профессия, как и любая другая. Я шесть лет изучал программирование в институте и, думаю, чтобы стать художником, требуется сопоставимое время. Нужно освоить довольно большой объем теоретического материала — для современного художника это важно.
ForkLog: То есть у тебя не было подозрения к этому языку? Многие очень скептически к нему относятся.
Артем: Поначалу оно было, конечно. Подозрение понятно: ты приходишь в галерею, и надо читать километры описаний какой-нибудь работы. Иногда это действительно чушь, но чаще всего за этой сложностью скрывается куча смыслов и референсов. Современное искусство берет очень много концепций из философии, теории медиа. Чтобы его оценить, нужно потратить время.
ForkLog: В начале 2000-х люди обменивались дисками, на которых были записаны произведения демосцены — это своеобразный феномен, в котором искусство встречается с хардкорным программированием. Помнишь такое?
Артем: Да, конечно, некоторые мои друзья этим занимались и даже получали за свое творчество награды. Сам я на тот момент только учился программировать, смотрел в код и не понимал, что в нем происходит. Подобное мне казалось чем-то недостижимым. Но такие вещи очень вдохновляют.
ForkLog: Это напоминало соревнования ремесленников XVIII века: кто круче придумает механизм для часов.
Артем: Так и есть. Вся демосцена вращалась вокруг жестких технических ограничений, которые предлагали компьютеры прошлых поколений. Сейчас эта культура «погасла» из-за того, что техника стала слишком мощная.
ForkLog: Кажется, то же самое происходит с искусством — это уже не совсем про мастерство художника. Но тогда о чем оно?
Артем: Оно про концепции. Технологии здесь выступают способом их иллюстрировать. От художника требуется в первую очередь найти интересную идею. Сейчас мы наблюдаем бум генераторов Text to Image. Это революция того же порядка, что и изобретение фотоаппарата. Тогда исчезла потребность в том, чтобы художники рисовали максимально реалистично, и им пришлось переизобретать искусство.
В наши дни происходит то же самое. Весь XX век художники уходили все дальше в мир идей, используя в качестве основного инструмента воображение. А теперь вдруг оказалось, что и воображение можно передать на аутсорс нейросетям. Не полностью, конечно, но процесс генерации идей стал очевидно проще.
ForkLog: Что бы ты взял у сообщества кодеров и перенес в арт-среду — и наоборот? В чем вообще ты видишь принципиальную разницу между двумя этими комьюнити?
Артем: Художники более свободно мыслят, в то время как у программистов обычно существуют рамки: если есть задача, то ее нужно выполнить строго определенным образом. У художников наоборот: задача не обязательно должна быть выполнена, главное ее зафиксировать, а со временем можно и доработать. Мне как программисту было сложно понять такой подход.
В «Стрелке» мы делали проект Atoll — об умных городах будущего. Мы размышляли, например, о том, как можно взять данные одного города и смешать его с данными другого и получить третий город, который будет жить по правилам обоих. С точки зрения художника, здесь все просто: берешь карты двух территорий, разрезаешь на квадраты и перемешиваешь. А вот программисту очевидно, что так это не работает — квадраты недостаточно просто перемешать, чтобы они стали миксом. Для меня это было непостижимо: мы ставим перед собой одну задачу, а выполняем по факту совсем другую. Потом я понял, что на самом деле целью художественного проекта было не реализовать что-то конкретное, а доступно проиллюстрировать идею.
В этом суть искусства. Оно работает с идеями, в то время как программирование более практично: если взялся что-то делать, ты прежде всего должен предоставить работающий продукт. Уже во вторую очередь ты думаешь об эстетической составляющей.
В этом я вижу основу конфликта между технарями и артистами. Но мне кажется, что время от времени стоит выходить за рамки рациональности, заглядывать в будущее и задумываться о том, чем мы сможем в нем заняться, когда будут сняты очередные технические ограничения.
Помню, пять лет назад на летней школе в МФТИ специалист по нейросетям Михаил Бурцев сказал: «Я думаю, в будущем мы откажемся от привычного нам интерфейса операционных систем. Вместо него будет чат!» Кто-то видит будущее, а кто-то предпочитает оставаться в рамках того, что может сделать здесь и сейчас. Иногда полезно убирать рамки, и искусство очень в этом помогает.
ForkLog: Но у гуманитарной сферы есть один серьезный недостаток. Если говорить про академическую науку, она очень медленная: когда где-то вышел важный текст, его переведут и распространят лет через пять. Скорость распространения идей минимальная в сравнении с техническим сообществом.
Артем: В точных науках, как правило, то же самое: между написанием статьи, ее рецензированием и публикацией могут пройти годы. Мне кажется, когда произошел бум нейросетей, требования к посвященным им материалам заметно смягчили: технология выглядит настолько важной, что лучше оперативно распространять информацию о ней, а уже потом, если потребуется, опровергать ложные данные.
Обмен информацией существенно упростил arXiv.org. С его появлением стал распространяться принцип digital first — то есть ты пишешь статью, публикуешь ее в цифре и только потом, может быть, в журналах. Ты открыл что-то новое и тут же можешь поделиться знанием с другими. Это сильно ускоряет прогресс.
ForkLog: И скорость образования сообществ. Как только возникает что-то мало-мальски значимое, вокруг этого тут же формируется комьюнити.
Артем: Да, очень сложно пройти мимо, когда появляется новая разработка. Я слежу за всеми ИИ-проектами и стараюсь потестить каждую интересную, на мой взгляд, нейросеть. Становится все сложнее — что-то новое появляется каждый день.
ForkLog: Как ты относишься к массовому распространению нейросетей и к тому, что теперь ими может пользоваться практически каждый?
Артем: Я технопозитивист, поэтому отношусь к этому очень хорошо — как к новому витку прогресса. Единственное — когда появились простейшие в использовании Text to Image, многие стали называть себя цифровыми художниками. При этом под искусством они понимают просто красивые картинки без какого-либо концепта, а ведь именно это, на мой взгляд, отличает художника от ремесленника. Художник поднимает фундаментальные вопросы, которые заставляют думать.
Я однажды ездил в китайский Шэньчжэнь. Там есть деревня, где живут художники. Они зарабатывают на жизнь тем, что создают копии известных произведений. Идешь по улочке, а там сидит человек и перерисовывает картину Джексона Поллока — смотрит на телефоне на хаотично разбросанные пятна и воспроизводит их с точностью до миллиметра. В итоге картина есть, она красивая, но что она несет? Она просто займет пространство в интерьере. На мой взгляд, это не совсем искусство.
У большинства людей, называющих себя цифровыми художниками, получается то же самое — нечто красивое, что просто занимает пространство. Те же, кто действительно стараются, учатся правильно составлять промт, фундаментально подходят к работе с инструментами, лично у меня вопросов не вызывают.
ForkLog: Но ведь ИИ-инструменты, которые создают красивые картинки, сами обучены на красивых картинках, как те художники в китайской деревне. Получается, что за конечный результат все равно отвечают прежде всего те, кто создавал нейросеть и ее обучал.
Артем: Эта проблема порождает много споров. Датасет в больших проектах собирается из всех картинок, доступных в интернете и соответствующих морально-этическим нормам. Действительно, есть заметный крен в сторону западного искусства. Но нейросеть всегда можно переобучить и скорректировать ее работу.
Конечно, можно сколько угодно критиковать людей, которые натренировали нейросеть на определенном датасете. А можно сказать им спасибо за проделанную работу и улучшить их инструмент, устранив недостатки, на которые ты наткнулся. Второй подход мне кажется более правильным. Благо сейчас это все гораздо проще, чем было раньше.
ForkLog: При желании можно вообще собрать датасет, например, только из картин, нарисованных женщинами или представителями социально уязвимых групп граждан.
Артем: Конечно. Возможно и обратное. Кто-то в шутку уже составил датасет для больших языковых моделей ровно из всего, что запрещено разработчиками. Такая реакция на то, что ChatGPT ломается на провокационных вопросах, начинает отвечать невпопад, извиняться и так далее.
Я считаю, что ничего в этой сфере запрещать не нужно, скорее следует создавать кластеры: здесь у нас клуб любителей морали, а здесь — кружок генерации анекдотов для гопников. Сама нейросеть — инструмент, а не конечный продукт.
ForkLog: И все-таки нетрудно представить, что люди будут выбирать нечто среднее. Как итог — получим усредненные «красивые картинки» от Midjourney, на которых будут обучаться уже следующие поколения нейросетей.
Артем: Мы с Егором Крафтом сейчас как раз работаем над проектом, который обыгрывает этот фидбэк-луп. Уже понятно, что если нейросеть обучать на ее же выходных данных, она деградирует. Разработчики делают на это поправку, но Midjourney, конечно, дообучается на собственных «лучших результатах». Расхожий пример — женские лица, сгенерированные ей, отчетливо похожи друг на друга, это одна и та же девушка. Рано или поздно это придется корректировать.