AI visualization as a new trend of extra monetization of streamed music for indie artists
- Authors: Budnik R.A.1, Guryanov V.V.1, Evpak E.G.1
-
Affiliations:
- Higher School of Economics (HSE University)
- Issue: Vol 51, No 4 (2024)
- Pages: 80-122
- Section: Intellectual Property Rights
- URL: https://journal-vniispk.ru/2225-3475/article/view/281217
- DOI: https://doi.org/10.17323/tis.2024.23975
- ID: 281217
Cite item
Full Text
Abstract
The article provides the outcomes of the experiments on the reaction of target audience towards the visualization of the narratives in the songwriting art of three indie artists of Media Sharks record label founded at NRU HSE’s Faculty of Creative Industries. The categories for evaluating the neural network generated visualization in the music videos are described on examples of Kandinsky and Genmo in terms of tools for extra monetization for the streamed music audiovisual products for the benefit of indie artists. The research optics applied for determination of social value of generative visualization neural networks combines the tools of bibliometric analysis, historical-genetic analysis and case studies of the precedents of pioneering AI-generated music videos for the artists of Russian and global popular music stage. The experimental model for calculation of the additional profits for the streamed music artists from posting the AI-generated music videos as supplements to original streamed music products at YouTube video hosting is proposed for future broader academic discussion.
Full Text
Введение в проблему и актуальность темы исследования
Нейросетевая визуализация стриминговой музыки на видеохостингах — новый актуальный тренд в массовом цифровом медиаискусстве и массовой музыкальной культуре, ставший вслед за дебютным клипом группы “Cream Soda” на сингл «Меланхолия», собравшим в 2021 г. более 2 200 000 просмотров на YouTube, прорывной технологией 2023 г. вместе с активным развитием и внедрением на массовый рынок пользовательского аудиовизуального контента нейросетевых сервисов визуализации творческих продуктов. С одной стороны, популярность нейросетевых клипов музыкальных артистов доказывается статистикой просмотров и реакций пользователей на аудиовизуальные продукты медийных исполнителей российской и мировой музыкальной сцены, таких как Юлия Савичева (клип на песню «Девочка» — 150 440 просмотров), группы «Сектор Газа» (клип на песню «Твой звонок» — 411 000 просмотров; «Мумия» — 343 000 просмотров), «Король и шут» (клипы на песни «Кукла колдуна» — 429 000 просмотров; «Камнем по голове» — 1 800 000 просмотров), “Deep Purple” (клип на песню “Child in Time” — 2 700 000 просмотров; “Smoke on the Water” — 1 100 000 просмотров). С другой стороны, артисты, чье музыкальное творчество популяризировалось изначально с помощью нарративов мультипликации, такие как Gorillaz (клип на песню Kids with Guns — 963 просмотра), испытывают противоположный эффект — недостаточный интерес зрителя к вторичному нейросетевому продукту.
Визуальный промпт-инжиниринг как технология в отечественном академическом дискурсе начала 2020-х гг., по данным научной электронной библиотеки eLibrary, освещен недостаточно — по запросу на ключевые слова «визуальный промпт-инжиниринг» выдается всего четыре публикации, все датированные 2023 г., из которых в контексте настоящего исследования представляет интерес работа Джоша Фруллингера «Что такое генеративный искусственный интеллект?» [1], в которой рассматриваются нейросетевые инструменты DALL-E и Stable Diffusion. Пионерская публикация Джоша Фруллингера вводит в научную дискуссию понятие «генеративный искусственный интеллект», описывает технологии, лежащие в основе работы нейронных сетей, подобных DALL-E, объясняет причины «странной причуды рук» — способности генеративных визуализационных нейросетей рисовать нереалистичные количества пальцев на руках, конечностей и зубов через применение нейросетями алгоритмов фрагментарного анализа арт-объектов. В разделе выводов Джош Фруллингер опровергает расхожий стереотип о потенциальном вытеснении нейросетями художников и медиахудожников с рынка труда, приводя в качестве примера фиаско «галлюцинирующей нейросети» в процессе создания научных статей и подводя к мысли о возникновении специализации промпт-инжиниринга как направления в предметной области ИИ, посвященного практикам изучения «инженерии запросов» [1, с. 3].
Представляющая интерес как для практиков, так и для теоретиков медиаискусства, современного изобразительного искусства и смежных областей гуманитарной науки, таких как авторское право и смежные права, антропология и философия, тема визуального промпт-инжиниринга в последнее время все чаще фигурирует в качестве секционной в конференциях по искусству и дизайну и по вопросам авторского права:
- в десятом номере журнала «Университетская книга» в 2023 г. был опубликован дайджест VII конференции СберУниверситета «Больше чем обучение — 2023» [2];
- 11 апреля 2024 г. в Высшей школе экономики прошла организованная Аспирантской школой по искусству и дизайну НИУ ВШЭ Международная научно-практическая конференция «Теории и практики искусства и дизайна: социокультурные, экономические и политические контексты», в рамках которой художники-исследователи «НейроЛабы» Школы дизайна НИУ ВШЭ представили результаты собственных экспериментов в секции «Медиаискусство в контексте новейших технологий» [3];
- 12 апреля 2024 г. на Международной конференции «Теории и практики искусства и дизайна: социокультурные, политические и экономические контексты» в рамках круглого стола «Нейросетевой поворот в популярной музыке: возможности и вызовы» [4] обсуждались варианты выбора норм правового статуса аудиовизуального контента, созданного человеком с применением нейросетевых инструментов в практиках авторского права Нидерландов (Даво ван Пеурсен, Donemus Publishing, Нидерланды) и Российской Федерации (Руслан Будник, Кафедра ЮНЕСКО НИУ ВШЭ). Также был представлен доклад Ольги Сыч на тему «Анонимизированные исполнители и нейросетевые артисты: сравнительный анализ методов и специфики конструирования образа»;
- 18-19 апреля 2024 г. состоялась организованная Кафедрой ЮНЕСКО НИУ ВШЭ ежегодная конференция «АВТОР/AUTHOR-2024» [5], на которой авторы настоящей статьи представили результаты данного исследования.
В фокусе нашего исследования — проблема оценки потенциала альтернативной монетизации музыкального творчества инди-артистов при помощи публикаций музыкальных клипов, созданных с применением технологии промпт-инжиниринга и онлайн-сервисов по генерации видео в нейросети Kandinsky и ее функциональном аналоге нового поколения — Genmo.
Под монетизацией креативного продукта часто обобщенно понимают комплекс действий, направленных на извлечение финансовой выгоды из процесса оказания услуг основных и смежных с основной деятельностью направлений, а также сам результат извлечения финансовой выгоды из проекта. Субъектами, извлекающими финансовую выгоду из монетизации креативного продукта с применением технологий нейросетевой визуализации музыки, в текущем исследовании выступают инди-артисты — музыканты, создающие в процессе творческого труда музыку в жанре инди. Специфика деятельности инди-артистов напрямую связана с DIY- и DIT-практиками производства музыкального и аудиовизуального продуктов. Соответственно понятием «альтернативная монетизация» мы определяем способы извлечения артистом финансовой выгоды из творческой деятельности коммерческого характера и медиапродуктов, представляющих собой дополнительные/переработанные/альтернативные версии к оригинальным медиапродуктам изданного аудиовизуального контента артиста.
Эмпирическое исследование призвано установить логические взаимосвязи между категориями медийности артистов с разными показателями численности фан-базы и приростом целевой аудитории артистов за счет публикуемого контента нейросетевых музыкальных клипов.
Под понятием «медийность» в настоящем исследовании понимается эффект высокой упоминаемости артиста музыкальной эстрады в средствах массовой информации. Из наблюдения, что медийные артисты имеют многотысячную и даже многомиллионную фан-базу на видеохостинге YouTube, вытекает гипотеза, что выявление корреляционных коэффициентов среднемесячных показателей просмотров единицы контента на YouTube у медийных артистов с большим фандомом в сравнении с аналогичным показателем у артистов с немногочисленным фандомом позволит рассчитать отношение цены одного досмотра единицы аудиовизуального контента с перспективой расчета ценности монетизации контента от одного подписчика. Такой расчет, в свою очередь, позволит спрогнозировать эффект альтернативной монетизации от размещения артистами и их фанатами нейросетевых клипов на популярные песни артистов.
Дизайн исследования
Предметом настоящего исследования стал потенциал монетизации аудиовизуальных продуктов, визуальный ряд к которым сгенерирован нейросетями.
Шаг 1. Кейс-стади. В качестве референсов для кейс-стади и отслеживания трендов в использовании нейросетей были рассмотрены сгенерированные сервисами ИИ-визуализации музыкальные клипы к песням Юлии Савичевой, к группам “Сream Soda”, «Сектор Газа», «Король и шут», “Deep Purple” и “Gorillaz”. Кроме сравнения количественных показателей просмотров и пользовательских реакций на медиапродукты кейс-стади включали в себя еще и качественные виды анализа: контент-анализ и семантический анализ текстовых реакций пользователей на контент в комментариях и семантический анализ описаний медиапродуктов, добавляемых авторами клипов к описанию музыкальных видео (как правило, в текстовых описаниях указываются применяемые для визуализации нейросетевые сервисы). В результате обобщения данных кейс-стади был сформирован «хит-парад» нейросетевых музыкальных видео с топ-чартами просмотров и указанием нейросетей для визуализации, популярных на российском и мировом рынках. Данные кейс-стади о популярных продуктах визуализационных нейросетей по критерию технологических и художественных решений дальше интерпретировались для прикладного применения в эмпирическом исследовании потенциала альтернативной монетизации собственных аудиовизуальных продуктов артистов лейбла Media Sharks в целях последующих приблизительных расчетов сравнительных коэффициентов.
Шаг 2. Эмпирическое исследование. Слушателям предлагались видеоклипы, сгенерированные нейросетью Kandinsky на песни трех артистов лейбла Media Sharks: Jennie Moz-Art, инди-рок проекта W&V и специально созданного виртуального артиста ЕШШКА, визуальный образ которого был сгенерирован нейросетями «Шедеврум» и Kandinsky. Процесс выбора единиц музыкального контента для нейросетевой визуализации основывался, с одной стороны, на личном интересе экспериментальной творческой группы медиахудожников, объединившихся под творческим псевдонимом «Виктор Смурт», с другой стороны — в соответствии с жанровой политикой лейбла Media Sharks.
Теоретический объект эмпирического исследования представлен совокупностью показателей просмотров/прослушиваний и реакций пользователей видеохостинга YouTube на нейросетевые визуализации музыкальных композиций выбранных артистов, а также производными расчетными количественными показателями среднемесячных просмотров единиц аудиовизуального контента.
Гипотеза исследования строится вокруг предположения о том, что использование нейросетевой визуализации песен инди-артиста на волне популярности феномена нейросетей способно привлечь/возродить внимание слушателя/фаната к музыкальному творчеству артиста [10].
В ходе эксперимента последовательно тестировалась «жизнеспособность» аудиовизуальных продуктов, созданных для артистов ЕШШКА (сингл «Виртуальная я», дата издания: 15 декабря 2023 г.); Jennie Moz-Art (бонус-трек «Ешкин кот», дата издания: 1 декабря 2017 г.); W&V (песни мини-альбома «Отражения»: «Ведьма и вампиры», «Свитер оверсайз», «Танго инферно» и «Ветра»); Jennie Moz-Art (сингл «Мелодия твоей души», дата издания: 21 апреля 2022 г.), нейросетевые клипы к которым были размещены на видеохостинге YouTube. Последовательность публикации медиапродуктов соответствует, с одной стороны, этапам эволюции возможностей нейросети Kandinsky по генерации статичных изображений / динамичной визуализации нарративов песен, с другой стороны, медиаплану и контент-плану лейбла Media Sharks по продвижению релизов артистов в соответствии с задачами эксперимента.
Процесс отслеживания результатов эксперимента был разделен на несколько этапов.
- Опрос фокус-групп по каждому из предложенных медиапродуктов (кроме тестовой песни Jennie Moz-Art «Ешкин кот», для трех опубликованных визуализаций которой собиралась исключительно статистика просмотров на YouTube).
- Замер статистических показателей просмотров/лайков к клипам с нейросетевой визуализацией, размещенным на видеохостинге YouTube, через личные кабинеты артистов (статистические метрики раздела «Творческая студия»).
- Сравнение количественных показателей клипов, участвующих в эксперименте, с эталонными медийными артистами, имеющими опубликованные клипы, созданные с применением нейросетевой визуализации («Сектор Газа», “Deep Purple”, «Король и шут»), и расчет сравнительных коэффициентов отклика подписчиков по параметрам количества просмотров/лайков/комментариев.
Финальный этап аудита результатов эксперимента имеет два сценария: синхронный и диахронический. Синхронный сценарий аудита результатов эксперимента представляет собой еженедельный сбор статистики прослушиваний композиций артистов на стриминг-сервисах Apple Music и VK Music параллельно с анализом данных за соответствующий период на YouTube. В контексте экспериментальной части исследования достаточными для выводов будут данные, собранные из «Творческих студий» личных кабинетов артистов на видеохостинге YouTube. Диахронический сценарий аудита представляет собой поквартальное сравнение динамики статистических показателей просмотров нейросетевых клипов к песням артистов на YouTube с данными отчетов о платных стримах, получаемых лейблом Media Sharks раз в три месяца в соответствии со сроками налогово-отчетных периодов от дистрибьютора — Believe Digital. В настоящий момент ввиду доступности данных отчета о дистрибьюции за четвертый квартал 2023 г. и прогнозируемости времени доступности отчета о дистрибьюции за первый квартал 2024 г. ближе к началу мая 2024 г. в настоящей статье будут отражены только результаты синхронного аудита.
1. Кейс-стади трендов нейросетевой визуализации музыкальных клипов медийных артистов
1.1. Первооткрыватели нейросетевых клипов в России и в мире
Первое упоминание о создании музыкальных клипов с нейросетевой визуализацией в российском медиаполе появилось с публикацией в газете «Метро» в связи с историей успеха группы “Cream Soda” [11]. В статье, посвященной дебютному для звезд отечественной эстрады нейросетевому клипу на песню «Меланхолия» группы “Cream Soda”, уточнялось, что прецедент построчной нейросетевой визуализации нарративов песенной лирики популярных музыкальных коллективов продолжает мировые тренды развития генеративного медиаискусства, активно внедряемые в музыкальный продукт артистов высокоразвитых креативных стран.
Клип на песню «Меланхолия» [11], как следует из описания к медиапродукту на видеохостинге YouTube, был создан медиахудожниками Денисом Ширяевым и Алексеем Федоровым, автор идеи визуализации — Антон Дворсон. При создании клипа использовалась батарея визуализационных нейросетей, которая включала сервисы CLIP, StyleGAN2, BigGAN, изобретенные авторами программных инструментов Уиллом Стедденом, Джереми Торманом, Майклом Алафризом, Филом Уангом и Райаном Мадроком. Опубликованная за сутки до даты премьеры нейросетевого клипа «Меланхолия» статья в сетевом издании «Правила жизни» (ранее Esquire) [13] сообщала, что музыканты группы — Анна Романовская, Илья Гадаев и Дима Нова — предлагали медиахудожникам поэкспериментировать с отбором видеоряда нескольких альтернативных нейросетей к слову «меланхолия» на припеве песни, поскольку нейросети генерировали «совсем мрачные образы», по словам артистов. Результирующий видеоряд первого нейросетевого музыкального клипа представляет собой квадратные сменяющиеся нейросетевые генерации эклектичного визуала на поэтические строки песни «Меланхолия» в виде анимированных GIF-изображений в постмодернистской эстетике, смонтированные синхронно под фонограмму. Склейки линейного монтажа не обработаны, продолжительность одной визуализационной микросцены не превышает четырех секунд с целью удержать внимание зрителя.
Клип собрал 2 201 273 просмотра с момента размещения на видеохостинге YouTube 23 апреля 2021 г. При общем количестве 65 800 подписчиков официального YouTube-канала артиста “Cream Soda” 11 000 пользователей (примерно 16,7% общего числа подписчиков канала артиста) отметили клип реакцией «нравится», 551 пользователь (0,83% общего числа подписчиков) отреагировал на нейросетевой клип комментариями, содержание которых отчасти ностальгическое — о распаде группы, отчасти хвалебное, и есть сравнение визуала с работами польского художника Здислава Бексинского.
Исторически восстановить прецедент мирового первенства генерации дебютного музыкального видео с помощью генеративных нейросетей по данным открытых источников было намного сложнее: так, среди 342 000 000 выдаваемых в Google результатов поиска по ключевым словам “first music video generated by ai” обнаруживается информация о том, что первое в истории креативных индустрий музыкально-визуальное слайд-шоу было создано Джозефом Штерном и Эдвардом Марком к аудиозаписи их песни “A Little Lost Child” [14] в конце XIX в., а первое полностью искусственно-интеллектуальное музыкальное видео было размещено на видеохостинге YouTube 24 ноября 2023 г. Оно представляет собой дебютную композицию полностью нейросетевого артиста Anna Indiana “Betrayed by this Town”, созданную нейросетями коллектива промпт-инженеров A1-ECR Big Data Analytics [16] с применением генеративной нейросетевой 3D-мультипликации для визуализации образа юной артистки-подростка, поющей об одиночестве в городе, с музыкальным материалом в тональности си-мажор на остинатный популярный в массовой повсеместно распространяемой музыке гармонический ход «I — V — vi — IV», по аналогии с бесконечным попурри мировых хитов “4 Chords” в исполнении “The Axis of Awesome” [17].
В контексте обсуждаемой в рамках настоящего исследования темы монетизации нейросетевого контента важно отметить, что количество подписчиков YouTube-канала A1-ECR Big Data Analytics составляет 674 человека, количество просмотров музыкального видео “Betrayed by this Town” с момента отгрузки единицы контента на видеохостинг YouTube — 33 217 просмотров, видео собрало 251 комментарий от пользователей YouTube. Данные показатели свидетельствуют о том, что количество просмотров и комментариев похоже на реалистичное, которое естественным образом могло быть получено от живых людей после размещения информации о видео на тематическом форуме.
Начиная с конца апреля 2024 г. ситуация с обнародованием генеративных визуализационных инструментов нейросети Sora поделила индустрию на «до» и «после»: если еще в десятых числах апреля 2024 г. поисковой запрос в Google на комбинацию ключевых слов “first music video generated by ai” выдавал в первых строках информацию о песне “A Little Lost Child”, то в начале мая 2024 г. с представлением инструментов Sora первые пять позиций поисковой выборки в Google стали выдавать в качестве первого музыкального нейросетевого видео информацию о дебютном нейросетевом клипе на композицию артиста Washed Out “The Hardest Part” с использованием нейросети Sora [18].
О выпуске нейросетевого клипа, созданного в онлайн-редакторе Sora, рекорд-лейбл Sub Pop, представляющий творчество артиста Washed Out, сообщил изданию Los Angeles Times в дату релиза новой песни — 2 мая 2024 г. В статье Элизабет де Луна для онлайн-издания mashable.com [19] приводятся цитаты из интервью режиссера Пола Трилло, который за шесть недель с нулевым бюджетом на клип смонтировал 55 микросцен, сгенерированных по текстовым запросам нейросетью Sora по бесплатной подписке.
Кроме новости о релизе первого официального медиапродукта, сгенерированного нейросетью Sora, в статье Элизабет де Луна приводятся другие релевантные примеры антропоморфно-нейросетевого творчества популярных артистов, таких как K-pop бэнд Seventeen с намеренно нейросетевым клипом к композиции “MAESTRO” [20], тизер на который за две недели с даты публикации (24 апреля 2024 г.) собрал 1 724 836 просмотров на видеохостинге YouTube, и вышедший днем ранее, 23 апреля 2024 г., клип группы RIIZE “Impossible” AI Generated Visualizer, недоступный для просмотра в России из-за геополитических ограничений, но собравший за первые две недели 158 783 просмотра и 13 000 лайков на YouTube, по открытым данным видеохостинга [21].
Анализируя визуальный ряд первого официального клипового продукта нейросети Sora на композицию артиста Washed Out “The Hardest Part” [22], следует отметить, что по стилю визуального решения клип приближен к реалистичному видео. Динамичный темпоритм гиперпоп-композиции подчеркивается скоростью движения в микросценах клипа. Любопытная деталь, определяющая узнаваемость применения практик нейросетевого генеративного медиаискусства в создании клипа — образ главной героини, задаваемый по промпту: «Симпатичная рыжая кудрявая девушка». Похожий тиражируемый образ визуализации персонажей женского пола встретится далее по тексту статьи в описании нейросетевого клипа на песню «Кукла колдуна» группы «Король и шут», созданного с применением нейросети Stable Diffusion, и обнаружит портретные сходства с образом артиста Jennie Moz-Art и сквозного персонажа ведьмы в нейросетевых клиповых экспериментах авторов исследования. За девять дней с даты релиза на видеохостинге YouTube нейросетевой клип к песне “The Hardest Part” собрал 204 543 просмотра и 4300 лайков от пользователей видеохостинга при общем количестве 40 800 подписчиков на канале артиста Washed Out.
В 2020 г. Анджелос Чатзимпарас, Рафаэль Мартинз и группа исследователей опубликовали статью «Опрос об опросах по использованию визуализации для интерпретации моделей машинного обучения» [23], в которой описываются методы и результаты широкого библиометрического анализа публикаций, посвященных теме визуализации с помощью моделей машинного обучения. Ключевой вывод из статьи относится к размышлению авторов о модели метаисследований и применении такой модели к поиску научной информации для построения иерархических мультипараметрических систем анализа данных, что в контексте обсуждаемой проблемы нейросетевой визуализации музыки позволяет выбрать релевантные параметры для оценки результатов совместной деятельности человека и нейросетей в создании нейросетевых музыкальных клипов.
Частным случаем популярных исследовательских запросов является пара ключевых слов “text visualisation”. Так, в цитируемой авторами статье Денга, Донга и коллектива авторов “Imagenet: A large-scale hierarchial image database”, опубликованной по результатам проведения в 2009 г. конференции IEEE, посвященной вопросам компьютерного зрения и распознаванию паттернов, описывались принципы работы базы данных ImageNet, построенной в логике онтологии конструирования образов на основании структуры сети WordNet и обученной на распознавании 3,2 млн изображений [24]. Интерпретация материалов статьи Денга, Донга и коллектива авторов в контексте текущего исследования состоит в том, что подобные публикации мозаично представляют собранное научное знание о развитии моделей машинного обучения, связанных с визуализацией текста, однако на данный момент в глобальном и отечественном академических дискурсах еще не сформировался системный подход к изучению пользовательского восприятия продуктов нейросетевых музыкальных клипов. Это можно объяснить тем, что сами технологии нейросетевой мультипликации стали появляться на массовом рынке только с 2023 г. и исследовательская дискуссия еще не успела сформироваться за короткий промежуток времени, поскольку только в ноябре 2023 г. был представлен полностью нейросетевой мультипликационный артист с генеративным музыкальным материалом.
Логика кейс-стади, предлагаемого в качестве поискового этапа в исследовании, предполагает построение «хит-парада» нейросетевых музыкальных клипов медийных артистов на основании поисковых запросов “ai music video” / «музыкальный клип нейросеть» на видеохостинге YouTube, начиная с композиции артиста “Сream Soda” «Меланхолия» и далее, отталкиваясь от истории просмотров видео, анализируемой алгоритмами YouTube. В целях выявления потенциала монетизации стриминговой музыки внимание при анализе поисковой выборки будет обращено на количество подписчиков на канале артиста / производителя нейросетевых клипов, количество просмотров видео от момента публикации до даты просмотра, количество и качество комментариев от пользователей видеохостинга. Метаданные текстовых описаний к нейросетевым клипам будут проанализированы на предмет наличия информации об использованной в производстве контента генеративной нейросети, что даст ответ на вопрос о технологических трендах нейросетевой визуализации, и на предмет истории создания нейросетевого музыкального видео, что даст ответ на вопрос об институциональных связях производителя единицы контента с артистом, чья музыка использовалась в качестве источника вдохновения к нейросетевой мультипликации. Интерпретация собранных данных поможет ответить на вопрос об источнике дополнительной монетизации и количественных характеристиках, достаточных для монетизации стримингового контента условий (количество просмотров, количество подписчиков).
1.2. «Хит-парад» нейросетевых музыкальных клипов медийных артистов в России и в мире
Первичные данные сравнительного анализа количественных показателей просмотров, пользовательских реакций и комментариев в отношении нейросетевых видео исследуемых референсных артистов российской и мировой музыкальной сцены (источник: видеохостинг YouTube) представлены в табл. 1.
Таблица 1. Сравнительный анализ популярности нейросетевых музыкальных клипов артистов российской и мировой музыкальной сцены (дата создания таблицы: 12 апреля 2024 г.)
Позиция | Артист | Композиция | Количество просмотров | Количество лайков / комментариев | Использованная нейросеть | Количество подписчиков на канале артиста |
1 | “Deep Purple” | “Child in Time” | 2 780 768 | 43 000 / 0 | Stable Diffusion | 11 200 |
2 | “Сream Soda” | «Меланхолия» | 2 201 273 | 11 000 / 551 | CLIP, StyleGAN2, BigGAN | 65 800 |
3 | «Король и шут» | «Камнем по голове» | 1 823 815 | 16 000/ 674 | Midjourney | 16 200 |
4 | “Deep Purple” | “Smoke on the Water” | 1 100 000 | 43 000 / 1980 | Сhiba Film | 1 199 000 |
5 | «Король и шут» | «Кукла колдуна» | 430 221 | 10 000 /525 | Stable Diffusion, GPT-4 | 64 400 |
6 | «Сектор Газа» | «Твой звонок» | 411 000 | 8600 / 542 | GPT-4 | 64 400 |
7 | «Сектор Газа» | «Мумия» | 343 000 | 5700 / 502 | GPT-4 Deforum | 64 400 |
8 | Юлия Савичева | «Девочка» | 150 818 | 3500 / 181 | Genmo? | 305 000 |
9 | “Gorillaz” | “Kids with Guns” | 964 | 91 / 0 | Midjourney, Stable Diffusion Video, Topaz Video | 11 700 |
Интерпретация собранных количественных и качественных данных, представленных в описаниях к проанализированным нейросетевым клипам (табл. 1), включает в себя несколько существенных для эмпирической части исследования наблюдений.
- Качество фан-базы артиста влияет на количество реакций. У артистов “Deep Purple” (клип к композиции “Smoke on the Water”), Юлии Савичевой (нейеросетевое mood-video к композиции «Девочка»), “Сream Soda” (клип к песне «Меланхолия») клипы размещены на официальных YouTube-каналах артистов, где их может прямо без посредников смотреть целевая аудитория подписчиков канала. Это обеспечивает высокий процент открытого отклика фанатов на творчество артистов.
- Размещение нейросетевых клипов артистов в креативных сообществах и на каналах нейросетевых медиахудожников неоднозначно влияет на отклик аудитории. Сообщество Neural Madness (youtube.com/@Neural-madness; 64 400 подписчиков), нейросетевые художники Ben Gillin (https://www.youtube.com/@BenGillin; 11 700 подписчиков) и Soldesign72 (https://www.youtube.com/ @soldesign72; 11 200 подписчиков), выкладывающие на свои каналы создаваемые ими нейросетевые видео для артистов, алгоритмами YouTube, разумеется, зарабатывают себе количество дополнительных просмотров, обеспечивая высокий процент поисковой выдачи и улучшая видимость собственного бренда в YouTube, но делят роялти с артистами, музыка которых использована при генерации видео — аналитические алгоритмы YouTube подгружают релиз музыкальной композиции и указывают информацию о правообладателях. C другой стороны, небольшое количество просмотров видео с известным артистом (как в случае с композицией “Gorillaz” “Kids with Guns”) неоднозначно воспринимается как поклонниками артиста, так и подписчиками канала медиахудожника.
- Формирование визуальной эстетики генеративной клиповой анимации. В результате проведенного визуального исследования проанализированных девяти музыкальных клипов с нейросетевой визуализацией вместе с контент-анализом пользовательских комментариев и реакций под видео было выявлено три базовых подхода к созданию нейросетевой визуализации музыкальных произведений:
а) слайд-шоу со статичными / частично анимированными изображениями, подобранными/сгенерированными под сюжетную линию нарратива вокальной строки с применением подходов промпт-инжиниринга и добавлением чата GPT-4 в батарею нейросетей для генерации текстовых описаний нейросети-визуализатору;
б) аниматик музыкального мультипликационного фильма, создаваемый путем монтажа анимированных сцен, срежиссированных фантазией нейросетевого медиахудожника/креатора и затем смонтированных в приложении для видеомонтажа;
в) комбинированный нелинейный монтаж абстрактных и космогонических изображений, генерируемых нейросетями Stable Diffusion / Midjourney поверх традиционного видеоряда музыкального клипа.
Наряду с техниками монтажа клиповых сцен к особенностям генерации у визуализационных нейросетей также могут относиться типичные ошибки визуализации конечностей: количество рук, ног, пальцев, хоботов, крыльев и кинематика их движения, а также стереотипные образы персонажей. Так, целевая аудитория генеративного клипа «Кукла колдуна» (группа «Король и шут»), созданного с использованием нейросети Stable Diffusion, в комментариях к клипу обсуждает «лояльность» нейросети к образу рыжей ведьмы (под видеоклипом в декабре 2023 г. комментарий пользователя @user-wr4nd7pu8l: «Нейросеть явно питает нежные чувства к рыженьким:)» собрал 1200 лайков и 56 ответов).
Приведенный пример демонстрирует способность нейросетей к последующей генерации образов сквозных персонажей, что позволяет в клипах на разные песни обращаться к сторителлингу легенды артиста.
Вдобавок к уже упомянутым выше типичным ошибкам генерации анимированных и, в меньшей степени, статичных изображений «необучаемые» общедоступные нейросетевые инструменты пока проявляют плохую избирательность при формировании внешности персонажей. Бывает трудно получить двух человек с разным цветом волос, мужской и женский образы порой меняются чертами — у женщины появляется борода, а у мужчины — юбка и длинные волосы.
Описанные примеры ошибок нейросетевой визуализации антропоморфных персонажей можно отнести как к «точкам роста» по доработке алгоритмов визуализации в генеративных нейронных сетях, так и к специфике генеративной нейросетевой мультипликации с использованием массово распространяемых на рынке визуализационных нейросетей в текущем состоянии их технологического развития на момент зимы/весны 2023–2024 гг.
- Лицензирование контента и охраноспособность нейросетевых музыкальных клипов. Два наблюдения, относящиеся к проведенному кейс-стади, касались вопросов охраноспособности аудиовизуальных продуктов, созданных с нейросетевой визуализацией: а) размещение логотипов видеоредакторов и брендов музыкальных нейросетей непосредственно поверх визуала клипов и б) текстовые описания с указанием имен, брендов и ролей всех участников творческой группы в части нейросетевой визуализации со ссылками на личные страницы специалистов в социальных сетях. Размещение логотипа компании-производителя визуализационной нейросети поверх визуального ряда клипа подтверждает, что автор/производитель аудиовизуального продукта согласен с фактом принадлежности личных имущественных прав на единицу контента компании — поставщику визуализационной нейросети.
В соответствии со ст. 1257 ГК РФ автором произведения [...] признается гражданин, творческим трудом которого оно создано. Однако п. 1 ст. 1300 ГК РФ «Информация об авторском праве» гласит: «Информацией об авторском праве признается любая информация, которая идентифицирует произведения, автора или иного правообладателя, либо информация об условиях использования произведения, которая содержится на оригинале или экземпляре произведения, приложена к нему или появляется в связи с сообщением в эфир или по кабелю либо доведением такого произведения до всеобщего сведения, а также любые цифры и коды, в которых содержится такая информация» [25]. В соответствии с ч. 3 ст. 1250 ГК РФ «Защита интеллектуальных прав» предусматривается доказательство отсутствия вины в нарушении интеллектуальных прав лицом, нарушившим интеллектуальные права. Из этого следует, что если автор единицы аудиовизуального контента, произведенного с использованием визуализационных нейросетей, не читал условия лицензионного соглашения пользователя при первом и последующих использованиях нейросети, то это не освобождает автора единицы контента от соблюдения условий лицензионного соглашения пользователя, в котором кроме прочего могут быть прописаны ограничения на публикацию единицы аудиовизуального контента. Данные обстоятельства авторам цифрового контента и медиахудожникам следует учитывать при тестировании нейросетевых инструментов.
2. Эксперименты нейросетевой визуализации творчества инди-артистов лейбла Media Sharks
Основанный на принципах промпт-инжиниринга творческий метод взаимодействия медиахудожника под творческим псевдонимом Виктор Смурт с нейросетями для генерации изображений состоял в разработке текстовых описаний визуализируемых объектов. В качестве таких объектов выступали как сцены в поэпизодной раскадровке сюжета, так и визуальные образы персонажей — главных и второстепенных героев клипа, а также непроизвольно возникшие или намеренно выбранные медиахудожником детали, отражающие оттенки передаваемых музыкальным повествованием настроения, образа, дополнительной сюжетной линии или элемента творческой вселенной артиста.
Для антропоморфных персонажей в промптах задавались основные черты внешности, например «Девушка с короткими кудрявыми волосами в кожаной куртке» (см. рис. 1). При этом разные нейросетевые инструменты выдавали некий типичный образ, который можно было модифицировать оценочными определениями: красивая, грустная, сердитая, веселая и т.п.
Рис. 1. Вариант визуализации промпта «Серьезная девушка с короткими кудрявыми волосами в кожаной куртке» (источник: нейросеть Kandinsky, стиль: киберпанк)
Фантазийные персонажи, не существующие в действительности, задавались по внешнему сходству с кем-то известным, находящимся в базе изображений нейросети. Например, для визуализации Ехарного Бабая использовалось описание «Добрый смешной гоблин» (рис. 2).
Рис. 2. Нейросетевая визуализация Ехарного Бабая. Промпт «Добрый смешной гоблин» (источник: нейросеть Kandinsky, стиль: рисунок карандашом)
В сценах с действиями героев их движения указывались в промптах обобщенно. Добиться генерации сцены, где, например, кот ловит муху, с точной визуальной передачей действия от нейросети было невозможно. В некоторых случаях ИИ даже дорисовывал движения самостоятельно, правда, иногда невпопад.
В отличие от традиционного подхода с длительным «обучением» нейросетевого инструмента, когда производится множество последовательных генераций, в ходе которых промпт корректируется и уточняется с целью добиться желаемого результата, в данном случае медиахудожник во многом полагался на «фантазию» искусственного интеллекта, подстраивая промпты под сгенерированные им изображения и сцены. Возникающий визуальный ряд мог отклоняться от первоначального замысла и получать спонтанные линии развития, а образы персонажей приобретали неожиданные черты. Взаимодействие с нейросетью происходило в режиме своеобразного «потока сознания», рождающего по ходу смыслы и фантасмагорические и порой абсурдные ассоциации, но иногда они обостряли драматургию сюжета и поднимали визуализацию конкретных нарративов в клипе на уровень псевдофилософского обобщения.
Придумывая промпты, отбирая и монтируя сгенерированные нейросетью материалы для клипа, человеку приходится сталкиваться с необходимостью пожертвовать точностью иллюстрирования содержания песни ради большей оригинальности и яркого впечатления. С этой точки зрения сложнее визуализировать истории, основанные на конкретных действиях персонажей, на нюансах переживаний или бытовых деталях, — эти моменты нейросеть «понимает» и реализует хуже всего. Выигрышными оказываются сюжеты, допускающие вольную визуальную трактовку и импровизацию.
При генерации статичных изображений возможности контроля значительно выше, чем при анимации. У нейросети Kandinsky в статике доступен выбор из 18 стилей, в тексте промпта можно указывать крупность, ракурс, глубину детализации и другие параметры. В зависимости от выбранного стиля объект получается более конкретным или, наоборот, более условным. Некоторые стили, например киберпанк или хохлома, значительно сужают разнообразие — на выходе все объекты получаются похожими. Наиболее детального соответствия запросу удается добиться в стилях цифровая живопись и рисунок карандашом.
Более точные в передаче нарративов клипы в виде слайд-шоу из статичных изображений представляются менее визуально привлекательными, чем анимационные. Творческое взаимодействие с нейросетями более полно реализуется при создании анимированных сцен. Здесь Kandinsky, с одной стороны, не позволяет получить в видеоряде какие-то значимые для сюжета детали, но с другой — привносит элемент неожиданности, добавляет образам динамики и причудливо трансформирует их. Объекты растягиваются и перетекают друг в друга, создавая захватывающий эффект.
Ход эксперимента в следующих подпунктах данного параграфа будет раскрываться в соответствии с хронологией событий.
2.1. Портрет целевой аудитории Jennie Moz-Art и ассоциированных инди-артистов
Фокус-группа для опросов целевых потребителей музыкального продукта инди-артистов Jennie Moz-Art, W&V и ЕШШКА в случае первого проведенного эксперимента с оценкой нейросетевой визуализации клипа артиста ЕШШКА «Виртуальная я» была собрана на основе портретов целевой аудитории артиста Jennie Moz-Art по данным из «Творческой студии» YouTube (рис. 3) из числа социально активных контактов артиста.
Рис. 3. Пол и возраст целевой аудитории артистки Jennie Moz-Art: данные личного кабинета артиста в «Творческой студии» видеохостинга YouTube с 01.11.2023 по 15.12.2023
Из инфографики видно, что ядром целевой аудитории артистки Jennie Moz-Art являются мужчины (63,6%) в возрастном диапазоне от 25 до 54 лет и женщины (36,4%) в возрастном диапазоне от 18 до 54 лет. Приняв эти данные за исходные, авторы исследования создали три опроса по продуктам нейросетевой генерации мультфильмов для производных артистов — полунейросетевой-полуантропоморфной певицы ЕШШКА и живого антропоморфного инди-рок-дуэта W&V. Для последующих опросов формирование фокус-группы происходило по принципу добавления к ядру желающих продолжать участие в экспериментах лояльных целевых потребителей новых респондентов, чья профессиональная деятельность и/или музыкальные интересы связаны с инди-музыкой и генеративным искусством. Таким образом, динамика приращения ядра целевых потребителей экспериментального музыкального контента с нейросетевой визуализацией позволяла проанализировать дополнительный параметр — процент удержания лояльности зрителя/слушателя к новым медиапродуктам оцениваемого артиста.
Сравнительный анализ портретов целевой аудитории артистов ЕШШКА и W&V представлен на рис. 4.
Рис. 4. Пол и возраст целевой аудитории артистов ЕШШКА (а) и W&V (б). Данные из личных кабинетов артиста (ЕШШКА — источник: лейбл Media Sharks, W&V — источник: YouTube-канал Witch&Vamps)
Поскольку в целях чистоты эксперимента ни один продукт нейросетевой генерации не сопровождался таргетированной рекламой, показатели количества просмотров на YouTube для нейросетевого клипа «Виртуальная я» артиста ЕШШКА не позволили алгоритмам YouTube описать пол и возраст аудитории клипа. В этой связи крайнюю левую дату замеров активности аудитории для канала лейбла Media Sharks было решено сдвинуть на один год назад — с 25 декабря 2022 г. по 25 декабря 2023 г. В этот период к контенту лейбла наибольший интерес проявляли зрители мужского пола в возрасте от 35 до 44 лет (31,7% пользователей), чуть менее активны были зрители в возрастных группах от 45 до 54 лет (25,1% пользователей) и молодежь в возрасте от 25 до 34 лет (24,4%). Здесь можно увидеть расширение целевой аудитории артистки Jennie Moz-Art в сторону привлечения внимания более юных зрителей (8,9% дополнительных целевых подписчиков в возрасте от 18 до 24 лет) и более возрастных зрителей (25,1% пользователей в возрасте от 45 до 54 лет и 7,5% пользователей в возрасте от 55 до 64 лет).
Для YouTube-канала Witch&Vamps диапазон дат выставлялся с 20 января 2024 г. (дата создания канала) по 19 февраля 2024 г. (плюс неделя от даты размещения нейросетевых клипов к песням «Ведьма и вампиры» и «Свитер оверсайз»). В выбранный период контент канала просматривали 76,2% мужской и 23,8% женской аудитории с наибольшей активностью пользователей возрастной группы от 35 до 44 лет (35,5% общего количества зрителей канала).
Как видно из приведенных данных, зрительские аудитории каналов Jennie Moz-Art Official и дуэта W&V (рис. 3, 4) в целом совпадают по критерию аватара целевого зрителя/слушателя. Это мужчина в возрасте от 35 до 44 лет, ежедневно или несколько раз в неделю потребляющий развлекательный аудиовизуальный контент с музыкой в стиле инди и инди-рок и увлекающийся изучением новых технологий, включая генеративные нейросети. В отношении предпочтений визуализации контента для такого целевого потребителя была сформулирована гипотеза, представленная в п. 2.1.1 настоящей статьи, о выборе образов героев и цветовой гаммы исходя из популярности единиц контента основного артиста (рис. 5) с дальнейшим уточнением параметров визуализации на основании данных опросов фокус-групп для релевантных категорий респондентов.
Рис. 5. Топ-5 самых популярных музыкальных видео артистки Jennie Moz-Art. Данные личного кабинета артиста в «Творческой студии» видеохостинга YouTube с 01.04.2007 по 15.12.2023
После проведения каждого опроса даты заполнения опросника последним респондентом фиксировались как контрольные точки для замеров активности пользователей видеохостинга YouTube в плане целевых действий: просмотров анализируемых клипов/лайков/комментирования. Хронология фиксации контрольных точек замеров активности представлена в табл. 2.
Таблица 2. Даты размещения нейросетевых мультипликационных музыкальных клипов на видеохостинге YouTube и хронология проведения опросов фокус-групп по реакции на нейросетевые видео артистов ЕШШКА, Jennie Moz-Art и W&V
Позиция | Единица контента | Дата выгрузки на YouTube | Дата заполнения опроса последним респондентом | Дата последней активности зрителей музыкального видео | Суммарное количество просмотров музыкального видео |
1 | «Виртуальная я» | 15.12.2023 | 25.12.2023 | 12.04.2024 | 94 |
2 | «Ешкин кот» (1) [26] | 29.08.2023 | – | 03.04.2024 | 237 |
3 | «Ешкин кот» (2) [27] | 29.08.2023 | – | 03.03.2024 | 98 |
4 | «Ешкин кот» (новогодний) [28] | 25.12.2023 | – | 12.03.2024 | 143 |
5 | «Ведьма и вампиры» [29] | 12.02.2024 | 24.03.2024 | 12.04.2024 | 169 |
6 | «Свитер оверсайз» [30] | 12.02.2024 | 02.03.2024 | 12.04.2024 | 225 |
7 | «Танго инферно» [31] | 12.02.2024 | – | 11.04.2024 | 97 |
8 | «Ветра» [32] | 12.02.2024 | – | 11.04.2024 | 83 |
9 | «Мелодия твоей души» [33] | 23.02.2024 | – | 12.04.2024 | 1524 |
Как видно из табл. 2, для трех аудиовизуальных продуктов — композиции «Виртуальная я» артиста ЕШШКА, композиций «Ведьма и вампиры» и «Свитер оверсайз» артиста W&V — пользовательская активность зрителей не прекращалась на 12 апреля 2024 г., что косвенно подтверждает справедливость замечания об эффективности кампании опросов для вовлечения пользователей в просмотр контента.
Чем ближе дата последней активности зрителей музыкального видео к текущей календарной дате работы над статьей (в случае замеров крайней датой являлось 12 апреля 2024 г.), тем выше субъективная эффективность кампании с нейросетевыми мультипликационными клипами на песни артистов лейбла Media Sharks при условии, что суммарное количество просмотров клипов за период с момента публикации до момента замеров контрольных точек пользовательской активности суммировалось с количеством просмотров/прослушиваний основного аудиовизуала релизов.
Данные сравнения двух показателей количества просмотров контента в видео оригинала и нейросетевых видео артистов представлены в табл. 3.
Таблица 3. Сравнительный анализ количества просмотров оригинальных музыкальных видео и нейросетевых мультипликационных клипов к избранным песням артистов ЕШШКА, W&V, Jennie Moz-Art, участвовавших в качестве единиц контента в опросах фокус-групп целевой аудитории артистов с 15.12.2023 по 15.03.2024
Позиция | Единица контента (оригинал) | Количество просмотров оригинального музыкального видео | Нейросетевой мультфильм | Количество просмотров нейросетевого мультфильма |
1 | «Виртуальная я» [34] | 24 | «Виртуальная я» (сингл, 2023) [35] | 273 |
2 | «Ведьма и вампиры» (live reheardal) [36] | 624 | «Ведьма и вампиры» (мульт.) [37] | 240 |
3 | «Я уеду жить в свитер» (lyric video) [38] | 640 | «Свитер оверсайз» (мульт.) [39] | 304 |
4 | «Мелодия твоей души» [40] | 6478 | «Мелодия твоей души» (Kandinsky visualisation, 2024) [41] | 1615 |
Как видно из данных табл. 3, в сравнительном анализе количества просмотров аудиовизуального контента можно условно выделить два тренда: 1) больше просмотров оригинала аудиовизуального контента, чем нейросетевой визуализации (у композиций W&V «Ведьма и вампиры», Jennie Moz-Art «Я уеду жить в свитер», «Мелодия твоей души»); 2) больше просмотров нейросетевой визуализации песни, чем оригинала аудиовизуального контента (ЕШШКА «Виртуальная я»). Первый тренд объясняется в случае артиста W&V более высокой популярностью репетиционного видео к песне «Ведьма и вампиры» по сравнению с нейросетевым мультфильмом, продиктованной интересом аудитории к живому концертно-репетиционному исполнению артистами песни, которая понравилась чуть раньше в виде мультфильма. В случае композиции «Свитер оверсайз», нейросетевой мультфильм которой сопоставлялся с лирик-видео к оригиналу песни Jennie Moz-Art «Я уеду жить в свитер», вышедшим в 2023 г., сравнительно более высокая популярность оригинала песни может обсуждаться при дальнейшем расчете коэффициента среднемесячного количества просмотров единицы контента, который будет рассчитан и рассмотрен далее в п. 3 настоящей статьи. С композицией «Мелодия твоей души», к которой нейросетевая мультипликация вышла 23 февраля 2024 г., аналогичным образом объяснение разницы количества просмотров должно базироваться на расчете среднемесячного количества просмотров единицы контента.
2.1.1. Генерация Ешки и Ешкина пантеона
Для того чтобы определить понравившиеся целевой аудитории ранее изданные медиапродукты артистки Jennie Moz-Art в контексте выбора нарративов и образов для визуализации нейросетевых клипов, рассматривалось творчество артистки, изданное с момента начала ведения канала на YouTube (01.04.2007) до планируемой даты релиза первого нейросетевого видео (15.12.2023).
Для выбранного диапазона дат был дополнительно снят замер популярности контента в разделе «Лучшие видео» (рис. 5).
Представленные на рис. 5 четыре музыкальных видео сопровождают синглы Jennie Moz-Art, а пятое видео внизу чарта — композиция «С Новым годом» — включена в альбом «Рождественские фантазии», вышедший в декабре 2019 г. Учитывая тематические и сезонные предпочтения целевой аудитории артистки, а также личные пожелания ее студентов, было решено начать эксперимент по нейросетевой визуализации с создания генеративного видеоряда к песне «Ешкин кот» из альбома «Летающие объекты».
На рис. 6 представлена сравнительная статистика просмотров нейросетевого клипа-слайдшоу «Ешкин Кот», созданного с визуализациями нейросети Kandinsky, в числе пяти самых популярных музыкальных видео с 15.12.2023 по 31.12.2023.
Рис. 6. Топ-5 самых популярных музыкальных видео артистки Jennie Moz-Art. Данные личного кабинета артиста в «Творческой студии» видеохостинга YouTube с 15.12.2023 по 31.12.2023
Как заметно из названий и обложек музыкальных видео, все клипы, кроме композиции «Мелодия твоей души», относятся к новогодней тематике. При этом вышедший 24 декабря 2023 г. музыкальный клип «Ешкин Кот» (новогодний) бьет рекорды просмотров, демонстрируя самую высокую популярность (532 органических просмотра за восемь дней, которые затем алгоритмы YouTube обнуляют) и толерантность зрителя к длительности просмотра (1:08 минут непрерывного просмотра и прослушивания композиции).
На основании оценки количественных характеристик зрительских реакций (средняя продолжительность просмотров, количество просмотров) клипы «Ешкин Кот (новогодний)» и «Мелодия твоей души» были признаны лидерами эффективности нейросетевой визуализации творчества артистки Jennie Moz-Art.
2.1.2. Сингл «Виртуальная я» и мистификация нейросетевого артиста ЕШШКА
Выявленные в ходе предыдущего исследовательского шага предпочтения целевой аудитории артистки Jennie Moz-Art — видеть в клипах на песни инди-композитора в качестве визуала яркие образы празднично наряженной дивы, поющей о романтических сюжетах и чувствах — вдохновили творческий коллектив авторов настоящей статьи изобрести новый медиапродукт в исполнении полунейросетевого-полуантропоморфного артиста ЕШШКА, используя препарированный чатом GPT-3,5 корпус поэтических текстов, размещенных на ресурсе СТИХИ.РУ (https://stihi.ru/avtor/worldisasong) в разные годы, батарею музыкальных нейросетей для создания музыкальной композиции с текстом и нейросети «Шедеврум» и Kandinsky для создания визуального оформления релиза.
В качестве отправной точки для разработки фигуры артиста был использован сюжет из песни Jennie Moz-Art «Ешкин кот», где главной героиней выступает девочка Ешка, живущая в Барвихе и заботящаяся о своем коте и его друзьях. Основной фокус делался на семантическом анализе стихов о восприятии любви и отношений и на темах творческого эскапизма автора. В результате была выбрана тема одиночества в толпе и вынужденного коммуникативного эскапизма поп-звезды. Окончательный текст песни «Виртуальная я» подвергся многоступенчатому музыкально-семантическому анализу.
Имя нового полунейросетевого-полуантропоморфного артиста — ЕШШКА — было выбрано из-за популярности клипов к песне Jennie Moz-Art «Ешкин Кот», в имени артиста удвоили букву «ш», поскольку варианты написания имени «Ешка»/«Yoshka» в сервисе потоковой музыки Apple Music уже были зарегистрированы за другими артистами. Удвоенная буква «ш» в имени нового артиста вполне соответствовала эстетике нейросетевого генеративного искусства с характерными паттернами добавления дополнительных конечностей (пальцев рук, общего количества ног).
Музыка
- При создании интонационно-ритмического решения вокальной строки из песенного текста использовалась нейросеть Melobytes ai. Далее вокальная строка в исполнении Jennie Moz-Art была записана на диктофон в целях последующей обработки.
- Вокальный профиль исполнителя корректировался нейросетью Voicemod ai — в этой части эксперимента были выявлены базовые корректировки интонационных паттернов по параметру звуковысотности, результат которых показался автору эксперимента логически странным из-за некорректной работы нейросети по выравниванию абсолютной звуковысотности нот в вокальных фразах. Далее полученный от нейросети музыкальный материал был скорректирован композитором на слух, после чего вокальная строка отправилась в нейросеть для создания плейбэка.
- При создании плейбэка использовалась нейросеть generatom ai. Полученный от нейросети сгенерированный музыкальный подклад в заданном стиле был композиционно доработан композитором вручную в редакторе Ableton Live до полного соответствия структуре текста в вокальной строке и доаранжирован дополнительными тембрами баса и синтетического подклада для придания полноценного законченного звучания композиции «Виртуальная я», стилизованной под гиперпоп.
- Музыкальный прототип песни, собранный в редакторе Ableton Live из материала, полученного на предыдущих шагах эксперимента, был выгружен в нейросеть Landr ai для алгоритмического мастеринга.
- Отработанная нейросетью Landr ai композиция была повторно загружена в аудиоредактор Ableton Live для технической экспертизы качества мастеринга. Параметры компрессии и частотной эквализации были скорректированы композитором вручную встроенными инструментами аудиоредактора Ableton Live.
Таким образом, музыка песни «Виртуальная я» была создана композитором в тактике пошагового итерационного творчества совместно с нейросетями Melobytes ai, Voicemod ai, generatom ai и Landr ai и включала в себя доработку/корректуру музыкального материала после каждого шага алгоритмической генерации.
Визуальное оформление медиапродукта
При создании визуального ряда в видео использовалась нейросеть Kandinsky. Нейросеть генерировала динамическую визуализацию сцен по промптам, затем сгенерированные сцены собирались в монтажный материал / «сшивались» в видеоредакторах Icecream 3.0 и PhotoShow Pro. Финальная версия визуального ряда была доработана автором визуализации при помощи добавления встроенных эффектов на отдельные фрагменты динамического визуала припевов по собственному художественному усмотрению.
Итоговые медиапродукты — сингл «Виртуальная я» (https://bfan.link/virtualnaya-ya) и нейросетевой мультипликационный клип [42] с аналогичным названием — были изданы на лейбле Media Sharks с параллельным распространением опроса [43] для фокус-группы целевых потребителей единицы медиаконтента.
Структура опросника включала в себя семь исследовательских блоков и блок информации о респондентах. Логика распределения вопросов внутри исследовательских блоков была организована в соответствии с принципом «от простого — к сложному». Целью опроса было выявление факторов, влияющих на оценочное восприятие нейросетевых продуктов музыкальных артистов потребителями стриминговой музыки, преимущественно имеющими непосредственное профессиональное отношение к производству аудиовизуального контента или увлекающимися музыкой и новыми медиатехнологиями.
Раздел 1 «Общее впечатление от клипа» содержал два вопроса: «Как вам в целом клип?» с вариантами ответов: «а) “Зашел” / б) Не вызвал эмоций / в) Не “зашел”»; «Сколько вам удалось посмотреть/послушать, не останавливаясь, или вы досмотрели клип до конца?» с вариантами ответов: «а) Прослушал до конца / б) Прослушал, проматывая / в) Не дослушал до конца / г) Бросил после первых нескольких секунд».
Раздел 2 «Впечатление от исполнительницы: вокал» содержал четыре вопроса, предлагающие респондентам сравнить тембр вокала артиста ЕШШКА с одним из перечисленных музыкальных исполнителей, включая таких артистов, как LADY GAGA, Jennie Moz-Art, других известных респондентам исполнителей, либо субъективно оценить уникальность вокального исполнения ЕШШКИ путем количественного оценивания степени схожести/уникальности вокала ЕШШКИ от 1 до 5 баллов, где 1 — совсем не похожа на другого исполнителя, 5 — очень похожа на выбранного исполнителя. Финальный вопрос раздела об оценке оригинальности вокального исполнения ЕШШКИ предполагал другую трактовку шкалы: здесь оценка 1 балл означала: ординарная, ничем не примечательная манера — сегодня все так поют, оценка 5 баллов означала: очень оригинальная, необычная подача вокала.
Раздел 3 «Впечатление от исполнительницы: образ» содержал семь вопросов, предлагающих респондентам оценить внешнее сходство визуального образа артиста ЕШШКА с одним из перечисленных артистов, включая Юлию Савичеву, Jennie Moz-Art, Милу Йовович, Тину Тернер, чьи образы были отобраны для сравнения по принципу внешнего субъективного сходства с портретами ЕШШКИ в кадрах нейросетевого клипа «Виртуальная я». Кроме того, предлагалось выбрать из перечня представленных на слайде нейросетевых изображений ЕШШКИ одно, наиболее хорошо визуально отражающее сущность артистки, считываемую зрителем/слушателем из сложного художественного текста песни-клипа при просмотре и прослушивании. Также респондентам предлагалось определить степень сходства портретного образа артиста ЕШШКИ с роботом или голограммой / живым человеком.
Раздел 4 «Впечатление от исполнительницы: легенда и нарратив песни» был представлен одним лаконичным вопросом: респондентам предлагалось выбрать из перечня настроений то, в котором они эмоционально восприняли клип. Вариантами ответа здесь были такие, как «Веселье», «Грусть», «Ярость», «Досада», «Страх», «Безразличие» и «Другое» — вариант, предлагающий респонденту вписать свою эмоцию, не указанную в перечне.
Раздел 5 «Нарративы и трансмедийный потенциал музыкально-нейросетевого продукта» относился к более сложному по степени аналитической включенности респондентов контексту, поэтому выступал в роли факультативного, как и последующие два раздела. В этом разделе содержалось пять заданий, в части которых предлагалось сравнить нарративы песни артиста ЕШШКА «Виртуальна я» со списком музыкальных композиций известных артистов, таких как Линда (песня «Ворона»), Земфира (песня «Знак бесконечность»), LADY GAGA (песня “Poker Face”), Jennie Moz-Art (песня “Empty Ken”), Sia (песня “Chandelier”), Алла Пугачева (песня «Сильная женщина»).
Все артисты и песни в предлагаемом перечне выбирались для сравнения по принципу присутствия в нарративах сравниваемых композиций темы «инаковости», одиночества и вынужденной самостоятельности лирической героини музыкального повествования. Задачей последующих вопросов раздела было определить, насколько респондент в качестве целевого слушателя / зрителя медиапродукта способен воссоздать в своем воображении характер, темперамент, образ жизни, вкусы и предпочтения артиста ЕШШКА, исходя из смыслов, заложенных в тексте песни «Виртуальная я». Еще три вопроса раздела уточняли у респондентов характер целевого действия, которое слушатель/зритель клипа может совершить после просмотра/прослушивания единицы контента, и уточняли прогноз респондента относительно сценариев продолжения истории ЕШШКИ, описанной в песне «Виртуальная я», за пределами сюжета песни в других возможных композициях и форматах.
Раздел 6 «Прогноз креативных коллабораций» для артиста ЕШШКИ — второй опциональный раздел опроса — предлагал респондентам из перечня артистов выбрать тех, с кем они в наибольшей степени вероятности представляли бы себе перспективы творческой коллаборации артиста ЕШШКА в части создания новых аудиовизуальных продуктов и возможных совместных концертов/шоу, а также уточнял, воспринимают ли респонденты ЕШШКУ как только стримингового виртуального артиста или представляют себе концерт ЕШШКИ подобно концерту знаменитой японской голограммы-вокалоида Hatsune Miku.
Раздел 7 «Жанровый потенциал нейросетевой музыки» — один из самых сложных в опросе — призывал респондентов после повторного прослушивания сингла «Виртуальная я» сфокусироваться именно на ощущениях от услышанной музыки и проанализировать ее в рамках определения жанра (варианты ответов: а) гиперпоп, б) электронная танцевальная музыка, в) инди-музыка, г) кроссовер, д) экспериментальная музыка, е) другое — опция ответа, предлагающая респонденту вписать собственный вариант жанра услышанной песни, если он не был перечислен среди описанных вариантов). Следующие два вопроса раздела уточняли, на какую известную композицию респондентам показалась похожа песня «Виртуальная я», и далее было необходимо количественно оценить в баллах процент оригинальности музыкального материала от 1 балла («Полный плагиат») до 5 баллов («Совершенно оригинальный и аутентичный музыкальный материал»). Финальный вопрос раздела предлагал респондентам выбрать целевое действие, которое слушатель мог бы совершить с музыкальной композицией «Виртуальная я» в разных обстоятельствах повседневной жизни в зависимости от ситуации прослушивания музыки. В качестве вариантов для ответа на финальный вопрос раздела предлагались следующие целевые действия: а) танцевать в клубе; б) поставить мелодию на будильник, чтобы вовремя просыпаться; в) поставить мелодию на звонок к номеру нежелательного контакта; г) уснуть под трек, словно это колыбельная; д) отправить ссылку на клип недругу / неприятному навязчивому человеку; е) отправить ссылку на клип другу / близкому человеку с сообщением: «Обязательно посмотри и послушай»; ж) приступить к отложенным делам, дослушав композицию; з) вариант «Другое», предлагающий респонденту самостоятельно сформулировать предполагаемое им целевое действие после прослушивания музыкальной композиции, не отраженное в списке.
Восьмой раздел опроса содержал вопросы о персональных данных респондентов, включая возраст, пол, род профессиональной деятельности, частоту слушания музыки, выбор предпочитаемого респондентом музыкального стриминг-сервиса, информацию о предпочитаемом жанре музыки, любимых артистах и предложение участвовать в похожих экспериментах. В случае утвердительного ответа респондента на финальный вопрос раздела о желании участвовать в экспериментах респонденту предлагалось оставить контактные данные для обратной связи.
В пилотном опросе об оценке свойств нейросетевого клипа «Виртуальная я», структура которого описана выше, приняли участие 42 человека (мужчины и женщины) в возрасте от 18 до 65 лет, преимущественно творческих профессий (рис. 7, 8).
Рис. 7. Пол и возраст респондентов опроса об оценке свойств нейросетевого клипа «Виртуальная я»
Рис. 8. Род занятий респондентов опроса об оценке свойств нейросетевого клипа «Виртуальная я»
Результаты пилотного опроса о восприятии респондентами песни артиста ЕШШКА «Виртуальная я» показали, что до конца нейросетевой клип полувиртуальной артистки ЕШШКА досмотрели около половины участников опроса, бросили смотреть после первых секунд около 10% (рис. 9).
Рис. 9. Ответы респондентов на вопрос: «Сколько вам удалось посмотреть/послушать, не останавливаясь, или вы досмотрели клип до конца?»
Интересно, что мужчин оказалось существенно больше, чем женщин, как среди досмотревших до конца (53% против 45%), так и среди бросивших после первых секунд (20% против 4%). То есть мужская аудитория быстрее и более однозначно определилась с мнением, а в женской значительно больше оказалось колеблющихся — тех, кто не дослушал до конца или прослушал, проматывая (50% против 26% у мужчин). Также существенно разделились ответы по возрасту респондентов: более возрастная аудитория оказалась категоричнее, чем молодая, как в положительной оценке (дослушали до конца 56% против 40%), так и в отрицательной (бросили после первых секунд 17% против 5%). Это согласуется с представлениями о том, что мужчины и люди более зрелого возраста в меньшей степени подвержены эмоциональным колебаниям при принятии решений.
Оценочное восприятие респондентами клипа с первого взгляда представлено на рис. 10.
Рис. 10. Ответы респондентов на вопрос: «Как вам в целом клип?»
Положительную оценку «Зашел» дали 53% участников опроса, 28% ответили «Не зашел», 20% не испытали эмоций при прослушивании. В женской аудитории оказалось 54% положительных оценок против 47% в мужской, но также больше в ней и отрицательных оценок — 33% против 20%. Сопоставляя данные с предыдущим вопросом, можно предположить, что около половины женщин, которые стали проматывать трек и не дослушали его до конца, в итоге ответили «Не зашел». Интересно, что среди мужчин количество тех, кто отрицательно оценил трек, и тех, кто бросил его слушать через несколько секунд, строго совпало, что подтверждает тезис о том, что мужская негативная реакция проявляется сразу, а женщины дольше проверяют свои ощущения. Что касается разницы между оценками в двух возрастных категориях, она оказалась практически неощутима.
Интерес для настоящего исследования представляли ответы респондентов об оригинальности музыкальной составляющей клипа, визуальной и аудиальной оценке портретного сходства ЕШШКИ с предложенными к сравнению артистами и в целом с человеком либо с роботом (рис. 11, 12) в части изображения и вокала (рис. 13), а также субъективная оценка респондентами степени оригинальности музыкальной композиции (рис. 14), наполовину созданной с применением генеративных нейронных сетей.
Рис. 11. Нейросетевой портрет артиста ЕШШКА. Источник: нейросеть Kandinsky
Рис. 12. Ответы респондентов на вопрос: «Насколько, по-вашему, предлагаемый на этом кадре образ ЕШШКИ похож на реального человека, а не на робота (голограмму)?»
Рис. 13. Ответы респондентов на вопрос: «Оцените степень оригинальности вокального исполнения ЕШШКИ, ее индивидуальность и непохожесть на других известных вам исполнителей (от 1 до 5)»
Рис. 14. Ответы респондентов на вопрос: «Отметьте на 5-балльной шкале, каков, по-вашему, процент оригинальности композиции «Виртуальная я» (где 1 — полный плагиат; 5 — совершенно оригинальный и аутентичный музыкальный материал)»
Визуальное впечатление респондентов от образа ЕШШКИ
Данная картинка была отобрана из нескольких вариантов, сгенерированных нейросетью Kandinsky по промпту «Рыжеволосая женщина со строгим лицом, стиль киберпанк» с негативным промптом «Яркая помада». Хотя алгоритм создания изображений этой сетью до конца не ясен, результаты экспериментов позволяют предположить, что программа берет за основу портреты реальных моделей, а не синтезирует их с нуля по частям. При многократном повторении одного и того же запроса сеть выдает образы с явно выраженными характерными чертами трех-четырех моделей, никак не смешивая их. При уточнении запроса можно внести коррективы: например, убрать яркие губы, изменить выражение лица или цвет волос, но сходство с конкретной моделью остается. То есть ИИ в данном случае, скорее, не «очеловечивает» синтетические персонажи, а наоборот, «роботизирует» реальные портреты, придавая им атрибутику и черты стиля киберпанк.
Ответы по поводу сходства предложенного образа с человеком распределились довольно равномерно по шкале оценок. Положительные оценки от 5 до 3 набрали примерно по 25% ответов (всего 73%), отрицательные (2 и 1) — соответственно 18 и 10%. То есть образ ожидаемо оказался ближе к реальному человеку, чем к роботу. В то же время среди мужской части респондентов и в более возрастной категории оказалось больше тех, кто высказался за сходство с роботом. Возможно, мужчины больше обращают внимание на «роботизирующую» атрибутику, а для людей старше 30 лет стиль киберпанк менее привычен и менее естествен, чем для более молодых.
Забавное наблюдение состоит также в том, что 45% молодежи в возрасте от 18 до 29 лет видят портретное сходство ЕШШКИ с Юлией Савичевой, 30% молодежи и 17% респондентов в возрасте 30+ отметили портретное сходство ЕШШКИ с Jennie Moz-Art, 33% опрошенных видят непрямое метафорическое частичное сходство ЕШШКИ с Милой Йовович, и около 30% респондентов посчитали один из образов ЕШШКИ в клипе не похожим на образ Тины Тернер, но близким к нему по эстетике.
NB! Охраноспособность изображения человека закреплена в ст. 152.1 ГК РФ «Охрана изображения гражданина», в п. 1 которой об «обнародовании» говорится, что «использование изображения гражданина [...] допускается только с согласия этого гражданина». Данная законодательная норма ограничивает потенциал деятельности визуальных промпт-инженеров, использующих изображения ныне живущих артистов в продуктах нейросетевой визуальной генерации. При этом в нейросетях Kandinsky и Genmo предусмотрена опция генерации визуального образа по фотографии или промпту, описывающему сходство с известным человеком, что вызывает правовую коллизию.
Оценка оригинальности вокального исполнения и музыкального материала песни «Виртуальная я»
В описании музыкальной части эксперимента уже упоминалось, что творческий метод композитора при создании интонационно-ритмического ряда фонограммы на 50% состоял из итерационного взаимодействия композитора с нейросетями, но композиционная структура плейбэка и интонирование вокальной строки корректировались композитором в соответствии с традиционными законами гармонии и общепринятыми правилами аранжировки массового популярного музыкального продукта в стиле инди. Отсюда в композиции — оригинальная, прописанная композитором линия баса и очеловеченное эмоциональное интонирование текста вокальной строки, которое музыкальные генеративные нейронные сети, за исключением Suno, пока не в состоянии воссоздать/сгенерировать, тем более в привязке к экспрессивным паттернам в музыкальной форме плейбэка. Так возник исследовательский интерес узнать мнения респондентов относительно 1) восприятия оригинальности вокально-певческой подачи музыкального материала (рис. 13) и относительно 2) субъективной оценки респондентами оригинальности музыкального материала композиции «Виртуальная я» (рис. 14).
Как видно из распределения ответов на рис. 13, низкую степень оригинальности вокального исполнения ЕШШКИ оценочно определяют мужчины (36% оценили степень схожести вокального исполнения ЕШШКИ с другими артистами на 5 баллов, и еще 36% оценивают схожесть вокального исполнения ЕШШКИ на 4 балла). Выше всего оригинальность исполнения оценивают респонденты в возрасте 30+ (35% опрошенных поставили оценку 1 балл ЕШШКЕ) и женщины (всего 8% опрошенных женщин ставят 5 баллов за схожесть вокального исполнения с другими артистами).
Полученный результат, во-первых, свидетельствует о более высоком уровне развития тембрового слуха мужчин при оценочном прослушивании музыки, во-вторых, служит индикатором того, что музыкальному продюсеру, использующему нейросетевые инструменты обработки вокала, проще удовлетворить эстетические требования женщин по критерию оригинальности вокального исполнения артиста. Выявленная гендерная и возрастная специфика развития тембрового слуха, разумеется, подлежит дополнительному изучению в рамках отдельных нейрокогнитивных исследований психофизиологии слуха.
Предваряя широкую дискуссию об охраноспособности голоса гражданина, в рамках настоящего исследования уместно в контексте упоминания категорий оригинальности вокально-певческого исполнения музыкального артиста обратиться к правовым нормам ст. 1313 ГК РФ «Исполнитель», где в качестве исполнителя в числе прочих профессий граждан указаны «актер, певец, музыкант [...] или иное лицо, которое [...] поет или иным образом участвует в исполнении произведения…». Статья 1315 ГК РФ регламентирует в п. 2 части первой «право авторства (исполнителя) на исполнение», в п. 3 части первой — устанавливает право на имя исполнителя / наименование творческого коллектива, в п. 4 части первой — «право на неприкосновенность исполнения, т.е. на защиту исполнения от всякого искажения / внесения изменений, приводящих к извращению смысла и нарушению целостности восприятия исполнения». В контексте работы музыкального промпт-инженера или музыкального продюсера с генеративными нейронными сетями соблюдение законодательства об авторском праве может ограничивать использование инструментов с применением технологии вокалоид, а также исключать использование генеративных моделей, обученных на голосах знаменитостей в сонастройке вокально-певческого профиля исполнителя под вокально-певческий профиль известного артиста. Поскольку в ч. 3 ст. 1315 ГК РФ сказано, что «права исполнителя признаются и действуют независимо от наличия и действия авторских прав на исполняемое произведение», можно заключить, что технологические решения нейросетевой сонастройки вокала произвольно выбранного исполнителя с вокально-певческим профилем известного артиста подпадают под правовую коллизию.
На рис. 14 представлено распределение ответов респондентов об оригинальности музыкальной ткани композиции «Виртуальная я».
Более оригинальной в части восприятия музыкальной ткани посчитали композицию представители старшей возрастной категории и мужчины (28% и 27% отличных оценок соответственно). Молодые слушатели и женщины оценили оригинальность скромнее (16% и 17% отличных баллов), при этом 5% и 4% этих категорий сочли композицию плагиатом. В целом же, на отлично и хорошо оригинальность оценили 47% респондентов, на удовлетворительно — 29%, неудовлетворительную оценку поставили 24%. Комментарий к полученным результатам в части определения оригинальности музыкальной ткани может быть обращен лишь к поискам причинно-следственных связей в индивидуальном социокультурном опыте респондентов, обусловившем развитие музыкальной памяти на образцы потребляемой цифровой музыки заданного жанра.
Таким образом, эксперимент с внедрением полунейросетевого-полуантропоморфного артиста ЕШШКА в ростер артистов лейбла Media Sharks выявил ряд особенностей пользовательского восприятия нейросетевого аудиовизуального контента, в том числе задав оценочные шкалы для выявления оригинальности контента по параметрам: 1) портретного сходства с артистами, 2) антропоморфности визуального изображения артиста, 3) аутентичности/антропоморфности вокально-певческой манеры исполнения, 4) аутентичности/оригинальности музыкального материала генеративного музыкального продукта. Выявленные параметры могут применяться в оценке восприятия генеративных аудиовизуальных продуктов методом статистических исследований реакций рядового слушателя/зрителя, что, в свою очередь, имеет потенциал к расширению методов судебной экспертизы в сфере авторского права.
2.1.3. Генеративные ведьмы и вампирская сага в творчестве W&V и Jennie Moz-Art
В феврале 2024 г. на отечественных киноэкранах появилась новая экранизация романа М.А. Булгакова «Мастер и Маргарита». За первый месяц кинопроката картина собрала максимально противоречивые критические отзывы и показала устойчиво высокие кассовые сборы. Интерес массового зрителя к новой кинокартине, снятой по мотивам классического сюжета булгаковской вампирской саги, вызвал цепной интерес к нарративам о ведьмах и вампирах в кино и музыкальном искусстве. Параллельно с событиями массового отечественного кинорынка 14 февраля 2024 г. музыкальный инди-рок-дуэт W&V выпустил дебютный мини-альбом «Отражения», визуально сопровождаемый генеративными нейросетевыми мультфильмами, автором которых также выступил Виктор Смурт.
Четыре композиции мини-альбома «Ведьма и вампиры», «Свитер оверсайз», «Танго инферно» и «Ветра», представленные оригинальным авторским материалом солистов инди-рок-группы W&V, стилизованным в эстетике инди-рок, требовали концептуальной визуализации. Так родилась идея сквозных персонажей, в число которых вошел образ рыжей кудрявой ведьмы — визуального архетипа артистов Jennie Moz-Art и ЕШШКА, и образ странствующего гитариста. Они возникали во всех четырех нейросетевых мультипликациях к одноименным песням.
Визуальные образы ведьмы из клипов W&V «Ведьма и вампиры» и «Свитер оверсайз», представленные на рис. 15, демонстрируют портретное сходство со сценическим образом артиста Jennie Moz-Art. Такова была художественная задача для нейросети Kandinsky, и побочным эффектом реализации поставленной задачи можно считать то, что нейросеть обучилась генерировать портрет артистки, ставший сквозным персонажем для трех музыкальных проектов, включая клипы на песни Jennie Moz-Art, полувиртуального артиста ЕШШКА и вокалистки инди-рок-группы W&V.
Рис. 15. Портреты рыжей кудрявой ведьмы (сквозной персонаж клипов «Ведьма и вампиры», «Свитер оверсайз»). Источник: нейросеть Kandinsky
С персонажем странствующего гитариста получилось иначе: в разных клипах и даже внутри одного клипа образ гитариста генерировался ситуативно под задачу изображения известного литературного персонажа (граф Дракула, Уильям Шекспир, Казанова) или музыкального артиста (Эд Ширан) с гитарой, и лишь последние два стоп-кадра в нижнем ряду справа на рис. 16 представляют собой абстрактное изображение гитариста в студии.
Рис. 16. Портрет странствующего гитариста (сквозной персонаж клипов «Ведьма и вампиры», «Свитер оверсайз»). Источник: нейросеть Kandinsky
Выявленный коммуникационный потенциал опроса фокус-группы целевых зрителей/слушателей композиции «Виртуальная я» переосмыслился авторами настоящего исследования в ключе упрощения структуры опроса. Задачей нового этапа исследования в случае с оценкой нейросетевых клипов было определение идеального формата генеративного мультипликационного клипа. В качестве эмпирического материала выступили два клипа к песням из альбома «Отражения»: 1) клип из компиляции статичных картинок на песню «Ведьма и вампиры» [44] с динамичными абстрактными визуализациями массовых макабрических сцен и 2) анимированный клип на песню «Свитер оверсайз» [45].
Два новых опроса о свойствах пользовательского восприятия нейросетевых клипов имели примерно одинаковую структуру. Первый вопрос: «Досмотрели ли вы клип до конца?», как и в случае с толерантностью зрителя/слушателя нейросетевого клипа на песню ЕШШКИ, уточнял у респондентов, на каком тайм-коде аудиовизуальный продукт, созданный нейросетью, утомлял зрителя и становился ему неинтересным. Последующие два вопроса имели целью выяснить субъективную оценку клипа и видеоряда клипа по пятибалльной шкале, где 1 — «Очень слабо», 5 — «Блестяще». Четвертый вопрос уточнял мнение респондентов о том, как видеоряд клипа влияет на восприятие песни («Улучшает восприятие», «Не влияет на восприятие», «Ухудшает восприятие» или «Другое» — собственный вариант ответа от респондента). Следующие два вопроса выявляли реакцию респондентов на присутствующие в клипах специфические нейросетевые особенности визуализации: насколько они заметны на фоне стилистического решения видеоряда (варианты ответов: «Очень сильно заметны», «Не сильно заметны») и насколько субъективно понравились зрителям присутствующие специфические нейросетевые особенности визуализации в клипе (варианты ответов: «Абсолютно понравились», «Скорее, понравились, чем нет», «Скорее, не понравились», «Совсем не понравились»).
Седьмой вопрос предлагал респондентам сравнить реакции на заданный клип по отношению к уже известному экспериментальному примеру нейросетевой визуализации песен артиста (в случае нейросетевого клипа к песне W&V «Ведьма и вампиры» референсом выступал клип «Свитер оверсайз», в случае клипа к песне W&V «Свитер оверсайз» референсом выступал клип артиста ЕШШКА «Виртуальная я»). На основании сравнительного анализа участникам опроса предлагалось сопоставить качество двух клипов: «Оцените данный клип в сравнении с экспериментальным клипом…» (варианты ответов: «Этот существенно лучше», «Не вижу особой разницы», «Этот хуже»). В случае экспериментального клипа W&V «Ведьма и вампиры» необходимо было также получить от респондентов обратную связь на предмет более эффективной для восприятия зрителем технологии производства клипа, для этого был задан вопрос: «Какая технология (с использованием статических изображений или с использованием анимированных сцен) интереснее и выразительнее?» (варианты ответа: «Выразительнее анимационная технология», «Выразительнее технология из статических изображений», «Обе интересные и выразительные», «Обе неинтересные», «Другое» — собственный вариант ответа от респондента).
В следующем задании респондентам предлагалось сравнить субъективное восприятие анализируемого клипа по отношению к восприятию нейросетевого клипа на песню известного артиста (предлагалось сравнить клип W&V «Ведьма и вампиры» с нейросетевой клипом на песню группы «Король и Шут» «Кукла колдуна»; для клипа W&V «Свитер оверсайз» в качестве референса для сравнения предлагался нейросетевой клип на песню группы «Сектор Газа» «Святая война»), варианты ответов демонстрировали наиболее вероятные ответы респондентов, по мнению авторов опроса (выбор предлагался из опций: «Не вижу особой разницы», «Этот (экспериментальный) клип явно хуже»).
Завершал исследовательскую часть опроса вопрос об отношении респондентов к потоку публикаций в СМИ об искусственном интеллекте (варианты ответов: «С интересом», «Нейтрально», «Игнорирую», «С раздражением», «Другое» — собственный вариант ответа от респондента). Этот вопрос имел целью выявить изменения общественного мнения относительно массированного освещения в открытых источниках трендов развития генеративного медиаискусства и искусственного интеллекта, гипотетически снижающих интерес массового зрителя к продуктам нейросетевой мультипликации в массовой популярной потоковой музыке. В финальном разделе опроса были вопросы о персональных данных респондентов и их музыкально-стилевых предпочтениях.
В рамках настоящего исследования наиболее значимым представляется выборочный сравнительный анализ ответов респондентов на вопросы: «Оцените экспериментальный клип в целом по пятибалльной системе» (рис. 17), «Как видеоряд в экспериментальном клипе влияет на восприятие песни?» (рис. 18), «Оцените экспериментальный нейросетевой клип в сравнении с нейросетевым клипом на песню известного артиста» (рис. 19), «Какую реакцию у вас вызвали специфические нейросетевые особенности визуала в клипах?» (рис. 20) и «Какая технология производства визуала, на ваш взгляд, выразительнее?» (рис. 21).
Рис. 17. Ответы респондентов на вопрос: «Оцените экспериментальный клип в целом по пятибалльной системе». Вверху — ответы о клипе W&V «Свитер оверсайз», внизу — ответы о клипе W&V «Ведьма и вампиры»
Рис. 18. Ответы респондентов на вопрос: «Как видеоряд в экспериментальном клипе влияет на восприятие песни?» Вверху — ответы о клипе W&V «Свитер оверсайз», внизу — ответы о клипе W&V «Ведьма и вампиры»
Рис. 19. Ответы респондентов на вопрос: «Оцените экспериментальный нейросетевой клип в сравнении с нейросетевым клипом на песню известного артиста». Вверху — ответы о клипе W&V «Свитер оверсайз», внизу — ответы о клипе W&V «Ведьма и вампиры»
Рис. 20. Ответы респондентов на вопрос: «Какую реакцию у вас вызвали специфические нейросетевые особенности визуала в клипах?» Вверху — ответы о клипе W&V «Свитер оверсайз», внизу — ответы о клипе W&V «Ведьма и вампиры»
Рис. 21. Ответы респондентов на вопрос: «Какая технология производства визуала, на ваш взгляд, выразительнее?»
Оценки клипа «Ведьма и вампиры» распределились довольно равномерно. Интересно, что доли отличных, посредственных и плохих оценок практически совпали, их оказалось примерно по 27%.
Респондентов опроса по клипу «Свитер оверсайз» было больше, что дало возможность ранжировать ответы по полу и возрасту. Среди мужчин и более возрастной аудитории отличные оценки клипа были более многочисленны, чем среди молодежи и женщин. Но если считать положительными оценки 5 и 4, то в сумме их оказалось больше именно от аудитории в возрасте до 40 лет.
По влиянию сгенерированного нейросетью видеоряда на восприятие песни клип «Ведьма и вампиры» был оценен абсолютно нейтрально. У клипа «Свитер оверсайз» практически совпали оценки от респондентов разного возраста, но разделились среди мужской и женской аудитории: среди тех, кто счел видеоряд улучшающим восприятие, мужчин оказалось на 50% больше, чем женщин. Соответственно негативно оценили это влияние больше женщины, чем мужчины.
Вопрос о сравнении экспериментальных клипов с индустриальным аналогом имел целью получить представление, насколько в генеративном видеоконтенте заметна разница между профессиональным и любительским уровнями его разработки. В среднем около 70% респондентов не увидели особой разницы, но возрастная аудитория оказалась более критичной — ответов, что экспериментальный клип намного хуже, от старшей группы было почти вдвое больше, чем от молодой.
Существенно более положительно аудитория отреагировала на специфические нейросетевые особенности клипа «Свитер оверсайз», манера визуализации в котором мягче и лиричнее, чем в «Ведьме и вампирах». Отрицательных оценок по первому клипу было менее 15%, по второму — около 45%. Более критичной оказалась группа респондентов в возрасте до 40 лет, а среди мужчин и женщин доля недовольных оказалась примерно одинаковой. Интересно, что доля мужчин, которым абсолютно понравились нейросетевые особенности «Свитера оверсайз», оказалась в 3 раза выше, чем доля женщин, давших такой ответ.
Как показывает распределение ответов на рис. 21, наиболее привлекательной для 36,4% опрошенных показалась анимационная технология производства нейросетевой визуализации к клипам. Это доказывает справедливость выдвинутой нами гипотезы о том, что технологический скачок в развитии визуализационных нейросетей постепенно вытеснит из оборота более ранние версии со статической визуализацией. На втором месте по популярности у респондентов был вариант ответа: «Обе технологии визуализации интересные и выразительные» — такой ответ выбрали 27,3% опрошенных. Оставшиеся респонденты в равном распределении по 18,2% проголосовали за варианты «Выразительнее технология генерации визуала из статических изображений» и «Обе технологии одинаково неинтересны». В пользу довода о привлекательности генерации визуала из статических изображений может служить достаточно разнообразная библиотека макабрических образов клипа «Ведьма и вампиры», особенно это относится к портретам барабанщиков, персонажей для построчной иллюстрации стихотворного повествования о графе Дракуле и мифологических героях, а также к портретам миньонов. Выбор респондентами варианта об одинаково спорной эффективности и привлекательности обеих технологий нейросетевой визуализации свидетельствует о том, что эти технологии необходимо продолжать совершенствовать, для того чтобы быть конкурентоспособными и добиться внимания разборчивых и «насмотренных» зрителей.
Ожидалось, что проведение опросов фокус-групп после релиза нейросетевых клипов к альбому W&V «Отражения» должно было привести к увеличению количества просмотров анализируемых клипов в опросный и постопросный период. По данным табл. 2, дата последнего заполнения опроса респондентами фокус-группы к клипу W&V «Свитер оверсайз» — 02.03.2024; дата последнего заполнения респондентами опроса по клипу W&V «Ведьма и вампиры» — 24.03.2024. Если сопоставлять даты начала опросов — 14.02.2024 для клипа W&V «Свитер оверсайз» и 19.03.2024 для клипа W&V «Ведьма и вампиры», на графиках пользовательской активности в «Творческой студии» YouTube (рис. 22) можно визуально отследить эффект от проведения опросов, который будет наблюдаться в виде добавления просмотров контента.
Рис. 22. Динамика просмотров нейросетевых клипов W&V «Ведьма и вампиры» (вверху) и «Свитер оверсайз» (внизу) в даты проведения опросов фокус-групп и за весь период с момента публикации. Источник: «Творческая студия» YouTube-канала Witch&Vamps
Как видно из общих графиков в нижней части рисунка, в период опросов фокус-групп пользовательская активность увеличивалась, что влияло на увеличение количества просмотров единиц контента на канале артиста.
Для определения количественных показателей эффективности опросов фокус-групп в приросте пользовательской активности достаточно рассчитать среднее количество просмотров в месяц для общего периода с момента публикации единиц контента (12 февраля 2024 г.) до даты формирования отчета (10 мая 2024 г.) и сопоставить полученные среднемесячные количества просмотров за весь период со среднемесячными количествами просмотров в период проведения опроса (табл. 4).
Таблица 4. Расчет среднемесячного количества просмотров нейросетевых клипов «Ведьма и вампиры» и «Свитер оверсайз» в даты проведения опросов фокус-групп и за весь период с момента публикации
Клип | Количество просмотров за весь период Nwacth1 | Количество дней в периоде Ndays1 | Среднемесячное количество просмотров Q1 | Количество просмотров за период опросов Nwacth2 | Количество дней в периоде Ndays2 | Среднемесячное количество просмотров Q2 |
«Ведьма и вампиры» | 244 | 89 | 82 | 145 | 6 | 725 |
«Свитер оверсайз» | 307 | 89 | 103 | 84 | 18 | 140 |
При расчете среднемесячного количества просмотров клипов количество дней в месяце принималось равным 30, и использовалась формула:
Q = (Nwacth /Ndays) x 30,
где: Ndays — количество дней в запрашиваемом периоде (рассчитывается по календарю); Nwacth — количество просмотров в запрашиваемом периоде, по данным статистики личного кабинета «Творческой студии» YouTube-канала артиста; Q — среднемесячное количество просмотров единицы контента, расчетная величина, округляемая до целого значения.
Как видно из расчетных данных табл. 4, показатель Q2 (расчетное значение среднемесячного количества просмотров единицы контента в период опроса) ввиду ограниченного количества дней продолжительности опросов фокус-групп (шесть дней — в случае клипа «Ведьма и вампиры» и 18 дней — в случае клипа «Свитер оверсайз») отражает высокую эффективность опросов как инструмента привлечения дополнительного трафика на YouTube-канал. Об этом свидетельствует положительное сравнение показателей Q1 и Q2, что особенно заметно для клипа «Ведьма и вампиры»: 82 просмотра в месяц в среднем за весь период с февраля по май 2024 г., или приблизительно 725 просмотров в месяц с привлечением трафика от фокус-группы при ежедневном средневзвешенном количестве просмотров клипа, равном 24 в день. Поскольку в целях эксперимента контент каналов артистов не сопровождается таргетированной рекламой, данные расчеты являются релевантными и представляют ценность для дальнейшей интерпретации показателей Q в более широком сравнительном анализе количества среднемесячных просмотров контента нейросетевых клипов медийных артистов, который представлен в третьем разделе настоящего исследования.
Таким образом, результаты опросов фокус-групп о восприятии нейросетевых клипов на песни W&V «Ведьма и вампиры» и «Свитер оверсайз» можно интерпретировать в части перспективности формата нейросетевых видео в пользу продолжения экспериментов с анимированными мультфильмами и движущимися, динамичными изображениями, в части специфики визуальной репрезентации нейросетевых персонажей — в пользу акцента на интересы мужской аудитории в возрасте до 40 лет.
2.1.4. «Фильм о фильме» и виртуальный мерч как копродукты и новый жанр документирования нейросетевых экспериментов
Финальная итерационная часть творческого эксперимента с нейросетевыми визуализациями для артистов Jennie Moz-Art, ЕШШКА и W&V представляет собой выявление жизнеспособности копродуктов нейросетевых визуализаций клипов. В процессе работы медиахудожника Виктора Смурта с нейросетями Kandinsky и Genmo отдельные сцены, сгенерированные по промптам для экспериментальных клипов, не вошли в монтажную версию, при этом у авторов исследования возникла идея опытным путем выявить жизнеспособность единиц вторичного аудиовизуального контента, созданных из нейросетевых сцен, не вошедших в клипы. Так появились два типа копродуктов: 1) виртуальный мерч к саге о ешшкином пантеоне и 2) динамично обновляемый плейлист «ИИ тупит» с видео «кастинга» нейросетевых актеров на роли персонажей в клипы артистов лейбла Media Sharks, созданный для подписчиков канала лейбла в жанре «Фильм о фильме» в развлекательных целях.
Данные о старте набора просмотров плейлиста «ИИ тупит» представлены в табл. 5.
Таблица 5. Количество просмотров копродуктов нейросетевых видео в сравнении с монтажными версиями нейросетевых клипов на песни артистов лейбла Media Sharks. Источник: «Творческая студия» YouTube, данные на 11.05.2024
Нейросетевое видео | Дата публикации | Количество просмотров с даты публикации по 11.05.2024 | Оригинал единицы контента | Дата публикации оригиналь ного видео | Количество просмотров оригинального видео с даты публикации нейросетевого видео по 11.05.2024 |
Кинопроба город [46] | 21.04.2024 | 33 | – | – | – |
Кинопроба слоны 00 [47] | 21.04.2024 | 18 | Jennie Moz-Art «Слоны летят на север» | 12.03.2024 | 16 |
Кинопроба Хлоя русалка [48] | 21.04.2024 | 16 | – | – | – |
Кинопроба муха 00 [49] | 21.04.2024 | 18 | Jennie Moz-Art «Муха по имени Катя» | 21.04.2024 | 85 |
Проба ведьмы 4 2 [50] | 28.04.2024 | 20 | Jennie Moz-Art «Мелодия твоей души» | 23.02.2024 | 27 |
Кинопроба ежики 2 [51] | 03.05.2024 | 23 | Jennie Moz-Art «Песенка про ежиков» | 13.03.2024 | 1 |
Синопсис триллера «Ешшкин кот» [52] | 03.05.2024 | 19 | W&V «Свитер оверсайз» | 12.02.2023 | 3 |
Ешкин мерч [53] | 11.05.2024 | 2 | Jennie Moz-Art «Ешкин кот (новогодний)» | 25.12.2023 | 1 |
ИТОГО | 149 | 133 |
Как показывает строка «ИТОГО» в табл. 5, добавление копродуктов нейросетевой генерации создало лейблу Media Sharks 149 дополнительных просмотров нового созданного развлекательно-документального плейлиста «ИИ тупит! Мучения виртуального режиссера с нейросетевыми актерами», а также косвенно повлияло на подогрев интереса пользователей YouTube к аудиовизуальным продуктам артистов лейбла Media Sharks, увеличив количество просмотров суммарно на 133. Наиболее ярко эффект от копродуктов заметен на нейросетевых клипах к песням Jennie Moz-Art «Муха по имени Катя» (85 просмотров с даты добавления видео «Кинопроба муха 00») и «Мелодия твоей души» (27 дополнительных просмотров нейросетевого клипа с даты добавления видео «Кинопроба ведьмы 4 2»). Более детальная оценка эффективности альтернативной монетизации творчества артистов лейбла Media Sharks с помощью копродуктов нейросетевой визуализации требует прошествия более длительного времени с даты публикации плейлиста развлекательно-документального контента и может войти в объем продолжения исследования дополнительной монетизации стриминговой музыки с помощью нейросетевого контента. На данный момент факт роста числа просмотров оригинальных видео от создания плейлиста с копродуктами генеративных видео является достаточным основанием продолжать эксперименты с нейросетевыми видео для артистов лейбла Media Sharks.
3. Подходы к количественной оценке методов альтернативной монетизации творчества инди-артистов с помощью нейросетевых видео
Предлагаемая в настоящем исследовании модель количественного оценивания методов альтернативной монетизации творчества артистов с помощью нейросетевых видео базируется на эвристическом подходе сравнения четырех реляционных коэффициентов: средневзвешенного количества просмотров единицы аудиовизуального контента в месяц (Q), диапазона доходов артиста в месяц от размещения единицы контента на YouTube (R, рассчитывается по двум различным формулам для артистов с разной численностью фандома), расчетным среднемесячным вознаграждением за просмотр единицы контента (Yср) и ценностью одного активного подписчика для генерации дохода артисту от музыкальных видео на YouTube (V).
3.1. Сопоставление эффективности нейросетевых и оригинальных клипов по параметру средневзвешенного количества просмотров в месяц
В п. 2.1.3 и в табл. 4 исследования уже упоминалась роль коэффициента Q, означающего расчетное количество просмотров единицы контента в среднем за один месяц. Этот показатель выступает в качестве уравнивающего критерия для сравнения востребованности аудиовизуального контента артистов с большим (более 50 000 подписчиков) и с немногочисленным (менее 50 000 подписчиков) фандомами. Проиллюстрируем эффект от количества подписной базы фандома визуализацией количества просмотров оригинальных и нейросетевых видео результатами кейс-стади для артистов “Deep Purple”, “CREAM SODA”, «Король и шут», «Сектор Газа», Юлия Савичева и “Gorillaz”, представленными в табл. 6.
Таблица 6. Количество просмотров оригинальных и нейросетевых клипов медийных артистов
Песня | Оригинал клипа | Нейросетевой клип | ||||
Дата публикации | Просмотров всего | Просмотров в месяц Q1 | Дата публикации | Просмотров всего | Просмотров в месяц Q2 | |
Артист: “Deep Purple”. Количество подписчиков: 1 200 000 | ||||||
“Smoke on the water” | 09.05.2010 | 5 106 770 | 28 629 | 01.02.2024 | 1 739 096 | 133 777 |
“Child in time” (Live) 1972 | 26.05.2010 | 173 274 846 | 1 211 712 | 09.10.2022 | 2 886 950 | 151 945 |
Артист: “Cream Soda”. Количество подписчиков: 66 100 | ||||||
“Melancholia” | 23.04.2021 | 70 365 | 2 932 | 23.04.2021 | 2 213 943 | 92 248 |
Артист: «Король и Шут». Количество подписчиков: 575 000 | ||||||
«Камнем по голове» | 22.01.2015 | 8 684 365 | 77 593 | 24.03.2023 | 2 075 288 | 159 637 |
«Кукла колдуна» | 27.08.2013 | 66 000 934 | 568 973 | 30.11.2023 | 461 130 | 92 226 |
Артист: «Сектор Газа». Количество подписчиков: 156 000 | ||||||
«Твой звонок» | 06.08.2018 | 35 928 018 | 520 696 | 10.10.2023 | 448 267 | 64 038 |
«Мумия» | 06.10.2009 | 583 901 | 3175 | 02.10.2023 | 347 711 | 49 682 |
Артист: Юлия Савичева. Количество подписчиков: 309 000 | ||||||
«Девочка» | 16.02.2024 | 717 217 | 239 072 | 13.03.2024 | 208 889 | 208 889 |
Артист: “Gorillaz”. Количество подписчиков: 10 800 000 | ||||||
“Kids With Gun”s | 14.01 2010 | 31 788 036 | 172 761 | 01.12.2023 | 1054 | 211 |
Источник: YouTube.
Как видно из количественных данных, представленных в табл. 6, минимальный размер фандома у проанализированных медийных артистов составляет 66 100 человек (количество подписчиков на официальном YouTube-канале у артиста “CREAM SODA”). Такое количество подписчиков позволило артисту получить с 23 апреля 2021 г. по 18 апреля 2024 г. 70 365 просмотров видео живого выступления артистов на радио ENERGY и 2 213 943 просмотра нейросетевого клипа к песне «Меланхолия», размещенного 23 апреля 2021 г. Очевидно, что коэффициент Q, отражающий расчетное количество просмотров в месяц (два маркированных столбца — Q1 и Q2 на рис. 23), позволяет сопоставить эффективность двух единиц контента — оригинального видео и нейросетевого видео — за равный промежуток времени. Сравнивая в этой логике количество просмотров в месяц для концертного и нейросетевого видео к песне «Меланхолия», получаем, что эффективность нейросетевого видео (в среднем 92 248 просмотров в месяц) почти в 30 раз выше эффективности концертного видео (2932 просмотра в месяц). Изучение расчетных и статистических данных из таблицы на рис. 23 выявило два тренда:
Рис. 23. Методика расчета коэффициентов монетизации музыкальных видео артистов, по данным онлайн-сканера диапазона ежемесячных доходов от монетизации на YouTube для артиста “Deep Purple” на дату 18.04.2024. Данные сервиса SOCIALBLADE.COM
1) с преимущественной эффективностью нейросетевых видео по расчету среднемесячного количества просмотров единицы контента — такой тренд характерен для артистов “Deep Purple” (композиция “Smoke on the Water”), “CREAM SODA” (композиция «Меланхолия»), «Король и Шут» (композиция «Камнем по голове»), «Сектор Газа» (композиция «Мумия»);
2) с преимущественной эффективностью оригинальных видео по расчету среднемесячного количества просмотров единицы контента — этот тренд демонстрирует контент артистов “Deep Purple” (композиция “Child in the Time”), «Король и Шут» (композиция «Кукла колдуна»), «Сектор Газа» (композиция «Твой звонок»), Юлия Савичева (композиция «Девочка»), “Gorillaz” (композиция “Kids with Guns”).
Причин преимущественной эффективности контента видео заданного формата может быть много, для их выявления необходимы дополнительные глубинные кейс-стади с качественной и количественной оценкой влияния рекламного бюджета, выбранной маркетинговой стратегии, изучением каналов коммуникации артиста и анализ ресурсов команды артиста. В рамках настоящего исследования вывод о дихотомии эффективности нейросетевых и оригинальных видео может считаться достаточным для иллюстрации выдвинутой гипотезы о потенциальной эффективности нейросетевых видео в монетизации стриминговой музыки артиста.
Рассмотрим далее параметры, количественно определяющие непосредственно оценку потенциала монетизации музыкального контента.
3.2. Расчет диапазона доходов артиста от единицы контента на YouTube на основании данных о монетизации канала или отчетов о цифровых роялти от издателя
Монетизация канала артиста на YouTube — опция получения цифровых вознаграждений за активное пользование видеохостингом, которую сервис YouTube предлагает пользователям с подписной базой от 1500 человек и количеством часов просмотра видеоконтента от 4000 за последние 12 месяцев. Очевидно, что такая опция доступна только артистам, на канале которых выполняются одновременно оба условия — и по количеству подписчиков, и по суммарному количеству часов просмотра аудиовизуального контента. Причем выбор опции подключения монетизации остается свободным правом артиста или менеджера YouTube-канала артиста. Еще одним ограничивающим условием выступает эффект геополитической асимметрии и территориальных санкций, возникший для артистов Российской Федерации после февральских событий 2022 г., когда ряд международных брендов прекратили деятельность в Российской Федерации и YouTube отключил монетизацию контента для российских артистов. Если музыкальный артист является резидентом лейбла за пределами Российской Федерации (как, например, рекорд-лейблы, издающие музыкальный контент через дистрибьютора Believe Digital со штаб-квартирой дистрибьютора Believe Music во Франции), то монетизация контента на YouTube отражается в ежеквартальных отчетах о роялти от цифровой дистрибуции музыкального контента. В этой связи в целях настоящего исследования интересно сравнить доход на единицу аудиовизуального контента на музыку артиста на YouTube и рассмотреть факторы, влияющие на величину такого дохода.
3.2.1. Расчет доходов от единицы контента для артистов с подключенной монетизацией канала на YouTube
В оътношении изучаемых нами кейсов медийных артистов (“Deep Purple”, “CREAM SODA” и др.) первый исследовательский шаг в расчете монетизации единицы аудиовизуального контента состоял в проверке факта подключения монетизации YouTube-канала артиста. Сделать это можно с использованием онлайн-сервиса «Калькулятор денег YouTube», сканирующего данные YouTube-канала артиста по ссылке на искомый YouTube-канал в реальном времени.
На рис. 23 представлены модель монетизации канала YouTube и описание расчетных параметров монетизации контента для артиста “Deep Purple”, расчет подготовлен по данным онлайн-сервиса SOCIALBLADE.
Изображенная в верхней части рисунка модель расчета монетизации канала YouTube предлагает позицию канала артиста в собственном рейтинге сервиса SOCIALBLADE, учитывающем количество подписчиков, суммарное количество просмотров видео на канале от даты создания канала до запрашиваемой даты, позицию в рейтинге YouTube-каналов страны — резиденции артиста (в случае исследуемого кейса — поз. 71 в рейтинге YouTube-каналов США), позицию в рейтинге музыкальных каналов на YouTube, динамику подписчиков за последние 30 дней, еженедельную динамику подписчиков за весь период существования канала, расчет приблизительного диапазона доходов от видео за последние 30 дней, расчет приблизительного диапазона ежегодных доходов от видео, количество просмотров видео за последние 30 дней и динамику еженедельных просмотров видео за все время существования канала. Среди описанных параметров, формирующих рейтинг канала на сервисе SOCIALBLADE, для расчета среднего размера дохода от одного воспроизведения единицы контента на канале артиста будут задействованы два показателя, схематически отмеченные на рис. 23 внизу: 1) Rmonth — диапазон ежемесячного дохода от монетизации контента на YouTube, 2) Wmonth — количество просмотров видео за последние 30 дней.
По описанной логике средний размер дохода от одного воспроизведения единицы контента на канале артиста будет рассчитываться по формуле, изображенной с пояснениями на рис. 24.
Рис. 24. Формула расчета среднего размера дохода от одного воспроизведения единицы контента (Yср) на канале артиста “Deep Purple”
В приведенном на рис. 24 модельном расчете обращает на себя внимание процедура перевода валют из долларов в рубли по курсу валют на день расчетов, в случае с “Deep Purple” на дату 18.04.2024 средневзвешенный курс доллара к рублю составлял 95 рублей за 1 доллар.
Логика вычислений размера среднего дохода от одного воспроизведения единицы контента базируется на понятии среднего арифметического значения доходов артиста в месяц: средний доход от совокупности просмотренных видео делится на количество просмотров в течение месяца, и получается размер вознаграждения артиста за единичный просмотр (Yср). Эта величина наряду со среднемесячным количеством просмотров единицы контента (Q) выступает в качестве второго реляционного коэффициента, размер которого колеблется в зависимости от курса доллара и от дельты среднемесячных доходов артиста с монетизированным каналом YouTube.
Результаты расчета дополнительной монетизации музыкальных видео (оригинальных и нейросетевых) для исследуемых медийных артистов представлены в табл. 7.
Таблица 7. Расчет дополнительной монетизации музыкальных видео медийных артистов
Песня | Оригинал клипа | Нейросетевой клип | |||
Просмотров всего Stotal | Расчет роялти за просмотры клипа Rtotal-orig | Расчет стоимости просмотра от одного подписчика Yср., руб./трек | Просмотров всего | Расчет роялти за просмотры клипа Rtotal-AI | |
Артист: “Deep Purple”. Количество подписчиков: 1 200 000 | |||||
“Smoke on the water” | 5 106 770 | 1 082 635 | 0,212 | 1 739 096 | 368 688 |
“Child in time” (Live) 1972 | 173 274 846 | 36 734 267 | 0,212 | 2 886 950 | 612 033 |
Артист: “Cream Soda”. Количество подписчиков: 66 100 | |||||
“Melancholia” | 70 365 | 14 214 | 0,202 | 2 213 943 | 447 216 |
Артист: «Король и Шут». Количество подписчиков: 575 000 | |||||
«Камнем по голове» | 8 684 365 | 1 7543 | 0,0002 | 2 075 288 | 415 |
«Кукла колдуна» | 66 000 934 | 13 200 | 0,0002 | 461 130 | 92 2 |
Артист: «Сектор Газа». Количество подписчиков: 156 000 | |||||
«Твой звонок» | 35 928 018 | 7 257 959 | 0,202 | 448 267 | 90 549 |
«Мумия» | 583 901 | 119 968 | 0,202 | 347 711 | 70 250 |
Артист: Юлия Савичева. Количество подписчиков: 309 000 | |||||
«Девочка» | 717 217 | 144 511 | 0,201 | 208 889 | 41 987 |
Артист: “Gorillaz”. Количество подписчиков: 10 800 000 | |||||
“Kids With Guns” | 31 788 036 | 6 415 956 | 0,202 | 1054 | 213 |
Величина Stotal во втором столбце табл. 7 отражает количество подписчиков каналов изучаемых артистов. Показатель Rtotal-orig обозначает расчетный размер доходов (роялти) от просмотров оригинального клипа артиста за весь период с момента размещения единицы контента на YouTube, он рассчитывался по формуле: стоимость одного просмотра (Ycр) умножить на количество просмотров клипа с момента размещения. Аналогичным образом рассчитывался размер доходов артиста за все время от просмотров нейросетевых клипов (показатель Rtotal-AI).
Так, в соответствии с логикой расчетов показателей Rtotal-orig. и Rtotal-AI на основании вычисления средней стоимости просмотра единицы контента (Ycр) лидер просмотров — клип группы “Deep Purple” “Child in Time” — с момента размещения 26 мая 2010 г. на YouTube оригинального живого концертного выступления (запись 1970 г.) заработал на YouTube 36 734 267 руб. (приблизительно 386 676 долл. за 14 лет, или в среднем 27 619 долл. в год и 2301 долл. в месяц), а нейросетевой клип, размещенный на YouTube-канале видеографа Sol Productions 9 октября 2022 г., за полтора года заработал 612 033 руб. (приблизительно 6442 долл. за весь период размещения — 18 месяцев, или в среднем 358 долл. в месяц) с оговоркой, что количество подписчиков на официальном YouTube-канале группы “Deep Purple” составляет 1 200 000 человек, а количество подписчиков на YouTube-канале видеографа Sol Productions в 100 раз меньше — 12 100 подписчиков. Выдвигать гипотезы относительно возможной упущенной выгоды менеджера YouTube-канала группы “Deep Purple” в данном случае не приходится, потому что роялти за использование музыки артиста алгоритмы YouTube все равно передают издателю артиста “Deep Purple”, а для видеографа Sol Productions дополнительный доход в размере 358 долларов в месяц за нейросетевое видео на песню “Deep Purple” может представлять финансовый интерес. Если на основании полученных данных вычислить долю дополнительного дохода от нейросетевого музыкального видео артиста “Deep Purple”, размер ежемесячного дохода от нейросетевого музыкального видео к песне “Child in Time” (358 долл. в месяц) составит 15,5%.
Однако, как видно из расчетов в табл. 7, показатель средней стоимости просмотра единицы контента Ycр у каждого из изучаемых артистов с монетизируемым каналом YouTube отличается именно из-за разницы размеров диапазона ежемесячного заработка по данным онлайн-калькулятора SOCIALBLADE, вычисления которого, как описывалось выше, учитывают параметр количества подписчиков и региональные рейтинги YouTube-канала артиста. Алгоритмы YouTube также обучены определять «накрутку» просмотров и подписчиков и автоматически вычитать данные «накрученных» просмотров из общего количества просмотров видео. Этим эффектом можно объяснить, например, низкий показатель средней стоимости просмотра единицы контента у группы «Сектор Газа» (Ycр = 0,0002 руб.). В среднем же стоимость одного просмотра единицы контента на YouTube, согласно расчетам, колеблется на уровне 20-21 коп. за просмотр.
Соотношение доли ежемесячного вознаграждения за нейросетевые музыкальные видео и размера фандома медийных артистов представлена на графике (рис. 25).
Рис. 25. Зависимость доли ежемесячного вознаграждения, руб./мес., за нейросетевые музыкальные видео от размера фандома медийных артистов. Источник: собственные расчеты авторов исследования по вторичным данным YouTube
Как видно из рис. 25, зависимость расчетной доли ежемесячного дохода артиста от нейросетевых музыкальных клипов от количества подписчиков нелинейная. Самый высокий процент ежемесячного дохода от нейросетевого видео — у группы “CREAM SODA” (расчетная доля дохода 24 845 руб./мес. за нейросетевое видео ежемесячно на канале артиста по отношению к 790 руб. ежемесячно за живое концертное видео от трафика радио ENERGY составляет 3146%). Более частым явлением может быть доля увеличения дохода от нейросетевых видео в размере 14–17%, как в случае с нейросетевыми клипами “Deep Purple” и «Сектор Газа». В том случае, когда нейросетевой клип становится официальным музыкальным видео, как это произошло у “CREAM SODA” (3146%) и Юлии Савичевой (43,58%), расчетная доля ежемесячного дохода от нейросетевого клипа может превышать размер основного дохода от оригинального аудиовизуального продукта.
Для расчета дохода артистов с неподключенной опцией монетизации контента на YouTube необходимы данные о роялти от издателя. Рассмотрим далее, как происходит вычисление доходов от нейросетевых музыкальных клипов на примере артистов лейбла Media Sharks.
3.2.2. Расчет доходов от музыкальных видео для артистов с неподключенной монетизацией канала YouTube по данным ежеквартальных отчетов о цифровой дистрибуции
Стриминговые артисты ежеквартально получают от издателя или напрямую от платформы цифровой дистрибуции данные о начислениях роялти за каждый релиз. В таких отчетах в форме таблицы перечисляются площадки и стриминг-сервисы, на которых платные подписчики слушали релиз, включая видеохостинг YouTube (рис. 26).
Рис. 26. Фрагмент отчета Believe Digital о цифровой дистрибуции артистов лейбла Media Sharks за четвертый квартал 2023 г. (вверху) с формулой расчета среднего размера дохода от одного воспроизведения единицы контента (внизу)
Как следует из приведенного на рис. 26 фрагмента отчета Believe Digital, размер дохода от единичного воспроизведения музыкальной композиции артиста на YouTube (показатели Y в верхней части рисунка) — величина переменная, зависящая от страны прослушивания и от количества подписчиков на канале артиста. Так, для песни «Я уеду жить в свитер» артиста Jennie Moz-Art (размер фандома на YouTube — 1560 подписчиков) размер дохода от одного воспроизведения песни в России составляет 22 коп., а единичное воспроизведение этой же композиции в Украине приносит доход 7 коп.; доход артиста “Lyubastish” от единичного воспроизведения песни “TOGETHER” составил в России 16 коп.
Ввиду регионального непостоянства величины дохода от единичного прослушивания усредненный показатель Yср индивидуально для каждого артиста на основании данных от дистрибьютора можно рассчитать по формуле, как показано на рис. 26: методом вычисления среднего арифметического складываются показатели монетизации музыкальной композиции в разных странах и вычисляется среднее значение путем деления на количество единичных прослушиваний. Так, усредненная стоимость единичного прослушивания песни «Я уеду жить в свитер» на YouTube составила, согласно проведенным расчетам, 14 коп. Это на 6 коп. меньше, чем у Юлии Савичевой за песню «Девочка», и намного выше, чем за композицию «Кукла колдуна» группы «Король и Шут», стоимость дослушивания которой была обнулена алгоритмами YouTube.
Если принять размер средневзвешенного дохода от одного прослушивания композиции «Я уеду жить в свитер» за эквивалент для артистов лейбла Media Sharks, что вполне допустимо, учитывая географию слушателей и производный по отношению к артисту Jennie Moz-Art характер артистов ЕШШКА и W&V, расчет доходов от рассмотренных в подпунктах п. 2 настоящего исследования экспериментальных единиц контента представлен в табл. 8.
Таблица 8. Количество просмотров и расчет доходов от монетизации оригинальных и нейросетевых артистов лейбла Media Shark. Источник: YouTube
Песня | Оригинал клипа | Нейросетевой клип | |||||
Дата публикации | Просмотров всего | Просмотров в месяц Q1 | Дата публикации | Просмотров всего Wtotal | Просмотров в месяц Q2 | Расчет монетизации Rtotal, руб. | |
Артист: ЕШШКА. Количество подписчиков: 1 | |||||||
«Виртуальная я» | 09.05.2010 | 22 | 4 | 14.12.2023 | 271 | 54 | 39,30 |
Артист: W&V. Количество подписчиков: 34 | |||||||
«Ведьма и вампиры» | 26.02.2024 | 614 | 205 | 12.02.2024 | 220 | 73 | 39,10 |
«Свитер оверсайз» | 09.02.2024 | 969 | 323 | 12.02.2024 | 284 | 95 | 41,18 |
«Танго инферно» | 13.02.2024 | 20 | 6 | 12.02.2024 | 128 | 43 | 18,56 |
«Ветра» | 09.02.2024 | 69 | 23 | 12.02.2024 | 109 | 36 | 15,80 |
Артист: Jennie Moz-Art. Количество подписчиков: 1560 | |||||||
Песня | Оригинал клипа | Нейросетевой клип | |||||
«Ешкин кот» (2019) | 30.11.2017 | 239 | 3 | Дата публикации | Просмотров всего Wtotal | Просмотров в месяц Q2 | Расчет монетизации Rtotal руб. |
«Ешкин кот» (официальное лирик-видео) | 29.08.2023 | 239 | 30 | 34,66 | |||
«Ешкин кот» (ретро) | 29.08.2023 | 101 | 13 | 14,65 | |||
«Ешкин кот» (новогодний) | 25.12.2023 | 145 | 36 | 21,03 | |||
«Мелодия твоей души» | 28.04.2022 | 6423 | 268 | ||||
«Мелодия твоей души» (Kandinsky) | 29.08.2023 | 1526 | 508 | 221,27 | |||
ИТОГО дополнительной монетизации | 438,35 |
Таким образом, суммарный размер дополнительного дохода от экспериментального контента на музыку артистов, созданного в рамках настоящего исследования, для исследуемых проектов лейбла Media Sharks в период с декабря 2023 г. по апрель 2024 г. составил 438 руб. 35 коп. Доход полунейросетевого-полуантропоморфного артиста ЕШШКА составил в указанный период 39 руб. 30 коп., суммарный доход артиста W&V от нейросетевого мультипликационного мини-альбома «Отражения» составил 107 руб. 44 коп., суммарный доход артиста Jennie Moz-Art от нейросетевых мультипликаций на песню «Ешкин кот» и нейросетевого клипа на песню «Мелодия твоей души» составил 291 руб. 61 коп. Если добавим к этим значениям собственный доход лейбла Media Sharks от монетизации 149 дополнительных просмотров нейросетевых копродуктов из плейлиста «ИИ тупит», описанных в п. 2.1.4 настоящего исследования, получим дополнительный доход лейбла от нового плейлиста в размере расчетных 2160 руб. 50 коп. и суммарный доход лейбла от экспериментальных продуктов в размере 2598 руб. 85 коп.
Приведенные расчетные показатели свидетельствуют о жизнеспособности нейросетевого контента и доказывают справедливость выдвинутой нами гипотезы о зависимости размеров дополнительной монетизации от размера фандома артиста.
Дискуссия и выводы
Настоящее исследование ставило целью изучение факторов, определяющих потенциал дополнительной монетизации стриминговой музыки инди-артистов у нейросетевых музыкальных видео, размещаемых на видеохостинге YouTube.
В результате кейс-стади историй создания нейросетевых видео было выявлено, что распространенными на массовом рынке нейросетевыми решениями для создания музыкальных клипов являются популярные генеративные инструменты визуализации Stable Diffusion, Midjourney, CLIP, StyleGAN2, BigGAN, GPT-4, Deforum, Sora, Kandinsky и Genmo, способные создавать статичные визуализационные слайды или динамичные анимированные сцены продолжительностью 4–16 секунд по текстовым описаниям промпт-инженеров. В дальнейшем они вручную дорабатываются путем склейки монтажных сцен режиссерами музыкальных видео. В целях обеспечения информирования пользователя видеохостинга YouTube о применении нейросетевых инструментов визуализации, а иногда и в целях рекламы таких инструментов музыкальные видео, создаваемые с использованием нейросетей, подписываются: «Нарисовано/сделано нейросетью».
Размещаемые на официальных каналах артистов нейросетевые видео дают больший эффект для артиста, чем размещаемые на каналах визуализаторов и промпт-инженеров нейросетевые клипы на песни артистов, хотя и в случае трансмедийной распространяемости по разным ресурсам артист имеет право на извлечение дохода от воспроизведения музыки в нейросетевом музыкальном видео, и этот вид дохода может рассматриваться как смежное право артиста.
В пользу подтверждения выдвинутой в разделе «Дизайн исследования» гипотезы о потенциале нейросетевых видео возродить внимание слушателя/фаната к музыкальному творчеству артиста [10] выступают полученные в ходе экспериментального исследования статистические данные о количестве просмотров нейросетевого клипа на песню артиста Jennie Moz-Art «Мелодия твоей души» и результаты опросов фокус-групп по нейросетевым клипам «Виртуальная я» артиста ЕШШКА и клипам инди-рок группы W&V «Свитер оверсайз» и «Ведьма и вампиры».
Исследование показало, что можно пропорционально сопоставлять доходы артистов с разными размерами фандомов по реляционным коэффициентам количества среднемесячных просмотров нейросетевого контента (Q) и средневзвешенному размеру вознаграждения за единичный просмотр нейросетевого музыкального видео (Yср). Предполагается реалистичным найти зависимость цены укрупненных 1000 просмотров единицы контента для артистов с фандомом более 50 тыс. подписчиков и смоделировать расчет для артистов лейбла Media Sharks, участвовавших в проведенном эксперименте. Финальной переменной, от которой зависит сборка общей формулы расчета дополнительной монетизации стриминговой музыки инди-артистов, мог бы стать коэффициент ценности одного активного подписчика для генерации дохода артисту от музыкальных видео на YouTube, однако на данный момент ввиду недостаточных количественных данных имеет смысл продолжить качественное исследование контент-анализом комментариев подписчиков артистов относительно субъективного восприятия нейросетевых музыкальных клипов, что позволит выявить точки роста в развитии представлений о совершенствовании технологий нейросетевой визуализации и производства нового знания об эмоциональных реакциях зрителей на нейросетевой контент артистов.
Список проанализированных в кейс-стади нейросетевых музыкальных клипов артистов (до клипа нейросети Sora)
- Ai music video — Kids with Guns — Gorillaz. Ben Gillin. 1 декабря 2023 г. [YouTube]. — URL: https://youtu.be/SbNSNi90yWc?si=pkwAk29uXfYhr7bV (дата обращения: 17.04.2024).
- Cream Soda. MELANCHOLIA (Live @ Радио ENERGY). Радио ENERGY. 23 апреля 2021 г. [YouTube]. — URL: https://youtu.be/fqNSXZLz48E?si=PxPu7eYaV3lA_jWE (дата обращения: 17.04.2024).
- Cream Soda. Меланхолия (Премьера клипа 2021). CREAM SODA. 23 апреля 2021 г. [YouTube]. — URL: https://youtu.be/sG_xXogxYUc?si=1wUzuqCVzZpKvUUe (дата обращения: 17.04.2024).
- Deep Purple. Child in Time 2022, (Lyrically) AI-illustrated. Soldesign72. 9, October, 2022. [YouTube]. — URL: https://youtu.be/v-T_G0R8_do?si=_s-BGrjKyalZ9CqX (дата обращения: 17.04.2024).
- Deep Purple. Child in Time — Live (1970). Deep Purple Official. 26, May, 2010. [YouTube]. — URL: https://youtu.be/OorZcOzNcgE?si=-eIj0UvUy8cfX1V- (дата обращения: 17.04.2024).
- Deep Purple. Smoke On the Water (Official Music Video). Deep Purple Official. 1, March, 2024. [YouTube]. — URL: https://youtu.be/Q2FzZSBD5LE?si=H4FL6clFSiRdX60z (дата обращения: 17.04.2024).
- Deep Purple. Smoke on the Water Live (1973, New York). Deep Purple Official. 9, May, 2010. [YouTube]. — URL: https://youtu.be/0WpKpcEORxo?si=W4Mu9PxiqF-j69S- (дата обращения: 17.04.2024).
- Kids with Guns. Gorillaz. 14 января 2010 г. [YouTube]. — URL: https://youtu.be/VCkFSe3voRc?si=JCku0dqE0iDNUWRW (дата обращения: 17.04.2024).
- Jennie Moz-Art. Ешкин кот (новогодний). Jennie Moz-Art Official. 25 декабря 2023 г. [YouTube]. — URL: https://youtu.be/Sp42-JRtW9U?si=fUbcTa9oEiAjWZwJ (дата обращения: 17.04.2024).
- Jennie Moz-Art. Летающие объекты (2017). Ешкин кот (Bonus Track).1 декабря 2017 г. [YouTube Music]. — URL: https://music.youtube.com/watch?v=DUuVDpXNBJQ (дата обращения: 17.04.2024).
- Jennie Moz-Art. Мелодия твоей души. Jennie Moz-Art Official. 28 апреля 2022 г. [YouTube]. — URL: https://youtu.be/qVdXIGNJ1-g?si=WCfFnjKD8ISg7pGy (дата обращения: 17.04.2024).
- Jennie Moz-Art. Мелодия твоей души (Kandinsky Visualisation, 2024). Jennie Moz-Art Official. 23 февраля 2024 г. — URL: https://youtu.be/ZAWpT75cPvg?si= uLN88fiF1rM3DYpr (дата обращения: 17.04.2024).
- Jennie Moz-Art & AI. Ешкин кот (официальное лирик-видео). Jennie Moz-Art Official. 29 августа 2023 г. [YouTube]. — URL: https://youtu.be/NaKh-wJOhK0?si=bRIxZxQSmkqJUxRH (дата обращения: 17.04.2024 г.).
- Jennie Moz-Art & AI. Ешкин кот (ретро). Jennie Moz-Art Official. 29 августа 2023 г. [YouTube]. — URL: https://youtu.be/FF7dU0OUHZk?si=tn1XgKRXQqIJGMQp (дата обращения: 17.04.2024).
- W&V. Ведьма и вампиры (live rehearsal). Witch and Vamps. 26 февраля 2024 г. [YouTube]. — URL: https://youtu.be/vBSHutRVWiQ?si=za83X5TQ-Y-GUR-4 (дата обращения: 17.04.2024).
- W&V. Ведьма и вампиры (мульт). Witch and Vamps. 12 февраля 2024 г. [YouTube]. — URL: https://youtu.be/24rh051ks5c?si=dqa4OKSRbWlfUTdn (дата обращения: 17.04.2024).
- W&V. Ветра (2024). Witch and Vamps. 9 февраля 2024 г. [YouTube]. — URL: https://youtu.be/R62WL8_C1Ms?si=8UH3924IFhRE8Lar (дата обращения: 17.04.2024).
- W&V. Ветра (мульт). Witch and Vamps. 12 февраля 2024 г. [YouTube]. — URL: https://youtu.be/5E74MWbeSI0?si=_X0hvwINVLI6pXZ9 (дата обращения: 17.04.2024).
- W&V. Свитер оверсайз (live rehearsal). Witch and Vamps. 19 февраля 2024 г. [YouTube]. — URL: https://youtu.be/0puAgm5q8bI?si=PwKkaDzOPPqkrci2 (дата обращения: 17.04.2024).
- W&V. Свитер оверсайз (мульт). Witch and Vamps. 12 февраля 2024 г. [YouTube]. — URL: https://youtu.be/F2OD-t2eOsQ?si=EMSuRpx8bnovuDN6 (дата обращения: 17.04.2024).
- W&V. Танго инферно (альбом «Отражения»). W&V (тема). 13 февраля 2024 г. [YouTube Music]. — URL: https://youtu.be/g4CmV-GdcVY?si=rXruqLUmOruS_wyI (дата обращения: 17.04.2024).
- W&V. Танго инферно (мульт). Witch and Vamps. 12 февраля 2024 г. [YouTube]. — URL: https://youtu.be/ZEE8zypiy9Q?si=s_Dx7f_xvncyL_7B (дата обращения: 17.04.2024).
- Король и Шут. Камнем по голове (Live) На Краю.Casino Gunes ve Ay. 22 января 2015 г. [YouTube]. — URL: https://youtu.be/ksRJWyIqp5I?si=KVzeGhM0VDdMXlza (дата обращения: 17.04.2024).
- Король и Шут. Камнем по голове нарисованный Нейросетью. Нарисовано Нейросетью. 24 марта 2023 г. [YouTube]. — URL: https://youtu.be/II97GC5ks7k?si=0lrtVrvS06c-MIzH (дата обращения: 17.04.2024).
- Король и Шут. Кукла колдуна (HD). Лекс Лютер. 27 августа 2013 г. [YouTube]. — URL: https://youtu.be/Nj6aM9ljdQU?si=5_MZI5itIMmJNLY1 (дата обращения: 17.04.2024).
- Король и Шут. Кукла колдуна (Нейросеть). Neural-madness. 30 ноября 2023 г. [YouTube]. — URL: https://youtu.be/L2SBi3_vnsU?si=dMLE76yYXKy5abPy (дата обращения: 17.04.2024).
- Нейросеть рисует клип Сектор газа — Мумия.Neural-madness. 2 октября 2023 г. [YouTube]. — URL: https://youtu.be/FmdZEOT_J-w?si=LrszE0craRMIGxdx (дата обращения: 17.04.2024).
- Сектор Газа. МУМИЯ. Odes90. 6 октября 2009 г. [YouTube]. — URL: https://youtu.be/TuXjea8Q5wc?si=LeHHPbh_Hs0gM3PR (дата обращения: 17.04.2024).
- Сектор Газа. Твой звонок. Bad Style. 6 августа 2018 г. [YouTube]. — URL: https://youtu.be/cXhPRJw-9Ek?si=bLpXhRE8PYlI2G8f (дата обращения: 17.04.2024).
- Сектор Газа. Твой звонок (новая нейросеть). Neural-madness. 10 октября 2023 г. [YouTube]. — URL: https://youtu.be/2xBthFqb_2w?si=Zuv8iMsBfI0JITe1 (дата обращения: 17.04.2024).
- Юлия Савичева. Девочка (Mood Video). SavichevaMusic. 13 марта 2024 г. [YouTube]. — URL: https://youtu.be/d0UTFndMAKw?si=IBlPwJXuIzXKjRL - (дата обращения: 17.04.2024).
- Юлия Савичева. Девочка (Премьера трека 2024). SavichevaMusic. 16 февраля 2024 г. [YouTube]. — URL: https://youtu.be/hu4Zf_lbAE8?si=1abD3tpeNsfMsx_i (дата обращения: 17.04.2024).
- ёшшка. Виртуальная я (feat. Jennie Moz-Art). ешшка. 15 декабря 2023 г. [YouTube Music]. — URL: https://music.youtube.com/watch?v=S1assh18Lwc&list=OLAK5uy_kTRYgWU0IdfJPnzI8rUPVgS6Fix9fcfxU (дата обращения: 17.04.2024).
List of analyzed case-studies with AI-generated music videos of the artists (created before Sora AI):
- Ai music video — Kids with Guns — Gorillaz. Ben Gillin. 01.12.2023 [YouTube]. — URL: https://youtu.be/SbNSNi90yWc?si=pkwAk29uXfYhr7bV (access date: 17.04.2024).
- Cream Soda. MELANCHOLIA (Live @ Radio ENERGY). Radio ENERGY. 23, April, 2021. [YouTube]. — URL: https://youtu.be/fqNSXZLz48E?si=PxPu7eYaV3lA_jWE (access date: 17.04.2024).
- Cream Soda. Melanholiya (Premyera klipa 2021). (in Russ.). Cream Soda. Melankholy. (Music video prime show, 2021). CREAM SODA. 23, April, 2021. [YouTube]. — URL: https://youtu.be/sG_xXogxYUc?si=1wUzuqCVzZpKvUUe (access date: 17.04.2024).
- Deep Purple. Child In Time 2022, (Lyrically) AI-illustrated. Soldesign72. 9, October, 2022. [YouTube]. URL: https://youtu.be/v-T_G0R8_do?si=_s-BGrjKyalZ9CqX (access date: 17.04.2024).
- Deep Purple. Child in Time — Live (1970). Deep Purple Official. 26, May, 2010. [YouTube]. — URL: https://youtu.be/OorZcOzNcgE?si=-eIj0UvUy8cfX1V (access date: 17.04.2024).
- Deep Purple. Smoke On the Water (Official Music Video). Deep Purple Official. 1, March, 2024. [YouTube]. — URL: https://youtu.be/Q2FzZSBD5LE?si=H4FL6clFSiRdX60z (access date: 17.04.2024).
- Deep Purple. Smoke on the Water Live (1973, New York). Deep Purple Official. 9, May, 2010. [YouTube]. — URL: https://youtu.be/0WpKpcEORxo?si=W4Mu9PxiqF-j69S- (access date: 17.04.2024).
- Kids with Guns. Gorillaz.14, January, 2010. [YouTube]. — URL: https://youtu.be/VCkFSe3voRc?si=JCku0dqE0iDNUWRW (access date: 17.04.2024).
- Jennie Moz-Art. Yoshkin Kot (novogodniy) (in Russ.). Jennie Moz-Art. Yoshkin Kot (New Year version) // Jennie Moz-Art Official [YouTube]. 25, December, 2023. — URL: https://youtu.be/Sp42-JRtW9U?si=j06GUwBFyszZ2WaR (access date: 17, April, 2024).
- Jennie Moz-Art. Letahushiye objekti (2017). Yoshkin Kot (Bonus Track) (in Russ.). Jennie Moz-Art. Flying objects (2017). Yoshka’s Cat (Bonus Track). 1, December, 2017. [YouTube Music]. — URL: https://music.youtube.com/watch?v=DUuVDpXNBJQ (access date: 17.04.2024).
- Melodiya tvoei dushi (single) (in Russ.). Jennie Moz-Art. Melody of Your Soul (Single) // Jennie Moz-Art Official [YouTube channel]. 28, April, 2022. — URL: https://youtu.be/qVdXIGNJ1-g?si=WCfFnjKD8ISg7pGy (access date: 17.04.2024).
- Jennie Moz-Art. Melodiya tvoei dushi (Kandinsky Visualization, 2024). (in Russ.). Jennie Moz-Art. The Melody of Your Soul // Jennie Moz-Art Official [YouTube]. 23, February, 2024. — URL: https://youtu.be/ZAWpT75cPvg?si=uLN88fiF1rM3DYpr (access date: 17.04.2024).
- Jennie Moz-Art & AI. Yoshkin Kot (Ofitsial’noye lirik-video) (in Russ.) Jennie Moz-Art & AI. Yoshkin Kot (Official lyric video) // Jennie Moz-Art Official [YouTube]. 29, August, 2023. — URL: https://youtu.be/NaKh-wJOhK0?si=mKS49QZReX4syp8V (access date: 12, April, 2024).
- Jennie Moz-Art & AI. Yoshkin Kot (retro). (in Russ.) Jennie Moz-Art & AI. Yoshkin Kot (retro style) // Jennie Moz-Art Official [YouTube]. 29, August, 2023. — URL: https://youtu.be/FF7dU0OUHZk?si=a9bu6k3DzR50-rNo (Access date: 12, April, 2024).
- W&V. Ved’ma i vampiry (live rehearsal) (in Russ.). W&V. Witch and Vamps (live rehearsal). Witch and Vamps. 26, February, 2024. [YouTube]. — URL: https://youtu.be/vBSHutRVWiQ?si=za83X5TQ-Y-GUR-4 (access date: 17.04.2024).
- W&V. Ved’ma i vampiry (mul’t) (in Russ.). W&V. Witch and Vamps (AI-cartoon) // Witch and Vamps. [YouTube]. 12, February, 2024. — URL: https://youtu.be/24rh051ks5c?si=2IZctS4Dez8ZM-Ce (access date: 12, April, 2024).
- W&V. Vetra (2024) (in Russ.). W&V. The Winds (2024). Witch and Vamps. 9, February, 2024. [YouTube]. — URL: https://youtu.be/R62WL8_C1Ms?si=8UH3924IFhRE8Lar (access date: 17.04.2024).
- W&V. Vetra (mul’t) (in Russ.). W&V. The Winds (AI-cartoon) //Witch and Vamps. [YouTube]. 12, February, 2024. — URL: https://youtu.be/5E74MWbeSI0?si=jnLMppLHR_9ptiAv (access date: 17, April, 2024).
- W&V. Sweater oversize (live rehearsal). Witch and Vamps. 19, February, 2024. [YouTube]. — URL: https://youtu.be/0puAgm5q8bI?si=PwKkaDzOPPqkrci2 (access date: 17.04.2024).
- W&V. Sweater oversize (mul’t) (in Russ.). W&V. Sweater oversize (AI-cartoon) // Witch&Vamps [YouTube channel]. 12, February, 2024. URL: https://youtu.be/F2OD-t2eOsQ?si=OWshfkq6-m27f0fH (access date: 7, May, 2024).
- W&V. Tango inferno (al’bom “Otrazheniya”). W&V (tema) (in Russ.). W&V. Tango Inferno (“Otrazheniya” album). W&V (theme). 13, February, 2024. [YouTube Music]. — URL: https://youtu.be/g4CmV-GdcVY?si=rXruqLUmOruS_wyI (Aaccess date: 17.04.2024).
- W&V. Tango Inferno (mul’t). (in Russ.). W&V. Tango Inferno (AI-cartoon) // Witch and Vamps. [YouTube]. 12, February, 2024. — URL: https://youtu.be/ZEE8zypiy9Q?si=ypHs3nkEtZ7rT0DB (access date: 17, April, 2024).
- Korol’ i Shut. Kamnem po golove (Live) Na krayu. Casino Gunes ve Ay (in Russ.). King and Joker. Stone on the Head (Live). At the Edge. Casino Gunes ve Ay. 22, January, 2015. [YouTube]. — URL: https://youtu.be/ksRJWyIqp5I?si=KVzeGhM0VDdMXlza (access date: 17.04.2024).
- Korol’ i Shut. Kamnem po golove narisovanniy neyrosetyu (in Russ.). King and Joker. Stone on the Head drawn by AI. Narisovano Neyrosetyu. 24, March, 2023. [YouTube]. — URL: https://youtu.be/II97GC5ks7k?si=0lrtVrvS06c-MIzH (access date: 17.04.2024).
- Korol’ i Shut. Kukla kolduna (HD) (in Russ.). King and Joker. Magician’s Doll. Lex Luthor. 27, August, 2013. [YouTube]. — URL: https://youtu.be/Nj6aM9ljdQU?si=5_MZI5itIMmJNLY1 (access date: 17.04.2024).
- Korol’ i Shut. Kukla kolduna (Neiroset’) (in Russ.). King and Joker. Magician’s Doll (AI). Neural-madness. 30, January, 2023. [YouTube]. — URL: https://youtu.be/L2SBi3_vnsU?si=dMLE76yYXKy5abPy (access date: 17.04.2024).
- Neiroset’ risuet klip Sektor Gaza — Mumiya (in Russ.). Neural network draws the AI music video for Sector Gaza’s song “Mumy”. Neural-madness. 2, October, 2023. [YouTube]. — URL: https://youtu.be/FmdZEOT_J-w?si=LrszE0craRMIGxdx (access date: 17.04.2024).
- Sektor Gaza. MUMIYA (in Russ.). Sector Gaza. MUMY. Odes90. 6, October, 2009. [YouTube]. — URL: https://youtu.be/TuXjea8Q5wc?si=LeHHPbh_Hs0gM3PR (access date: 17.04.2024).
- Sektor Gaza. Tvoy zvonok. (in Russ.). Sector Gaza. Your call. Bad Style. 6, August, 2018. [YouTube]. — URL: https://youtu.be/cXhPRJw-9Ek?si=bLpXhRE8PYlI2G8f (access date: 17.04.2024).
- Sektor Gaza. Tvoy zvonok (novaya neyroset’) (in Russ.). Sector Gaza. Your call (new AI). Neural-madness. 10, October, 2023. [YouTube]. — URL: https://youtu.be/2xBthFqb_2w?si=Zuv8iMsBfI0JITe1 (access date: 17.04.2024).
- Yuliya Savicheva. Devochka (Mood Video) (in Russ.). Yuliya Savicheva. The Girl. (Mood Video). SavichevaMusic. 13, March, 2024. [YouTube]. — URL: https://youtu.be/d0UTFndMAKw?si=IBlPwJXuIzXKjRL- (access date: 17.04.2024).
- Yuliya Savicheva. Devochka (Premyera treka 2024) (in Russ.). Yuliya Savicheva. The Girl. (Prime play of the track release). Savicheva Music. 16, February, 2024. [YouTube]. — URL: https://youtu.be/hu4Zf_lbAE8?si=1abD3tpeNsfMsx_i (access date: 17.04.2024).
- Virtual’naya ya (feat. Jennie Moz-Art). (in Russ.). YOSHSHKA. Virtual me (feat. Jennie Moz-Art). YOSHSHKA. 15, December, 2023. [YouTube Music]. — URL: https://music.youtube.com/watch?v=S1assh18Lwc&list=OLAK5uy_kTRYgWU0IdfJPnzI8rUPVgS6Fix9fcfxU (access date: 17.04.2024).
About the authors
Ruslan A. Budnik
Higher School of Economics (HSE University)
Author for correspondence.
Email: eevpak@hse.ru
ORCID iD: 0000-0001-8076-1560
Deputy Director of the International Scientific and Educational Center “UNESCO Chair on Copyright, Neighboring, Cultural and Information Rights”, Doctor of Legal Sciences
Russian Federation, MoscowVladimir V. Guryanov
Higher School of Economics (HSE University)
Email: vguryanov@hse.ru
ORCID iD: 0000-0001-8615-3806
Senior lecturer of the Institute for Media
Russian Federation, MoscowEvgeniya G. Evpak
Higher School of Economics (HSE University)
Email: vguryanov@hse.ru
ORCID iD: 0000-0001-5961-5657
Ph.D. scholar of the Arts and Design School, Visiting Lecturer of the Design School
Russian Federation, MoscowReferences
- Frulinger D. Chto takoe generativniy iskusstvenniy intellekt? (in Russ.). What is general artificial intelligence? // BIT. Business & Informatsionniye Technologii. 2023. No 2(125). P. 32–35.
- Bol’she, chem obuchenie // Universitetskaya kniga. 2023. No 10. S. 16–19. — EDN ROVDYB.
- Mezhdunarodnaya konferentsiya “Teorii i praktiki iskusstva i dizaina: sociokul’turniye, politicheskiye i ekonomicheskiye konteksti”. Sektsiya “Mediaiskusstvo v kontekste noveyshikh tehnologiy”. Moderator: Stanislav Milovidov (in Russ.). International conference “Theories and practices of arts and design: sociocultural, political and economic contexts”. Sect. “Media art in the context of new technologies”. April, 11, 2024, M., HSE Creative Hub. — URL: https://design.hse.ru/news/3199#program
- Mezhdunarodnaya konferentsiya “Teorii i praktiki iskusstva i dizaina: sociokul’turniye, politicheskiye i ekonomicheskiye konteksti”. Krugliy stol “Neyrosetevoy povorot v populyarnoi muzyke: vozmozhnosti i vizovy”. Moderator: Evgeniya Evpak (in Russ.). International conference “Theories and practices of arts and design: sociocultural, political and economic contexts”. Round table “Generative neural transition in popular music: opportunities and challenges”. April, 12, 2024. M., HSE Creative Hub. — URL: https://design.hse.ru/news/3199
- IV Mezhdunarodnaya nauchno-prakticheskaya conferentsiya “AUTHOR-2024” (in Russ). IV International research-and-practical conference “AUTHOR-2024” / Mezhdunarodniynauchno-obrazovatel’niy tsentr “Kafedra UNESCO po avtorskomu pravu, smezhnim, kul’turnim i informatsionnim pravam”. Meropriyatiya. IV Mezhdunarodnaya nauchno-prakticheskaya conferentsiya “AUTHOR-2024. 18-19, April, 2024. Moscow.
- Wikipedia. Monetizatsiya (in Russ.). — URL: https://ru.wikipedia.org/wiki/Monetizatsiya (Access date: 24.03.2024).
- Volkov D.P. Endorsing v muzykal’noy industrii (in Russ.). Enrorcing in the music industry // EKONOMIKA, BIZNES, INNOVATSII: sb. statey Mezhdunarodnoi nauchno-prakticheskoy konferentsii: v 2 chastyah. Penza, 5 January, 2018. Vol. 1. Ch. 1. Penza: Nauka i Prosvescheniy (IP Gulyayev G.Y.), 2018. S. 107–109.
- Arefiyeva A.I. Vliyaniye mediatechnologiy na vyrazheniye zritel’skoy loyal’nosti mezhdunarodnogo konkursa “Eurovidenie” (in Russ.). Influence of media technologies on reflection of viewers’ loyalty towards “Eurovision” international song contest // Innovatsii. Nauka. Obrazovaniye. 2021. No 47. S. 1354–1362.
- Iglamova А.А. Muzykal’noye ispolnitel’stvo v referentsiyakh nachala XXI veka (in Russ.). Music performance in references of the beginning of the 21st century // Teatr XXI veka i vizovy novogo vremeni: materialy mezhdunarodniy nauchno-prakticheskoy konferentsii, posvyaschonnoy 110-letiyu tatarskogo teatra, Kazan, 22, December, 2016. Kazan: Institut yazika, literaturi i iskusstva imeni G. Ibragimova, 2016. P. 242–249.
- West P.M., Brockett P.L., Golden L.L. A Comparative Analysis of Neural Networks and Statistical Methods for Predicting Consumer Choice // Marketing Science. 1997. Vol. 16(4). P. 370–391. — URL: http://www.jstor.org/stable/184232
- Ramon A. Gruppa Cream Soda vypustili klip, sgenerirovanniy neyrosetyu (in Russ.). Cream Soda music band released a music video generated by neural network // 23, April, 2021. Metro, Saint Petersburg [Online source]. — URL: https://www.metronews.ru/visual/video/reviews/gruppa-cream-soda-vypustili-klip-sgenerirovannyy-neyrosetyu-1781741/ (access date: 24.03.2024).
- Cream Soda — Melankholiya (Premiera klipa, 2021). Cream Soda. YouTube [music video]. — URL: https://youtu.be/sG_xXogxYUc?si=OM4r0NOI5c3cEwtq (access date: 24.03.2024).
- Cream Soda vypustili klip “Melankholiya”. Ego napisala neyroset’. Pravila Zhizni. Kul’tura i razvlecheniya (in Russ). Cream Soda released the music video “Melankholiya”. It was generated by a neural network. 22.04.2021 // Pravila Zhizni [Online source]. — URL: https://www.pravilamag.ru/news/culture-and-entertainment/22-04-2021/257563-cream-soda-vypustili-klip-melanholiya-ego-napisala-neyroset/ (access date: 25.03.2024).
- Jeremy Norman’s HistoryofInformation.com. The First Illustrated Song, First Step towards the Music Video // HistoryofInformation.com [Online source]. — URL: https://www.historyofinformation.com/detail.php?id=3990 (access date: May, 10, 2024).
- V First Fully AI Music Video Released // drmilktruck, November, 25, 2023. Gretsch-talk.com [Online forum]. — URL: https://www.gretsch-talk.com/threads/first-fully-ai-music-video-released.223806/ (access date: May, 10, 2024).
- Song “Betrayed by this Town” — Anna Indiana (AI) Artificial Intelligence // A1-ECR Big Data Analytics, 24, November, 2023. [YouTube video]. — URL: https://youtu.be/3T175LTQFnw?si=XhTgUsZDE4o28jCS (access date: May, 10, 2024).
- SEVENTEEN. “MAESTRO”. Official Teaser 1 // HYBE Labels. [YouTube video]. 24, April, 2024. — URL: https://youtu.be/rOK790-wRhk?si=Sr8tze6-0RT8uqDb (access date: 11, May, 2024).
- RIIZE. “Impossible” AI Generated Visualizer // RIIZE [YouTube video]. 23, April, 2024. URL: https://www.youtube.com/watch?v=PAMS2-BjLYM&ab_channel=RIIZE (access date: 11, May, 2024).
- Washed Out — The Hardest Part (Official Video). // Washed Out [YouTube video]. 2, May, 2024. URL: https://youtu.be/-Nb-M1GAOX8?si=bAM4JoePMOeQ9Xtr (access date: 11, May, 2024).
- Chatzimparmpas A., Martins R.M., Jusufi I., Kerren A. A survey of surveys on the use of visualization for interpreting machine learning models // Information Visualization. 2020. Vol. 19(3). P. 207–233.
- Deng J, Dong W, Socher R. et al. ImageNet: a large-scale hierarchical image database // Proceedings of the 2009 IEEE conference on computer vision and pattern recognition, Miami, FL, 20–25 June 2009, P. 248–255. New York: IEEE. — Cit. po: Chatzimparmpas A., Martins R.M., Jusufi I., Kerren A. A survey of surveys on the use of visualization for interpreting machine learning models // Information Visualization. 2020. Vol. 19(3). P. 207–233.
- GK RF Statya 1300. Informatsiya ob avtorskom prave. Grazhdanskiy Kodeks Rossiyskoy Federatsii (Chast’ chetvertaya) ot 18.12.2006 No 230 FZ red. ot 30.01.2024) (in Russ.) Civil Code of Russian Federation. Article 1300. Information about copyright // Informatsionnaya sistema “Konsul’tant Plus” [Online source]. — URL: https://www.consultant.ru/document/cons_doc_LAW_64629/510639c114afe9742a1114add641bb1ce4dd8352/#dst100502 (access date: 25.04.2024).
- Jennie Moz-Art & AI. Yoshkin Kot (Ofitsial’noye lirik-video). (in Russ.) Jennie Moz-Art & AI. Yoshkin Kot (Official lyric video) // Jennie Moz-Art Official [YouTube]. 29, August, 2023. — URL: https://youtu.be/NaKh-wJOhK0?si=mKS49QZReX4syp8V (access date: 12, April, 2024).
- Jennie Moz-Art & AI. Yoshkin Kot (retro) (in Russ.) Jennie Moz-Art & AI. Yoshkin Kot (retro style) // Jennie Moz-Art Official [YouTube]. 29, August, 2023. — URL: https://youtu.be/FF7dU0OUHZk?si=a9bu6k3DzR50-rNo (access date: 12, April, 2024).
- Jennie Moz-Art. Yoshkin Kot (novogodniy) (in Russ.). Jennie Moz-Art. Yoshkin Kot (New Year version) // Jennie Moz-Art Official [YouTube]. 25, December, 2023. — URL: https://youtu.be/Sp42-JRtW9U?si=j06GUwBFyszZ2WaR (access date: 12, April, 2024).
- W&V. Ved’ma i vampiry (mul’t) (in Russ.). W&V. Witch and Vamps (AI-cartoon) // Witch and Vamps. [YouTube]. 12, February, 2024. — URL: https://youtu.be/24rh051ks5c?si=2IZctS4Dez8ZM-Ce (access date: 12, April, 2024).
- W&V. Sweater oversize (mul’t) (in Russ.). W&V. Sweater oversize (AI-cartoon) //Witch and Vamps. [YouTube]. 12, February, 2024. — URL: https://youtu.be/F2OD-t2eOsQ?si=FkJgUjWGmO7G2w8j (access date: 12, April, 2024).
- W&V. Tango Inferno (mul’t) (in Russ.). W&V. Tango Inferno (AI-cartoon) //Witch and Vamps. [YouTube]. 12, February, 2024. — URL: https://youtu.be/ZEE8zypiy9Q?si=ypHs3nkEtZ7rT0DB (access date: 12, April, 2024).
- W&V. Vetra (mul’t) (in Russ.). W&V. The Winds (AI-cartoon) //Witch and Vamps. [YouTube]. 12, February, 2024. — URL: https://youtu.be/5E74MWbeSI0?si=jnLMppLHR_9ptiAv (access date: 12, April, 2024).
- Jennie Moz-Art. Melodiya tvoei dushi (Kandinsky Visualization, 2024) (in Russ.). Jennie Moz-Art. The Melody of Your Soul // Jennie Moz-Art Official [YouTube]. 23, February, 2024. — URL: https://youtu.be/ZAWpT75cPvg?si=DcGuIrO6UVTF87VR (access date: 12, April, 2024).
- YOSHSHKA. Virtual’naya ya. (in Russ.). YOSHSHKA. Virtual me // YOSHSHKA (theme). Provided to YouTube by Media Sharks. 13, December, 2023. — URL: https://youtu.be/S1assh18Lwc?si=Zv4rdfBKmPPcqkFS (access date: 7, May, 2024).
- YOSHSHKA. Virtual’naya ya (singl, 2023). in Russ.). YOSHSHKA. Virtual me. (Single, 2023) // Media Sharks [YouTube channel]. 14, December, 2023. — URL: https://youtu.be/_F5lCe5zWJg?si=3iFFVC8gSU4Q7bmT (access date: 7, May, 2024).
- W&V. Ved’ma i vampiry (мульт) // Witch&Vamps [YouTube-канал]. 12 февраля 2024 г. — URL: https://youtu.be/24rh051ks5c?si=6fdba3KYy54aDSLi (access date: 7 мая 2024 г.)
- W&V. Ved’ma i vampiry (Live rehearsal) (in Russ.). W&V. Witch and Vamps (Live rehearsal) // Witch&Vamps [YouTube-канал]. 26, February, 2024. — URL: https://youtu.be/vBSHutRVWiQ?si=uNsTSk4HBlym0Nhd (access date: 7, May, 2024).
- Jennie Moz-Art. Ya uedu zhit’ v sviter (Lyric video) (in Russ.). Jennie Moz-Art. I’m leaving for sweater (Lyric video) // Jennie Moz-Art Official [YouTube channel]. 30, March, 2023. — URL: https://youtu.be/YJ6pPMQcwpQ?si=oEN_wwDk_A6xEkxZ (access date: 7, May, 2024).
- W&V. Sweater oversize (mul’t) (in Russ.). W&V. Sweater oversize (AI-cartoon) // Witch&Vamps [YouTube channel]. 12, February, 2024. — URL: https://youtu.be/F2OD-t2eOsQ?si=OWshfkq6-m27f0fH (access date: 7, May, 2024).
- Jennie Moz-Art. Melodiya tvoei dushi (single). (in Russ.). Jennie Moz-Art. Melody of Your Soul (Single) // Jennie Moz-Art Official [YouTube channel]. 28, April, 2022. — URL: https://youtu.be/qVdXIGNJ1-g?si=buF5nenmUdP9pvSx (access date: 7, May, 2024).
- Jennie Moz-Art. Melodiya tvoei dushi (Kandinsky visualisation, 2024) // Jennie Moz-Art Official [YouTube-канал]. 23 февраля 2024 г. — URL: https://youtu.be/ZAWpT75cPvg?si=INdGMdMB5rOW9ar7 (access date: 7 мая 2024 г.).
- EShShKA. Virtual’naya ya (singl, 2023) // Media Sharks [YouTube-канал]. 14 dec. 2023 г. — URL: https://youtu.be/_F5lCe5zWJg?si=3iFFVC8gSU4Q7bmT (там же).
- Guryanov V., Evpak E. Otsenite eksperimental’niy klip, sozdanniy chelovekom i neyrosetyami? (in Russ.). Evaluate the experimental music video created by human being and generative neural networks? // Vladimir Guryanov, Evgeniya Evpak [online questionnaire]. 5, December, 2023. — URL: https://forms.gle/QVjWBBQwdnRMCf146 (access date: 7, May, 2024).
- Guryanov V., Evpak E. Otsenite sleduyushiy eksperimental’niy klip, sozsanniy chelovekom i neyrosetyami (in Russ.). Evaluate the next one experimental music video created by human being and generative neural networks // Vladimir Guryanov, Evgeniya Evpak [online questionnaire]. 19, March, 2024. URL: https://forms.gle/ihkcTZ46E6ewSjV6A (access date: 7, May, 2024).
- Guryanov V., Evpak E. Otsenite esho odin eksperimental’niy klip, sozdanniy chelovekom i neyrosetyami (in Russ.). Evaluate one more experimental music video created by human being and generative neural networks // Vladimir Guryanov, Evgeniya Evpak [online questionnaire]. 14, February, 2024. — URL: https://forms.gle/N2y3bJ5dARy8wJNS6 (access date: 7, May, 2024).
- Kinoproba gorod (in Russ.). “City” filming take // II tupit! Mucheniya virtual’nogo rezhissera s neyrosetevimi aktyorami. Media Sharks [YouTube video]. 21, April, 2024. — URL: https://youtu.be/y87Yd6e29Pk?si=EOwynFlspC4gK9Ju (access date: 11.05.2024).
- Kinoproba sloni 00 (in Russ.). “Elephants 00” filming take // II tupit! Mucheniya virtual’nogo rezhissera s neyrosetevimi aktyorami. Media Sharks [YouTube video]. 21, April, 2024. — URL: https://youtu.be/qK1Fd9vVJHI?si=X09tfZ2d2CaRUi6E (access date: 11.05.2024).
- Kinoproba Hloya rusalka (in Russ.). “Chloe the mermaid” filming take // II tupit! Mucheniya virtual’nogo rezhissera s neyrosetevimi aktyorami. Media Sharks [YouTube video]. 21, April, 2024. — URL: https://youtu.be/VYYDYS7plK4?si=7vVLpY5CdDbx9Qs0 (access date: 11.05.2024).
- Kinoproba muha 00 (in Russ.). “Fly” filming take // II tupit! Mucheniya virtual’nogo rezhissera s neyrosetevimi aktyorami. Media Sharks [YouTube video]. 21, April, 2024. — URL: https://youtu.be/-mQRBDANBuA?si=1vdJSRIeONdA6Qjs (access date: 11.05.2024).
- Proba ved’my 4.2. (in Russ.). “Witch 4.2.” filming take // II tupit! Mucheniya virtual’nogo rezhissera s neyrosetevimi aktyorami. Media Sharks [YouTube video]. 28, April, 2024. — URL: https://youtu.be/HOuCqa0rCDo?si=0vzGNN5DvXUmVMy_ (access date: 11.05.2024).
- Kinoproba yozhiki 2 (in Russ.). “Hedgehogs 2” filming take // II tupit! Mucheniya virtual’nogo rezhissera s neyrosetevimi aktyorami. Media Sharks [YouTube video]. 3, May, 2024. — URL: https://youtu.be/1fTOqh3PTds?si=vnIqDF1s50m8HTOZ (access date: 11.05.2024).
- Sinopsis trillera “Yoshkin kot” (in Russ.). “Yoshka’s Cat” Thriller Synopsis // II tupit! Mucheniya virtual’nogo rezhissera s neyrosetevimi aktyorami. Media Sharks [YouTube video]. 3, May, 2024. — URL: https://youtu.be/uOvRwsdSvzI?si=TworWTz9iwri_w_m (access date: 11.05.2024).
- Yoshkin merch (in Russ.). Yoshka’s merch // II tupit! Mucheniya virtual’nogo rezhissera s neyrosetevimi aktyorami. [YouTube video]. 11, May, 2024. — URL: https://youtu.be/6BxRCx--6o0?si=o7KrTYoOKDjLKpyy (access date: 11.05.2024).
- Dohodi s YouTube: skol’ko mozhno zarabotat’? (in Russ.). YouTube profit: how much can one earn? // UpSound [Online source]. — URL: https://we.upsound.org/youtubecash (access date: 11, May, 2024).
Supplementary files
