|
|
||
Работа над текстами и около них - графика, инструменты и тому подобное. |
Данная коллекция примеров иллюстрирует пояснение к пишущемуся пособию по Suno.
В данном примере в треке должно быть две темы, в мажоре и миноре; в первой ведущий инструмент - фортепиано, во второй - флейта. В композиции пять секций, с разными вариантами развития и смешения тем.
В поле ввода "Стиль музыки" введено то, что в заголовке каждого трека-примера (стиль, жанр, модификатор, инструмент). Таким образом форма (Lyrics) модифицируется так чтобы содержание вписывалось в предлагаемый стиль.
Что получилось - судите сами.
[mixing:clean, wide] [focus:bass, melody] [eq:bass-heavy, bright] [stereo:wide] [reverb:light] [instruments:flute, piano] [theme1: A grand piano motif in C major.] [theme2: A contrasting flute melody in A minor.] [section1: Introduction of theme1 with orchestral accompaniment.] [section2: Transition to theme2, led by flutes and strings.] [section3: Development of both themes with counterpoint in brass and woodwinds.] [section4: Recapitulation of theme1 in a dramatic orchestral tutti.] [section5: Coda with layered motifs resolving to a triumphant C major chord.]
Accordion rock
Acoustic blues
Avant-garde jazz disco
Brass orchestra
Chamber orchestra
City pop symphonic metal
Classical
Dark cabaret
Easy listening
EDM
Experimental psych
Horror synth
Hypnagogic pacific reggae
Liquid bass and drum rockabilly
Minimal techno house
Musical saw cafe band
New age
Orchestral soundtrack
Psychedelic psybient
Rock-n-roll
Russian techno
Shoegaze
Soulful reggaeton
Spiritual hip hop
Synth prog
Synthwave
Tavern
Technopop
Vaporwave
===== Перейти к комментариям
Сложно сказать, почему выбрал именно это стихотворение. Я бы выразился так: в нём та эссенция автора, которая понемногу перелилась во все его работы.
Так же, как работы известного поэта, чей путь завершился на мосту Мирабо, "Наполеон" - короткое стихотворение, в одну строфу. Всё же оно при этом очень ёмкое.
Второй куплет - галлюцинация искина на эту же тему.
Walter de la Mare, "Napoleon" (1901 - 1918) "WHAT is the world, O soldiers? It is I: I, this incessant snow, This northern sky; Soldiers, this solitude Through which we go Is I."
Варианты трека
Walter de la Mare - Napoleon (V1)
Walter de la Mare - Napoleon (V2)
Walter de la Mare - Napoleon (V3)
Walter de la Mare - Napoleon (V4)
Walter de la Mare - Napoleon (V5)
Walter de la Mare - Napoleon (V6)
Walter de la Mare - Napoleon (V7)
===== Перейти к комментариям
Всё же посмотрим, что такое персоны в действии. С "Колоколами" всё глухо, простите за корявый каламбур, но есть другие песни, не отягощённые авторским и смежными правами в силу давности лет.
Я выбрал среди таких "Славное море", считающуюся теперь народной, по стихотворению 1848 года Дмитрия Павловича Давыдова, сибирского поэта.
Думаю, что песня не нуждается в представлении.
Славное море - священный Байкал, Славный корабль - омулёвая бочка. Эй, Баргузин, пошевеливай вал, Молодцу плыть недалёчко. Долго я тяжкие цепи влачил, Долго скитался в горах Акатуя; Старый товарищ бежать пособил - Ожил я, волю почуя. Шилка и Нерчинск не страшны теперь, Горная стража меня не поймала, В дебрях не тронул прожорливый зверь, Пуля стрелка - миновала. Шёл я и в ночь, и средь белого дня, Вкруг городов озираяся зорко, Хлебом кормили крестьянки меня, Парни снабжали махоркой. Славное море - священный Байкал, Славный мой парус - кафтан дыроватый, Эй, Баргузин, пошевеливай вал, Слышатся грома раскаты.
Исходный трек - эталон персоны, "Хромой король"
Варианты трека
Славное море - священный Байкал (01, Pop Rock)
Славное море - священный Байкал (02, Acoustic Ballad)
Славное море - священный Байкал (03, March)
Славное море - священный Байкал (04, A Cappella)
Славное море - священный Байкал (05, Folk Rock)
Славное море - священный Байкал (06, Folk Pop)
Славное море - священный Байкал (07, String Orchestra)
Славное море - священный Байкал (08, Punk)
Славное море - священный Байкал (09, Cafe Rock)
Славное море - священный Байкал (10, Drum Voices)
Славное море - священный Байкал (11, Chant)
Славное море - священный Байкал (12, Chant Aria)
===== Перейти к комментариям
Первые опыты с т.н. персонами оказались, на самом деле, впечатляющими. Я многократно высказывал мысль, что отсутствие "личности" - шаблона темра и манер исполнения - это то, что ощутимо мешает в генерировании треков: шут его знает, какой голос искин выберет в следующий раз.
А теперь, едва только найден устраивающий тембр и манера, можно создать на базе их т.н. "персону" (persona) и петь далее от его/её/их имени.
Первый опыт ниже. Персона сгенерирована с "исполнителя" песни "Хромой король". Этакий оперный голос. На его основе порождено пять треков на текст песни "Колокола".
Прежде чем слушать сгенерированное, очень советую послушать то, о чём речь. Наверняка многие из вас знают эту песню, из "Приключений Электроника". Два варианта: на YouTube, на RuTube. Первый - из фильма, второй уже студийный.
Автор слов: Юрий Энтин Бьют часы на старой башне, Провожая день вчерашний, И звонят колокола... Провожая день вчерашний, Бьют часы на старой башне, Будет, будет даль светла! Припев: Бой часов, как ключик золотой, Двери утра весело открой! Окна утра настежь распахни! Сумрак ночи с улиц прогони! Бьют часы на старой башне. То, что ночью было страшным, Светом залито дневным. То, что ночью было страшным, Стало теплым и домашним, Стало милым и смешным. Припев. Бьют часы на старой башне. В этом мире должен каждый Не спешить, не отставать. В этом мире должен каждый Слушать время и отважно В ногу с временем шагать! Припев: Бой часов, как ключик золотой, Двери утра весело открой! Окна утра настежь распахни! Сумрак ночи с улиц прогони! Окна утра настежь распахни! Сумрак ночи с улиц прогони! Бьют часы на старой башне, Провожая день вчерашний, И звонят колокола.
Исходный трек - эталон персоны, "Хромой король"
Почти уже опубликовал, когда понял, что для этого требуется разрешение автора слов песни. Я отправил запрос представителю Юрия Энтина; если разрешат на приемлемых условиях, выложу сюда; до того момента (и если нет) просьба обращаться ко мне приватно.
Ну а я тем временем "исполню" этим же оперным голосом что-нибудь такое, где уже не требуется разрешения автора или его наследников.
===== Перейти к комментариям
Алиса. Которая из Страны Чудес.
Ну и грибы. Много грибов.
Ну и далее - мысли самой Алисы.
1. Mushrooms that I’m tasting seem to twist me into baseless shapes, Suddenly I'm shrinking, then I'm stretching out in endless tapes. Biting one is danger, and the other just a stranger’s trick, All this nibbling, dabbling, turns my world around in colors thick. 2. Tall as trees I’m towering, then I’m small enough to flee the ants, Growing like a giant, now my toes outgrow my shoes and pants. With each bite, I’m guessing if I’ll stretch or shrink or spin around, Mushrooms that I’m munching make me wonder where my feet are bound. 3. What’s the size I’m seeking when my mind is slowly leaking sense? Every nibble leaving me with questions wide and doubts immense. All the things I’m tasting lead me farther down this path of dreams, Mushrooms’ magic swirling ‘round in wild and whirling schemes. 4. Left and right I’m finding every mushroom has a trick to pull, One will make me vanish, while the other leaves me overfull. Curious and cautious, yet I’m tempted by each brand new bite, In this world of wonder where I wander through each height and flight. Will I be the same nice Alice when I find my way back home? Or a stranger, ever-changing, lost in dreams where wild things roam?
Грибы - Shrooms
===== Перейти к комментариям
Разговор в комментариях зашёл вчера об эмбиенте ("обволакивающая", "плещущаяся" музыка), так что я поставил несколько опытов.
Suno крайне редко удаётся сгенерировать эмбиент - неизбежно туда вкладываются иные, ритмичные стили, как ни старайся. С другой стороны есть сервис Soundful, порождающий "очень машинные", как они сами признаются, MIDI-композиции.
Попытался скрестить: эмбиент от Soundful был вначале продлён Suno (т.е., "допиши, как этот трек мог бы звучать дальше"), отдельно - исходный трек от Soundful был преобразован в каверы.
Времени на очень глубокие и многокомпонентные тесты не было, в качестве стилей для продления и порождения каверов брались два метажанра: "electronic" и "musique concrete". С первым читателям, вероятно, всё более или менее понятно; второй, "конкретная музыка", включает в композицию звуки окружающего мира (чем отчасти похож на эмбиент).
Итоги ниже. В "продлениях" работа от Suno начинается между 1:50 и 1:59, до того момента звучит оригинальный трек (две его минуты: Suno ограничивает длину внешнего трека, с которым потом можно работать).
Исходный трек, "Focus Rho"
Продления
Продление 1: электронка
Продление 2: электронка
Продление 3: конкретная музыка
Каверы
Кавер 1: электронка
Кавер 2: конкретная музыка
Кавер 3: конкретная музыка
===== Перейти к комментариям
Конечно же, это шутка. Сегодня в одном из чатов возник вопрос, можно ли минут за 10 соорудить убедительное агитационное средство для побуждения строптивых авторов к ежедневному обязательному творческому труду. Свой вклад мне удалось внести примерно за семь минут (сюда входит синтез музыкального трека, включая одно продление и один кавер, а также графическое оформление).
Сильно не ругаться, особого выбора среди вариантов не было - то есть, некогда было его выбирать.
Мотивирующая песня #2
===== Перейти к комментариям
Время от времени меня спрашивают: я часто упоминаю другой продукт от Stability.AI, а именно Stable Audio, но ничего им не демонстрирую.
Исправляюсь. Существующий вариант Stable Audio (SA), доступный всем желающим - это т.н. Stable Audio Open v1, на котором любой желающий может сгенерировать звуковую дорожку до 47 секунд длиной.
Так вот. SA хорош для дорожек-образцов (скажем, ритмический рисунок, который потом можно "скормить" другим генераторам, таким как Suno) и в целом для любых звуковых фрагментов, вовсе не музыкальных.
В качестве примера: я взял 10 образцов-описаний, по 30 секунд каждый, склеил их в единый пятиминутный трек.
Я намеренно не делал перебор, использовал первый же вариант (хотя, как и в случае других диффузных моделей, там всегда можно повыбирать: при средней скорости генерации 1:1 это не так уж накладно. Т.е. одна секунда будущего трека просчитывается примерно 1 секунду в реальном времени.
Так что вот. Звуки дождя, вой призраков, звуки улицы и всё такое - это то, где и нужен SA, в качестве генератора произвольного звукового оформления. Делать им именно музыку крайне сложно, а делать её долгой (длиннее 47 секунд) - фактически невозможно.
Версия 2 SA, намного более способная и интересная, доступна только по коммерческой схеме, выдавать её всем желающим в открытый доступ явно не планируется.
Что не означает конечно, что годную модель из серии "звуковой файл по текстовому описанию" нельзя найти. Их полно, просто это - вопрос наличия оборудования под рукой, чтобы просчитывать качественные звуки, и вопрос собственно поиска и перебора.
Записывайте, если нужно: известный диффузный гибрид Riffusion; список text-to-audio; голос по описанию: XTTS-v2, ChatTTS, OpenVoice v2, Parler-TTS
Это с ходу. Их намного больше, чем в списках выше.
Ну и в заключение. Попробуйте угадать, что за 10 образцов, по 30 секунд каждый, использовались в примере ниже. Т.е., каким было описание, что за звуковая сцена вам предлагается.
Stable Audio - 10 образцов
===== Перейти к комментариям
У стихотворения "Пыль" Редьярда Киплинга (в оригинале "Boots", т.е. "Сапоги") богатая история.
Написано от лица пехотинца Британской армии, передвигающегося форсированными маршами по Южной Африке во время Англо-бурской войны 1899—1902 годов (войны, в которой почти не было настоящих сражений).
Есть достаточно известная песня Евгения Аграновича "Пыль" по этому же стихотворению.
Автор перевода Ада Оношкович-Яцына (1922) День, ночь, день, ночь — мы идём по Африке, День, ночь, день, ночь — всё по той же Африке (Пыль, пыль, пыль, пыль — от шагающих сапог!) Отпуска нет на войне! Восемь, шесть, двенадцать, пять — двадцать миль на этот раз, Три, двенадцать, двадцать две — восемнадцать миль вчера. (Пыль, пыль, пыль, пыль — от шагающих сапог!) Отпуска нет на войне! Брось, брось, брось, брось — видеть то, что впереди. (Пыль, пыль, пыль, пыль — от шагающих сапог!) Все, все, все, все — от нее сойдут с ума, И отпуска нет на войне! Ты, ты, ты, ты — пробуй думать о другом, Бог, мой, дай, сил — обезуметь не совсем! (Пыль, пыль, пыль, пыль — от шагающих сапог!) И отпуска нет на войне! Счёт, счёт, счёт, счёт — пулям в кушаке веди, Чуть, сон, взял, верх — задние тебя сомнут. (Пыль, пыль, пыль, пыль — от шагающих сапог!) Отпуска нет на войне! Для, нас, всё, вздор — голод, жажда, длинный путь, Но, нет, нет, нет — хуже, чем всегда одно, — Пыль, пыль, пыль, пыль — от шагающих сапог, И отпуска нет на войне! Днём, все, мы, тут — и не так уж тяжело, Но, чуть, лёг, мрак — снова только каблуки. (Пыль, пыль, пыль, пыль — от шагающих сапог!) Отпуска нет на войне! Я, шёл, сквозь, ад — шесть недель, и я клянусь, Там, нет, ни, тьмы — ни жаровен, ни чертей, Но, пыль, пыль, пыль, пыль — от шагающих сапог, И отпуска нет на войне!
Редьярд Киплинг - Пыль (V5)
Редьярд Киплинг - Пыль (V4)
Редьярд Киплинг - Пыль (V3)
Редьярд Киплинг - Пыль (V2)
Редьярд Киплинг - Пыль (V1)
===== Перейти к комментариям
На слова сонета 2 Шекспира (на русском и английском языках).
Продолжим? Сонет 2 не такой мрачный.
Слева ниже - слова, слева по-английски, справа по-русски (перевод С.Маршака).
Уильям Шекспир, сонет 2 When forty winters shall besiege thy brow, Когда твоё чело избороздят And dig deep trenches in thy beauty’s field, Глубокими следами сорок зим, Thy youth’s proud livery so gazed on now, Кто будет помнить царственный наряд, Will be a tatter’d weed of small worth held: Гнушаясь жалким рубищем твоим? Then being asked, where all thy beauty lies, И на вопрос: "Где прячутся сейчас Where all the treasure of thy lusty days; Остатки красоты весёлых лет?" - To say, within thine own deep sunken eyes, Что скажешь ты? На дне угасших глаз? Were an all-eating shame, and thriftless praise. Но злой насмешкой будет твой ответ. How much more praise deserv’d thy beauty’s use, Достойней прозвучали бы слова: If thou couldst answer ‘This fair child of mine "Вы посмотрите на моих детей. Shall sum my count, and make my old excuse,’ Моя былая свежесть в них жива, Proving his beauty by succession thine! В них оправданье старости моей". This were to be new made when thou art old, Пускай с годами стынущая кровь And see thy blood warm when thou feel’st it cold. В наследнике твоём пылает вновь!
Уильям Шекспир, сонет 2 (английский язык)
Уильям Шекспир, сонет 2 (русский язык)
===== Перейти к комментариям
На слова сонета 66 Шекспира (на русском и английском языках).
Тем временем в Suno появилась функция "точечной" правки: можно переделать неправильно или неудачно произнесённую фразу, модифицировать музыкальную часть (фразу) и т.д. - вот и пригодилась, уж больно косноязычен бывает компьютерный голос.
Слева ниже - слова, слева по-английски, справа по-русски (перевод С.Маршака).
Уильям Шекспир, сонет 66 Tired with all these, for restful death I cry: Зову я смерть. Мне видеть невтерпёж As to behold desert a beggar born, Достоинство, что просит подаянья, And needy nothing trimm’d in jollity, Над простотой глумящуюся ложь, And purest faith unhappily forsworn, Ничтожество в роскошном одеянье, And gilded honour shamefully misplac’d, И совершенству ложный приговор, And maiden virtue rudely strumpeted, И девственность, поруганную грубо, And right perfection wrongfully disgrac’d, И неуместной почести позор, And strength by limping sway disabled И мощь в плену у немощи беззубой, And art made tongue-tied by authority, И прямоту, что глупостью слывет, And folly, doctor-like, controlling skill, И глупость в маске мудреца, пророка, And simple truth miscall’d simplicity, И вдохновения зажатый рот, And captive good attending captain ill: И праведность на службе у порока. Tir’d with all these, from these would I be gone, Все мерзостно, что вижу я вокруг... Save that, to die, I leave my love alone. Но как тебя покинуть, милый друг?!
Уильям Шекспир, сонет 66 (английский язык)
Уильям Шекспир, сонет 66 (русский язык)
===== Перейти к комментариям
По стихотворению Фёдора Сологуба "Баллада о высоком доме".
Фёдор Сологуб "Баллада о высоком доме" (1920) Дух строителя немеет, Обессиленный в подвале. Выше ветер чище веет, Выше лучше видны дали, Выше ближе к небесам. Воплощенье верной чести, Возводи строенье выше На высоком, гордом месте, От фундамента до крыши Все открытое ветрам. Пыль подвалов любят мыши, Высота нужна орлам. Лист, ногою смятый, тлеет На песке, томясь в печали. Крот на свет взглянуть не смеет, Звезды не ему мерцали. Ты всходи по ступеням, Слушай радостные вести, Притаившись в каждой нише, И к ликующей невесте Приникай все ближе, тише, Равнодушный к голосам Петуха, коня и мыши. Высота нужна орлам. Сердце к солнцу тяготеет, Шумы жизни замолчали Там, где небо пламенеет, Туч расторгнувши вуали. Посмотри в долину,— там Флюгер маленький из жести, К стенкам клеятся афиши, Злость припуталася к лести, Люди серые, как мыши, Что-то тащат по дворам. Восходи же выше, выше, Высота нужна орлам. Послание Поднимай, строитель, крыши Выше, выше к облакам. Пусть снуют во мраке мыши, Высота нужна орлам.
Высота нужна орлам (alternative)
Альтернативные версии:
Высота нужна орлам (R2 - amateur rock)
Высота нужна орлам (R3 - city pop symphony metal)
Высота нужна орлам (R4 - dark alt-pop)
Высота нужна орлам (R5 - orchestral soundtrack)
Высота нужна орлам (R6 - illbient alternative rock)
Высота нужна орлам (R7 - post-punk)
===== Перейти к комментариям
В ужасах разных главное — контекст. Всё должно действовать вкупе, сообща.
Прослушайте трек. Да, там полно диссонанса и прочего, это намеренно.
И только потом прочтите текст (ну и прослушайте трек ещё раз — или уже не слушайте).
Страна снов - Призрачная шкатулка
В детскую — так потом мы поняли — мы зашли в последнюю очередь. Заброшенный дом и так был не подарок, одно помещение мрачнее другого, но тут...
Мы даже не стали пытаться заглядывать, что там на просторной кровати на возвышении. Вроде просто подушки и одеяла, и густой слой пыли поверх.
Лампа на полу у входа начала тускло рдеть и постепенно разгорелась так, что мы разглядели непонятный сундук перед собой, и на полу перед ним — музыкальную шкатулку.
— Они очень любили его, — медленно проговорила Настя, оглянувшись. Она присела, прежде чем я пришёл в себя и коснулась шкатулки кончиками пальцев. Тотчас заиграла мелодия — приятная, хотя и не очень сложная.
— Идём отсюда, — потребовала Настя. Мы быстро вышли вон, спустились по лестнице и ещё через пару минут удалялись от дома под полной Луной.
Не сразу поняли, что музыка осталась с нами, доносясь сразу отовсюду, и звучала всё большим диссонансом, резала слух, и что-то ещё звучало помимо...
Мы бросились назад, а когда ворвались в сумрачную детскую (лампа больше не разгоралась), шкатулка умолкла сама собой.
Мы на цыпочках покинули дом, и, пока удалялись, всё казалось, что кто-то крадётся следом.
Дополнение: добавлено два "чистых" исполнения темы музыкальной шкатулки - самой по себе и с аккомпанементом.
Страна снов - Музыкальная шкатулка
Страна снов - Музыкальная шкатулка (аккомпанемент)
===== Перейти к комментариям
Если сделать порядком каверов подряд, в них может, внезапно, обнаружиться закономерность - и вовсе не та, что в песне-образце.
Подробнее - на странице "Собственность ада", ну а здесь я просто выложу трек-образец и два кавера к нему (второй, по совместительству, галлюцинация).
EDM - Breaking
Часть 03. Кавер: врата ада
Эпилог - Слишком высоко
===== Перейти к комментариям
Продолжаю, сложно оторваться (в свободное время) от "каверизации", простите мой английский.
Ниже варианты мелодии из "The Elder Scrolls 2: Daggerfall", трек восемнадцатый, который уже не первый десяток лет стоит у меня на телефонах в качестве основной озвучки вызова ("рингтон" на новоязе).
Обратите внимание на минорный вариант исполнения. По мне, прямо-таки находка (если в случае искина так можно говорить).
The Elder Scrolls 2: Daggerfall - Square
The Elder Scrolls 2: Daggerfall - Square - Symphony
The Elder Scrolls 2: Daggerfall - Square - Minor Dance
The Elder Scrolls 2: Daggerfall - Square - Grand Piano
===== Перейти к комментариям
Тем временем Suno увеличил допустимую продолжительность внешних треков (загруженных пользователем) до двух минут, чем открыл интересные возможности.
В сочетании с функцией создания производных работ по образцу (каверов) теперь можно их генерировать для огромного количества давно известных композиций, включая так называемые OST ("official sound track" - официальный саунд-трек, официальное музыкальное сопровождение).
При этом снизили параноидальность предупреждения о возможном нарушении авторского права: для пробы я "скормил" сервису несколько треков из OST относительно недавней компьютерной игры, "Amnesia: the Dark Descent", и сервис не стал возражать.
Вангую, как говорят на новоязе, появление множества каверов - как качественных, так и не очень. Но для творческих задач это крайне удобно: теперь можно взять достаточно долгую композицию и с помощью кавера положить с её помощью слова на отдельно полученную мелодию.
Короче, конкретно для меня это вылилось в неожиданную новую забаву: взять OST от игр, в которые я давно и с удовольствием играю (теперь обычно в отпуске) и посмотреть, что выйдет.
В качестве примера взят исходный трек из очень старой игры "Betrayal at Krondor" (1993), один из часто воспроизводимых в процессе игры треков (один из трёх, которые игра выбирает, когда приходится с кем-то биться).
Betrayal at Krondor OST - It's a Trap
BAK It's a Trap Cover - Symphony Piece
BAK It's a Trap Cover - Voices (A cappella)
BAK It's a Trap Cover - Tavern
BAK It's a Trap Cover - Ballad
BAK It's a Trap Cover - Cavalry
BAK It's a Trap Cover - Disco Drums
BAK It's a Trap Cover - Fast Pace
BAK It's a Trap Cover - Hypna
BAK It's a Trap Cover - Pacifique
BAK It's a Trap Cover - Rock Ballad
BAK It's a Trap Cover - Slap Dance
Понятно, что в каком-то смысле это был процесс ради процесса - не смог удержаться, как говорится.
===== Перейти к комментариям
Добиться фоновых звуков (шум улицы, свист ветра и пр.) от Suno (и не только от него, раз уж речь зашла) крайне сложно.
Внезапно, при очередной генерации, получилось нечто очень странное - совершенно немузыкальный файл (как говорится, сами просили - ешьте полной ложкой).
Это не музыка, и местами сильно режет ухо во всех смыслах. Так что вас предупредили:
Konstantin Boyandin - Curtain of Chaos
Забегая вперёд, от этого "трека" получаются улётные каверы.
===== Перейти к комментариям
Что ж, вот то, что получилось - когда сделан кавер от вчерашней галлюцинации (см. ниже), на другие, уже осмысленные, слова.
Hallucination - You Didn't See It Green
===== Перейти к комментариям
"Галлюцинациями" в сфере искусственного интеллекта называют ситуации, когда "ответ" искина (в том числе сгенерированная картинка, музыка или видео) не соответствуют описанию (запросу).
Галлюцинируют они все, что как бы и для людей вполне типичное явление. Пример такой галлюцинации ниже: при запуске генерирования кавера (композиции по мотивам, с другим исполнением чисто инструментального трека) получилось вот это.
Не уверен даже что есть такой язык, на котором поют, но звучит красиво.
К слову, если кто опознает язык (диалект), не сочтите за труд поделиться знанием.
Hallucination - To See Your Chance
Есть такой термин "novelty song" без точного перевода на русский. Это песня-авангард, песня ради песни - в т.ч. с "выдуманным" языком и т.п. Примеры таких исполнителей: Orbis Mundi (практически все песни); In Extremo ("Vollmond"); Black Lace ("Agadoo"); The Avalanches ("The Frontier Psychiatrist"). То, что генерирует искин, отвечающий за каверы, очень часто похожи именно на такие песни ради песен.
===== Перейти к комментариям
В предыдущей заметки опыты ставились над "песней-бессмыслицей" (т.н. "novelty song"). Сейчас попробуем "почистить" второй вариант песни "Тоффи" ("Кошки на крыше", по стихотворению Александры Ковалевской).
Ниже два трека: исходный, по которому создавались каверы (эталон) и один из каверов, который очень походит на эталон и чистит почти все его огрехи, кроме "проглоченного" начала припева.
У эталона множество огрехов: постепенно нарастающий к концу фоновый шум; проглоченное начало припева после первого куплета; наконец, галлюцинации - в финале повторяется припев, причём опять же часть слогов проглочена.
Тоффи V02 Эталон
Тоффи V02 Правка
А теперь все мало-мальски осмысленные каверы, не являющиеся фактическими копиями эталона. Обратите внимание, что большинство из них - химеры: первый куплет исполняется в другом стиле, зато потом практически точно копируется эталон.
Тоффи V02 Кавер 9
Тоффи V02 Кавер 8
Тоффи V02 Кавер 6
Тоффи V02 Кавер 1
Тоффи V02 Кавер 2
Тоффи V02 Кавер 3
Тоффи V02 Кавер 4
Тоффи V02 Кавер 5
Тоффи V02 Кавер 7
Ну и галлюцинации. Невзирая на их очевидную странность, сами по себе композиции вполне интересные. Кто скажет, на каком языке исполняется вторая?
Тoффи V02 Галлюцинация 1
Тoффи V02 Галлюцинация 2
===== Перейти к комментариям
Случилось занятное, и Suno предоставил платным пользователям функцию создания каверов (калька с английского "cover" - "обложка", "обёртка").
Кавер - это музыкальная композиция, исполненная немного иначе (другой стиль, другой вокал, другой текст). Весьма популярное явление и сейчас: есть музыкальные группы, которые зарабатывают, выпуская именно каверы.
Обольщаться, правда, не нужно. Сервис по-прежнему не допускает к обработке опознанные коммерческие треки, а от прочих внешних позволит загрузить не более 60 секунд. Полноценно "каверить" можно только треки, созданные в том же сервисе.
Функция создания каверов весьма сырая пока что, и примерно в 60% случаев попросту возвращает тот же самый исходный файл.
Опыты поставил на том самом "Винни-Пухе", в списке ниже этот трек под номером ноль (самый первый).
Pooh Song (V00 )
Pooh Song Cover (V07 folk choral)
Pooh Song Cover (V10 bluegrass)
Pooh Song Cover (V01 duet)
Pooh Song Cover (V02 folk opera)
Pooh Song Cover (V03 folk rock)
Pooh Song Cover (V04 liquid drum and bass rockabilly)
Pooh Song Cover (V05 hard techno)
Pooh Song Cover (V06 a cappella)
Pooh Song Cover (V08 techno reggae)
Pooh Song Cover (V09 pop rock)
Pooh Song Cover (V11 club rock-n-roll)
Pooh Song Cover (V12 klezmer pop)
Pooh Song Cover (V13 club lullaby)
Можно создавать каверы и без вокала:
Pooh Song Instrumental Cover (V01 indie rock)
Pooh Song Instrumental Cover (V02 liquid bass and drum rockabilly)
А вот это пример весьма фантасмагоричной галлюцинации (когда полученный трек вообще никаким боком к тому, что задано делать).
Hallucination - It's Too Late
Так что появился ещё один инструмент, и теперь можно генерировать новые треки, очень близкие к исходному.
===== Перейти к комментариям
Я пока не видел простого способа взять готовую "минусовку" (песню, из которой удалён вокал - ну или сведено всё, кроме вокала) и наложить на неё произвольный текст средствами ИИ.
Однако есть другой способ: взять минусовку за образец и "творчески развить" (продолжить); если образец достаточно длинный, ИИ сумеет точно воспроизвести и поддержать и ритмику, и в целом структуру. А если в образце были немузыкальные компоненты (фоновый шум), то и его можно будет услышать в "развитии темы".
Ниже примеры, как может выглядеть такое развитие. За образец взята тема от версии седьмой озвучки "Щедрого неба".
Может показаться весьма занудным прослушивать такое количество однотипного. Спорить не буду. Разработка (импровизация ИИ) начинается между 11 и 14 секундами каждого трека.
Практическое применение - помимо того, чтобы положить другой (или тот же) текст на однотипную (очень схожую) мелодию, можно использовать инструментал как фон. Например, для т.н. буктрейлеров (коротких видеороликов, рекламирующих некую книгу).
Константин Бояндин - Щедрое небо, инструментал (V1 minimal techno)
Константин Бояндин - Щедрое небо, инструментал (V2 minimal techno)
Константин Бояндин - Щедрое небо, инструментал (V3 accordion rock)
Константин Бояндин - Щедрое небо, инструментал (V4 klezmer pop)
Константин Бояндин - Щедрое небо, инструментал (V5 hypnagogic electropop)
Константин Бояндин - Щедрое небо, инструментал (V6 dark alt-pop)
Константин Бояндин - Щедрое небо, инструментал (V7 dark alt-pop)
Константин Бояндин - Щедрое небо, инструментал (V8 soul trap)
Константин Бояндин - Щедрое небо, инструментал (V9 illbientwave)
===== Перейти к комментариям
Закончим эту пятницу музыкальной шуткой. Многие из написанных недавно композиций были для меня, скажем так, скорее депрессивными.
Ну а раз был Призрак Оперы, отчего бы не быть и Призраку Литературы?
Female: In sleep it wrote for me, In dreams he came, That Muse that writes for me And calls my name. And will I write again, Once for awhile? For Phantom of the Literature is there, Inside my file. Male: It brings me fantasy, And fiction, too. Both crime and mystery Look so anew. For time I spent in vain That does beguile - For Phantom of the Literature is there, Inside my file. Male: Come to me, my Angel of prose! Oh come to me! Male and female: It makes me type and type, Deprives of sleep, Book's getting strong and ripe, Inside me deep. It's published making me Both cry and smile - For Phantom of the Literature is there, Inside my file.
Konstantin Boyandin - Phantom of the Literature
===== Перейти к комментариям
Что ж, есть некоторое продвижение. Эксперимент ниже ("Wake Up Your Mind") использовал немузыкальный ("шумовой") файл в качестве затравки, и на этот раз комбинацией директив удалось добиться того, чтобы вокал стал просто чтением.
Правда, почему-то шёпотом.
Работаем дальше, а те, кто понимают английский язык, думаю, смогут прочувствовать послание в этой композиции.
Chill and Bells - Wake Up Your Mind
===== Перейти к комментариям
Начал пробовать синтезировать проговаривание текста (а ля Утёсов, когда ещё никакого рэпа и в планах не было).
Тесты будут здесь, в этой секции. Первая проба, где взято четверостишие про Винни-Пуха не привела к ожидаемому итогу, но звучит крайне забавно, не стал выбрасывать.
Хорошо живёт на свете Винни-Пух - V1 (spoken word, recitative, bass trap)
Хорошо живёт на свете Винни-Пух - V2 (spoken word, recitative, soul trap)
Хорошо живёт на свете Винни-Пух - V3 (spoken word, recitative, accordion afro trap)
Это, конечно, смешно и забавно, но пока речитатива не выходит, пробую другие комбинации.
===== Перейти к комментариям
Ниже приведена озвучка стихотворения Натальи Стадлер "Новые краски" (десять вариантов).
Чемпионы "среди меня" - шесть и девять.
Новые краски - V1 (rock ballad)
Новые краски - V2 (acoustic ballad)
Новые краски - V3 (illbientwave)
Новые краски - V4 (choral a cappella)
Новые краски - V5 (accordion rock)
Новые краски - V6 (hypnagogic pacific reggae)
Новые краски - V7 (flamenco hip hop)
Новые краски - V8 (harpsicord symphonic metal)
Новые краски - V9 (dark alt-pop)
Новые краски - V10 (psybient new wave)
===== Перейти к комментариям
Известную шотландскую песню "The Bonnie Banks o' Loch Lomond" исполняли очень многие.
Лично мне больше всего понравилось исполнение от "The Dublin Ramblers" и Эллы Робертс. Последнее рекомендую посмотреть и послушать прежде, чем знакомиться с сегодняшней озвучкой ниже.
By yon bonnie banks and by yon bonnie braes, Where the sun shines bright on Loch Lomond, Where me and my true love were ever wont to gae, On the bonnie, bonnie banks o' Loch Lomond. Chorus: O ye'll tak' the high road, and I'll tak' the low road, And I'll be in Scotland afore ye, But me and my true love will never meet again, On the bonnie, bonnie banks o' Loch Lomond. 'Twas there that we parted, in yon shady glen, On the steep, steep side o' Ben Lomond, Where in soft purple hue, the highland hills we view, And the moon coming out in the gloaming. Chorus The wee birdies sing and the wildflowers spring, And in sunshine the waters are sleeping. But the broken heart it kens nae second spring again, Though the waeful may cease frae their grieving. Chorus
Как всегда, "призёры среди меня" указаны первыми, выделены жирным шрифтом.
Konstantin Boyandin - Loch Lomond V06 (horror synth)
Konstantin Boyandin - Loch Lomond V10 (illbient alternative rock)
Konstantin Boyandin - Loch Lomond V02 (hypnagogic pacific reggae)
Konstantin Boyandin - Loch Lomond V03 (accordion ambient techno)
Konstantin Boyandin - Loch Lomond V04 (choral a cappella)
Konstantin Boyandin - Loch Lomond V05 (dark alt-pop)
Konstantin Boyandin - Loch Lomond V07 (opera)
Konstantin Boyandin - Loch Lomond V08 (accordion rock)
Konstantin Boyandin - Loch Lomond V09 (illbientwave)
===== Перейти к комментариям
Последний подсчёт показывает, что раздельно опознаваемых стилей в Suno почти девятьсот.
Основной задачей является правильно подобрать стили (или их комбинацию), и правильно перечислить, вкупе с другими уточнениями. Ничего не напоминает? Описание создание текстовой картинки по тексту. Только здесь речь о звуковой композиции (необязательно музыкальной).
Ниже пример - список треков для "Путешествия, приснившегося под утро", для которых сгодилось единственное описание стиля.
Так сказать, понять и проникнуться.
Konstantin Boyandin - The Pursuit (liquid drum and bass rockabilly)
Konstantin Boyandin - We Stay till Morning (hypnagogic ambient trance)
Konstantin Boyandin - Lazy Time (illbientwave)
Konstantin Boyandin - Down the River (soulful chillsynth)
Konstantin Boyandin - Game Console (hyper-dance)
Konstantin Boyandin - Hurrying Up (psychedelic psybient)
Konstantin Boyandin - Lily Lake (hypnagogic pacific reggae)
Konstantin Boyandin - Lost in Memories (city pop symphonic metal)
Konstantin Boyandin - Maze of Mirrors (Russian ambient techno)
Konstantin Boyandin - Mute Movie (harpsicord boogie)
Konstantin Boyandin - Old Radio (calypso opera)
Konstantin Boyandin - Opera House (choral chanson)
Konstantin Boyandin - Pond of Treasures (reggaetonwave)
Konstantin Boyandin - The Frontier (dark alt-pop)
Konstantin Boyandin - The Steam Train (psybient griot)
Konstantin Boyandin - The Tempest (dark dance)
Konstantin Boyandin - Wild Party (prog avant-garde jazz)
===== Перейти к комментариям
На сей раз и основная тема, и вариации вряд ли войдут в золотой фонд музыки человечества. И не нужно: в данном случае это — иллюстрации
Дано: сервис (вроде Soundful) или аналогичная локальная установка (SA) генерируют относительно простые, не слишком разнообразные по структуре треки, которые хотелось бы использовать в качестве основы, по которой другой сервис или инструмент уже будет создавать другой трек.
В итоге выбран процесс такой: вначале выдаётся образец мелодии (основного трека), который загружается в сервис типа Suno, и затем "продолжается" (наращивается).
Процесс аналогичен использованию LoRA в случае картинок, с единственной тренировочной мелодией: сервис очень точно и узнаваемо "продолжает" трек, поддерживая его ритмическую картину и используя отдельные музыкальные фразы, при этом добавляет уже "от себя".
Правда, чтобы основа стала устойчивой, сервису нужен большой фрагмент (в примерах ниже — около 60 секунд). Впрочем, никто не мешает затем отсечь вступительный эталонный фрагмент в редакторе и сделать таким образом трек желательной структуры.
Несколько занудно, но в принципе работает. Образцы ниже.
Исходником служит фрагмент, иллюстрирующий сцену испытания искина, когда тот должен по нескольким примитивным звукам (треск зубьев расчёски, стук по большой бочке и т.д.) написать мало-мальски пригодную для танцев мелодию. Можно ли под перечисленное ниже танцевать — думаю, можно.
На краю крыши
На краю крыши (виолончель)
На краю крыши (дабстеп)
На краю крыши (фанк)
На краю крыши (металл)
На краю крыши (оркестр)
На краю крыши (рок)
На краю крыши (рок-опера)
На краю крыши (техно)
Ответы ниже.Какие из этих кошек настоящие?
1
2
3
4 (синтез)
5 (синтез)
6
7
Конечно, поиск в Сети этих картинок будет считаться неспортивным поведением.
Ответ: синтетическими являются изображения номер 4 и 5, остальные - фото подлинных кошек.
===== Перейти к комментариям
Коллекция озвучки стихотворений Александры Ковалевской находится здесь.
Вначале - одно из самых известных исполнений (Эдуард Хиль). Увы, там только три куплета.
Эдуард Хиль - Хромой король
Железный шлем, деревянный костыль, Король с войны возвращался домой. Солдаты пели, глотая пыль, И пел с ними вместе король хромой. Троянский бархат, немурский шёлк - (*) На башне ждала королева, и вот Платком она машет, завидев полк, Она смеётся, она поёт. Рваная обувь, а в шляпе цветок, Плясал на площади люд простой... Он тоже пел, он молчать не мог В такую минуту и в день такой. Бой барабанный, знамён карнавал - Король с войны возвратился домой. Войну проиграл, полноги потерял, Но рад был до слёз, что остался живой. ------------------------------------- * - Итог обсуждения в SU.KSP: - Ошибка перевода. Должно быть "...Труанский бархат, намюрский шелк..." Бархат изготовленный в городе Труане (Troyes) Шелк изготовлен в городе Намюре - (Бельгия)
Ну и то, что выдал искин.
Хромой король (рок)
Хромой король (поп-опера)
Хромой король (барды)
Хромой король (кафе)
Хромой король (металл)
Хромой король (оперетта)
Хромой король (панк)
NB: я в курсе, что во втором и третьем вариантах удвоен второй куплет ("галлюцинация" искина).
===== Перейти к комментариям
К "магии" получения картинки по описанию многие уже привыкли.
К "магии" получения видео по картинке ещё только предстоит.
Обратите внимание, как "электронный режиссёр" достраивает появляющиеся подробности интерьера лабиринта.
===== Перейти к комментариям
Что ж, обещал варианты исполнения известной песни про Веверлея, вот они.
Слова:
Пошёл купаться Веверлей, Оставив дома Доротею, С собою пару пузырей Берёт он, плавать не умея. Нырнул он, как он только смог, Нырнул он прямо с головою, Но голова тяжеле ног, Она осталась под водою. Жена, узнав про ту беду, Удостовериться хотела Но ноги милого в пруду Она узрев, окаменела. Прошли года, и пруд заглох, И поросли травой аллеи, Но всё торчит там пара ног И остов бедной Доротеи.
Веверлей (поп)
Веверлей (кафе)
Веверлей (рок)
===== Перейти к комментариям
Что ж, теперь записью и сведением трека занимаются "специально обученные подпрограммы", и оставался только один шаг, мастеринг.
Что это такое, вы легко найдёте на просторах Сети. Если что, это приведение трека в оптимальное с точки зрения звучания состояние.
Ну и два примера: трек до мастеринга и после.
Time (Viona Zeth), до мастеринга
Time (Viona Zeth), после мастеринга
Пошёл подвергать этой процедуре остальные ранее скомпонованные треки. Которые не в мусор.
===== Перейти к комментариям
Итак, это случилось: минутная заминка, и я не смог найти адекватного короткого перевода основного слова этой композиции, "breaking" (to break: ломаться, распадаться, делать паузу и ещё много значений)
В общем, нужна была не очень сложная, прилипчивая танцевальная композиция. Вам судить, насколько это удалось.
Дополнение. Два варианта композиции.
Breaking (Joey)
Breaking (Martin)
===== Перейти к комментариям
В классику искин тоже может. При этом структурно пьесы вполне походят на то, что ожидается.
То, что нужно для настройки на рабочий лад утром в субботу.
Романтическая фуга
Sonata Della Foresta Mistica
===== Перейти к комментариям
Пока я пытаюсь сделать что-то, похожее на блатняк, захотелось чего-нибудь незатейливого и бодро-танцевального.
Короче. В этот дождливый сонный день — немного бодрого металла. На сон грядущий.
Прочь!
===== Перейти к комментариям
Спрашивали — отвечаем. Suno умеет писать песни по русскому тексту, ниже две обработки моих давешних стихотворений.
Как обойти ошибку в последней строке "...письма", пока не очень понимаю, спрошу тех.поддержку. Искин не "понимает", где именно по контексту должно быть ударение в слове "стоит".
Напиши мне письмо
Нарисованные люди
===== Перейти к комментариям
Немного бодрящего регги этим жарким утром.
Феникс плохого не посоветует.
Яркий новый день
===== Перейти к комментариям
Эпизод в повествовании, где протагонисты оказываются в постоянно меняющемся лабиринте, и выбраться можно только следуя за голосом друг друга — а единственное, что удерживает по эту сторону рассудка — стук собственного сердца.
Иди на мой голос
===== Перейти к комментариям
Едем (идём) дальше. "Восхождение" - основная серия эпизодов о начале путешествия - как герои выбираются из ставшей смертельно опасной библиотеки и бегут прочь, поднимаясь всё выше, за облака - буквально.
Восхождение
===== Перейти к комментариям
На случай, если кто-нибудь интересовался, что нонче могут нейросети по части музыки, вот пример. Музыкальное сопровождение к пишущейся книге; трек 4, "Призраки ждут нас", иллюстрация к эпизоду бегства из библиотеки.
Призраки ждут нас
===== Перейти к комментариям
Меж тем Stability.AI выставило во всеобщий доступ файлы весов ("модели") Medium третьей версии SD.
Мой любимый графический интерфейс от AUTOMATIC1111 пока не поддерживает, пришлось в темпе научиться пользоваться ComfyUI.
Принцесса
Балерина
Чёрная роза
Кот
Вишнёвое дерево
Часовое королевство
Полярное сияние
В библиотеке
Лунная ночь
Крестьянка
Кролик
Берег моря
Потому что!
Плачущий ангел
Качество деталей местами очень приятно радует (обратите внимание на капельки росы на розе и столе, а также на волны в море).
Добиться вменяемой человеческой фигуры в случае девушки у книжных полок оказалось дико сложно: только одна (!) из примерно полусотни попыток дала что-то не очень страхолюдное.
А вот кота, принцессу и балерину, внезапно, выдало без особых сложностей.
Засада есть теперь и в коммерческом использовании. Теперь под это требуется платная лицензия ($20 в месяц; как платить из России — не очень въехал, но это не самое большое затруднение). Самое большое — что если вы делаете, например, производную работу (модель на базе основной модели SD3), то после отказа от коммерческой лицензии, по лицензионному соглашению, все такие производные работы вы должны удалить и картинок с них не строить.
В общем, создатели SD отчётливо движутся к максимальной коммерсализации своего продукта, теперь можно делать ставки — начиная с какой именно версии они закроют код (или существенную его часть).
По понятной причине, производных моделей для SD3 будет на порядок-другой меньше, чем для предыдущих его версий. Увы.
Тем не менее ждём, предвкушаем и надеемся.
===== Перейти к комментариям
Помнится, написано было лимериков про кота Кузьму порядком, в рабочих записях их за сотню.
Теперь, при помощи электронного художника, их вполне можно проиллюстрировать.
Кот Кузьма, кочегар из Гааги, Слыл гребцом небывалой отваги: Он Ла-Манш, говорят, Раз пятнадцать подряд Пересёк на плоту из бумаги.
===== Перейти к комментариям
Случилось прекрасное: некая добрая душа натренировала корректировочную модель (LoRA) на работах Васи Ложкина. Так что теперь можно развлекаться.
Пой, гитара!
Сезон открыт
Начинаем зарядку!
Вечер трудного дня
Согласитесь, что-то в этом есть.
===== Перейти к комментариям
Уже упоминавшееся заблуждение о том, что описание для генеративных моделей воспринимается программой примерно так же, как автором описания (обычно человеком) ведёт и к другим достаточно интересным находкам.
Оптические иллюзии и "смешение сцен" - достаточно сложная категория изображений. Сложная в том смысле, что вряд ли получится описать её словами и получить от электронного художника именно то, что заказывал. Простой пример:
Чудо света
Обратите внимание - там, где стоит человек, вероятнее всего сухо, но вот прямо над ним уже толща воды. Плюс расположение теней, плюс "переливающийся в воду" луч света. Всё верно, это тоже галлюцинация модели "HelloWorld", а сцена описывается как extremely detailed, oil painting, "wonder of the world". Т.е., "чудо света". Некоторые из таких галлюцинаций очень, я бы сказал, пугающие.
Поэтому стало привычкой время от времени запускать длинный прогон (обычно на ночь) нескольких тысяч галлюцинаций на проверенные опытом описания, а поутру быстренько пролистывать это всё. И всегда там можно найти что-то любопытное, что нарочно не придумаешь.v
Вообще достаточно занятно осваивать технологии, которые не реже раза в год меняются так основательно, что сама мысль сопровождать это учебником или хотя бы рабочими записями лишена смысла: всё устаревает не то чтобы в момент написания, но очень вскоре.
Поэтому правило здесь примерно такое же, как при наблюдении за цветущей "ночной красавицей" (кактус, цветок которого к утру следующего дня уже увядает): смотри, восхищайся и пользуйся, пока возможно. Завтра будет уже что-то совсем другое. Ну, почти совсем.
===== Перейти к комментариям
Фраза "last days" (последние дни) также оказалась плодотворной в смысле галлюцинаций.
Занятно, что на портретную ориентацию двигатель выдал огромное количество очень интересных (и вовсе не жутких) портретов, преимущественно женских.
На ландшафтную... Там и собственно ландшафты, и, неожиданно, большое количество т.н. "body horror" — ужасы, опирающиеся на сцены жутких изменений тела и всевозможные уродства. Кто видел "The Thing" Карпентера, тот поймёт, о чём речь.
50
55
65
83
90
101
107
Но бывает и другое, и тоже не редкое, примеры выше.
===== Перейти к комментариям
Предыдущие опыты с "ультракороткими" описаниями дали интересные результаты. Обозначился ряд моделей, которые, если можно так сказать, очень эффектно галлюцинируют. А именно, выдают самые разные по направленности картинки в ответ на короткий запрос.
Дело, конечно, не в краткости определения, а в том, как тренировалась модель. Неожиданный всплеск "галлюцинаций" в ответ на описание "sound of silence", "звук тишины", объясняется именно этим: в рамках свободы творчества (коэффициента CFG) модель находит более или менее весомые цепочки ассоциаций, которые и разрастаются в очень странные картинки.
Чемпионы по части галлюцинирования, среди моделей на CivitAI:
LEOSAM's Hello World Copax Art Brush ICBINP ("I can't believe it's not photo" — "Поверить не могу, что это не фото") Lah Mysterious Epic Fantasy Vision
Составлять списки моделей в данном случае дело неблагодарное (очень уж быстро меняется ситуация в этой отрасли — SD 3 уже не за горами), но упомянутые модели с очень живым воображением также входят в список тех, что я отобрал для работы (куда входят также Proteus RunDiffusion, Crystal Clear Lightning, Cinematix, Lightning Bloom, Real Good Fast Pass, Realism from Hades, Real Vis, WLOP Style и Zavy Chroma, всего изучено 50+ моделей).
Ну а теперь сами картинки (все построены на модели LEOSAM's Hello World, легко найдёте на CivitAI).
Через Вселенную
Дивный новый мир
Сумерки времени
Полёт воображения
Бесконечная рекурсия
Страна тайн
Главное чудо дня
Иной мир
Чудо света
===== Перейти к комментариям
Песню "Звук тишины" ("Sound of silence") наверняка знают все, пусть даже не зная ни названия, ни исполнителя. Для архива: оригинальное исполнение (Simon & Garfunkel), исполнение Gregorian
В целом и общем короткие определения дают стохастические результаты. В данном случае на выходе есть несколько типичных результатов: лодки, река в лесу, река на фоне гор, портреты, дома и "всякое странное".
Текст определения: extremely detailed, oil painting, sound of silence, by Greg Rutkowski and Tyler Edlin
Сами картинки ниже. Заголовки условные, поскольку электронный художник именно так "увидел" звук тишины.
Пагода
Лес
Корабль
Корабль-дом
Воздушный шар
Вечер на Югготе
Мягкая посадка
Закат в лесу
Дом-дерево
Портрет
Дерево на холме
Трое в лодке
Закат над рекой
Ущелье
Извержение
Древняя раса
Дом у ручья
===== Перейти к комментариям
Логично звучали вопросы, почему в предыдущем посте (см. ниже) итоговые картинки не имеют ничего общего с оригиналом. Ниже краткое пояснение.
В инструменте "img2img" (картинка в картинку) SD использует минимум два параметра, чтобы обозначить, насколько итоговая картинка близка к оригиналу. Первый уже известен, CFG, очень упрощая — насколько двигатель будет придерживаться описания, а насколько — следовать своей "фантазии" (чем выше коэффициент, тем более послушным будет двигатель).
Вторым, специфическим для "картинки в картинку", является т.н. коэффициент подавления шума (denoising strength), вещественное число от 0 до 1 (0: двигатель не участвует; 1: двигатель может вносить произвольные правки). Судя по сказанному ранее, "шумом" является исходная картинка.
Выяснилось, уже экспериментально, что важным фактором также является число шагов синтеза изображения. В предыдущем случае я использовал скоростную модель ("Lightning"); она характерна тем, что работает только с низкими коэффициентами CFG и с малым количеством шагов (и в среднем, даёт изображение худшего качества за счёт значительного увеличения скорости работы).
На этот раз взята модель типа SDXL (Juggernaut RunDiffusion), но не скоростная. Итоги см. ниже.
1. Обработка фотографии. Исходная картинка:
Текст определения (во что переделываем): extremely detailed, oil painting, close-up portrait of middle-aged wizard, calm smile, fantasy, majestic mansion in the background, by Tyler Edlin and Nick Avallone
Итоги ниже (числом обозначен коэффициент подавления шума, при прочих равных условиях).
При подавлении шума ниже 0.35 двигатель, по сути, себя почти не проявляет. Резкий скачок изменений происходит между 0.45 и 0.60. Всё, что выше — по сути, уже в чистом виде фантазия двигателя, ничем не похожая на оригинал (примерно так выглядят итоги работы со скоростными моделями).
2. Дополненная реальность. Исходная картинка (фото поблизости от места, где я живу):
Добавляем воздушный шар в небе (коэффициент 0.45):
Добавляем сторожевую башню (коэффициент 0.45):
Если поиграть определениями при диапазоне 0.4-0.5, вполне можно убедительно "дополнить реальность", внося минимальные искажения и порождая более или менее реалистичные новые подробности.
===== Перейти к комментариям
У SD есть функция создания картинки на основе другой картинки. Признаться, я был бы рад прочесть сейчас длинную лекцию по использованию этого инструмента, но...
Так получилось, что просто захотелось посмотреть, насколько хороши будут производные картинки. Источником было фото меня любимого (но новоязе "селфи"), но первым же делом я применил к ней скоростную модель... и понял, что картинки замечательные (сами посмотрите), в т.ч. с точки зрения анатомии, но в качестве учебного материала ничего не стоят: у нейронки, в случае скоростных моделей, практически невозможно выставить настройки, при которых исходное изображение будет очень понемногу трансформироваться в считанное. В данном случае есть магическое значение соответствующего коэффициента (снятия шума, denoising strength: 0 - полное отсутствие свободы воли нейронки, 1 - максимальная свобода), что изменение даже в четвёртом знаке после запятой меняет картинку радикально (и не очень интересно).
Так что лекция будет потом.
В качестве иллюстрации: картинка ниже получена из той, что левая нижняя в коллекции выше, при изменении коэффициента с 0.75 до 0.74:
Польза, кстати, всё равно есть: можно генерировать аватарки, тоннами. И вполне себе приличные.
===== Перейти к комментариям
Соблазн начать, наконец-то, подбирать приемлемый облик для персонажей был давно. Теперь, когда с вычислительными мощностями всё приемлемо, задача вылилась в неожиданный аспект - найти и описание, и оптимальную модель для опытов.
Что ж, лиха беда начало.
1. Первое знакомство
Это Тень. В миру — Эсстер Аратрин ан эс Метуар, антагонист и протагонист "Ступеней из пепла", последовательно.
Эсстер появляется только в третьей (из трёх) частей книги, но при этом вызвала наибольшее количество обсуждений: и в связи со своей "должностью" — голос и воплощение подлинной Тени, Стража мрака, владычицы царства мёртвых и распорядителя их судеб (по принятым во множестве культур Шамтерана поверьям, Тень может возвращать умерших в царство живых, Средний мир, если те сами отыщут себе дорогу).
Воскресает после смерти (в книге — после ножевых и огнестрельных ранений, а также, в финале, после смерти от старости). Однажды (и она это знает) её призовёт на окончательную и бессрочную службу подлинная Тень, и отказаться не получится.
Умеет крайне быстро перемещаться в отсутствие света, её мышечная реакция превосходит реакцию обычного человека в несколько раз. Обладает рядом других черт, свойственных подлинной Тени — например, в состоянии подчинить почти кого угодно своей воле.
При всём этом, оказывается человеком чести и способным на самопожертвование — пусть даже с ужасными манерами, пренебрежением к правилам и стремлением делать всё по-своему.
Через три года после событий книги у Эсстер родилась дочь, Вессен (тоже, по иронии, выбравшая путь Тени — правда, уже технологическим вариантом, безо всякой мистики).
Не все, кому довелось увидеть Тень так близко, сумели потом поведать об этой встрече.
2. Подлинный облик
По книге, Тень с лёгкостью принимает произвольный облик (не уточняется, насколько она меняется внутри, если облик мужской). Тем не менее, с какого-то момента выглядеть самой собой стало для Эсстер привилегией: её первую госпожу раздражал и облик, и голос подлинной Эсстер.
Эсстер, невзирая на происхождение (прямая наследница малого дома в Тегароне, что само по себе даёт немалые привилегии и в стране, и среди другой родни), несмотря на хорошее образование, с самого начала пренебрежительно относится к правилам и законам, обожает авантюры. Что, собственно, и закончилось для неё потерей свободы.
Отрывок из книги:
— Вы всё знаете, — огорчилась Тень, отходя в сторону. — Зачем спрашивали?
— Только что догадался. А одежда, в гардеробе у Май — тоже ваша?
Тень хлопнула себя по лбу.
— Надо будет попросить, переодеться как-нибудь. Всё равно она ей мала. А мне хочется выглядеть красивой.
— Вы и так красивы. Очень красивы.
— Не я, а Госпожа. Сама я... вот, смотрите.
Тень отвернулась. Через некоторое время повернулась вновь. Худенькая, светлолицая. Веснушчатое круглое лицо, большие зелёные глаза, тонкие губы, рыжие лохмы — стожок сена на голове.
— Видите? Пугало...
Тень вновь отвернулась и через несколько секунд вернула облик Майтенаринн.
— Вы и сами красивы. Нет, правда. Кстати, можно попросить об одолжении?
3. Подлинная Тень
Подлинная Тень, владычица царства мёртвых и распорядитель судеб тех, кто умер, появляется в книге дважды. В третий раз её встретит уже Лас, в "Книге Снов". Поскольку в Тень, в той или иной мере, верит большинство населения планеты, вызвать Стража мрака, так сказать, в гости, получилось неожиданно легко. О последствиях, как водится, никто не думал.
Оба раза Эсстер служит обликом, вместилищем подлинной Тени. Во второй раз Страж мрака разрешила своему "агенту" услышать разговор.
Отрывок из книги:
— Май, Лас, — позвала Тень. Солнце уже село; Лас и Май сидели у небольшого розового куста, на поляне. Семь цветков светились в быстро наступающей темноте. — Идёмте, мы ждём вас. Скоро будет ужин.
Лас кивнула и встала, протянув руку Май. Та приняла, поднялась... оглянулась на Тень.
— Лас... похоже, у неё ко мне разговор. Извини.
Ласточка кивнула вновь и убежала.
Сумрак сгустился над Тенью.
— Госпожа, — Тень заговорила первой. Глаза её светились красным. — Я приняла ваше приглашение... из любопытства, не скрою. Появляясь здесь, Я нарушаю обещание не вмешиваться в дела Среднего мира. Но Меня так давно не приглашали от чистого сердца... Прошу вас впредь быть осмотрительнее, когда вы позволяете явиться подобным Мне.
Майтенаринн кивнула, хотя сохранять самообладание было непросто. Непросто было общаться со сгустком тьмы.
— Я, настоящая Тень, не имею права помогать вам непосредственно. Вы должны справиться сами.
— Понимаю и не прошу ни о чём.
— На прощание, Майтенаринн. Когда вы предстанете передо Мной, сочту за честь лично выбрать достойную вас дорогу. Но не торопитесь ко Мне, прошу вас.
— Прощайте, Страж мрака.
— До встречи, Майтенаринн. Та, что остаётся... будьте к ней снисходительны.
Интересующимся: изображения построены на моделях, последовательно: realismFromHades_XLLightning, realVisXLV4.0 _Lightning, proteusRunDiffusion_withclip. Вы легко найдёте их на CivitAI точка com.
===== Перейти к комментариям
В день общенационального траура — только о мирном и прекрасном.
Ангел и дитя
Бабочка
Танцовщица
Улыбка
Вихрь чувств
Путешественница
Фермер
Лис
Девушка в шляпе
Верный пёс
Пантера
Возвращение домой
Олень
Тропа в неведомое
Тигр
Где-то во сне
===== Перейти к комментариям
Стоило упомянуть в предыдущем выпуске, что модели часто меняются, как почти сразу же попалась на глаза модель «Протей» от компании RunDiffusion (угадайте, что именно она разрабатывает).
Ниже приведены некоторые пробники, которыми я проверяю теперь каждую модель. Общие параметры создания изображений такие:
Алгоритм сведения: DPM++ 2M Karras Шагов: 30 Коэффициент CFG: 5 Пропуск CLIP: 2 Размер: 1216x832 (или наоборот)
Модель класса SDXL, но не скоростная, просчёт длится относительно долго. Во всех случаях ниже описание, с учётом рекомендаций на сайте, выглядит так:
extremely detailed oil painting, СЦЕНА, score_9, score_8_up, score_7_up, score_6_up, score_5_up, score_4_up
где «СЦЕНА» относится к собственно данной картинке. Т.е., это всё «картина маслом», что отражается на чёткости и технике. Об остальном судите сами.
Сторожевая башня
Знамение
Девушка в саду
Вишнёвое дерево
Дракон
Чёрная роза
Солнечные часы
Зеркало
Летучий Голландец
Орк в замке
Джентльмен на прогулке
Замок на холме
Будни Машинариума
Майнкрафт
Дом ведьмы
Чеширский кот
Nevermore
Бабочки
Модель очень качественно работает во многих областях, как вы только что сумели увидеть. Даже без указания стиля художника и конкретной техники (понятно, что мышь стоило изобразить в мультипликационном стиле). Аниме, если что, модель тоже умеет.
Так что спасибо коммерческой компании за этот подарок сообществу.
Любопытно, кто сумеет хотя бы примерно угадать текстовое описание для изображения «Зеркало» (подсказка: там пять слов).
===== Перейти к комментариям
В дополнение к предыдущему посту — коллекция разных пробников и невостребованных картинок с орками Варкрафта.
В первой картинке удалось совместить визуализацию двух игровых вселенных: "World of Warcraft" и "Amnesia: The Dark Descent".
Замок Александра Бренненбургского
Остановка в городе
Горной тропой
Прогулка по реке
Орк. Джеймс Орк
Перед сдачей проекта
Носки для внуков
Учения
Всё для фронта
Гуру с мечом
Гуру с хлопушкой
На пенсии
Согласитесь, и мальчики, и девочки хоть куда!
===== Перейти к комментариям
Кто посещает коллекцию моделей для SD на CivitAI, тот в курсе, что минимум раз в 2-3 месяца там происходит серьёзное обновление корпуса моделей. Конкретно сейчас появилось множество т.е. «Lightning»-моделей («lightning» — «молния»), относящихся к методике «дистилляции» моделей, после которой возможен просчёт картинок приемлемого качества за малое количество шагов. Как следствие, время просчёта может значительно сокращаться, в случае моей аппаратной части — до 5-6 раз по сравнению с оригинальной моделью.
Параллельно меня попросили просчитать несколько картинок с персонажами-орками (из вселенной Варкрафта, это существенно).
Ну, всё и заверте... Картинки вы можете посмотреть, нажав на соотв. ссылку в поле «Примечание» (буква обозначает пол персонажа). Орки-мужчины в тренировочном лагере, и орки-женщины на прогулке в лесу.
Модель | Алгоритм сведения | Количество шагов | CFG Scale | Примечание |
---|---|---|---|---|
DreamDiffusionXL-Lightning | DPM++ SDE | 8 | 2 | М Ж |
DreamShaperXL-Lightning | DPM++ SDE Karras | 6 | 2 | М Ж |
HelloWorldXL-LightningEulerA | Euler a | 8 | 1 | М Ж |
JuggernautXL-Lightning | DPM++ SDE | 4 | 2 | М Ж |
LightningBloom-XL | DPM++ SDE | 4 | 1.5 | М Ж |
LightningFusion-XL | Euler a | 10 | 1 | М Ж |
MjollnirXL-Lightning | DPM++ SDE | 4 | 2 | М Ж |
Realgood-Fastpass-Lightning | Euler a | 8 | 2 | М Ж |
RealisticFantasyMix-XL | DPM++ SDE | 8 | 4 | М Ж |
RealisticStockPhoto | DPM++ SDE | 8 | 3 | М Ж |
RealVisXL-Lightning | DPM++ SDE | 4 | 2 | М Ж |
SinteticoXLL-Lightning | Euler | 8 | 1 | М Ж |
WildcardXL-Lightning | DPM++ SDE | 6 | 1.5 | М Ж |
Скоростными являются только те перечисленные модели, у которых в названии есть соответствующая строка (Lightning).
Самыми быстрыми оказались Hello World, Real Vis и Realgood. Что до качества... Судить сложно, но я пока буду придерживаться, при прочих равных, RealVis, Juggernaut и Hello World.
===== Перейти к комментариям
Всех женщин поздравляю с международным женским днём 8-го Марта.
Пусть каждый день в вашей жизни будут любовь, счастье, удача и оптимизм — а в этот день пусть их будет просто немного больше.
Тепла и процветания вашему дому.
Начинаем представлять главных героев "Легенды о принцессе Давенир".
Абра Давенир, архив Исторического факультета университета Мискатоник, 1927 год, Аркхем, Массачусетс. 20 лет, студентка Кафедры древней истории Исторического факультета, участница экспедиции на хребет Майоринк ("Хребет Дариана").
12
16
17
19
26
27
Фото в парке кампуса университета Мискатоник, 24 августа 1927 года.
(пока не решил, которая будет основным фото ГГ)
Изображения сгенерированы в SDXL-Turbo, модель RealVisionv5-Lightning, время просчёта 1.35сек на картинку (768x1024)
===== Перейти к комментариям
«Сотрудничество» с чат-ботами (Gigachat, ChatGPT, StableLM, Pygmalion и сервисом Replika) дало неожиданные итоги.
С «творческой помощью» ботов создался и вырос в полноценный синопсис проект романа, рабочее название «Легенда о принцессе Давенир».
Место и время действия: Аркхем, Массачусетс, 1927-й год.
Студенты университета Мискатоник Абра Давенир и Говард Гленн, делающие свои дипломные работы на основе одних и тех же материалов научных экспедиций университета, приходят к выводу, что за легендами о канувшем под землю городе-государстве Дариане, к востоку от города, есть более чем веские фактические свидетельства.
Расследование этих материалов выливается в новую экспедицию в систему пещер, над предполагаемым местонахождением легендарного Дариана, следствием которой становится череда необычных и далеко идущих последствий и для исследователей, и для города, и, вероятно, для всей Земли.
3
4
6
11
12
16
31
36
Изображения просчитаны в модели ZavyChroma XL. На иллюстрациях — принцесса Ульвен Маорин Давенир ар-Дариан после получения печальной вести от гонца.
Поздравляю, теперь в работе не три книги, а четыре.
===== Перейти к комментариям
Пока мы тут бьёмся за оливье и прочее культурное наследство, технологии искусственного интеллекта не стоят на месте. Если вы ещё ни разу не заглядывали на сайт StabilityAI (создатели Stable Diffusion, SD — сайт на английском языке), то самое время восполнить этот пробел. Подсказка: там не только достигли ускорения работы SD, об этом ниже, но и очень быстро осваивают другие генеративные направления: текст, музыка, видео, 3D моделирование и так далее.
Об этих направлениях речь когда-нибудь потом, а пока что самое важное о SD: там не только освоили высокое разрешение и умение бороться с известными дефектами картинок (SD XL), но и разработали существенное ускорение алгоритма построения картинки по описанию.
Если совсем на пальцах: новая, доступная с уже существующими обёртками модель SD XL Turbo позволяет генерировать изображения размером 768x1024 примерно за 0.8 секунды каждое там, где прежде на это уходило секунд 8-10. Понятно, что это очень примерная оценка, и всё зависит от описания, «железа» и конкретного разрешения картинки.
Соответственно, порождённые от SD XL Turbo модели также показывают существенный прирост скорости, при этом очень выигрывая в качестве.
Посмотрим на примеры. Созданные ниже картинки считались в разрешении 768x1024 от 3 до 5 секунд (NVidia RTX A4000, AMD Epyc 2GHz с 8-ю ядрами, 32 Гб DDR5) при использовании модели RealVisionXL_Turbo.
Для чистоты эксперимента я делал ровно один просчёт картинки по тому же самому описанию (т.е., не делал традиционно: просчитать несколько десятков вариантов и выбрать 1-2 годных). Ясно и понятно, что конечности и анатомия — всё ещё слабое место генеративных моделей; о том, насколько всё изменилось, судите сами.
Звёздное небо
Девушка у обрыва
На тропинке в саду
Городская аллея
Культист
Алиса Листьева
На репетицию
В кафе
Вы могли обратить внимание на осмысленные надписи: «Heat» у Алисы Листьевой и «Hero» у девушки в кафе. Это тоже новое свойство модели: можно задавать вполне определённые текстовые строки, взамен того случайного набора символов, который обычно получался.
Картинки ниже получены на базе той самой модели SD XL Turbo (алгоритм сведения Euler a, разрешение 768x1024 или 512x512, 1 прогон сведения, дискриминатор (CFG) 1).
Хвойный лес ночью
Деревья на скале
Замок
Дом в лесу
Причудливый особняк
Хребты безумия
Пустынная роза
Едем дальше.
===== Перейти к комментариям
|
Новые книги авторов СИ, вышедшие из печати:
О.Болдырева "Крадуш. Чужие души"
М.Николаев "Вторжение на Землю"