
Не так давно вышла третья версия suno.ai и это, мне кажется, отличный повод написать про то что это такое, что может и почему это интересно.
Начнем с того, что это алгоритм машинного обучения для end-to-end генерации музыки. В теории, для того чтобы что-то сгенерировать человек вообще не нужен.
Алгоритм сам напишет текст, озвучит его и наложит музыку. И результат даже в таком формате поражает. Очевидно, что уже не так уж просто отличить сгенерированную музыку от записей настоящих концертов.
Но в такой музыке не будет души, правда ведь?) Поэтому человек все же может принимать участие в написании музыки на разных уровнях. Он может ограничиться приблизительным описанием или полностью написать текст, задать стиль, прописать где будет куплет, а где крутое гитарное соло.
Скептически настроенные люди могли бы сказать, что это все не музыка, что это все просто пародия на уже существующие песни. И в целом они будут не далеки от истины, ведь так работает машинное обучение: мы учим модель генерировать что-то как можно более похожее на то, что уже существует. Но это вовсе не значит, что модель не создает ничего нового! Аналогичным образом работают и ChatGPT и Stable Diffusion. ChatGPT отвечает на ваши новые вопросы своими новыми ответами, а Stable Diffusion генерирует новые картинки по вашим новым запросам. Также и здесь.
Но не стоит полагать, что вся "новизна" будет заключаться исключительно в запросах. Модели машинного обучения имеют свойство обобщаться, то есть именно "понимать" что от них хотят, а значит вполне могут и создавать что-то новое посредством стохастических процессов внутри них.
Еще один аргумент в пользу того, что модель может писать интересную и необычную музыку — сам процесс генерации. По всей видимости, генерация музыки идет поверх уже написанного текста. То есть фактически музыка подстраивается под текст, и если текст будет иметь какую-то интересную и необычную поэтическую структуру то и музыка будет по крайней мере необычной. То есть экспрессивность музыки наследуется от экспрессивности текста, а текстовые модели сейчас показывают очень разнообразные и интересные результаты!