Дали вештачката интелигенција ќе ги замени Стонси?

Рубрика: Аудио и видеотехника

Автор: Невенка Стојановска

Објавено на 04.05.2020 - 21:15

Стонси своевремено ја сумираа целата суштина на популарната рок-музика во еден единствен риф и стих којшто на англиски вели “It’s only Rock ‘n Roll” (“Тоа е само рокен рол“). Но, како што признаваат во Силиконската долина, да научиш машина да компонира воопшто не е едноставно.

OpenAI оваа недела го најави open source компјутерскиот систем Jukebox, којшто умее да компонира оригинални мелодии и хармонии сосе стихови и вокализации, служејќи се со стиловите на популарни уметници од широк спектар на музички жанрови.

Резултатите се далеку од совршени, но сепак се импресивни. Во некои случаи Jukebox создаде кредибилни рендери на песни кои потсетуваат на тврдокорниот гитарски стил на Ролинг Стоунс, на златните вокализации на Ела Фицџералд, интонациите на Елтон Џон и на зарипнатиот глас на Род Стјуарт.

Но, има и неверојатно бизарни творевини, каква што е на пример песната во стилот на Елвис Присли наречена “Митоза“, каде синтетичкиот Елвис пее “Од прашина дојдовме со скромен почеток; од прав до липиди до клетка до срце; Со митоза со мејоза со тек на време; На крај се разбудивме со свесност“. Слична несреќна комбинација е и ВИ песната “Среќно Божиќно бебе“ испеана во стилот на големиот Чак Бери, со стихови што веројатно до смрт би ги преплашиле малите деца. Што значи дека, најблаго речено, има уште многу, мноооогу работа за усовршување на алгоритамот. Сепак, проектот е значаен чекор напред во областа на генерирањето на музика со помош на вештачка интелигенција и, секако, заслужува пофалби.

За да ги обучува компјутерите за генерирање песни, OpenAI создаде огромен сет на податоци составен од 1,2 милиони песни.

Компјутерските програми со децении се обидуваа да генерираат пристојна музика. Еден од поимпресивните потфати на ова поле е програмата Band in a Box на PG Music, која им овозможува на корисниците да внесат акорди по што таа самостојно генерира оригинални мелодии и повеќеделни хармонии во кој било од десетиците музички стилови. Во 2018 година, Google ja претстави Musical Transformer, којaшто генерира песни со препознатливо повторување кое “влегува во уво”. OpenAI минатата година ja издаде MuseNet, којашто генерира оригинални мелодии, но не и текстови. Jukebox е веројатно првата програма со овие две можности – генерирање песни со стихови “испеани” од вокали.

Техничките спецификации врзани за програмата се достапни онлајн, за оние кои се интересираат за деталите. Клучен предизвик е обработката на огромни количини музички податоци. На пример, една типична песна во траење од 4 минути, снимена со CD квалитет (44 kHz, 16-бити) има над 10 милиони временски чекори, според OpenAI. Притоа за компримирањето на податоци, отстранувањето на нерелевантните информации и надсемплување на резултатот назад во програмата се врши со авто-енкодер. Потребни се приближно девет часа за да се рендерира само една минута аудиоматеријал!

Секако е дека ќе има подобрување на програмата, впрочем и самите креатори од OpenAI се свесни за нејзините недостатоци, како што се на пример неможноста за составување на подолги музички теми со рефрени и повторливи фрази, да спомнеме само некои од нив. Следната итерација од оваа програма се очекува да стане достапна во април 2021 година.

A еве и неколку примери за "во живо" да ги слушнете синтетизираните песни

OpenAI · Jukebox samples: Novel lyrics

Клучни зборови:

аудио
софтвер
рендерирање музика
OpenAI
Jukebox