Fantasztikus dolgot mutattak be néhány napja a keresőóriás részéről. A cég MusicLM nevű programja hasonlóan működik, mint a képgeneráló AI-szolgáltatások, igaz egyelőre csak néhány példán keresztül mutatták meg, mit tud, így egyelőre biztosan nem próbálhatjuk ki.
A DALL-E-re erősen hasonlító megoldásról rántotta le a leplet a Google, ami egyrészt szövegek alapján képes zenét gyártani, másrészt a fütyülés vagy dúdolás alapján hallott dallamot más hangszerekre is átalakítja, amennyiben azt kérik tőle.
A mesterséges intelligencia a MusicLM nevet kapta, a The Verge cikke alapján pedig a Google egy csomó mintát feltöltött az internetre, hogy bemutathassa az újdonságot. Vannak 30 másodperces, valódi daloknak tűnő részletek, melyek egész bekezdésnyi leírásokból jöttek létre, ezekben pedig a konkrét műfajt, a hangulatot, sőt hangszerek fajtáját is előírták, de olyan ötperces darabokat is megmutattak, amik mindössze egy-két szóból álló instrukciók után születtek.
Ha valakit a képeket generáló mesterséges intelligenciák lenyűgöztek, akkor valószínűleg ezt is imádni fogja, főként úgy, hogy a Google által megosztott demóoldalon igyekeztek a lehető legrészletesebben bemutatni a fejlesztésüket. Volt például, hogy arra kérték egy megadott filmes jelenethez készítsen aláfestő dallamot, harmonikás death metal, vagy éppen a futuristic club kifejezéseket is értelmezni tudta és egészen jó eredményeket produkált.
Ezeken túl a MusicLM még az emberi énekhangot is képes szimulálni, és bár úgy tűnik, hogy a hangok hangszínét és általános hangzását eltalálja, ebben még mindig elég statikus hangot kapunk vissza, szóval lesz még hová fejlődni, de egy kezdeti próbálkozásnak viszont kiváló. A hivatalos leírás szerint ez az AI minőségében és a felirathoz való ragaszkodásban is jobb a többi hasonló rendszerhez képest, mivel képes hangot befogadni és lemásolni a dallamot.
A MusicLM tehát egy igazán izgalmas fejlesztés lett, azonban csalódniuk kell azoknak, akik azt várják, hogy kipróbálhatják a közeljövőben. Ezt ugyanis a Google egyelőre biztosan nem tervezi közzétenni annak érdekében, hogy megelőzzék a kreatív tartalom esetleges eltulajdonítását, illetőleg a lehetséges kulturális kisajátításnak vagy félrefordításnak a kockázataira hivatkoztak.
Mindez azt jelenti, hogy a kutatásuk jelenleg azoknak lehet hasznos, akik zenei AI-rendszereket építenek, mivel a Google bejelentése szerint hamarosan közzétesznek egy körülbelül 5500 zene-szöveg párost tartalmazó adathalmazt, amely segíthet más zenei mesterséges intelligenciák képzésében és értékelésében.
Természetesen egy ilyen grandiózus dolgot kár lenne veszni hagyniuk, így nem elképzelhetetlen, hogy egyszer majd valamelyik alkalmazásukban, továbbfejlesztett formában megjelenhet a MusicLM, vagy legalábbis felhasználnak belőle valamit.
Aki kíváncsi az említett mintákra és a saját fülével hallgatná meg az eredményeket, annak ide kell kattintania.