A zenészek sem lehetnek nyugodtak a mesterséges intelligencia miatt

2024. máj. 16.

A generatív mesterséges intelligencia megjelenése előtt sokan arra asszociáltak, hogy az MI először minden bizonnyal a kétkezi munkások megélhetését fogja veszélyeztetni, azonban az elmúlt években kiderült, hogy inkább a szellemi dolgozók megélhetése kerülhet kétségek közé. A külföldi nagy lapoknál voltak és vannak is kísérletek az újságírók lecserélésére, adminisztratív feladatkörök automatizálására. Abban azonban tényleg sokáig konszenzus volt, hogy a művészeti tematikájú generatív mesterséges intelligenciák még sokáig nem fognak versenyre kelni az emberi alkotókkal.

Az OpenAI DALL-E fejlesztése és a Midjourney 2022-es megjelenése és széles körű elterjedését látva azonban ma már azt sem lehet egyértelműen kijelenteni, hogy az MI képtelen felvenni a versenyt az alkotókkal. Bár épp mostanában kezdődnek meg a jogi viták arról, hogy milyen fotókon képezték ki ezeket a programokat, bármi is legyen az eredmény, visszamenőleges hatásuk nem lesz, így az eddigi képzési anyagokból nyugodtan profitálhatnak majd a fejlesztők. A képgeneráló programok eredményeit látva pedig azt mondhatjuk, igenis van miért félnie a grafikusoknak: több zenekar volt, amely MI által generált turnéplakáttal, vagy épp albumborítóval állt elő, így megspórolva a grafikusok tiszteletdíját.

Na de mi van az egyéb művészeti irányokkal? A zenei generatív mesterséges intelligencia programokból szintén jónéhány napvilágot látott az elmúlt években, ezek többsége azonban csak instrumentális zene készítésére volt alkalmas – arra is sokszor fülsértő hibákkal, tempótévesztéssel, stb. –, ha zenei ambícióink voltak, az éneklést többnyire már nekünk kellett rögzíteni. Jó példa erre a Google MusicFX vagy a Beatoven.ai, csak hogy néhányat felsoroljunk. A sorból azonban kiemelkedik a Suno AI, amely az elmúlt hónapokban több millió új felhasználóra tett szert azáltal, hogy az OpenAI GPT-4 nyelvi modelljét felhasználva rengeteg nyelven képes dalszöveget írni és megszólaltatni, az egyébként is meglepően minőségi zenei alapok mellett.

Hogy működik?

A Suno oldalát felkeresve egy klasszikus zenei streaming felület tárul elénk, ahol a publikus dalok között is sokáig válogathatunk, mielőtt belevágnánk az alkotásba. Ehhez pedig nem kell külön profilt sem létrehozni, Google vagy Facebook-fiókunkkal könnyedén bejelentkezhetünk, ráadásul a korábbi dalok automatikusan mentésre kerülnek, így a letöltéssel sem kell bajlódnunk.

Ezt követően beállíthatjuk, hogy saját dalszövegünkhöz akarunk-e zenét, vagy egy teljes egészében MI által generált dalt szeretnénk kézhez kapni. Bárhogy is döntünk, a rövid promptot, vagyis instrukciós szöveget nekünk kell megfogalmazni, amiben leírhatjuk, milyen témájú dalszöveget szeretnénk hallani, ahogy azt is, hogy milyen nyelven szólaljon meg, és persze, hogy milyen zenei stílusban, esetleg stílusok mixében.

Míg a képgeneráló programoknál a leggyakoribb megkötés, hogy közéleti szereplőket, valamint erőszakos és pornográf tartalmakat nem lehet generálni, a program esetében a közéleti szereplőkkel nincs probléma. Amit viszont kerülni kell, az a konkrét előadók másolása, tehát nem kérhetjük azt, hogy a Metallica zenéjét másolja le a program. Végül a generáláskor érdemes a modell V3-mas verzióját választani, ez ugyanis már a fejlett GPT-4 nyelvi modellt veszi alapul, ami sokkal komplexebb nyelvi megoldásokra képes.

Amennyiben csak szórakozásból próbáljuk ki a programot, azt napi tíz dalig ingyen megtehetjük, ha viszont ennél komolyabb terveink vannak, akkor bizony nem tudjuk elkerülni azt, hogy a zsebünkbe nyúljunk. Míg alapvetően csak 50 kredit (10 dal) és 2 egyszerre zajló művelet jár ingyen, havi 8 dollár, vagyis nagyjából 3000 forint ellenében már havi 2500 kredit (500 dal), és 10 azonos időben zajló művelet engedélyezett. A Premier Plan részeként, 24 dollár (8700 forint) ellenében már 10 ezer kredit (2000 dal) és 10 egyszerre történő generálás engedélyezett.

Eredmények tekintetében már a V2 és a V3 modellel készült zenék között is jelentős különbséget lehet érzékelni, legyen szó akár a dallamok komplexitásáról, a magyar nyelv ismeretéről, és úgy en block a hitelességről. Természetesen pár másodperc után még mindig megállapítható, hogy nem emberi eredetű az, amit hallunk, viszont a vetélytársakhoz képest nagyjából fél-egy éves előnyben van a Suno - az MI fejlesztésének mai tempójában.

Új piacot nyithat a mesterséges zene

A fizetős csomagok esetében fontos előny, hogy a tartalom már monetizálhatóvá válik, így ha például háttérzenét készítünk, amit később megvásárolnak, az a pénz tisztán az alkotóé lesz. Ugyanígy jogtisztán lehet használni bármilyen egyéb célra. Erre már hazánkban is van példa, a több mint 150 ezer feliratkozóval bíró Jólvanezígy YouTube-csatorna outroként használja a Suno által gyártott dalokat, sőt már streaming-felületeken is lehet hallgatni egyes dalaikat.

Ez, és a külföldi trendek azt jelzik, hogy a megvásárolható háttérzenéknek leáldozóban lehet a piaca, ugyanis pár másodperc munkával és minimális pénzbefektetéssel szinte bárki gyárthat zenét, ráadásul pont olyat, ami a saját ízléséhez passzol. És bár az Európai Unió elfogadta a generatív mesterséges intelligenciát szabályozó AI Actet, ennek passzusai jó néhány évig nem kerülnek még betartásra, így a fejlesztőknek még nem kell nyilvánosságra hozniuk az adatbázist, amin az alkalmazásukat kiképezték. A törvényeknek pedig nem lesz visszamenőleges hatálya.

Az ehhez hasonló programoknak minden bizonnyal a reklámiparra is hatásuk lesz, ugyanis könnyen lehet, hogy a márkák néhány év múlva már nem zenészeket fognak felkérni egy-egy rövid dal elkészítésére, hanem egy ehhez hasonló programot bíznak majd meg a feladattal, szinte ingyen. Érdemes figyelembe venni egy nemrégiben készített európai felmérés eredményeit is, amely szerint 5 éven belül a zenészek, a streaming miatt alapvetően is megcsappant bevételeinek 27 százalékát veszélyeztetheti majd az MI. Így szinte elkerülhetetlennek tűnik, hogy mind a kiadók, mind pedig a jogvédő szervezetek és a kormányok is lépjenek az ügyben.

Kutatás: https://www.musicbusinessworldwide.com/generative-ai-music-market-to-be-worth-3bn-by-2028-says-report-commissioned-by-sacem-and-gema/#:~:text=Carried%20out%20by%20Goldmedia%2C%20a,inputs%20is%20put%20into%20place.