Kihívások és lehetőségek a mesterséges intelligencián alapuló zeneszerzés kapcsán

 

Magyari Marcell* és Németh Zoltán* gondolatait összegezte:

Szedmák Borbála[1]

 

 

 

A digitalizáció az élet minden területén megjelent az utóbbi években, így többek között a zene világában is teret hódított: számos platform segíti elő az élő koncertközvetítést, együttzenélést, a szektor különböző szereplői közötti kapcsolatépítést, applikációk támogatják a zenetanulást, „robotkarmesterek” vezénylik esetenként a zenekarokat, illetve megjelentek a mesterséges intelligencián (AI) alapuló „zeneszerző-szoftverek” is. Korábbi cikkeimben részletesen bemutattam ezeket, valamint recenzió formájában is értékeltem a jelenséget. Jelen cikkben pedig két fiatal zeneszerző segítségével vizsgálom a kérdéskört, és próbálok választ adni az alábbi kérdésekre: Valós félelem lehet a zene világában is az a nézet, hogy a különböző, a mesterséges intelligencián alapuló „zeneszerző-szoftverek” elveszik az emberek munkáját? Előfordulhat, hogy évek múlva már nem lesz szükség zeneszerzőkre, és egy „gép” képes lesz akár a kreatív folyamatokban is részt venni? Milyen előnyök, lehetőségek, valamint kihívások, korlátok azonosíthatók az AI zeneszerzés kapcsán?

 

A mesterséges intelligencia zenében történő felhasználása az elmúlt években dinamikus növekedésnek indult. Megjelentek különböző zeneszerző programok, amelyek milliók számára tették lehetővé, hogy zeneszerzővé váljanak mindenféle előképzettség nélkül: csupán a stílust, tempót és a hangulatot kell megadniuk, és a program pillanatok alatt generál egy egyedi zeneművet. Némelyik alkalmazás és zenemű annyira jól sikerült, hogy fogyasztói tesztek során a hallgatók (akár szakavatott fülek) sem tudták megkülönböztetni, hogy melyik Bach és melyik a mesterséges intelligencia szerzeménye. A mesterséges intelligencia akár olyan zeneművek születését is elősegítheti, amelyek teljesen újszerű hangzásvilággal rendelkeznek. Egy zenekar például az első Grammy jelölését is a mesterséges intelligenciának köszönheti: ezt alkalmazva készíteni tudott egy olyan zeneművet, amely szakított az addigi hangzásvilággal.

 

Egyesek szerint a mesterséges intelligencia a művészet végét jelenti, mások azonban az ebben rejlő lehetőségeket emelik ki, hiszen – korábbi cikkünkből idézve -, „amennyiben nem használjuk ki a technológia által nyújtott előnyöket, a lehetőségek el fognak menni mellettünk” (A klasszikus zene „társkereső” platformjai, ZeneKar, 28 évfolyam, 2. szám). Gyakori félelem a gépekkel, robotokkal szemben, hogy elveszik az emberek munkáját – vajon ez igaz lehet akár zeneszerzőkre is? Előfordulhat, hogy akár érdekesebb vagy „jobb” zenét készít egy alkalmazás, mint egy zeneszerző? Korábbi cikkemben (A mesterséges intelligencia megjelenése a zenei szektorban, ZeneKar, 28. évfolyam, 3. szám) néhány, a mesterséges intelligenciára épülő, innovatív megoldást mutattam be a zene világában. Jelen cikk során célom, hogy a mesterséges intelligencia alkalmazásában rejlő potenciált zeneszerzők véleményét megismerve vizsgáljam. Interjúalanyaimat, Magyari Marcellt és Németh Zoltánt a mesterséges intelligencián alapuló zeneszerzés kapcsán kihívásokról, lehetőségekről, valamint a jövővel kapcsolatos meglátásairól kérdeztem.

 

Az, hogy valamilyen algoritmus alapján zene készül, nem újszerű, már a középkorban algoritmusok szerint énekelték a szöveget: az algoritmus szabályozta, hogy melyik magánhangzó milyen hang. Az érdekes kérdés az, hogy a mesterséges intelligencia tud-e döntést hozni. Az említett példa determinisztikus algoritmus, amely azt jelenti, hogyha ugyanazt a szöveget „betáplálom”, akkor ugyanazt a dallamot fogom kapni. Az lesz a „jó” zeneszerző alkalmazás, amely nem ugyanazt fogja visszaadni ugyanarra az inputra; lesz benne variációs lehetőség: ha kétszer lefuttatja az ember az algoritmust egy adathalmazra, akkor nem ugyanazt fogja visszakapni. Van tehát benne „véletlenszerűség”, a programozási szaknyelvvel élve heurisztika: az algoritmus valamilyen szempontrendszer alapján dönt, és nem mindig ugyanúgy dönt. Az érdekes kérdés az, milyen heurisztikus gondolatokat lehet beültetni egy algoritmusba, és mitől lesz „emberi” egy ilyen döntés. Ha például van egy dallam, amely folyamatosan megy fölfelé akkor mikor jön el az a pont, amikor egy ember már úgy érzi, hogy már „irányt kéne változtatni”, és lefele kellene mennie a dallamnak. Ez persze csak egy példa, rengeteg hasonló kérdés említhető ennek kapcsán. Hogyan taníthatjuk meg a programnak azt, hogy hogy milyen döntéseket kell hozni, és hogy ez mitől lesz emberi? Akár a machine learning alapján működő, legerősebb sakkgépek példáját vizsgálva megállapíthatjuk, hogy nagyon nagy nehézség nincs ebben. Kellő ideig kell „futniuk”, ezalatt megértik a sakkjátszmákat, hogy mi miért alakult úgy, ahogy, a kielemzett játszmákból pedig szabályokat hoznak létre. Ennek kapcsán legnagyobb kihívás az az, hogy szükség van adatbázisra; adatok nélkül nincsen AI. Ehhez első lépésként össze kell állítani egy tanítómintát. Persze kihívás a szakmai rész is, hogy az adatra hogyan építünk, az algoritmus hogyan fog tanulni, de az első lépés mindenképp a tanítóminta összeállítása. Ez tulajdonképpen ahhoz hasonlítható, hogy a képfelismerő algoritmusokat úgy „edzik”, hogy nagyon sok képet mutatnak neki. Itt a képek helyett zenei mintákat kell mutatni a „gépnek”. Ezt követően egy olyan algoritmusra van szükség, amely ezen a tanítómintán megy végig, a tanítóminta sajátosságait, összefüggéseit pedig a gép megtanulja, tehát például melyek azok a hangok, amelyek egy adott zenei környezetben jellemzően előfordulnak, és melyek azok, amelyek kevésbé. Ha ez a tanítóminta nem kellően gazdag, akkor például a zenei építkezés, az, hogy az egyik motívum a másikra épüljön, hiányozni fog. Kicsit olyan ez, mint egy chatbot. Ha felteszünk egy kérdést, amire a chatbot válaszol, akkor úgy tűnik, mintha ember lenne, de aztán ha felteszünk egy következő kérdést, akkor annak a válasznak már semmi köze nincs az előzőhöz. Ha a tanító-adatbázis nagyobb, illetve a mögötte lévő AI algoritmus is jóval összetettebb, akkor nagyobb potenciált lát egyik alanyunk a témában. A tanítóminta összerakása a legnehezebb, hogy az változatos legyen eléggé. Nagyon fontos az AI kapcsán, hogy mennyi adat áll rendelkezésre, és ha nagyon tág a fókusz, akkor hatványozottan nő a mennyisége az adatnak, amely szükséges. Egyik alanyunk szavaival élve „adatok kellenek, ha nincsenek adataink, akkor nem lehet csodát létrehozni”. Technikai kihívással is szembesül a „szerző” egy ilyen program kialakítása során. Például előfordulhat, hogy az adott mintát „túltanulja” algoritmus, amely azt jelenti, hogy például egy A és egy G hang után mindig egy F-et fog játszani, mert a tanítómintában az F hang felül volt reprezentálva. Persze arra is figyelni kell, hogy a tanítóminta összeállítása során olyan mintákat kell „betáplálni”, amelyek azonos zenei környezetben vannak; muszáj zenei kontextusban gondolkozni. Fontos tehát, hogy az AI programozás mellett a zenéhez is értsen az ember, ha egy ilyen programot szeretne összerakni. Ez meglehetősen ritka, azonban egyik alanyunk, Magyari Marcell ékes példája a két terület összefonódásának, így segítségével betekintést nyerhettünk a technológiai szempontokba is.

 

Ennek az ellentétje az, amikor mi, „emberek” beállítunk paramétereket, skálaszabályokat, amelyek alapján az algoritmus számol, kiértékel, és döntést hoz. Ebben az esetben az emberi behatás is szerepet játszik; nem a statisztika, hanem a beállítások alapján működik a gép. Ez két külön irányzat, mindkettő tud működni. Zeneszerző programok esetében is értelmezhető a két irány: ha valaki kielemzi Bach összes fúgáját, valószínűleg tud írni egy újabb fúgát, amely olyan lesz, mint Bach összes fúgájának az átlaga. Ez az egyik irány. A másik pedig, különböző szabályrendszereket hozunk létre, és azok eredményeznek valamilyen hangot vagy eseménysorozatot. Az algoritmikus zeneírást képviselik például a new complexity zeneszerzők is: rengeteg matematikai adatból dolgoznak, a darabjaik valamilyen algoritmuson alapulnak, amelyet le lehet írni matematikailag is. Ami fontos, hogy milyen Hz-en és mennyi ideig szóljon egy hang, és aztán azt valamilyen módon meg kell hangszerelni. Ez nem annyira sok adat.

 

További érdekes téma a szerzői jogok kérdésköre. Ha valaki készít - kódol - egy programot, amely „random” elemek nélkül, determinisztikus módon „kiad” egy dallamot, akkor a program készítője a „zeneszerző”. Ebben az esetben, ha valaki elindítja a programot, mindig ugyanazt fogja visszakapni, ugyanazon szabályok alapján. De kérdés, hogy mi a helyzet akkor, ha egy felületen megadhat a felhasználó paramétereket (például stílus, hangulat, akkordszerkezet stb.), amelyek alapján elkészül a „zenemű”. Ez már valószínűleg inkább a felhasználó „szerzeménye”, de nagyon sokrétű ez a kérdés. A határ talán az input-output mennyiségében keresendő. Ha például vesszük az Ableton (szoftver) példáját, akkor az alábbi történik: a felhasználó MIDI adatot, hang-könyvtárat „táplál be”, a program pedig visszaadja azt, tehát technikailag az Ableton egy hangszer. Tulajdonképpen úgy működik, mintha „leütne egy hangot” a felhasználó – éppúgy, mint a zongora klaviatúráján. Érdekes kérdés, hogy egy ilyen program mikor hangszer, és mikortól valamilyen „entitás”, amely terméket állít elő. Az említett szoftver egy olyan hangot fog visszaadni és olyan hosszan, amilyen hosszan azt „leütötte” a felhasználó - tehát ez egy egy az egyhez reláció. De ha a program egy „leütött” billentyű esetében több hangot ad vissza azok alapján, hogy milyen hosszan és milyen erősen ütötte le a felhasználó a billentyűt, akkor ez már közelít a zeneszerzéshez. Minél bonyolultabb egy algoritmus és minél több az input, annál inkább lesz ez egy zeneszerzési módszer, mert akkor már nem egy hangot fog visszaadni a program, hanem sokat, amelyekből már lehet aztán építkezni.

 

Ha a „zeneszerző-program” közel ugyanazt fogja visszaadni mindig ugyanazon szabályok alapján, és a felhasználónak nincsen „belenyúlása” sehol, akkor a szoftveré az „érdem”. Interjúalanyaim egyetértettek abban, hogy amennyiben van „belenyúlási” lehetőség, akkor már inkább egy „hangszerelő géphez” hasonlíthatjuk a programot. Ekkor – mivel a felhasználó határozta meg a paramétereket - az ő tulajdona lesz az elkészült zenemű, mert azt senki más nem készítette el korábban ugyanúgy, ugyanazokkal a paraméterekkel. Vélhetően senki nem fogja tudni azt megállapítani, hogy egy „ember” vagy egy „gép” írta a zenét. Fejlesztői oldalról a program az, amely levédhető, ha azonban ezt a fejlesztők közzéteszik, akkor - alanyaim szerint - a produktum, amely a segítségével készül, már a felhasználóé. Ha egyébként nagyon bonyolult, amit visszakap a felhasználó, és sok benne a véletlenszerű elem, akkor tulajdonképpen a kérdésfelvetés is teoretikus: sosem nem lesz ugyanolyan a „zenemű”, mint amit más akarna levédetni. Persze ez stílusfüggő is: a barokk stílusban sokkal kevesebb lehet a „random” elem, kevesebb az opció, döntési lehetőség, így elég hamar el lehet jutni oda, hogy nem elég bonyolult a heurisztika, és a mesterséges intelligencia duplikálni fogja a korábban már „megkomponált” művet. Ebben az esetben előállhat az, hogy olyat sikerül létrehozni, amit már esetleg valaki létrehozott, vagy legalábbis részleteiben.

 

Gyakori félelem a „gépek” kapcsán, hogy azok elveszik az emberek munkáját. Felvetődik a kérdés, hogy ez a zene világára is értelmezhető-e: előfordulhat, hogy a mesterséges intelligencián alapuló zeneszerző szoftverek elveszik a zeneszerzők munkáját? Lehet, hogy néhány év múlva nem lesz akár szükség zeneszerzőkre? Alanyaim egyetértettek abban, hogy ez a jövőkép nemhogy nagyon távoli, de nem is reális. Az iparosodás példáját nézve láthatjuk, hogy ugyan kevesebb szövő emberre volt szükség, de aztán őket felvette az ipar máshogy. A példát a zeneszerzőkre értelmezve előfordulhat tehát a zeneszerző-szoftverek felfutásának eredményeképp, hogy kevesebb zeneszerzőre lesz szükség a hagyományos értelemben, azonban a szoftverfejlesztő ipar valamilyen módon „fel fogja szívni” őket. Ezzel együtt nem tartják alanyaim valószínűnek, hogy ez a közeljövőben bekövetkezne. Nagyon nehéz kérdés ugyanis, hogy mitől lesz emberi a zeneszerzés, az érzelmek, gondolatok hogyan tudnak megjelenni. A kortárs zene a new complexity irányzattal már elment abba az irányba nagyon régen, hogy már most sem emberi az a zene, amelyet írunk. Ez azt jelenti, hogy amennyiben kellően „bonyolultat” kérünk a géptől, akkor azt nem lehet megkülönböztetni technikailag egy Ferneyhough-darabtól. Ez valahol a szépsége is a szerializmusnak. A fő probléma, kérdés ezzel kapcsolatban az, hogy hol az érzelem a darab mögött; mit fejez ki az a zene, amelyet egy gép ír. Ugyanazért, ugyanúgy nem tudja egy gép megírni az adott darabot, mint egy ember, de túlmisztifikálni sem szabad a mögöttes gondolatok szerepét: egyik alanyunk szavaival élve „ezek valójában csak hangjegyek”. Továbbá az érzelmeket is „hozzá lehet rakni” a gépi zenéhez is: megtanítható a „gép”, hogy mit jelent zenei nyelven olyan érzelemben kommunikálni, amelyet a felhasználó kér. Az „extra-muzikális” elemek azok, amelyeket valószínűleg nehezebben lehet integrálni. Ilyen például, amikor egy hang vagy egy fordulat mögött a 20. századi zenében valakinek a neve „rejlik”, hangjegyekbe kódolva - de ezeket leggyakrabban észre sem veszi a zenehallgató.

 

Egy gép tehát előállíthatja ugyanazokat a hangsorokat, dallamokat, és így tulajdonképpen nem lehet különbséget tenni a „gép” és az „ember” alkotása között. A nagy nehézség sokkal inkább az előadásban rejlik. Rengeteg a nehezen számszerűsíthető, nehezen „megfogható” faktor a zenélésben. Egy hegedű esetében fontos tényező, hogy például mennyi gyanta van a vonón, mennyire kell erősen nyomni a vonót ahhoz, hogy az ne recsegjen be, de közben azért kellően hangosan szólaljon meg a hang. Ez csak néhány példa, amelyek mellett rengeteg hasonló faktort kell figyelembe venni. Egy embernek ez érzésre megy, azonban a gépnek ezt matematikailag kell definiálni. Alanyaim szerint azonban idővel biztosan el fog jönni ennek a kora, és majd lesznek olyan zenekarok, amelyekben csak robotok játszanak. De ettől függetlenül továbbra is lesznek olyan zenekarok is, ahol ugyanúgy emberek fognak zenélni. Tehát a mesterséges intelligencia potenciális térnyerésével csak felszabadul erőforrás, amelyet más területen lehet kamatoztatni.

 

Ha egy „gép” hangsoraiban ugyanolyan zenét tud szerezni, mint egy zeneszerző, és a megírt művet egy „hús-vér” művész előadja, akkor nem válik el, hogy melyiket szerezte gép, és melyiket ember. De kérdés, hogy ez „baj-e”. Alanyaim szerint egyáltalán nem, hiszen nagyon gyakran egy darabot azért hallgatunk, mert az írta, akit hallgatni akarunk, vagy pedig egy adott stílusú zenét szeretnénk hallgatni. Ha az számít, hogy ki írta, akkor nem azt nézzük, hogy mi a darab - persze van egy elképzelésünk arról, hogy mit fogunk hallani. Ha azonban egy lejátszási listát szeretnénk kreálni adott stílusú dalokkal, akkor meg az nem számít, hogy ki írta a művet, csak legyen valami olyasmi, mint amire éppen vágyunk. Tehát felhasználóként – hallgatóként - valójában nem számít, hogy az, amit hallgatunk, gép vagy ember kompozíciója-e.

 

Alanyaim kiemelik, hogy a zeneszerzőknek már jelenleg, a mesterséges intelligencia kapcsán feszegetett kérdésektől függetlenül is nehéz kiemelkedniük, hiszen rengeteg jó zeneszerző van; mindenki inkább a mikrokörnyezetében tud érvényesülni. Napjainkban nincsenek „nagyon nagy zeneszerzők”, hanem nagyon sok „kis zeneszerző” van, akik „nagyon nagyokat” tudnak alkotni, csak nem kapnak akkora visszhangot sehol, mert a világ minden táján megvan a saját mikro- kultúra és ott érvényesülnek, nem pedig a nagy térben. Alapvetően a zeneszerzőknek tehát nem a zeneszerző-szoftverektől kell félniük, hanem mindenki mástól, a „vetélytársaktól”.

 

A zeneszerző programoknak jellemzően nagyon szűk a felhasználási körük. Például, ha valaki filmzenét szeretne a filmjéhez, akkor kiváló választás lehet egy szoftver, amely segítségével néhány kattintással ezt létre is hozhatja. Az alkalmazott zeneszerzők tehát (akik filmzenékkel, reklámzenékkel stb. foglalkoznak) előfordulhat, hogy kicsit „nagyobb bajban vannak”. Ők „egyszerűbb” zenével foglalkoznak, amely szabályrendszerét könnyebb számszerűsíteni egy gép számára, illetve ezeknek a zenéknek a felhasználása is más. Ha valaki például egy diplomafilmet készít, és létezik egy program, amely 10 perc alatt elkészíti hozzá a zenét, akkor azt fogja igénybe venni, nem fog külön megkeresni zeneszerzőt. A reklámiparban hasonló a helyzet: a zenemű kiválasztásával, a jogdíjak és az egyéb adminisztratív intéznivalók rengeteg időt igényelnének, miközben a gép egy pillanat alatt „kidob” egy hasonló hangulatú zenét, mint amit szerettünk volna.

 

A mesterséges intelligencián alapuló zeneszerzés további felhasználási területe lehet a zeneszerzők továbbfejlesztése is. Érdekes lenne kielemezni, hogy mikor, hol, miért, milyen döntést hozott a „gép”. Ez rámutathat új elemzési szempontokra, tanulhat a szakma valami újat, vagy találhat egy új irányt vagy egy új fordulatot, hangszerösszeállítást. Eszerint tehát az ember tanulhatna a géptől egy idő után. Ehhez szintén jó analógia a sakkgépek példája: ma az összes sakkmester gépek segítségével tanulja a játékot. Egyes versenyeken random állásból indul el a játék, és mindenki kap 15 percet, hogy elemezze az állást. Ilyenkor a gép mondja meg sokkal hatékonyabban és eredményesebben, hogy mi az a stratégia, amelyet követni érdemes.

 

A mesterséges intelligencián alapuló zeneszerzés oktatási célokra történő felhasználásában egyesek nagyobb, míg mások kisebb potenciált látnak. Abban egyetértettek interjúalanyaim, hogy amennyiben a program elég fejlett lesz, akkor alapvető zeneszerzési elveket meg lehet vele tanítani, de kérdés, hogy ez mennyiben „ad többet” a diáknak, mintha valódi darabokat, élő példákat elemezne, és megvizsgálná, hogy mitől „működik” az adott fordulat.

 

Egyesek az esztétikai funkciót háttérbe szorítva inkább abban gondolkodnak, hogy például, ha valaki improvizálni tanul, és elakad, akkor a gép segíthetne, hogy mi lehetne a következő hang. Vagy például a tanuló és a gép váltogathatja is egymást: játszik valamit a diák, amit kiértékel a gép, és erre reagálva egy következő körben a gép játszik, majd megint a diák és így tovább. Persze ehhez fontos, hogy valós idejű reakciókra képes legyen a gép. Továbbá például osztályozhatná a diák által lejátszott dallamokat: definiálhatná, hogy azok a tanítómintához képest mennyire egyszerűek vagy bonyolultak, valamint tippeket adhatna, hogy kezdő zongoristaként például, ha egy adott hangot belerakna a diák, akkor azzal tovább tudná vinni vagy bonyolítani, izgalmasabbá tenni a játékát. Tehát korrigálhatna, ötleteket adhatna, illetve közös zenélésre is alkalmas lehet, hiszen akinek nincsen lehetősége arra, hogy a barátaival zenéljen, annak kiváló alternatívát nyújthatna. Persze ennek nem professzionális szinten, hanem inkább az alapfokú zenetanulásban lehet helye.

 

Alanyaim hangsúlyozták, hogy ugyan elképzelhető, hogy idővel ez teret hódít, azonban együtt zenélni mindig érdekesebb lesz egy valódi emberrel. Sokkal élvezetesebb a közös zenélés és a tanulás is „élőben”. Közös improvizáció során gyakran nem is feltétlenül a másik játékára, zenéjére, hanem magára az élő emberre reagál a zenész. Persze lehetnek olyan helyzetek – mint például a COVID-19 okozta bezárások -, amikor hasznos lehet a zenét tanulóknak, hogy együtt tudnak játszani egy programmal, amely nem mindig ugyanazt csinálja, vagy ha egyéb okból kifolyólag valakinek nincsen rá lehetősége, hogy emberrel zenéljen, akkor is jó opció lehet. Vannak tehát felhasználási lehetőségek az oktatásban is, azonban egyes vélemények szerint azért nem valószínű, hogy az oktatás fő irányát ez jelentené. Az otthoni gyakorlást esetleg érdekesebbé teheti, hiszen így a diák nem a szoba négy falának játszik, hanem kap egy „partnert”, „aki” válaszolgat, de alanyaim egyelőre ennek csak marginális szerepet tulajdonítanak.

 

Az edukációs célok mellett zenei kíséret előállításban is relevánsak lehetnek az AI által nyújtott lehetőségek. A kilencvenes években terjedtek el a kíséret-automatikával rendelkező szintetizátorok, amelyek jellemzően mindig ugyanazokat az ütemeket ismételték. Egy ilyen kíséret-automatikát AI-al magasabb szintre lehetne emelni, és így nem ugyanazt a 3 akkordot játszaná végig, hanem megfelelően variálná ezeket, sőt, ha játszik a zenei kíséretre a zenész, akkor még reagálhatna is arra.

 

A mesterséges intelligencián alapuló zeneszerzés további előnye az, hogy „szélesedik a skála”, azaz létrejön egy új irányzat. Alanyaim szerint bizonyára lesznek majd olyan zeneszerzők, akik ilyen programokkal fognak zenét generálni, és közülük is ki fognak emelkedni kiválóságok, a „szakma” legmagasabb fokú művelői. Egy új irányzat kialakulása mindig érdekes jelenség és további tanulásra ad lehetőséget. Egyik alanyunk szavaival élve „rosszabb nem lesz tőle az iparnak, inkább más lesz, ami nem feltétlenül baj”. Mint minden művészeti ágban, a zenében is az a jellemző, hogy attól, hogy megjelenik egy új irányzat, nem lesz az előző kevésbé fontos, hiszen mindennek megvan a rajongótábora. „Attól, hogy megjelenik valami új, nem tűnik el automatikusan a régi.”

 

A mesterséges intelligencián alapuló zeneszerzés könnyűzenében történő felhasználásáról megoszlanak a vélemények. Abban egyetértenek a szakértők, hogy például rockzenét sokkal könnyebben lehet generálni az egyszerűbb szerkezet és a műfajra jellemző korlátok miatt. Az AI könnyedén képes lehet kiváló popslágereket írni, ezek esetében ugyanis a cél a nagyon könnyű befogadás és az, hogy minél könnyebben az „ember fülébe másszon a dal”. Gyakran hallható, hogy az a legjobb popzene, amely 90 %-ban ismert fordulatokra épül, és nagyjából 10 %-ban van benne valamilyen csavar, de azért a legtöbb popzene még csavar nélkül is teljesen jól működik, néhány akkordra építve. Azonban a populáris zenében még nagyobb szerepet kap a dalszerző-előadó személyisége, a dalok „háttértörténete”. Technikailag tehát a könnyűzenében könnyebb lenne implementálni a „gépeket”, de valószínűleg nem lenne akkora sikerük, mert a popegyütteseket jellemzően azért hallgatják az emberek, mert azonosulni tudnak velük és a képviselt életérzéssel. Persze ha nem tudják, hogy az adott zenemű „gép” szerzeménye, akkor valószínűleg könnyebben azonosulnak a dallal, azonban elidegenítőleg hathat, ha kiderül, hogy egy „gép” generálta a dallamot és a szöveget. A komolyzenei réteg ilyen értelemben sokkal kísérletezőbb. Egyik alanyunk szavaival élve „furcsa kettősség” jellemzi a klasszikus zenét: egyfelől jelen van a konzervativizmus, másfelől viszont „folyamatosan feszegeti a saját határait”.

 

Más vélemények szerint viszont akár a klasszikus, akár a könnyűzene oldaláról vizsgáljuk a kérdést, a zeneszerzésnek nem az a célja sosem, hogy meglévő sémákat hasznosítsunk, hanem az, hogy úgy fejezzünk ki érzelmeket, ahogy eddig más nem. A kérdéskört egyrészt megközelíthetjük a „laikusok” szemével, másrészt pedig értelmezhetjük a jelenséget zeneszeretőként, zenerajongóként, illetve zenészként. Szenzációként értelmezve ez egy nagyon izgalmas dolog, hogy zenei összefüggéseket (például melyik hang fordul elő gyakrabban, milyen zenei környezetben stb.) hogyan tud egy szoftver megragadni, és hogy ebből valóban ki lehet hasonló dolgokat kihozni, mint amire egy ember képes. De zeneszeretőként hiányolhatjuk az „emberi oldalt” – bármilyen műfajról is beszélünk.

 

Hallgatóként az „emberi oldal” azonban nem mindig olyan egyszerűen érzékelhető, azonosítható. A cikk elején említett Bach-példa kapcsán beszélgettünk szakértőinkkel arról is, hogy szerintük mennyire reális az, hogy egy, a mesterséges intelligencián alapuló zeneszerző szoftver olyan zeneműveket képes írni, amelyet akár könnyedén össze lehet keverni Bach műveivel. Egyikük kiemelte, hogy sok esetben „árulkodó jel”, hogy a zeneszerző szoftver darabjait jellemzően a szoftvernek a lejátszójával játsszák fel, ami nyilván nem veszi figyelembe a dinamikát, művészi szempontokat. Tehát az előadás nagyon le van „butítva” sokszor. Persze ebben nagyon nagy fejlődés figyelhető meg az utóbbi időben, számos olyan VST érhető el, amelyeknél élő hangszerrel vették föl a hangokat, így nem lehet könnyen megkülönböztetni, hogy az adott hangot ember játssza-e vagy „gép”. Egyedül akkor fog gyanút az ember, ha két ugyanolyan hang van egymás után, mivel egy hangot egy ember kétszer pontosan ugyanúgy nem tud megszólaltatni. Ilyen esetben „csalni” kell, például ezrelékekkel kell módosítani a hangerőt vagy valamilyen egyéb paramétert.

 

Másik alanyunk inkább szkepticizmusának adott hangot. Kiemelte, hogy például a túlillesztés veszélyével is számolni kell, amely azt jelenti, hogy az algoritmus esetlegesen mindösszesen visszajátszik teljes Bach fordulatokat, és ezt egy laikus, aki nem ismeri hangról hangra a Bach-darabokat, nem fogja észrevenni. Kérdés tehát, hogy ezek a vélemények kiktől származnak. Amennyiben zeneszerető laikusok vélekednek ily módon, az kérdéseket vet fel. Másik kérdés az adatbázis témaköre: rengeteg mintát kell bevinni a rendszerbe, hogy ez működőképes legyen.

 

Az AI jövője kapcsán számos nézet létezik. Egyes vélemények szerint a jövőben születhetnek olyan algoritmusok, amelyek már nem problémaspecifikusak lesznek, és felül fogják múlni az embereket. Ez a félelmetes jövő. Másik vélemények szerint igazából körülbelül kétszáz év, mire ide eljutunk, és az AI igazából mindig csak arra lesz jó, hogy a tanítómintát visszajátssza, és így nem fogja az embert soha kiváltani, mert csak egy jó utánzó lesz az AI. Ez két külön nézet, hogy ezek közül melyik teljesül be, azt nem tudhatjuk, csak tippek vannak. Annyit viszont megállapíthatunk, hogy a következő néhány évben biztosan nem helyettesíti a zeneszerzőket a mesterséges intelligencia. A többi pedig majd kiderül.

 

Összegző gondolatok

A mesterséges intelligencia megjelenése a zene világában igen megosztó: sokan a lehetőséget és az ebben rejlő potenciált emelik ki, míg mások inkább kételyeiket fogalmazzák meg a téma kapcsán. Interjúalanyaim az AI-zeneszerzés kapcsán a legnagyobb lehetőséget a zenei paletta „színesítésében”, a reklám- és filmipar kiszolgálásában, valamint az oktatási célokra történő felhasználásban látják: a mesterséges intelligencia elősegítheti az improvizációs készség fejlesztését, ötleteket adhat a tanulónak, hogy az adott harmóniasort hogyan gazdagíthatná, vagy akár lehetőséget nyújthat az együttzenélésre is.

Az edukációs célok mellett zenei kíséret előállításban is relevánsak lehetnek az AI által nyújtott lehetőségek. A fő kihívás a tanítóminta és az adatbázis összeállításában rejlik; a mennyiségen túl pedig a változatosság is kulcskérdés, illetve fontos a feljátszott motívumok kapcsán a zenei építkezés is (az egyik motívum a másikra épüljön).

 

Gyakran megjelenő aggály a mesterséges intelligencia kapcsán, hogy „elveszi az ember munkáját”, és idővel nem lesz szükség az emberi „munkaerőre” akár a zene szektorában sem. Előfordulhat, hogy a szoftverek válnak a jövő zeneszerzőivé? Interjúalanyaim pozitívabb képet fest a helyzetről. Nagyon izgalmasnak látják, hogy zenei összefüggéseket hogyan tud egy szoftver megragadni, és hogy ebből valóban ki lehet hasonló dolgokat hozni, mint amire egy ember képes, azonban véleményük szerint a következő néhány évben biztosan nem helyettesíti a zeneszerzőket a mesterséges intelligencia, azonban a távolabbi jövő megjósolhatatlan, a technológia ugyanis dinamikusan fejlődik. Egyesek a mesterséges intelligencia térhódítását a zene világában a „lélek nélküli művészet” koraként emlegetik, míg mások a „lehetőségek világaként”, de annyi biztos, hogy a technológiai fejlődés a zene szektorát sem fogja érintetlenül hagyni.

 

*Interjúalanyaim:

A képen szöveg, személy, beltéri látható

Automatikusan generált leírás

Magyari Marcell

szoftverfejlesztő, amatőr zeneszerző és festőművész. Szabadidejében mesterséges intelligencia fejlesztésével is foglalkozik különböző társasjátékokhoz. Néhány műve a YouTube-on megtalálható a saját nevével jelzett csatornán. Zenei stílusa leginkább az amerikai posztminimalista irányzatéhoz hasonlít. 30. születésnapi önálló szerzői estje a Fészek Művészklubban lesz 2022. május 13-án.

 

MAGYARI Marcell - Szimfonikus Költemény (11:20)

Budafoki Dohnányi Zenekar, vezényel a szerző

 

MAGYARI Marcell: Repetitív Ritmus- és Motívummetamorfózis (op. 9) (8:21)

 

Marcell Magyari - Gryningsljus (w/ score) (5:01)

Magyari Marcell: Gryningslius- for solo piano

 

Marcell Magyari (me) plays: Péter Pejtsik: Stonehenge (4:17)

Előadja a gordonkán szerző

 

Marcell MAGYARI - Magic Trick (demo w/ score) (6:38)

Magyar Marcell: Magic Trick for 4 percussionists

 

Út a zenéhez | Németh Zoltán

Németh Zoltán

kilencéves korában kezdett zongorázni, de már akkor is érdeklődött a zeneszerzés iránt. A Bartók Konzervatóriumban a 3. évben vette fel a zongoraszak mellé a zeneszerzést fakultatív módon. A Zeneakadémiára zeneszerzés szakra adta be első helyen a jelentkezését. Saját bevallása szerint „az egyetem során kitágult a zenei világ előttem. Számos gondolatébresztő és inspiratív művel, irányzattal találkoztam, amik segítettek közelebb jutni az egyéni hangvétel megtalálásához.” A mesterszakot és a tanári képzést követően jelenleg egy zeneiskolában tanít zongorát, és korrepetítorként dolgozik. Emellett számos darabon dolgozik, és zongorakoncertet is tervez adni késő tavasszal, Chopin- és Liszt-művekből válogatva. Művei közül fontosnak tartja kiemelni a Concertino for Piano and Orchestra-t, illetve a Bettermann-triót.

 

 

Németh Zoltán: Szonáta (10:59)

Előadja: Boros Tekla (zongora)

(Zeneszerzés verseny, Solti terem, 2017. április 26.)

 

 

Németh Zoltán: Noktürn (2:01)

Előadja: Foskolos Bettina (zongora)

 

 



[1] Szedmák Borbála kutató a Budapesti Corvinus Egyetemen. Közel húsz éve foglalkozik klasszikus zenéléssel, fő kutatási területe a kultúramenedzsment. (borbala.szedmak@uni-corvinus.hu)