Kihívások és lehetőségek a mesterséges intelligencián alapuló
zeneszerzés kapcsán
Magyari Marcell* és Németh Zoltán*
gondolatait összegezte:
Szedmák Borbála[1]
A
digitalizáció az élet minden területén megjelent az utóbbi években, így többek
között a zene világában is teret hódított: számos platform segíti elő az
élő koncertközvetítést, együttzenélést, a szektor
különböző szereplői közötti kapcsolatépítést, applikációk támogatják
a zenetanulást, „robotkarmesterek” vezénylik esetenként a zenekarokat, illetve
megjelentek a mesterséges intelligencián (AI) alapuló
„zeneszerző-szoftverek” is. Korábbi cikkeimben részletesen bemutattam
ezeket, valamint recenzió formájában is értékeltem a jelenséget. Jelen cikkben
pedig két fiatal zeneszerző segítségével vizsgálom a kérdéskört, és próbálok
választ adni az alábbi kérdésekre: Valós félelem lehet a zene világában is az a
nézet, hogy a különböző, a mesterséges intelligencián alapuló
„zeneszerző-szoftverek” elveszik az emberek munkáját? Előfordulhat,
hogy évek múlva már nem lesz szükség zeneszerzőkre, és egy „gép” képes
lesz akár a kreatív folyamatokban is részt venni? Milyen előnyök,
lehetőségek, valamint kihívások, korlátok azonosíthatók az AI zeneszerzés
kapcsán?
A
mesterséges intelligencia zenében történő felhasználása az elmúlt években
dinamikus növekedésnek indult. Megjelentek különböző zeneszerző
programok, amelyek milliók számára tették lehetővé, hogy zeneszerzővé
váljanak mindenféle előképzettség nélkül: csupán a stílust, tempót és a
hangulatot kell megadniuk, és a program pillanatok alatt generál egy egyedi
zeneművet. Némelyik alkalmazás és zenemű annyira jól sikerült, hogy
fogyasztói tesztek során a hallgatók (akár szakavatott fülek) sem tudták
megkülönböztetni, hogy melyik Bach és melyik a mesterséges intelligencia
szerzeménye. A mesterséges intelligencia akár olyan zeneművek születését
is elősegítheti, amelyek teljesen újszerű hangzásvilággal
rendelkeznek. Egy zenekar például az első Grammy jelölését is a
mesterséges intelligenciának köszönheti: ezt alkalmazva készíteni tudott egy
olyan zeneművet, amely szakított az addigi hangzásvilággal.
Egyesek
szerint a mesterséges intelligencia a művészet végét jelenti, mások
azonban az ebben rejlő lehetőségeket emelik ki, hiszen – korábbi
cikkünkből idézve -, „amennyiben nem használjuk ki a technológia által
nyújtott előnyöket, a lehetőségek el fognak menni mellettünk” (A
klasszikus zene „társkereső” platformjai, ZeneKar,
28 évfolyam, 2. szám). Gyakori félelem a gépekkel, robotokkal szemben, hogy
elveszik az emberek munkáját – vajon ez igaz lehet akár zeneszerzőkre is?
Előfordulhat, hogy akár érdekesebb vagy „jobb” zenét készít egy
alkalmazás, mint egy zeneszerző? Korábbi cikkemben (A mesterséges
intelligencia megjelenése a zenei szektorban, ZeneKar,
28. évfolyam, 3. szám) néhány, a mesterséges intelligenciára épülő,
innovatív megoldást mutattam be a zene világában. Jelen cikk során célom, hogy
a mesterséges intelligencia alkalmazásában rejlő potenciált zeneszerzők
véleményét megismerve vizsgáljam. Interjúalanyaimat, Magyari Marcellt és Németh
Zoltánt a mesterséges intelligencián alapuló zeneszerzés kapcsán kihívásokról,
lehetőségekről, valamint a jövővel kapcsolatos meglátásairól
kérdeztem.
Az,
hogy valamilyen algoritmus alapján zene készül, nem újszerű, már a
középkorban algoritmusok szerint énekelték a szöveget: az algoritmus
szabályozta, hogy melyik magánhangzó milyen hang. Az érdekes kérdés az, hogy a
mesterséges intelligencia tud-e döntést hozni. Az említett példa
determinisztikus algoritmus, amely azt jelenti, hogyha ugyanazt a szöveget
„betáplálom”, akkor ugyanazt a dallamot fogom kapni. Az lesz a „jó”
zeneszerző alkalmazás, amely nem ugyanazt fogja visszaadni ugyanarra az
inputra; lesz benne variációs lehetőség: ha kétszer lefuttatja az ember az
algoritmust egy adathalmazra, akkor nem ugyanazt fogja visszakapni. Van tehát
benne „véletlenszerűség”, a programozási szaknyelvvel élve heurisztika: az
algoritmus valamilyen szempontrendszer alapján dönt, és nem mindig ugyanúgy
dönt. Az érdekes kérdés az, milyen heurisztikus gondolatokat lehet beültetni
egy algoritmusba, és mitől lesz „emberi” egy ilyen döntés. Ha például van
egy dallam, amely folyamatosan megy fölfelé akkor
mikor jön el az a pont, amikor egy ember már úgy érzi, hogy már „irányt kéne
változtatni”, és lefele kellene mennie a dallamnak. Ez persze csak egy példa,
rengeteg hasonló kérdés említhető ennek kapcsán. Hogyan taníthatjuk meg a
programnak azt, hogy hogy milyen döntéseket kell hozni, és hogy ez mitől
lesz emberi? Akár a machine learning
alapján működő, legerősebb sakkgépek példáját vizsgálva
megállapíthatjuk, hogy nagyon nagy nehézség nincs ebben. Kellő ideig kell
„futniuk”, ezalatt megértik a sakkjátszmákat, hogy mi miért alakult úgy, ahogy,
a kielemzett játszmákból pedig szabályokat hoznak létre. Ennek kapcsán
legnagyobb kihívás az az, hogy szükség van adatbázisra; adatok nélkül nincsen
AI. Ehhez első lépésként össze kell állítani egy tanítómintát. Persze
kihívás a szakmai rész is, hogy az adatra hogyan építünk, az algoritmus hogyan
fog tanulni, de az első lépés mindenképp a tanítóminta összeállítása. Ez
tulajdonképpen ahhoz hasonlítható, hogy a képfelismerő algoritmusokat úgy
„edzik”, hogy nagyon sok képet mutatnak neki. Itt a képek helyett zenei
mintákat kell mutatni a „gépnek”. Ezt követően egy olyan algoritmusra van
szükség, amely ezen a tanítómintán megy végig, a tanítóminta sajátosságait,
összefüggéseit pedig a gép megtanulja, tehát például melyek azok a hangok, amelyek
egy adott zenei környezetben jellemzően előfordulnak, és melyek azok,
amelyek kevésbé. Ha ez a tanítóminta nem kellően gazdag, akkor például a
zenei építkezés, az, hogy az egyik motívum a másikra épüljön, hiányozni fog.
Kicsit olyan ez, mint egy chatbot. Ha felteszünk egy kérdést, amire a chatbot
válaszol, akkor úgy tűnik, mintha ember lenne, de aztán ha felteszünk egy
következő kérdést, akkor annak a válasznak már semmi köze nincs az
előzőhöz. Ha a tanító-adatbázis nagyobb, illetve a mögötte lévő
AI algoritmus is jóval összetettebb, akkor nagyobb potenciált lát egyik
alanyunk a témában. A tanítóminta összerakása a legnehezebb, hogy az változatos
legyen eléggé. Nagyon fontos az AI kapcsán, hogy mennyi adat áll rendelkezésre,
és ha nagyon tág a fókusz, akkor hatványozottan nő a mennyisége az
adatnak, amely szükséges. Egyik alanyunk szavaival élve „adatok kellenek, ha
nincsenek adataink, akkor nem lehet csodát létrehozni”. Technikai kihívással is
szembesül a „szerző” egy ilyen program kialakítása során. Például előfordulhat,
hogy az adott mintát „túltanulja” algoritmus, amely azt jelenti, hogy például
egy A és egy G hang után mindig egy F-et fog játszani,
mert a tanítómintában az F hang felül volt reprezentálva. Persze arra is
figyelni kell, hogy a tanítóminta összeállítása során olyan mintákat kell
„betáplálni”, amelyek azonos zenei környezetben vannak; muszáj zenei
kontextusban gondolkozni. Fontos tehát, hogy az AI programozás mellett a
zenéhez is értsen az ember, ha egy ilyen programot szeretne összerakni. Ez meglehetősen
ritka, azonban egyik alanyunk, Magyari Marcell ékes példája a két terület
összefonódásának, így segítségével betekintést nyerhettünk a technológiai
szempontokba is.
Ennek
az ellentétje az, amikor mi, „emberek” beállítunk paramétereket, skálaszabályokat,
amelyek alapján az algoritmus számol, kiértékel, és döntést hoz. Ebben az
esetben az emberi behatás is szerepet játszik; nem a statisztika, hanem a
beállítások alapján működik a gép. Ez két külön irányzat, mindkettő
tud működni. Zeneszerző programok esetében is értelmezhető a két
irány: ha valaki kielemzi Bach összes fúgáját, valószínűleg tud írni egy
újabb fúgát, amely olyan lesz, mint Bach összes fúgájának az átlaga. Ez az
egyik irány. A másik pedig, különböző szabályrendszereket hozunk létre, és
azok eredményeznek valamilyen hangot vagy eseménysorozatot. Az algoritmikus
zeneírást képviselik például a new complexity zeneszerzők is: rengeteg matematikai
adatból dolgoznak, a darabjaik valamilyen algoritmuson alapulnak, amelyet le
lehet írni matematikailag is. Ami fontos, hogy milyen Hz-en és mennyi ideig
szóljon egy hang, és aztán azt valamilyen módon meg kell hangszerelni. Ez nem
annyira sok adat.
További
érdekes téma a szerzői jogok kérdésköre. Ha valaki készít - kódol - egy
programot, amely „random” elemek nélkül, determinisztikus módon „kiad” egy
dallamot, akkor a program készítője a „zeneszerző”. Ebben az esetben,
ha valaki elindítja a programot, mindig ugyanazt fogja visszakapni, ugyanazon
szabályok alapján. De kérdés, hogy mi a helyzet akkor, ha egy felületen
megadhat a felhasználó paramétereket (például stílus, hangulat, akkordszerkezet
stb.), amelyek alapján elkészül a „zenemű”. Ez már valószínűleg
inkább a felhasználó „szerzeménye”, de nagyon sokrétű ez a kérdés. A határ
talán az input-output mennyiségében keresendő. Ha például vesszük az Ableton (szoftver) példáját, akkor az alábbi történik: a
felhasználó MIDI adatot, hang-könyvtárat „táplál be”, a program pedig
visszaadja azt, tehát technikailag az Ableton egy
hangszer. Tulajdonképpen úgy működik, mintha „leütne egy hangot” a
felhasználó – éppúgy, mint a zongora klaviatúráján. Érdekes kérdés, hogy egy
ilyen program mikor hangszer, és mikortól valamilyen „entitás”, amely terméket
állít elő. Az említett szoftver egy olyan hangot fog visszaadni és olyan
hosszan, amilyen hosszan azt „leütötte” a felhasználó - tehát ez egy egy az egyhez reláció. De ha a program egy „leütött”
billentyű esetében több hangot ad vissza azok alapján, hogy milyen hosszan
és milyen erősen ütötte le a felhasználó a billentyűt, akkor ez már
közelít a zeneszerzéshez. Minél bonyolultabb egy algoritmus és minél több az
input, annál inkább lesz ez egy zeneszerzési módszer, mert akkor már nem egy
hangot fog visszaadni a program, hanem sokat, amelyekből már lehet aztán
építkezni.
Ha
a „zeneszerző-program” közel ugyanazt fogja visszaadni mindig ugyanazon
szabályok alapján, és a felhasználónak nincsen „belenyúlása” sehol, akkor a
szoftveré az „érdem”. Interjúalanyaim egyetértettek abban, hogy amennyiben van
„belenyúlási” lehetőség, akkor már inkább egy „hangszerelő géphez”
hasonlíthatjuk a programot. Ekkor – mivel a felhasználó határozta meg a
paramétereket - az ő tulajdona lesz az elkészült zenemű, mert azt
senki más nem készítette el korábban ugyanúgy, ugyanazokkal a paraméterekkel.
Vélhetően senki nem fogja tudni azt megállapítani, hogy egy „ember” vagy
egy „gép” írta a zenét. Fejlesztői oldalról a program az, amely
levédhető, ha azonban ezt a fejlesztők közzéteszik, akkor - alanyaim
szerint - a produktum, amely a segítségével készül, már a felhasználóé. Ha
egyébként nagyon bonyolult, amit visszakap a felhasználó, és sok benne a
véletlenszerű elem, akkor tulajdonképpen a kérdésfelvetés is teoretikus:
sosem nem lesz ugyanolyan a „zenemű”, mint amit más akarna levédetni.
Persze ez stílusfüggő is: a barokk stílusban sokkal kevesebb lehet a
„random” elem, kevesebb az opció, döntési lehetőség, így elég hamar el
lehet jutni oda, hogy nem elég bonyolult a heurisztika, és a mesterséges
intelligencia duplikálni fogja a korábban már „megkomponált” művet. Ebben
az esetben előállhat az, hogy olyat sikerül létrehozni, amit már esetleg
valaki létrehozott, vagy legalábbis részleteiben.
Gyakori
félelem a „gépek” kapcsán, hogy azok elveszik az emberek munkáját.
Felvetődik a kérdés, hogy ez a zene világára is értelmezhető-e:
előfordulhat, hogy a mesterséges intelligencián alapuló zeneszerző
szoftverek elveszik a zeneszerzők munkáját? Lehet, hogy néhány év múlva
nem lesz akár szükség zeneszerzőkre? Alanyaim egyetértettek abban, hogy ez
a jövőkép nemhogy nagyon távoli, de nem is reális. Az iparosodás példáját
nézve láthatjuk, hogy ugyan kevesebb szövő emberre volt szükség, de aztán
őket felvette az ipar máshogy. A példát a zeneszerzőkre értelmezve
előfordulhat tehát a zeneszerző-szoftverek felfutásának eredményeképp,
hogy kevesebb zeneszerzőre lesz szükség a hagyományos értelemben, azonban
a szoftverfejlesztő ipar valamilyen módon „fel fogja szívni” őket.
Ezzel együtt nem tartják alanyaim valószínűnek, hogy ez a
közeljövőben bekövetkezne. Nagyon nehéz kérdés ugyanis, hogy mitől
lesz emberi a zeneszerzés, az érzelmek, gondolatok hogyan tudnak megjelenni. A
kortárs zene a new complexity
irányzattal már elment abba az irányba nagyon régen, hogy már most sem emberi
az a zene, amelyet írunk. Ez azt jelenti, hogy amennyiben kellően
„bonyolultat” kérünk a géptől, akkor azt nem lehet megkülönböztetni
technikailag egy Ferneyhough-darabtól. Ez valahol a
szépsége is a szerializmusnak. A fő probléma,
kérdés ezzel kapcsolatban az, hogy hol az érzelem a darab mögött; mit fejez ki
az a zene, amelyet egy gép ír. Ugyanazért, ugyanúgy nem tudja egy gép megírni
az adott darabot, mint egy ember, de túlmisztifikálni sem szabad a mögöttes
gondolatok szerepét: egyik alanyunk szavaival élve „ezek valójában csak
hangjegyek”. Továbbá az érzelmeket is „hozzá lehet rakni” a gépi zenéhez is:
megtanítható a „gép”, hogy mit jelent zenei nyelven olyan érzelemben
kommunikálni, amelyet a felhasználó kér. Az „extra-muzikális” elemek azok,
amelyeket valószínűleg nehezebben lehet integrálni. Ilyen például, amikor
egy hang vagy egy fordulat mögött a 20. századi zenében valakinek a neve
„rejlik”, hangjegyekbe kódolva - de ezeket leggyakrabban észre sem veszi a
zenehallgató.
Egy
gép tehát előállíthatja ugyanazokat a hangsorokat, dallamokat, és így tulajdonképpen
nem lehet különbséget tenni a „gép” és az „ember” alkotása között. A nagy
nehézség sokkal inkább az előadásban rejlik. Rengeteg a nehezen
számszerűsíthető, nehezen „megfogható” faktor a zenélésben. Egy
hegedű esetében fontos tényező, hogy például mennyi gyanta van a
vonón, mennyire kell erősen nyomni a vonót ahhoz, hogy az ne recsegjen be,
de közben azért kellően hangosan szólaljon meg a hang. Ez csak néhány
példa, amelyek mellett rengeteg hasonló faktort kell figyelembe venni. Egy embernek
ez érzésre megy, azonban a gépnek ezt matematikailag kell definiálni. Alanyaim
szerint azonban idővel biztosan el fog jönni ennek a kora, és majd lesznek
olyan zenekarok, amelyekben csak robotok játszanak. De ettől függetlenül
továbbra is lesznek olyan zenekarok is, ahol ugyanúgy emberek fognak zenélni.
Tehát a mesterséges intelligencia potenciális térnyerésével csak felszabadul
erőforrás, amelyet más területen lehet kamatoztatni.
Ha
egy „gép” hangsoraiban ugyanolyan zenét tud szerezni, mint egy zeneszerző,
és a megírt művet egy „hús-vér” művész előadja, akkor nem válik
el, hogy melyiket szerezte gép, és melyiket ember. De kérdés, hogy ez „baj-e”.
Alanyaim szerint egyáltalán nem, hiszen nagyon gyakran egy darabot azért
hallgatunk, mert az írta, akit hallgatni akarunk, vagy pedig egy adott stílusú
zenét szeretnénk hallgatni. Ha az számít, hogy ki írta, akkor nem azt nézzük,
hogy mi a darab - persze van egy elképzelésünk arról, hogy mit fogunk hallani.
Ha azonban egy lejátszási listát szeretnénk kreálni adott stílusú dalokkal,
akkor meg az nem számít, hogy ki írta a művet, csak legyen valami olyasmi,
mint amire éppen vágyunk. Tehát felhasználóként – hallgatóként - valójában nem
számít, hogy az, amit hallgatunk, gép vagy ember kompozíciója-e.
Alanyaim
kiemelik, hogy a zeneszerzőknek már jelenleg, a mesterséges intelligencia
kapcsán feszegetett kérdésektől függetlenül is nehéz kiemelkedniük, hiszen
rengeteg jó zeneszerző van; mindenki inkább a mikrokörnyezetében tud
érvényesülni. Napjainkban nincsenek „nagyon nagy zeneszerzők”, hanem
nagyon sok „kis zeneszerző” van, akik „nagyon nagyokat” tudnak alkotni,
csak nem kapnak akkora visszhangot sehol, mert a világ minden táján megvan a
saját mikro- kultúra és ott érvényesülnek, nem pedig a
nagy térben. Alapvetően a zeneszerzőknek tehát nem a
zeneszerző-szoftverektől kell félniük, hanem mindenki mástól, a
„vetélytársaktól”.
A
zeneszerző programoknak jellemzően nagyon szűk a felhasználási
körük. Például, ha valaki filmzenét szeretne a filmjéhez, akkor kiváló
választás lehet egy szoftver, amely segítségével néhány kattintással ezt létre
is hozhatja. Az alkalmazott zeneszerzők tehát (akik filmzenékkel,
reklámzenékkel stb. foglalkoznak) előfordulhat, hogy kicsit „nagyobb
bajban vannak”. Ők „egyszerűbb” zenével foglalkoznak, amely szabályrendszerét
könnyebb számszerűsíteni egy gép számára, illetve ezeknek a zenéknek a
felhasználása is más. Ha valaki például egy diplomafilmet készít, és létezik
egy program, amely 10 perc alatt elkészíti hozzá a zenét, akkor azt fogja
igénybe venni, nem fog külön megkeresni zeneszerzőt. A reklámiparban
hasonló a helyzet: a zenemű kiválasztásával, a jogdíjak és az egyéb
adminisztratív intéznivalók rengeteg időt igényelnének, miközben a gép egy
pillanat alatt „kidob” egy hasonló hangulatú zenét, mint amit szerettünk volna.
A
mesterséges intelligencián alapuló zeneszerzés további felhasználási területe
lehet a zeneszerzők továbbfejlesztése is. Érdekes lenne kielemezni, hogy
mikor, hol, miért, milyen döntést hozott a „gép”. Ez rámutathat új elemzési
szempontokra, tanulhat a szakma valami újat, vagy találhat egy új irányt vagy
egy új fordulatot, hangszerösszeállítást. Eszerint tehát az ember tanulhatna a
géptől egy idő után. Ehhez szintén jó analógia a sakkgépek példája:
ma az összes sakkmester gépek segítségével tanulja a játékot. Egyes versenyeken
random állásból indul el a játék, és mindenki kap 15 percet, hogy elemezze az
állást. Ilyenkor a gép mondja meg sokkal hatékonyabban és eredményesebben, hogy
mi az a stratégia, amelyet követni érdemes.
A
mesterséges intelligencián alapuló zeneszerzés oktatási célokra történő
felhasználásában egyesek nagyobb, míg mások kisebb potenciált látnak. Abban
egyetértettek interjúalanyaim, hogy amennyiben a program elég fejlett lesz,
akkor alapvető zeneszerzési elveket meg lehet vele tanítani, de kérdés,
hogy ez mennyiben „ad többet” a diáknak, mintha valódi darabokat, élő
példákat elemezne, és megvizsgálná, hogy mitől „működik” az adott
fordulat.
Egyesek
az esztétikai funkciót háttérbe szorítva inkább abban gondolkodnak, hogy például,
ha valaki improvizálni tanul, és elakad, akkor a gép segíthetne, hogy mi
lehetne a következő hang. Vagy például a tanuló és a gép váltogathatja is
egymást: játszik valamit a diák, amit kiértékel a gép, és erre reagálva egy
következő körben a gép játszik, majd megint a diák és így tovább. Persze
ehhez fontos, hogy valós idejű reakciókra képes legyen a gép. Továbbá
például osztályozhatná a diák által lejátszott dallamokat: definiálhatná, hogy
azok a tanítómintához képest mennyire egyszerűek vagy bonyolultak,
valamint tippeket adhatna, hogy kezdő zongoristaként például, ha egy adott
hangot belerakna a diák, akkor azzal tovább tudná vinni vagy bonyolítani,
izgalmasabbá tenni a játékát. Tehát korrigálhatna, ötleteket adhatna, illetve
közös zenélésre is alkalmas lehet, hiszen akinek nincsen lehetősége arra,
hogy a barátaival zenéljen, annak kiváló alternatívát nyújthatna. Persze ennek
nem professzionális szinten, hanem inkább az alapfokú zenetanulásban lehet helye.
Alanyaim
hangsúlyozták, hogy ugyan elképzelhető, hogy idővel ez teret hódít,
azonban együtt zenélni mindig érdekesebb lesz egy valódi emberrel. Sokkal
élvezetesebb a közös zenélés és a tanulás is „élőben”. Közös improvizáció
során gyakran nem is feltétlenül a másik játékára, zenéjére, hanem magára az
élő emberre reagál a zenész. Persze lehetnek olyan helyzetek – mint
például a COVID-19 okozta bezárások -, amikor hasznos lehet a zenét tanulóknak,
hogy együtt tudnak játszani egy programmal, amely nem mindig ugyanazt csinálja,
vagy ha egyéb okból kifolyólag valakinek nincsen rá lehetősége, hogy
emberrel zenéljen, akkor is jó opció lehet. Vannak tehát felhasználási
lehetőségek az oktatásban is, azonban egyes vélemények szerint azért nem
valószínű, hogy az oktatás fő irányát ez jelentené. Az otthoni
gyakorlást esetleg érdekesebbé teheti, hiszen így a diák nem a szoba négy
falának játszik, hanem kap egy „partnert”, „aki” válaszolgat, de alanyaim
egyelőre ennek csak marginális szerepet tulajdonítanak.
Az
edukációs célok mellett zenei kíséret előállításban is relevánsak lehetnek
az AI által nyújtott lehetőségek. A kilencvenes években terjedtek el a
kíséret-automatikával rendelkező szintetizátorok, amelyek jellemzően
mindig ugyanazokat az ütemeket ismételték. Egy ilyen kíséret-automatikát
AI-al magasabb szintre lehetne emelni, és így nem
ugyanazt a 3 akkordot játszaná végig, hanem megfelelően variálná ezeket,
sőt, ha játszik a zenei kíséretre a zenész, akkor még reagálhatna is arra.
A
mesterséges intelligencián alapuló zeneszerzés további előnye az, hogy
„szélesedik a skála”, azaz létrejön egy új irányzat. Alanyaim szerint bizonyára
lesznek majd olyan zeneszerzők, akik ilyen programokkal fognak zenét
generálni, és közülük is ki fognak emelkedni kiválóságok, a „szakma”
legmagasabb fokú művelői. Egy új irányzat kialakulása mindig érdekes
jelenség és további tanulásra ad lehetőséget. Egyik alanyunk szavaival
élve „rosszabb nem lesz tőle az iparnak, inkább más lesz, ami nem
feltétlenül baj”. Mint minden művészeti ágban, a zenében is az a
jellemző, hogy attól, hogy megjelenik egy új irányzat, nem lesz az
előző kevésbé fontos, hiszen mindennek megvan a rajongótábora.
„Attól, hogy megjelenik valami új, nem tűnik el automatikusan a régi.”
A
mesterséges intelligencián alapuló zeneszerzés könnyűzenében történő
felhasználásáról megoszlanak a vélemények. Abban egyetértenek a szakértők,
hogy például rockzenét sokkal könnyebben lehet generálni az egyszerűbb
szerkezet és a műfajra jellemző korlátok miatt. Az AI könnyedén képes
lehet kiváló popslágereket írni, ezek esetében ugyanis a cél a nagyon
könnyű befogadás és az, hogy minél könnyebben az „ember fülébe másszon a
dal”. Gyakran hallható, hogy az a legjobb popzene, amely 90 %-ban ismert
fordulatokra épül, és nagyjából 10 %-ban van benne valamilyen csavar, de azért
a legtöbb popzene még csavar nélkül is teljesen jól működik, néhány akkordra
építve. Azonban a populáris zenében még nagyobb szerepet kap a
dalszerző-előadó személyisége, a dalok „háttértörténete”.
Technikailag tehát a könnyűzenében könnyebb lenne implementálni a
„gépeket”, de valószínűleg nem lenne akkora sikerük, mert a popegyütteseket
jellemzően azért hallgatják az emberek, mert azonosulni tudnak velük és a
képviselt életérzéssel. Persze ha nem tudják, hogy az adott zenemű „gép”
szerzeménye, akkor valószínűleg könnyebben azonosulnak a dallal, azonban
elidegenítőleg hathat, ha kiderül, hogy egy „gép” generálta a dallamot és
a szöveget. A komolyzenei réteg ilyen értelemben sokkal kísérletezőbb.
Egyik alanyunk szavaival élve „furcsa kettősség” jellemzi a klasszikus
zenét: egyfelől jelen van a konzervativizmus, másfelől viszont
„folyamatosan feszegeti a saját határait”.
Más
vélemények szerint viszont akár a klasszikus, akár a könnyűzene oldaláról
vizsgáljuk a kérdést, a zeneszerzésnek nem az a célja sosem, hogy meglévő
sémákat hasznosítsunk, hanem az, hogy úgy fejezzünk ki érzelmeket, ahogy eddig
más nem. A kérdéskört egyrészt megközelíthetjük a „laikusok” szemével, másrészt
pedig értelmezhetjük a jelenséget zeneszeretőként, zenerajongóként,
illetve zenészként. Szenzációként értelmezve ez egy nagyon izgalmas dolog, hogy
zenei összefüggéseket (például melyik hang fordul elő gyakrabban, milyen
zenei környezetben stb.) hogyan tud egy szoftver megragadni, és hogy ebből
valóban ki lehet hasonló dolgokat kihozni, mint amire egy ember képes. De
zeneszeretőként hiányolhatjuk az „emberi oldalt” – bármilyen műfajról
is beszélünk.
Hallgatóként
az „emberi oldal” azonban nem mindig olyan egyszerűen érzékelhető,
azonosítható. A cikk elején említett Bach-példa kapcsán beszélgettünk
szakértőinkkel arról is, hogy szerintük mennyire reális az, hogy egy, a
mesterséges intelligencián alapuló zeneszerző szoftver olyan
zeneműveket képes írni, amelyet akár könnyedén össze lehet keverni Bach
műveivel. Egyikük kiemelte, hogy sok esetben „árulkodó jel”, hogy a
zeneszerző szoftver darabjait jellemzően a szoftvernek a
lejátszójával játsszák fel, ami nyilván nem veszi figyelembe a dinamikát,
művészi szempontokat. Tehát az előadás nagyon le van „butítva”
sokszor. Persze ebben nagyon nagy fejlődés figyelhető meg az utóbbi
időben, számos olyan VST érhető el, amelyeknél élő hangszerrel
vették föl a hangokat, így nem lehet könnyen megkülönböztetni, hogy az adott
hangot ember játssza-e vagy „gép”. Egyedül akkor fog gyanút az ember, ha két
ugyanolyan hang van egymás után, mivel egy hangot egy ember kétszer pontosan
ugyanúgy nem tud megszólaltatni. Ilyen esetben „csalni” kell, például
ezrelékekkel kell módosítani a hangerőt vagy valamilyen egyéb paramétert.
Másik
alanyunk inkább szkepticizmusának adott hangot. Kiemelte, hogy például a
túlillesztés veszélyével is számolni kell, amely azt jelenti, hogy az
algoritmus esetlegesen mindösszesen visszajátszik teljes Bach fordulatokat, és
ezt egy laikus, aki nem ismeri hangról hangra a Bach-darabokat, nem fogja
észrevenni. Kérdés tehát, hogy ezek a vélemények kiktől származnak. Amennyiben
zeneszerető laikusok vélekednek ily módon, az kérdéseket vet fel. Másik
kérdés az adatbázis témaköre: rengeteg mintát kell bevinni a rendszerbe, hogy
ez működőképes legyen.
Az
AI jövője kapcsán számos nézet létezik. Egyes
vélemények szerint a jövőben születhetnek olyan algoritmusok, amelyek már
nem problémaspecifikusak lesznek, és felül fogják múlni az embereket. Ez a
félelmetes jövő. Másik vélemények szerint igazából körülbelül kétszáz év,
mire ide eljutunk, és az AI igazából mindig csak arra lesz jó, hogy a
tanítómintát visszajátssza, és így nem fogja az embert soha kiváltani, mert
csak egy jó utánzó lesz az AI. Ez két külön nézet, hogy ezek közül melyik
teljesül be, azt nem tudhatjuk, csak tippek vannak. Annyit viszont
megállapíthatunk, hogy a következő néhány évben biztosan nem helyettesíti
a zeneszerzőket a mesterséges intelligencia. A többi pedig majd kiderül.
Összegző
gondolatok
A
mesterséges intelligencia megjelenése a zene világában igen megosztó: sokan a
lehetőséget és az ebben rejlő potenciált emelik ki, míg mások inkább
kételyeiket fogalmazzák meg a téma kapcsán. Interjúalanyaim az AI-zeneszerzés
kapcsán a legnagyobb lehetőséget a zenei paletta „színesítésében”, a
reklám- és filmipar kiszolgálásában, valamint az oktatási célokra történő
felhasználásban látják: a mesterséges intelligencia elősegítheti az
improvizációs készség fejlesztését, ötleteket adhat a tanulónak, hogy az adott
harmóniasort hogyan gazdagíthatná, vagy akár lehetőséget nyújthat az
együttzenélésre is.
Az
edukációs célok mellett zenei kíséret előállításban is relevánsak lehetnek
az AI által nyújtott lehetőségek. A fő kihívás a tanítóminta és az adatbázis
összeállításában rejlik; a mennyiségen túl pedig a változatosság is kulcskérdés,
illetve fontos a feljátszott motívumok kapcsán a zenei építkezés is (az egyik
motívum a másikra épüljön).
Gyakran
megjelenő aggály a mesterséges intelligencia kapcsán, hogy „elveszi az
ember munkáját”, és idővel nem lesz szükség az emberi „munkaerőre” akár
a zene szektorában sem. Előfordulhat, hogy a szoftverek válnak a jövő
zeneszerzőivé? Interjúalanyaim pozitívabb képet fest a helyzetről.
Nagyon izgalmasnak látják, hogy zenei összefüggéseket hogyan tud egy szoftver
megragadni, és hogy ebből valóban ki lehet hasonló dolgokat hozni, mint
amire egy ember képes, azonban véleményük szerint a következő néhány évben
biztosan nem helyettesíti a zeneszerzőket a mesterséges intelligencia,
azonban a távolabbi jövő megjósolhatatlan, a technológia ugyanis
dinamikusan fejlődik. Egyesek a mesterséges intelligencia térhódítását a
zene világában a „lélek nélküli művészet” koraként emlegetik, míg mások a
„lehetőségek világaként”, de annyi biztos, hogy a technológiai
fejlődés a zene szektorát sem fogja érintetlenül hagyni.
Magyari Marcell
szoftverfejlesztő,
amatőr zeneszerző és festőművész. Szabadidejében
mesterséges intelligencia fejlesztésével is foglalkozik különböző
társasjátékokhoz. Néhány műve a YouTube-on megtalálható a saját nevével
jelzett csatornán. Zenei stílusa leginkább az amerikai posztminimalista
irányzatéhoz hasonlít. 30. születésnapi önálló szerzői estje a Fészek
Művészklubban lesz 2022. május 13-án.
MAGYARI
Marcell - Szimfonikus Költemény
(11:20)
Budafoki Dohnányi Zenekar, vezényel a
szerző
MAGYARI Marcell: Repetitív Ritmus- és Motívummetamorfózis (op. 9) (8:21)
Marcell
Magyari - Gryningsljus (w/ score) (5:01)
Magyari Marcell: Gryningslius- for solo piano
Marcell Magyari (me) plays: Péter Pejtsik: Stonehenge (4:17)
Előadja a gordonkán szerző
Marcell
MAGYARI - Magic Trick (demo w/ score) (6:38)
Magyar Marcell: Magic Trick for
4 percussionists
Németh Zoltán
kilencéves korában
kezdett zongorázni, de már akkor is érdeklődött a zeneszerzés iránt. A
Bartók Konzervatóriumban a 3. évben vette fel a zongoraszak mellé a
zeneszerzést fakultatív módon. A Zeneakadémiára zeneszerzés szakra adta be
első helyen a jelentkezését. Saját bevallása szerint „az egyetem során
kitágult a zenei világ előttem. Számos gondolatébresztő és inspiratív
művel, irányzattal találkoztam, amik segítettek közelebb jutni az egyéni
hangvétel megtalálásához.” A mesterszakot és a tanári
képzést követően jelenleg egy zeneiskolában tanít zongorát, és korrepetítorként dolgozik. Emellett számos darabon
dolgozik, és zongorakoncertet is tervez adni késő tavasszal, Chopin- és
Liszt-művekből válogatva. Művei közül fontosnak tartja kiemelni
a Concertino for Piano and Orchestra-t,
illetve a Bettermann-triót.
Németh Zoltán:
Szonáta (10:59)
Előadja: Boros Tekla (zongora)
(Zeneszerzés verseny, Solti terem, 2017.
április 26.)
Németh Zoltán:
Noktürn (2:01)
Előadja:
Foskolos Bettina (zongora)
[1] Szedmák
Borbála kutató a Budapesti Corvinus Egyetemen. Közel húsz éve foglalkozik
klasszikus zenéléssel, fő kutatási területe a kultúramenedzsment. (borbala.szedmak@uni-corvinus.hu)