milyen paramétereket szeretnénk elemezni, hanem
később is választhatunk. Az is nyilvánvaló evidencia, hogy számos
szoftver áll a kutatók rendelkezésére – egy részük ingyenesen
elérhető, míg mások licenchez kötöttek. A talán leggyakrabban
alkalmazott felvételi és elemző szoftver a Praat (Boersma 2001;
Boersma – Weenink, 2015).
Az akusztikai elemzések példájaként egy, a
hangszalagok működésére visszautaló kísérletből mutatunk be példát.
A 2. ábra felső részén egy spektrogramon egy, a hangszalagok
rezgésének folyamatos emelése, majd ereszkedése (glissando) során
képzett á hang lenyomatát látjuk (Gráczi – Deme, 2011). A
spektrogramon a legalsó vízszintes vonal, a legalacsonyabb
frekvenciaösszetevő az alaphang. Ezen az értéken rezegnek a
hangszalagok az adott időpontban. A magasabb frekvenciaösszetevők a
felhangok. A nyilak azokat a pontokat jelölik, ahol ezek a
folyamatos vonalazódások fodrozódnak, megszakadnak, avagy zajos
összetevő jelenik meg. Ezeken a pontokon olyan frekvenciatartományba
ért a (folyamatosan emelkedő, majd csökkenő) hangszalagrezgés, ahol
vagy a beszélő beszédképző szerveire vagy az ejtett hangra jellemző
sajátrezonanciákon rezgés található, illetve amikor az énekes
regisztert vált, azaz olyan alaphangmagassághoz ér, ahol a
hangszalagok rezgési módját, artikulációs beállításait meg kell
változtatnia, hogy folytathassa az alaphang emelését. Ezeken a
pontokon a hangszalagok működése megzavarodik. Ezt gyakorlott
beszélő/énekes különféle artikulációs stratégiákkal könnyen
feloldhatja. Elemezték a glissando mikrofonos felvételét, hogy a
hangszalagrezgésben történő átmeneti zavarokat (bifurkációkat)
adatolhassák. Azt pedig, hogy mi lehet a jelenség hátterében (azaz
milyen típusú ponthoz ért az alaphang) egyrészt ugyanebből a jelből,
másrészt egy, a nyak gégei részéhez tapasztott gyorsulásmérő
segítségével felvett rezgés regisztrátumaiból elemezték. A 2.
ábra alsó része a felvételi eszközt mutatja, amely hétköznapi
használata során egy gitár-hangszedő. Azaz hagyományos felhasználása
során zenészek használják, míg az eszközfonetika korai
leleményességéhez visszatérve megjelent a mai kutatásokban is. A
működési elve az, hogy a test rezgését alakítja elektromos jellé, és
ezt rögzítik. A felhasználási területe pedig főként a hangszalagok
alatti üregek rezgésének elemzése. Ezeket a rezgéseket a
beszédjelből csak közvetetten nyerhetjük ki az ábrán látható hatások
elemzésével, míg az eszköz használatával rögzíthetjük ezeket a
jeleket is.

2. ábra • Folyamatosan emelkedő, majd csökkenő
alaphangmagassággal ejtett (glissando) á hang ejtésében létrejövő
bifurkációk keskeny- és szélessávú spektrogramon, illetve a
kísérletben használt felvételi eszköz: gitárhangszedő.
A nyilak (1., 2., 4.) a rövid alaphangképzési
zavarokat; a 3. összekötő vonal egy hosszabb artikulációs nehézséget
okozó szakaszt jelöl.
3.3. Percepciós fonetika • A beszédpercepció
vizsgálata is jelentősen támaszkodik a technológia újabb és újabb
vívmányaira. A beszéd akusztikai szerkezete nagymértékben redundáns.
Ez azt jelenti, hogy több olyan akusztikai jegy, jellemző (kulcs) is
megjelenik a normál beszédben, amely segít egy-egy beszédhangról
eldöntenünk, hogy mely fonéma megvalósulása lehet. Egy kérdés lehet
például, hogy a zöngés fonémák (például g, z, zs) képzése során
gyakran hosszabb-rövidebb időre leáll a zöngeképzés aerodinamikai
okok miatt, így részben hasonlóvá válnak zöngétlen párjukhoz (k, sz,
s). Ezekben az esetekben a beszédpercepció számos egyéb akusztikai
jegyet figyelembe véve meg tudja ítélni, melyik mássalhangzó
realizációját hallotta a hallgató. Ilyen jegyek például a konszonáns
saját vagy a megelőző magánhangzó időtartama (a zöngés fonéma
általában rövidebb időtartamban, de hosszabb megelőző magánhangzóval
valósul meg). Jellemző az is, hogy a hangsorban elfoglalt hely
(szünetet követő, azt megelőző, magánhangzók közötti,
mássalhangzó-kapcsolat hányadik tagja) hogyan hat a zönge arányára a
mássalhangzóban. Természetes kommunikációs helyzetben nemcsak a
fonetikai jegyek, hanem a tágabb környezet is hozzájárul a sikeres
azonosításhoz. Ahhoz, hogy felderíthessük az egyes akusztikai
kulcsok szerepét a beszédpercepcióban, a további jegyeket
„semlegesíteni” kell. Azaz például olyan időtartamot megadni, amely
mind a zöngés, mind a zöngétlen mássalhangzóra jellemző lehet, majd
ebben a konszonánsban a zönge arányát változtatni. Ehhez a
„hangsebészet”, azaz a felvett természetes ejtés szoftveres
módosítása (Olaszy, 2003) és a beszédszintézis van a fonetikusok
segítségére. Ezek segítségével előállíthatnak olyan hanganyagot,
ahol csak a kívánt akusztikai jegy tér el (általában skálaszerűen).
Ennek lehallgatása során a kísérleti személy jelöli, mi hangzott el,
majd az adatokból megítélhető, hogy az adott akusztikai kulcs az
elemzett körülmények között hogyan hat a beszédpercepcióra – a fenti
kísérlettel folytatva, például, hogy adott hangsorbeli helyzetben
milyen arányú zöngétől észlelnek zöngés vagy zöngétlen fonémát az
adatközlők (Gráczi, 2013).
Egy másik magyar példa a kiegészítendő
kérdőmondatok dallammenetének észlelésében használta fel a hanganyag
módosításának lehetőségét (Gósy, 1993). A köznyelvi norma alapján
ezen mondatokban a közlés elején található a dallamcsúcs, a dallam
menete pedig ereszkedő. A beszélők azonban gyakran alkalmaznak a
mondat végén az eldöntendő kérdéshez hasonló emelkedő-eső
hanglejtésformát. Az elemzés kimutatta, hogy ugyanazon mondatok
eltérő dallammenettel való megvalósulásakor ez utóbbi formát előbb
azonosítják a hallgatók kérdésként.
A beszédészlelés és a beszédtechnológia eredményei
természetesen egymás számára is felhasználhatóak. A gyermekek
beszédhallásának és -észlelésének vizsgálatához létrehoztak egy
olyan készüléket, amelyben az egyes beszédhangoknak csak az
elsődleges akusztikai kulcsai szerepelnek (Gósy et al., 1987). Azaz
a zöngésséget például csak a zönge képviseli, a magánhangzóról nem
nyújt információt a mássalhangzó szerkezete stb. Ebből következően,
ha a hallgató hallása nem megfelelő az adott frekvencián, vagy a
feldolgozás során nem tudja jól hasznosítani a megfelelő kulcsot, a
lejátszott szó helyett mást (esetleg értelmetlen hangsort) mond
vissza. A szék szó helyett kisebb észlelési vagy hallási probléma
esetében a fék szót fogja ismételni a gyermek, míg súlyosabb esetben
akár a ló vagy ó hangsort azonosítja.
Fordított irányú alkalmazás történt például
szintetizált beszédben a beszédhangok természetesnek megfelelő
időtartamának kialakítására (Olaszy, 1994). A szintetizált szöveg
meghallgatása alapján kellett a kísérleti személyeknek azokat a
hangokat jelölniük, melyeket túl hosszúnak vagy rövidnek éreztek. A
kapott adatok alapján módosították az időtartamokat, majd ismét
percepciós kísérletnek vetették alá az eredményt. Ezzel a módszerrel
a mesterséges beszéd természetességét kívánták növelni.
4. Kitekintés
A jelen tanulmány a fonetika technológiai alapú fejlődésének egy
rövid, nem teljes körű, de remélhetőleg izgalmas, figyelemfelkeltő
bemutatását tűzte ki célul a kezdetektől az eszközfonetikán át
napjainkig. A kezdeti leleményesség, amellyel egyszerű, nem
specifikus eszközök alkalmazásától a korszerű, precíz technológiáig
történő fejlődés, mely minden eszközös tudományra szükségszerűen
jellemző, a beszédkutatásban is megtalálható.
Kulcsszavak: fonetikatörténet, eszközfonetika, beszédkutatás,
nemzetközi és hazai irányzatok
IRODALOM
Balassa József (1887): A magyar hangok
képzése. Stomatoskopikus vizsgálatok alapján. Nyelvtudományi
Közlemények. 21, 121–125.
Balassa József (1900): Újabb phonetikai
irodalom. Nyelvtudományi Közlemények. 30, 121–25.
Balassa János (1908): Magyar
palatogrammok. Magyar Nyelvőr. 37, 470–472.
Boersma, Paul (2001): Praat, a System for
Doing Phonetics by Computer. Glot International. 5, 9/10, 341–345. •
WEBCÍM
Boersma, Paul – Weenink, David (2015):
Praat: Doing Phonetics by Computer [Computer program]. Version
6.0.08 •
WEBCÍM
Bolla Kálmán (1995): Magyar fonetikai
atlasz – A szegmentális hangszerkezet elemei. Nemzeti Tankönyvkiadó,
Budapest
Booth, Jeremy (1997): A Short History of
Blood Pressure Measurement. Proceedings of the Royal Society of
Medicine, 70, 793–799. •
WEBCÍM
Darwin, Erasmus (1803): The Temple of
Nature: or The Origin of Society. Johnson, London •
WEBCÍM
Gombocz Zoltán (1900): A kísérleti
phonetika és a nyelvtanítás. Magyar Paedagógia. 3, 180–187.
Gombocz Zoltán (1908): Magyar
palatogrammok. Nyelvtudományi Közlemények. 38, 193–204.
Gósy Mária (1993): A kiegészítendő
kérdések felismerésének sajátosságai. Magyar Nyelv. 89, 4, 413–424.
Gósy Mária (2004): Fonetika, a beszéd
tudománya. Osiris, Budapest
Gósy Mária – Olaszy Gábor (1985): A magyar
kísérleti fonetika első évtizedei. Nyelvtudományi Közlemények. 87,
109–121.
Gósy Mária – Olaszy G. – Hirschberg J. –
Farkas Zs. (1987): New Method for Audiometry: The G-O-H Measuring
System Using Synthetic Speech. Proceedings of the XIth International
Congress of Phonetic Sciences. Tallinn, 1987. Vol. 4. 185–188.
Gráczi Tekla Etelka (2013): Voiced Part
Ratio and [voice] Identification. Elhangzott: XVIth Summer School of
Psycholinguistics. Balatonalmádi 2013. máj. 25–29.
Gráczi Tekla Etelka – Deme Andrea (2011):
A szubglottális rezonanciák megjelenése az éneklésben. Elhangzott:
XIII. Pszicholingvisztikai Nyári Egyetem. 2011. máj. 22–26.
Hoole, Philip – Nguyen, Noël (1997):
Electromagnetic Articulography in Coarticulation Research.
Forschungsberichte des Instituts für Phonetik und Sprachliche
Kommunikation der Universität München. 35, 177–184. •
WEBCÍM
Kemp, J. Alan (1995): Precursors to Modern
Approaches. In: Koerner, Ernst Frideryk Konrad – Asher, Ron E.
(eds.): Concise History of the Language Sciences. From the Sumerians
to the Cognitivists. Pergamon, Oxford, 371–387. •
WEBCÍM (nem
teljes)
Kempelen Farkas ([1791] 1989): Az emberi
beszéd mechanizmusa, valamint a szerző beszélőgépének leírása.
(Fordította: Mollay Károly) Szépirodalmi, Budapest
Kroos, Christian (2008): Measurement
Accuracy in 3D Electromagnetic Articulography. (Carstents AG500). In
Proceedings of 8th International Seminar on Speech Production.
Straussbourg, 61–64. •
WEBCÍM
MacMahon, Michael K. C. (2013):
Orthography and the Early History of Phonetics. In: Allan, Keith
(ed.): The Oxford Handbook of the History of Linguistics. Oxford U.
P., Oxford DOI: 10.1093/oxfordhb/ 978 0199585847.013.0006 •
WEBCÍM
Olaszy Gábor (1994):
Hangidőtartam-módosító kísérletek a gépi beszéd ritmusának
javítására. In: Gósy Mária (szerk.): Beszédkutatás 1994. Az MTA
Nyelvtudományi Intézete, Budapest, 140–151.
Olaszy Gábor (2003): Az artikuláció
akusztikai vetülete – a hangsebészet elmélete és gyakorlata. In:
Hunyadi László (szerk.): Kísérleti fonetika és laboratóriumi
fonológia 2003. Debreceni Egyetem, Debrecen, 241–254.
Rousselot, Jean-Pierre (1897–1908):
Pricipes de phonétique expérimentale. I–II. Welter, Paris Tome 1:
http://gallica.bnf.fr/ark:/12148/bpt6k5727902b Tome: 2 •
WEBCÍM
Stone, Maureen (2010): Laboratory
Techniques for Investigating Speech Articulation. In: Hardcastle,
William J. – Laver, J. – Gibbon, F. E. (eds.): The Handbook of
Phonetic Sciences. Willey-Blackwell, Oxford, 9–38.
Sweet, Henry (1911): Encyclopedia
Britannica. •
WEBCÍM
Tillmann, Hans G. (1995): Early Modern
Isntrumental Phonetics. In: Koerner, Ernst Frideryk Konrad – Asher,
Ron E. (eds.): Concise History of the Language Sciences. From the
Sumerians to the Cognitivists. Pergamon, Oxford, 401–415.
Yunusova, Yana – Green, J. R. – Mefferd,
A. (2009): Accuracy Assesment for AG500, Electromagnetic
Articulograph. Journal of Speech, Language, and Hearing Research.
52, 547–555. DOI: 10.1044/1092-4388(2008/07-0218) •
WEBCÍM
LÁBJEGYZETEK
1 A szupraszegmentumoknak
többféle felosztása is lehetséges, melyek közül ez a felosztás
terjedt el a magyar szakirodalomban.
<
|