Magyar Tudomány, 2007/03 268. o.

Beszéd és beszédtudomány III.



Lakossági gyógyszerinformációs

rendszer fejlesztése

beszédkutatási eredmények alapján


Olaszy Gábor

az MTA doktora, tudományos fõmunkatárs, egyetemi tanár

MTA Nyelvtudományi Intézet és BME Távközlési és Médiainformatikai Tanszék

olaszy nytud.hu


Haraszti Csaba

fõosztályvezetõ

Országos Gyógyszerészeti Intézet



Az utóbbi két évtizedben a beszédkutatásnak kialakult egy speciális ága, a beszédtechnológia, amely a kutatási eredményeket interdiszciplináris formába öntve hoz létre új, komplex megoldásokat. Egy ilyen – a társadalom széles rétegeit szolgáló – beszédtechnológiai eredményen alapuló információs rendszert ismertetünk a jelen cikkben.

A Gyógyszervonal elnevezésû telefonos szolgáltatás biztosítja a lakosságnak, hogy a gyógyszerekkel kapcsolatos alapvetõ információkhoz hozzájusson helytõl és idõtõl függetlenül, tehát a nap huszonnégy órájában. Ilyen adatelérési lehetõség mindeddig nem állt rendelkezésre (tudomásunk szerint külföldön sem). A rendszert a BME Távközlési és Médiainformatikai Tanszéke (TMIT) és az Országos Gyógyszerészeti Intézet (OGYI) fejlesztette ki 2005–2006-ban egy elnyert GVOP-pályázat keretében. Magyarországon jelenleg körülbelül ötezer, különbözõ kiszerelésû, OGYI által törzskönyvezett gyógyszer van. Évente mintegy négyszáz új gyógyszer jelenik meg, és hozzávetõlegesen ugyanenynyit vonnak ki a forgalomból. A Gyógyszervonal információs rendszer mind a szakembereknek, mind a lakosságnak segítség a betegtájékoztatók szövegéhez történõ szabad hozzáférésben.

A rendszer tervezõi célul tûzték ki a természetes beszédkommunikáció géppel támogatott formájának a megvalósítását, ez a fejlesztés fõ újdonsága. Ez azt jelenti, hogy felhívunk egy telefonszámot, és emberi hangon „beszélgetést folytatunk” a géppel, bár erõsen korlátozva a dialógust a gyógyszerekkel kapcsolatos kérdésekre. A „géppel” történõ beszélgetés megvalósításához számos fonetikai, beszédtechnológiai és mûszaki problémát kell megoldani. Beszédszintetizátor szükséges ahhoz, hogy a hívó fél részére az információs rendszer szövegét felolvassuk, az emberi beszéd feldolgozásához pedig beszédfelismerõt kell alkalmaznunk. Mindkettõ egy-egy beszédtechnológiai modulként mûködik az információs rendszerben.

Az alapvetõ gondot ezeknek a gépi moduloknak az alkalmazásánál az jelenti, hogy a gép nem ismeri a nyelvet. A beszédszintetizátorral lényegében betûk sorozata szólaltatható meg; a beszédfelismerõ szoftver pedig nem képes nyelvileg is feldolgozni az akusztikus jelet, csupán összehasonlítja azt a memóriájában tárolt mintákkal. A bejövõ akusztikus jelet a leghasonlóbb tárolt mintához fogja hozzárendelni. A Gyógyszervonal információs rendszert az 1. ábra szemlélteti.

A rendszer 11 fõ modult tartalmaz. 1. A hívó fél az adatmegadáshoz két forma közül választhat. Beszéddel megadja a gyógyszer nevét, ilyenkor a dialógusvezérlõ a 9. beszédfelismerõ bemenetére irányítja a jelet, avagy kéri a gyógyszer törzsszámát (négyjegyû szám, ez minden gyógyszerdobozon megtalálható). Ez utóbbi esetben a dialógusvezérlõ a 3. blokkban keresi meg a gyógyszert. 2. A dialógusvezérlõ végzi a párbeszédet a hívó fél és a gép között. A lehetõségeknek megfelelõen, barátságos, egyszerû szervezésû dialógust alakítottunk ki. A bejelentkezéskor a gép üdvözli a hívót. Ha az ügyfél elõször hívja a rendszert, akkor részletes információt is kérhet. Ha a hívó gyakrabban használja a rendszert, akkor a bejelentkezõ szöveg átugorható. Ebben az esetben azonnal a gyógyszer nevét kéri a rendszer. A párbeszéd során a hívó fél a kiválasztott gyógyszerhez tartozó minden fontos adatot megtudhat. A dialógusvezérlõ mondatait kellemes hangszínezetû nõi hang olvassa fel, nyugodt tempóban. 3. Ez a modul az adattár, amelyik a gyógyszerek törzskönyvi számát és a hozzájuk rendelt gyógyszerneveket tartalmazza. 4. Itt található a gyógyszerek nevéhez tartozó betegtájékoztatók szövege, az OGYI által jóváhagyott formában. Hatféle információt kérhet az ügyfél: általános tájékoztató, szedés elõtti tudnivalók, alkalmazási javaslatok, mellékhatások, a készítmény tárolása, egyéb tudnivalók. 5. Ez az adattár a beszédszintetizátornak elõkészített, kódolt formátumú szövegeket tartalmazza. 6. A beszédszintetizátor olvassa fel a 4. adattár szövegeit. A szintetizátor a BME TMIT Profivox beszédszintetizátorából (Olaszy et al., 2000) kialakított, speciálisan gyógyszerinformációs szövegek felolvasására fejlesztett szoftver. A betegtájékoztatók szövegének fogalmazási stílusa, néha a központozása is, eltér az általános szövegekétõl. Ezért az itt megkívánt felolvasási stratégiához sajátos szabályokat kellett kialakítani (8. blokk), meghatározva az idegen szavak kiejtési szabályait is (7. blokk). Több ezer, fõként latin szó kiejtését kellett meghatározni és beépíteni a kivételszótárba, hogy a felolvasások elfogadhatóan hangozzanak. Ez a szótár nyitott, hiszen az elõforduló újabb szavak kiejtését is meg kell határozni. 9. A beszédfelismerõ modul egy beszélõtõl független mintaillesztõ egység (Fegyó et al. 2003). Az ügyfél beszédének akusztikai jeleibõl kiszámított paramétermezõt hasonlítja össze az adattárában eltárolt sok ezer minta paramétereivel (11. blokk), és kiválasztja a leghasonlóbbat. A felismerõ modul tehát csak akkor mûködik jól, ha az ügyfél olyan gyógyszernevet mond be, amelyik szerepel a rendszer ötezres adattárában. 10. A beszédfelismerõ különlegessége, hogy új felismerendõ elem esetén nem kell ún. „tanítást” végezni. Speciális adatábrázolási forma teszi lehetõvé, hogy fonetikai azonosítók segítségével megadható az új felismerendõ elem paraméterrendszere. A beszédfelismerõ szótára éppúgy nyitott, mint a beszédszintetizátoré.

A Gyógyszervonal lakossági információs rendszerrel sok esetben megelõzhetõ a téves gyógyszerhasználat. Lehetõséget teremt társadalmilag hátrányos helyzetû csoportok (például idõsek, sérült emberek, kórházban fekvõk) számára is a betegtájékoztatókban rögzített, fontos információk megszerzésére. A közegészségügyi információs ellátottság egyik fontos eleme lehet az ilyen szolgáltatás, amely interdiszciplináris együttmûködés következménye, és alapvetõen a beszédkutatás eredményeit használja fel.


Kulcsszavak: beszédszintézis, gépi beszédfelismerés, információs rendszer, dialógusvezérlõ, gyógyszertájékoztató


Irodalom

Olaszy Gábor – Németh G. – Olaszi P. – Kiss G. – Zainkó Cs. – Gordos G. (2000): Profivox – a Hungarian TTS System for Telecommunications Applications. International Journal of Speech Technology. 3–4. 201–215.

Fegyó Tibor – Mihajlik P. – Szarvas M. – Tatai P. – Tatai G. (2003): Voxenter – Intelligent Voice Enabled Call Center for Hungarian. Proceedings of 8th European Conference on Speech Communication and Technology, Geneva. 1905–1908.



1. ábra • A Gyógyszervonal információs rendszer felépítése



<-- Vissza a 2007/03 szám tartalomjegyzékére


<-- Vissza a Magyar Tudomány honlapra


[Információk] [Tartalom] [Akaprint Kft.]