Natūralios kalbos technologijos

Turinys
Įvadas 3
1. Esamos situacijos apžvalga 4
1.1. Situacija pasaulyje 4
1.2. Situacija Lietuvoje 5
2. Balso technologijų reikšmė informacinėje visuomenėje 7
2.1. Svarbiausios balso technologijos ir jų paskirtis 7
2.2. Balso technologijų plėtros motyvai 7
2.3. Balso technologijų panaudojimo sferos 8
3. Balso technologijų pasiekimai pasaulyje 9
3.1. Atpažinimas 9
3.2. Kitos sudėtinės atpažinimo funkcijos 10
3.3. Kalbos sintezės metodai 11
3.4. Sintezės kokybės vertinimo kriterijai 12
3.5. Kalbos sintezatoriaus komponentės 12
4. Balso technologijų praktinės taikymo sritys 13
4.1. Balso technologijų panaudojimas neįgaliesiems 14
4.2. Balso technologijų panaudojimo neįgaliems pavyzdžiai 15
4.3. Balso technologijų panaudojimo kriminalistikoje analizė pasaulyje 17
4.4. Balso technologijų kriminalistikoje naudojimas ir vystymas Lietuvoje 21
5. Balso technologijų taikymas mobiliuosiuose telefonuose. 23
6. Balso atpažinimo programų pritaikymo sritys 24
6.1. Kredito kortelė 24
6.2. Intelektualus bankomatai 25
7. Ateities technologijos 26
Išvados 29
Literaturos šaltiniai 30Įvadas
Balso technologija – viena iš perspektyviausių praktinio taikymo srityse pabandžius suvokti jos galimybes. Dėka šių naaujovių asmens technologinė aplinka įgauna vis artimesnę natūraliai komunikacijai formą, kuri gerokai patrauklesniu paverčią interfeiso aspektą. Realybė nėra itin džiuginanti, tačiau situacija iš esmės pasikeitus žvelgiant į keletos dešimtmečių istoriją. Vis didesnį pagreitį įgaunanti technologinė pramonė ir, apskritai, mokslinis potencialas sąlygos šios srities ženklesnę pažangą ateityje. Faktorius, kad žmonijos problematikos sprendimo formos iš esmės jau pakitusios ir perkeltos į technologinę terpę, neleidžia nusivilti, jog ši sritis bus pamiršta, juo labiau, dėl realių pritaikymo galimybių. Kuo sparčiau bus padaryti esminiai sprendimai, tuo greičiau buus sprendžiamos neregių problemos įvairiose veiklos kryptyse. Nepaisant to, kad inovacijų kaštai gana aukšti, tačiau įvertinus jų socialinę ir moralinę prasmę neįgaliųjų gyvenime investicija atsipirktų neįkainuojamai.
Pasirinktoji tematika atitinka asmeninės patirties išraišką dirbant balso technologijų aplinkoje ir sutampa su iškilusios problematikos re

ealizavimu. Tikslas – suformuoti bendrą vaizdą apie šios inovatyvios technologinės srities galimybes ir prisiliesti prie perspektyvių taikymo sferų.
Darbe bus atskleistas balso technologijos praktiškumas, apibūdinta dabartinę situaciją Lietuvoje ir pasaulyje, dalinai pristatyti visų mechanizmų veikimo principai taip pat apibrėžtos praktinės taikymo sritys.1. Esamos situacijos apžvalga
1.1. Situacija pasaulyje
Kalbos technologijų tyrimai pasaulyje atliekami daugiau kaip 50 metų. Aktyviausiai tiriama JAV, Japonijoje, Australijoje ir labiausiai išsivysčiusiose Vakarų Europos šalyse. Pastarąjį dešimtmetį jie ėmė plėstis buvusio Rytų bloko šalyse: Čekijoje, Slovėnijoje, Vengrijoje, Jugoslavijoje ir kt.

Labiausiai išsivysčiusiose šalyse kalbos atpažinimo srityje jau sukurtos įvairios komandų sistemos, bandoma kurti rišlios kalbos atpažinimo sistemas. Daug kur jau pasiekta suprantama ir vartotojui priimtina sintezuotos kalbos kokybė, tokią kalbą siekiama priartinti prie natūralios. Jungiant sintezę su atpažinimu, kuriamos dialogo balsu sistemos. Intensyvūs tyrimai attliekami kalbančiojo atpažinimo pagal balsą srityje. Šios technologijos taikomos kriminalistikoje, elektroninėje prekyboje, informacijos apsaugos sistemose.

Pastarąjį dešimtmetį pasaulyje suintensyvėjo automatinio vertimo tyrimai. Nors šiuo būdu jau verčiami laikraščių ir techniniai tekstai, jis naudojamas telekomunikacinio daugiakalbio ryšio sistemose bei interneto paieškos paslaugų teikimo kompiuteriuose, dar toli iki automatinio grožinės literatūros vertimo. Europos Sąjungoje naudojamos vertimo sistemos, kurios veikia su 17 kalbų poromis, tarp jų gerai žinoma ir gana kokybiška anglų–prancūzų versija, nuolat tobulėja vertimas italų–anglų, ispanų–anglų kalbomis, sparčiai tobulėja japonų–anglų projektai, naudojamos rusų–anglų–rusų au
utomatinio vertimo sistemos.

Norint kurti kalbos technologijų produktus, reikia kalbos išteklių: archyvų, tekstynų, garsynų ir iš jų gautos kalbos duomenų bazės. Įvairių kalbų ir tipų tekstynai jau nuo 7-ojo dešimtmečio kuriami ir taikomi pačioms įvairiausioms informacinės visuomenės reikmėms. Tekstynai yra būdas išsaugoti kalbos paveldą, faktinės informacijos šaltinis, autentiškos kalbos vartosenos duomenų bankas, kalbos statistikos duomenų šaltinis ir automatinių kalbos modelių verifikavimo bazė. Tekstynų vertė priklauso nuo jų dydžio, pobūdžio, apdorojimo laipsnio ir darbui su jais skirtos programinės įrangos galimybių. Pastaruoju metu Europos valstybių kalbos išteklių archyvai yra taip išaugę ir sustiprėję, kad iš siauros mokslo tyrimų ar technologijų kūrimo paskirties tapo reikšmingomis valstybės tautinį identitetą ir istorinį procesą fiksuojančiomis ir globaliam pasauliui pristatančiomis nacionalinių išteklių saugyklomis.
Vakarų ir Vidurio Europos valstybės turi beveik visą į savas kalbas išverstą kasdieniniam darbui bei mokymui reikalingą programinę įrangą. Prieš keletą metų praūžusi programinės įrangos legalizavimo banga palietė valstybines institucijas ir kompanijas, kurios pastebėjo, kad vienintelis tinkamas pasirinkimas – naudoti atvirojo kodo arba nemokamą programinę įrangą.
Kiekviena tauta rūpinasi savo raštų ženklų funkcionavimu informacinėse sistemose. Lenkai yra sukūrę taisyklingų lenkiškų diakritinių ženklų dizaino taisykles, perkuria kompiuteriniu formatu visus kada nors praeityje lenkų dailininkų sukurtus šriftus. Vengrijos Mokslų Akademijos Vengrų literatūros istorijos institutas kataloguoja senųjų vengrų raštų ženklus, tv
varko jų kodavimą ir kuria šriftus. Latviai yra sukūrę arba adaptavę apie 80 kompiuterinių šriftų.
Iš 6 800 žinomų kalbų internetinius žodynus, skirtus tarptautiniam vartotojui, turi 260 kalbų. Lietuvių kalba internete pateikti 6 dvikalbiai žodynai, latviai yra pateikę 5 dvikalbius ir 1 tarminį žodyną, estai – 8 žodynus, tarp jų slengo, patarlių, frazeologijos ir sinonimų.
Europoje kalbos technologijų tyrimus ir taikymą koordinuoja net kelios organizacijos. Pagal Europos Sąjungos programas pastaraisiais metais vykdoma per šimtą didelių tarptautinių projektų. Jiems skiriamos milijardinės lėšos.1.2. Situacija Lietuvoje
Lietuvoje kalbos technologijomis pradėta domėtis prieš 20–30 metų. Pagrindinės kryptys – kalbos signalų atpažinimas, sintezė bei suglaudinimas. Sukurta atskirai sakomų žodžių atpažinimo technologija, pradėti kalbos atpažinimo darbai. Pasistūmėta kompiuterinių dialogų balsu kūrimo bei kalbos sintezės srityse. Tačiau tai tik pradžia – reikia didinti atpažįstamų žodžių skaičių, pereiti prie rišlios kalbos atpažinimo, gerinti sintezuotos kalbos suprantamumą ir natūralumą, kurti balso technologijas naudojančius produktus, ieškoti naujų taikymo sričių. Pradėti pirmieji anglų–lietuvių kalbų automatinio vertimo sistemos darbai. Šiuos darbus skubina artėjanti integracija į Europos Sąjungą.

Rašytinės kalbos tekstynų srityje Lietuva yra lyderė Baltijos šalyse. Visuomenei per internetą prieinamas 100 milijonų teksto žodžių turintis dabartinės rašytinės lietuvių kalbos tekstynas. Be to, kaupiamas paralelus lietuvių ir kitų kalbų (anglų, vokiečių, čekų) tekstynas, sukaupti keli nedidelės apimties specialieji tekstynai. Tačiau esamiems ir būsimiems tekstynams trūksta bendros, lietuvių kalbai pritaikytos pr
rograminės įrangos, kuri leistų kuo geriau panaudoti turimus kalbos resursus ir iš jų gaunamus skaitmeninius aprašus.

Sukurtas bendrinės lietuvių kalbos pavieniui tariamų žodžių universalus anotuotas garsynas. Jis atspindi visus svarbiausius fonetinius ypatumus ir skirtas lietuvių kalbos informacinių technologijų mokslo tyrimo ir taikymo darbams, tačiau tarp ES narių ir šalių kandidačių garsynų srityje Lietuva užima paskutinę vietą.
Siekiant išsaugoti kalbos ir kultūros paveldą, sukurtas ir pildomas Tarmių archyvas. Pradėtos kurti paveldo elektroninės kartotekos su paieškos sistemomis: skenuojamos senosios žodynų kortelės, kalbininkų ranka rašyti dokumentai, užrašai.
Sukurti ir naudojami daugiakalbiai žodynai „Alkonas“, LED. Kompaktine plokštele išleistas „Dabartinės lietuvių kalbos žodynas“. Jis su svarbiausių vietovardžių sąrašu pateiktas ir internete. Kompaktine plokštele išleistas „Lietuvių tarmių žodyno“ pirmasis tomas, į skaitmeninę formą pradėtas versti didysis „Lietuvių kalbos žodynas“.
Kuriama trijų lygių nacionalinė kalbos duomenų metabazė. Sukurta ir pildoma senųjų raštų duomenų bazė: XVI–XVII a. raštų tekstynai ir konkordancijos. „Lietuvių kalbos žodyno“, jo papildymų bei kartotekos pagrindu kuriama akademinė leksikos, „Bendrinės kalbos žodyno“ pagrindu pradėta kurti bendrinės leksikos, „Sinonimų žodyno“ pagrindu kuriama sinonimų duomenų bazė, pradėta kurti lietuvių kalbos dalių junglumo duomenų bazė, kalbos konsultacijų skaitmeninis bankas, kalbos rekomendacijų, dabartinės vartosenos skaitmeninė kartoteka. Kuriamas pirmasis originalus kompiuterinis žaidimas, ugdantis kalbos kultūros ir rašybos įgūdžius.
Pradėti programinės įrangos vertimo į lietuvių kalbą darbai. Iš dalies išversta operacinė sistema Windows XP Professional, pirmoji raštinės paketo MS Office programa Word XP, interneto programų pagrindiniai komponentai: naršyklė, hipertekstų rašyklė, visiškai sutvarkytas lietuviškų elektroninių laiškų bei tinklalapių rašymas ir skaitymas, išversta duomenų tvarkymo programa Total Commander, antivirusinė programa Doctor Web, sulietuvintos kelios mokymo programos. Lietuvoje sukurta atvirojo kodo duomenų bazė, į lietuvių kalbą išversti programų paketai Mozilla ir OpenOffice. Tai tik epizodiniai darbai, lyginant su kitomis valstybėmis. Vakarų ir Vidurio Europos valstybių kalbų sąraše pagal programinės įrangos vertimą lietuvių kalba užima 21 vietą iš 25. Parengti pagrindinės lietuviškos abėcėlės, kirčiuotų raidžių koduočių standartai, lietuviškos kompiuterių klaviatūros standartas su numatyta galimybe įtraukti kirčiuotas raides, parengti kirčiuotų raidžių šriftai 8 bitų koduotėms.

Integruojantis į daugiakalbę Europos Sąjungą, vykstant globalizacijai ir formuojantis pasaulio informacinei visuomenei, būtina užtikrinti lietuvių kalbos kaip vienos svarbiausių nacionalinės kultūros paveldo dalių išsaugojimą, vartojimą ir fun.kcionalumą visose viešojo valstybės gyvenimo srityse, patenkinti naujus Europos integracijos lemiamus žinių visuomenės poreikius.2. Balso technologijų reikšmė informacinėje visuomenėje
2.1. Svarbiausios balso technologijos ir jų paskirtis
Skirsime tris balso technologijų grupes:
 balsų tariamų vienetų ( žodžiai, jų sekos, frazės ) automatinis nustatymas arba kalbos atpažinimas;
 teksto skaitymas balsu arba kalbos sintezė;
 kitos balso technologijos (asmens tapatybės vertinimas pagal jo balsą, kalbos signalų suspaudimas bei kodavimas, triukšmų slopinimas ir pan. ).

Toks grupavimas yra parinktas sąmoningai, nes pirmųjų dviejų technologijos grupių plėtrai reikia pakankamai gero lietuvių kalbos žinojimo. Mažai tikėtina, kad jos gali būti sėkmingai kuriamos ne Lietuvoje. Kitos balso technologijos gali būti pakankamai savarankios, bet dažnai jos kartu yra ir sudėtinės atpažinimo bei sintezės dalys.
Atpažinimas. Jo paskirtis yra automatiškai nustatyti, kas balsu sakoma informacijos priėmimo sistemai. Tai gali būti atskiras žodis ( balso komanda ), žodžių seka ( PIN kodas ), net rišlių sakinių skaitymas. Informacijos priėmimo sistema, nustačiusi, kas jai buvo pasakyta, atlieka adekvačius veiksmus, t.y. atpažinimas yra informacijos prieigos forma.
Sintezė. Jos pagalba pagal reikiamą komandą balsu perskaitoma informacinėje sistemoje teksto pavidalu saugoma informacija. Sintezei priskiriamos ir paprastesnės informacijos pateikimo balsu formos, pvz. iš anksto paruoštu žodžių ar jų sekų pateikimas balsu, esant tam tikram reikalavimui.
Kitos balso technologijos. Trumpai apibūdinsime keletą tokių technologijų. Asmens tapatybės vertinimas pagal jo balsą reikalingas teisėsaugoje ir komercinių operacijų vykdymui ( asmens parašas ). Triukšmų šalinimas nuo kalbos signalų yra priemonė sukauptoms kultūros vertybėms restauruoti. Beje, triukšmų apdorojimo problemos iš esmės persmelkia veik visas kitas balso technologijas. Balso signalų suspaudimas yra taupaus balso įrašų sugojimo ar perdavimo priemonė, kurios poreikis jau jaučiamas ir Lietuvoje, operuojant balsu Internete ( VoIP ).2.2. Balso technologijų plėtros motyvai
Argumentai, kuriais grindžiamas balso technologijų plėtros būtinumas, tarp kurių išskiriama trys motyvai:
 Lietuva – draugiškos daugiakalbės Europos narė
 visuotinė, integruota ir intuityvi informacijos prieiga bei jos pateikimas,
 visuomenės perkrova technologinėmis priemonėmis.

Lietuva – draugiškos daugiakalbės Europos narė. Tuo tvirtinama, kad Europa, skirtingai nuo kitų pasaulio regionų yra daugiakalbė, o balso technologijos yra Europos lingvistinės infrastruktūros, palankaus draugiškos daugiakalbės Europos kūrimo veiksnio, sudėtinė dalis. Jų plėtrai reikia ir kiekvienos Europos valstybės valios.
Visuotinė, integruota ir intuityvi informacijos prieiga bei jos pateikimas. Visuotinumo prasmė gerai matoma mobilaus vartotojo atveju, kai yra labai ribotos klaviatūros galimybės. Be to, balso technologijos papildo grafinę, teksto ir kitas informacijos vaizdavimo formas. Balso technologijos, kaip natūraliausias bendravimo būdas, turi unikalių intuityvios informacijos prieigos galimybių.
Visuomenės perkrova technologinėmis priemonėmis. Vakaruose vis labiau pabrėžiama, kad žmonės pageidauja paprastesnio ir lengvesnio gyvenimo stiliaus. Iš vienos pusės skatinamas pastovus ir visuotinis informacinis lavinimasis, tačiau kartu suprantama, kad visko mokėti negalima ( primirštama, kas išmokta; kai kurių funkcijų retokai reikia konkrečioje veikloje arba jas užgožia svarbesnės; kartais neįmanoma be išorinės pagalbos pasinaudoti informacija , pvz. neįgaliems, ir pan.).2.3. Balso technologijų panaudojimo sferos
Mes apibrėšime tas balso technologijų panaudojimo sferas, kurių, mūsų nuomone, plėtojimas Lietuvoje yra aktualiausias, be to galima išnaudoti bei stiprinti esamą mokslinį potencialą, o kalbos signalų technologijų įsigijimas (kaip ir eksploatavimo įsisavinimas) yra brangus:
 mokymo procesų tobulinimas;
 priemonės neįgaliems, kai kurie medicininiai taikymai;
 teisėsauga bei krašto apsauga;
 kultūros bei kalbos vertybių sutvarkymas ir išsaugojimas;
 administravimas ir telekomunikacinės paslaugos

Mokymo proceso tobulinimas. Lietuvoje reikia pasiekti, kad mokymo procesas būtų artimas pasauliniam .Tai reiškia, kad technologinėse informatikos, telekomunikacijų disciplinose turėtų būti žymiai daugiau lingvistikos ir atvirkščiai. Pagrindines kliūtis galima pašalinti, sukuriant reikalingas technologines mokymo priemones. Kartu turi būti kuriami treniruokliai gimtosios bei užsienio kalbų mokymuisi, pritaikyti logopedijai ir kiti.
Priemonės neįgaliems. Paminėtinos kompiuterizuotos darbo vietos akliems, kurtiems, turintiems motorinių funkcijų sutrikimus, neprigirdintiems. Balso technologijos taip pat naudingos LOR medicinoje, pooperacinėje reabilitacijoje, ką rodo nuolat augantis dėmesys kitose šalyse.
Teisėsauga bei krašto apsauga. Kalbos signalų technologijų procedūros naudingos fonoskopinių ekspertizių tobulinimui, operatyvinėje veikloje, kalbos signalų neviešam saugojimui ar perdavimui, civilinėje saugoje ir panašiai. Plintant techninėmis naujovėmis plinta ir nauji falsifikavimo būdai, todėl svarbu paruošti tinkamas priemones.
Kultūros, istorijos ir kalbos vertybių sutvarkymas ir išsaugojimas. Per eilę dešimtmečių garso pavidalu yra sukaupta labai vertingos medžiagos, kurią reikia šiuolaikinėmis priemonėmis sutvarkyti.
Administravimas ir telekomunikacinės paslaugos. Neretai įvairaus lygmens pareigūnai neturi galimybių priimti visus pageidaujančius, o telefoninės kalbos signalų technologijų priemonės padėtų išplėsti aptarnaujamų piliečių skaičių. Vis plečiasi internetinės balso panaudojimo priemonės. Balso technologijos jau senokai priskiriamos strateginei naujų telekomunikacinių paslaugų kūrimo krypčiai.3. Balso technologijų pasiekimai pasaulyje
3.1. Atpažinimas
Trys lietuviškos atpažinimo problemos. Galima paminėti bent porą “lituanistinių” faktorių, kurie turi labai didelę reikšmę tolesnei balso technologijų plėtrai Lietuvoje. Pirma, tai geras lietuvių fonetikos bei sintaksės dėsningumų supratimas, kuriam reikia buitinės lietuvių kalbos vartojimo patirties, kuo vargu ar atidžiai domėsis kitų šalių technologai; antra, reikia kaupti lietuviškus balso technologijų resursus ( garsynus ), nes be jų neįmanoma tolesnė pažanga. Taigi, šalia plataus rato bendrų uždavinių, yra pabrėžiamos trys svarbios “ lituanistinės “ balso technologijų problemos:
• I faktorius – balso technologijų lietuviška sintaksė;
• II faktorius – balso technologijų lietuviška fonetika;
• III faktorius – lietuviški balso garsynai (angl., speech databases arba speech corpora).3.2. Kitos sudėtinės atpažinimo funkcijos
Pagrindinė atpažinimo schema – tolydinio tankio paslėptos Markovo grandinės (continuous density hidden Markov model – CD HMM ). Šiuo metu tai yra populiariausia kalbos signalų atpažinimo schema. Bet koks lingvistinis vienetas (žodis, skiemuo, fonema) yra aprašomas tam tikru skaičiumi būsenų ir perėjimo tikimybėmis. Daroma prielaida, kad tai kas ir kaip tariama niekada nėra tiksliai žinoma (paslėptas procesas), bet rezultatą visada stebime (girdime ) ir jį galime fiksuoti. Taigi automatinio atpažinimo įtaiso šerdis yra pagal stebėjimo rezultatus sukonstruotas paslėpto proceso modelis. Modelio parametrų įvertinimui naudojama Baum-Welch procedūra, atliekant iteracinius tiesioginių-atbulinių ( Forward – Backward ) tikimybių skaičiavimus. Sintaksė modeliuojama N-gramatikomis, kuriose yra sukaupiamos N paeiliui einančių žodžių statistikos. Atpažinimo procesas grindžiamas Viterbi algoritmu, kai su ištarta fraze dinaminio programavimo būdu lyginami žinomi CD HMM modeliai, surandant panašiausią.
Pašalinių garsų atmetimas ( out of vocabulary ). Klausydamas jį dominančios kalbinės informacijos, žmogus sugeba ignoruoti pašalinius pokalbius, triukšmus, muzikinius garsus ar panašiai, žinoma, jei pastarieji nėra pernelyg intensyvūs. Tai reiškia, kad reikia turėti galimybę atmesti įvairius akustinius garsus, kurių nėra kompiuterinio dialogo žodyne. Tinkamai parenkant atpažįstamų signalų panašumo slenkstį, tikrinama ar nagrinėjama komanda yra pakankamai panaši į kurią nors vieną iš leistinų komandų. Jei slenkstis pakankamai aukštas, tai atmetama ir dalis leistinų komandų, o jei šis slenkstis per žemas, atpažinimo įtaisas beprasmiškai reaguoja į pašalinius garsus. Kuo tikslesnis yra atpažinimo algoritmas, tuo efektyviau veikia ši procedūra.
Raktinių žodžių paieška ( key word spotting ). Tipinę žmogaus tariamą komandą galima pavaizduoti esminiais žodžiais: subjektas ( kas vykdo ), predikatas( kas vykdoma ), objektas( kas yra vykdymo objektas ), atributai ( kaip vykdoma ). Realioje frazėje esti funkcine prasme neesminių žodžių ( pvz. malonybės ), nekalbinių intarpų ( mikčiojimas, kostelėjimas ), o funkciškai esminių žodžių tvarka gali keistis, nors prasmė išlieka ta pati. Raktinių žodžių paieška yra funkciškai esminių žodžių suradimas.
Pasikliovimas atpažinimu ( confidence measure ). Vis labiau plinta procedūros, kai galutinis sprendimas priimamas pagal atpažįstamo vieneto panašumo mato reikšmę nebūtinai iš karto. Jei panašumas nėra pakankamai aukštas, automatas siūlo pakartoti užklausą, modeliuojant žmogaus elgesį, kai jis gali ne iš karto suprasti klausimo prasmę.
Akustinio aido slopinimas ( acoustical echo cancellation ). Dialogo tarp dviejų žmonių metu neretai vienas pašnekovas pertraukia kitą, nes jis suprato, ką turėtų atsakyti. Panašiai kompiuteris duoda ilgoką nuorodą ( prompt ), o vartotojas nelaukdamas nuorodos galo ištarią komandą, taigi į mikrofoną patenka nuorodos ir vartotojo komandos mišinys. Kompiuteriui reikia mokėti atskirti ką pasakė jis pats ( akustinis aidas ) ir ką pasakė vartotojas. Tam naudojamos įvairios adaptyvaus tiesinio filtravimo modifikacijos. Neseniai AT&T pareiškė, kad savo sukurtas 40 msek. akustinio aido slopinimo priemones priskiria prie svarbesnių pastarojo penkmečio kompanijos laimėjimų.
Triukšmų apdorojimas ( noise supression, speech enhancement ). Praktikoje naudingus signalus visada lydi triukšmai. Skiriama labai daug dėmesio triukšmų poveikiui susilpninti. Galima paminėti spektro atėmimo, Kahrunen – Loeve dekompozicijos, Vinerio filtravimo, Kalmano filtravimo, Markovo grandinių, vilnelių ir eilę kitų metodų triukšmams šalinti nuo signalų. Gaunamas iki 6-10 dB eilės triukšmo slopinimo lygis. “Nuvalytas” signalas kartais būna nemalonus klausai, bet atpažinimo prasme gaunami ir teigiami rezultatai.
Prisitaikymas prie akustinės aplinkos (adaptation). Seniai pastebėta, kad laboratorijose paruoštos atpažinimo priemonės blogai veikia realaus taikymo sąlygomis. Pvz., laboratorijose gaunama mažesnė nei 1% sk.aičių pavadinimų sekų atpažinimo klaida gali išaugti iki 75% telefono kanaluose Texas Instrument surado efektyvų adaptavimosi būdą, kai efektingai išnaudojami laboratoriniai duomenis ir atpažinimo klaida nesumažėja. Didelės apimties laboratoriniai duomenis atspindi žmonių balsų įvairovę bei lingvistines ypatybes, o santykinai nedidelė adaptavimo medžiaga leidžia prisitaikyti prie triukšmų, kanalo, reverberacijų ir kitų faktorių.3.3. Kalbos sintezės metodai
Kalbos sinteze vadinamas automatinis balsinio pranešimo generavimas iš pateikto teksto ar kitos simbolių sekos, t.y. tekstu pateiktos informacijos skaitymas balsu. Nekelia abejonių, kad sintezė labai nuo konkrečios kalbos savybių priklausanti kalbos technologijų sritis. Generavimui reikia naudoti konkrečiai kalbai paruoštus sintezės elementus (pastarieji dažnai vadinami sintezės vienetais) bei atsižvelgti į duotos kalbos gramatines ypatybes (kirčiavimą, prozodines, intonacines savybes ir pan.). Reiktų pažymėti, kad lietuvių kalba nėra sintezės požiūriu lengva kalba.
Sintezės iš teksto panaudojimo perspektyvos labai plačios – jos gali būti naudojamos įvairiausiose informacinėse sistemose (ryšiuose, transporte, gal būt sveikatos apsaugoje). Pasaulyje jau egzistuoja visa eilė kalbos sintezės taikymo praktikoje pavyzdžių, dažniausiai orientuotų į didžiąsias pasaulio kalbas (anglų, kinų, prancūzų, vokiečių, japonų). Jose naudojama pakankamai aukštos kokybės balso sintezė, tačiau net ir geriausių šiuolaikinių sintezės sistemų generuoto balso kokybė gerokai nusileidžia natūraliam balsui.3.4. Sintezės kokybės vertinimo kriterijai
Sintetinės kalbos kokybei apibūdinti naudojama eilė rodiklių, kurių svarbiausieji yra aiškumas (angl. inteligibillity) ir natūralumas (angl. naturalness). Aiškumu nusakoma, kokią lingvistinių vienetų (fonemų, skiemenų ar žodžių) dalį gali suprasti klausytojas. Natūralumas yra subjektyvesnis kriterijus, juo stengiamasi nustatyti kiek sintetinė kalba artima žmogaus kalbos. Eilę dešimtmečių aiškumo gerinimo pastangos buvo sintezės plėtros varomoji jėga, kadangi neaiški kalba yra praktiškai bevertė. Yra gauti aukšto aiškumo sintetinės kalbos pavyzdžiai ir ypač stengiamasi pagerinti natūralumą.
Šiuo metu formuojasi ir pragmatiškesni sintetinės kalbos kokybės vertinimo kriterijai. Skiriamos dvi sintetinės kalbos kokybės gradacijos: vartojimo kokybė (angl. customer quality) ir natūrali kokybė (angl. natural quality). Vartojimo kokybės sintetine kalba laikoma kalba, kai didelė vartotojų dalis moka už paslaugas, kai informacija pateikiama sintetine kalba. Natūralia kokybe suprantama tokia sintetinė kalba, kai specialiai nepasiruošęs vartotojas nesugeba jos atskirti nuo žmogaus kalbos. Nors visada buvo ir nenatūralios, bet aiškios, sintetinės kalbos praktinio panaudojimo sferų (tarkim nėra kitos galimybės informacijos pateikimui), tačiau, plintant automatizuotoms balso paslaugoms, nenatūrali kalba stabdo tokiomis paslaugomis besinaudojančių vartotojų skaičių. Kadangi natūralumas yra subjektyvus kriterijus, jis dažniausiai vertinamas balais: grupei klausytojų pateikiami sintezuotų įrašų pavyzdžiai ir pasiūloma įvertinti kokybę balu. Balso technologijų vertinimui dažniausiai naudojama penkiabalė sistema. Skirtingų klausytojų vertinimo rezultatai suvidurkinami.3.5. Kalbos sintezatoriaus komponentės
Norint tekstą paversti balsu, reikia nuosekliai atlikti eilę procedūrų. Visų pirma tekstą reikia tinkamai paruošti, atlikti jo transkripciją (pvz. lietuvišką žodį gąsdina mes tariame gazdina ), nustatyti frazėje esančių žodžių kirčius, apibūdinti frazės tipą (paprasta, klausiamoji ar šaukiamoji intonacija). Šis etapas paprastai vadinamas teksto normalizavimu. Galiausiai tekstas paverčiamas fonemų seka su prozodijomis. Šią seką reikia paversti tinkama sintezės vienetų seka, o pastarąją paversti balsu.

Nors visos sintezatoriaus komponentės yra svarbios, tačiau kol kas labiausiai sintetinės kalbos kokybę nulemia sintezės vienetų kokybė. Jais gali būti skiemuo, skiemens dalis, fonema, jos dalis ar jų junginys – difonas. Sintezės vienetai gali būti tiesiog iškirptos iš žmogaus balso signalo atkarpos arba tos pačios atkarpos gali būti paverstos požymiais (kepstras, filtrai, Furje transformacija, tiesinės prognozės parametrai). Pirmuoju atveju turime taip vadinamą signalo bangos konkatenaciją, o antruoju – parametrinę sintezę.4. Balso technologijų praktinės taikymo sritys
Kalbos signalų, t.y. su šnekamąja arba sakytine kalba (angl. speech, rus. rečj) susijusios, technologijos bendra prasme yra reikšmingos įvairiais informacinės, o toliau ir žinių, visuomenės plėtros aspektais. Žinių apie konkrečią kalbą svarba lemia, kad pageidautina tam tikra kiekvienos valstybės valia, vystant ir paskleidžiant šias technologijas. Greta kalbos signalų, šnekamos kalbos, šnekos terminų, naudojamas ir balso technologijų terminas, bet čia turima galvoje tik komunikacinę balso funkciją angliško žodžio “speech” prasme (yra ir kitos labai svarbios sritys apibūdinamos žodžiais “language”, “text”, “music” ir pan.).
Be kitų priežasčių kalbos signalų mokslo ir technologijų vystymas Lietuvoje pageidautinas ir dėl to, kad yra eilė neatidėliotinų praktinio panaudojimo sričių, kur galima išnaudoti bei stiprinti esamą mokslinį potencialą, o kalbos signalų technologijų įsigijimas (kaip ir eksploatavimo įsisavinimas) yra brangus, be to svarbus yra ir konkrečios kalbos mokėjimo faktorius.
Praktines balso technologijų taikymo sritys .
• Kalbinis dialogas su kompiuteriu.
• Balso įrašų stenografavimas.
• Ilgų pokalbių apdorojimo priemonės.
• Balsinė Interneto naršyklė.
• Balsas namų automatikoje ( home – automatic ).
• Automatinis lietuviško teksto skaitymas balsu.
• Lietuviško teksto iš interneto skaitymas balsu.
• Balso atsakymų mašina telekominėse paslaugose.
• Asmens atpažinimas pagal jo balsą.4.1. Balso technologijų panaudojimas neįgaliesiems
„Daugelis programinės įrangos gamintojų nekreipia dėmesio į tai, kad su jų produktais neįmanoma tinkamai suderinti, pvz., teksto skaitymo balsu programų– „Programos suderinamumas su skaitymo balsu priemonėmis reiškia, kad programą galės naudoti daugiau vartotojų.“ Dažnai tokiam suderinimui nereikia itin didelių pastangų: nedidelių pakeitimų pakanka tam, kad programinė įranga dirbtų su neįgaliesiems vartotojams skirtomis priemonėmis.
Internetas suteikia prieigą neįgaliesiems prie informacijos pasaulio. Tokios technologijos, kaip sensoriniai ekranai ir balso programinė įranga padeda žmonėms lengviau gauti informaciją, kurios jie seniau taip lengvai negalėdavo rasti. Tiesa, technologijos turi ir kitą pusę: žmogui, turinčiam regos sutrikimų, gali būti sunku orientuotis svetainėse, prisotintose daugialypės terpės priemonių.
Taigi viena iš perspektyviausių balso technologijų panaudojimo sričių – įvairūs neįgaliems žmonėms skirti taikymai (akliems ir silpnaregiams, nevaikščiojantiems arba turintiems ribotas judėjimo galimybes). Balso technologijų panaudojimas dažnai yra esminis arba net vienintelis tokių žmonių integravimo į visuomenę būdas. Skiriamos dvi didelės balso technologijų taikymo neįgaliesiems grupės:
 Į informacijos valdymą ar pateikimą balsu orientuoti taikymai;
 Neįgaliesiems skirti specializuoti techniniai įrenginiai su integruotomis balso technologijų komponentėmis.
Pirmai taikymų kategorijai priklauso tokie taikymai kaip kompiuterio valdymas balsu, informacijos iš Interneto ar kitų tekstinių informacijos šaltinių perskaitymas balsu ir pan. Antrai taikymų kategorijai priskiriami tie taikymai, kai į specialius neįgaliems žmonėms skirtus įrenginius integruojamos balso technologijų komponentės (pvz., žmonėms su riboto judėjimo galimybėmis skirti ir balsu valdomi vežimėliai).

Neįgaliesiems orientuoti taikymai iš esmės remiasi tais pačiais kalbos apdorojimo technologijų pasiekimais: kalbos atpažinimu, kalbos sinteze ir kartais asmens atpažinimu. Tačiau neįgalūs žmonės dažnai neturi alternatyvios galimybės valdyti įrenginį ar gauti informaciją kitaip negu balsu. Todėl tokiems žmonėms priimtinas žemesnis balso technologijų lygis negu eiliniam vartotojui, t.y didesnis kalbos atpažinimo modelio daromas klaidų skaičius, prastesnis sintetinės kalbos kokybės lygis. Kita neįgaliesiems skirtų taikymų ypatybė tai, kad jų panaudojimu rūpinasi ne tiek patys jų vartotojui (šiuo atveju neįgalūs žmonės), bet valstybinės socialinės rūpybos tarnybos, turtingose šalyse labdaros organizacijos ir pan.4.2. Balso technologijų panaudojimo neįgaliems pavyzdžiai
Žinoma, kad įvairiose pasaulio šalyse gana aktyviai stengiamasi neįgaliuosius aprūpinti įvairiais įtaisais, kuriuose panaudotos kalbos signalų panaudojimo technologijos. Tačiau, kadangi technologijos, naudojamos tokiuose įtaisuose, remiasi bendrais kalbos technologijų pasiekimais, specialiojoje mokslinėje literatūroje balso technologijų taikymo neįgaliesiems problemos nagrinėjamos gana retai. Čia pateiksime kelis balso technologijų panaudojimo neįgaliųjų integracijai į visuomenę pavyzdžius iš kelių Europos valstybių.

Pažymėtina, kad panaudoti kalbos apdorojimo technologijas tokio pobūdžio taikymams stengiamasi ne tik išsivysčiusiose Vakarų Europos ir Šiaurės Amerikos šalyse, bet ir Vidurio bei Centrinės Europos šalyse. Slovėnijoje sukurta akliesiems ir silpnaregiams skirta informacinė sistema, skirta supažindinti su tos šalies žiniasklaidoje spausdinamais straipsniais. Sistema integruoja kalbos atpažinimo ir slovėnų kalbos sintezės elementus. Vertinant įdiegtų balso technologijų kokybę reikia pasakyti, kad sintezuojama kalba yra gana gerai suprantama, tačiau nenatūrali ir eiliniam vartotojui būtų nelabai priimtina, tačiau aklieji ar silpnaregiai ja naudojasi noriai. Tarp kitų šio regiono šalių panašaus pobūdžio sistemos kuriamos Lenkijoje, Čekijoje, Vengrijoje.

Kita kalbos signalų apdorojimą naudojančių technologijų taikymų sritis – ribotas judėjimo galimybes turintiems asmenims skirti specialūs vežimėliai, valdomi balsu. Tokio tipo vežimėliai ypač reikalingi žmonėms negalintiems valdyti ne tik kojų, bet ir rankų. Prie vartotojo pritvirtinamas mikrofonas, sujungtas su įmontuotu kalbos atpažinimo ir komandų vykdymo blokais. Vykdomų komandų rinkinį sudaro apie 10 komandų, tarp kurių gali būti ne tik judėjimą valdančios komandos, bet ir sėdėjimo vietą valdančios komandos (pakelt aukščiau arba nuleist žemiau kėdę, valdyti atlošą ir pan.). Tokias priemones kuria kai kurios Švedijos, JAV kompanijos. Šių priemonių ypatybė tai, kad balso komandų atpažinimo realizavimas organizuotas ne asmeniniame kompiuteryje ar darbo stotyje, bet autonominiame specializuotame procesoriuje su nedideliu atminties kiekiu. Pažymėtina, kad jose naudojamoms kalbos technologijoms keliami kiek aukštesni reikalavimai, nei informacinėse sistemose keliamiems reikalavimams.
Tenka konstatuoti, kad kalbos technologijų panaudojimo neįgaliesiems padėtis Lietuvoje yra nepatenkinama. Visų pirma tai pabrėžia patys tas žmonių grupes atstovaujantys asmenys.
Darbui su kompiuteriu aklieji ir silpnaregiai naudoja įvairius metodus: vaizdo ekrane padidinimą ir paryškinimą, informacijos išvedimą į Brailio eilutę ar spausdintuvą, informacijos išvedimą balsu. Bene patogiausias yra pastarasis, tačiau tam, kad kompiuteris kalbėtų, reikalingas sintezatorius ir programinė įranga, valdanti sintezatorių ir sukurianti aklam vartotojui patogią darbo aplinką. Darbo aplinkos sukūrimui paprastai naudojamos taip vadinamos ekrano skaitymo programos, kurios perduoda sintezatoriui, kokia informacija buvo išvesta į ekraną ir kokie klavišai buvo paspausti. Lietuvių kalba įneša nedaug specifikos į ekrano skaitymą, todėl galima pasinaudoti užsienyje sukurtomis ekrano skaitymo programomis, pvz., MS-DOS aplinkoje programa HAL (sukurta Dolphin Systems Inc.), Windows aplinkoje programa JAWS (sukurta Henter-Joice Inc.). Šiuo metu dauguma aklųjų ir silpnaregių Lietuvoje naudoja būtent šias programas. Egzistuojantys lietuvių kalbos sintezatoriai (Apollo II ir Aistis) gali dirbti MS-DOS aplinkoje kartu su ekrano skaitymo programa HAL. Apollo II gali dirbti ir Windows aplinkoje, tam reikalingos specialios tvarkyklės (nes Apollo II – aparatūrinis įrenginys). Daugelis programinių sintezatorių su kitomis programomis bendrauja naudodami Microsoft SAPI (angl. Speech Application Programming Interface) sąsają, pvz., sintezatorius Eloquence (nekalbantis lietuviškai) ir ekrano skaitymo programa JAWS. Sintezatorius “Aistis” šios sąsajos nepalaiko, todėl itin perspektyvu būtų modifikuoti jį taip, kad šią sąsa.ją palaikytų.
Žinoma, vienu svarbiausių balso technologijų taikymų neįgaliesiems kūrimo stabdžių yra finansinės problemos, ypač jais besirūpinančių draugijų ir valstybinių institucijų. Tačiau tinkamai kooperuojant lėšas, panaudojant patirtį sukauptą kuriant balso technologijas orientuotas kitoms sritims, galima rasti būdų kaip šios pažangios technologijos būtų panaudotos Lietuvos neįgaliųjų integracijai į šalies visuomenę.
Neįgaliųjų asmenų integracija į visuomenę yra svarbus socialinis uždavinys, be kita ko skatinamas ir Europos Sąjungos institucijų. Neretai tai ne tik socialinės pagalbos uždavinys, nes nors ir ribotai į visuomeninį gyvenimą integruotas žmogus gali pradėti teikti naudą tai pačiai visuomenei. Kaip jau parodėme, kalbos technologijos gali užimti svarbią ypač svarbią vietą sprendžiant šį uždavinį.

Perspektyviausia balso technologijų panaudojimo neįgaliesiems sritis – informacinių sistemų, valdomų balsu ir pateikiančių informaciją balsu kūrimas. Nereikėtų manyti, kad tokios informacinės sistemos būtinai turi orientuotis tik į informacijos iš laikraščių perskaitymą balsu, jos gali akluosius ir silpnaregius informuoti ir apie kitus įvykius, galbūt labiau specifinius šių žmonių gyvenimui. Sistemos, gebančios atpažinti gana nedidelį balso komandų skaičių ir valdyti kompiuterį, potencialiai labai naudingos ne tik akliesiems, bet ir ribotas judėjimo galimybes turintiems asmenims.

Sekančiu balso technologijų taikymų neįgaliesiems vystymo etapu galėtų būti kai kurių specializuotų įtaisų, panaudojančių balso komandas, kūrimas. Tokie įtaisai galėtų panaudoti asmeninio tipo kompiuterius susietus su vykdymo įtaisais, kad būtų galima atlikti kelias tokiam žmogui naudingas ir reikalingas operacijas (pvz., įjungti ar išjungti šviesą, veną ar kitą buitinį prietaisą ar pan.). Tokia neįgaliajam skirta vieta būtų pakankamai brangi (be sistemos kūrimo išlaidų, kiekvienam asmeniui reikalingas kompiuteris ir specialus vykdymo įtaisas), tačiau manytume, kad reikėtų pradžiai siekti bent kelių tokių vietų sukūrimo ir įdiegimo.

Specialių neįgaliesiems skirtų prietaisų (tokių kaip balso technologijas panaudojančių vežimėlių) kūrimas būtų tolesnės perspektyvos dalykas. Vargu ar jie gali būti sukurti tik kalbos signalų apdorojimo specialistų pastangomis: reikia panaudoti tokių prietaisų projektavimo patirtį.

Galbūt dėl gan gausaus regos sutrikimų skaičiaus tokiems vartotojams sukurta gan nemažai technologijų. Programinė įranga verčia tekstą ekrane į garsinį tekstą, o Brailio rašto ekranai leidžia „matyti“ tekstą. Naudojant skanerius, galima įvesti reikiamą informaciją ir ją perskaityti naudojantis viena paminėtų priemonių, o Brailio spausdintuvai gali atspausdinti tekstą Brailio raštu. Mažėjančios kainos padarė šias technologijas prieinamesnes platesnei auditorijai. Krentant bendrosios paskirties ir specializuotų technologijų kainoms, regos sutrikimų turintys vartotojai gali įsigyti sistemas, į kurias įdiegtos naujausios technologijos. Daugialypės terpės kompiuteriams vis populiarėjant, pavyzdžiui, kuriant mokomąją medžiagą, naudojama vis daugiau garsinės informacijos. Tokios informacijos naudojimas užveria duris žmonėms, turintiems klausos sutrikimų. Turintiems fizinių negalių viena daugiausiai papildomų galimybių teikiančių programų – balso atpažinimo programa. Ji leidžia vartotojams valdyti kitas programas ir diktuoti tekstą, naudojant natūralią kalbą. Seniau balso atpažinimo programos suteikdavo tik keletą galimybių, diktuojant tekstą reikėdavo daryti pauzę po kiekvieno žodžio. Dar seniau negalintys naudotis klaviatūra ir pele naudodavo vadinamąją „šiaudelio“ technologiją: pučiant ir traukiant orą per šiaudelį buvo perduodamas tekstas Morzės abėcėle. Naudojantys respiratorius vis dar naudoja šią technologiją, nes kvėpavimą lengvinanti įranga neatpažįstamai iškraipo balsą, ir tikimybė, kad jį supras balso atpažinimo priemonės, gerokai sumažėja. Vis dažniau gamintojai prabyla ir dar apie vieną vartotojų grupę – turinčiuosius .mokymosi sutrikimų. Gamintojai kuria skanavimo programinę įrangą, kuri gali atlikti įvairius veiksmus. Atliekami veiksmai palengvina mokymosi procesą. „WYNN Reader“ – programinė įranga, naudojanti kalbos technologiją balsu skaityti elektroninį tekstą vartotojui, taip pat tarti žodžius paraidžiui ir pateikti žodžių apibrėžimus4.3. Balso technologijų panaudojimo kriminalistikoje analizė pasaulyje
Kriminalistikoje balso technologijos pradėtos taikyti palyginti ne taip seniai, kaip pirštų antspaudai. Pirmoji fonoskopinė ekspertizė, teisme priimta kaip įkaltis, buvo atlikta JAV 1960 metais. Nors kariškiai ir specialiosios tarnybos savo darbe balso technologijas ar jų elementus pradėjo taikyti savo veikloje gerokai anksčiau, Antrojo pasaulinio karo metais. Kalbinių technologijų panaudojimo specialiųjų tarnybų bei kariniams tikslams srityje darbai JAV buvo vykdomi pagrinde BELL ir Nacionalinės saugumo agentūros (NSA) laboratorijose. Tarybų Sąjungoje taip pat stengtasi neatsilikti ir vykdyti panašius darbus. Tuo metu sukurti produktai buvo labai brangūs, sudėtingi, didelių matmenų ir t.t. Pavyzdžiui NSA užsakymu 1944 metais sukurtas vokoderis, skirtas telefoninių pokalbių užslaptinimui, buvo talpinamas traktoriaus traukiamoje didžiulėje priekaboje. Todėl tik pasiekus atitinkamą garso įrašymo technikos ir pačių kalbinių priemonių technologinį lygį, apie 1970 metus šios technologijos buvo pradėtos taikyti kriminalistikoje.
Balso technologijų taikymas kriminalistikoje. Kriminalistinę techniką bei technologijas, kurios atitinkamai yra susijusios su garso technologijomis, pagal panaudojimo pobūdį reikėtų skirstyti į dvi sritis:
 Kriminalinė paieška arba operatyvinis darbas;
 Teismo kriminalistika, arba teismo ekspertizė (Forensic criminalistic).
Kriminalistikos moksle bei moksliniuose tyrimuose šio dalinimo nėra, nes moksliniai pasiekimai sėkmingai naudojami tiek operatyviniame darbe, tiek teismo ekspertizėje. Tačiau visgi yra keletas esminių skirtumų, susijusių ir su pačių garsinių technologijų panaudojimu.
Visų pirma kriminalinei paieškai reikalingi patogūs darbui technologiniai sprendimai, nereikalaujantys iš vartotojo ypatingų žinių. Operatyvinio darbuotojo arba techniko uždaviniai yra: kokybiškai padaryti garso (vaizdo) įrašus, užtikrinti jų autentiškumą, panaudojant naujas technologijas (ypač tai svarbu darant skaitmeninius įrašus), greitai surasti reikiamus įrašus balsų bazėje, jei tokia egzistuoja, pasinaudoti turimomis priemonėmis garso įrašo suprantamumui pagerinti.
Tuo tarpu teismo ekspertizės metu atliekamas ekspertinis garso – vaizdo įrašų tyrimas. Ekspertas turi turėti gilias atitinkamų mokslo sričių žinias. Jis turi atlikti tyrimą, pasinaudodamas naujausiomis technologijomis ir turimomis mokslinėmis žiniomis, pateikti šio tyrimo moksliškai pagrįstą ataskaitą teismui ir, esant reikalui, apginti savo išvadas teisme.
Šiuo metu pagrindinis dėmesys skiriamas šiems tyrimams, susijusiems su kalbinių technologijų taikymu kriminalistikoje:
• Skaitmeninių garso signalų įrašymas ir jų autentiškumo užtikrinimas naudojant skaitmeninius vandens ženklus, kriptografijos elementus ir kt.;
• Balsų bazių kūrimas;
• Užtriukšmintų garso įrašų filtravimas, garso įrašų suprantamumo gerinimas, norimo asmens balso išskyrimas iš balsų mišinio ir kt.;
• Asmens identifikavimas pagal balsą (Speaker identification);
• Garso įrašų integralumo ir autentiškumo nustatymas (Integrity and Authenticity Examinations of Audio Recordings).
Teisminėje kriminalistikoje aktualiausios yra trys paskutinės tyrimų kryptys ir kalbinių technologijų pasiekimų šiose srityse taikymas. Tuo tarpu kriminalistams – operatyvininkams aktualesni kalbinių technologijų pasiekimai, susiję su pirmomis trimis tyrimų kryptimis. Reikia pastebėti, kad čia buvo aptarti tik pagrindiniai kalbinių technologijų taikymo kriminalistikoje aspektai. Tačiau yra visa eilė šių technologijų taikymo sričių, kur jos atlieka galbūt nepagrindinį vaidmenį. Kaip pavyzdį galima paminėti melo detektorių pagal balsą.
Kriminalistikos sritis, kuri apima visas aukščiau išvardintas tyrimų kryptis, dar vadinama kriminalistine akustika (The Acoustics of crime) arba kriminalistine fonetika (Forensic phonetic). Teismo ekspertizė, kuri sprendžia aukščiau nurodytas problemas, vadinama kriminalistiniu balso ir garso signalų bei jų įrašymo priemonių tyrimu (Forensi.c speech and audio analysis). Lietuvoje ir buvusiose socialistinėse šalyse ši sritis vadinama fonoskopija. JAV naudojamas terminas “Kriminalistinė akustika” (The Acoustics of crime) arba “Balso įrašų identifikavimas (Voicegram identification). Taip pat naudojami ir kiti pavadiniai, pvz.: Federalinis tyrimų biuras (FBI) naudoja terminą Forensic Audio Recordings investigations.
Kriminalistikoje naudojami balso technologijų metodai. Viena pagrindinių problemų išlieka asmens identifikavimas pagal balsą, todėl ją panagrinėsime smulkiau. Moksliniuose kalbinių technologijų tyrinėjimuose kalbėtojo atpažinimas pagal jo balsą yra suprantamas kaip procesas, kurio metu iš asmens kalbos signalų išskiriami identifikaciniai požymiai, pagal kuriuos ir atpažįstamas konkretus asmuo. Kalbėtojo atpažinimas savo ruožtu skirstomas į identifikavimą ir verifikavimą. Tiek verifikavimas, tiek identifikavimas gali būti priklausomas arba nepriklausomas nuo teksto. Teismo ekspertizėje asmens atpažinimas pagal balsą vadinamas asmens identifikavimu ir dažniausiai yra nepriklausomas nuo teksto. Kriminalistikoje naudojami ir verifikavimo elementai, kai atliekamas asmens vertinimas pagal balsą. Kaip pavyzdį čia galima paminėti asmens balso palyginimą su balsais iš turimos balsų bazės.
Pagrindinis bruožas skiriantis teisminį asmens identifikavimą nuo kitų verifikavimo sistemų yra tai, kad mes turime “nelinkusio bendrauti” (non co-operative speaker) asmens balsą. T.y. dažniausiai tiriamasis ir lyginamasis garso įrašai stipriai skiriasi. Šis skirtumas susidaro dėl skirtingų garso įrašų darymo sąlygų, asmens skirtingų emocinių būsenų, triukšmo įtakos, garso įrašymo kanalų nesutapimo ir t.t.
Šiuo metu teisminiame asmens atpažinime pagal balsą (asmens identifikavime pagal balsą) yra naudojami šie pagrindiniai metodai (approaches):
 Sonografinis metodas (Voiceprint);
 Fonetinis – akustinis metodas;
 Kombinuotas metodas;
 Automatinis metodas.

Reikia pastebėti, kad toks skirstymas yra sąlyginis, kai kurie pavadinimai nėra visiškai prigiję praktikoje. Pavyzdžiui, kombinuotas metodas kartais vadinamas pusiau automatiniu (semi automatic).
Apibendrinant pasaulinėje kriminalistikos praktikoje naudojamų metodų analizę galime padaryti keletą išvadų:
1. Šiuo metu garso teisminių ekspertizių (fonoskopinių) poreikis visame pasaulyje nuolat auga, o jų atlikimo terminai ir tikslumas netenkina teisėsaugos sistemos. Šių ekspertizių atlikimo pagreitinimas bei naujų uždavinių, kuriuos formuluoja šiuolaikinė kriminalistinė praktika, sprendimas galimas tik tada, kai bus glaudžiai bendradarbiaujama tarp šioje srityje dirbančių teismo ekspertų bei kalbines technologijas kuriančių mokslininkų.
2. Nepaisant visų pasiekimų asmens atpažinimo pagal balsą srityje, kriminalistinis asmens identifikavimas pagal balsą yra labai aktuali problema. Pagrindinės tyrimų kryptys čia yra dvi. Visų pirma, garso įrašymo sąlygų įtakos mažinimas identifikavimo tikslumui. Antra, mūsų nuomone, reikalingi moksliniai tyrimai naujų identifikacinių požymių iš balso išskyrimui, kadangi šiuo metu asmens identifikavimui naudojami tie patys požymiai, kaip ir kalbos atpažinimui. Šie požymiai literatūroje vertinami gana prieštaringai: viename straipsnyje jie naudojami kalbos atpažinimui, ir teigiama, kad jie nepriklauso nuo asmens individualių savybių (tai svarbu atpažįstant kalbą), kitame – kad tie patys požymiai gerai atspindi individualiais kalbančiojo savybes. Mokslinių tyrimų, kur būtų nagrinėjamos įvairių identifikacinių požymių sistemos yra labai mažai, ir tai dažniausiai jie skirti įvairių verifikacinių sistemų pagal balsą problemų tyrimui. Tuo tarpu specifinių kriminalistinių asmens identifikavimo pagal balsą problemų mokslinių tyrimų beveik nėra.
3. Šiuo metu plačiausiai kalbinės technologijos taikomos triukšmo slopinimui ir kalbos suprantamumo gerinimui. Čia taikomi tiek įvairūs triukšmo slopinimo algoritmai, realizuoti prietaisų pavidalu, tiek programiniu pavidalu P.C. Perspektyviausia kryptis kalbinių technologijų panaudojimo triukšmo slopinimui ir kalbos suprantamumo gerinimui būtų naujų patogių vartotojui technologijų sukūrimas, realizuojant jas programiniu pavidalu. Savaime suprantama, šios technologijos turi efektyviai slopinti įvairaus pobūdžio triukšmus, kurie atsiranda panaudojant nusikaltimų fiksavimui šiuolaikinę garso įrašymo techniką.
4. Viena iš perspektyviausių krypčių kalbinių technologijų taikyme tai – taip vadinamų skaitmeninių “vandens ženklų” panaudojimas skaitmeninių garso įrašų autentiškumui užtikrinti. Šiuo metu vykdomi intensyvūs tyrimai, siekiant apsaugoti garso įrašus nuo nesankcionuoto jų tiražavimo (ypač muzikinius kūrinius). Mūsų nuomone, čia būtinos tiek kalbinių technologijų mokslininkų, besispecializuojančių garso signalo kompresijos algoritmų tyrime, tiek informatikų, tyrinėjančių kriptografijos metodus, bendros pastangos.4.4. Balso technologijų kriminalistikoje naudojimas ir vystymas Lietuvoje
Lietuvoje balso technologijos kriminalistikoje daugiausia naudojamos Lietuvos teismo ekspertizės centro fonoskopinių ekspertizių grupėje.

Kalbant apie balso technologijų kriminalistikoje vystymo perspektyvas, reikia pabrėžti, kad šiuo metu Lietuvoje yra sprendžiami tik su teismine garso įrašų ekspertize susiję klausimai, užtikrinant tam tikrą tiek mokslinį, tiek ekspertinį lygį. Tačiau ir čia yra visa eilė problemų, kurių sprendimui reikalingas bendras kalbines technologijas kuriančių mokslininkų ir fonoskopijos ekspertų darbas.

Kitose teisėsaugos tarnybose, kurios naudoja garso ir vaizdo įrašymo aparatūrą ir kalbines technologijas, skirtas triukšmo slopinimui ir nusikaltimų fiksavimui, padėtis šiuo metu yra nepatenkinama. Būtų tikslinga, kad kalbinių technologijų specialistai, teisėsaugos institucijų užsakymu, paruoštų reikalavimus įsigyjamai vaizdo ir garso aparatūrai, įvertinant problemas, kurios atsiranda, kai šie įrašai pateikiami ekspertiniam tyrimui. Čia turi būti atsižvelgta į tendencijas kalbinių technologijų srityje ir ypač skaitmeninių garso įrašų panaudojimą.

Šiuo metu gana aktualia problema tampa garso įrašų, tiek tų, kuriuose yra užfiksuotas nusikaltimas, tiek taip vadinamų lyginamųjų, centralizuotas tvarkymas, t.y. Kriminalistinės fonotekos arba atitinkamos balsų bazės sukūrimas. Šiuo metu garso įrašus daro ir juos atitinkamai tvarko kiekviena žinyba pagal savo vidinius reglamentus. Todėl nereta situacija, kai, pavyzdžiui, fonoskopinei ekspertizei reikalingas asmens, įtariamo padarius nusikaltimą, balso įrašas, o galimybės padaryti tokį įrašą nėra. Gali būti, kad gretimame policijos komisariate turi šio asmens balso pavyzdį, tačiau apie tai žino tik tas darbuotojas, kuris turi reikalingą įrašą. Problematiška taip pat padaryti balso pavyzdžių garso įrašus jei jie yra sulaikymo vietose. Tokiu atveju nusikaltėlis iš sulaikymo vietos siunčiamas pas tardytoją. Pati siuntimo procedūra yra gana brangi ir sudėtinga ( reikalinga sargyba, specialus transportas ir t.t.). Tokiu būdu švaistomos lėšos, o apie operatyvumą negali būti nė kalbos.

Daug sunkumų sukelia tai, kad nusikaltimų fiksavimui taikoma labai įvairi garso įrašymo – atkūrimo aparatūra, skirtingų formatų garso įrašai pateikiami pačiose įvairiausiose laikmenose: nuo analoginių garso įrašų magnetinėse juostose iki skaitmeninių kompiuteriniuose diskeliuose. Dėl tokios informacijos laikmenų ir formatų įvairovės operatyvus pasikeitimas šiais garso įrašais tarp atskirų teisėsaugos žinybų neįmanomas. Kartais net paprastas jų perklausymas tampa problema, nes daugelis žinybų neturi reikiamos įrangos.

Šiuo metu kalbinių technologijų taikymas, tame tarpe ir asmens tapatybės nustatymo pagal balsą, turi dideles perspektyvas karinėje srityje. Ypatingai svarbiu laikoma informacijos ir bendrai saugumo užtikrinimas panaudojant biometrines technologijas. Kadangi šiuo metu jau egzistuoja tam tikra ryšių infrastruktūra, tai asmens tapatybės nustatymo pagal balsą technologijos (žmogaus balsas yra viena iš jo biometrinių charakteristikų) turi gana didelius pranašumus lyginant su visomis kitomis biometrinėmis technologijomis. Naudojant verifikavimą pagal balsą taip vadinamas lygių klaidų procentas EER=1,2¸1,7%, kai tuo tarpu, jei naudojamas verifikavimui tik vieno piršto antspaudas (Fingerprint), EER=8,8% . Tokiu būdu balsas leidžia pakankamai patikimai identifikuoti asmenį, nepanaudojant sudėtingų techninių įrengimų: balso neįmanoma pavogti, perduoti ir t.t. Taip pat kaip teigia JAV karinės informacijos apsaugos specialistai tik panaudojant biometrinius identifikavimo metodus galima užtikrinti atitinkamą informacijos saugumą bei nustatyti asmens tapatybę. Tuo pačiu šie metodai rekomenduojami ir kitose srityse, kur reikalingas didelio laipsnio saugumas, kaip pvz. praėjimas į skrydžių valdymo patalpą, patekimas į ginklų valdymo centrą, atomines elektrines, chemines bei padidinto pavojaus įmones ir kita. Savaime suprantama, kad ne biometriniai asmens tapatybės nustatym.o metodai (įvairūs slaptažodžiai, čypinės, magnetinės kortelės ir kita) negali užtikrinti reikiamo informacijos saugumo. Taip pat reikia pastebėti, kad karinė sritis yra suinteresuota visu kalbinių technologijų spektru: pradedant automatiniu kalbos komandų atpažinimu ir baigiant įvairiais treniruokliais. Kalbinių technologijų mokslininkai galėtų atlikti visą eilę projektų, skirtų Lietuvos krašto apsaugos reikmėms, įvertinant poreikius ir šalies specifiką.5. Balso technologijų taikymas mobiliuosiuose telefonuose.
Nors pirmieji telefonai, galintys atpažinti balso komandas, atsirado vos prieš porą metų, ši funkcija daugeliui pasirodė paranki ir kalbos atpažinimo sistemos tampa vis svarbesniu faktoriumi renkantis mobilųjį telefoną.
Balso atpažinimo funkcijos bent jau kol kas, naudojamos vos kelioms pagrindinėms telefono funkcijoms valdyti. Pirmiausia ši funkcija naudojama rinkti numerį balsu (name dialing). Dėl ribotų telefono resursu, rezultatai nėra itin įspūdingi. Pirmieji telefonai su kalbos atpažininno sistema gali .atpažinti iki dešimties vardų, kurių kiekvienas priskirtas vienai iš telefonų knygelės pozicijų. Tai leidžia vartotojui, paspaudusiam mygtuką, ištarti vardą to žmogaus, kuriam norima paskambinti. Telefonas, atpažinęs vardą, patvirtins paklausimą garsiniu signalu ir pradės skambinti to vardo priskirtam numeriui.
Antra funkcija, kuriai lengvai pritaikoma balso atpažinimo sistema, yra įeinančiojo skambučio priėmimas arba atmetimas (call answen’ng). Ši funkcija paranki naudojantis laisvu rankų įranga,
Kodėl atsirado mobiliųjų telefonų balso atpažinimo sistemos, paaiškinti galėtų keletas populiariausių taikymo atveju Bene dažniausiai pasitaikanti situacija vartotojas vairuojantis, automobilį ir tuo pat metu kalbantis telefonu. Tai yra pavojinga, nes trukdo vairuotojui susikaupti ir stebėti situaciją kelyje. Paskaičiuota, kad surinkti numerį užtrunka maždaug 15 s. 0 važiuojant 100 km/h greičiu per šį laiką galima nuvažiuoti iki 400 metrų. Todėl daugelyje šalių kalbėti telefonu vairuojant uždrausta ir išlygos galioja tik laisvų rankų įrangai. Tačiau net ir naudojant laisvų rankų įrangą, renkant numerį ar norint atsakyti į skambutį, rankas tenka atitraukti nuo vairo, o akis nuo situacijos kelyje, o tai tam tikrose situacijose gali būti pavojinga. Naudodamasis balso atpažinimo sistema, vairuotojas gatvėje elgsis žymiai saugiau.
Dar viena iš priežasčių balso atpažinimo sistemoms atsirasti yra vis stiprėjanti tendencija visais įmanomais būdais didinti telefonų ekranus. Šią “madą” diktuoja naujos paslaugos, ypač WAP. Tačiau telefonas, nepaisant to, turi išlikti mažas, todėl neišvengiamai tenka mažinti klaviatūrą. Tiesa, kartais kišeninių kompiuterių pavyzdžiu vietoje klaviatūros, ar dubliuojant ja, naudojamas lietimui jautrus ekranas. Tačiau ir tai tik dalinė išeitis, nes telefoną naudojant skambinti nuo to tik tampa komplikuočiau. Kadangi balsas yra naturaliausia žmogiško bendravimo priemonė, todėl natūraliai atrodo, kad patogiausia vartotojo sąsaja ir yra kalbos atpažinimas.
Dar viena iš priežasčių vis labiau populiarėjanti “Bluetooth” technologija. “Ericsson” jau kurį laiką reklamuoja ausinę su mikrofonu, leidžiančią be jokio laido kalbėtis telefonu. Ir tai galima daryti net neimant paties telefono aparato į rankas, ar esant nuo jo keliu metrų atstumu. Suderinus šį tikrai patogų priedą su balso atpažinimo technologija, būtų gautas labai patrauklus naudojimo būdas, tinkamas tiek važiuojant automobiliu, tiek ir dirbant biure. Tačiau tam, kad iki galo būtų išnaudoti tokios ausinės siūlomi privalumai, reikia, kad balsu būtų galima valdyti bene visas pagrindines telefono funkcijas skambinimą, skambučio priėmimą bei atmetimą, kai kurias operacijas su telefonų knygele.
Pati atpažinimo sistema, atrodytų, nėra tokia sudėtinga, kaip kad, tarkime, kompiuteriams skirtos balso atpažinimo programos, kurios diktuojamą tekstą verčia elektroniniu tekstu. Vis dėlto tenka pripažinti, kad jai reikia patenkinti nemažai reikalavimų. Bene daugiausia problemu kyla todėl, kad mobilusis telefonas naudojamas įvairiose aplinkose tiek triukšmingose vietose (pavyzdžiui, gatvėje ar oro uoste), tiek ir ramiose ar tai būtų biuro patalpa, ar gamta. Svarbiausia, kad balso komandos net ir tokiose skirtingose aplinkose būtų atpažįstamos vienodai. Labai svarbu ir tai, kad balso atpažinimo sistema reaguotų tik į jai skirtas komandas ir nepradėtų skambinti nuo atsitiktinių garsų .
Pilnai, arba sąlyginai išbaigtai, Įdiegus šią technologiją mobiliuosiuose .telefonuose – būtų vienas iš tikrai sėkmingų šio tūkstantmečio pradžios balso technologijos taikymo pavyzdžių. Juk žymiai patogiau yra iššaukti kurį nors meniu punktą balsu, nei kad spaudinėti mygtukus. Be to, tai garantuotų didesnį saugumą keliuose, kur vairuotojai, kalbantys telefonu, neretai kelia pavojų savo bei kitų sveikatai. Tiesa, kol kas sunku tikėtis galimybės diktuoti telefonui SMS žinutes arba el. pašta, tačiau svarstoma ir tokia galimybė. Telefonai, kuriems galima diktuoti balsu, ženkliai palengvintų gyvenima neįgaliesiems ar tai būtų akli, ar judėjimo sutrikimų kamuojami žmonės.6. Balso atpažinimo programų pritaikymo sritys
6.1. Kredito kortelė
Kredito kortelė, kuria galima pasinaudoti tik tada, jei išgirstamas savininko balsas, galėtų tapti nauju efektyviu ginklu prieš sukčius. Kortelės savininkui balsu pasakius slaptažodį jis patikrinamas kortelėje esančios balso atpažinimo mikroschemos. Pagrindinis tokios apsaugos priemonės tikslas – neleisti vagims pasinaudoti vogta kortele, o kitiems sukčiams – pasinaudoti svetima kortele užsakant prekes internetu.
Prototipinį produktą pagamino bendrovės „Beepcard“ specialistai iš Kalifornijos valstijos (JAV). Tai yra pirmasis bandymas standartinio dydžio kredito kortelėje sutalpinti mikrofoną, garsiakalbį, bateriją ir garso atpažinimo lustą. Tiesa, bandymas nėra visiškai sėkmingas: nors kortelė yra tokio paties ilgio ir pločio, kaip standartinė atsiskaitymo priemonė, tačiau jos storis yra tris kartus didesnis nei įprastos kortelės. Bendrovės vadovo Alano Sege’o (Sežo) teigimu, inžinieriai planuoja naudoti mažesnius lustus ir taip sumažinti kortelės storį.
Balsu „atrakinama“ kortelė sukurta kiek senesnės „Beepcard“ technologijos, skirtos apsaugai nuo neteisėto kortelės panaudojimo perkant prekes internetu, pagrindu. Senesnio pavyzdžio kortelėje nebuvo mikrofono, tačiau buvo garsiakalbis, kuris „supypsi“ akustinį identifikavimo signalą, o šis per kompiuterio mikrofoną perduodamas tarnybinei stočiai, patvirtinančiai, jog pirkėjas turi kortelę. Identifikavimo signalas keičiamas kiekvieną kartą, kai tik atliekamas naujas užsakymas.
Tačiau ši senoji technologija negali sutrukdyti sukčiams pasinaudoti pavogta kortele. Naujesnės kortelės taip pat naudoja identifikavimą pypsint, tačiau iš jos negalima išgauti nė garso, kol neišgirstamas šeimininko pasakytas slaptažodis. Kortelės vagims tektų ne tik žinoti slaptažodį, bet ir labai tiksliai atkartoti savininko balsą.
Paprastos balso atpažinimo sistemos jau daug metų naudojamos mobiliuosiuose telefonuose – vartotojas gali balsu pasirinkti kam bus skambinama. Sunkiausia šiuo atžvilgiu tekusi užduotis – sukurti tokią garso priėmimo, atpažinimo ir skleidimo sistemų grandinę, kad ji su maitinimo šaltiniu tilptų į kortelę.
Energijos šaltimo veikimą pailgina tai, jog grandinė įjungiama tik tada, kai kortelė naudojama. Paspaudus kortelės paviršiuje esantį mygtuką ji moterišku balsu paprašo ištarti slaptažodį. Jei balso atpažinimo sistema priima slaptažodį, kortelės garsiakalbis išpypsi identifikacijos kodą, kuris perduodamas tarnybinei stočiai, kad ši galėtų leisti vykdyti pinigų pervedimą.
Tikimasi, kad galutiniam vartotojui pateiktų kortelių baterijos bus tokios talpios, kad 2 metų laikotarpyje bus galima atlikti po 10 kasdieninių pervedimų. Tačiau baterijos talpa – ne vienintelė problema. Ji dar turi būti ir pakankamai patvari bei lanksti, kad nesulūžtų. „Beepcard“ šią problemą bando spręsti patalpindami bateriją į kortelės kampą, kuris lankstosi mažiau nei kortelės centras.6.2. Intelektualus bankomatai
Tai intelektualūs bankomatai, sudaryti iš „Wincor Nixdorf“ modelio „ProCash“ įrangos ir atviros programinės įrangos „ProTopas“. Kuriant naujus produktus naudojamos naujausios technologijos, pavyzdžiui, vaizdo apdorojimo ir balso atpažinimo technologijos.
Balsu valdomi bankomatai: Bankomatas, kurį galima valdyti balsu, ypač tinka žmonėms su fizine negalia. Pvz., tokiais bankomatais gali naudotis prastai matantys žmonės. Bankomatai atlieka visas funkcijas, kurios jiems nurodomos balsu, išskyrus PIN kodo įvedimą (tai būtina saugumui).
Bankomatas veikia visiškai taip, kaip ir naudojant įprastus mygtukus. Bankomatas pritaikytas kelioms kalboms. Balso atpažinimo technologija, įdiegta į bankomatą – tai dar vienas reikšmingas žingsnis biometrijos srityje ir bankinių technologijų plėtroje.
Balsu valdomas bankomatas buvo sukurtas Balso technologijų centro Sankt Peterburge sukurtų technologijų pagrindu.
Kalbos atpažinimas : Kalbos atpažinimas turėtų tapti raktu į visiškai naują elektronikos rinkos sektorių. Ši technologija padarys asmeninius kompiuterius prieinamus daugeliui žmonių, be to, ji yra reikalinga trečiosios kartos (3G) mobiliajai telefonijai.

“Asmeninių kompiuterių naudojimą šiandien būtų galima palyginti su tuo, kaip buvo kasama žemė kastuvais iki išrandant ekskavatorių, ¬ sako dr. Michaelis Dertouzos, vadovaujantis Massachusetso technologijos instituto (MIT) kompiuterių mokslo laboratorijai. ¬ Šiandien reikia pasitelkti savo smegenis, rankas ir akis. Ateities kompiuteriams pakaks vien smegenų, o jiems valdyti nereikės nei akių, nei rankų. Vietoj to galėsime su kompiuteriais kalbėti pranešdami, ko mes iš jų norime, kokį jie turi atlikti darbą. Aš galėsiu paprasčiausiai pasakyti savo kompiuteriui: “Užsakyk man savaitgalio kelionei bilietą į Atėnus už pačią mažiausią kainą”. Kompiuteris jau iš anksto žinos, kokios klasės skrydžius ir viešbučius aš dažniausiai pasirenku, kokią sumą aš galiu išleisti, o visa kita jam nesudarys didelių problemų.”

Netgi ir Amerikoje, kurioje tūkstančiui gyventojų šiandien tenka daugiausiai kompiuterių, apie 30 proc. žmonių dar neturi jokio kompiuterio, nes juos gąsdina jo sudėtingumas ir naudojimosi juo sunkumai. Kai kompiuteris sugebės suprasti žmogaus kalbą, tada jis taps taip lengvai naudojamu, kad visi panorės jį įsigyti.7. Ateities technologijos
2005-ieji nebe už kalnų, ir nors technologijos patobulėjo, mūsų miestai, namai ar darbo vietos, trumpai tariant, mūsų gyvenimas, dar nėra toks, koks buvo pranašautas būsiąs prieš 40 ar 50 metų. Vis dėlto žmonės nori įsivaizduoti, kaip viskas atrodys ateityje.

Kompiuteriai taps žmoniškesni: Naujos technologijos leis jums sąveikauti su kompiuteriu iš esmės panašiai kaip su kitu žmogumi, taip kompiuteriją paversdamos natūralesne. Kai kalbame apie tai, jog kompiuteriai taps žmogiškesni, mes turime galvoje, kad jie įgaus žmogiškesnių bruožų, pavyzdžiui, galimybę reaguoti į tariamus žodžius ar rašomas instrukcijas natūraliau. To dėka vartotojo sąsaja atrodys ir elgsis žmogiškiau, net jei programa, kuria dirbama, ir neturi “dirbtinio intelekto”. Vienas būdų patenkinti troškimą sukurti žmogiškesnę vartotojo sąsają – suteikti šiek tiek asmeniškumo.
Suprantantys AK: Turbūt vienas pagrindinių reikalavimų tam pasiekti yra natūralios kalbos apdorojimas, arba galimybė atsakyti į klausimą, kuris užduotas taip pat, kaip ir jūs jį užduodate kitam žmogui. Vienas garsiausių tokios technologijos panaudojimo pavyzdžių – paieškos “Internete” svetainė “Ask Jeeves”, kuri pateikia atsakymus į natūralia kalba užduotus klausimus. Nors ši svetainė neturi jokios asmeniškumo gyslelės, kitos panašios tarnybos bando sukurti žmogiškesnius veikėjus. Taip atsirado “tauškaliai” (chatterbot) – tariami veikėjai, kuriems galite užduoti klausimą ir gauti atsakymą. “Tauškaliai” neapsimeta turintys kokių nors įgimtų protinių gabumų, o tiesiog atsako į klausimus, kurie atitinka užprogramuotą temą.Kai kurie “tauškaliai” neturi jokio žmogiškumo, kai kurie jo turi daugiau. Pavyzdžiui, bendrovės “Big Science Co.” sukurta Andrette ne tik atsako į klausimus, bet ir demonstruoja skirtingus veikėjo paveikslėlius – atitinkamai pagal veido išraišką. Kai natūrali kalba ar “tauškalius” naudojamas programai kontroliuoti, sukuriama kai kurių specialistų vadinama socialinė vartotojo sąsaja..

Balso atpažinimas: Kitas metodas, kuriant žmogiškesnes vartotojo sąsajas, yra balso atpažinimas, kuris nepaprastai greitai tobulėja. Programos, pavyzdžiui “Dragon NaturallySpeaking” ar “IBM ViaVoice”, puikiai atpažįsta nuolatinę kalbą. Vienintelis tokių programų trūkumas – reikalavimas tarti skyrybos ženklus – taip pat bus greitai panaikintas. Daug darbo įdėta, stengiantis panaikinti būtinybę vartotojui “prisijaukinti” programą prie savo balso. Pavyzdžiui, IBM pademonstravo programą, kuri, su ja susisiekus telefonu, atsakys į jūsų klausimus be jokio pasirengimo. Iš tikrųjų dauguma tyrinėtojų kuria tokias telefonu paremtas sistemas. Anot jų, dauguma žmonių namuose vis dar neturi ryšio su “Internetu”, tačiau turi telefoną, tad tokiomis sistemomis būtų suteikta galimybė naudotis programomis vis daugiau žmonių.

Daugeliu aspektų “Windows” ar “Macintosh” vartotojo sąsajos, kurias mes laikome tikromis grafinėmis VS, nedaug tepasikeitė nuo tų laikų, kai buvo sukurtos “Xerox” PARC tyrimų centre. Nors mes prie jų pripratome, be pelės šias sąsajas valdyti yra labai sudėtinga. Kuo rečiau norėsime naudoti klaviatūrą ar pelę, tuo labiau teks susimąstyti apie jų pamainą. Balso atpažinimas, pavyzdžiui, taps vis dažniau naudojamas automobiliuose ir kai kuriuose buitiniuose įrenginiuose. Telefoninėse sistemose tiek balso atpažinimas, tiek ir jo sintezė bus taikoma vis dažniau.

Natūrali kalba: Programinė įranga, kuri supranta mūsų kalbą, egzistuoja jau seniai. Neseniai pasirodė keletas naujų tokių programų. Programa “Actioneer” leidžia parašyti frazę, pavyzdžiui, “suplanuoti susitikimą su Jonu 4 valandą”, ir automatiškai sutvarko atitinkamą įrašą kalendoriuje. Programa veikia su “Microsoft Outlook”, “Lotus Notes” bei kai kuriais rankiniais įrenginiais. Panaši programa “Portico”, be to, gali dar ir perskaityti jums elektroniniu paštu gautas žinutes, peržvelgti naujienas bei akcijų kainas telefonu. Šios programos yra įspūdingos ir naudingos, tačiau jos dar toli nuo to, kad galėtume jas vadinti gudriomis.. Jos supras jus tik tol, kol kalbėsite apie kažką, susijusį su paštu, adresais ar kalendoriumi. Programos neleis jums peržengti nustatyto pasaulio ribos.

Natūralios kalbos sąsajos gali būti ženklu, kad programos tampa gudresnės, tačiau ir kitose srityse programos tampa žmogiškesnės – prilygdamos ir kartais viršydamos mūsų sugebėjimus.

Šiandienos mokslo pasaulyje kalbotyra darosi vis labiau priklausoma nuo informacinių technologijų. Vakarų Europos patirtis rodo, jog taikomosios kalbotyros šakos – kompiuterinė lingvistika, kompiuterinė lingvodidaktika, terminologija šiuolaikinėje lingvistikoje yra bene perspektyviausios.
Šiuolaikinės informacinės technologijos leidžia diegti efektyvius tekstų analizės, kalbų studijų, automatinio vertimo bei šnekamosios kalbos sintezės metodus. Viena iš populiariausių informacinių technologijų, reikalingų natūraliai kalbai apdoroti, yra įvairių tipų tekstynai – programiškai apdoroti didelių apimčių elektroninių tekstų rinkiniai.Išvados
1. Aktyviau plėtoti balso technologijas ir skatinti jų taikymą.
2. Nedelsiant spręsti lietuviškos sintezės panaudojimo problematiką.
3. Plačiau išnaudoti mokslinį potencialą įgyvendinant įvairius su balso technologijomis susisijus projektus.
4. Gerinti visuomenės informatyvumą apie Lietuvoje nuveiktus darbus šioje srityje.
5. Balso technologijos – tai vienintelis šansas neįgaliesiems pilnavertiškai jaustis bendroje konkurencinėje aplinkoje.
6. Balso technologijų taikymas garantuotų didesnį saugumą keliuose, kur vairuotojai, kalbantys telefonu, neretai kelia pavojų savo bei kitų sveikatai
7. Informaciškai grįsti balso programinės įrangos kūrimą, koordinuojant svarbiausius aspektus su kompetetingais subjektais.
8. Kalbos atpažinimas turėtų tapti raktu į visiškai naują elektronikos rinkos sektorių. Ši technologija padarys asmeninius kompiuterius prieinamus daugeliui žmonių.

Literatūra ir šaltiniai

1. www.likit.lt/frames/turinys/turinys.htm

2. www.kalba.ktu.lt/Mokslas/mokslo%20programa.doc

3. www.vlkk.lt/nutarimai/dokumentas.96.html

4. www.online.5ci.lt/Article.asp?Long=L&ArticleID=107

5. www.rtn.lt/rtn/0001/penkios.html

www.rtn.lt/rtn/0204/pokalbis.html

6. www.bs2.lt/default2.asp?DL=L&TopicID=124

www.bs2.lt/default2.asp?DL=L&TopicID=176

7. www.mks.lt/print/lt/main/topicals/press?ID=57

8. www.rtn.lt/rtn/0001/penkios.html

Leave a Comment