Govor in jezikovne tehnologije


1 Uvod


Nekako stereotipna predstava je, da jezikoslovec zdolgočaseno zeha, kakor hitro je govora o tehničnih stvareh. Nekaj pozornosti se mu zdijo vredne navadno šele potem, ko se pokvarijo ali ne delujejo tako, kot bi želel, ter s tem ovirajo neko njegovo dejavnost ali hotenje. Da bi sodeloval v procesu nastajanja tehničnih izdelkov, jezikoslovec ni navajen.


S prehodom v digitalno dobo se ta vzorec morda nekoliko spreminja, vsaj v določenem segmentu. V povezavi z jezikoslovjem so izrazito tak segment jezikovne tehnologije. Zanimanje jezikoslovcev zanje narašča: ne samo zanimanje za njihovo uporabo, vse več jezikoslovcev doma in še več v tujini je aktivnih tudi v procesu razvoja jezikovnih tehnologij.


Toda kaj pravzaprav označuje termin jezikovne tehnologije? Kakšno mesto ima govor v jezikovnih tehnologijah? Kako skuša tehnologija obravnavati, posnemati, procesirati ... tako kompleksno stvar, kot je človeški (po)govor? Nadaljnjih vprašanj je še veliko, toda za začetek že teh preveč. V tem prispevku zelo strnjeno podajam pregled jezikovnih tehnologij ter razpravljam o govoru z vidika govornih tehnologij, tj. tistega dela jezikovnih tehnologij, ki se ukvarja z govorom.


2 Jezikovne tehnologije


Jezikovne tehnologije v vsakdanji rabi pomenijo računalniške produkte, ki so tesno povezani z jezikom. To so lahko npr. črkovalnik ali slovnični pregledovalnik, ki smo ga navajeni uporabljati, ko pišemo besedila v elektronski obliki. Nekoliko manj pogosto uporabljamo avtomatsko povzemanje, še manj rudarjenje podatkov. Zelo ali celo najbolj značilni produkti jezikovnih tehnologij pa so na primer sintetizator govora, ki besedilo, zapisano v elektronski obliki v program za sintezo, izgovori/prebere. Obratno razpoznavalnik govora besedilo, ki ga izgovorimo v mikrofon, zapiše s črkami in ga na primer prikaže na ekranu. Strojni/avtomatski prevajalnik je lahko narejen za prevajanje pisnih besedil ali za prevajanje govora, kjer na primer v pogovoru s tujcem naš govor prevede v govor v tujem jeziku, govor tujca pa v govor v slovenskem jeziku. Produkt jezikovnih tehnologij je lahko tudi sistem dialoga, ki lahko prav tako deluje za pisno ali govorno komunikacijo; na primer informacijski portal, kjer poizvedujete po določeni vrsti informacij, pri tem pa se pogovarjate z računalnikom, ne človekom. Med produkte jezikovnih tehnologij lahko štejemo tudi korpus besedil s programskim vmesnikom – konkordančnikom, ki uporabniku omogoča avtomatsko iskanje po besedilih, ali različne elektronske slovarje.


Večina naštetih produktov jezikovnih tehnologij je razvitih tudi za slovenski jezik, povezave do njih najdemo prek spletnih strani Slovenskega društva za jezikovne tehnologije (http://nl.ijs.si/sdjt/sdjt-www.html), njihove predstavitve pa v zbornikih konference Jezikovne tehnologije (Erjavec, Gros, 1998; Erjavec, Gros, 2000; Erjavec, Gros, 2002; Erjavec, Gros, 2004; Erjavec, Gros, 2006).


Do zdaj smo govorili samo o končnih produktih jezikovnih tehnologij. Vendar širše gledano termin jezikovne tehnologije zajema celoten proces razvoja jezikovnih tehnologij, osredotočen okoli razvoja jezikovnih virov ter učenja in razvoja algoritmov. Ločiti moramo namreč končno aplikacijo – recimo računalniški program z uporabniškim vmesnikom, razvit za neko konkretno uporabo – od tehnologije same, tj. algoritmov, zapisanih v programskih jezikih. V ozadju vsakega od zgoraj navedenih produktov je praviloma več zelo kompleksnih algoritmov. Šele ko so ti razviti, lahko razmišljamo, kako jih bomo združili v nek konkreten produkt z uporabniškim vmesnikom.


Za razvoj algoritmov potrebujemo vire, ki vsebujejo znanje o jeziku in iz katerih se lahko algoritmi učijo (iščejo vzorce obnašanja). Govorimo o jezikovnih virih. Ti so najrazličnejši, zgrajeni tako, da kar najbolje ustrezajo potrebam določene aplikacije oziroma algoritma. Za lažji pregled jih lahko ločimo na:

Nadalje lahko jezikovne vire ločimo na:

Govorni jezikovni viri v osnovi vključujejo posnetke govora. To so lahko posnetki za namene neke aplikacije vnaprej napisanih in prebranih besedil, posnetki javnega govornega nastopanja, posnetki pogovorov ... Zelo pogosto so posnetki ortografsko in/ali fonemsko prepisani ter segmentirani, velikokrat pa so vanje vključene še različne jezikoslovne, akustične (šumi med govorom, ozadje, kanal ...), sociolingivistične (podatki o govorcih) informacije ...


Z jezikovnimi tehnologijami se tesno povezujejo tudi jezikoslovne raziskave, ki temeljijo na jezikovnih virih in si pomagajo z orodji digitalnih tehnologij. Velik del teh se zbira okoli korpusnega jezikoslovja. Korpus pomeni računalniško zbirko besedil oz. delov besedil, zbranih po enotnih kriterijih za namene različnih raziskav (Gorjanc, 2005). Pomemben del aktivnosti korpusnega jezikoslovja je gradnja korpusov, saj so raziskave in njihovi rezultati odvisni od sestave korpusa in jezikoslovnih informacij, ki jih vključuje. Bistvo korpusnega jezikoslovja pa je seveda korpusna analiza, ki se lahko uporabi na tako rekoč katerem koli področju raziskav jezikoslovja (leksikologiji in leksikografiji, besedotvorju, besediloslovju, v analizi diskurza, sociolingvistiki, prevodoslovju ...) ali tudi v kakšnih nejezikovnih študijah. Korpus z iskalnimi algoritmi ali konkordančnikom je izredno močno raziskovalno orodje, saj omogoča večjo zanesljivost raziskav in preverjanje njihovih rezultatov, prav tako pa prinaša novo metodologijo raziskovanja in nov pogled na jezik ter tako oblikuje samostojno raziskovalno področje.


V jezikovnih tehnologijah se pogosto uporablja tudi termin računalniško jezikoslovje, ki je, poenostavljeno povedano, raziskovanje jezika iz računalniške perspektive. Računalniški jezikoslovci razvijajo računalniške modele za različne jezikovne pojave. V jezikoslovje lahko uvrstimo zlasti tiste raziskave računalniškega jezikoslovja, ki skušajo s pomočjo programiranja in računalniških algoritmov najti razlage določenih jezikovnih pojavov. Sicer pa je velik del računalniškega jezikoslovja usmerjen v učenje in razvoj algoritmov, potrebnih za produkte jezikovnih tehnologij.


Navedena področja jezikovnih tehnologij povzema shema 1.


Shema 1: Prikaz procesov in področij, ki jih običajno zajema termin jezikovne tehnologije.


Pri jezikovnih tehnologijah torej sodelujejo tehnološke vede in jezikoslovje. Znanja obeh ved se na vsakem od navedenih področij – produkti, algoritmi, jezikovni viri, jezikoslovne raziskave – prepletajo, kljub temu pa je jezikoslovje bolj aktivno zlasti pri razvoju jezikovnih virov in jezikoslovnih raziskavah, pri razvoju algoritmov in produktov pa tehnološke vede.


3 Govor v govornih tehnologijah


Jezikovne tehnologije vključujejo raziskave, razvoj in aplikacije tako za govorni kot pisni prenosnik. Znotraj jezikovnih tehnologij pa se je uveljavil poseben termin za tiste raziskave, razvoj in aplikacije, ki se ukvarjajo z govorom: govorne tehnologije. Sem sodijo predvsem sinteza govora, razpoznava govora, strojno simultano prevajanje govora, govorni sistemi dialoga ter govorni viri in raziskave, povezane s temi področji. Razvoj govornih tehnologij je namreč v veliko pogledih precej različen od tehnologij, ki procesirajo pisna besedila.


Aplikacije govornih tehnologij morajo delovati ali vsaj naj bi delovale v vsakdanji jezikovni rabi. Govorne tehnologije se v praksi na vsakem koraku srečujejo z variabilnostjo jezikovne rabe, jezikoslovni opisi, ki se v tehnologije integrirajo prek jezikovnih virov, pa so vedno samo idealiziran opis rabe. Govorne tehnologije so tako prisiljene iskati načine za obvladovanje te variabilnosti. Pri tem danes prevladujejo statistični pristopi – na podlagi vzorcev se izračunava najbolj pogosta in s tem najbolj verjetna jezikovna uresničitev, nato pa se dejanska uresničitev primerja s poznanimi vzorci. Uspešnost tehnologije je tako v veliki meri odvisna tudi od vzorcev, zajetih v jezikovne vire: bolj kot so podobni jezikovni rabi v praktični aplikaciji govornih tehnologij, večjo uspešnost tehnologij omogočajo.


Perspektiva, s katere tehnologije gledajo na govor, je precej drugačna od perspektive jezikoslovca, filozofa, sociologa, antropologa ...: cilj tehnologije ni razložiti, spoznati govor in procese, ki so z njim povezani, ampak v čim večji meri usposobiti za isto ali zelo podobno aktivnost tehnološke izdelke. Čeprav je ta naloga v veliki meri res odvisna od poznavanja človeškega govora in procesov, ki se ob tem aktivirajo, pa razvoj tehnologije vseeno zahteva nove, binarnemu sistemu prilagojene pristope, ki so bolj ali manj omejeni na raven materialnega in merljivega.


3.1 Govor kot akustični signal


Obravnavanje govora v govornih tehnologijah lahko v osnovi ločimo na dve ravni. Na prvi ravni se govor obravnava kot akustični signal. Prvi cilj govornih tehnologij je pretvoriti ta signal v besedilo (razpoznavanje govora) in obratno, pretvoriti zapisano besedilo v akustični signal (sinteza govora). Razpoznavanje in sinteza govora sta torej usmerjena v razmerje med akustičnim signalom in besedilom.


Akustični signal:


Pripadajoče besedilo:

tam ne kje konec maja oziroma sredini maja


Razvoj tehnologije pogosto poteka po stopnjah. Tako pri razpoznavanju govora v začetni fazi govorimo o razpoznavanju izoliranih besed, bolj izpopolnjena tehnologija je potrebna za razpoznavanje fraz, velik kakovostni preskok pomeni razpoznavanje tekočega branega govora, nadalje razpoznavanje spontanega govora (monologa), najtežavnejše pa je nedvomno razpoznavanje govora v pogovoru. Ne glede na stopnjo zahtevnosti pa se mora tehnologija soočiti z variabilnostjo jezikovne rabe: akustična slika posameznega fonema se nenehno spreminja, odvisno od akustičnega okolja, jezikovnega konteksta, govorca, situacije itd. Izračunamo lahko le približek, kar pa nikakor ni dovolj za razlikovanje med posameznimi fonemi. Na ravni besedila je stvar še veliko bolj kompleksna, saj ni mogoče predvideti natančnih stavkov in povedi, ki bodo izrečeni. Obstoječe tehnologije te probleme običajno rešujejo s kombiniranjem različnih algoritmov: predprocesiranjem, v katerem se v akustičnem signalu loči šum od govora, osrednji modul pa združuje iskalni algoritem, akustično modeliranje (razpoznavanje na ravni fonemov oz. trifonov), pri razpoznavanju tekočega branega ali spontanega (po)govora pa še jezikovno modeliranje (predvidevanje verjetnosti zaporedja besed v danem besednem kontekstu).


Sinteza govora skuša pretvoriti zapisano besedilo v akustični signal. Ta se lahko tvori sintetično, lahko pa se posname naravni akustični signal – človeški govor (t. i. korpusna sinteza). Danes prevladuje drugi postopek. Zanj je potreben jezikovni vir, ki vsebuje govor enega, profesionalnega govorca, fonemsko prepisan in segmentiran po fonemih. Sinteza govora kombinira foneme oz. natančneje trifone iz jezikovnega vira v nov govor, pri čemer mora algoritem poiskati najprimernejše segmente. Naloga nikakor ni trivialna, saj je isti fonem v različnih kontekstih izgovorjen zelo različno; v novem kontekstu se morajo zato različne akustično-prozodične značilnosti izgovorjenih fonemov (formantna slika, višina tona, dolžina fonema, jakost, intonacijska krivulja...) kar najbolje skladati, sicer sintetizirani, zlepljeni govor ne zveni naravno.


3.2 Govorjeno besedilo


Tehnologijo za razpoznavo in sintezo govora je mogoče integrirati v različne praktične aplikacije. Razvoj širših jezikovnokomunikacijskih zmožnosti tehnologij se zadnji čas usmerja v zmožnost smiselne komunikacije stroja s človekom (sistem dialoga) in zmožnost avtomatskega prevajanja pogovora. Takšni sistemi poleg razpoznave in sinteze govora zahtevajo dodatne module, npr. za strojno prevajanje, dialog ... Medtem ko smo pri sintezi in razpoznavi govora izpostavili akustični signal in razmerje med akustičnim signalom in besedilom, pa je pri strojnem prevajanju ali dialogu predmet zanimanja govorjeno besedilo v ortografskem zapisu in njegova interpretacija. Pri tem ostaja pomembna razlika v primerjavi z jezikovnimi tehnologijami, ki se ukvarjajo z izvorno pisnim besedilom: besedilo, ki je produkt spontanega govora ali pogovora, je v veliko pogledih zelo različno od izvorno pisnega besedila in zahteva drugačne tehnološke rešitve.


Resničen medčloveški pogovor, zapisan na papir, imamo pravzaprav redko priložnost brati. Tukaj navajam primer pogovora iz baze Turdis (Verdonik, Rojc, 2006). Odlomek je začetek pogovora, v katerem potencialna stranka po telefonu pokliče turistično agencijo, ker jo zanimajo informacije o ZDA (opis oznak v prepisu je v prilogi):


Ako1: dober dan želim "kompas" izvolite

K29: eee dober dan

K29: [N-]mene zanima eee č()[-N] mmm pravzaprav imam[m/a:m][N-]vprašanje[-N] dve vprašanji za[:] vaše ponudbe

K29: pa me zanima prvo[*][N-]za[-N] [.] če je že izšel katalog [N-]iz[:][-N] eee za "severno Ameriko" ?

K29: letos [.] za letošnje ...

Ako1: eee danes dobimo kataloge zdaj[z/a:j] pa če bo to vse[fs*E:] vmes noter za čez poletje pa to tako[t/a:k] vas zanima ne?

K29: ja tudi pa že zdaj[z/a:j] če je že kaj za prvi maj

Ako1: prvomajsko imam[m/a:m] katalog za vse[fs*E:] kompletno imamo[m/a:mO] en katalog in tudi[t/u:d] imamo[m/a:mO] naše ponudbe eee na spletnih straneh objavljene[Obj/a:UlEnE]

Ako1: [SOGOVORNIK_aha][SOGOVORNIK_aha]

Ako1: ja ampak za kasneje pa kaj[*] bo danes prišlo danes[d/a:ns] [1]

Ako1 [prekr]: [2] pozno popoldan jutri bo tu

K29 [prekr]: aha ravno danes ?


Govorne tehnologije opazujejo medčloveški, naravni pogovor predvsem kot skupek problemov, za katere je treba najti tehnološke rešitve. Kot težavne lastnosti različni avtorji navajajo netekočnosti (glej npr. izjavo pa me zanima prvo[*][N-]za[-N] [.] če je že izšel katalog [N-]iz[:][-N] eee za "severno Ameriko"), obotavljanja (npr. eee), napačne začetke (npr. [N-]mene zanima eee č()[-N]), hmkanje (v slovenščini pogosteje eee oz. mmm), ponavljanja (npr. prvomajsko imam[m/a:m] katalog za vse[fs*E:] kompletno imamo[m/a:mO] en katalog), diskurzne označevalce (v zgornjem primeru eee/mmm, zdaj, ne?, aha, ja), odsotnost ločil itd. Vendar pri tem večinoma naštevajo na površinskem besedilu opazne lastnosti. Ker je pogovor v jezikoslovju manj raziskan od pisne jezikovne rabe, pa so lahko to tudi izzivi za jezikoslovne raziskave ali razmišljanja o pogovoru in njegovih jezikovnih značilnostih ter o vzrokih in učinkih rabe za pogovor značilnih jezikovnih sredstev.


V slovenističnem jezikoslovju je pogovor ali govorjeni diskurz šele zadnji čas pogosteje predmet raziskav. Članke na to temo najdemo med drugim zbrane v posebnem poglavju zbornika Obdobja (Kržišnik, 2004), posamezni pa so tudi v drugih revijah ali publikacijah, npr. Kranjc, 1996/97, o strukturi in značilnostih konverzacije na primeru govora otrok; Vitez, Zwitter Vitez, 2004, o problemih prozodične analize spontanega govora; Smolej, 2004, o načinih tvorjenja govorjenega diskurza; Verdonik, 2006a, o diskurznih označevalcih v pogovoru; Verdonik, 2006b, o samopopravljanjih v pogovoru. Pomemben prispevek na to temo so seveda tudi članki v tem zborniku. V tujini, zlasti za angleški jezik, je razumljivo znanstvene in strokovne literature o pogovoru precej več, preglede pa najdemo npr. v Eggins, Slade, 1997, ali Schiffin, 1994.


Eden osrednjih razlogov, da z znanstvenega stališča pogovor dokaj slabo poznamo, je gotovo težavno zbiranje avtentičnega gradiva, za kar je potrebnega precej truda, določena tehnična sredstva in, ne najenostavneje, tudi privoljenje govorcev. Danes pomeni zbiranje takšnega gradiva, ki poteka tudi ob spodbudi in v okviru govornih tehnologij, gradnjo korpusa govorjenih besedil ali govornega korpusa. Za veliko svetovnih jezikov takšne zbirke že obstajajo, običajno ima kar nacionalni korpus posameznega jezika vključena tudi govorjena besedila. Slovenski nacionalni korpus FidaPlus (www.fidaplus.net) kot tudi Nova beseda (bos.zrc-sazu.si/s_beseda.html) govorjenih besedil v času pisanja tega prispevka še ne vključujeta oz. jih ne vključujeta v zadostnem obsegu, se pa pripravljajo načrti za tak korpus (Zemljarič, Stabej, 2006). Korpus govorjenih besedil, v katerem je zbrana velika količina avtentičnega gradiva, je nujen za uspešen razvoj govornih tehnologij, saj – kot smo povedali zgoraj – tehnologija oz. algoritmi temeljijo na jezikovnih virih, iz katerih se učijo. Tak korpus pa je osrednji vir tudi za mnoge jezikoslovne in druge humanistične in družboslovne raziskave govora ali govorjenega diskurza.


4 Zaključek


Prispevek skuša na kratko predstaviti jezikovne tehnologije in jezikoslovje v jezikovnih tehnologijah, nato pa razpravlja o govoru z vidika govornih tehnologij. Skladno z duhom tehnologije je tudi govor v njej obravnavan predvsem v tistih segmentih, kjer se manifestira tudi kot materialen, merljiv pojav, to pa je po eni strani akustični signal in po drugi, kadar je prepisan s črkami ali fonetičnimi znaki, govorjeno besedilo. Razvoj tehnologije poteka po stopnjah, z omejevanjem na manjše, poenostavljene, rešljive probleme. Toda tudi skozi iskanje tehnoloških rešitev za zelo poenostavljene cilje, ki nikakor ne dosegajo nivoja človeške sposobnosti za govorno komunikacijo, prodira večplastnost in kompleksnost govora.


Jezikoslovje in druge humanistične in družboslovne vede se raziskovanju človeškega (po)govora v večji meri posvečajo šele zadnja desetletja. Z govornimi tehnologijami se v te tokove vključujejo tudi tehnološke vede. Njihov prispevek k spoznavanju govora moramo ceniti vsaj zaradi izredno močnih orodij, ki omogočajo zanesljivejše in natančnejše raziskovanje, ter spodbud za raziskovanje, ki jih dajejo humanističnim in družboslovnim vedam, nikakor pa ne smemo zapostavljati niti metodoloških pristopov in njihove razlagalno-dokazovalne zmožnosti, ki lahko vnesejo nove perspektive tudi v humanistiko in družboslovje. S praktičnimi produkti govornih tehnologij pa lahko pričakujemo vplive tudi na naše vsakdanje življenje – integracije govornih tehnologij najdemo v napredni telefoniji, zanimiva je za medije (npr. za avtomatsko podnaslavljanje), za ljudi z motnjami vida ali sluha ...


6 Literatura


  1. Eggins, S., D. Slade, 1997. Analysing casual conversation. London, Washington: Cassell.

  2. Erjavec, T., J. Žganec Gros, (ur.), 2002. Jezikovne tehnologije – zbornik konference. Ljubljana: Institut Jožef Stefan.

  3. Erjavec, T., J. Žganec Gros, (ur.), 2004. Jezikovne tehnologije – zbornik B 7. mednarodne multikonference Informacijska družba IS 2004. Ljubljana: Institut Jožef Stefan.

  4. Erjavec, T., J. Žganec Gros, (ur.), 2006. Jezikovne tehnologije – zbornik 9. mednarodne multikonference Informacijska družba IS 2006. Ljubljana: Institut Jožef Stefan.

  5. Gorjanc, V., (ur.), 2003. Jezik in slovstvo 48/3-4. Tematska številka Jezikovne tehnologije za slovenščino. Ljubljana: Zveza društev, Slavistično društvo Slovenije.

  6. Gorjanc, V., 2005. Uvod v korpusno jezikoslovje. Domžale: Izolit.

  7. Kranjc, S., 1996/97. Govorjeni diskurz. Jezik in slovstvo 42/7. 307-319.

  8. Kržišnik, E., (ur.), 2004. Aktualizacija jezikovnozvrstne teorije na Slovenskem. Mednarodni simpozij Obdobja – Metode in zvrsti. Ljubljana: Center za slovenščino kot drugi/tuji jezik. 385-469.

  9. Schiffrin, D., 1994. Approaches to discourse. Oxford, Cambridge: Blackwell.

  10. Smolej, Mojca, 2004. Načini tvorjenja govorjenega diskurza – paradigmatska in sintagmatska os. V: Erika Kržišnik (ur.). Aktualizacija jezikovnozvrstne teorije na Slovenskem: členitev jezikovne resničnosti (Obdobja, Metode in zvrsti, 22). Ljubljana: Center za slovenščino kot drugi/tuji jezik.

  11. Verdonik, D., 2006a. Mhm, ja, no, dobro, glejte, eee ...: diskurzni označevalci v telefonskih pogovorih. Jezik in slovstvo 51/2. 19-36.

  12. Verdonik, D., 2006b. Popravljanja v spontano tvorjenih izjavah. Slavistična revija 54/2. 188-203.

  13. Verdonik, D., Rojc, M., 2006. Are you ready for a call? – Spontaneous conversations in tourism for speech-to-speech translation systems. V: Proceedings of LREC'06. Italija: Genova.

  14. Vitez, P., A. Zwitter Vitez, 2004. Problem prozodične analize spontanega govora. Jezik in slovstvo 49/6. 3-24.

  15. Zemljarič Miklavčič, J., M. Stabej, 2006. Zapisati nezapisljivo: transkribiranje spontanega govora za govorni korpus. V: Erjavec, T., J. Žganec Gros (ur.), 2006. Jezikovne tehnologije – zbornik 9. mednarodne multikonference Informacijska družba IS 2006. Ljubljana: Institut Jožef Stefan.



Priloga: Opis oznak v prepisu pogovora iz baze Turdis


V prepisu pogovora iz baze Turdis je:


Oznaka v prepisu

Opis

Ako1

Oznaka turističnega agenta.

K29

Oznaka klicatelja.

beseda[b@s/e:da]

Beseda in njena izgovorjava, prepisana s simboli SAMPA, kadar odstopa od predvidene zborne izgovorjave.

...

Nedokončana izjava.

bes()

Nedokončana beseda.

?

Rastoča intonacija.

beseda[:]

Predhodni fonem je podaljšan.

[.]

Kratek premor v govoru.

Besedilo [1]

Izjava se nadaljuje v prvem naslednjem segmentu, ki se začne z [2].

[2] besedilo

Nadaljevanje zadnje izjave, ki se konča z [1].

besedilo [P] besedilo

Segment vključuje dve izjavi enega govorca, [P] označuje mejo.

[SOGOVORNIK_aha]

Oporni signal aha, izreče ga sogovornik, ki je sicer trenutno naslovnik (v našem primeru K29).

[N-]

Začetek dela besedila, ki je popravljeno.

[-N]

Konec dela besedila, ki je popravljeno, do točke, kjer je prekinjen.




Summary


In this paper I try to give a short overview of language technologies and a place that linguistics holds in this field, and then I discuss how speech technologies (i.e. the part of language technologies that deals with speech) see and handle speech. In the world of the technologies, the speech is interesting only in its material, measurable form – when it is represented as acoustic signal or (spoken) text, written in alphabet. Speech technologies try to make a computer to write down speech (speech recognition), to pronounce written text (speech synthesis), to translate spoken text (speech translation), or even to communicate with human (dialog system). However, these are very complex processes and the technologies search the solutions by simplifying the task, eg. recognising only isolated words or phrases, limiting the scenarios etc. Nevertheless, they have to deal with variability and complexity of human speech.


In the humanities, some attention was paid to human speech and conversation mostly in the last decades. With speech technologies the technical sciences have found it an interesting subject of research as well. Their contribution to our knowledge about the speech and conversation have to be acknowledged at least for the powerful tools they offer, enabling more precise and reliable research results, for the research stimulations they raise, but as well for the new methodological approaches and new perspectives the humanities can gain from technologies. And with their final products the speech technologies have potential to impact our everyday life – with integrations to telecommunication technology, media, as a support to people with hearing or seeing malfunctions...