Računalna lingvistika

Izvor: Wikipedija
Skoči na: orijentacija, traži
Jezikoslovlje‎
Jezične razine
Fonetika ¤ Fonologija ¤ Morfologija (jezikoslovlje) ¤ Sintaksa ¤ Leksikologija ¤ Semantika ¤ Stilistika
Jezikoslovne discipline
Primjenjeno jezikoslovlje
Usvajanje jezika
Psiholingvistika
Tipološko jezikoslovlje
Flektivni jezici ¤ Aglutinativni jezici ¤ Izolirajući jezici ¤ Sintetički jezici ¤ Polisintetski jezici
Genetsko jezikoslovlje
Dijalektologija ¤ Poredbeno-povijesno jezikoslovlje
Sociolingvistika
Lingvistička antropologija
Generativna lingvistika
Kognitivna lingvistika
Računalna lingvistika
Deskriptivna lingvistika
Poredbeno jezikoslovlje
Leksikologija
Etimologija
Korpusna lingvistika
teorijsko jezikoslovlje
empirijsko jezikoslovlje
opće jezikoslovlje
računalno jezikoslovlje
Povijest jezikoslovlja
Popis jezikoslovaca
Neriješeni problemi

Računalna lingvistika (još i računska lingvistika, strojno jezikoslovlje, strojna lingvistika, računalno jezikoslovlje[1]), znanstvena je disciplina koja se bavi razvojem kompjuterskih programa koji omogućavaju računsku obradu prirodnog jezika. Predstavlja interdisciplinarno polje istraživanja, objedinjujući rezultate iz teoretskog računarstva, jezikoslovlja, kognitivne psihologije, umjetne inteligencije i logike

Pod obradom prirodnog jezika se podrazumijeva ispravljanje tekstova, ekstrakcija informacija, prijevod, interakcija između čovjeka i računala itd.

Poddiscipline[uredi VE | uredi]

Računalno se jezikoslovlje može podijeliti na više područja s obzirom na to obrađuje li se govorni ili pisani jezik, te pokušava li se jezik sintaksno analizirati (parsirati) ili pak generirati.

  • Prepoznavanje govora i sinteza govora proučavaju načine na koje računalo može prepoznati i razumijeti te generirati (stvoriti) prirodni jezik.
  • Parsiranje i generiranje jezika poddiscipline su računalnog jezikoslovlja koje proučavaju na koji je način sastavljen prirodni jezik.
  • Strojno prevođenje je dio računalnog jezikoslovlja koji se bavi razvojem programa za prevođenje jezika.

Uporaba u praksi[uredi VE | uredi]

Glavni je zadatak računalnog jezikoslovlja stike razvoj računalnih programa koji obavljaju različite zadatke povezane s ljudskim jezikom.

U to spada npr:

  • Potpora korisnika računala pri obradi tekstova kao npr. ispravak pravopisnih grešaka, provjera gramatičke ispravnosti i sl.
  • Automatsko traženje određenih mjesta u tekstovima i to ne samo prema njihovom obliku nego i značenju (Information-Retrieval i tražilice)
  • Potpora pri (potpunom) prevođenju tekstova iz jednog jezika u drugi
  • Obrada govora kod npr. telefonskih informacijskih službi ili uređaja za čitanje za slijepe
  • Pronalaženje informacija poput navoda literarnih djela te odgovaranje na pitanja korištenjem masivnih baza podataka (Information Extraction)
  • Potpora autoru pri pisanju tekstova kao npr. traženje odgovarajućeg izraza i terminologije
  • Interakcija između čovjeka i računala u prirodnom jeziku tako da se računalima mogu služiti i one osobe koje ne poznaju posebne naredbe
  • Računska složenost prirodnog jezika, koja je uvelike modelirana teorijom automata, posebice primjenom kontekstno ovisnih gramatika i linearno ograničenih Turingovih strojeva

Problemi u računalnom jezikoslovlju[uredi VE | uredi]

Neki od problema koje računalno jezikoslovlje mora riješiti su:

  • određivanje značenja riječi: neke riječi imaju ovisno o kontekstu različita značenja (homonimi - riječi istog oblika, ali različitog značenja). U tom se slučaju mora odabrati značenje koje odgovara odgovarajućem kontekstu. S druge su strane potrebni formalizmi za predstavljanje značenja riječi.
  • Sintaksna nejednoznačnost: u ponekim se slučajevima jedna rečenica može na više načina analizirati i tumačiti. Odabir točne analize zahtijeva semantičku informaciju o načinu govora i namjeri govornika. Primjer: "Petar vidi Mariju s dalekozorom" - u ovom slučaju nije jasno vidi li Petar Mariju koja drži dalekozor ili Petar vidi Mariju pomoću dalekozora.
  • neke rečenice izražavaju preneseno značenje (pragmatika)

Kako i daju li se ovi problemi riješiti ovisi uvelike o posebnostima jezika. Štoviše, nastoje se razviti postupci primjenjivi na sve jezike, ali detalji se moraju za svaki jezik posebno obraditi. Jedan program za npr. rastavljanje riječi za engleski ne može se primjeniti za hrvatski.

Računalno jezikoslovlje radi i na razvitku programa koji omogućuju provjeru različitih jezikoslovnih hipoteza. Uvjet koji treba biti ispunjen da bi takvo provjeravanje bilo moguće jest mogućnost računala da simulira radnje koje čovjek riječima jednog jezika vrši.

Izvori[uredi VE | uredi]

  1. Kiš Miroslav, Englesko-hrvatski i hrvatsko-engleski informatički rječnik, Zagreb, Naklada Ljevak, 2000., str. 215

Vanjske poveznice[uredi VE | uredi]