Naziv
Prepoznavanje obavijesti u tekstu
Organizacijska jedinica
Odsjek za lingvistiku
ECTS bodovi
5
Šifra
52301
Semestri izvođenja
ljetni
Nastavnici
Satnica
Predavanja
30
Seminar
15

Cilj
Uvesti studente u područje crpljenja obavijesti s posebnim naglaskom na prvu fazu prepoznavanja i klasifikacije naziva. Osim teorijskog dijela studenti će u drugom dijelu semestra samostalno izrađivati sustav za prepoznavanje i klasifikaciju naziva koji će biti empirijski vrednovan. Primarni jezik obrade je hrvatski jezik uobličen tekstovima iz informativnog registra.
Sadržaj

Ishodi učenja
  1. Vrjednovati izrađena pravila na samostalno prikupljenom korpusu za evaluaciju.
  2. Definirati prepoznavanje i klasifikacija obavijesti u kontekstu lingvistike i računalne lingvistike.
  3. Identificirati temeljne nosioce obavijesti u tekstu prema konvencionalnoj specifikaciji.
  4. Kritički prosuđivati o području crpljenja obavijesti iz različitih perspektiva lingvistike i računalne znanosti.
  5. Opisati razliku između sustava za prepoznavanje i klasifikaciju naziva zasnovanih na pravilima i sustava zasnovanih na strojnom učenju.
  6. Kritički proširiti dijelove teksta koji mogu biti od osobitog značaja istraživaču ovisno o području koje se istražuje
  7. Odrediti strategije i usvojiti metodologiju za izradu gramatika za prepoznavanje i klasifikaciju naziva.
  8. Samostalno izraditi pravila za prepoznavanje i klasifikaciju naziva koristeći postojeći lingvistički alat.
Metode podučavanja
Metode ocjenjivanja

Obavezna literatura
  1. Grishman, Ralph (2003), Information Extraction, Handbook of Computational Linguistics, urednik Ruslan Mitkov, poglavlje 27
  2. Sekine, Satoshi; ‎ Ranchhod, Elisabete (2009) A Survey of Named Entity Recognition and Classification, u Named Entities, 3–28. Philadelphia: John Benjamins. Nisbet
  3. Gross, Maurice (1997), The Construction of Local Grammars, Finite State Devices for Natural Language Processing, (urednici: Roche, E.; Schabes, Y.), MIT Press, Cambridge, MA, str. 329–354.
  4. Donald, David (1996), Internal and external evidence in the identification and semantic categorization of proper names, Corpus Processing for Lexical Acquisition, poglavlje 2, urednici: Boguraev; Pustejovsky, The MIT Press, Cambridge, MA, str. 21–39.
  5. Friburger, Nathalie; Maurel, Denis (2004), Finite-state transducer cascades to extract named entities in texts, Theoretical Computer Science, Vol. 313, Issue 1, str. 93–104
Dopunska literatura

Izborni predmet na studijima
  1. Lingvistika, sveučilišni preddiplomski dvopredmetni studij, 2., 4., 6. semestar
Fakultetska ponuda
  • Preddiplomski studij: Ljetni semestar