Naziv
Strojno prevođenje
Organizacijska jedinica
Odsjek za informacijske i komunikacijske znanosti
ECTS
6
Šifra
52647
Semestri
zimski
Nastavnici
Satnica
Predavanja
30
Seminar
30

Cilj
Cilj kolegija je stjecane kompetencija vezanih uz izradu i primjenu sustava za automatsko strojno prevođenje u cilju prijenosa informacija, u okviru primjene suvremenih disruptivnih tehnologija. Analizirat će se primjena automatskog strojnog prevođenja i drugih jezičnih tehnologija u konkretnim situacijama poslovanja, obrazovanja i svakodnevne upotrebe. Provest će se evaluacija i analiza prednosti i nedostataka pojedinih strategija, arhitektura sustava, evaluacija automatske i ljudske evaluacije. Izradit će se vlastiti sustav i konceputalni model vlastitog sustava kroz integraciju različith disruptivnih tehnologija.
Sadržaj
  1. Uvod. Ciljevi, razlozi za razvojem, primjena, ograničenja strojnog prevođenja. Disruptivne i jezične tehnologije.
  2. Povijesni razvoj – od prve primjene do suvremenih rješenja sustava za strojno prevođenje.
  3. Besplatni prevodilački alati na internetu. Prikaz alata, analiza primjene; Strojno prevođenje temeljeno na pravilima (RBMT).
  4. Statističko strojno prevođenje (SMT). Analiza i evaluacija sustava.
  5. Analiza reursa i vrsta podataka potrebnih za izgradnju automatskog sustava za strojno prevođenje.
  6. Višejezčni informacijski sustav u EU. Analiza i primjena alata i resursa: sustava za strojno prevođenje, prepoznavanje govora, terminoloških baza, itd. Analiza resursa za hrvatski.
  7. Stupnjevi automatizacije. Mogućnosti integracije strojnog prevođenja i drugih sustava u konkretno okruženje.
  8. Automatsko strojno prevođenje u multimediji.
  9. Neuronske mreže. Neuronsko strojno prevođenje (NMT).
  10. Faze evaluacije sustava. Ljudska evaluacija sustava. Višediomenzionalna metrika (MQM).
  11. Automatska evaluacija primjenom različitih metrika (BLEU, NIST, WER, PER, F-mjera,…) i odnos s ljudskom evaluacijom.
  12. Prikaz i analiza sustava za izgradnju prilagođenog sustava za automatsko strojno prevođenje.
  13. Projektni rad: prikupljanje i priprema resursa za izgradnju sustava.
  14. Projektni rad: prikupljanje i priprema resursa za izgradnju sustava.
  15. Prikaz i evaluacija vlastitog sustava. Kritička analiza, mogućnosti primjene, integracije i ograničenja.

Ishodi učenja
  1. objasniti pojam digitalne transformacije kroz primjenu jezičnih i drugih disruptivnih tehnologija
  2. analizirati moguće primjene i ograničenja sustava za automatsko strojno prevođenje u konkretnim situacijama
  3. provesti komparativnu analizu različitih arhitekstuae sustava za automatsko strojno prevođenje temeljenih na jezičnim modelima, statističkom strojnom prevođenje i neuronskim mrežama
  4. objasniti osnovne principe neuronske mreže i primjene neuronskog strojnog prevođenja
  5. provesti prikupljanje različitih vrsta resursa (paralelnih korpusa i drugih izvora) potrebnih za izgradnju sustava za automatsko strojno prevođenje, pripremiti resurse za izgradnju sustava
  6. provesti evaluaciju sustava za automatsko strojno prevođenje primjenom ljudske i automatske metrike
  7. kritički procijeniti mogućnosti integracije sustava za strojno prevođenje u proces obrade dokumenta i dohvaćanja višejezičnih informacija
  8. - osmišljavanje i izgradnja vlastitog modela sustava za strojno prevođenje i provođenje evaluacije
  9. - provođenje evaluacije uz kritički pristup softvera za automatsko računalno prevođenje, prijevodnih memorija i terminoloških baza
  10. - analiza moguće primjene sustava za strojno prevođenje u konkretnim situacijama i analiza ograničenja
  11. - analiza potreba, uvjeta i ishoda unutar radne jedinice prilikom uvođenja tehnologije za računalno prevođenje
  12. - osmišljavanje i izgradnja vlastitog modela sustava za strojno prevođenje i provođenje evaluacije
  13. - primjena i analiza korpusa u izradi sustava za strojno prevođenje
  14. - provođenje evaluacije uz kritički pristup softvera za automatsko računalno prevođenje, prijevodnih memorija i terminoloških baza
  15. - analiza moguće primjene sustava za strojno prevođenje u konkretnim situacijama i analiza ograničenja
  16. Primijeniti znanja iz različitih područja računalne obrade jezika
  17. Interpretirati probleme vezane za dizajn, razvoj, evaluaciju i realizaciju dijaloških sustava utemeljenih na prirodnom jeziku
  18. Identificirati i usporediti vodeće trendove i razvoj računalnih tehnologija te tehnologije naprednog pretraživanja
Metode podučavanja
Metode poučavanja: klasično i primjenom sustava za e-učenje
- Predavanja – teorijski dio
- Vježbe – kroz samostalne zadatke
- Seminar – kroz samostalni ili timski rad
Metode ocjenjivanja
Konačna ocjena čini ukupnost znanja i ispunjenih obaveza tijekom nastavnog razdoblja, a stječe se prikupljanjem bodova kroz izvršene praktične zadatake (samostali rad), projekti zadatak kroz timski rad (istraživanje, prezentacija, izlaganje) i pismeni ispit.

Obavezna literatura
  1. Dovedan, Z.; Seljan, S.; Vučković, K. Strojno prevođenje kao pomoć u procesu komunikacije. Str. 283-291. Informatologia 35 (4), 2002, 283-291
  2. European Commission, DGT. Translation Tools and Workflow, 2012.
  3. Introduction to Machine Translation: An Online Tutorial, 2008.
  4. Seljan, S.; Gašpar, A. Primjena prevoditeljskih alata u EU i potreba za hrvatskim tehnologijama. Zagreb : HDPL, 2009, 617-625.
  5. Kučiš, V.; Seljan, S.; Klasnić, K. Evaluation of Electronic Translation Tools Through Quality Parameters // INFuture2009 - Digital Resources and Knowledge Sharing . Zagreb : Odsjek za informacijske znanosti, 2009, 341-351
  6. Seljan, S. Hrvatski jezik i računalno prevođenje: Hrvatski online. InfoTrend.hr - onLINE, 2014.
  7. Seljan, S.; Dunđer, I. Machine Translation and Automatic Evaluation of English/Russian-Croatian, 2015. 72-79
  8. Seljan, S.; Tucaković, M.; Dunđer, I. Human Evaluation of Online Machine Translation Services for English/Russian-Croatian. Springer. 353, 2015.
  9. Seljan, S.; Dunđer, I.; Pavlovski, M. Human quality evaluation of machine-translated poetry // 2020 43rd International Convention on Information, Communication and Electronic Technology (MIPRO): proceedings / Koricic, Marko... [et al] (ur.). Rijeka: Croatian Society for Information, Communication and Electronic Technology - MIPRO, 2020. str. 1040-1045 doi:10.23919/MIPRO48935.2020
  10. Dunđer, I. Seljan, S.; Pavlovski, M. Automatic machine translation of poetry and a low-resource language pair // 2020 43rd International Convention on Information, Communication and Electronic Technology (MIPRO): proceedings / Koricic, Marko... [et al] (ur.). Rijeka: Croatian Society for Information, Communication and Electronic Technology - MIPRO, 2020. str. 1034-1039 doi:10.23919/MIPRO48935
Dopunska literatura
  1. Zetzshe, Jost: A Translator's Tool Box - A Computer Primer. International Writer's Group, 2014.
  2. Nirenburg, S; Somers, H; Wilks, Y. Readings in Machine Translation. MIT, 2003
  3. Maegaard, Bente, ed. MT Summit VIII: Machine Translation in the Information Age. Proceedings, Santiago de Compsotela, Spain, 2001.
  4. Görög, A. Quantifying and benchmarking quality: the TAUS Dynamic Quality Framework, 2014.
  5. Seljan, S.; Brkić, M.; Kučiš, V. Evaluation of Free Online Machine Translations for Croatian-English and English-Croatian Language Pairs, 2011.
  6. 8Brkić, M.; Seljan, S.; Matetić, M. Machine Translation Evaluation for Croatian-English and English-Croatian Language Pairs // NLPCS Workshop: Human-Machine Interaction in Translation / Sharp, Bernardette ; Zock, Michael ; Carl, Michael ; Jakobsen, Arnt Lykke (ur.). Copenhagen : Copenhagen Business School, 2011. 93-104
  7. Seljan, S.. Sublanguage in Machine Translation. Proceedings of 23rd International Convention MIRO 2000: Computers in Intelligent Systems CIS + CTS . Str.17-20. Rijeka: Liniavera, 2000.
  8. Allen, James. Natural Language Understanding
  9. TAUS Translation Technology Landscape, 2020.

Obavezan kolegij na studijima
  1. Informacijske znanosti, sveučilišni prijediplomski jednopredmetni studij, 5. semestar
Fakultetska ponuda
  • Prijediplomski studij: Zimski semestar