Matična ustanova projekta: Institut za hrvatski jezik
Trajanje projekta: 31. prosinca 2023. – 30. prosinca 2027.
Voditeljica projekta: dr. sc. Goranka Blagus Bartolec, Institut za hrvatski jezik, Zagreb
Suradnici na projektu:
dr. Magdalena Baer, Instytut Filologii Słowiańskiej, Uniwersytet im. Adama Mickiewicza, Poznań, suradnica
dr. sc. Petra Bago, Filozofski fakultet Sveučilišta u Zagrebu, suradnica
dr. sc. Goranka Blagus Bartolec, Institut za hrvatski jezik, Zagreb, voditeljica projekta
dr. sc. Gorana Duplančić Rogošić, Ekonomski fakultet, Split, suradnica
dr. sc. Barbara Kovačević, Institut za hrvatski jezik, Zagreb, suradnica
dr. sc. Ivana Kurtović Budja, Institut za hrvatski jezik, Zagreb, suradnica
dr. sc. Ivana Matas Ivanković, Institut za hrvatski jezik, Zagreb, suradnica
dr. sc. Antonia Ordulj, Fakultet hrvatskih studija, Zagreb, suradnica
dr. sc. Mirjana Šnjarić, Filozofski fakultet Sveučilišta u Zagrebu , suradnica
U okviru projekta razvit će se 5 baza – opća baza višerječnih izraza, baza frazema, baza hrvatskih poslovica, baza višerječnih izraza u okviru hrvatskoga kao inoga jezika, baza glagolskih kolokacija hrvatskoga, poljskoga, njemačkoga i engleskoga jezika.
Podatci uneseni u bazu bit će koristan izvor za:
1. različita jezikoslovna istraživanja,
2. unaprjeđenje korpusnih alata za prepoznavanje višerječnih izraza (općih i stručnih kolokacija, frazema, poslovica, pragmema, gramatičkih sveza),
3. istraživanja na kontrastivnoj razini za potrebe prevođenja, izrade paralelnih korpusa te u poučavanju i učenju hrvatskoga kao inoga jezika.
Baze višerječnih izraza danas su jedan od temeljnih jezičnih resursa svakoga jezika te ključna karika u razvoju obrade prirodnoga jezika. Stoga je izrada takva mrežnog resursa strateški važna i za hrvatski jezik te za povezivanje hrvatskoga jezika s drugim jezicima (poljskim, njemačkim, engleskim).
Internetska stranica projekta: https://mwe-cro.jezik.hr/o-projektu/