Pregled posta

Adresa bloga: https://blog.dnevnik.hr/agropolitika

Marketing

HRVATSKI JEZIK U DIGITALNOM DOBU

STARE NOVINE SU – ONLINE


Nakon duge pauze Odjel za jezikoslovlje Matice hrvatske organizirao je predavanje " Hrvatski jezik u digitalnom dobu" 16 ožujka na kojem je glavni predavač bio prof. dr. sc. Marko Tadić redoviti prof. u trajnom zvanju na Odsjeku za lingvistiku na zagrebačkome Filozofskom fakultetu, stručnjak na području računalnog jezikoslovlja, računalne leksikografije i obrade morfologije i strojnog prevođenja. Njegovi znanstveni doprinosi odnosi se na računalnu obradu hrvatskoga jezika, izgradnju hrvatskoga morfološkog leksikona, razvoja teorije i prakse jezičnih tehnologija za hrvatski jezik te razvoja Hrvatskoga nacionalnog korpusa. Hrvatski nacionalni korpus nastao je od odabranih tekstova na hrvatskome jeziku iz svih područja, struka, žanrova i stilova prenesen u digitalni oblik: od književnih i znanstvenih djela do udžbenika, od novinskih tiskovina do mrežnih novina.
U početku je zamišljen u dvije temeljne sastavnice i to od 30 milijunskoga korpusa suvremenoga hrvatskoga jezika u koji su ulazili tekstovi ili njihovi odsječci nastali nakon 1990., isključivo od izvornih govornika, isključivo pisanoga teksta, različitih područja, žanrova i tematike i Hrvatskoga elektroničkoga tekstovnoga arhiva u koji su ulazili tekstovi u cjelini, a ponajprije čitavi nizovi publikacija što podrazumijeva godišta, edicije itd. Koncepciju korpusa 3. generacije, od 2004. karakterizira veći opseg. Od 2005. Hrvatski nacionalni korpus ima 105 milijuna pojavnica i sastoji se od niza potkorpusa koji se mogu digitalno pretraživati pojedinačno i zajedno. „Hrvatski nacionalni korpus od 2013. obasiže više od 216 milijuna pojavnica, a može ga se slobodno pretraživati na https://filip.ffzg.hr „ kaže prof dr. Marko Tadić.

Kako se jezik mijenja u digitalnom prostoru i kako jezik mijenja digitalni prostor? Koja je uloga i važnost jezičnih tehnologija u očuvanju jezika, njegovu razvoju i opisu? Kako digitalnim očuvanjem jezika čuvamo i vlastito kulturno nasljeđe?
Prof. dr. Tadić je na predavanju, na popularan način u okviru današnje primjene i svakodnevnih potreba, govorio o internetu i komunikaciji.
„Između ostaloga je retorički upitao“Tko je 1922. mogao zamisliti postojanje, mobitela, interneta, elektronske pošte, a tko može zamisliti budućnost i kakvi će komunikacijski kanali biti za sto godina, 2122. godine? „ Za jezik koji želio sačuvati morati ćemo imati pomagalo, da taj jezik ne bude gurnut u stranu. Jezik ćemo sačuvati tako da mu omogućimo njegovu funkcionalnost u današnjim komunikacijskim formama: elektronička pošta, razne vrste sustava za razmjenu poruka, Whats App, Mesinger, Viber. Neki su nivoi manje cenzurirani, neki više. To je ono , „dati se u ruke privatnicima“ onda oni imaju pravo čitati, ne samo sve što vi pišete već i pohranjujete. Otvorite svoj google , i piše „ imamo pravo čitati sve poruke vaše pošte, sve vaše dokumente na google stranici, sve vaše dokumente koje pohranjujete i vi ste s tim morate suglasiti“ podsjetio je dr. Tadić te konstarirao –„To nitko ne čita“. Te rekao „.Jedan Twitter isključio je račun predsjednika SAD-a „
Tako je dr. Tadić podsjetio da je društvena internet mreža Twitter isključila trajno račun predsjednika Trumpa u siječnju 2021.s obrazloženjem „ kako bismo spriječili potencijalne daljnje pozive na nasilje”, stajalo je u službenoj izjavi uprave Twittera.
„Dakle budućnost može biti blistava, može biti mračna, ali na nama je da je učinimo blistavom“ – rekao je dr. Tadić.
Odgovarajući na pitanje o ulozi jezičnih tehnologija i kako one mogu pomoći u naslijeđu kulture i njenih vrijednosti i nasljeđa identiteta, dr. Tadić je rekao da je činjenica da moramo prikupiti podatke o hrvatskim vrijednostima. To očuvanje nastaje prenošenjem tekstova koji su nastali objavom, sada u digitalnoj sferi, jer nekad je vrijedilo ono pravilo, što se nije pojavilo na televiziji nije se ni dogodilo. Kada se pojavio internet, međumrežje, danas vrijedi druga priča, čega nema na međumrežju to i ne postoji“ rekao je predavač dr. Tadić


Prof.dr. Marko Tadić drći predavanje o hrvatskom jeziku u digitalnom dobu u Knižari Matice hrvatske, Matice hrvatske 2 ,16. ožujka ove godine. Prisutne su i dr.Ida Raffaelli i dr.Daniela Katunar kao moderatorice.
Fotografija: M.Zouhar Zec

STARE NOVINE SU SADA ONLINE
„Činjenica da se danas događaju velike digitalizacijske kampanje, što znači da tekstovi koji su na papiru se ubrzanim postupkom digitaliziraju i prenose u format digitalnog teksta. Takve kampanje vodi knjižnica HAZU. U Nacionalnoj i sveučilišnoj biblioteci je bilo mnogo starih hrvatskih novina iz druge polovice 19. stoljeća, pogledajte, to je sve sada online.“ rekao je dr. Tadić te nastavio
„Možete proučavati vrlo kvalitetne materijale i sadržaje. To je oblik očuvanja.Pitanje je godina ili desetljeća kada će i Hrvatski državni Arhiv i svi njegovi dokumenti biti digitalizirani. Nije dovoljno samo pretraživati već čete diferencijacijom moći postavljati pametna pitanja. Naši povjesničari tvrde da je proučavanje dokumenata u samom središtu njihove metodologije rada. Zamislite koliko će oni moći uštedjeti vremena kada postave pitanje na način: „želim sve dokumente u kojima se spominje Nikola Šubić Zrinski koji su nastali u 18. stoljeću“ I dobiju odgovor odmah. Zamislite rad povjesničara koji mora potrošiti mjesece tražeći te ili takve dokumente ako još nisu digitalizirani. Danas postoje alati za prepoznavanje imena ljudi, organizacija, tvrtki. A 10 posto svih novinskih tekstova su imena. To su dijelovi teksta koji odgovaraju na stručna novinarska pitanja TKO, GDJE, KADA I KOLIKO. Na pitanje ZAŠTO odgovore daju kolumnisti“ – objasnio je profesor s odjela za lingvistiku.
„A pretražujući po starim tekstovima možete postaviti pitanje : Želim sve tekstove naprimjer u kojima se glagoli slažu uz napr. ime određenog poduzetnika, političara, ministra. A zatim i koji su akuzativi uz to ime? To je poslovno obavještavanje i to su javno dostupni podaci.PR agencije mogu putem internet sustava dobiti informaciju koliko se nekog dana, uz određeno ime, i drugih različitih podataka može saznati.
„ Danas postoje perilice rublja kojoj na jednom od jezika koji ima, možete reći da bijelo rublje želite imati oprano za četiri sata, ne morate je programirati.“ A na zadnje pitanje moderatorice, da li je optimističan po pitanju budućnosti prof.dr. Tadić je odgovorio „Optimistično je da na burzi rada nema nezaposlenih informatičara“
M. Zouhar Zec


VJESNIK JE SASTAVNI DIO HRVATSKOG NACIONALNOG KORPUSA
Na kraju predavanja, jedan je prisutni slušatelj postavio pitanje želeći znati koliko je godina pisanog dnevnog lista Vjesnik digitalizirano, te gdje se digitalizirani materijal može naći?
Prof. dr. Tadić je odgovorio .“ Godine 1998. moja ekipa i ja smo počeli postavljati Hrvatski nacionalni korpus i imamo tekstove Vjesnika od 2000. do 2011.Vjesnik je sastavni dio hrvatskog nacionalnog korpusa. Imamo više od 10 godina Vjesnika. On je relativno kasno krenuo online, i to je korpus od pedesetak milijuna sastavnica. Disk je u Hrvatskom državnom arhivu, a trebalo bi vidjeti i arhiv hrvatskog Weba, a to radi SRCE sa NSB-om. Oni jednom u velikim intervalima pokupe kompletnu rh domenu. I jezično je Vjesnik bio jedna od najboljih novina koju smo ikada imali. Ni jedne novine se nakon Vjesnika ne mogu usporediti s kvalitetom lektorske službe“ rekao je na kraju prof.dr.Marko Tadić s odsjeka za lingvistiku Filozofskog fakulteta u Zagrebu.
M. Zouhar Zec





Post je objavljen 20.03.2022. u 16:48 sati.