Prispevki konference JTDH2024 / Contributions to the JTDH2024 conference

Prispevki konference Jezikovne tehnologije in digitalna humanistika 2024
Contributions of the Language Technologies and Digital Humanities Conference

 

*Celotni zbornik konference je trenutno še v pripravi. / Please note that the complete conference proceedings are currently in preparation.


Vabljeni predavanji / Invited lectures [PDF]

 

Barbara McGillivray: Exploring language change computationally: lessons from interdisciplinary collaborations 

Simon Dobnik: Beyond pixels and words


Prispevki / Papers

 

Lenka Bajčetić, Vuk Batanović, Tanja Samardžić: Lemmatizing Serbian and Croatian via String Edit Prediction [PDF]

Slobodan Beliga, Ivana Filipović Petrović: Large Language Models Supporting Lexicography: Conceptual Organization Of Croatian Idioms [PDF]

Jaka Čibej, Tina Munda: Metoda polavtomatskega popravljanja lem in oblikoskladenjskih oznak na primeru učnega korpusa govorjene slovenščine ROG [PDF]

Jaka Čibej: First Steps Toward the Compilation of a Safety Dataset for Slovene Large Language Models [PDF]

Filip Dobranić, Nikola Ljubešić: Twitter Before X: Scenes from the Balkans [PDF]

Kaja Dobrovoljc: Extending the Spoken Slovenian Treebank [PDF]

Magdalena Gapsa, Špela Arhar Holdt, Iztok Kosem: Kako dober je ChatGPT pri umeščanju sopomenk pod besedne pomene [PDF]

Boshko Koloski, Senja Pollak, Geraint Wiggins, Nada Lavrač: Generative AI for Computational Creativity Conceptualization [PDF]

Diana Košir, Tomaž Erjavec: Korpus CVET 1.0: Izdelava, opis in analiza zbirke starejših besedil v verski periodiki [PDF]

Jakob Lenardič: Slovenian Particle: Not a Syntactic Category [PDF]

Nikola Ljubešić, Luka Terčon, Kaja Dobrovoljc: CLASSLA-Stanza: The Next Step for Linguistic Processing of South Slavic Languages [PDF]

Nikola Ljubešić Peter Rupnik, Tea Perinčić: Mići Princ – A Little Boy Teaching Speech Technologies the Chakavian Dialect [PDF]

Simona Majhenič: Communicative Intent Divergence of Discourse Markers in Simultaneously Interpreted Speech [PDF]

Matej Martinc, Veronika Bajt, Špela Rot, Senja Pollak: Sistem za zaznavanje sprememb v rabi besed in njegova uporaba za sociolingvistično analizo [PDF]

Katja Meden, Ana Cvek, Vid Klopčič, Matevž Pesek, Mihael Ojsteršek, Mojca Šorn, Andrej Pančur: Unlocking History: A Redesign of the SIstory 5.0 Portal [PDF]

Katja Meden, Tomaž Erjavec, Andrej Pančur: “Parlament je po teoriji polje kontroliranega konflikta”: Slovenski parlamentarni korpus siParl 4.0 [PDF]

Kristina Pahor De Maiti Tekavčič, Nikola Ljubešić, Darja Fišer: Expanding the Frenk Corpus of Socially Unacceptable Discourse to French [PDF]

Ajda Pretnar Žagar: A Corpus Linguistic Characterisation of sPeriodika [PDF]

Tanja Samardžić, Peter Rupnik, Mirjana Starović, Nikola Ljubešić: Mak na konac: A Multi-Reference Speech-To-Text Benchmark for Croatian and Serbian [PDF]

Janez Štebe: Strojna prevedba internetnih naslovov novičarskih prispevkov v naslov na Wayback Archive [PDF]

Aleš Vaupotič, Narvika Bovcon: Osebni podatki v umetnosti: njihova zakonita obdelava in vloga etike v novomedijski kulturi [PDF]

Darinka Verdonik, Nikola Ljubešić, Peter Rupnik, Kaja Dobrovoljc, Jaka Čibej: Izbor in urejanje gradiv za učni korpus govorjene slovenščine ROG [PDF]

Domen Vreš, Martin Božič, Aljaž Potočnik, Tomaž Martinčič, Marko Robnik-Šikonja: Generative Model for Less-Resourced Language with 1 Billion Parameters [PDF]


Povzetki / Abstracts

 

Ksenija Bogetić, Vojko Gorjanc, Jure Skubic, Alenka Kavčič: Gender Ideology : A Corpus-Linguistic Look at Emergent ‘Anti-Gender’ Vocabulary in Slovenia, Croatia and Serbia [PDF]

Alice Fedotova, Adriano Ferraresi, Maja Miličević Petrović, Alberto Barrón-Cedeño: Expanding the European Parliament Translation and Interpreting Corpus: A Modular Pipeline for the Construction of Complex Corpora [PDF]

Mateja Jemec Tomazin: Slovenski terminološki portal [PDF]

Janez Križaj, Jerneja Žganec Gros, Simon Dobrišek: Utilizing Forced Alignment for Phonetic Analysis of Slovene Speech [PDF]

Anna Kryvenko: Degrees of Belonging to Europe in Parliamentary Discourse: A Comparative Corpus-Assisted Study [PDF]

Tina Munda, Špela Arhar Holdt: Na poti k skladenjskim analizam šolskega pisanja: Skladenjski vzorci v korpusu Šolar 3.0 [PDF]

Mojca Stritar Kučuk: KOST 2.0: Predstavitev korpusa in potek označevanja jezikovnih napak [PDF]

Klara Žnideršič, Vid Klopčič, Matevž Pesek, Matija Marolt: The GOVORI.SI Speech Transcription Platform [PDF]


Študentski prispevki / Student papers

 

Matej Klemen: Test poznavanja splošnih besed v slovenščini med udeleženci Mladinske poletne šole slovenščine [PDF]

Meta Kokalj: Parlay: A Method For Constructing a Paragraph-Level NLI Dataset Based on Multi-Category Scenarios [PDF]

Camile Lendering, Manfred González Joaquín Figueira: Efficient Fine-Tuning Techniques for Slovenian Language Models [PDF]

Luka Terčon: Uporaba šestih mer skladenjske kompleksnosti za primerjavo jezika v govornem in pisnem korpusu [PDF]