Prispevki konference JTDH2024 / Contributions to the JTDH2024 conference

Prispevki konference
Jezikovne tehnologije in digitalna humanistika 2024
Contributions of the
Language Technologies and Digital Humanities Conference

 

Celotni zbornik konference ter posnetka uvodnih nagovorov in strokovnega panela so na voljo na tej povezavi. / The complete conference proceedings, along with videos of the welcome speech and expert panel, are available at this link.


Uvodni nagovori in vabljeni predavanji / Welcome speech and Invited lectures

Špela Arhar Holdt, Andrej Pančur, Jurij Dolžan: Uvodni nagovor / Welcome Speech [video]

Barbara McGillivray: Exploring language change computationally: lessons from interdisciplinary collaborations [PDF+video]

Simon Dobnik: Beyond pixels and words [PDF+video]


Prispevki / Papers

 

Lenka Bajčetić, Vuk Batanović, Tanja Samardžić: Lemmatizing Serbian and Croatian via String Edit Prediction [PDF]

Slobodan Beliga, Ivana Filipović Petrović: Large Language Models Supporting Lexicography: Conceptual Organization Of Croatian Idioms [PDF]

Jaka Čibej, Tina Munda: Metoda polavtomatskega popravljanja lem in oblikoskladenjskih oznak na primeru učnega korpusa govorjene slovenščine ROG [PDF]

Jaka Čibej: First Steps Toward the Compilation of a Safety Dataset for Slovene Large Language Models [PDF]

Filip Dobranić, Nikola Ljubešić: Twitter Before X: Scenes from the Balkans [PDF]

Kaja Dobrovoljc: Extending the Spoken Slovenian Treebank [PDF]

Magdalena Gapsa, Špela Arhar Holdt, Iztok Kosem: Kako dober je ChatGPT pri umeščanju sopomenk pod besedne pomene [PDF]

Boshko Koloski, Senja Pollak, Geraint Wiggins, Nada Lavrač: Generative AI for Computational Creativity Conceptualization [PDF]

Diana Košir, Tomaž Erjavec: Korpus CVET 1.0: Izdelava, opis in analiza zbirke starejših besedil v verski periodiki [PDF]

Jakob Lenardič: Slovenian Particle: Not a Syntactic Category [PDF]

Nikola Ljubešić, Luka Terčon, Kaja Dobrovoljc: CLASSLA-Stanza: The Next Step for Linguistic Processing of South Slavic Languages [PDF]

Nikola Ljubešić Peter Rupnik, Tea Perinčić: Mići Princ – A Little Boy Teaching Speech Technologies the Chakavian Dialect [PDF]

Simona Majhenič: Communicative Intent Divergence of Discourse Markers in Simultaneously Interpreted Speech [PDF]

Matej Martinc, Veronika Bajt, Špela Rot, Senja Pollak: Sistem za zaznavanje sprememb v rabi besed in njegova uporaba za sociolingvistično analizo [PDF]

Katja Meden, Ana Cvek, Vid Klopčič, Matevž Pesek, Mihael Ojsteršek, Mojca Šorn, Andrej Pančur: Unlocking History: A Redesign of the SIstory 5.0 Portal [PDF]

Katja Meden, Tomaž Erjavec, Andrej Pančur: “Parlament je po teoriji polje kontroliranega konflikta”: Slovenski parlamentarni korpus siParl 4.0 [PDF]

Kristina Pahor De Maiti Tekavčič, Nikola Ljubešić, Darja Fišer: Expanding the Frenk Corpus of Socially Unacceptable Discourse to French [PDF]

Ajda Pretnar Žagar: A Corpus Linguistic Characterisation of sPeriodika [PDF]

Tanja Samardžić, Peter Rupnik, Mirjana Starović, Nikola Ljubešić: Mak na konac: A Multi-Reference Speech-To-Text Benchmark for Croatian and Serbian [PDF]

Janez Štebe: Strojna prevedba internetnih naslovov novičarskih prispevkov v naslov na Wayback Archive [PDF]

Aleš Vaupotič, Narvika Bovcon: Osebni podatki v umetnosti: njihova zakonita obdelava in vloga etike v novomedijski kulturi [PDF]

Darinka Verdonik, Nikola Ljubešić, Peter Rupnik, Kaja Dobrovoljc, Jaka Čibej: Izbor in urejanje gradiv za učni korpus govorjene slovenščine ROG [PDF]

Domen Vreš, Martin Božič, Aljaž Potočnik, Tomaž Martinčič, Marko Robnik-Šikonja: Generative Model for Less-Resourced Language with 1 Billion Parameters [PDF]


Povzetki / Abstracts

 

Ksenija Bogetić, Vojko Gorjanc, Jure Skubic, Alenka Kavčič: Gender Ideology : A Corpus-Linguistic Look at Emergent ‘Anti-Gender’ Vocabulary in Slovenia, Croatia and Serbia [PDF]

Alice Fedotova, Adriano Ferraresi, Maja Miličević Petrović, Alberto Barrón-Cedeño: Expanding the European Parliament Translation and Interpreting Corpus: A Modular Pipeline for the Construction of Complex Corpora [PDF]

Mateja Jemec Tomazin: Slovenski terminološki portal [PDF]

Janez Križaj, Jerneja Žganec Gros, Simon Dobrišek: Utilizing Forced Alignment for Phonetic Analysis of Slovene Speech [PDF]

Anna Kryvenko: Degrees of Belonging to Europe in Parliamentary Discourse: A Comparative Corpus-Assisted Study [PDF]

Tina Munda, Špela Arhar Holdt: Na poti k skladenjskim analizam šolskega pisanja: Skladenjski vzorci v korpusu Šolar 3.0 [PDF]

Mojca Stritar Kučuk: KOST 2.0: Predstavitev korpusa in potek označevanja jezikovnih napak [PDF]

Klara Žnideršič, Vid Klopčič, Matevž Pesek, Matija Marolt: The GOVORI.SI Speech Transcription Platform [PDF]


Študentski prispevki / Student papers

 

Matej Klemen: Test poznavanja splošnih besed v slovenščini med udeleženci Mladinske poletne šole slovenščine [PDF]

Meta Kokalj: Parlay: A Method For Constructing a Paragraph-Level NLI Dataset Based on Multi-Category Scenarios [PDF]

Camile Lendering, Manfred González Joaquín Figueira: Efficient Fine-Tuning Techniques for Slovenian Language Models [PDF]

Luka Terčon: Uporaba šestih mer skladenjske kompleksnosti za primerjavo jezika v govornem in pisnem korpusu [PDF]