KONFERENCA JEZIKOVNE TEHNOLOGIJE IN DIGITALNA HUMANISTIKA 2024

19. in 20. september 2024
Fakulteta za elektrotehniko Univerze v Ljubljani

 

Slovensko društvo za jezikovne tehnologije (SDJT), Center za jezikovne vire in tehnologije Univerze v Ljubljani (CJVT) ter raziskovalni infrastrukturi CLARIN.SI in DARIAH-SI organiziramo bienalno mednarodno konferenco “Jezikovne tehnologije in digitalna humanistika”. Konferenca se ponaša z več kot 20-letno tradicijo, tematsko širitev na digitalno humanistiko pa smo uvedli leta 2016. Organizacijski odbor konference letos upravlja ZRC SAZU, organizacija pa poteka v sodelovanju s Fakulteto za elektrotehniko Univerze v Ljubljani, ki bo dogodek gostila 19. in 20. 9. 2024.

 

  1. Tematska področja
  2. Pomembni datumi
  3. Vabljeni predavanji
  4. Predkonferenčni dogodki
  5. Paneli
  6. Navodila za avtorje
  7. Organizatorji

Tematska področja konference

Na konferenco vabimo raziskovalce, ki delujejo v različnih disciplinah in metodoloških okvirih. Vabimo prispevke z naslednjih področij:

  • govorne in druge eno- in večjezične jezikovne tehnologije;
  • digitalno jezikoslovje: prevodoslovje, korpusno jezikoslovje, leksikologija in leksikografija, standardizacija;
  • digitalna humanistika in zgodovinopisje, literarne vede, etnologija, muzikologija, kulturna dediščina, umetnost ter arheologija;
  • digitalna humanistika v izobraževanju in digitalna publicistika.

Dobrodošli so prispevki, ki predstavljajo smernice, raziskave, dobre prakse, projekte in rezultate na teh področjih. V sklopu konference bodo tudi vabljeni predavanji, študentska sekcija ter paneli o aktualnih temah, povezanih s konferenco. Uradna jezika konference bosta slovenščina in angleščina.

Vabljeni predavanji


Barbara McGillivray

“Exploring language change computationally: lessons from interdisciplinary collaborations”

 

Izvleček predavanja: Napredne računalniške metode nam omogočajo analizo ogromnih količin podatkov in odkrivanje prej nezaznavnih vzorcev. Le malo algoritmov za obdelavo jezika pa ustrezno upošteva dinamično naravo jezika, predvsem semantiko, ki je ključna za humanistične raziskave. Potekajo prizadevanja, da bi sistemi umetne inteligence bolje razumeli zgodovinski kontekst in dinamiko jezika, na primer pri samodejnem zaznavanju semantičnih premikov, vendar za zaznavanje finih odtenkov jezika in kulturnega konteksta še vedno potrebujemo človeško označevanje in interpretacijo. Na predavanju bom poročala o interdisciplinarnem projektu, v katerem smo za analizo učinkov mehanizacije na razvoj angleškega jezika v 19. stoletju sodelovali digitalni humanisti, računalniški jezikoslovci, programerji in knjižničarji. Razpravljala bom o izzivih in spoznanjih, ki jih je prineslo združevanje množičenja za označevanje zgodovinskega jezika, algoritmov in oblikovalskih eksperimentov. Integracija omenjenih pristopov nam namreč omogoča večplastno razumevanje evolucije jezika ob prihodu mehanizacije ter v širšem prispeva k interdisciplinarnim raziskavam na stičišču umetne inteligence in humanističnih ved.

O predavateljici: Barbara McGillivray is predavateljica digitalne humanistike in računalniške kulturologije na oddelku za digitalno humanistiko King’s College London in raziskovalka na inštitutu Alan Turing. Je glavna urednica revije Journal of Open Humanities Data, koordinatorka magistrskega programa Digitalna humanistika na King’s College London, predsednica posebne interesne skupine za jezikovne tehnologije za socio-ekonomske vede in humanistiko pri združenju ACL ter koordinatorka posebne interesne skupine “Humanistika in podatkovna znanost” na institutu Alan Turing. Njene raziskave se osredotočajo na računalniške metode za raziskovanje jezikovnih sprememb tako v zgodovinskem jeziku kot v sodobnih podatkih. Bila je med glavnimi raziskovalci projekta Living with Machines (Živeti s stroji), obsežnega sodelovanja med inštitutom Alan Turing in narodno knjižnico British Library, pri katerem so skozi analizo britanskih zbirk zgodovinskega časopisja raziskovali učinke mehanizacije. Njena najnovejša knjiga je “Applying Language Technology in Humanities Research. Design, Application, and the Underlying Logic“ (soavtor Gábor Mihály Tóth, Palgrave Macmillan 2020).



Simon Dobnik

“Beyond pixels and words”

 

Izvleček predavanja: Besed ne uporabljamo v izolaciji. Ko govorimo, jih povezujemo s predhodnim znanjem, z namenom interakcije – s kakšnim namenom govorimo, kdo je naš sogovornik, kaj je bilo povedano prej – našim skupnim razumevanjem, s čuti in zaznavanjem fizičnega sveta in situacij okrog nas. Govor pa ni edini način, s katerim prenašamo informacije: interakcije potekajo v pisanju, simbolih, z različnimi vrstami besedil, s pogledom, gestami in drugimi lastnostmi naših teles. Jezikovni modeli v jezikovnih tehnologijah pomen primarno luščijo iz besedil, občasno pa tudi iz drugih modalnosti, kot so slike in akustični signal. To nas postavlja pred dve vprašanji: (i) v kolikšni meri te modalnosti predstavljajo in posredujejo semantično znanje za različne naloge in uporabe obdelave naravnega jezika in (ii) kako semantično znanje iz teh modalnosti prenesti v druge modalnosti – kako bi velike jezikovne modele pripeljali v resnični svet in jih peljali na sprehod? Na predavanju bom predstavil raziskave, s katerimi naslavljamo ta vprašanja, in orisal izzive, ki nas čakajo v prihodnosti.

O predavatelju: Simon Dobnik je profesor računalniškega jezikoslovja na oddelku za filozofijo, jezikoslovje in teorijo znanosti na univerzi Gothenburg na Švedskem. Deluje kot član Centre for Language Technology (CLT) in član Centre for Linguistic Theory and Studies in Probability (CLASP), kjer vodi skupino za kognitivne sisteme. Njegove raziskave vključujejo: (i) podatkovne modele in strojno učenje pomenskih reprezentacij za jezik, delovanje in zaznavanje, (ii) semantične modele jezika, delovanja in zaznavanja (računalniška semantika), (iii) učenje reprezentacij v jeziku, sklepanju in razložljivosti, (iv) interpretacijo in generiranje prostorskih opisov in referenc, (v) interaktivno učenje z majhnimi količinami podatkov, (vi) pristranskost in varnost podatkov, ter (vii) multimodalni dialog, robotiko in s tem povezane teme. 

Predkonferenčni dogodki

Dan pred konferenco, 18. septembra 2024, organiziramo tri predkonferenčne dogodke:

Predviden urnik:

09:00-13:00 Delavnica CLASSLA-Express
09:00-13:00 Delavnica LaTeX za humaniste
14:00-15:00 Okrogla miza o velikih jezikovnih modelih v korpusnem jezikoslovju
15:00-17:00 Mreženje južnoslovanskih raziskovalcev in centrov ReLDI in CLASSLA

Zadnja postaja CLASSLA-Express – serije delavnic, na katerih udeleženci raziskujejo korpuse južnoslovanskih jezikov z uporabo konkordančnikov CLARIN.SI (Skopje TBA, Zagreb 19. april, Rijeka 26. april, Beograd 29. maj, Ljubljana 18. september). Delavnica bo potekala v angleščini, za sodelovanje na delavnici se je treba prijaviti. Več informacij najdete na https://www.clarin.si/info/wp-content/uploads/2024/05/Call-for-participation_CLASSLA-Express_LJ.docx.pdf


Brez nočnih mor zaradi urejanja dokumentov: uvod v LaTeX za humaniste

V tej praktični delavnici bodo udeleženci spoznali uporabo programa LaTeX. To je visokozmogljivi urejevalnik besedil, ki se vse pogosteje priporoča in uporablja tudi v digitalni humanistiki in jezikoslovju. LaTeX občutno olajša upravljanje kompleksne strukture in bibliografije, saj omogoča učinkovit nadzor nad vsebino dokumenta z rednimi in samodejnimi posodobitvami sklicev. Poleg tega zagotavlja enostavno prilagoditev besedila v skladu z vsakokratno predlogo, ki jo predvideva določena konferenca ali znanstvena revija. Tako kot številni drugi priljubljeni urejevalniki besedil je tudi LateX mogoče uporabljati v programskih okoljih, ki omogočajo sodelovalno delo.

Delavnica je namenjena predvsem začetnikom, ki nimajo ali imajo malo izkušenj z urejevalnikom LaTeX. Glavni cilj delavnice je udeležence naučiti, kako pristopiti k izdelavi dokumenta v LaTeXu od samega začetka. Prikazani bodo ključni koraki pri pripravi dokumenta, posvetili pa se bomo tudi  upravljanju bibliografije. Delavnica bo prilagojena raziskovalnim potrebam udeležencev in bo izvedena v angleščini ali slovenščini, odvisno od občinstva.


Okrogla miza o uporabi velikih jezikovnih modelov v korpusnih raziskavah – ključno vprašanje današnjih korpusnih jezikoslovcev, prepoznano na prvih dveh postajah delavnice CLASSLA-Express.


Mreženje južnoslovanskih raziskovalcev CLASSLA (center znanja za južnoslovanske jezike) in ReLDI Centre Belgrade, namenjen razpravi o bodočih organizacijskih, infrastrukturnih in splošnih usmeritvah obeh organizacij ter nasploh mreženju raziskovalcev, ki se zanimajo za južnoslovanske jezike.

Paneli

Napredki in perspektive v raziskavah govorne komunikacije

Vodja panela Darinka Verdonik

Področje raziskav govorne komunikacije sega od tradicionalnih jezikoslovnih disciplin do najsodobnejših komunikacijskih tehnologij, ustvarjajoč široko paleto raziskav in inovacij. Ta panel združuje aktivne raziskovalce s področij računalniškega jezikoslovja, govornih tehnologij, korpusnega jezikoslovja in tradicionalnih jezikoslovnih disciplin, ki bodo razpravljali o najnovejših dosežkih in izzivih na svojih raziskovalnih področjih, o motivih, ki so gonilo njihovih raziskav, ter o tem, kako lahko raziskave govorne komunikacije naslavljajo družbene izzive, s katerimi se soočamo danes. Pridružite se nam na raziskovanju prihodnjih izzivov v raziskavah govorne komunikacije, kjer se skozi soočanje teoretičnih pogledov in praktičnih aplikacij razkriva prihodnost tega dinamičnega področja. 

Pomembni datumi

    • 1. 3. 2024: prvi klic za prispevke
    • 17. 5. 2024: rok za oddajo prispevkov in povzetkov
    • 31. 5. 2024: podaljšani rok za oddajo prispevkov in povzetkov
    • 5. 7. 2024: obvestilo o sprejetju prispevka / povzetka
    • 23. 8. 2024: oddaja končnega prispevka / povzetka
    • 23. 8. 2024: rok za registracijo
    • 18. 9. 2024: predkonferenčni dogodki oz. delavnice
    • 19. in 20. 9. 2024: konferenca JTDH 2024

Navodila za prispevke

Za konferenco zbiramo tako razširjene povzetke kot tudi polne prispevke. Razširjeni povzetki bodo objavljeni v knjižici povzetkov, polni prispevki pa v konferenčnem zborniku. Oboji bodo ob začetku konference objavljen na konferenčni spletni strani pod licenco Creative Commons. Avtorjem prepuščamo odločitev, ali bodo razširjeni povzetek oz. polni prispevek v recenziranje oddali anonimizirano ali ne.

Uradna jezika konference sta slovenščina in angleščina.

Polni prispevki naj bodo dolgi 4000–6500 besed, razširjeni povzetki pa 2000–3000 besed. Za pripravo prispevka v slovenščini uporabite predlogo za Word, predlogo za LaTeX [.zip] ali Overleaf predlogo za LateX (.zip in Overleaf vsebujeta tako angleško kot slovensko različico). Predloga za Word za prispevke v angleščini je na voljo na angleški strani konference.

Prispevke zbiramo preko platforme EasyChair na tej povezavi.

Avtorji študentskih (polnih) prispevkov naj ob oddaji to označijo tako, dodajo ključno besedo (keyword) “študentski prispevek”. Pri študentskih prispevkih morajo biti vsi avtorji do- ali podiplomski (magistrski, doktorski) študenti. Ti prispevki bodo imeli na konferenci svojo sekcijo, izbran in nagrajen pa bo tudi najboljši študentski prispevek.

Organizacija

Organizacijski odbor

  • Jerneja Fridl (predsednica OO, predstavnica DARIAH-SI), Znanstvenoraziskovalni center Slovenske akademije znanosti in umetnosti
  • Mojca Šorn (predstavnica DARIAH-SI), Inštitut za novejšo zgodovino
  • Ana Cvek (predstavnica DARIAH-SI), Inštitut za novejšo zgodovino
  • Simon Dobrišek (predstavnik CJVT), Fakulteta za elektrotehniko, Univerza v Ljubljani
  • Katja Meden (predstavnica CLARIN.SI), Institut “Jožef Stefan”
  • Kaja Dobrovoljc (predstavnica SDJT), Filozofska fakulteta, Univerza v Ljubljani
  • Miha Peče (predstavnik DARIAH-SI), Znanstvenoraziskovalni center Slovenske akademije znanosti in umetnosti
  • Miha Seručnik (predstavnik DARIAH-SI), Znanstvenoraziskovalni center Slovenske akademije znanosti in umetnosti

Programski odbor

Predsedstvo programskega odbora

  • Špela Arhar Holdt (predsednica PO, predstavnica CJVT), Filozofska fakulteta in Fakulteta za računalništvo in informatiko, Univerza v Ljubljani
  • Slavko Žitnik (predstavnik SDJT), Fakulteta za računalništvo in informatiko, Univerza v Ljubljani
  • Tomaž Erjavec (predstavnik CLARIN.SI), Institut “Jožef Stefan”
  • Jakob Lenardič (predstavnik DARIAH-SI), Inštitut za novejšo zgodovino
  • Matej Klemen (študentska sekcija), Fakulteta za računalništvo in informatiko, Univerza v Ljubljani
  • Tina Munda (študentska sekcija), Filozofska fakulteta, Univerza v Ljubljani 
  • David Bordon (študentska sekcija), Filozofska fakulteta, Univerza v Ljubljani 

Člani programskega odbora

  • Saša Babič, Inštitut za slovensko narodopisje, ZRC SAZU
  • Petra Bago, Filozofska fakulteta, Univerza v Zagrebu
  • Vuk Batanović, Inovacijski center Elektrotehniške fakultete, Univerza v Beogradu
  • Narvika Bovcon, Fakulteta za računalništvo in informatiko, Univerza v Ljubljani
  • Václav Cvrček, Inštitut češkega narodnega korpusa, Karlova univerza v Pragi
  • Jaka Čibej, Fakulteta za računalništvo in informatiko, Univerza v Ljubljani
  • Simon Dobrišek, Fakulteta za elektrotehniko, Univerza v Ljubljani
  • Helena Dobrovoljc, Inštitut za slovenski jezik Frana Ramovša, ZRC SAZU
  • Kaja Dobrovoljc, Filozofska fakulteta, Univerza v Ljubljani
  • Jerneja Fridl, ZRC SAZU
  • Polona Gantar, Filozofska fakulteta, Univerza v Ljubljani
  • Vojko Gorjanc, Filozofska fakulteta, Univerza v Ljubljani
  • Jurij Hadalin, Inštitut za novejšo zgodovino
  • Ivo Ipšić, Univerza na Reki
  • Mateja Jemec Tomazin, Inštitut za slovenski jezik Frana Ramovša, ZRC SAZU
  • Alenka Kavčič, Fakulteta za računalništvo in informatiko, Univerza v Ljubljani
  • Iztok Kosem, Filozofska fakulteta, Univerza v Ljubljani
  • Simon Krek, Filozofska fakulteta in Fakulteta za računalništvo in informatiko, Univerza v Ljubljani
  • Drago Kunej, Glasbenonarodopisni inštitut, ZRC SAZU
  • Nikola Ljubešić, Odsek za tehnologije znanja, Institut “Jožef Stefan”
  • Nataša Logar, Fakulteta za družbene vede, Univerza v Ljubljani
  • Matija Marolt, Fakulteta za računalništvo in informatiko, Univerza v Ljubljani
  • Sanda Martinčić Ipšić, Univerza na Reki
  • Mirjam Sepesy Maučec, Fakulteta za elektrotehniko, računalništvo in informatiko, Univerza v Mariboru
  • Maja Miličević Petrović, Univerza v Bolonji
  • Dunja Mladenić, Laboratorij za umetno inteligenco, Institut “Jožef Stefan”
  • Andrej Pančur, Inštitut za novejšo zgodovino
  • Matevž Pesek, Fakulteta za računalništvo in informatiko, Univerza v Ljubljani
  • Karmen Pižorn, Pedagoška fakulteta, Univerza v Ljubljani
  • Senja Pollak, Odsek za tehnologije znanja, Institut “Jožef Stefan”
  • Ajda Pretnar, Inštitut za novejšo zgodovino
  • Marko Robnik Šikonja, Fakulteta za računalništvo in informatiko, Univerza v Ljubljani
  • Tanja Samardžić, Univerza v Zurichu
  • Miha Seručnik, Zgodovinski inštitut Milka Kosa, ZRC SAZU
  • Marko Stabej, Filozofska fakulteta, Univerza v Ljubljani
  • Janez Štebe, Fakulteta za družbene vede, Univerza v Ljubljani
  • Mojca Šorn, Inštitut za novejšo zgodovino
  • Daniel Vasić, Univerza v Mostarju
  • Darinka Verdonik, Fakulteta za elektrotehniko, računalništvo in informatiko, Univerza v Mariboru
  • Jerneja Žganec Gros, Alpineon d.o.o.
  • Andrej Žgank, Fakulteta za elektrotehniko, računalništvo in informatiko, Univerza v Mariboru
  • Aleš Žagar, Fakulteta za računalništvo in informatiko, Univerza v Ljubljani
  • Branko Žitko, Fakulteta za znanost, Univeza v Splitu