KONFERENCA JEZIKOVNE TEHNOLOGIJE IN DIGITALNA HUMANISTIKA 2020

24.-25. september 2020

www.sdjt.si/jtdh-2020
English page:
www.sdjt.si/jtdh-2020/en/

Slovensko društvo za jezikovne tehnologije (SDJT), Center za jezikovne vire in tehnologije Univerze v Ljubljani (CJVT), Inštitut za novejšo zgodovino (INZ) ter raziskovalni infrastrukturi CLARIN.SI in DARIAH-SI so 24. in 25. 9. 2020 organizirali konferenco “Jezikovne tehnologije in digitalna humanistika”, ki se ponaša z več kot 20-letno tradicijo, tematsko širitev na digitalno humanistiko pa smo uvedli leta 2016. Izvedbo virtualne konference je podprl CLARIN ERIC.

  1. Zbornik konference
  2. Urnik konference in fotografija virtualnih udeležencev
  3. Nagrade
  4. Vabljeni predavanji
  5. Panel “Razvoj slovenščine v digitalnem okolju”
  6. Organizacija
  7. Programski odbor

Pred konferenco:

  1. Tematska področja konference
  2. Pomembni datumi
  3. Navodila za prispevke
  4. Registracija
  5. Informacije za avtorje predstavitev

Nagrade

V sklopu JT-DH 2020 so bile podeljene tudi nagrade:

  • Nagrado komisije za najboljši študentski prispevek je prejel:
    Zoran Fijavž: Ambivalence of Queer Visibility in Video-Based Social Media Content. [PDF] [Video]
  • Nagrado publike za najboljšo posneto predstavitev pa je prejela:
    Špela Antloga: Korpus metafor KOMET 1.0. [PDF] [Video]

Vabljeni predavanji

Sara Tonelli

Avtomatsko prepoznavanje nasilnega govora: preveč digitalne, premalo humanistike?

[Video]

Izvleček:

Sporočila na družbenih omrežjih so pogosto usmerjena proti določenim skupinam uporabnikov glede na njihovo versko ali etnično pripadnost ali socialni status. Še posebej so nevarna, kadar so usmerjena proti ranljivim uporabnikom, kot so najstniki. Čeprav je pomembno razvijati orodja in algoritme za avtomatsko prepoznavanje nasilnih sporočil, da jih lahko odstranimo, sovražne račune pa onemogočimo, je prav tako zelo pomembno razumeti jezik, ki ga različne spletne skupnosti uporabljajo, do katere mere je žaljivi jezik mogoče posplošiti, in kakšno vlogo ima označevanje učnih podatkov pri zmanjševanju pristranskosti algoritmov za avtomatsko prepoznavanje nasilnega govora na spletu. V predavanju bomo naredili pregled sodobnih pristopov za prepoznavanje nasilnega govora in predstavili tekoče raziskave za boljše razumevanje tega fenomena, analizo vloge spletnih skupnosti, vsebino besedil in vpletenost deležnikov.

Življenjepis:

Sara Tonelli je vodja raziskovalne skupine Digitalna humanistika pri Fondaciji Bruna Kesslerja v Trentu in izredna profesorica na Oddelku za psihologijo in kognitivne znanosti na Univerzi v Trentu. Potem ko je leta 2010 doktorirala iz jezikoslovja na Univerzi Ca’ Foscari v Benetkah, se je najprej zaposlila kot podoktorska raziskovalka v skupini za Računalniško procesiranje naravnih jezikov v FBK, nato pa prevzela vodenje na novo ustanovljene raziskovalne skupine Digitalna humanistika. Sodelovala je pri številnih nacionalnih in evropskih projektih s področja zgodovinskih arhivov, luščenja dogodkov in časovnih informacij ter prepoznavanja političnih stališč. V zadnjem obdobju se je posvetila monitoriranja družbenih omrežij in prepoznavanja sovražnega govora. Njeni raziskovalni interesi so izrazito interdisciplinarni, pri svojem delu pa skuša uporabljati in prilagajati napredne besedilnoanalitične pristope za družboslovne in zgodovinske raziskave.

Kaspar Beelen

Govorjenje v imenu drugih
Zakaj naj digitalno humanistiko zanimajo parlamentarni podatki

[Video]

Izvleček:

Parlamenti hranijo podrobne zapise vsega, kar politiki povejo med plenarnimi sejami. V zadnjih desetletjih se je zelo povečala razpoložljivost teh (skoraj dobesednih) zapisnikov v digitalni obliki, pri čemer nastajajo obsežni zgodovinski korpusi, ki vsebujejo milijone besed in obsegajo več stoletij političnih razprav. Ti podatki omogočajo enkraten vpogled v jezik in svetovni nazor poslancev in volivcev, ki naj bi jih ti zastopali, s tem pa zagotavljajo podrobno pričevanje o skoraj vsaki temi, ki je bila kdaj koli predmet javnega mnenja.

Digitalni parlamentarni zapisniki za digitalne zgodovinarje pomenijo dragoceno zbirko, ki pa še ni dovolj raziskana. V predstavitvi je zajet pregled najnovejših pristopov k obravnavi parlamentarnih podatkov, ki združujejo računalništvo in zgodovino. Najprej je predstavljeno, kako govori poslancev znanstvenikom omogočajo preučevanje različnih vidikov jezika, od čustev ali prefinjenosti do uporabe humorja. Prispevek nato obravnava, kako računalniška analiza parlamentarnih razprav prispeva k iskanju odgovorov na pomembna zgodovinska vprašanja, kakršni sta na primer vloga žensk v nacionalni politiki ali spremembe oblike političnega zastopanja.

Življenjepis:

Kaspar Beelen je digitalni zgodovinar, ki raziskuje uporabo strojnega učenja v humanističnih raziskavah. Po doktoratu iz zgodovine na Univerzi v Antwerpnu (2014) je bil podoktorski sodelavec na Univerzi v Torontu. Kot raziskovalec pri projektu Digging into Linked Parliamentary Data (Dilipad) je objavil več razprav, ki združujejo podatkovno znanost, politologijo in zgodovino ter obravnavajo najrazličnejše teme, med drugim zastopanost žensk v parlamentu Združenega Kraljestva, razvoj javnozdravstvenega diskurza in uporabo čustev v parlamentarnem jeziku. Kaspar se je leta 2016 zaposlil na Univerzi v Amsterdamu – najprej kot podoktorski sodelavec na Inštitutu za informatiko, nato pa kot docent na digitalni humanistiki (medijske študije). Od februarja 2019 je zaposlen na Inštitutu Alan Turing kot znanstveni sodelavec pri projektu Living with Machines.


Predstavitveni panel “Razvoj slovenščine v digitalnem okolju”

Med letoma 2020 in 2022 poteka nacionalni projekt “Razvoj slovenščine v digitalnem okolju”, ki razvija računalniške izdelke in storitve s področja jezikovnih tehnologij za slovenski jezik. Med rezultati so novi jezikovni viri, orodja za procesiranje slovenščine in aplikacije (prepoznava govora, transkripcija, strojno prevajanje, terminološki portal, luščenje terminologije). Na panelu so bili predstavljeni projektni cilji in aktivnosti, predviden pa je bil tudi čas za razpravo.

Panel je potekal v slovenščini, posnetek panela pa bomo predvidoma naknadno podnaslovili tudi v angleščini za mednarodno strokovno javnost.




Tematska področja konference

Na konferenco vabimo raziskovalce, ki delujejo v različnih disciplinah in metodoloških okvirih. Vabimo prispevke z naslednjih področij:

  • govorne in druge eno- in večjezične jezikovne tehnologije;
  • digitalno jezikoslovje: prevodoslovje, korpusno jezikoslovje, leksikologija in leksikografija, standardizacija;
  • digitalna humanistika in zgodovinopisje, literarne vede, etnologija, muzikologija, kulturna dediščina, umetnost ter arheologija;
  • digitalna humanistika v izobraževanju in digitalna publicistika.

Dobrodošli so prispevki, ki predstavljajo smernice, raziskave, dobre prakse, projekte in rezultate na teh področjih. V sklopu konference bodo tudi vabljeni predavanji, študentska sekcija ter paneli o aktualnih temah, povezanih s konferenco. Uradna jezika konference bosta slovenščina in angleščina.

Avtorje izbranih člankov bomo povabili, da svoje prispevke iz JTDH 2020 razširijo za posebno angleško številko revije Slovenščina 2.0. Revija je indeksirana v informacijskem servisu Scopus. Vsak od izbranih prispevkov bo recenziran po običajnem recenzentskem postopku in ga bo potrebno pripraviti v skladu s smernicami, ki jih najdete v navodilih za avtorje.


Pomembni datumi

  • 1. 06. 2020 podaljšani rok za oddajo prispevkov in povzetkov
  • 10. 07. 2020 rok za recenzije
  • 15. 07. 2020 obvestilo o sprejetju prispevka/povzetka
  • 1. 9. 2020 obvestilo o formatu konference
  • 10. 09. 2020 oddaja končnega prispevka/povzetka
  • 23. 09. 2020 dokončan zbornik
  • 24.-25. 09. 2020 konferenca

Za konferenco zbiramo tako razširjene povzetke kot tudi polne prispevke. Razširjeni povzetki bodo objavljeni v knjižici povzetkov, polni prispevki pa v konferenčnem zborniku, ki bo ob začetku konference objavljen na konferenčni spletni strani pod licenco Creative Commons. Avtorjem prepuščamo odločitev, ali bodo razširjeni povzetek oz. polni prispevek v recenziranje oddali anonimizirano ali ne.

Uradna jezika konference sta slovenščina in angleščina.

Razširjeni povzetki naj bodo dolgi do 2-4 strani, polni prispevki pa 6-8 strani. Sestavljeni naj bodo v skladu s predlogo konference:

Prispevke zbiramo preko platforme EasyChair na tej povezavi.

Avtorji prispevkov naj ob oddaji označijo, ali gre za študentski prispevek (uporabite ključno besedo “študentski prispevek”), kjer morajo biti vsi avtorji do- ali podiplomski študenti. Ti prispevki bodo imeli na konferenci svojo sekcijo, izbran in nagrajen pa bo tudi najboljši študentski prispevek


Registracija

Konferenca je virtualna, in za vse udeležence brezplačna. Zaradi lažje organizacije obvezna prijava preko obrazca.

Ker želimo zagotoviti, da bi bila konferenca v čim večji meri dostopna za vse zainteresirane, bo program sestavljen iz asinhronih in sinhronih elementov: 

  1. Zbornik konference in posnetki predstavitev sprejetih prispevkov bodo objavljeni vnaprej, tako da si jih bodo udeleženci lahko ogledali, ko jim to najbolj ustreza. Avtorji boste predstavitve prispevkov posneli vnaprej in jih poslali organizatorjem. Več informacij o tem najdete spodaj.
  2. Med konferenco bomo v okolju Zoom organizirali moderirane tematske diskusije v živo, na katerih bodo registrirani udeleženci lahko zastavljali vprašanja in komentirali prispevke.

Urnik konference je dostopen tukaj.


Informacije za avtorje predstavitev

Oddaja posnetih predstavitev

Snemanje predstavitev pripravite v poljubnem orodju (npr. Zoom ali PowerPoint). Kako se posname predstavitev v orodju Zoom in PowerPoint, si lahko ogledate tu:

Dolžina predstavitve:

  • Kratke predstavitve: dolžina posnetka do 10 min
  • Dolge predstavitve: dolžina posnetka do 15 min

Jezik predstavitve:

  • Predstavitev prispevka lahko pripravite v slovenščini ali angleščini, po želji.
  • Tematske diskusije bodo potekale v angleščini.

Vaša predstavitev naj bo zgoščena kratka in jedrnata ter naj služi kot odskočna deska za diskusijo v živo. Avtorji predstavitve naj se na začetku posnetka na kratko predstavijo. Čeprav je pomembno predvsem, da so na posnetku razločno vidne prosojnice, bomo veseli, če bomo lahko videli tudi predavatelja.

Za snemanje uporabite mikrofon (zvok je še pomembnejši od slike).

Posnetek predstavitve naj bo shranjen v formatu MP4, ki ga naložite na eno od platform za izmenjavo datotek (npr. https://wetransfer.com, https://files.fm/).

Posnetek delite z Mihael.Ojstersek@inz.si ter povezavo do posnetka kopirajte v registracijski obrazec do 18. septembra 2020: Obrazec


Organizacija

Organizacijski odbor

  • Simon Dobrišek (SDJT, FE)
  • Nataša Frank (INZ)
  • Darja Fišer (CJVT)
  • Jerneja Fridl (DARIAH-SI, ZRC SAZU)
  • Jurij Hadalin (DARIAH-SI, INZ)
  • Katja Meden (CLARIN)
  • Mihael Ojsteršek (DARIAH-SI, INZ)
  • Mojca Šorn (predsednik, DARIAH-SI, INZ)

Programski odbor

Predsedstvo programskega odbora

  • izr. prof. dr. Darja Fišer, Filozofska fakulteta, Univerza v Ljubljani (CJVT, predsednica)
  • izr. prof. dr. Simon Dobrišek, Filozofska fakulteta, Univerza v Ljubljani (SDJT)
  • izr. prof. dr. Tomaž Erjavec, Institut “Jožef Stefan” (CLARIN.SI)
  • dr. Andrej Pančur, Inštitut za novejšo zgodovino (DARIAH-SI)
  • as. Ajda Pretnar (Fakulteta za računalništvo in informatiko)

Člani programskega odbora

  • dr. Špela Arhar Holdt, Filozofska fakulteta, Univerza v Ljubljani
  • prof. dr. Zoran Bosnić, Fakulteta za računalništvo in informatiko, Univerza v Ljubljani
  • doc. dr. Narvika Bovcon, Fakulteta za računalništvo in informatiko, Univerza v Ljubljani
  • doc. dr. Václav Cvrček, Inštitut češkega narodnega korpusa, Karlova univerza v Pragi
  • prof. dr. Simon Dobrišek, Fakulteta za elektrotehniko, Univerza v Ljubljani
  • doc. dr. Helena Dobrovoljc, Inštitut za slovenski jezik Frana Ramovša, ZRC SAZU
  • izr. prof. dr. Darja Fišer, Filozofska fakulteta, Univerza v Ljubljani
  • dr. Jerneja Fridl, ZRC SAZU
  • dr. Polona Gantar, Filozofska fakulteta, Univerza v Ljubljani
  • dr. Vojko Gorjanc, Filozofska fakulteta, Univerza v Ljubljani
  • dr. Jurij Hadalin, Inštitut za novejšo zgodovino
  • doc. dr. Mario Hibert, Filozofska fakulteta, Univerza v Sarajevu
  • prof. dr. Miran Hladnik, Filozofska fakulteta, Univerza v Ljubljani
  • prof. dr. Ivo Ipšić, Tehniška fakulteta, Univerza na Reki
  • doc. dr. Mateja Jemec Tomazin, Inštitut za slovenski jezik Frana Ramovša, ZRC SAZU
  • prof. dr. Zdravko Kačič, Fakulteta za elektrotehniko, računalništvo in informatiko, Univerza v Mariboru
  • dr. Mojca Kotar, Univerza v Ljubljani
  • dr. Simon Krek, Institut “Jožef Stefan” / Center za jezikovne vire in tehnologije, Univerza v Ljubljani
  • prof. dr. Cvetana Krstev, Filozofska fakulteta, Univerza v Beogradu
  • doc. dr. Drago Kunej, Glasbenonarodopisni inštitut, ZRC SAZU
  • doc. dr. Nikola Ljubešić, Odsek za informacijske in komunikacijske znanosti, Univerza v Zagrebu
  • prof. dr. Nataša Logar, Fakulteta za družbene vede, Univerza v Ljubljani
  • doc. dr. Matija Marolt, Fakulteta za računalništvo in informatiko, Univerza v Ljubljani
  • prof. dr. France Mihelič, Fakulteta za elektrotehniko, Univerza v Ljubljani
  • doc. dr. Maja Miličević, Filološka fakulteta, Univerza v Beogradu
  • prof. dr. Dunja Mladenić, Laboratorij za umetno inteligenco, Institut “Jožef Stefan”
  • dr. Matija Ogrin, Inštitut za slovensko literaturo in literarne vede ZRC SAZU
  • dr. Andrej Pančur, Inštitut za novejšo zgodovino
  • doc. dr. Dan Podjed, Inštitut za slovensko narodopisje ZRC SAZU
  • dr. Senja Pollak, Institut “Jožef Stefan”
  • prof. dr. Marko Robnik-Šikonja, Fakulteta za računalništvo in informatiko, Univerza v Ljubljani
  • dr. Tanja Samardžić, Univerza v Zurichu
  • dr. Miha Seručnik, Zgodovinski inštitut Milka Kosa ZRC SAZU
  • prof. dr. Marko Stabej, Filozofska fakulteta, Univerza v Ljubljani
  • dr. Mojca Šorn, Inštitut za novejšo zgodovino
  • doc. dr. Janez Štebe, Fakulteta za družbene vede
  • doc. dr. Aleš Vaupotič, Raziskovalni center za humanistiko, Univerza v Novi Gorici
  • prof. dr. Špela Vintar, Filozofska fakulteta, Univerza v Ljubljani
  • dr. Jerneja Žganec Gros, Alpineon d.o.o.