Obvestila

Vabilo na predavanje JOTA, 28. november 2024

Spoštovani,

Vabimo vas na predavanje JOTA, na katerem bo Filip Dobranić (INZ) predstavil svoje delo v okviru doktorskega študija. Predavanje bo v četrtek, 28. novembra 2024 ob 16:15 na UL FRI (Večna pot 113, Ljubljana) v predavalnici P21.

Naslov predavanja: Segmentacija zgodovinskih tiskanih medijev z uporabo vizualnih in jezikovnih vložitev

Povzetek predavanja: Ob vsej količini digitaliziranega zgodovinskega časopisja in naraščajočem toku novih modelov za računalniški vid in strojno obdelavo jezika je presenetljivo, da zaenkrat ne zmoremo zanesljivo odgovoriti na relativno trivialna vprašanja kot so: Kateri časopis je leta 1920 objavil največ oglasov? Kakšna je rast (ali padec) rabe ilustracij v določenem časopisu? Kako pogoste in natančne so bile vremenske napovedi? Tudi onkraj zgodovinske periodike so odgovori na podobna vprašanja nedosegljivi, ker je, še posebej ko gre za gosto in spremenljivo postavitev tiska, vire težko zanesljivo razčleniti. V sklopu doktorskega študija razvijam modele, ki bodo sposobni učinkovito identificirati specifično vsebino v zgodovinskem tisku (npr. oglase ali osmrtnice) in s tem naredili korak proti odgovorom na zgornja vprašanja. Na predstavitvi se bomo na hitro sprehodili skozi nekatere najbolj popularne pristope in si ogledali “low-tech” pristop, ki deluje bolje, kot bi sicer pričakovali (in ga lahko uporabite že danes). Nadaljevali bomo s prikazom trenutnega stanja modelov, ki jih razvijam, konkretneje cevovoda modelov za računalniški vid in klasifikacijo besedil, zaključili pa s predstavitvijo načrtov za prihodnost in modele, ki uporabljajo t.i. “zemljevide besedilnih vložitev.”

Za tiste, ki niste bili prisotni na predhodni Joti, si predavanje lahko ogledate na platformi Videolectures.

Lep pozdrav,
Slavko
V vlogi predsednika SDJT

Facebook dogodek: https://fb.me/e/4V4TCSStR

11. spominska JOTA, 29. september 2024

Na zadnjem občnem zboru smo sklenili, da 11. spominsko JOTO po desetih uspešnih pohodih v spomin na Adama Kilgariffa namenimo novemu kolegu, ki ga žal ni več med nami: Thierryju Declercku.

Pohod smo izvedli v soboto, 29. 9. 2024, in sicer smo se povzpeli na Sv. Primož nad Kamnikom. Za tiste, ki Thierryja niste poznali, si lahko preberete več o njem na https://www.sdjt.si/wp/dogodki/jota/spominska-jota/, kjer smo objavili tudi nekaj utrinkov z našega pohoda.

Vabilo na redni občni zbor, 20. september 2024

Spoštovani člani SDJT,

vabimo vas na redni občni zbor SDJT, ki bo v petek, 20. septembra 2024, ob 16:30, na Fakulteti za elektrotehniko, Tržaška cesta 25, Ljubljana. Občni zbor bo zaključil letošnjo konferenco JTDH 2024, za katero vas tudi prijazno vabimo k udeležbi.

Predlagani dnevni red je:

  • Izvolitev delovnega predsedstva
  • Izvolitev zapisnikarja in dveh overoviteljev zapisnika
  • Ugotavljanje sklepčnosti in sprejem dnevnega reda
  • Poročilo o delovanju društva od zadnjega občnega zbora; obravnava in sprejem poročila
  • Poročilo o finančnem poslovanju društva v obdobju od zadnjega občnega zbora; obravnava in sprejem poročila
  • Prenova koncepta „Spominske JOTE“
  • Program dela v naslednjem letu in razprava
  • Razno


Upam, da se vidimo v čim večjem številu.

 

Lep pozdrav,

dr. Slavko Žitnik, predsednik SDJT

Konferenca Jezikovne tehnologije in digitalna humanistika (JTDH 2024)

Spoštovani,
 
na spletni strani konference JT-DH 2024 so na voljo vse podrobnosti o programu konference, ki bo potekala med 19. in 20. septembrom 2024.
 
Prijave na konferenco so že odprte, več informacij najdete tukaj. Registracija bo odprta do 8. 9. 2024. Prijazno vabljeni k udeležbi na konferenci in predkonferenčnih dogodkih ter občnem zboru SDJT, ki bo prav tako potekal v času konference.
 

Vabilo na predavanje JOTA, 3. julij 2024

Vabimo vas na predavanje JOTA, na katerem bosta Tim Prezelj (UL PeF) in Timotej Knez (UL FRI) predstavila rezultate projekta SemSex. Predavanje bo v sredo, 3. julija 2024 ob 16:15 na UL FRI (Večna pot 113, Ljubljana) v predavalnici P19. 
 
Naslov predavanjaSemSex: Prepoznava tem spolne vzgoje v učnih načrtih
 
Povzetek predavanja: Predstavili bomo CLARIN.SI projekt SemSex (Prezelj, Knez, Žitnik), ki prinaša inovativno rešitev za prepoznavanje tem spolne vzgoje v učnih načrtih slovenskih šol s pomočjo naprednih metod analize naravnega jezika. Avtomatsko pregledovanje različnih konceptov omogoča pridobivanje dragocenih povratnih informacij, s pomočjo katerih lahko prepoznamo premalo zastopane ali preveč poudarjene teme. V sklopu projekta smo razvili ontologijo pojmov s področja spolne vzgoje, ki določa obseg interesnega področja. Nato smo polavtomatsko zbrali primerna besedila, ki opisujejo posamezne koncepte, in jih uporabili za izgradnjo učne množice. Na podlagi ontologije in učne množice smo naučili dva klasifikatorja, ki samodejno prepoznata prisotnost konceptov spolne vzgoje v besedilih učnih načrtov.
Posebno pozornost smo namenili splošnosti sistema, da bo mogoče enak postopek v prihodnosti uporabiti tudi za druge domene. Naš sistem omogoča celovito pregledovanje tem spolne vzgoje v učnih načrtih, kar bo pripomoglo k boljši zasnovi novih učnih načrtov, ki bodo celoviteje pokrivali vsebine spolne vzgoje.
 
Za tiste, ki niste bili prisotni na predhodni Joti, si lahko predavanje pogledate na https://videolectures.net/jota_kosem_zagar_klemen/

 

Vabilo na predavanje JOTA, 11. april 2024

Spoštovani,

Vabimo vas na predavanje JOTA, na katerem bodo dr. Iztok Kosem (UL CJVT / IJS), Aleš Žagar (UL FRI), Matej Klemen (UL FRI) predstavili svoja nova jezikovno-tehnološka orodja. Predavanje bo v četrtek, 11. aprila 2024 ob 16:15 na UL FRI (Večna pot 113, Ljubljana) v predavalnici P21. 

Naslov predavanja: Novi jezikovno-tehnološki orodji Korpusnik in SENTA

Povzetek predavanja: Korpusna orodja oz. konkordančniki so postali temeljni pripomoček jezikoslovcev in izdelovalcev jezikovnih virov, pa tudi prevajalcev, lektorjev in ostalih končnih uporabnikov. Konkordančniki ponujajo številne funkcije za analizo rabe jezika, ki pa lahko zaradi njihove kompleksnosti pri mnogih uporabnikih ostanejo neizkoriščene. Pri tem se kaže potreba po povzemalnih orodjih, ki bi raznovrstne podatke iz korpusov predstavila na plastičen in pregleden način ter jih tako približala širši množici uporabnikov. To je bil eden od ciljev projekta SLOKIT oz. Nadgradnja CLARIN.SI (2022-2023), v okviru katerega je bilo izdelano orodje Korpusnik, ki povzema podatke iz petih korpusov slovenskega jezika: – Gigafida 2.0, Trendi, OSS 1.0, JANES 1.0 in Gos 2.0. V projektu je bila razvita tudi aplikacija SENTA za poenostavljanje in analizo besedil. Posebna pozornost pri zasnovi in izdelavi obeh orodij je bila namenjena dostopnosti oseb s posebnimi potrebami. V predstavitvi bomo prikazali delovanje obeh orodij in njuno zaledje ter pojasnili ključne odločitve, ki so vplivale na njuno zasnovo.

Za tiste, ki niste bili prisotni na predhodni Joti, si lahko predavanje pogledate na https://videolectures.net/jota_antloga_jezikovna_raba

Lep pozdrav,
Slavko Žitnik
V vlogi predsednika SDJT

Razpis za štipendije za obisk poletnih šol v letu 2024

Spoštovani člani SDJT,

eno temeljnih poslanstev SDJT je izobraževanje novih generacij raziskovalcev s področja jezikovnih tehnologij. Društvo zato letos, tako kot v preteklih letih, podeljuje eno ali dve štipendiji za obisk izbranih poletnih šol s področja jezikovnih tehnologij in digitalne humanistike.

Za štipendijo se lahko potegujejo študenti druge in tretje stopnje katerekoli študijske smeri v Sloveniji, ki so včlanjeni v SDJT (prijavni obrazec: http://goo.gl/forms/SvMeZL8thX) in jih zanima digitalna humanistika, obdelava naravnih jezikov (NLP), jezikovne tehnologije in računalniško jezikoslovje. Pogoj za prijavo je, da se v okviru doktorske oz. magistrske naloge ukvarjajo z jezikovnimi tehnologijami za slovenščino, prednost pa bodo imeli tisti kandidati, ki že poznajo osnove NLP. 

V razpis vključujemo naslednje poletne šole:

Morebitni interesenti naj pošljejo življenjepis in motivacijsko pismo na naslov sdjt@ijs.si (z naslovom – Prijava za štipendijo za poletno šolo), pri čemer lahko tudi sami navedejo, če jih morda zanima katera druga relevantna poletna šola, ki je nismo navedli. Vse mentorje in profesorje, ki so aktivni na področjih relevantnih poletnih šol, pa prosim, da informacijo o možnosti štipendiranja razširijo med svojimi študenti.

Rok za prijavo je do srede, 3. aprila 2024. Izbiro kandidatov bo komisija društva izvedla najkasneje do srede, 17. aprila 2024.

Lep pozdrav, 
Izvršni odbor SDJT

 

Predavanje JOTA, 29. februar 2024

Spoštovani,

Vabimo vas na predavanje JOTA, na katerem bo Špela Antloga, mag. slov. predstavila svoje delo na področju figurativne rabe jezika. Predavanje bo v četrtek, 29. februarja 2024 ob 16:15 v predavalnici P21 na UL FRI (Večna pot 113, Ljubljana). 

Naslov predavanja: Prepoznava in označevanje figurativne jezikovne rabe v korpusih

Povzetek predavanja: Figurativni jezik je v zadnjem desetletju aktualna tema ne samo v jezikoslovju, ampak tudi pri nalogah procesiranja naravnega jezika. Ob tem nastajajo korpusi, označeni za različne oblike figurativnega jezika, ki so del vsakdanjega sporazumevanja – metaforo, metonimijo, poosebitev, ironijo ipd. Različne označevalne sheme naslavljajo izziv, kako v besedilu prepoznati in razločevati med običajnimi, osnovnimi pomeni besed in besednih zvez ter njihovimi izpeljanimi, figurativnimi pomeni, ki so zahtevnejši za prepoznavo (in razumevanje) tako za človeka kot tudi za stroje. Predstavljeni bodo primeri prepoznave in označevanja figurativne jezikovne rabe v korpusih, izzivi pri označevanju ter pomanjkljivosti pri prenosu označevalnih shem v druge jezike (na primeru slovenskega korpusa KOMET 1.0, označenega za metaforično rabljene besede).

O predavateljici: Špela Antloga je doktorska študentka in raziskovalka na Fakulteti za elektrotehniko, računalništvo in informatiko v Laboratoriju za digitalno procesiranje signalov. Raziskovalno se ukvarja z uresničitvijo in vlogo metafore v besedilih. Sodeluje pri projektu Temeljne raziskave za razvoj govornih virov in tehnologij za slovenski jezik (https://mezzanine.um.si). 

Lep pozdrav,
Slavko Žitnik

V vlogi predsednika SDJT

Predavanje JOTA, 21. november 2023

Spoštovani,

Vabimo vas na predavanje JOTA, na katerem bo izr. prof. dr. Darinka Verdonik predstavila svoje delo na področju govornih korpusov. Predavanje bo v torek, 21. novembra 2023 ob 15. uri preko spletne povezave https://uni-lj-si.zoom.us/j/98549109184

Naslov predavanja: Označevanje dialoških dejanj v korpusih

Povzetek predavanja: Dialoška dejanja so zanimiva in uporabna kategorija označevanja podatkov pri procesiranju naravnega jezika (npr. pri avtomatskem razpoznavanju govora, dialoških sistemih in prevajanju govora v govor) kot tudi v jezikoslovju, zlasti v korpusni pragmatiki. Razvitih je bilo več shem za označevanje dialoških dejanj. Mnoge so prilagojene za specifična področja, kot je načrtovanje potovanja z železnico, načrtovanje sestankov in potovanj, pogovori v avtomobilu ali komunikacija med posadko. Najbolj znane in uporabljene pa so tiste sheme, ki skušajo biti generične in uporabne za različna področja, na primer DAMSL, SWBD-DAMSL in ISO 24617-2. V predavanju bomo ob primerih iz slovenskih govornih korpusov predstavili dialoška dejanja, njihove najpogostejše tipe, izzive pri označevanju in pomanjkljivosti najbolj pogosto uporabljenih označevalnih shem.

O predavateljici: Darinka Verdonik se raziskovalno ukvarja predvsem z govorjenim jezikom, govornimi viri in analizo diskurza. Izkušnje je pridobivala ob izdelavi govornih virov Gos in Artur. V temeljnih raziskavah poleg izdelave govornih virov analizira predvsem diskurzne prvine govorjenega jezika, kot so diskurzni označevalci, netekočnosti, dialoška dejanja, pa tudi porocese razumevanja oz. nerazumevanja v komunikaciji. Vodi veliki temeljni projekt Temeljne raziskave za razvoj govornih virov in tehnologij za slovenski jezik (https://mezzanine.um.si).

Lep pozdrav,
Slavko Žitnik

V vlogi predsednika SDJT

 

Predavanje JOTA, 21. september 2023

Spoštovani,

Vabimo vas na predavanje JOTA, na katerem bo doc. dr. Slavko Žitnik predstavil področje vrednotenja jezikovnih tehnologij. Predavanje bo v četrtek, 21. septembra 2023 ob 16. uri v Predavalnici P21 na Fakulteti za računalništvo in informatiko (Večna pot 113, Ljubljana). Po predavanju bomo nadaljevali z občnim zborom SDJT.

Naslov predavanja: Vrednotenje jezikovnih tehnologij in SloBENCH

Povzetek predavanja: Področje obdelave naravnega jezika ima v primerjavi z ostalimi področji umetne inteligence že zelo dolgo tradicijo neodvisnega vrednotenja metod. V zadnjih letih se je število javno objavljenih korpusov, ki ponujajo javno objavljene lestvice najboljših pristopov, močno povečalo. Prav tako je bilo razvitih kar nekaj ogrodij za neodvisno vrednotenje. Tekom predavanja bomo predstavili razvoj vrednotenja na področju obdelave naravnega jezika. Podrobneje si bomo ogledali delovanje ogrodja SloBENCH (https://slobench.cjvt.si) in prikazali praktičen primer izdelave novega vrednotnika za poljubno nalogo.

Lep pozdrav,
Slavko Žitnik v vlogi predsednika SDJT

 

Vabilo na občni zbor in spominsko JOTO

Spoštovani člani SDJT,

vabimo vas na redni občni zbor SDJT, ki bo v četrtek, 21. septembra 2023 ob 16.00, v predavalnici 21 na Fakulteti za računalništvo in informatiko, Večna pot 113, Ljubljana.

Uvod v občni zbor bo predavanje Jota – Vrednotenja metod za obdelavo naravnega jezika in SloBENCH – več podatkov bo posredovanih kasneje.

Predlagani dnevni red je:

  • Izvolitev delovnega predsedstva
  • Izvolitev zapisnikarja in dveh overoviteljev zapisnika
  • Ugotavljanje sklepčnosti in sprejem dnevnega reda
  • Poročilo o delovanju društva od zadnjega občnega zbora; obravnava in sprejem poročila
  • Poročilo o finančnem poslovanju društva v obdobju od zadnjega občnega zbora; obravnava in sprejem poročila
  • Program dela v naslednjem letu in razprava
  • Razno

Prosimo, da se za zagotavljanje volilne sklepčnosti občnega zbora udeležite v čim večjem številu.

10. spominski pohod za Adama Kilgarriffa

četrtek, 28. septembra 2023, načrtujemo spominski pohod Adama Kilgarriffa na Kofce. Zbrali bi se ob 9h zjutraj na parkirišču pred Fakulteto za računalništvo in informatiko (Večna pot 113, Ljubljana) in se nato odpravili do začetne točke. Na občnem zboru bomo določili dostopno in sestopno smer. Prosim, da se informativno prijavite na pohod: PRIJAVA.

Lep pozdrav,

Slavko Žitnik v imenu upravnega odbora SDJT


Vabilo na večerna predavanja ESSLLI 2023

Spoštovani,

Naslednji teden na Fakulteti za računalništvo in informatiko v Ljubljani organiziramo 34. evropsko poletno šolo logike, jezika in računalništva – ESSLLI 2023 (https://2023.esslli.eu). V okviru poletne šole organiziramo tudi štiri večerna predavanja odličnih raziskovalcev in profesorjev, ki so dostopna za javnost in bodo potekala ob 19h v predavalnici PA:

  • 1. avgust: Marko Robnik-ŠikonjaLarge language models for cross-lingual transfer
  • 3. avgust: Malvina NissimLanguage Technology Society
  • 8. avgust: Beniamino AccattoliThe Cost of the lambda Calculus and the Semantics of Sharing
  • 10. avgust: Darja FišerThe Good, the Bad and the Ugly of Language Technology Infrastructure

Več o predavanjih si lahko preberete tudi na spletni strani https://2023.esslli.eu/courses-workshops-accepted/evening.html. V kolikor imate čas, ste toplo vabljeni, da se predavanj udeležite.

Poletna šola ESSLLI 2023 je s privlačnim programom privabila več kot 330 prijavljenih udeležencev z vsega sveta. Dvotedenska poletna šola ima dolgo tradicijo, saj poteka vse od leta 1989 vsakič v drugem evropskem mestu. Udeležencem, predvsem doktorskim študentom in mladim raziskovalcem, ponuja tečaje in tematske delavnice na področjih logike, jezikoslovja in računalništva. Zaradi izjemno interdisciplinarne zasnove gre za edinstven dogodek brez primere v Evropi, saj velja za glavno stično točko mladih raziskovalk in raziskovalcev ter študentk in študentov navedenih disciplin, saj jim nudi edinstven prostor za razpravo, izmenjavo znanj in skupno razvijanje novih idej. 

Letošnjo poletno šolo organizirata Fakulteta za računalništvo in informatiko in Filozofska fakulteta Univerze v Ljubljani v sodelovanju s Slovenskim društvom za jezikovne tehnologije in Slovenskim društvom INFORMATIKA. Program soustvarja prek 80 profesoric in profesorjev iz 23 različnih držav, v dveh tednih pa se bo zvrstilo kar 53 seminarjev in delavnic, ki bodo potekali v sedmih vzporednih sekcijah. 

Se vidimo in lep pozdrav,

Slavko

predsednik društva

Vabilo na predavanje JOTA, 5. junij 2023

Spoštovani,

vabimo vas na predavanje JOTA, na katerem bo dr. Simon Šuster, raziskovalec na področju obdelave naravnega jezika, predstavil določanje kakovosti medicinskih izdelkov s pomočjo strojnega učenja in obdelave naravnega jezika. Predavanje bo v ponedeljek, 5. junija 2023 ob 16. uri v Predavalnici P19 na Fakulteti za računalništvo in informatiko (Večna pot 113, Ljubljana).

Naslov predavanja: Maske ne obvarujejo pred virusi. Ali pač? Avtomatsko ugotavljanje kakovosti izsledkov v medicini

Povzetek predavanja: Z dokazi podprta medicina temelji na izsledkih, ki jih glede na klinično vprašanje strokovnjaki povzamejo iz znanstvenih objav. V sklopu tega procesa poteka tudi ugotavljanje kakovosti relevantnih študij, kar vključuje določanje pristranskosti v uporabljeni metodologiji, poročanju in objavljanju. Gre za ključen korak v sintezi izsledkov, ki pa zaradi svoje zahtevnosti in dolgotrajnosti zavira dostopnost ažurnih medicinskih dognanj. V predavanju bom predstavil, kako se lahko s strojnim učenjem in obdelavo naravnega jezika lotimo priprave podatkovno–besedilnih virov in modeliranja določanja kakovosti medicinskih izsledkov. Dotaknil se bom tudi vprašanj zanesljivosti, izbirnega napovedovanja in algoritemske poštenosti v razvitih modelih. Nazadnje bom zarisal še vlogo tovrstnih sistemov v praksi.

Posnetek predhodne Jote, kjer je Erik Novak predstavil modele za zdravorazumsko sklepanje, je dostopen na https://videolectures.net/jota_novak_demonstracija_modelov

Lep pozdrav,
Slavko Žitnik

V vlogi predsednika SDJT

Razpis za štipendije za obisk poletnih šol v letu 2023

Spoštovani člani SDJT, 

eno temeljnih poslanstev SDJT je tudi izobraževanje novih generacij raziskovalcev s področja jezikovnih tehnologij in društvo je v preteklih letih letno podeljevalo štipendije za obisk izbranih poletnih šol s tega področja.

Po tradiciji je v razpis vedno vključena Evropska poletna šola logike, jezika in informatike (ESSLLI – European Summer School in Logic, Language and Information). Letos poletna šola poteka že 34. in jo organiziramo v okviru društva od 31. julija do 11. avgusta 2023 na Fakulteti za računalništvo in informatiko v Ljubljani – https://2023.esslli.eu. Zaradi tega smo se odločili, da bomo letos podeljevali štipendije za udeležbo le na tej poletni šoli.

Za štipendije se bodo lahko potegovali študenti druge in tretje stopnje katerekoli študijske smeri, ki so včlanjeni v SDJT (ali se še boste včlanili), in jih zanima digitalna humanistika, obdelava naravnih jezikov (NLP), jezikovne tehnologije in računalniško jezikoslovje, pri čemer bodo imeli prednost tisti, ki že poznajo osnove NLP in/ali se v okviru doktorske oz. magistrske naloge ukvarjajo oz. nameravajo ukvarjati z jezikovnimi tehnologijami za slovenščino. 

Morebitni interesenti naj pošljejo življenjepis in motivacijsko pismo na naslov sdjt@ijs.si (z naslovom – Prijava za štipendijo ESSLLI 2023), pri čemer prosim navedite tudi, če želite, da vam uredimo namestitev v Ljubljani. Vse mentorje in profesorje, pa prosim, da informacijo o možnosti štipendiranja razširijo med svojimi študenti.

Rok za prijavo je do petka, 28. aprila 2023. Izbiro kandidatov bo potem komisija društva izvedla do petka, 12. maja. 2023. 


Poletna šola logike, jezika in informatike ESSLLI23

Dragi člani SDJT,

obveščamo vas, da bo letošnja, že 34. evropska poletna šola logike, jezika in informatike (ESSLLI), med 31. julijem in 11. avgustom 2023 potekala na Fakulteti za računalništvo in informatiko v Ljubljani.

Poletna šola ESSLLI je namenjena predvsem magistrskim in doktorskim študentom ter mlajšim raziskovalcem s področij jezikoslovja, logike, računalništva in informatike. Letos se bo v dveh tednih zvrstilo kar 49 različnih tečajev ter štiri delavnice-simpoziji, ob tem pa bo mogoče obiskati še štiri večerna predavanja in se udeležiti različnih družabnih aktivnosti.

Prijave na poletno šolo so že odprte: https://2023.esslli.eu/registration.html

Vabimo vas, da novico o poletni šoli razširite med zainteresiranimi študenti in raziskovalci.

ESSLLI plakat
Letak (pdf)

Vabilo na marčevsko JOTO

Vabimo vas na predavanje JOTA, na katerem bo Erik Novak iz Inštituta Jožef Stefan predstavil izdelavo baze znanja in modelov za zdravorazumsko sklepanje na podlagi orodja COMET. Predavanje bo v torek, 7. marca 2023 ob 16. uri v Predavalnici P19 na Fakulteti za računalništvo in informatiko (Večna pot 113, Ljubljana).

Naslov in povzetek:

Izdelava in demonstracija modelov za zdravorazumsko sklepanje za slovenščino

Zdravorazumsko sklepanje se nanaša na sposobnost napovedovanja verjetnih zaključkov, ki izhajajo iz izbranega znanja. Modeli za zdravorazumsko sklepanje so uporabni pri izboljšanju razumevanja besedil in odkrivanju vzorcev, ter pri avtomatizaciji procesa odločanja. V predstavitvi bomo preučili postopek izdelave zdravorazumskih modelov z uporabo nevronskih jezikovnih modelov. Izpostavili bomo tudi težave, s katerimi se srečujemo pri razvoju te vrste modelov, ter predstavili rezultate prvih zdravorazumskih modelov za slovenščino.

O predavatelju:

Erik Novak je zaposlen kot raziskovalec na Odseku za umetno intelligenco na Institutu Jožef Stefan in je hkrati doktorski študent študijskega programa Informacijske in komunikacijske tehnologije na Mednarodni podiplomski šoli Jožefa Stefana. Njegovo raziskovalno delo se osredotoča na različne naloge na področju obdelave naravnega jezika, s poudarkom na merjenju podobnosti besedil v različnih jezikih.


Vabilo na novembrsko JOTO

Lepo vabljeni na predavanje v okviru serije JOTA, na katerem bo Aleš Žagar s Fakultete za računalništvo in informatiko Univerze v Ljubljani predstavil tehnike avtomatskega povzemanja za slovenski jezik. Predavanje bo v sredo, 9. novembra 2022 ob 16. uri v Predavalnici P18 na Fakulteti za računalništvo in informatiko (Večna pot 113, Ljubljana).

Naslov in povzetek predavanja:  Izdelava in demonstracija avtomatskih povzemalnikov besedil v slovenskem jeziku

Povzemanje besedil naslavlja vse večji problem velikih količin tekstovnih podatkov. S pomočjo povzemalnikov lahko večje količine informacij pretvorimo v krajšo obliko ter s tem zmanjšamo čas za pridobitev ključnih vsebin besedila. V predstavitvi si bomo pogledali različne pristope in metode k povzemanju, pri čemer se bomo osredotočili na algoritme na osnovi grafov ter globoke nevronske mreže. Izpostavili bomo probleme, s katerimi se srečujemo pri povzemanju v slovenskem jeziku ter pokazali, kako si lahko z vizualizacijo pomagamo do boljše predstavitve rezultatov strojnih povzemalnikov.

O predavatelju:  Aleš Žagar je zaposlen kot raziskovalec v laboratoriju za kognitivno modeliranje in je hkrati doktorski študent 2. letnika študijskega programa Računalništvo in informatika. V svojem raziskovalnem delu se ukvarja z dodajanjem znanja v nevronske mreže ter z različnimi nalogami s področja obdelave naravnega jezika s poudarkom na povzemanju besedil.


Vabilo na redni občni zbor društva in predstavitev vmesnih rezultatov projekta RSDO

Člani SDJT so vljudno vabljeni na na redni občni zbor SDJT, ki bo v petek, 16. septembra 2022, ob 14.30, v sobi 20 na Fakulteti družbene vede, Kardeljeva ploščad 5, Ljubljana. Občni zbor bo izveden kot zaključni dogodek konference Jezikovne tehnologije in digitalna humanistika – JTDH 2022. Uvod v občni zbor bo predstavitev vmesnih rezultatov projekta Razvoj slovenščine v digitalnem okolju (RSDO), pri katerem sodeluje veliko članov našega društva.

Predlagani dnevni red je:

  1. Izvolitev delovnega predsedstva
  2. Izvolitev zapisnikarja in dveh overoviteljev zapisnika
  3. Ugotavljanje sklepčnosti in sprejem dnevnega reda
  4. Poročilo o delovanju društva od zadnjega občnega zbora; obravnava in sprejem poročila
  5. Poročilo o finančnem poslovanju društva v obdobju od zadnjega občnega zbora; obravnava in sprejem poročila
  6. Volitve organov SDJT za naslednje 4-letno mandatno obdobje
    – Upravni odbor (predsednik, tajnik, blagajnik, 2 člana)
    – Nadzorni odbor (predsednik, 2 člana )
    – Častno razsodišče (predsednik, 2 člana)
  7. Glasovanje na daljavo
  8. Program dela v naslednjem letu in razprava
  9. Razno

Prosimo, da svoje morebitne kandidature in predloge za kandidate za članstvo v organih društva pošljete na sdjt@ijs.si najkasneje do četrtka, 15. septembra 2022. Mandatna doba članov organov društva je 4 leta. Člani so lahko večkrat izvoljeni v isti organ društva. Praviloma so v organih enakopravno zastopani člani z različnih področij jezikovnih tehnologij. Člani nadzornega odbora ne morejo biti obenem tudi člani upravnega odbora.

Prosimo, da se za zagotavljanje volilne sklepčnosti občnega zbora udeležite v čim večjem številu.


Razpis za štipendije za obisk poletnih šol v letu 2022

Eno temeljnih poslanstev SDJT je tudi izobraževanje novih generacij raziskovalcev s področja jezikovnih tehnologij in društvo je v preteklih letih letno podelilo eno ali dve štipendiji za obisk izbranih poletnih šol s področja jezikovnih tehnologij in digitalne humanistike.

Po tradiciji v razpis vključujemo 33rd European Summer School in Logic, Language and Information – https://2022.esslli.eu/, ki ima rok za prijavo do 31. maja 2022.

S področja digitalne humanistike je v razpis vključena poletna šola CULTURE & TECHNOLOGY – European Summer University in Digital Humanities – https://esu.fdhl.info/. Tudi ta poletna šola ima rok za prijavo konec meseca maja.

Na razpis se lahko prijavijo tudi kandidati, ki so se morda že prijavil na poletno šolo LxMLS 2022 – 12th Lisbon Machine Learning School – http://lxmls.it.pt/2022/, ki je imela rok za prijavo do 15. maja 2022.
Za štipendiji se bodo lahko potegovali študenti druge in tretje stopnje katerekoli študijske smeri, ki so včlanjeni v SDJT (http://goo.gl/forms/SvMeZL8thX), in jih zanima digitalna humanistika, obdelava naravnih jezikov (NLP), jezikovne tehnologije in računalniško jezikoslovje, pri čemer bodo imeli prednost tisti, ki že poznajo osnove NLP in/ali se v okviru doktorske oz. magistrske naloge ukvarjajo oz. nameravajo ukvarjati z jezikovnimi tehnologijami za slovenščino.

Morebitni interesenti naj pošljejo življenjepis in motivacijsko pismo na naslov sdjt@ijs.si (z naslovom – Prijava za štipendijo za poletno šolo), pri čemer lahko tudi sami navedejo, če jih morda zanima katera druga relevantna poletna šola, ki ni omenjena zgoraj. Vse mentorje in profesorje, ki so aktivni na področjih relevantnih poletnih šol, pa prosimo, da informacijo o možnosti štipendiranja razširijo med svojimi študenti.

Rok za prijavo je do srede, 25. maja 2022. Izbiro kandidatov bo komisija društva izvedla do petka, 27. maja. 2022, da bodo izbrani kandidat potem še imeli čas za prijavo na izbrano poletno šolo.


Vabilo k oddaji prispevkov na konferenco JTDH 2022

Vjudno vabljeni k oddaji prispevkov na konferenco Jezikovne tehnologije in digitalna humanistika – JTDH 2022.

Konferenco organizirajo Slovensko društvo za jezikovne tehnologije, CLARIN.SI, DARIAH-SI in Center za jezikovne vire in tehnologije UL. Konferenca bo potekala 15. in 16. septembra 2022 na Inštitutu za novejšo zgodovino, Privoz 11, Ljubljana. V primeru poslabšanih epidemioloških razmer bo konferenca potekala virtualno.

Konferenca je tematsko široka in vabi raziskovalce, ki delujejo v različnih disciplinah in metodoloških okvirih. Vabimo prispevke z naslednjih področij:

  • govorne in druge eno- in večjezične jezikovne tehnologije
  • digitalno jezikoslovje: prevodoslovje, korpusno jezikoslovje, leksikologija in leksikografija, standardizacija
  • digitalna humanistika in zgodovinopisje, etnologija, muzikologija, kulturna dediščina, umetnost ter arheologija
  • digitalna humanistika v izobraževanju in digitalna publicistika

Dobrodošli so prispevki, ki predstavljajo smernice, raziskave, dobre prakse, projekte in rezultate na teh področjih. V sklopu konference predvidevamo tudi vabljena predavanja, študentsko sekcijo ter panel o aktualnih temah, povezanih s konferenco.

Več informacij in podrobna navodila za prispevke so dostopna na spletni strani konference: https://www.sdjt.si/jtdh-2022.


Vabilo na redni občni zbor društva

Člani SDJT so vljudno vabljeni na redni občni zbor SDJT, ki bo v petek, 12. novembra 2021, ob 13.15. uri. Zaradi slabšanja zdravstvenih razmer in lažje udeležbe bo občni zbor SDJT tudi tokrat izveden na daljavo prek videokonferenčne platforme Zoom. Povabilno povezavo na videokonferenco Zoom boste prejeli po e-pošti na SDJT poštni seznam.

Predlagani dnevni red je:

1. Izvolitev delovnega predsedstva
2. Izvolitev zapisnikarja in dveh overoviteljev zapisnika
3. Ugotavljanje sklepčnosti in sprejem dnevnega reda
4. Poročilo o delovanju društva od zadnjega občnega zbora; obravnava in sprejem poročila
5. Poročilo o finančnem poslovanju društva v obdobju od zadnjega občnega zbora; obravnava in sprejem poročila
6. Program dela v naslednjem letu in razprava
7. Razno

Uvod v občni zbor bo novembrska e-Jota, na kateri nam bo Tadej Škvorc, ki je mladi raziskovalec na Institutu Jožef Stefan in doktorski študent na Fakulteti za računalništvo in informatiko Univerze v Ljubljani, predstavil metodo razpoznavanje idiomov v slovenskih besedilih z metodami strojnega učenja. Tudi uvodno predavanje bo izvedeno prek videokonferenčne platforme Zoom.

Naslov predavanja: Prepoznavanje idiomov v besedilih z kontekstualnimi vložitvami besed

Povzetek predavanja: Razlikovanje med dobesednim in prenesenim pomenom besed predstavlja probleme mnogim metodam obdelave naravnega jezika (npr. strojnemu prevajanju). Eden glavnih problemov je pomanjkanje velikih podatkovnih množic, ki so potrebne za uspešno delovanje globokih nevronskih mrež in drugih sodobnih metod obdelave naravnega jezika. Predstavljena bo metoda za prepoznavanje idiomov v slovenskih besedilih z metodami strojnega učenja, nevronskih mrež in vektorskih vložitev besed. Predstavljena metoda zaradi uporabe kontekstualnih vektorskih vložitev deluje dobro tudi brez uporabe velikih učnih množic. Prav tako je zmožna zaznati idiome, ki se v učni množici ne pojavijo, kar dosedanjim metodam predstavlja velike probleme. Predstavili bomo tudi slovensko podatkovno množico povedi SloIE, ki vsebuje 29,400 povedi z besednimi zvezami, ki se lahko pojavijo ali v dobesednem ali v idiomatskem pomenu.

Predstavitev predavatelja: Tadej Škvorc je mladi raziskovalec na Institutu Jožef Stefan in doktorski študent na Fakulteti za računalništvo in informatiko Univerze v Ljubljani. Njegovo raziskovalno področje predstavlja obdelava neravnega jezika, predvsem metode osredotočene na vektorske vložitve besed.


Razpis za štipendiji za obisk poletnih šol v letu 2021

Eno temeljnih poslanstev SDJT je tudi izobraževanje novih generacij raziskovalcev s področja jezikovnih tehnologij in društvo je v preteklih letih letno podelilo dve štipendiji za obisk izbranih poletnih šol s področja jezikovnih tehnologij in digitalne humanistike.

Ena od poletnih šol, ki bi lahko bila v letu 2021 v tem smislu aktualna, je LxMLS 2021 – 11th Lisbon Machine Learning School – http://lxmls.it.pt/2021/.

Po tradiciji v razpis vključujemo tudi 32nd European Summer School in Logic, Language and Information – https://esslli2021.unibz.it/. Ta poletna šola se bo zaradi aktualnih zdravstvenih razmer izvajal na daljavo.

S področja digitalne humanistike je primerna poletna šola CULTURE & TECHNOLOGY – European Summer University in Digital Humanities. Ta poletna šola se bo izvajala hibridno.

Za štipendiji se lahko potegujejo študenti druge in tretje stopnje katerekoli študijske smeri, ki so včlanjeni v SDJT (http://goo.gl/forms/SvMeZL8thX), in jih zanima digitalna humanistika, obdelava naravnih jezikov (NLP), jezikovne tehnologije in računalniško jezikoslovje, pri čemer imajo prednost tisti, ki že poznajo osnove NLP in/ali se v okviru doktorske oz. magistrske naloge ukvarjajo oz. nameravajo ukvarjati z jezikovnimi tehnologijami za slovenščino.

Morebitni interesenti naj pošljejo življenjepis in motivacijsko pismo na naslov sdjt@ijs.si (z naslovom – Prijava za štipendijo za poletno šolo), pri čemer lahko tudi sami navedejo, če jih morda zanima katera druga relevantna poletna šola, ki ni omenjena zgoraj.  Vse mentorje in profesorje, ki so aktivni na področjih relevantnih poletnih šol, pa prosimo, da informacijo o možnosti štipendiranja razširijo med svojimi študenti.


Vabilo na marčno e-Joto

V okviru Jezikovno-tehnološkega abonmaja Slovenskega društva za jezikovne tehnologije ste po daljšem premoru vabljeni na marčno e-Joto v sredo, 17. marca, ob 14. uri. Tudi tokratna e-Jota bo izvedena na daljavo in sicer na videokonferenčni Zoom platformi na povezavi

https://uni-lj-si.zoom.us/j/92749548390?pwd=MTBONCtCcmwrRGFiczM4RXh6a3Nadz09
Meeting ID: 927 4954 8390
Passcode: 177054

Kolega Martin Božič s Fakultete za računalništvo in informatiko Univerze v Ljubljani nam bo predstavil razvito orodje za samodejno postavljanje vejic v slovenska besedila, ga je razvil v okviru svojega diplomskega dela pod mentorstvom prof. dr. Marka Robnika Šikonje in je na razpolago na spletnem naslovu https://orodja.cjvt.si/vejice/home

Naslov predavanja: Uporaba modela BERT pri postavljanju vejic v slovenskem jeziku

Med najpogostejše napake pri pisanju besedil v slovenščini sodi napačno postavljanje vejic. V okviru e-Jote bo predstavljena rešitev samodejnega postavljanja vejic, ki jo bila razvita pod mentorstvom prof. dr. Marka Robnika Šikonje v okviru predavateljeve diplomske naloge ob zaključku 1. stopnje študija na Fakulteti za računalništvo in informatiko Univerze v Ljubljani. Rešitev temelji na uporabi vnaprej naučenega jezikovnega modela tipa BERT, ki je bil izpopolnjen za problem samodejnega postavljanja vejic. Arhitekturo BERT se bo primerjalo z rešitvijo, pridobljeno z uporabo GRU nevronskih mrež, s čimer se je doseglo znatno izboljšanje rezultatov. Na kratko bo predstavljeno delovanje celotnega modela. Predstavljena arhitektura se trenutno uporablja v aplikaciji Vejice, ki je dostopna na spletnem naslovu: https://orodja.cjvt.si/vejice/home.

Predavatelj:

Martin Božič je študent 1. letnika Magistrskega študija na Fakulteti za računalništvo in informatiko Univerze v Ljubljani. V prvih treh letih študija se je spoznal z osnovami umetne inteligence. To znanje je uporabil pri svoji diplomski nalogi ob zaključku 1. stopnje. Vedno ga je veselilo delo na uporabnih stvareh, zato se je odločil za diplomsko nalogo iz samodejnega postavljanja vejic.


Zaključek konference JTDH 2020

Slovensko društvo za jezikovne tehnologije (SDJT), Center za jezikovne vire in tehnologije Univerze v Ljubljani (CJVT), Inštitut za novejšo zgodovino (INZ) ter raziskovalni infrastrukturi CLARIN.SI in DARIAH-SI so 24. in 25. 9. 2020 organizirali konferenco “Jezikovne tehnologije in digitalna humanistika” (JTDH 2020).

Zaradi pandemije Covid-19 je bila letošnja konferenca izvedena v virtualni obliki:
http://www.sdjt.si/wp/dogodki/konference/jtdh-2020/.

Konference se je udeležilo 172 registriranih udeležencev iz 18 držav. Predstavljenih je bilo 21 rednih in 5 študentskih prispevkov 73 avtorjev iz 5 držav. Prispevki so objavljeni v zborniku konference:
http://www.sdjt.si/wp/dogodki/konference/jtdh-2020/zbornik/.

Program je vključeval dve vabljeni predavanjih, 4 redne sekcije, panel projekta »Razvoj slovenščine v digitalnem okolju« in občni zbor našega društva. Prispevki in video posnetki vseh predstavitev so na razpolago na spletnih straneh urnika konference:
http://www.sdjt.si/wp/dogodki/konference/jtdh-2020/urnik-timetable/.

Nagrado za najboljši študentski prispevek na konferenci je prejel Zoran Fijavž za svoj prispevek z naslovom Ambivalence of Queer Visibility in Video-Based Social Media Content.

Nagrado za najboljšo predstavitev prispevka pa je prejela Špela Antloga za predstavitev svojega prispevka z naslovom Korpus metafor KOMET 1.0.

Slovensko društvo za jezikovne tehnologije se zahvaljuje vsem recenzentom za zelo kakovostne recenzije prispevkov, moderatorjem za odlično vodenje sekcij in vsem našim kolegom organizatorjem, ki so izkazali veliko predanost pri izvedbi konference v teh posebnih okoliščinah. Posebna zahvala gre naši predani kolegici Darji Fišer, ki je vodila programski odbor konference in ima največ zaslug za uspešno izvedbo konference.

Posebna zahvala gre tudi predstavnikom in sodelavcem raziskovalnih infrastruktur CLARIN.SI in DARIAH-SI, ki so s svojo podporo omogočili, da je bila udeležba na konferenci brezplačna. Njihovi sodelavci so pomembno pripomogli k uspešni pripravi zbornika in organizaciji same konference.

Nenazadnje gre posebna zahvala tudi predstavnikom CLARIN ERIC, ki so omogočili virtualno izvedbo konference z brezplačnim uporabo njihove licence za videokonferenčno platformo Zoom.


Vabilo na redni občni zbor društva

Člani SDJT so vljudno vabljeni na redni občni zbor SDJT, ki bo v petek, 25. septembra 2020, ob 16. uri. Zaradi pandemije Covid-19 in splošnih priporočil NIJZ bo občni zbor SDJT tokrat izveden na daljavo prek videokonferenčne platforme Zoom, in sicer kot zaključni dogodek konference Jezikovne tehnologije in digitalna humanistika JTDH 2020, ki bo prav tako potekala v virtualni obliki: http://www.sdjt.si/wp/dogodki/konference/jtdh-2020/. Urnik konference: http://www.sdjt.si/wp/dogodki/konference/jtdh-2020/urnik-timetable/.

Naše društvo po tradiciji sodeluje pri organizaciji konference JTDH 2020 in člani so vljudno vabljeni, da se konference udeležijo in jo promovirajo med strokovnimi kolegi. Konferenca je za vse udeležence brezplačna, je pa zaradi lažje organizacije obvezna prijava: https://forms.gle/cmeX6orURaSfuFSN9

Predlagani dnevni red občnega zbora SDJT je:

1. Izvolitev delovnega predsedstva
2. Izvolitev zapisnikarja in dveh overoviteljev zapisnika
3. Ugotavljanje sklepčnosti in sprejem dnevnega reda
4. Poročilo o delovanju društva od zadnjega občnega zbora; obravnava in sprejem poročila
5. Poročilo o finančnem poslovanju društva v obdobju od zadnjega občnega zbora; obravnava in sprejem poročila
6. Program dela v naslednjem letu in razprava
7. Razno

Povezavo na videokonferenco Zoom, prek katere se boste pridružili občnemu zboru SDJT, boste po e-pošti prejeli v času trajanja konference JTDH 2020.


Objavljen urnik in odprta registracija na konferenco JTDH 2020

Objavili smo urnik konference JEZIKOVNE TEHNOLOGIJE IN DIGITALNA HUMANISTIKA 2020. Zaradi pandemije Covid-19 bo konferenca JTDH 2020 potekala v virtualni obliki. Konferenca bo za vse udeležence brezplačna, je pa zaradi lažje organizacije obvezna prijava. Ker želimo zagotoviti, da bi bila konferenca v čim večji meri dostopna za vse zainteresirane, bo program sestavljen iz asinhronih (posnetki) in sinhronih (v živo) elementov:

  • Zbornik konference in posnetki predstavitev sprejetih prispevkov bodo objavljeni vnaprej, tako da si jih bodo udeleženci lahko ogledali, ko jim to najbolj ustreza. Avtorji bodo predstavitve prispevkov posneli vnaprej in jih poslali organizatorjem.
  • Med konferenco bomo v okolju Zoom organizirali moderirane tematske diskusije v živo, na katerih bodo registrirani udeleženci lahko zastavljali vprašanja in komentirali prispevke.

Vabilo na majsko Joto

V okviru Jezikovno-tehnološkega abonmaja Slovenskega društva za jezikovne tehnologije ste vabljeni na majsko e-Joto v četrtek, 21. maja 2020, ob 14. uri, ki bo tokrat izjemoma izvedena na daljavo v MS Teams skupini “SDJT Jota”, ki se ji lahko v MS Teams okolju pridružite s kodo “yb3d9ui”. Vsi, ki nimate dostopa do MS Teams okolja in bi se predavanja radi udeležili, pa pišite na email naslov <simon.dobrisek@fe.uni-lj.si>, da vam pošljemo vabilo za pridružitev v skupino kot zunanjemu gostu.

Kolega Marko Drobnjak z Inštituta za kriminologijo na Pravni fakulteti Univerze v Ljubljani nam bo tokrat predstavil preučevanje percepcije govora v pravnih postopkih in metodološki pristop tovrstnega raziskovanja za slovenski jezik.

Naslov predavanja: Percepcija slovenščine v pravnih postopkih in načini za profiliranje posameznikov na podlagi govora

Govor z uveljavitvijo multidisciplinarne metodologije, kjer v zadnjem času še posebej pomembno vlogo igrajo tehnologije za procesiranje naravnega jezika (angl.: natural language processing – NLP), predstavlja raziskovalni izziv sodobni znanosti in tudi temo prihajajočega predavanja. V tokratni e-Joti bo predstavljeno preučevanje percepcije govora v pravnih postopkih in metodološki pristop tovrstnega raziskovanja za slovenski jezik. V sklepnem delu bo kot izziv za prihodnost nakazan nastavek, ki poleg percepcije govora vključuje tudi dimenzijo profiliranja in identifikacije na podlagi govora. Poleg obstoječih znanih metod bo zaključna debata potekala o potencialu vektorske vložitve besed, in sicer s poudarkom na »akustičnih« značilnostih oz. fonetičnih značilnostih slednjih (angl.: acoustic word embeddings – AWEs) in nevronskih mrežah – tako pri raziskovanju percepcije govora kot pri identifikaciji na podlagi govora.

Predavatelj:

Marko Drobnjak je mladi raziskovalec na Inštitutu za kriminologijo in doktorski študent Pravne fakultete Univerze v Ljubljani. Njegovo raziskovalno področje predstavlja kriminološko preučevanje jezika in prava, še posebej se osredotoča na percepcijo govora v pravnih postopkih.


Vabilo na konferenco JTDH 2020

Slovensko društvo za jezikovne tehnologije (SDJT), Center za jezikovne vire in tehnologije Univerze v Ljubljani (CJVT), Inštitut za novejšo zgodovino (INZ) ter raziskovalni infrastrukturi CLARIN.SI in DARIAH-SI bodo 24. in 25. 9. 2020 organizirali konferenco “Jezikovne tehnologije in digitalna humanistika”, ki se ponaša z več kot 20-letno tradicijo, tematsko širitev na digitalno humanistiko pa smo uvedli leta 2016.

Na konferenco vabimo raziskovalce, ki delujejo v različnih disciplinah in metodoloških okvirih. Vabimo prispevke z naslednjih področij:
– govorne in druge eno- in večjezične jezikovne tehnologije
– digitalno jezikoslovje: prevodoslovje, korpusno jezikoslovje, leksikologija in leksikografija, standardizacija
– digitalna humanistika in zgodovinopisje, literarne vede, etnologija, muzikologija, kulturna dediščina, umetnost ter arheologija
– digitalna humanistika v izobraževanju in digitalna publicistika

Dobrodošli so prispevki, ki predstavljajo smernice, raziskave, dobre prakse, projekte in rezultate na teh področjih. V sklopu konference bodo tudi vabljeni predavanji, študentska sekcija ter paneli o aktualnih temah, povezanih s konferenco. Uradna jezika konference bosta slovenščina in angleščina.

Več informacij in pomembni datumi so objavljeni na spletni strani konference www.sdjt.si/jtdh-2020


Razpis za štipendiji za obisk poletnih šol

Eno temeljnih poslanstev SDJT je tudi izobraževanje novih generacij raziskovalcev s področja jezikovnih tehnologij, zato bo društvo tudi letos podelilo dve štipendiji za obisk izbranih poletnih šol.

Ena od poletnih šol, ki bi lahko bila v tem smislu aktualna je: LxMLS 2020 – 10th Lisbon Machine Learning School – http://lxmls.it.pt/2020/. Rok za prijavo na to šolo je že 15. marca, zato bi morali čim prej identificirati morebitne kandidate med vašimi (doktorskimi) študenti .

Po tradiciji je alternativna opcija, da v razpis vključimo 32nd European Summer School in Logic, Language and Information – https://www.esslli.eu/

S področja digitalne humanistike pa je verjetno smiselno vključiti poletno šolo: BAL-ADRIA Summer School on Digital Humanities 2020 – https://www.dariah.eu/event/bal-adria-summer-school-on-digital-humanities-2020/

Za štipendiji se lahko potegujejo študenti druge in tretje stopnje katerekoli študijske smeri, ki so včlanjeni v SDJT in jih zanima digitalna humanistika, obdelava naravnih jezikov (NLP), jezikovne tehnologije in računalniško jezikoslovje, pri čemer bodo imeli prednost tisti, ki že poznajo osnove NLP in/ali se v okviru doktorske oz. magistrske naloge ukvarjajo oz. nameravajo ukvarjati z jezikovnimi tehnologijami za slovenščino.

Morebitni interesenti že lahko pošljejo življenjepis in motivacijsko pismo na naslov sdjt@ijs.si, pri čemer lahko tudi sami navedejo, če jih morda zanima katera druga relevantna poletna šola, ki ni omenjena zgoraj.  Vse mentorje in profesorje, ki so aktivni na področjih relevantnih poletnih šol, pa prosim, da informacijo o možnosti štipendiranja že razširijo med svojimi študenti.


Vabilo na redni občni zbor društva

Spoštovani člani SDJT,

vljudno vabljeni na redni občni zbor SDJT, ki bo v petek, 18. oktobra 2019, ob 12. uri v predavalnici P03 na Fakulteti za računalništvo in informatiko Univerze v Ljubljani.

Predlagani dnevni red je:

1. Izvolitev delovnega predsedstva
2. Izvolitev zapisnikarja in dveh overoviteljev zapisnika
3. Ugotavljanje sklepčnosti in sprejem dnevnega reda
4. Poročilo o delovanju društva od zadnjega občnega zbora; obravnava in sprejem poročila
5. Poročilo o finančnem poslovanju društva v obdobju od zadnjega občnega zbora; obravnava in sprejem poročila
6. Sprememba statuta za ohranitev statusa društva, ki deluje v javnem interesu
7. Program dela v naslednjem letu in razprava
8. Razno
Uvod v občni zbor bo redna mesečna Jota, na kateri nam bosta kolegica dr. Nataša Logar z UL FDV in kolega dr. Iztok Kosem z UL FF (CJVT) in IJS predstavila mobilno aplikacijo »Igra besed«, v kateri se uporabniki preizkušajo v poznavanju tipičnih slovenskih besednih zvez.

Navodila za dostop do FRI najdete na spletni strani:
https://fri.uni-lj.si/sl/o-fakulteti/kako-do-nas

Lep pozdrav,

Simon Dobrišek,
Predsednik SDJT


Vabilo na oktobrsko Joto

V okviru Jezikovnotehnološkega abonmaja Slovenskega društva za jezikovne tehnologije vabimo na oktobrsko Joto, ki jo bomo priredili v petek, 18. oktobra 2019, ob 12. uri v predavalnici P03 na Fakulteti za računalništvo in informatiko Univerze v Ljubljani. Kolega Nataša Logarin Iztok Kosem s Centra za jezikovne vire in tehnologije Univerze v Ljubljani bosta predstavila mobilno aplikacijo Igra besed.

Naslov predavanja: Igra besed: od korpusnostatistične tipičnosti do mobilne zabave s slovenščino

V slovenskem prostoru so mobilne aplikacije, ki promovirajo prostočasno utrjevanje in izboljševanje znanja slovenskega jezika, zelo redke (npr. Besedovnjak, Besedni piknik). Na predavanju bomo predstavili novo mobilno aplikacijo Igra besed, v kateri se uporabniki mobilnih naprav z operacijskima sistemoma Android in iOS lahko preizkušajo v poznavanju
tipičnih slovenskih besednih zvez. Prikazali bomo vsebinsko in podatkovno zasnovo igre ter tudi že prve odzive nanjo.

Predavatelja:

Dr. Nataša Logar je docentka na Fakulteti za družbene vede UL. Predava o jezikovni kulturi slovenskega jezika, jeziku in stilu novinarskih besedil ter strokovno-znanstveni slovenščini, raziskovalno pa jo ob tem zanimajo predvsem sodobni jezikovni viri.

Dr. Iztok Kosem je raziskovalec na Filozofski fakulteti UL (Center za jezikovne vire in tehnologije UL) ter na Institutu Jožef Stefan. Proučuje področje leksikografije in korpusnega jezikoslovja s poudarkom na uporabniško prijaznih virih ter aplikacijah za
slovenščino.


Kako bo mogoče? Posvet o digitalni prihodnosti slovenščine

V petek, 27. septembra 2019, je v Zbornični dvorani stavbe Univerze v Ljubljani potekal dogodek z naslovom »Kako bo mogoče? – posvet o digitalni prihodnosti slovenščine«, ki ga je Slovensko društvo za jezikovne tehnologije soorganiziralo s Centrom za jezikovne vire in tehnologije Univerze v Ljubljani, Inštitutom za slovenski jezik Frana Ramovša ZRC SAZU in raziskovalno infrastrukturo CLARIN.SI (Institut Jožef Stefan). Namen posveta je bil ugotoviti, kateri ukrepi bi najbolj učinkovito prispevali k uspešnemu razvoju slovenščine v digitalnem okolju v času pospešene digitalizacije in globalizacije.

Več podrobnosti o dogodku: http://www.sdjt.si/wp/dogodki/posveti/posvet-o-digitalni-prihodnosti-slovenscine/.


Kratko poročilo z 31. Evropske poletne šole logike, jezika in informatike
Štipendistka Iza Škrjanec je strnila vtise z letošnje poletne šole ESSLLI v Rigi [Prispevek]


Kratko poročilo z Evropske poletne univerze digitalne humanistike
Štipendistka Kristina Pahor da Maiti je strnila vtise z letošnje poletne šole Univerze v Leipzigu [Prispevek]


Vabilo na šesti spominski pohod Adama Kilgarriffa

V letu 2019 se bomo v spomin na Adama Kilgarriffa ponovno odpravili v hribe. Kot vas večina najbrž že ve, Slovensko društvo za jezikovne tehnologije vsako leto organizira pohod v spomin na veliko prekmalu preminulega kolega in prijatelja Adama Kilgarriffa. Tokrat se bomo na spominsko pot odpravili že šestič, in sicer bomo pot začeli pri domu pod slapom Rinka. Zahtevnejše pohodnike bo pot zanesla na Brano, medtem ko bo lažji pohod do Doma na Okrešlju prijaznejši družinam (in tistim, ki jih moti zgodnja ura). Pot na Brano ne terja posebne opreme, zaradi krušljivega terena je dobrodošla čelada. Na koncu se vsi zberemo na Okrešlju. Za prevoz bomo pohodniki poskrbeli sami, če potrebujete prevoz, nam pišite, sicer pa prijave niso potrebne. Ne pozabite na pijačo, jedačo in obvezno planinsko opremo. V primeru slabega vremena pohod odpade.

Datum: 17. avgust 2019
Izhodišče: Koča pod slapom Rinka (930 m)
Cilja: Okrešelj (lažji pohod, primeren za družine; 1396 m; 1 ura in 15 minut) in Brana (2253 m; 3 ure in pol)
Štart: 11.00 (Okrešelj) / 7.00 (Brana)
Zbirališče: Dom na Okrešlju
Organizacija: damjan.popic@ff.uni-lj.si , darja.fiser@ff.uni-lj.si

Adam Kilgariff, Nikola Ljubešić in Tomaž Erjavec med Adamovim zadnjim vzponom na Grintovec.

Vabilo na majsko Joto

V okviru Jezikovnotehnološkega abonmaja Slovenskega društva za jezikovne tehnologije vabimo na majsko Joto, ki jo bomo priredili v torek, 28. maja 2019, ob 14. uri v predavalnici P04 na Fakulteti za računalništvo in informatiko Univerze v Ljubljani.

Kolega Tomaž Erjavec z Odseka za tehnologije znanja na Institutu »Jožef Stefan« nam bo predstavil evropsko raziskovalno infrastrukturo CLARIN in slovensko nacionalno infrastrukturo CLARIN.SI.

Naslov predavanja: Raziskovalna infrastruktura CLARIN.SI

Predavanje bo predstavilo evropsko raziskovalno infrastrukturo CLARIN in slovensko nacionalno infrastrukturo CLARIN.SI. Vizija CLARIN je omogočiti dostopnost digitalnih jezikovnih virov in orodij za vse evropske jezike, predvsem za raziskovalce v humanistiki in družboslovju, pri čemer je CLARIN.SI usmerjena predvsem na slovenski jezik, kot tudi druge južnoslovanske jezike. Predavanje bo predstavilo organizacijo in storitve CLARIN(.SI), s poudarkom na virih, ki so dostopni v repozitoriju infrastrukture in omogočajo raznovrstne jezikovnotehnološke raziskave slovenskega jezika.


Razpis za štipendiji za obisk poletnih šol

Eno temeljnih poslanstev SDJT je tudi izobraževanje novih generacij raziskovalcev s področja jezikovnih tehnologij, zato  društvo tudi letos podeljuje dve štipendiji za obisk poletnih šol, in sicer za:

– poletno šolo European Summer University in Digital Humanities, ki bo od 23. julija do 2. avgusta 2019 potekala v Leipzigu v Nemčiji, in

– poletno šolo European Summer School of Logic, Language and Information, ki bo potekala od 5. do 16. avgusta 2019 v Rigi v Latviji.

Za štipendiji se lahko potegujejo študenti druge in tretje stopnje katerekoli študijske smeri, ki so včlanjeni v SDJT, in jih zanima digitalna humanistika, obdelava naravnih jezikov (NLP), jezikovne tehnologije in računalniško jezikoslovje, pri čemer bodo imeli prednost tisti, ki že poznajo osnove NLP in/ali se v okviru doktorske oz. magistrske naloge ukvarjajo oz. nameravajo ukvarjati z jezikovnimi tehnologijami za slovenščino.

Interesenti pošljite življenjepis in motivacijsko pismo do 15. aprila 2019 na naslov sdjt@ijs.si.

Komisija v sestavi: Simon Dobrišek, Darja Fišer in Špela Arhar Holdt, bo nato izvedla izbor kandidatov najkasneje do 25. aprila 2019.

Vse mentorje in profesorje, ki so aktivni na področjih omenjenih poletnih šol, prosimo, da informacijo o razpisu razširijo med svojimi študenti.


Vabilo na marčevsko Joto

V okviru Jezikovnotehnološkega abonmaja Slovenskega društva za jezikovne tehnologije ste vabljeni na marčevsko Joto, ki jo bomo priredili v četrtek, 28. marca 2019, ob 14. uri v predavalnici P18 na Fakulteti za računalništvo in informatiko Univerze v Ljubljani.

Kolega Martin Pernuš nam bo predstavil najnovejše smernice pri
raziskovanju uporabe metod strojnega učenja za hkratno obdelovanje jezikovnih, slikovnih in zvočnih informacij.

Naslov predavanja: Možnosti združevanja jezikovnih, zvočnih in slikovnih tehnologij

Na predavanju bodo predstavljene najnovejše smernice pri raziskovanju uporabe metod strojnega učenja za hkratno obdelovanje jezikovnih, slikovnih in zvočnih informacij. Na kratko bodo opisani najnovejši odmevnejši članki na tem področju. Predstavljeni študijski pregled področja raziskovanja je bi izveden v okviru seminarja doktorskega študija na Fakulteti za Elektrotehniko Univerze v Ljubljani.


Vabilo na februarsko Joto

vabljeni na februarsko Joto, ki jo bomo priredili v četrtek, 21. februarja 2019, ob 14 uri v predavalnici P03 na Fakulteti za računalništvo in informatiko, Univerze v Ljubljani.

Kolega Marko Plahuta nam bo predstavil tehnologije in metode strojnega učenja, ki so bile uporabljene za postavitev spletnega iskalnika https://www.kontekst.io.

Naslov predavanja: Uporaba strojnega učenja za postavitev spletnega iskalnika kontekst.io
Na predavanju bo predstavljeno spletno mesto kontekst.io – motivacija, tehnologija in izvedba. Po kratkem uvodu v jezikovno modeliranje z nevronskimi mrežami ter opisu prednosti in slabosti modela word2vec v primerjavi s sodobnejšimi modeli bo predstavljen postopek priprave modela (zbiranje korpusa, obdelava besedila, izračun kolokacij …) in uporabe na spletu. Ob zaključku bo sledil prikaz nekaj praktičnih poskusov z modelom in njegove uporabnosti za druga opravila v strojnem učenju.


Vabilo na novembrsko Joto

Vabljeni na prvo Joto v sezoni 2018/2019, ki jo bomo priredili v petek, 9. novembra 2018, ob 14 uri v predavalnici P19 na Fakulteti za računalništvo in informatiko Univerze v Ljubljani.

Kolega Matjaž Rihtar iz Laboratorija za umetno inteligenco na IJS nam bo predstavil strojno prevajanje z uporabo nevronskih omrežij.

Naslov predavanja: Nevronsko strojno prevajanje
Predavanje ‘Nevronsko strojno prevajanje’ bo prikazalo trenutno stanje in izzive na področju nevronskega prevajanja. Prikazali bomo kratek uvod v nevronske mreže (nelinearnost, vzvratno razširjanje napak, možne izboljšave), nevronske jezikovne in prevajalne modele (LSTM, GRU, kodirnik-odkodirnik z mehanizmom pozornosti), možne izboljšave celotnega procesa (BPE, uporaba NMT pri prevajanju ne-naučenih jezikov) in trenutne izzive. Na koncu bomo v živo prikazali tudi prevajanje iz slovenščine v angleščino in obratno z nevronskim modelom, razvitim v Laboratoriju za umetno inteligenco na Institutu Jožef Stefan.


Vabilo na redni občni zbor SDJT

Spoštovani člani,

vabimo vas na redni občni zbor SDJT, ki bo dne 20. septembra 2018, ob 17:30, v predavalnici P3 na Fakulteti za elektrotehniko, Tržaška 25, Ljubljana.

Predlagani dnevni red je:

  1. Izvolitev delovnega predsedstva
  2. Izvolitev zapisnikarja in dveh overoviteljev zapisnika
  3. Ugotavljanje sklepčnosti in sprejem dnevnega reda
  4. Poročilo o delovanju društva od zadnjega občnega zbora; obravnava in sprejem poročila
  5. Poročilo o finančnem poslovanju društva v obdobju od zadnjega občnega zbora; obravnava in sprejem poročila
  6. Volitve organov SDJT
    – Upravni odbor (predsednik, tajnik, blagajnik, 2 člana UO)
    – Nadzorni odbor (predsednik, 2 člana NO)
    – Častno razsodišče (predsednik, 2 člana ČR)
  7. Glasovanje na daljavo
  8. Program dela v naslednjem letu in razprava
  9. Razno

Prosimo, da kandidature (svoje ali tuje) za članstvo v UO pošljete na sdjt@ijs.si najkasneje do 19. septembra 2018. Mandatna doba članov posameznih organov je 4 leta. Člani so lahko večkrat izvoljeni v isti organ društva. Praviloma so v organih enakopravno zastopani člani s posameznih področij jezikovnih tehnologij. Člani nadzornega odbora ne morejo biti obenem člani upravnega odbora.
Prosimo, da se občnega zbora udeležite v čim večjem številu.

Lep pozdrav,

Darja Fišer
v imenu UO SDJT


Izkušnja z Evropske poletne univerze iz digitalne humanistike na Univerzi v Leipzigu:
Ivana Zajc o poletni šoli in možnostih, ki jih nudi digitalna humanistika [Prispevek]


Vtisi s 4. pohoda v spomin na Adama Kilgarriffa, 22. julij 2018
[Prispevek]


Spoštovani,

sporočamo, da je na pobudo članov in ob izraženem nadaljnjem zaupanju Upravni odbor SDJT umaknil svoj odstop, ki ga je ponudil zaradi slabe presoje o podpori državnega svetnika Matjaža Gamsa. Za razumevanje in zaupanje se članom SDJT iskreno zahvaljujemo ter z vso predanostjo nadaljujemo z delom.

Lep pozdrav,

Upravni odbor SDJT


Spoštovani,

Upravni odbor Slovenskega društva za jezikovne tehnologije sporoča, da se je o podpori kandidata za področje znanosti za Državni svet Matjaža Gamsa odločal na podlagi programa, ki ga je kandidat predložil in ga pripenjamo na dnu tega sporočila. Njegove dejavnosti v sklopu dogodka “Kako preprečiti izumiranje slovenskega naroda”, ki je potekal v Državnem svetu Republike Slovenije 24. maja 2018, najstrožje obsojamo, saj so v nasprotju z vsemi vrednotami in cilji, v okviru katerih društvo deluje, pa tudi v nasprotju s programom, ki ga je predložil ob kandidaturi. S slabo presojo kandidata smo škodovali ugledu društva in njegovih članov, pa tudi slovenski znanosti in družbi nasploh, za kar se iskreno opravičujemo. Svoje napake se zavedamo in sprejemamo odgovornost zanjo, zato podajamo odstopno izjavo. Prav tako pozivamo k javnemu opravičilu in odstopu s funkcije člana Državnega sveta Matjaža Gamsa.

Lep pozdrav,

 
Upravni odbor Slovenskega društva za jezikovne tehnologije
Darja Fišer, predsednica
Kaja Dobrovoljc, tajnica
Katja Zupan, blagajničarka
Darinka Verdonik, članica
Miro Romih, član
 

Vabilo na junijsko Joto

Lepo vabljeni na poslednjo akademsko Joto v tej sezoni, ki se bo zvrstila v torek, 5. junija, ob 14:15 v P20 na Fakulteti za računalništvo Univerze v Ljubljani. O avtomatskem generiranju sloganov bo predaval Matej Martinc z IJS.

Naslov predavanja: Kreativno generiranje sloganov
Dobri reklamni slogani nastajajo tekom kompleksnega in dolgotrajnega procesa generiranja kandidatov za slogane v okviru možganskih neviht, piljenja in preverjanja najboljših idej ter končno z izborom najboljšega kandidata za uporabo v produkciji. Predstavljen bo sistem za generiranje naravnega jezika, ki je bil ustvarjen z namenom pohitritve in optimizacije tega procesa. Sistem kot vhod dobi besedilo z opisom podjetja, ga obdela s pomočjo metod za obdelavo naravnega jezika in jezikovnega modeliranja ter kot izhod vrne množico kandidatov za slogane za izbrano podjetje. Na predavanju se bomo poglobili v tehnične podrobnosti delovanja sistema, predstavili primere zgeneriranih sloganov in pojasnili, kako se je sistem obnesel pri nalogi generiranja angleških reklamnih sloganov za dve slovenski podjetji.

 

Razpis dveh štipendij SDJT

Glede na to, da je eno osnovnih poslanstev SJDT izobraževanje nove generacije raziskovalcev s področja jezikovnih tehnologij, bo SDJT tudi letos podelil 2 štipendiji za obisk poletnih šol, in sicer 1 za poletno šolo European Summer University in Digital Humanities, ki bo od 17. do 27. julija 2018 potekala v Leipzigu v Nemčiji, 1 pa za poletno šolo European Summer School of Logic, Language and Information, ki bo potekala od 6. do 17. avgusta 2018 v Sofiji v Bolgariji.

Štipendija krije registracijo za poletno šolo. Za poletno šolo ESSLLI organizator krije tudi stroške nastanitve v študentskem domu v večposteljni sobi.

Za štipendiji se lahko potegujejo študentje MA ali PhD stopnje katere koli študijske smeri, ki so včlanjeni v SDJT in jih zanima digitalna humanistika, procesiranje naravnih jezikov, jezikovne tehnologije in računalniško jezikoslovje, pri čemer bodo imeli prednost tisti, ki že poznajo osnove NLP in/ali se v okviru doktorske oz. magistrske naloge ukvarjajo oz. nameravajo ukvarjati z jezikovnimi tehnologijami za slovenščino.

Interesenti življenjepis in motivacijsko pismo do 4. junija 2018 pošljite na sdjt@ijs.si.

Komisija v sestavi Darja Fišer (FF), Kaja Dobrovoljc (IJS) in Marko Robnik Šikonja (FRI) bo izbrane kandidate obvestila do 10. junija 2018.


Vabilo na majsko joto

Dragi vsi, prav lepo vabljeni na majsko Joto, na kateri bo dr. Petra Kralj Novak z IJS predavala o trenjih stališč s pomočjo emojijev. Jota bo 21. 5. ob 14:15, P20 na Fakulteti za računalništvo Univerze v Ljubljani.

Naslov predavanja: Trenja stališč in čustvenčki v žarišču
Analiza stališč (stance analysis) je področje tekstovnega rudarjenja, ki se ukvarja z avtomatskim odkrivanjem, ali se pisec besedila strinja, nasprotuje ali je nevtralen do določenega vprašanja. V predavanju bom predstavila definicije in postopke, več pozornosti pa bom namenila rezultatom analize stališč na podatkih s socialnega omrežja Twitter. Posvetila se bom tudi dominantni novosti v neformalni komunikaciji: čustvenčkom (emoji) in njihovi vlogi v neformalni komunikaciji.


The 2018 Adam Kilgarriff Memorial Hike: Prevala (1311m) and Begunjščica (2060m)

Adam Kilgarrif at Grintavec (2347 m) in July 2013
Adam Kilgarrif at Grintavec (2347 m) in July 2013

Date: July 22, 2018
Start: 8am from Ljubljana, 9am from the starting point (the Ljubelj/Loibl Pass)
Duration: 1.5 hours to Prevala, 3.5 hours to Begunjščica (optional)
Difficulty: Easy walk to Prevala, steep but safe climb to Begunjščica

The view from Begunjščica.
The view from Begunjščica.

Organization: Darja Fišer and Damjan Popič

The Euralex Conference in Ljubljana coincides with the 5th anniversary of our last hike with our dear friend and inspiring colleague Adam Kilgarriff which we did just before driving together to the Euralex conference in Bolzano (15-19 July 2014). We hiked to the summit of Grintovec (2558 m), a strenuous hike even for experienced mountaineers, which Adam climbed in his sandals. Not only did he reach the summit first, he also offered to carry our backpack! I don’t remember ever seeing him happier than on that mountain.

The Slovene Language Technologies Society has been organizing a hike in Adam’s memory since then. On this occasion, we wish to invite the Euralex participants to join us on a beautiful hike to the Slovenian Alps we are certain Adam would have loved. The first part of the hike is easy, with lots of beautiful vistas, a tunnel and a mountain hut with great food. If you want a more challenging hike, you can also choose to continue all the way to the top of Begunjšica, a summit over 2000 meters above sea level.

The transportation from Ljubljana to the Ljubelj Pass and back is kindly sponsored by Lexical Computing. Please bring your own drinks and food (can also be purchased at the hut). In order to be able to organize the hike safely, registration is required by 1st July 2018. The hike is family friendly and everyone is welcome but please register each hiker separately.

If you have any questions about the hike, please send an email to sdjt@ijs.si.

Description of the hike | Equipment | Google form


Vabilo na deveto Joto sezone 2017/18
Dragi vsi, toplo vabljeni na aprilsko Joto, na kateri bo predaval prof. Ruslan Mitkov z Univerze v Wolverhamptonu. Predavanje (v angleščini) bo v torek, 17. aprila 2018, ob 16:15 v predavalnici 21 na Fakulteti za računalništvo in informatiko UL.

Naslov predavanja: Anaphora and coreference resolution: still a hard nut to crack? How far has it gone, what is its impact on NLP and what are the ways forward?

Anaphora and coreference resolution are arguably among the most challenging Natural Language Processing (NLP) tasks. Research in anaphora resolution and coreference resolution has focused almost exclusively on the development and intrinsic evaluation of various algorithms. While publications report positive results, the speaker will show that the replication of some of the best-known algorithms reveals reasons for concern in that the performance is far from ideal and the evaluation is far from transparent.

Anaphora and coreference resolution as tasks are crucial for the operation of NLP systems and should not be regarded in isolation but only in the wider picture of NLP applications. The extrinsic evaluation or the impact of an anaphora or coreference resolution module on a larger NLP system of which they are part, is an under-researched topic and several studies conducted by the speaker, seek to fill in this gap. More specifically, the speaker will discuss whether anaphora and coreference resolution can improve (and if they can, to what extent?) or not the performance of four NLP applications: text summarisation, term extraction, text categorisation and textual entailment.

The presentation will finish with suggested ways forward as to how anaphora and coreference resolution can do better and will outline the latest related research of the author.

Bio:
Ruslan Mitkov is Professor of Computational Linguistics and Language Engineering at the University of Wolverhampton. He is best known for his seminal contributions to the areas of anaphora resolution and automatic generation of multiple-choice tests. At Wolverhampton he set up the Research Group in Computational Linguistics, which has emerged as an internationally leading unit in applied Natural Language Processing and members of the group have won awards in different NLP/shared-task competitions. Prof. Mitkov is also Director of the Research Institute in Information and Language Processing, which includes the Research Group in Statistical Cybermetrics, another top performer internationally.

Lep pozdrav,
Darja Fišer


Vabilo na osmo Joto sezone 2017/18
Dragi vsi, prav lepo vabljeni še na drugo marčevsko Joto, ki jo prireja Oddelek za azijske študije FF UL. Na njej bo predaval prof. Prashant Pardeshi z Nacionalnega inštituta za japonski jezik in jezikoslovje. Predavanje (v angleščini) bo v ponedeljek, 26. marca 2018, od 16:20 do 18:00 v predavalnici 013 na FF.

Naslov predavanja: Japanese Basic Verbs Handbook: what is it and what does it do?
Polysemous lexical items, wherein one form has more than one meaning, are pervasive in the basic vocabulary of human languages and are considered to be generally difficult to acquire for foreign learners of any language. In the domain of linguistic theory, semanticists provided excellent insights into understanding the semantic connections among the multiple meanings of polysemous lexical items. However, dictionaries meant for native speakers tend to merely list multiple meanings of polysemous lexical items without describing the semantic connections among the multiple meanings, probably because the users of such dictionaries already know them intuitively. In the absence of learner’s dictionaries providing descriptions of the semantic connections among multiple meanings for a given form, understanding and acquiring multiple meanings of polysemous lexical items remains a difficult task for foreign learners of a language. The Japanese Basic Verbs Handbook—an online resource offering comprehensive description of multiple meanings and connections among them—is an attempt to fill this gap. In this talk we will offer an overview of the Japanese Basic Verbs Handbook and demonstrate its salient features (http://verbhandbook.ninjal.ac.jp/), in addition to introducing the two corpora used in its compilation. All the slides of the presentation are in Japanese and English and the talk will be given in English in order to make it accessible to those interested in general issues related to teaching/learning of polysemous basic verbs.

Bio:
Prashant Pardeshi (Ph.D., Kobe University) is a professor in the Division of Linguistic Theory and Typology, the National Institute for Japanese Language and Linguistics, Tokyo, Japan. He taught Japanese language at Department of Japanese, Pune University; Jawaharlal University, New Delhi and AOTS, New Delhi before moving to Japan. He is interested in functional linguistic typology, comparative studies between Japanese and Indian languages, Japanese language pedagogy, and lexicography. He has published many articles in international journals and edited volumes (http://www.ninjal.ac.jp/organization/researcher/prashant/).

Lep pozdrav,
Darja Fišer


Vabilo na sedmo Joto sezone 2017/18
Dragi vsi,
z veseljem vas vabimo na marčevsko Joto, na kateri bo dr. Jerneja Žganec Gros iz podjetja Alpineon predstavila sintetizator govora za slovenščino eBralec. Predavanje bo v ponedeljek, 19. marca 2018, ob 15:15 v P20 na Fakulteti za računalništvo UL.

Naslov predavanja: eBralec – sintetizator govora za slovenščino
eBralec je sintetizator govora za slovenski jezik, ki zna slovenska besedila samodejno pretvarjati v prijeten in razumljiv govor. Številnim slepim in slabovidnim uporabnikom ter dislektikom predstavlja nepogrešljiv pripomoček v vsakdanjem življenju. Predstavljen bo postopek njegove izgradnje, skupaj s številnimi primeri uporabe.

Lep pozdrav,
Darja Fišer


Vabilo na šesto Joto sezone 2017/18
Dragi vsi,
lepo vabljeni na februarsko Joto, na kateri bo Luka Krsnik predstavil svoje delo na področju avtomatskega naglaševanja slovenskih besed s pomočjo strojnega učenja. Predavanje bo 21. februarja ob 14:15 v predavalnici P20 na Fakulteti za računalništvo v Ljubljani.

Naslov predavanja: Napovedovanje naglasa slovenskih besed z metodami strojnega učenja
Za naglaševanje slovenskih besed ne obstaja preprost algoritem, naglasa slovenskih besed se namreč govorci naučimo med njihovim spoznavanjem. Metode strojnega učenja so se pri naglaševanju izkazale za uspešne. V magistrski nalogi smo na problemu preizkusili globoke nevronske mreže. Testirali smo različne arhitekture nevronskih mrež, več različnih predstavitev podatkov in ansamble mrež. Najboljše rezultate je vrnil ansambelski pristop, ki je pravilno napovedal 87,62 % besed iz testne množice. S predlaganim pristopom smo za več odstotkov izboljšal rezultate drugih metod strojnega učenja.

Vljudno vabljeni!
Darja Fišer


Vabilo na konferenco JTDH 
Slovensko društvo za jezikovne tehnologije, Fakulteta za elektrotehniko UL, Center za jezikovne vire in tehnologije UL, CLARIN.SI in DARIAH-SI 20. in 21. 9. 2018 organiziramo konferenco “Jezikovne tehnologije in digitalna humanistika”, ki se ponaša z več kot 20-letno tradicijo, tematsko širitev na digitalno humanistiko pa smo uvedli leta 2016. Vabljeni k oddaji prispevka. Več info: http://www.sdjt.si/wp/dogodki/konference/jtdh-2018/


JOTA na Videolectures
Predavanja v okviru Jezikovnotehnološkega abonmaja so odslej dostopna tudi na portalu Videolectures.NET.
Objavo posnetkov omogoča CLARIN.SI.
[video]


Vabilo na peto Joto sezone 2017/18
Dragi vsi, lepo vabljeni na našo prvo Joto v novem letu. Predavanje bo v sredo, 10. januarja, ob 15:15 v P22 na Fakulteti za računalništvo. Predaval bo Tadej Škvorc na temo avtomatskega sestavljanja urnikov za znanstvene konference.

Naslov predavanja: Gručenje z omejitvami na podlagi besedil in grafov pri razporejanju akademskih člankov
Ročno sestavljanje urnikov je lahko velikokrat zelo časovno zamudno opravilo. To drži še povsem pri organizaciji znanstvenih konferenc, kjer morajo organizatorji ustrezno razporediti predstavitve člankov, ki jih je lahko na velikih konferencah na stotine. Predstavitve morajo biti razporejene v seje tako, da vsaka seja vsebuje predstavitve člankov s sorodno tematiko. Na predavanju bomo predstavili, kako lahko z različnimi metodami obdelave naravnega jezika in strojnega učenja avtomatiziramo izgradnjo takega urnika. To storimo tako, da najprej z metodami obdelave naravnega jezika poiščemo podobne članke na podlagi njihovih besedil. Pomagamo si tudi z dodatnimi metapodatki v obliki grafov, ki jih imajo na voljo organizatorji konferenc. Na podlagi najdenih podobnosti lahko nato z gručenjem članke ustrezno razporedimo v seje urnika konference. Delo je bilo opravljeno na angleškem gradivu, prevajanje pa bo v slovenščini.

Lep pozdrav,
Darja Fišer


Vabilo na četrto Joto nove sezone (2017/18)
Dragi vsi, z veseljem sporočam, da leto 2017 zaključujemo s prav posebej zanimivo Joto, na kateri bo predaval Matt Purver z Univerze Queen Mary iz Londona (http://www.eecs.qmul.ac.uk/~ mpurver/). Predavanje bo 13. decembra ob 14:15 v P22 na FRI in bo potekalo v angleščini.

Naslov predavanja: Analysing Dialogue for Diagnosis and Prediction in Mental Health
Conditions which affect our mental health often affect the way we use language; and treatment often involves linguistic interaction. This talk will present work on three related projects investigating the use of computational natural language processing (NLP) to help understand and improve diagnosis and treatment for such conditions. We will look at clinical dialogue between patient and doctor or therapist, in cases involving schizophrenia, depression and dementia; in each case, we find that diagnostic information and/or treatment outcomes are related to observable features of a patient’s language and interaction with their conversational partner. We discuss the nature of these phenomena and the suitability and accuracy of NLP techniques for detecting them automatically.

Lep pozdrav,
Darja Fišer


Vabilo na tretjo Joto nove sezone (2017/18)
Lepo vabljeni na tretje predavanje, na katerem bo Geraint A. Wiggins z Univerze Queen Mary iz Londona predstavil svoje delo na področju računalniške ustvarjalnosti. Predavanje bo 22. 11. 2017 ob 14.00 v Oranžni sobi na Institutu “Jožef Stefan” in bo potekalo v angleščini.

Naslov predavanja:
Creativity, deep symbolic learning, and the information dynamics of thinking
I present a hypothetical theory of cognition which is based on the principle that mind/brains are information processors and compressors, that are sensitive to certain measures of information content, as defined by Shannon (1948). The model is intended to help explicate processes of anticipatory and creative reasoning in humans and other higher animals. The model is motivated by the evolutionary value of prediction in information processing in an information-overloaded world. (Povzetek v celoti dostopen tu.)

Lep pozdrav,
Darja Fišer


Vabilo na redni letni občni zbor in drugo Joto nove sezone

Spoštovani člani,

vljudno vabljeni na redni občni zbor SDJT, ki bo 24. oktobra 2016 ob 14.30 na Fakulteti za računalništvo v predavalnici P20.

Predlagani dnevni red je:

1. Izvolitev delovnega predsedstva
2. Izvolitev zapisnikarja in dveh overoviteljev zapisnika
3. Ugotavljanje sklepčnosti in sprejem dnevnega reda
4. Poročilo o delovanju društva od zadnjega občnega zbora; obravnava in sprejem poročila
5. Poročilo o finančnem poslovanju društva v obdobju od zadnjega občnega zbora; obravnava in sprejem poročila
6. Program dela v naslednjem letu in razprava
7. Razno

Uvod v občni zbor bo redna mesečna Jota, na kateri bo Peter Holozan predstavil nove Amebisove spletne servise:

Novi Amebisovi spletni servisi
V Amebisu smo se odločili, da ponudimo nekatere spletne  servise, uporabne predvsem za razvijalce virtualnih asistentov. Prvi je bil servis za napredno lematizacijo stavkov (kar imenujemo kar normalizacija), drugi pa bo pripisovanje konteksta vprašanjem/odgovorom glede na prejšnji pogovor. Predstavljeni bodo primeri, kako lahko pripisovanje konteksta izboljša odgovore v sistemu SecondEgo.

Lep pozdrav,

Darja Fišer
predsednica SDJT


Vabilo na prvo Joto nove sezone (2017/18)
Lepo vabljeni na prvo predavanje, na katerem bo Niko Colnerič s FRI predstavil svoje delo na področju prepoznave čustev v tvitih. Predavanje bo 27. 9. 2017 ob 14.00 v P20 na Fakulteti za računalništvo in informatiko UL.

Naslov predavanja:
Prepoznavanje čustev na Twitterju
Ste kdaj želeli prepoznavati čustva v tvitih, pa je teh bilo preveč za ročno pregledovanje? Bi vam koristilo, če bi računalnik sam znal ugotoviti, ali je bil nekdo jezen ali vesel, ko je nekaj zapisal? Na septembrskem predavanju bomo predstavili sistem za avtomatsko prepoznavanje čustev v angleških tvitih. Govorili bomo o tem, kako pridobiti podatke za učenje ter kako jih predobdelati. Primerjali bomo različne napovedne modele (tako klasične kot nevronske mreže) ter ugotavljali, kateri se najbolje obnesejo. Predstavili bomo pomanjkljivosti trenutnih pristopov ter prikazali delovanje na nekaj primerih.

Lep pozdrav,
Darja Fišer


Vabilo na planinski pohod
Dragi vsi,
lepo vabljeni na 3. planinski pohod v spomin Adamu Kilgarriffu v obeležitev 4. obletnice našega zadnjega skupnega vzpona na Grintovec, ki ga letos prijazno organizira Vojko Gorjanc. Z veseljem sporočamo, da se nam bo na pohodu pridružil tudi Miloš Jakubíček, direktor podjetja Lexical Computing, ki ga je ustanovil Adam.

Pohod bo v soboto, 8. julija, odpravili pa se bomo do Krnskega jezera: https://www.hribi.net/izlet/koca_pri_savici_krnsko_jezero_/1/163/4010. Pot bomo sklenili s kopanjem v Bohinjskem jezeru, tako da ne pozabite na kopalke in brisačo. Če si želite krajše ture, lahko izberete varianto iz Lepene:
http://www.hribi.net/izlet/dom_v_lepeni_krnsko_jezero_/1/163/291.

Če se nam želite pridružiti na poti, štartamo s parkirišča pri slapu Savica ob 7h. Če se nam želite pridružiti v planinskem domu pri Krnskih jezerih, pa se tam dobimo med 11. in 12. uro. Če potrebujete prevoz, pišite, pa se bomo skušali uskladiti. Dobrodošli tudi partnerji, družinski člani, prijatelji, psi. V primeru slabega vremena bo pohod prestavljen na 19. julij.

Se kmalu vidimo v alpskem slogu!
Darja Fišer


Odpoved osme letošnje Jote
Dragi vsi,
zaradi bolezni predavatelja žal odpade letošnja zadnja Jota o avtomatskem prepoznavanju čustev v tvitih. Joto bomo uvrstili v enega izmed jesenskih terminov. Hvala za razumevanje.


Vabilo na osmo letošnjo Joto
Lepo vabljeni na osmo letošnje predavanje, na katerem bo Niko Colnerič s FRI predstavil svoje delo na področju prepoznave čustev v tvitih. Predavanje bo 21. 6. 2017 ob 17.15 v P06 na Fakulteti za elektrotehniko UL.

Naslov predavanja:
Prepoznavanje čustev na Twitterju
Ste kdaj želeli prepoznavati čustva v tvitih, pa je teh bilo preveč za ročno pregledovanje? Bi vam koristilo, če bi računalnik sam znal ugotoviti, ali je bil nekdo jezen ali vesel, ko je nekaj zapisal? Na junijskem predavanju bomo predstavili sistem za avtomatsko prepoznavanje čustev v angleških tvitih. Govorili bomo o tem, kako pridobiti podatke za učenje ter kako jih predobdelati. Primerjali bomo različne napovedne modele (tako klasične kot nevronske mreže) ter ugotavljali, kateri se najbolje obnesejo. Predstavili bomo pomanjkljivosti trenutnih pristopov ter prikazali delovanje na nekaj primerih.

Lep pozdrav,
Darja Fišer


Vabilo na sedmo letošnjo Joto
Prijazno vabljeni na sedmo letošnje predavanje, na katerem bo Kaja Zupanc s FRI predstavila svoje delo na področju avtomatskega ocenjevanja esejev. Predavanje bo 25. 5. 2017 ob 15.15 v P21 na Fakulteti za računalništvo in informatiko UL.

Naslov predavanja:
Avtomatsko ocenjevanje esejev s sistemom SAGE+
Razumevanje besedila je za računalnike še vedno zelo zahtevna naloga. Kljub temu se v tujini za ocenjevanje esejev poleg časovno potratnega ročnega ocenjevanja že vrsto let uporablja tudi računalnik. Na majski JOTI bomo predstavili področje avtomatskega ocenjevanja esejev in sistem za avtomatsko ocenjevanje angleških esejev SAGE+.
Poleg ocenjevanja sintakse besedila se bomo posvetili tudi semantiki. Spoznali bomo, kako SAGE+ avtomatsko gradi ontologije iz besedil, in si pogledali, kako mu te pomagajo pri razumevanju vsebine.

Prijazen pozdrav,
Darja Fišer


Vabilo na šesto letošnjo Joto
Lepo vabljeni na šesto letošnje predavanje, na katerem bo dr. Simon Dobrišek s Fakultete za elektrotehniko predstavil dogajanje na področju govornih tehnologij. Predavanje bo 20. 4. 2017 ob 15.15 v P04 na Fakulteti za računalništvo in informatiko UL.

Naslov predavanja:
Sedanjost in prihodnost govornih tehnologij
Samodejni pretvorniki govora v besedilo, sistemi za zaznavanje ključnih besed, pretvorniki besedila v umetni govor, sistemi za vodenje govorjenega dialoga, razpoznavalniki govorcev in njihovih psihofizičnih stanj, razpoznavalniki govorjenega jezika in narečja, sistemi za ocenjevanje pravilnosti in kakovosti izgovarjave, sistemi za obdelavo in označevanje večmedijskih govornih vsebin ipd. Vse to so tehnologije, ki jih uvrščamo med t. i. govorne tehnologije. Na predavanju bomo predstavili dolgoletne izkušnje Laboratorija za umetno zaznavanje, sisteme in kibernetiko na Fakulteti za elektrotehniko Univerze v Ljubljani na področju razvoja govornih tehnologij, s poudarkom na podpori slovenskemu govorjenemu jeziku. Razmišljali bomo o prihodnosti teh tehnologij in tudi o prihodnosti govora kot človeku najbolj naravnega načina sporazumevanja.

Lep pozdrav,
Darja Fišer


Vabilo na peto letošnjo Joto
Lepo vabljeni na peto letošnje predavanje, na katerem bo dr. Aljaž Košmerlj z Instituta “Jožef Stefan” predstavil orodje za anonimizacijo besedil, namenjeno varovanju osebnih podatkov in zasebnosti. Predavanje bo 16. 3. 2017 ob 14.15 v P21 na Fakulteti za računalništvo in informatiko UL.

Naslov predavanja:
Tacita – orodje za pomoč pri anonimizaciji sodb

Na predavanju bomo predstavili orodje za pomoč pri anonimizaciji sodb, Tacita, ki smo ga za Ministrstvo za pravosodje razvili na Institutu “Jožef Stefan”. Zaradi varovanja zasebnosti je iz vsake sodbe pred njeno javno objavo potrebno odstraniti vse podatke, preko katerih bi lahko prepoznali vpletene v postopku. Tacita z metodologijo strojnega učenja napoveduje, kateri deli besedila morajo biti odstranjeni z visoko verjetnostjo, in tako pomaga pri sicer zamudnem ročnem postopku anonimizacije. Pogledali si bomo, kako smo orodje pripravili in katera orodja analize naravnega jezika smo uporabili.

Lep pozdrav,
Darja Fišer

 

Razpis za štipendijo za udeležbo poletne šole

SDJT bo letos podelil 2 štipendiji za obisk poletnih šol, 1 za poletno šolo ESSLLI, ki bo potekala od 17. do 28. julija 2017 v Toulousu v Franciji, 1 pa za Lisbon Machine Learning School, ki bo potekala od 20. do 27. julija 2017 v Lizboni na Portugalskem. Štipendija krije registracijo za poletno šolo. Za štipendiji se lahko potegujejo študentje MA ali PhD stopnje katere koli študijske smeri, ki so včlanjeni v SDJT (pristopna izjava) in jih zanima procesiranje naravnih jezikov, jezikovne tehnologije in računalniško jezikoslovje, pri čemer bodo imeli prednost tisti, ki že poznajo osnove NLP in/ali se v okviru doktorske oz. magistrske naloge ukvarjajo oz. nameravajo ukvarjati z jezikovnimi tehnologijami za slovenščino.
 
Interesenti življenjepis in motivacijsko pismo do 30. marca 2017 pošljite na sdjt@ijs.si. Komisija v sestavi Darja Fišer (FF), Marko Robnik Šikonja (FRI) in Tomaž Erjavec (IJS) bo izbrane kandidate obvestila do 15. aprila.

1. mesto v tekmovanju iz posodabljanja historičnih besedil

Z veseljem sporočamo, da sta Nikola Ljubešić (IJS) in Yves Scherrer (Univerza v Ženevi) s sistemom, razvitim v okviru nacionalnega temeljnega projekta JANES in nacionalne raziskovalne infrastrukture CLARIN.SI (https://github.com/clarinsi/csmtiser), na tekmovanju CLIN2017 v posodabljanju historičnih besedil med 16 sodelujočimi sistemi dosegla prvo mesto. Več informacij o tekmovanju, sodelujočih in rezultatih: ifarm.nl/clin2017st/results/. Čestitke avtorjema.


Vabilo na četrto letošnjo Joto
 
Vabljeni na četrto letošnje predavanje, na katerem bo doc. dr. Gordana Hržica z Univerze v Zagrebu predavala o gradnji korpusov govorcev z jezikovnimi motnjami. Predavanje bo 28. 2. 2017 ob 15.30 v Modri sobi na Filozofski fakulteti Univerze v Ljubljani.
 
Naslov predavanja:
Non-professional and specialised corpora

Ongoing trend in corpus linguistics has been its orientation towards professional writing, or in case of speech corpora towards professional speakers (e.g. TV hosts, lecturers). Exceptions are both rare and small in size. Professional writers’ and speakers’ corpora provide useful information, but cannot be representative for the everyday written language use (e.g. emails, letters, notes, essays, business corr