Obvestila

Vabilo na peto Joto sezone 2017/18
Dragi vsi,
lepo vabljeni na februarsko Joto, na kateri bo Luka Krsnik predstavil svoje delo na področju avtomatskega naglaševanja slovenskih besed s pomočjo strojnega učenja. Predavanje bo 21. februarja ob 14.15 v predavalnici P20 na Fakulteti za računalništvo v Ljubljani.

Naslov predavanja: Napovedovanje naglasa slovenskih besed z metodami strojnega učenja
Za naglaševanje slovenskih besed ne obstaja preprost algoritem, naglasa slovenskih besed se namreč govorci naučimo med njihovim spoznavanjem. Metode strojnega učenja so se pri naglaševanju izkazale za uspešne. V magistrski nalogi smo na problemu preizkusili globoke nevronske mreže. Testirali smo različne arhitekture nevronskih mrež, več različnih predstavitev podatkov in ansamble mrež. Najboljše rezultate je vrnil ansambelski pristop, ki je pravilno napovedal 87,62 % besed iz testne množice. S predlaganim pristopom smo za več odstotkov izboljšal rezultate drugih metod strojnega učenja.

Vljudno vabljeni!
Darja Fišer


Vabilo na JTDH konferenco
Slovensko društvo za jezikovne tehnologije, Center za jezikovne vire in tehnologije, CLARIN.SI in DARIAH-SI 20. in 21. 9. 2018 organiziramo konferenco “Jezikovne tehnologije in digitalna humanistika”, ki se ponaša z več kot 20-letno tradicijo, tematsko širitev na digitalno humanistiko pa smo uvedli leta 2016. Vabljeni k oddaji prispevka. Več info: http://www.sdjt.si/wp/dogodki/konference/jtdh-2018/


JOTA na Videolectures
Predavanja v okviru Jezikovnotehnološkega abonmaja so odslej dostopna tudi na portalu Videolectures.NET.
Objavo posnetkov omogoča CLARIN.SI.
[video]


Vabilo na peto Joto sezone 2017/18
Dragi vsi, lepo vabljeni na našo prvo Joto v novem letu. Predavanje bo v sredo, 10. januarja, ob 15:15 v P22 na Fakulteti za računalništvo. Predaval bo Tadej Škvorc na temo avtomatskega sestavljanja urnikov za znanstvene konference.

Naslov predavanja: Gručenje z omejitvami na podlagi besedil in grafov pri razporejanju akademskih člankov
Ročno sestavljanje urnikov je lahko velikokrat zelo časovno zamudno opravilo. To drži še povsem pri organizaciji znanstvenih konferenc, kjer morajo organizatorji ustrezno razporediti predstavitve člankov, ki jih je lahko na velikih konferencah na stotine. Predstavitve morajo biti razporejene v seje tako, da vsaka seja vsebuje predstavitve člankov s sorodno tematiko. Na predavanju bomo predstavili, kako lahko z različnimi metodami obdelave naravnega jezika in strojnega učenja avtomatiziramo izgradnjo takega urnika. To storimo tako, da najprej z metodami obdelave naravnega jezika poiščemo podobne članke na podlagi njihovih besedil. Pomagamo si tudi z dodatnimi metapodatki v obliki grafov, ki jih imajo na voljo organizatorji konferenc. Na podlagi najdenih podobnosti lahko nato z gručenjem članke ustrezno razporedimo v seje urnika konference. Delo je bilo opravljeno na angleškem gradivu, prevajanje pa bo v slovenščini.

Lep pozdrav,
Darja Fišer


Vabilo na četrto Joto nove sezone (2017/18)
Dragi vsi, z veseljem sporočam, da leto 2017 zaključujemo s prav posebej zanimivo Joto, na kateri bo predaval Matt Purver z Univerze Queen Mary iz Londona (http://www.eecs.qmul.ac.uk/~ mpurver/). Predavanje bo 13. decembra ob 14:15 v P22 na FRI in bo potekalo v angleščini.

Naslov predavanja: Analysing Dialogue for Diagnosis and Prediction in Mental Health
Conditions which affect our mental health often affect the way we use language; and treatment often involves linguistic interaction. This talk will present work on three related projects investigating the use of computational natural language processing (NLP) to help understand and improve diagnosis and treatment for such conditions. We will look at clinical dialogue between patient and doctor or therapist, in cases involving schizophrenia, depression and dementia; in each case, we find that diagnostic information and/or treatment outcomes are related to observable features of a patient’s language and interaction with their conversational partner. We discuss the nature of these phenomena and the suitability and accuracy of NLP techniques for detecting them automatically.

Lep pozdrav,
Darja Fišer


Vabilo na tretjo Joto nove sezone (2017/18)
Lepo vabljeni na tretje predavanje, na katerem bo Geraint A. Wiggins z Univerze Queen Mary iz Londona predstavil svoje delo na področju računalniške ustvarjalnosti. Predavanje bo 22. 11. 2017 ob 14.00 v Oranžni sobi na Institutu “Jožef Stefan” in bo potekalo v angleščini.

Naslov predavanja:
Creativity, deep symbolic learning, and the information dynamics of thinking
I present a hypothetical theory of cognition which is based on the principle that mind/brains are information processors and compressors, that are sensitive to certain measures of information content, as defined by Shannon (1948). The model is intended to help explicate processes of anticipatory and creative reasoning in humans and other higher animals. The model is motivated by the evolutionary value of prediction in information processing in an information-overloaded world. (Povzetek v celoti dostopen tu.)

Lep pozdrav,
Darja Fišer


Vabilo na redni letni občni zbor in drugo Joto nove sezone

Spoštovani člani,

vljudno vabljeni na redni občni zbor SDJT, ki bo 24. oktobra 2016 ob 14.30 na Fakulteti za računalništvo v predavalnici P20.

Predlagani dnevni red je:

1. Izvolitev delovnega predsedstva
2. Izvolitev zapisnikarja in dveh overoviteljev zapisnika
3. Ugotavljanje sklepčnosti in sprejem dnevnega reda
4. Poročilo o delovanju društva od zadnjega občnega zbora; obravnava in sprejem poročila
5. Poročilo o finančnem poslovanju društva v obdobju od zadnjega občnega zbora; obravnava in sprejem poročila
6. Program dela v naslednjem letu in razprava
7. Razno

Uvod v občni zbor bo redna mesečna Jota, na kateri bo Peter Holozan predstavil nove Amebisove spletne servise:

Novi Amebisovi spletni servisi
V Amebisu smo se odločili, da ponudimo nekatere spletne  servise, uporabne predvsem za razvijalce virtualnih asistentov. Prvi je bil servis za napredno lematizacijo stavkov (kar imenujemo kar normalizacija), drugi pa bo pripisovanje konteksta vprašanjem/odgovorom glede na prejšnji pogovor. Predstavljeni bodo primeri, kako lahko pripisovanje konteksta izboljša odgovore v sistemu SecondEgo.

Lep pozdrav,

Darja Fišer
predsednica SDJT


Vabilo na prvo Joto nove sezone (2017/18)
Lepo vabljeni na prvo predavanje, na katerem bo Niko Colnerič s FRI predstavil svoje delo na področju prepoznave čustev v tvitih. Predavanje bo 27. 9. 2017 ob 14.00 v P20 na Fakulteti za računalništvo in informatiko UL.

Naslov predavanja:
Prepoznavanje čustev na Twitterju
Ste kdaj želeli prepoznavati čustva v tvitih, pa je teh bilo preveč za ročno pregledovanje? Bi vam koristilo, če bi računalnik sam znal ugotoviti, ali je bil nekdo jezen ali vesel, ko je nekaj zapisal? Na septembrskem predavanju bomo predstavili sistem za avtomatsko prepoznavanje čustev v angleških tvitih. Govorili bomo o tem, kako pridobiti podatke za učenje ter kako jih predobdelati. Primerjali bomo različne napovedne modele (tako klasične kot nevronske mreže) ter ugotavljali, kateri se najbolje obnesejo. Predstavili bomo pomanjkljivosti trenutnih pristopov ter prikazali delovanje na nekaj primerih.

Lep pozdrav,
Darja Fišer


Vabilo na planinski pohod
Dragi vsi,
lepo vabljeni na 3. planinski pohod v spomin Adamu Kilgarriffu v obeležitev 4. obletnice našega zadnjega skupnega vzpona na Grintovec, ki ga letos prijazno organizira Vojko Gorjanc. Z veseljem sporočamo, da se nam bo na pohodu pridružil tudi Miloš Jakubíček, direktor podjetja Lexical Computing, ki ga je ustanovil Adam.

Pohod bo v soboto, 8. julija, odpravili pa se bomo do Krnskega jezera: https://www.hribi.net/izlet/koca_pri_savici_krnsko_jezero_/1/163/4010. Pot bomo sklenili s kopanjem v Bohinjskem jezeru, tako da ne pozabite na kopalke in brisačo. Če si želite krajše ture, lahko izberete varianto iz Lepene:
http://www.hribi.net/izlet/dom_v_lepeni_krnsko_jezero_/1/163/291.

Če se nam želite pridružiti na poti, štartamo s parkirišča pri slapu Savica ob 7h. Če se nam želite pridružiti v planinskem domu pri Krnskih jezerih, pa se tam dobimo med 11. in 12. uro. Če potrebujete prevoz, pišite, pa se bomo skušali uskladiti. Dobrodošli tudi partnerji, družinski člani, prijatelji, psi. V primeru slabega vremena bo pohod prestavljen na 19. julij.

Se kmalu vidimo v alpskem slogu!
Darja Fišer


Odpoved osme letošnje Jote
Dragi vsi,
zaradi bolezni predavatelja žal odpade letošnja zadnja Jota o avtomatskem prepoznavanju čustev v tvitih. Joto bomo uvrstili v enega izmed jesenskih terminov. Hvala za razumevanje.


Vabilo na osmo letošnjo Joto
Lepo vabljeni na osmo letošnje predavanje, na katerem bo Niko Colnerič s FRI predstavil svoje delo na področju prepoznave čustev v tvitih. Predavanje bo 21. 6. 2017 ob 17.15 v P06 na Fakulteti za elektrotehniko UL.

Naslov predavanja:
Prepoznavanje čustev na Twitterju
Ste kdaj želeli prepoznavati čustva v tvitih, pa je teh bilo preveč za ročno pregledovanje? Bi vam koristilo, če bi računalnik sam znal ugotoviti, ali je bil nekdo jezen ali vesel, ko je nekaj zapisal? Na junijskem predavanju bomo predstavili sistem za avtomatsko prepoznavanje čustev v angleških tvitih. Govorili bomo o tem, kako pridobiti podatke za učenje ter kako jih predobdelati. Primerjali bomo različne napovedne modele (tako klasične kot nevronske mreže) ter ugotavljali, kateri se najbolje obnesejo. Predstavili bomo pomanjkljivosti trenutnih pristopov ter prikazali delovanje na nekaj primerih.

Lep pozdrav,
Darja Fišer


Vabilo na sedmo letošnjo Joto
Prijazno vabljeni na sedmo letošnje predavanje, na katerem bo Kaja Zupanc s FRI predstavila svoje delo na področju avtomatskega ocenjevanja esejev. Predavanje bo 25. 5. 2017 ob 15.15 v P21 na Fakulteti za računalništvo in informatiko UL.

Naslov predavanja:
Avtomatsko ocenjevanje esejev s sistemom SAGE+
Razumevanje besedila je za računalnike še vedno zelo zahtevna naloga. Kljub temu se v tujini za ocenjevanje esejev poleg časovno potratnega ročnega ocenjevanja že vrsto let uporablja tudi računalnik. Na majski JOTI bomo predstavili področje avtomatskega ocenjevanja esejev in sistem za avtomatsko ocenjevanje angleških esejev SAGE+.
Poleg ocenjevanja sintakse besedila se bomo posvetili tudi semantiki. Spoznali bomo, kako SAGE+ avtomatsko gradi ontologije iz besedil, in si pogledali, kako mu te pomagajo pri razumevanju vsebine.

Prijazen pozdrav,
Darja Fišer


Vabilo na šesto letošnjo Joto
Lepo vabljeni na šesto letošnje predavanje, na katerem bo dr. Simon Dobrišek s Fakultete za elektrotehniko predstavil dogajanje na področju govornih tehnologij. Predavanje bo 20. 4. 2017 ob 15.15 v P04 na Fakulteti za računalništvo in informatiko UL.

Naslov predavanja:
Sedanjost in prihodnost govornih tehnologij
Samodejni pretvorniki govora v besedilo, sistemi za zaznavanje ključnih besed, pretvorniki besedila v umetni govor, sistemi za vodenje govorjenega dialoga, razpoznavalniki govorcev in njihovih psihofizičnih stanj, razpoznavalniki govorjenega jezika in narečja, sistemi za ocenjevanje pravilnosti in kakovosti izgovarjave, sistemi za obdelavo in označevanje večmedijskih govornih vsebin ipd. Vse to so tehnologije, ki jih uvrščamo med t. i. govorne tehnologije. Na predavanju bomo predstavili dolgoletne izkušnje Laboratorija za umetno zaznavanje, sisteme in kibernetiko na Fakulteti za elektrotehniko Univerze v Ljubljani na področju razvoja govornih tehnologij, s poudarkom na podpori slovenskemu govorjenemu jeziku. Razmišljali bomo o prihodnosti teh tehnologij in tudi o prihodnosti govora kot človeku najbolj naravnega načina sporazumevanja.

Lep pozdrav,
Darja Fišer


Vabilo na peto letošnjo Joto
Lepo vabljeni na peto letošnje predavanje, na katerem bo dr. Aljaž Košmerlj z Instituta “Jožef Stefan” predstavil orodje za anonimizacijo besedil, namenjeno varovanju osebnih podatkov in zasebnosti. Predavanje bo 16. 3. 2017 ob 14.15 v P21 na Fakulteti za računalništvo in informatiko UL.

Naslov predavanja:
Tacita – orodje za pomoč pri anonimizaciji sodb

Na predavanju bomo predstavili orodje za pomoč pri anonimizaciji sodb, Tacita, ki smo ga za Ministrstvo za pravosodje razvili na Institutu “Jožef Stefan”. Zaradi varovanja zasebnosti je iz vsake sodbe pred njeno javno objavo potrebno odstraniti vse podatke, preko katerih bi lahko prepoznali vpletene v postopku. Tacita z metodologijo strojnega učenja napoveduje, kateri deli besedila morajo biti odstranjeni z visoko verjetnostjo, in tako pomaga pri sicer zamudnem ročnem postopku anonimizacije. Pogledali si bomo, kako smo orodje pripravili in katera orodja analize naravnega jezika smo uporabili.

Lep pozdrav,
Darja Fišer


Razpis za štipendijo za udeležbo poletne šole

SDJT bo letos podelil 2 štipendiji za obisk poletnih šol, 1 za poletno šolo ESSLLI, ki bo potekala od 17. do 28. julija 2017 v Toulousu v Franciji, 1 pa za Lisbon Machine Learning School, ki bo potekala od 20. do 27. julija 2017 v Lizboni na Portugalskem. Štipendija krije registracijo za poletno šolo. Za štipendiji se lahko potegujejo študentje MA ali PhD stopnje katere koli študijske smeri, ki so včlanjeni v SDJT (pristopna izjava) in jih zanima procesiranje naravnih jezikov, jezikovne tehnologije in računalniško jezikoslovje, pri čemer bodo imeli prednost tisti, ki že poznajo osnove NLP in/ali se v okviru doktorske oz. magistrske naloge ukvarjajo oz. nameravajo ukvarjati z jezikovnimi tehnologijami za slovenščino.
Interesenti življenjepis in motivacijsko pismo do 30. marca 2017 pošljite na sdjt@ijs.si. Komisija v sestavi Darja Fišer (FF), Marko Robnik Šikonja (FRI) in Tomaž Erjavec (IJS) bo izbrane kandidate obvestila do 15. aprila.

1. mesto v tekmovanju iz posodabljanja historičnih besedil

Z veseljem sporočamo, da sta Nikola Ljubešić (IJS) in Yves Scherrer (Univerza v Ženevi) s sistemom, razvitim v okviru nacionalnega temeljnega projekta JANES in nacionalne raziskovalne infrastrukture CLARIN.SI (https://github.com/clarinsi/csmtiser), na tekmovanju CLIN2017 v posodabljanju historičnih besedil med 16 sodelujočimi sistemi dosegla prvo mesto. Več informacij o tekmovanju, sodelujočih in rezultatih: http://ifarm.nl/clin2017st/results/. Čestitke avtorjema.


Vabilo na četrto letošnjo Joto
Vabljeni na četrto letošnje predavanje, na katerem bo doc. dr. Gordana Hržica z Univerze v Zagrebu predavala o gradnji korpusov govorcev z jezikovnimi motnjami. Predavanje bo 28. 2. 2017 ob 15.30 v Modri sobi na Filozofski fakulteti Univerze v Ljubljani.
Naslov predavanja:
Non-professional and specialised corpora

Ongoing trend in corpus linguistics has been its orientation towards professional writing, or in case of speech corpora towards professional speakers (e.g. TV hosts, lecturers). Exceptions are both rare and small in size. Professional writers’ and speakers’ corpora provide useful information, but cannot be representative for the everyday written language use (e.g. emails, letters, notes, essays, business corr