Obvestila

Spoštovani,
sporočamo, da je na pobudo članov in ob izraženem nadaljnjem zaupanju Upravni odbor SDJT umaknil svoj odstop, ki ga je ponudil zaradi slabe presoje o podpori državnega svetnika Matjaža Gamsa. Za razumevanje in zaupanje se članom SDJT iskreno zahvaljujemo ter z vso predanostjo nadaljujemo z delom.
Lep pozdrav,
Upravni odbor SDJT

Spoštovani,
 

Upravni odbor Slovenskega društva za jezikovne tehnologije sporoča, da se je o podpori kandidata za področje znanosti za Državni svet Matjaža Gamsa odločal na podlagi programa, ki ga je kandidat predložil in ga pripenjamo na dnu tega sporočila. Njegove dejavnosti v sklopu dogodka “Kako preprečiti izumiranje slovenskega naroda”, ki je potekal v Državnem svetu Republike Slovenije 24. maja 2018, najstrožje obsojamo, saj so v nasprotju z vsemi vrednotami in cilji, v okviru katerih društvo deluje, pa tudi v nasprotju s programom, ki ga je predložil ob kandidaturi. S slabo presojo kandidata smo škodovali ugledu društva in njegovih članov, pa tudi slovenski znanosti in družbi nasploh, za kar se iskreno opravičujemo. Svoje napake se zavedamo in sprejemamo odgovornost zanjo, zato podajamo odstopno izjavo. Prav tako pozivamo k javnemu opravičilu in odstopu s funkcije člana Državnega sveta Matjaža Gamsa.

Lep pozdrav,

Upravni odbor Slovenskega društva za jezikovne tehnologije
Darja Fišer, predsednica
Kaja Dobrovoljc, tajnica
Katja Zupan, blagajničarka
Darinka Verdonik, članica
Miro Romih, član

Vabilo na junijsko Joto

Lepo vabljeni na poslednjo akademsko Joto v tej sezoni, ki se bo zvrstila v torek, 5. junija, ob 14:15 v P20 na Fakulteti za računalništvo Univerze v Ljubljani. O avtomatskem generiranju sloganov bo predaval Matej Martinc z IJS.

Naslov predavanja: Kreativno generiranje sloganov
Dobri reklamni slogani nastajajo tekom kompleksnega in dolgotrajnega procesa generiranja kandidatov za slogane v okviru možganskih neviht, piljenja in preverjanja najboljših idej ter končno z izborom najboljšega kandidata za uporabo v produkciji. Predstavljen bo sistem za generiranje naravnega jezika, ki je bil ustvarjen z namenom pohitritve in optimizacije tega procesa. Sistem kot vhod dobi besedilo z opisom podjetja, ga obdela s pomočjo metod za obdelavo naravnega jezika in jezikovnega modeliranja ter kot izhod vrne množico kandidatov za slogane za izbrano podjetje. Na predavanju se bomo poglobili v tehnične podrobnosti delovanja sistema, predstavili primere zgeneriranih sloganov in pojasnili, kako se je sistem obnesel pri nalogi generiranja angleških reklamnih sloganov za dve slovenski podjetji.


Razpis dveh štipendij SDJT

Glede na to, da je eno osnovnih poslanstev SJDT izobraževanje nove generacije raziskovalcev s področja jezikovnih tehnologij, bo SDJT tudi letos podelil 2 štipendiji za obisk poletnih šol, in sicer 1 za poletno šolo European Summer University in Digital Humanities, ki bo od 17. do 27. julija 2018 potekala v Leipzigu v Nemčiji, 1 pa za poletno šolo European Summer School of Logic, Language and Information, ki bo potekala od 6. do 17. avgusta 2018 v Sofiji v Bolgariji.

Štipendija krije registracijo za poletno šolo. Za poletno šolo ESSLLI organizator krije tudi stroške nastanitve v študentskem domu v večposteljni sobi.

Za štipendiji se lahko potegujejo študentje MA ali PhD stopnje katere koli študijske smeri, ki so včlanjeni v SDJT in jih zanima digitalna humanistika, procesiranje naravnih jezikov, jezikovne tehnologije in računalniško jezikoslovje, pri čemer bodo imeli prednost tisti, ki že poznajo osnove NLP in/ali se v okviru doktorske oz. magistrske naloge ukvarjajo oz. nameravajo ukvarjati z jezikovnimi tehnologijami za slovenščino.

Interesenti življenjepis in motivacijsko pismo do 4. junija 2018 pošljite na sdjt@ijs.si.

Komisija v sestavi Darja Fišer (FF), Kaja Dobrovoljc (IJS) in Marko Robnik Šikonja (FRI) bo izbrane kandidate obvestila do 10. junija 2018.


Vabilo na majsko joto

Dragi vsi, prav lepo vabljeni na majsko Joto, na kateri bo dr. Petra Kralj Novak z IJS predavala o trenjih stališč s pomočjo emojijev. Jota bo 21. 5. ob 14:15, P20 na Fakulteti za računalništvo Univerze v Ljubljani.

Naslov predavanja: Trenja stališč in čustvenčki v žarišču
Analiza stališč (stance analysis) je področje tekstovnega rudarjenja, ki se ukvarja z avtomatskim odkrivanjem, ali se pisec besedila strinja, nasprotuje ali je nevtralen do določenega vprašanja. V predavanju bom predstavila definicije in postopke, več pozornosti pa bom namenila rezultatom analize stališč na podatkih s socialnega omrežja Twitter. Posvetila se bom tudi dominantni novosti v neformalni komunikaciji: čustvenčkom (emoji) in njihovi vlogi v neformalni komunikaciji.


The 2018 Adam Kilgarriff Memorial Hike: Prevala (1311m) and Begunjščica (2060m)

Adam Kilgarrif at Grintavec (2347 m) in July 2013
Adam Kilgarrif at Grintavec (2347 m) in July 2013

Date: July 22, 2018
Start: 8am from Ljubljana, 9am from the starting point (the Ljubelj/Loibl Pass)
Duration: 1.5 hours to Prevala, 3.5 hours to Begunjščica (optional)
Difficulty: Easy walk to Prevala, steep but safe climb to Begunjščica

The view from Begunjščica.
The view from Begunjščica.

Organization: Darja Fišer and Damjan Popič

The Euralex Conference in Ljubljana coincides with the 5th anniversary of our last hike with our dear friend and inspiring colleague Adam Kilgarriff which we did just before driving together to the Euralex conference in Bolzano (15-19 July 2014). We hiked to the summit of Grintovec (2558 m), a strenuous hike even for experienced mountaineers, which Adam climbed in his sandals. Not only did he reach the summit first, he also offered to carry our backpack! I don’t remember ever seeing him happier than on that mountain.

The Slovene Language Technologies Society has been organizing a hike in Adam’s memory since then. On this occasion, we wish to invite the Euralex participants to join us on a beautiful hike to the Slovenian Alps we are certain Adam would have loved. The first part of the hike is easy, with lots of beautiful vistas, a tunnel and a mountain hut with great food. If you want a more challenging hike, you can also choose to continue all the way to the top of Begunjšica, a summit over 2000 meters above sea level.

The transportation from Ljubljana to the Ljubelj Pass and back is kindly sponsored by Lexical Computing. Please bring your own drinks and food (can also be purchased at the hut). In order to be able to organize the hike safely, registration is required by 1st July 2018. The hike is family friendly and everyone is welcome but please register each hiker separately.

If you have any questions about the hike, please send an email to sdjt@ijs.si.

Description of the hike | Equipment | Google form


Vabilo na deveto Joto sezone 2017/18
Dragi vsi, toplo vabljeni na aprilsko Joto, na kateri bo predaval prof. Ruslan Mitkov z Univerze v Wolverhamptonu. Predavanje (v angleščini) bo v torek, 17. aprila 2018, ob 16:15 v predavalnici 21 na Fakulteti za računalništvo in informatiko UL.

Naslov predavanja: Anaphora and coreference resolution: still a hard nut to crack? How far has it gone, what is its impact on NLP and what are the ways forward?

Anaphora and coreference resolution are arguably among the most challenging Natural Language Processing (NLP) tasks. Research in anaphora resolution and coreference resolution has focused almost exclusively on the development and intrinsic evaluation of various algorithms. While publications report positive results, the speaker will show that the replication of some of the best-known algorithms reveals reasons for concern in that the performance is far from ideal and the evaluation is far from transparent.

Anaphora and coreference resolution as tasks are crucial for the operation of NLP systems and should not be regarded in isolation but only in the wider picture of NLP applications. The extrinsic evaluation or the impact of an anaphora or coreference resolution module on a larger NLP system of which they are part, is an under-researched topic and several studies conducted by the speaker, seek to fill in this gap. More specifically, the speaker will discuss whether anaphora and coreference resolution can improve (and if they can, to what extent?) or not the performance of four NLP applications: text summarisation, term extraction, text categorisation and textual entailment.

The presentation will finish with suggested ways forward as to how anaphora and coreference resolution can do better and will outline the latest related research of the author.

Bio:
Ruslan Mitkov is Professor of Computational Linguistics and Language Engineering at the University of Wolverhampton. He is best known for his seminal contributions to the areas of anaphora resolution and automatic generation of multiple-choice tests. At Wolverhampton he set up the Research Group in Computational Linguistics, which has emerged as an internationally leading unit in applied Natural Language Processing and members of the group have won awards in different NLP/shared-task competitions. Prof. Mitkov is also Director of the Research Institute in Information and Language Processing, which includes the Research Group in Statistical Cybermetrics, another top performer internationally.

Lep pozdrav,
Darja Fišer


Vabilo na osmo Joto sezone 2017/18
Dragi vsi, prav lepo vabljeni še na drugo marčevsko Joto, ki jo prireja Oddelek za azijske študije FF UL. Na njej bo predaval prof. Prashant Pardeshi z Nacionalnega inštituta za japonski jezik in jezikoslovje. Predavanje (v angleščini) bo v ponedeljek, 26. marca 2018, od 16:20 do 18:00 v predavalnici 013 na FF.

Naslov predavanja: Japanese Basic Verbs Handbook: what is it and what does it do?
Polysemous lexical items, wherein one form has more than one meaning, are pervasive in the basic vocabulary of human languages and are considered to be generally difficult to acquire for foreign learners of any language. In the domain of linguistic theory, semanticists provided excellent insights into understanding the semantic connections among the multiple meanings of polysemous lexical items. However, dictionaries meant for native speakers tend to merely list multiple meanings of polysemous lexical items without describing the semantic connections among the multiple meanings, probably because the users of such dictionaries already know them intuitively. In the absence of learner’s dictionaries providing descriptions of the semantic connections among multiple meanings for a given form, understanding and acquiring multiple meanings of polysemous lexical items remains a difficult task for foreign learners of a language. The Japanese Basic Verbs Handbook—an online resource offering comprehensive description of multiple meanings and connections among them—is an attempt to fill this gap. In this talk we will offer an overview of the Japanese Basic Verbs Handbook and demonstrate its salient features (http://verbhandbook.ninjal.ac.jp/), in addition to introducing the two corpora used in its compilation. All the slides of the presentation are in Japanese and English and the talk will be given in English in order to make it accessible to those interested in general issues related to teaching/learning of polysemous basic verbs.

Bio:
Prashant Pardeshi (Ph.D., Kobe University) is a professor in the Division of Linguistic Theory and Typology, the National Institute for Japanese Language and Linguistics, Tokyo, Japan. He taught Japanese language at Department of Japanese, Pune University; Jawaharlal University, New Delhi and AOTS, New Delhi before moving to Japan. He is interested in functional linguistic typology, comparative studies between Japanese and Indian languages, Japanese language pedagogy, and lexicography. He has published many articles in international journals and edited volumes (http://www.ninjal.ac.jp/organization/researcher/prashant/).

Lep pozdrav,
Darja Fišer


Vabilo na sedmo Joto sezone 2017/18
Dragi vsi,
z veseljem vas vabimo na marčevsko Joto, na kateri bo dr. Jerneja Žganec Gros iz podjetja Alpineon predstavila sintetizator govora za slovenščino eBralec. Predavanje bo v ponedeljek, 19. marca 2018, ob 15:15 v P20 na Fakulteti za računalništvo UL.

Naslov predavanja: eBralec – sintetizator govora za slovenščino
eBralec je sintetizator govora za slovenski jezik, ki zna slovenska besedila samodejno pretvarjati v prijeten in razumljiv govor. Številnim slepim in slabovidnim uporabnikom ter dislektikom predstavlja nepogrešljiv pripomoček v vsakdanjem življenju. Predstavljen bo postopek njegove izgradnje, skupaj s številnimi primeri uporabe.

Lep pozdrav,
Darja Fišer


Vabilo na šesto Joto sezone 2017/18
Dragi vsi,
lepo vabljeni na februarsko Joto, na kateri bo Luka Krsnik predstavil svoje delo na področju avtomatskega naglaševanja slovenskih besed s pomočjo strojnega učenja. Predavanje bo 21. februarja ob 14:15 v predavalnici P20 na Fakulteti za računalništvo v Ljubljani.

Naslov predavanja: Napovedovanje naglasa slovenskih besed z metodami strojnega učenja
Za naglaševanje slovenskih besed ne obstaja preprost algoritem, naglasa slovenskih besed se namreč govorci naučimo med njihovim spoznavanjem. Metode strojnega učenja so se pri naglaševanju izkazale za uspešne. V magistrski nalogi smo na problemu preizkusili globoke nevronske mreže. Testirali smo različne arhitekture nevronskih mrež, več različnih predstavitev podatkov in ansamble mrež. Najboljše rezultate je vrnil ansambelski pristop, ki je pravilno napovedal 87,62 % besed iz testne množice. S predlaganim pristopom smo za več odstotkov izboljšal rezultate drugih metod strojnega učenja.

Vljudno vabljeni!
Darja Fišer


Vabilo na konferenco JTDH 
Slovensko društvo za jezikovne tehnologije, Fakulteta za elektrotehniko UL, Center za jezikovne vire in tehnologije UL, CLARIN.SI in DARIAH-SI 20. in 21. 9. 2018 organiziramo konferenco “Jezikovne tehnologije in digitalna humanistika”, ki se ponaša z več kot 20-letno tradicijo, tematsko širitev na digitalno humanistiko pa smo uvedli leta 2016. Vabljeni k oddaji prispevka. Več info: http://www.sdjt.si/wp/dogodki/konference/jtdh-2018/


JOTA na Videolectures
Predavanja v okviru Jezikovnotehnološkega abonmaja so odslej dostopna tudi na portalu Videolectures.NET.
Objavo posnetkov omogoča CLARIN.SI.
[video]


Vabilo na peto Joto sezone 2017/18
Dragi vsi, lepo vabljeni na našo prvo Joto v novem letu. Predavanje bo v sredo, 10. januarja, ob 15:15 v P22 na Fakulteti za računalništvo. Predaval bo Tadej Škvorc na temo avtomatskega sestavljanja urnikov za znanstvene konference.

Naslov predavanja: Gručenje z omejitvami na podlagi besedil in grafov pri razporejanju akademskih člankov
Ročno sestavljanje urnikov je lahko velikokrat zelo časovno zamudno opravilo. To drži še povsem pri organizaciji znanstvenih konferenc, kjer morajo organizatorji ustrezno razporediti predstavitve člankov, ki jih je lahko na velikih konferencah na stotine. Predstavitve morajo biti razporejene v seje tako, da vsaka seja vsebuje predstavitve člankov s sorodno tematiko. Na predavanju bomo predstavili, kako lahko z različnimi metodami obdelave naravnega jezika in strojnega učenja avtomatiziramo izgradnjo takega urnika. To storimo tako, da najprej z metodami obdelave naravnega jezika poiščemo podobne članke na podlagi njihovih besedil. Pomagamo si tudi z dodatnimi metapodatki v obliki grafov, ki jih imajo na voljo organizatorji konferenc. Na podlagi najdenih podobnosti lahko nato z gručenjem članke ustrezno razporedimo v seje urnika konference. Delo je bilo opravljeno na angleškem gradivu, prevajanje pa bo v slovenščini.

Lep pozdrav,
Darja Fišer


Vabilo na četrto Joto nove sezone (2017/18)
Dragi vsi, z veseljem sporočam, da leto 2017 zaključujemo s prav posebej zanimivo Joto, na kateri bo predaval Matt Purver z Univerze Queen Mary iz Londona (http://www.eecs.qmul.ac.uk/~ mpurver/). Predavanje bo 13. decembra ob 14:15 v P22 na FRI in bo potekalo v angleščini.

Naslov predavanja: Analysing Dialogue for Diagnosis and Prediction in Mental Health
Conditions which affect our mental health often affect the way we use language; and treatment often involves linguistic interaction. This talk will present work on three related projects investigating the use of computational natural language processing (NLP) to help understand and improve diagnosis and treatment for such conditions. We will look at clinical dialogue between patient and doctor or therapist, in cases involving schizophrenia, depression and dementia; in each case, we find that diagnostic information and/or treatment outcomes are related to observable features of a patient’s language and interaction with their conversational partner. We discuss the nature of these phenomena and the suitability and accuracy of NLP techniques for detecting them automatically.

Lep pozdrav,
Darja Fišer


Vabilo na tretjo Joto nove sezone (2017/18)
Lepo vabljeni na tretje predavanje, na katerem bo Geraint A. Wiggins z Univerze Queen Mary iz Londona predstavil svoje delo na področju računalniške ustvarjalnosti. Predavanje bo 22. 11. 2017 ob 14.00 v Oranžni sobi na Institutu “Jožef Stefan” in bo potekalo v angleščini.

Naslov predavanja:
Creativity, deep symbolic learning, and the information dynamics of thinking
I present a hypothetical theory of cognition which is based on the principle that mind/brains are information processors and compressors, that are sensitive to certain measures of information content, as defined by Shannon (1948). The model is intended to help explicate processes of anticipatory and creative reasoning in humans and other higher animals. The model is motivated by the evolutionary value of prediction in information processing in an information-overloaded world. (Povzetek v celoti dostopen tu.)

Lep pozdrav,
Darja Fišer


Vabilo na redni letni občni zbor in drugo Joto nove sezone

Spoštovani člani,

vljudno vabljeni na redni občni zbor SDJT, ki bo 24. oktobra 2016 ob 14.30 na Fakulteti za računalništvo v predavalnici P20.

Predlagani dnevni red je:

1. Izvolitev delovnega predsedstva
2. Izvolitev zapisnikarja in dveh overoviteljev zapisnika
3. Ugotavljanje sklepčnosti in sprejem dnevnega reda
4. Poročilo o delovanju društva od zadnjega občnega zbora; obravnava in sprejem poročila
5. Poročilo o finančnem poslovanju društva v obdobju od zadnjega občnega zbora; obravnava in sprejem poročila
6. Program dela v naslednjem letu in razprava
7. Razno

Uvod v občni zbor bo redna mesečna Jota, na kateri bo Peter Holozan predstavil nove Amebisove spletne servise:

Novi Amebisovi spletni servisi
V Amebisu smo se odločili, da ponudimo nekatere spletne  servise, uporabne predvsem za razvijalce virtualnih asistentov. Prvi je bil servis za napredno lematizacijo stavkov (kar imenujemo kar normalizacija), drugi pa bo pripisovanje konteksta vprašanjem/odgovorom glede na prejšnji pogovor. Predstavljeni bodo primeri, kako lahko pripisovanje konteksta izboljša odgovore v sistemu SecondEgo.

Lep pozdrav,

Darja Fišer
predsednica SDJT


Vabilo na prvo Joto nove sezone (2017/18)
Lepo vabljeni na prvo predavanje, na katerem bo Niko Colnerič s FRI predstavil svoje delo na področju prepoznave čustev v tvitih. Predavanje bo 27. 9. 2017 ob 14.00 v P20 na Fakulteti za računalništvo in informatiko UL.

Naslov predavanja:
Prepoznavanje čustev na Twitterju
Ste kdaj želeli prepoznavati čustva v tvitih, pa je teh bilo preveč za ročno pregledovanje? Bi vam koristilo, če bi računalnik sam znal ugotoviti, ali je bil nekdo jezen ali vesel, ko je nekaj zapisal? Na septembrskem predavanju bomo predstavili sistem za avtomatsko prepoznavanje čustev v angleških tvitih. Govorili bomo o tem, kako pridobiti podatke za učenje ter kako jih predobdelati. Primerjali bomo različne napovedne modele (tako klasične kot nevronske mreže) ter ugotavljali, kateri se najbolje obnesejo. Predstavili bomo pomanjkljivosti trenutnih pristopov ter prikazali delovanje na nekaj primerih.

Lep pozdrav,
Darja Fišer


Vabilo na planinski pohod
Dragi vsi,
lepo vabljeni na 3. planinski pohod v spomin Adamu Kilgarriffu v obeležitev 4. obletnice našega zadnjega skupnega vzpona na Grintovec, ki ga letos prijazno organizira Vojko Gorjanc. Z veseljem sporočamo, da se nam bo na pohodu pridružil tudi Miloš Jakubíček, direktor podjetja Lexical Computing, ki ga je ustanovil Adam.

Pohod bo v soboto, 8. julija, odpravili pa se bomo do Krnskega jezera: https://www.hribi.net/izlet/koca_pri_savici_krnsko_jezero_/1/163/4010. Pot bomo sklenili s kopanjem v Bohinjskem jezeru, tako da ne pozabite na kopalke in brisačo. Če si želite krajše ture, lahko izberete varianto iz Lepene:
http://www.hribi.net/izlet/dom_v_lepeni_krnsko_jezero_/1/163/291.

Če se nam želite pridružiti na poti, štartamo s parkirišča pri slapu Savica ob 7h. Če se nam želite pridružiti v planinskem domu pri Krnskih jezerih, pa se tam dobimo med 11. in 12. uro. Če potrebujete prevoz, pišite, pa se bomo skušali uskladiti. Dobrodošli tudi partnerji, družinski člani, prijatelji, psi. V primeru slabega vremena bo pohod prestavljen na 19. julij.

Se kmalu vidimo v alpskem slogu!
Darja Fišer


Odpoved osme letošnje Jote
Dragi vsi,
zaradi bolezni predavatelja žal odpade letošnja zadnja Jota o avtomatskem prepoznavanju čustev v tvitih. Joto bomo uvrstili v enega izmed jesenskih terminov. Hvala za razumevanje.


Vabilo na osmo letošnjo Joto
Lepo vabljeni na osmo letošnje predavanje, na katerem bo Niko Colnerič s FRI predstavil svoje delo na področju prepoznave čustev v tvitih. Predavanje bo 21. 6. 2017 ob 17.15 v P06 na Fakulteti za elektrotehniko UL.

Naslov predavanja:
Prepoznavanje čustev na Twitterju
Ste kdaj želeli prepoznavati čustva v tvitih, pa je teh bilo preveč za ročno pregledovanje? Bi vam koristilo, če bi računalnik sam znal ugotoviti, ali je bil nekdo jezen ali vesel, ko je nekaj zapisal? Na junijskem predavanju bomo predstavili sistem za avtomatsko prepoznavanje čustev v angleških tvitih. Govorili bomo o tem, kako pridobiti podatke za učenje ter kako jih predobdelati. Primerjali bomo različne napovedne modele (tako klasične kot nevronske mreže) ter ugotavljali, kateri se najbolje obnesejo. Predstavili bomo pomanjkljivosti trenutnih pristopov ter prikazali delovanje na nekaj primerih.

Lep pozdrav,
Darja Fišer


Vabilo na sedmo letošnjo Joto
Prijazno vabljeni na sedmo letošnje predavanje, na katerem bo Kaja Zupanc s FRI predstavila svoje delo na področju avtomatskega ocenjevanja esejev. Predavanje bo 25. 5. 2017 ob 15.15 v P21 na Fakulteti za računalništvo in informatiko UL.

Naslov predavanja:
Avtomatsko ocenjevanje esejev s sistemom SAGE+
Razumevanje besedila je za računalnike še vedno zelo zahtevna naloga. Kljub temu se v tujini za ocenjevanje esejev poleg časovno potratnega ročnega ocenjevanja že vrsto let uporablja tudi računalnik. Na majski JOTI bomo predstavili področje avtomatskega ocenjevanja esejev in sistem za avtomatsko ocenjevanje angleških esejev SAGE+.
Poleg ocenjevanja sintakse besedila se bomo posvetili tudi semantiki. Spoznali bomo, kako SAGE+ avtomatsko gradi ontologije iz besedil, in si pogledali, kako mu te pomagajo pri razumevanju vsebine.

Prijazen pozdrav,
Darja Fišer


Vabilo na šesto letošnjo Joto
Lepo vabljeni na šesto letošnje predavanje, na katerem bo dr. Simon Dobrišek s Fakultete za elektrotehniko predstavil dogajanje na področju govornih tehnologij. Predavanje bo 20. 4. 2017 ob 15.15 v P04 na Fakulteti za računalništvo in informatiko UL.

Naslov predavanja:
Sedanjost in prihodnost govornih tehnologij
Samodejni pretvorniki govora v besedilo, sistemi za zaznavanje ključnih besed, pretvorniki besedila v umetni govor, sistemi za vodenje govorjenega dialoga, razpoznavalniki govorcev in njihovih psihofizičnih stanj, razpoznavalniki govorjenega jezika in narečja, sistemi za ocenjevanje pravilnosti in kakovosti izgovarjave, sistemi za obdelavo in označevanje večmedijskih govornih vsebin ipd. Vse to so tehnologije, ki jih uvrščamo med t. i. govorne tehnologije. Na predavanju bomo predstavili dolgoletne izkušnje Laboratorija za umetno zaznavanje, sisteme in kibernetiko na Fakulteti za elektrotehniko Univerze v Ljubljani na področju razvoja govornih tehnologij, s poudarkom na podpori slovenskemu govorjenemu jeziku. Razmišljali bomo o prihodnosti teh tehnologij in tudi o prihodnosti govora kot človeku najbolj naravnega načina sporazumevanja.

Lep pozdrav,
Darja Fišer


Vabilo na peto letošnjo Joto
Lepo vabljeni na peto letošnje predavanje, na katerem bo dr. Aljaž Košmerlj z Instituta “Jožef Stefan” predstavil orodje za anonimizacijo besedil, namenjeno varovanju osebnih podatkov in zasebnosti. Predavanje bo 16. 3. 2017 ob 14.15 v P21 na Fakulteti za računalništvo in informatiko UL.

Naslov predavanja:
Tacita – orodje za pomoč pri anonimizaciji sodb

Na predavanju bomo predstavili orodje za pomoč pri anonimizaciji sodb, Tacita, ki smo ga za Ministrstvo za pravosodje razvili na Institutu “Jožef Stefan”. Zaradi varovanja zasebnosti je iz vsake sodbe pred njeno javno objavo potrebno odstraniti vse podatke, preko katerih bi lahko prepoznali vpletene v postopku. Tacita z metodologijo strojnega učenja napoveduje, kateri deli besedila morajo biti odstranjeni z visoko verjetnostjo, in tako pomaga pri sicer zamudnem ročnem postopku anonimizacije. Pogledali si bomo, kako smo orodje pripravili in katera orodja analize naravnega jezika smo uporabili.

Lep pozdrav,
Darja Fišer


Razpis za štipendijo za udeležbo poletne šole

SDJT bo letos podelil 2 štipendiji za obisk poletnih šol, 1 za poletno šolo ESSLLI, ki bo potekala od 17. do 28. julija 2017 v Toulousu v Franciji, 1 pa za Lisbon Machine Learning School, ki bo potekala od 20. do 27. julija 2017 v Lizboni na Portugalskem. Štipendija krije registracijo za poletno šolo. Za štipendiji se lahko potegujejo študentje MA ali PhD stopnje katere koli študijske smeri, ki so včlanjeni v SDJT (pristopna izjava) in jih zanima procesiranje naravnih jezikov, jezikovne tehnologije in računalniško jezikoslovje, pri čemer bodo imeli prednost tisti, ki že poznajo osnove NLP in/ali se v okviru doktorske oz. magistrske naloge ukvarjajo oz. nameravajo ukvarjati z jezikovnimi tehnologijami za slovenščino.
Interesenti življenjepis in motivacijsko pismo do 30. marca 2017 pošljite na sdjt@ijs.si. Komisija v sestavi Darja Fišer (FF), Marko Robnik Šikonja (FRI) in Tomaž Erjavec (IJS) bo izbrane kandidate obvestila do 15. aprila.

1. mesto v tekmovanju iz posodabljanja historičnih besedil

Z veseljem sporočamo, da sta Nikola Ljubešić (IJS) in Yves Scherrer (Univerza v Ženevi) s sistemom, razvitim v okviru nacionalnega temeljnega projekta JANES in nacionalne raziskovalne infrastrukture CLARIN.SI (https://github.com/clarinsi/csmtiser), na tekmovanju CLIN2017 v posodabljanju historičnih besedil med 16 sodelujočimi sistemi dosegla prvo mesto. Več informacij o tekmovanju, sodelujočih in rezultatih: http://ifarm.nl/clin2017st/results/. Čestitke avtorjema.


Vabilo na četrto letošnjo Joto
Vabljeni na četrto letošnje predavanje, na katerem bo doc. dr. Gordana Hržica z Univerze v Zagrebu predavala o gradnji korpusov govorcev z jezikovnimi motnjami. Predavanje bo 28. 2. 2017 ob 15.30 v Modri sobi na Filozofski fakulteti Univerze v Ljubljani.
Naslov predavanja:
Non-professional and specialised corpora

Ongoing trend in corpus linguistics has been its orientation towards professional writing, or in case of speech corpora towards professional speakers (e.g. TV hosts, lecturers). Exceptions are both rare and small in size. Professional writers’ and speakers’ corpora provide useful information, but cannot be representative for the everyday written language use (e.g. emails, letters, notes, essays, business corr