Vsi prispevki, ki jih je objavil/a Katja Meden

Vtisi s 30. Evropske poletne šole logike, jezika in informatike na Univerzi v Sofiji

V Sofiji je med 6. in 17. avgustom potekala 30. Evropska poletna šola logike, jezika in informatike. Skoraj dva tedna so v treh nadstropjih rektorata Univerze v Sofiji v centru mesta od jutra do večera potekala predavanja o najrazličnejših prepletih področij logike, računalništva, jezikoslovja in kognitivnih ved. Mojo izkušnjo poletne šole sta obravnavali dve področji: prvo je distribucijska semantika, drugo pa Bayesovske metode.

V prvem tednu je profesor Stefan Evert, profesor na Univerzi v Erlangenu in Nurembergu, na predavanjih o distribucijski semantiki slušateljem podal robustni uvod v področje, od metod za računanje distribucijskih modelov, primerov rabe tovrstnih modelov v praksi in najsodobnejših pristopov (npr. Word2vec) pa do vpetosti gradnje modelov v delotok označevanja korpusov. Hitro je postalo tudi jasno, da za nadaljnji razvoj na tem področju slušatelji potrebujejo znanje linearne algebre, pri čemer si predstavljam, da je veliko humanistično usmerjenih udeleženih pokimalo in v zapiske vstavilo simbol s pomenom »Preberi več o tem kasneje ali poišči način, kako naslednje leto dobiti kreditne točke za predavanje o tem.« Prvo sem med odmori, drugo nameravam.

V prvem tednu je prav tako potekalo predavanje Gregoryja Scontrasa, docenta na Univerzi v Kaliforniji, ki je predaval o verjetnostnih modelih razumevanja naravnega jezika. Gre se za zelo produktiven preplet Bayesovskih metod in eksperimentalnega jezikoslovja na področju raziskovanja pragmatike. Natančneje smo obravnavali Baysovski model racionalnih govornih dejanj, ki precej uspešno modelira rezultate različnih raziskav na področju pragmatike. Na primer, če mi sogovorec pove, da je pojedel nekaj kosov skupne torte, lahko sklepam, da je uvidevno pustil nekaj tudi zame, čeprav bi čisto formalno gledano »nekaj kosov« lahko pomenilo tudi »vse kose«. Iz kognitivnega vidika pa je s tem modelom tesno povezana sposobnost teorije uma (predvidevanja miselnega stanja sogovornika), ki je do neke mere bila formalizirana v jeziku Bayesovskih enačb.

V drugem tednu sem obiskoval predavanje o računalniškem procesiranju večbesednih izrazov, ki se je na koncu izkazalo kot posrečeno in aplikativnejše nadaljevanje predavanja o distribucijski semantiki. Carlos Ramisch (Univerza Aix Marseille), Agata Savary (Univerza v Toursu) in Aline Villavicencio (Univerza v Essexu in Univerza Rio Grande do Sul) so predavale o kriterijih za večbesedne izraze in označenih zbirkah v večih jezikih (med njimi tudi slovenščina), ki so nastale v okviru projekta PARSEME ter o rabi distribucijskih modelov za odkrivanje večbesednih izrazov.

V istem tednu sta Michael Franke, profesor na Univerzi v Osnabrücku, in Michael Henry Tessler, postdoktorski sodelavec na Univerzi v Stanfordu, predavala o verjetnostnem modeliranju na področju semantike in pragmatike. Po eni strani je šlo za podaljšek Bayesovskega predavanja iz prvega tedna, saj s(m)o slušatelji uporabljali WebPPL, na Javascriptu temelječ verjetnostni programski, ki je bil uporabljen tudi pri predavanju o verjetnostnem razumevanju jezika. Po drugi strani pa je to predavanje bilo močneje usmerjeno v nekatere metode in vrednosti verjetnostnih modelov nasploh in možnosti, ki jih ponuja WebPPL.

Velik del udeležencev poletne šole so predstavljali študenti in študentke, ki opravljajo magisterije ali doktorate na področju računalniškega jezikoslovja ali podobnih smeri, zame pa je poletna šola predstavljala priložnost izobraževanja na področjih, ki so v slovenskem prostoru organizirana priložnostno ali fragmentirano med različnimi fakultetami. Olajševanje dostopnosti in organizacija tovrstnih dogodkov sta ključna za vzpostavitev meddisciplinarnega dialoga med področjema računalništva in jezikoslovja, slovenščina pa kot manjši in morfološko bogati jezik ponuja procesiranju jezika nove izzive, obratno pa grajenje infrastrukture za procesiranje slovenščine odpira vrata široki paleti jezikovnih tehnologij.

Zoran Fijavž

Vtisi z Evropske poletne univerze iz digitalne humanistike na Univerzi v Leipzigu

Evropska poletna univerza iz digitalne humanistike na Univerzi v Leipzigu je ena od petih na svetu in hkrati edina tovrstna poletna šola izven angleško govorečega območja. Udeleženci – teh je okrog 90 – prihajajo z vsega sveta, od Združenih držav Amerike do Avstralije, Južne Amerike, Irana, Indije in Kitajske, veliko pa je tudi udeležencev iz Evrope. Dva tedna druženja udeležencu omogočijo, da se poveže z novimi, zanimivimi ljudmi z vsega sveta. Poletna univerza nudi izjemno intenziven program, ki v desetih dneh omogoči dvakrat po 18 ur zgoščenih delavnic, kjer so študentom na voljo vodilni strokovnjaki določenega področja, pa tudi množico predavanj, okroglih miz in strokovnih posvetov ter manj formalnih ogledov muzejev ter razstav. Poletno šolo organizira prof. dr. Elisabeth Burr z ekipo študentov, ki je pokazala vrhunsko predanost temu projektu. V svojem poslovilnem govoru ob koncu poletne šole je dr. Elisabeth Burr izpostavila Slovensko društvo za jezikovne tehnologije, ki študentom iz Slovenije omogoča obisk te kakovostne poletne šole.

Program je usmerjen v več kategorij digitalne humanistike, ki je hitro rastoče polje. Udeleženci tako prihajajo z različnih področij humanistike, denimo zgodovine, novinarstva, prevajalstva, sociologije. Poletna šola nudi bogat nabor metodologij, ki lahko pomagajo odgovoriti na različna raziskovalna vprašanja. Delavnice dajejo težo praktični aplikaciji znanja, zato je dobro, da se študent nanje dobro pripravi in si že pred prihodom določi konkretne cilje.

Edicija poletne šole v letu 2018 je ponudila denimo delavnico o strojnem prevajanju pod vodstvom dr. Tommija A. Pirinena z Univerze v Hamburgu, delavnico z dr. Carol Chiodo z Univerze v Princetonu in dr. Lauren Tilton z Univerze v Richmondu v ZDA, ki sta učili, kako najti, organizirati in analizirati podatke v določeni raziskavi. Sama sem se udeležila delavnice z naslovom Stilometrija. Gre za računalniško analizo literarnega stila. Profesorja sta prihajala s Poljske in sta skupino desetih študentov z vsega sveta, v katero sem bila vključena, hitro uvedla v analizo večjih korpusov besedil v programskem jeziku “R” in programu “R Studio”. Dr. Maciej Eder s Pedagoške fakultete v Krakovu in dr. Jeremi Ochab s tamkajšnje Jagielonske univerze sta ure oblikovala zelo dinamično, z mešanico predavanj in praktičnih vaj, ki smo jih opravili na osebnih računalnikih. Učitelja sta nam predstavila tudi nekaj aktualnih stilometričnih projektov in njune raziskave, ki so usmerjene predvsem v prepoznavanje avtorstva anonimnih tekstov. Pridobljeno znanje smo preizkusili na korpusih, ki sem ga sama lahko oblikovala zaradi dolgoletnih prizadevanj slovenskih strokovnjakov, denimo dr. Mirana Hladnika z Oddelka za slovenistiko ljubljanske Filozofske fakultete, za digitalizacijo slovenske književnosti. V pogovoru z drugimi udeleženci sem ugotovila, da smo v Sloveniji na področju digitalizacije literarnih del naprednejši od nekaterih drugih narodov, denimo Francozov.

Podobno znanje kot tečaj stilometrije, le da z delom v programu Python, je posredovala tudi delavnica dr. Eun Seo Jo s Univerze v Standordu, ki sem jo obiskala, ko smo imeli udeleženci na voljo obisk v drugih učilnicah. Obiskala sem tudi delavnico, v kateri sem spoznala nastajanje korpusa likovnih del iz zgodovine umetnosti, po katerem lahko iščemo denimo določene kompozicije in telesne postavitve figur. Peter Bell z univerze Friedrich-Alexander v Erlangen-Nürnbergu in Leonardo Impett s švicarske École Polytechnique Fédérale de Lausanne sta razkrila možnosti računalniškega pogleda (“computer vision”) za analizo vizualnega gradiva. V nepregledni množici iz zakladnice likovne ustvarjalnosti lahko s pomočjo računalnika najdemo določen vizualni detajl, ki se pojavlja v različnih okoljih. Zanimive so bile tudi predstavljene tehnike postavljanja določenih kulturnih pojavov na različne tipe zemljevidov, na primer literarnozgodovinskih dejstev in zgodb iz književnosti. Spoznala sem, da inovativni načini vizualne predstavitve podatkov niso pomembni le zato, ker nudijo nov vpogled v določeno znanje, marveč tudi zato, ker z njihovo pomočjo odpremo nove zorne kote in tako neredko novo znanje tudi pridobimo.

Digitalni svet je postal del vsakdanjega življenja in vstopa v raziskovanje na področju humanistike. To pa še vedno ni mogoče brez »tradicionalnih« raziskovalnih metod, ki nam omogočajo, da postavimo smiselna raziskovalna vprašanja. Raba računalniških algoritmov našim raziskavam vsekakor odpira nove dimenzije, vendar lahko tudi humanistika pozitivno vpliva na informacijske tehnologije. Posebej s tem, da osmisli in argumentira pomen prostega dostopa do znanja. Ta humanistična vrednota, ki je bila v začetkih interneta še njegov del, v korist velikih korporacij žal vse bolj izginja.

Ivana Zajc, doktorandka na Oddelku za slovenistiko FF UL

 

Vtisi s 4. pohoda v spomin na Adama Kilgarriffa, 22. julij 2018

Po konferenci EURALEX, ki je letos v organizaciji CJVT in Trojine potekala v Ljubljani, je SDJT organiziral 4. pohod v spomin na Adama Kilgarriffa. Pohoda se je udeležilo 20 pohodnikov iz 8 različnih držav, vzdušje je bilo nepozabno, vsi smo si zaželeli, da se na podobnem pohodu, mogoče v organizaciji kakšne od prihodnjih konferenc v drugi državi, srečamo še kdaj. Na pot smo se odpravili skupaj, po počitku na planšariji Prevala pa se je del pohodnikov odpravil do izvira Roža, tisti najbolj nadebudni pa so osvojili vrh Begunjšcice in se v Podljubelj vrnili preko Zelenice. Za podvig jim iskreno čestitamo! Posebna zahvala gre organizatorju pohoda Damjanu Popiču in sponzorju pohoda, podjetju SketchEngine, ki je pohodnikom omogočil prevoz do izhodišča in nazaj v Ljubljano.

The 2018 Adam Kilgarriff Memorial Hike

The 2018 Adam Kilgarriff Memorial Hike: Prevala (1311m) and Begunjščica (2060m)

Adam Kilgarrif at Grintavec (2347 m) in July 2013
Adam Kilgarrif at Grintavec (2347 m) in July 2013

Date: July 22, 2018
Start: 8am from Ljubljana, 9am from the starting point (the Ljubelj/Loibl Pass)
Duration: 1.5 hours to Prevala, 3.5 hours to Begunjščica (optional)
Difficulty: Easy walk to Prevala, steep but safe climb to Begunjščica

The view from Begunjščica.
The view from Begunjščica.

Organization: Darja Fišer and Damjan Popič

The Euralex Conference in Ljubljana coincides with the 5th anniversary of our last hike with our dear friend and inspiring colleague Adam Kilgarriff which we did just before driving together to the Euralex conference in Bolzano (15-19 July 2014). We hiked to the summit of Grintovec (2558 m), a strenuous hike even for experienced mountaineers, which Adam climbed in his sandals. Not only did he reach the summit first, he also offered to carry our backpack! I don’t remember ever seeing him happier than on that mountain.

The Slovene Language Technologies Society has been organizing a hike in Adam’s memory since then. On this occasion, we wish to invite the Euralex participants to join us on a beautiful hike to the Slovenian Alps we are certain Adam would have loved. The first part of the hike is easy, with lots of beautiful vistas, a tunnel and a mountain hut with great food. If you want a more challenging hike, you can also choose to continue all the way to the top of Begunjšica, a summit over 2000 meters above sea level.

The transportation from Ljubljana to the Ljubelj Pass and back is kindly sponsored by Lexical Computing. Please bring your own drinks and food (can also be purchased at the hut). In order to be able to organize the hike safely, registration is required by 1st July 2018. The hike is family friendly and everyone is welcome but please register each hiker separately.

If you have any questions about the hike, please send an email to sdjt@ijs.si.

Description of the hike | Equipment | Google form

The 2018 Adam Kilgarriff Memorial Hike – description

Description of the hike
[Back to full text]

We will drive to the Austrian-Slovenian border and begin our ascent from the Ljubelj Pass (1058 meters above sea level) following a stunning route through the Born Tunnel (a spectacular century-old 250-meter tunnel dug directly through the mountain) and along the slopes offering a scenic view of the valley and prominent peaks.

Entering the Born Tunnel (nastja.com).
Entering the Born Tunnel (nastja.com).

We will reach the Prevala alpine pasture after 1.5 hours of walk (and 250 meters worth of ascent) and split into two groups. One will enjoy the good eats and splendid views of the Prevala alpine cottage, whereas the second will attempt a steep climb to Begunjščica via the aptly-named Calvary. It will take us additional two hours to reach the summit, at which point we will be able to choose to return to Prevala or go via a different path that will bring us to another cottage (Zelenica) and back to the starting point. The descent takes about two hours, regardless of which path we choose.

The path towards Zelenica.
The path towards Zelenica.

In terms of technique, the hike is by no means difficult, but you will require good hiking shoes, sunscreen, stamina and plenty of water. The initial part of the path goes around the slopes of the mountain, so it may prove difficult for those who don’t have a good head for heights. However, you will be accompanied by experienced mountaineers every step of the way.

Walking along the initial part of the Born Trail (Slotrips.si).
Walking along the initial part of the Born Trail (Slotrips.si).

Equipment

  • sturdy hiking boots
  • comfortable clothes (in layers, this side of the mountain can get quite hot in July but can be quite chilly and windy on the summit)
  • rain gear (anorak, no umbrellas please)
  • headlamp (we will be walking through a 250 m long unlit tunnel)
  • water bottle
  • snacks/fruit

Google form

https://docs.google.com/forms/d/1Go-AmqI93OOspPiz71pSC6v0dVfw7egKCtyjZKjkBxE/