Arhivi Kategorije: Vtisi z dogodkov

Vtisi s 30. Evropske poletne šole logike, jezika in informatike na Univerzi v Sofiji

V Sofiji je med 6. in 17. avgustom potekala 30. Evropska poletna šola logike, jezika in informatike. Skoraj dva tedna so v treh nadstropjih rektorata Univerze v Sofiji v centru mesta od jutra do večera potekala predavanja o najrazličnejših prepletih področij logike, računalništva, jezikoslovja in kognitivnih ved. Mojo izkušnjo poletne šole sta obravnavali dve področji: prvo je distribucijska semantika, drugo pa Bayesovske metode.

V prvem tednu je profesor Stefan Evert, profesor na Univerzi v Erlangenu in Nurembergu, na predavanjih o distribucijski semantiki slušateljem podal robustni uvod v področje, od metod za računanje distribucijskih modelov, primerov rabe tovrstnih modelov v praksi in najsodobnejših pristopov (npr. Word2vec) pa do vpetosti gradnje modelov v delotok označevanja korpusov. Hitro je postalo tudi jasno, da za nadaljnji razvoj na tem področju slušatelji potrebujejo znanje linearne algebre, pri čemer si predstavljam, da je veliko humanistično usmerjenih udeleženih pokimalo in v zapiske vstavilo simbol s pomenom »Preberi več o tem kasneje ali poišči način, kako naslednje leto dobiti kreditne točke za predavanje o tem.« Prvo sem med odmori, drugo nameravam.

V prvem tednu je prav tako potekalo predavanje Gregoryja Scontrasa, docenta na Univerzi v Kaliforniji, ki je predaval o verjetnostnih modelih razumevanja naravnega jezika. Gre se za zelo produktiven preplet Bayesovskih metod in eksperimentalnega jezikoslovja na področju raziskovanja pragmatike. Natančneje smo obravnavali Baysovski model racionalnih govornih dejanj, ki precej uspešno modelira rezultate različnih raziskav na področju pragmatike. Na primer, če mi sogovorec pove, da je pojedel nekaj kosov skupne torte, lahko sklepam, da je uvidevno pustil nekaj tudi zame, čeprav bi čisto formalno gledano »nekaj kosov« lahko pomenilo tudi »vse kose«. Iz kognitivnega vidika pa je s tem modelom tesno povezana sposobnost teorije uma (predvidevanja miselnega stanja sogovornika), ki je do neke mere bila formalizirana v jeziku Bayesovskih enačb.

V drugem tednu sem obiskoval predavanje o računalniškem procesiranju večbesednih izrazov, ki se je na koncu izkazalo kot posrečeno in aplikativnejše nadaljevanje predavanja o distribucijski semantiki. Carlos Ramisch (Univerza Aix Marseille), Agata Savary (Univerza v Toursu) in Aline Villavicencio (Univerza v Essexu in Univerza Rio Grande do Sul) so predavale o kriterijih za večbesedne izraze in označenih zbirkah v večih jezikih (med njimi tudi slovenščina), ki so nastale v okviru projekta PARSEME ter o rabi distribucijskih modelov za odkrivanje večbesednih izrazov.

V istem tednu sta Michael Franke, profesor na Univerzi v Osnabrücku, in Michael Henry Tessler, postdoktorski sodelavec na Univerzi v Stanfordu, predavala o verjetnostnem modeliranju na področju semantike in pragmatike. Po eni strani je šlo za podaljšek Bayesovskega predavanja iz prvega tedna, saj s(m)o slušatelji uporabljali WebPPL, na Javascriptu temelječ verjetnostni programski, ki je bil uporabljen tudi pri predavanju o verjetnostnem razumevanju jezika. Po drugi strani pa je to predavanje bilo močneje usmerjeno v nekatere metode in vrednosti verjetnostnih modelov nasploh in možnosti, ki jih ponuja WebPPL.

Velik del udeležencev poletne šole so predstavljali študenti in študentke, ki opravljajo magisterije ali doktorate na področju računalniškega jezikoslovja ali podobnih smeri, zame pa je poletna šola predstavljala priložnost izobraževanja na področjih, ki so v slovenskem prostoru organizirana priložnostno ali fragmentirano med različnimi fakultetami. Olajševanje dostopnosti in organizacija tovrstnih dogodkov sta ključna za vzpostavitev meddisciplinarnega dialoga med področjema računalništva in jezikoslovja, slovenščina pa kot manjši in morfološko bogati jezik ponuja procesiranju jezika nove izzive, obratno pa grajenje infrastrukture za procesiranje slovenščine odpira vrata široki paleti jezikovnih tehnologij.

Zoran Fijavž

Vtisi z Evropske poletne univerze iz digitalne humanistike na Univerzi v Leipzigu

Evropska poletna univerza iz digitalne humanistike na Univerzi v Leipzigu je ena od petih na svetu in hkrati edina tovrstna poletna šola izven angleško govorečega območja. Udeleženci – teh je okrog 90 – prihajajo z vsega sveta, od Združenih držav Amerike do Avstralije, Južne Amerike, Irana, Indije in Kitajske, veliko pa je tudi udeležencev iz Evrope. Dva tedna druženja udeležencu omogočijo, da se poveže z novimi, zanimivimi ljudmi z vsega sveta. Poletna univerza nudi izjemno intenziven program, ki v desetih dneh omogoči dvakrat po 18 ur zgoščenih delavnic, kjer so študentom na voljo vodilni strokovnjaki določenega področja, pa tudi množico predavanj, okroglih miz in strokovnih posvetov ter manj formalnih ogledov muzejev ter razstav. Poletno šolo organizira prof. dr. Elisabeth Burr z ekipo študentov, ki je pokazala vrhunsko predanost temu projektu. V svojem poslovilnem govoru ob koncu poletne šole je dr. Elisabeth Burr izpostavila Slovensko društvo za jezikovne tehnologije, ki študentom iz Slovenije omogoča obisk te kakovostne poletne šole.

Program je usmerjen v več kategorij digitalne humanistike, ki je hitro rastoče polje. Udeleženci tako prihajajo z različnih področij humanistike, denimo zgodovine, novinarstva, prevajalstva, sociologije. Poletna šola nudi bogat nabor metodologij, ki lahko pomagajo odgovoriti na različna raziskovalna vprašanja. Delavnice dajejo težo praktični aplikaciji znanja, zato je dobro, da se študent nanje dobro pripravi in si že pred prihodom določi konkretne cilje.

Edicija poletne šole v letu 2018 je ponudila denimo delavnico o strojnem prevajanju pod vodstvom dr. Tommija A. Pirinena z Univerze v Hamburgu, delavnico z dr. Carol Chiodo z Univerze v Princetonu in dr. Lauren Tilton z Univerze v Richmondu v ZDA, ki sta učili, kako najti, organizirati in analizirati podatke v določeni raziskavi. Sama sem se udeležila delavnice z naslovom Stilometrija. Gre za računalniško analizo literarnega stila. Profesorja sta prihajala s Poljske in sta skupino desetih študentov z vsega sveta, v katero sem bila vključena, hitro uvedla v analizo večjih korpusov besedil v programskem jeziku “R” in programu “R Studio”. Dr. Maciej Eder s Pedagoške fakultete v Krakovu in dr. Jeremi Ochab s tamkajšnje Jagielonske univerze sta ure oblikovala zelo dinamično, z mešanico predavanj in praktičnih vaj, ki smo jih opravili na osebnih računalnikih. Učitelja sta nam predstavila tudi nekaj aktualnih stilometričnih projektov in njune raziskave, ki so usmerjene predvsem v prepoznavanje avtorstva anonimnih tekstov. Pridobljeno znanje smo preizkusili na korpusih, ki sem ga sama lahko oblikovala zaradi dolgoletnih prizadevanj slovenskih strokovnjakov, denimo dr. Mirana Hladnika z Oddelka za slovenistiko ljubljanske Filozofske fakultete, za digitalizacijo slovenske književnosti. V pogovoru z drugimi udeleženci sem ugotovila, da smo v Sloveniji na področju digitalizacije literarnih del naprednejši od nekaterih drugih narodov, denimo Francozov.

Podobno znanje kot tečaj stilometrije, le da z delom v programu Python, je posredovala tudi delavnica dr. Eun Seo Jo s Univerze v Standordu, ki sem jo obiskala, ko smo imeli udeleženci na voljo obisk v drugih učilnicah. Obiskala sem tudi delavnico, v kateri sem spoznala nastajanje korpusa likovnih del iz zgodovine umetnosti, po katerem lahko iščemo denimo določene kompozicije in telesne postavitve figur. Peter Bell z univerze Friedrich-Alexander v Erlangen-Nürnbergu in Leonardo Impett s švicarske École Polytechnique Fédérale de Lausanne sta razkrila možnosti računalniškega pogleda (“computer vision”) za analizo vizualnega gradiva. V nepregledni množici iz zakladnice likovne ustvarjalnosti lahko s pomočjo računalnika najdemo določen vizualni detajl, ki se pojavlja v različnih okoljih. Zanimive so bile tudi predstavljene tehnike postavljanja določenih kulturnih pojavov na različne tipe zemljevidov, na primer literarnozgodovinskih dejstev in zgodb iz književnosti. Spoznala sem, da inovativni načini vizualne predstavitve podatkov niso pomembni le zato, ker nudijo nov vpogled v določeno znanje, marveč tudi zato, ker z njihovo pomočjo odpremo nove zorne kote in tako neredko novo znanje tudi pridobimo.

Digitalni svet je postal del vsakdanjega življenja in vstopa v raziskovanje na področju humanistike. To pa še vedno ni mogoče brez »tradicionalnih« raziskovalnih metod, ki nam omogočajo, da postavimo smiselna raziskovalna vprašanja. Raba računalniških algoritmov našim raziskavam vsekakor odpira nove dimenzije, vendar lahko tudi humanistika pozitivno vpliva na informacijske tehnologije. Posebej s tem, da osmisli in argumentira pomen prostega dostopa do znanja. Ta humanistična vrednota, ki je bila v začetkih interneta še njegov del, v korist velikih korporacij žal vse bolj izginja.

Ivana Zajc, doktorandka na Oddelku za slovenistiko FF UL

 

Vtisi s 4. pohoda v spomin na Adama Kilgarriffa, 22. julij 2018

Po konferenci EURALEX, ki je letos v organizaciji CJVT in Trojine potekala v Ljubljani, je SDJT organiziral 4. pohod v spomin na Adama Kilgarriffa. Pohoda se je udeležilo 20 pohodnikov iz 8 različnih držav, vzdušje je bilo nepozabno, vsi smo si zaželeli, da se na podobnem pohodu, mogoče v organizaciji kakšne od prihodnjih konferenc v drugi državi, srečamo še kdaj. Na pot smo se odpravili skupaj, po počitku na planšariji Prevala pa se je del pohodnikov odpravil do izvira Roža, tisti najbolj nadebudni pa so osvojili vrh Begunjšcice in se v Podljubelj vrnili preko Zelenice. Za podvig jim iskreno čestitamo! Posebna zahvala gre organizatorju pohoda Damjanu Popiču in sponzorju pohoda, podjetju SketchEngine, ki je pohodnikom omogočil prevoz do izhodišča in nazaj v Ljubljano.