Vtisi s 30. Evropske poletne šole logike, jezika in informatike na Univerzi v Sofiji

V Sofiji je med 6. in 17. avgustom potekala 30. Evropska poletna šola logike, jezika in informatike. Skoraj dva tedna so v treh nadstropjih rektorata Univerze v Sofiji v centru mesta od jutra do večera potekala predavanja o najrazličnejših prepletih področij logike, računalništva, jezikoslovja in kognitivnih ved. Mojo izkušnjo poletne šole sta obravnavali dve področji: prvo je distribucijska semantika, drugo pa Bayesovske metode.

V prvem tednu je profesor Stefan Evert, profesor na Univerzi v Erlangenu in Nurembergu, na predavanjih o distribucijski semantiki slušateljem podal robustni uvod v področje, od metod za računanje distribucijskih modelov, primerov rabe tovrstnih modelov v praksi in najsodobnejših pristopov (npr. Word2vec) pa do vpetosti gradnje modelov v delotok označevanja korpusov. Hitro je postalo tudi jasno, da za nadaljnji razvoj na tem področju slušatelji potrebujejo znanje linearne algebre, pri čemer si predstavljam, da je veliko humanistično usmerjenih udeleženih pokimalo in v zapiske vstavilo simbol s pomenom »Preberi več o tem kasneje ali poišči način, kako naslednje leto dobiti kreditne točke za predavanje o tem.« Prvo sem med odmori, drugo nameravam.

V prvem tednu je prav tako potekalo predavanje Gregoryja Scontrasa, docenta na Univerzi v Kaliforniji, ki je predaval o verjetnostnih modelih razumevanja naravnega jezika. Gre se za zelo produktiven preplet Bayesovskih metod in eksperimentalnega jezikoslovja na področju raziskovanja pragmatike. Natančneje smo obravnavali Baysovski model racionalnih govornih dejanj, ki precej uspešno modelira rezultate različnih raziskav na področju pragmatike. Na primer, če mi sogovorec pove, da je pojedel nekaj kosov skupne torte, lahko sklepam, da je uvidevno pustil nekaj tudi zame, čeprav bi čisto formalno gledano »nekaj kosov« lahko pomenilo tudi »vse kose«. Iz kognitivnega vidika pa je s tem modelom tesno povezana sposobnost teorije uma (predvidevanja miselnega stanja sogovornika), ki je do neke mere bila formalizirana v jeziku Bayesovskih enačb.

V drugem tednu sem obiskoval predavanje o računalniškem procesiranju večbesednih izrazov, ki se je na koncu izkazalo kot posrečeno in aplikativnejše nadaljevanje predavanja o distribucijski semantiki. Carlos Ramisch (Univerza Aix Marseille), Agata Savary (Univerza v Toursu) in Aline Villavicencio (Univerza v Essexu in Univerza Rio Grande do Sul) so predavale o kriterijih za večbesedne izraze in označenih zbirkah v večih jezikih (med njimi tudi slovenščina), ki so nastale v okviru projekta PARSEME ter o rabi distribucijskih modelov za odkrivanje večbesednih izrazov.

V istem tednu sta Michael Franke, profesor na Univerzi v Osnabrücku, in Michael Henry Tessler, postdoktorski sodelavec na Univerzi v Stanfordu, predavala o verjetnostnem modeliranju na področju semantike in pragmatike. Po eni strani je šlo za podaljšek Bayesovskega predavanja iz prvega tedna, saj s(m)o slušatelji uporabljali WebPPL, na Javascriptu temelječ verjetnostni programski, ki je bil uporabljen tudi pri predavanju o verjetnostnem razumevanju jezika. Po drugi strani pa je to predavanje bilo močneje usmerjeno v nekatere metode in vrednosti verjetnostnih modelov nasploh in možnosti, ki jih ponuja WebPPL.

Velik del udeležencev poletne šole so predstavljali študenti in študentke, ki opravljajo magisterije ali doktorate na področju računalniškega jezikoslovja ali podobnih smeri, zame pa je poletna šola predstavljala priložnost izobraževanja na področjih, ki so v slovenskem prostoru organizirana priložnostno ali fragmentirano med različnimi fakultetami. Olajševanje dostopnosti in organizacija tovrstnih dogodkov sta ključna za vzpostavitev meddisciplinarnega dialoga med področjema računalništva in jezikoslovja, slovenščina pa kot manjši in morfološko bogati jezik ponuja procesiranju jezika nove izzive, obratno pa grajenje infrastrukture za procesiranje slovenščine odpira vrata široki paleti jezikovnih tehnologij.

Zoran Fijavž