Viri

Jezikovni viri in servisi


Orodja

Konkordančniki:

Obdelava besedil:

  • slovenski črkovalnik µBesAna
  • slovnični pregledovalnik slovenskih besedil Besana
  • spletni vmesnik za oblikoskladenjsko označevanje in lematizacijo besedil JOS
  • oblikoskladenjski označevalnik in lematizator za slovenski jezik Obeliks
  • skladenjski razčlenjevalnik SSJ
  • določanje oblikoslovnih oznak in lem ZRC
  • luščilnik terminologije za slovenščino LUIZ

Jezikovni korpusi

Enojezični splošni:

  • Korpus pisnega jezika Gigafida, 1 milijarda besed
  • Referenčni korpus Kres, 100 milijonov besed
  • Korpus pisnega jezika Nova beseda, 318 milijonov besed
  • Učni korpus ssj500k, 500.000 besed
  • Prosto dostopen korpus ccGigafida, 100 milijonov besed
  • Prosto dostopen korpus ccKres, 10 milijonov besed
  • Korpus starejše slovenščine IMP, 3 milijone besed
  • Skladenjsko označen korpus SDT, 30.000 besed
  • Govorni korpus Gos, 1 milijon besed

Enojezični specializirani:

  • Šolar: Korpus pisnih šolskih izdelkov, 1 milijon besed
  • Korpus DSI: korpus besedil s področja informatike in računalništva, 14 milijonov besed
  • KORP: korpus besedil odnosov z javnostmi, 1,8 milijona besed

Večjezični:

  • korpus SPOOK: večjezični primerljivi prevodoslovni korpus
  • Evrokorpus: dvo- in večjezični vzporedni korpusi besedil z različnih področij, v katerih je slovenščina vedno eden od jezikov, skupaj več kot 240 milijonov besed
  • MULTEXT-East: oblikoslovno označen večjezični korpus, večjezične oblikoslovne oznake in računalniški leksikon 

Projekti:

  • SSJ: razvoj referenčnega korpusa in leksikalne baze slovenskega jezika s slovničnim analizatorjem ter razvoj pedagoških priročnikov za poučevanje slovenščine
  • IMP: jezikovni viri starejše slovenščine
  • JOS: jezikoslovno označevanje slovenskega jezika
  • SIGNOR: korpus slovenskega znakovnega jezika in pilotna slovnica
  • CLARIN: evropska raziskovalna infrastruktura za jezikovne vire
  • FLaReNet: evropska mreža za razvoj jezikovnih virov in jezikovnih tehnologij

Posredniki:

  • META-SHARE: zbirka metapodatkov o jezikovnih virih, vključuje slovenščino
  • ELRA/ELDA: posredniška hiša za jezikovne vire, vključuje slovenščino
  • LDC: konzorcij za izmenjavo jezikovnih virov

Digitalne knjižnice


Slovarji in leksikalni viri

Slovarski viri:

  • Sloleks: slovenski oblikoslovni leksikon
  • SSSJ: spletni slovar slovenskega jezika
  • LBS: leksikalna baza slovenskega jezika
  • IMP: slovar slovenskih zastarelih besed
  • BOS@ZRC: slovarske zbirke na Inštitut za slovenski jezik Frana Ramovša ZRC SAZU
  • Termania: portal brezplačnih slovarjev za različne jezike in področja
  • gov.si: seznam večjezičnih spletnih slovarjev
  • Evroterm: večjezična terminološka zbirka
  • Islovar: terminološki slovar informatike
  • Angleško-slovenski računalniški slovar
  • sloWNet: slovenski semantični leksikon
  • Wikislovar: splošni prosti slovar slovenščine
  • Razvezani jezik: prosti slovar žive slovenščine

Pedagoški priročniki


Preverjanje in učenje jezika

  • Pregibnik: računalnik vam pregiba slovanske besede
  • Sloleks: leksikon besednih oblik za slovenščino
  • SFT: slovenščina za popotnike

Strojno prevajanje

  • Presis: strojni prevajalnik za slovenščino-angleščino in slovenščino-nemščino
  • Google translate: statistični strojni prevajalnik za številne jezike
  • bing Translator: statistični strojni prevajalnik za številne jezike
  • iTranslate: portal statističnih prevajalnikov za številne jezike

Govor

  • Govorec: sintetizator govora Amebis Govorec
  • Proteus TTS: sintetizator govora
  • SAMPA-sl: SAMPA fonetični simboli za slovenski jezik