Jezikovni viri in servisi
Orodja
Konkordančniki:
- Gigafida 2.0, Kres, GOS
- NoSketch Engine (novejši grafični vmesnik), NoSketch Engine (starejši vmesnik) in KonText @ CLARIN.SI
- Nova beseda
- Evrokorpus
Obdelava besedil:
- slovnični pregledovalnik in črkovalnik slovenskih besedil Besana
- spletni vmesnik za oblikoskladenjsko označevanje in lematizacijo besedil JOS
- oblikoskladenjski označevalnik in lematizator za slovenski jezik Obeliks
- skladenjski razčlenjevalnik SSJ
- določanje oblikoslovnih oznak in lem ZRC
- luščilnik terminologije za slovenščino LUIZ
Jezikovni korpusi
Enojezični splošni:
- Korpus pisnega jezika Gigafida 2.0, 1 milijarda besed
- Referenčni korpus Kres, 100 milijonov besed
- Korpus pisnega jezika Nova beseda, 318 milijonov besed
- Učni korpus ssj500k, 500.000 besed
- Prosto dostopen korpus ccGigafida, 100 milijonov besed
- Prosto dostopen korpus ccKres, 10 milijonov besed
- Korpus starejše slovenščine IMP, 3 milijone besed
- Skladenjsko označen korpus SDT, 30.000 besed
- Govorni korpus Gos, 1 milijon besed
Enojezični specializirani:
- Šolar: Korpus pisnih šolskih izdelkov, 1 milijon besed
- Korpus DSI: korpus besedil s področja informatike in računalništva, 14 milijonov besed
- KORP: korpus besedil odnosov z javnostmi, 1,8 milijona besed
Večjezični:
- korpus SPOOK: večjezični primerljivi prevodoslovni korpus
- Evrokorpus: dvo- in večjezični vzporedni korpusi besedil z različnih področij, v katerih je slovenščina vedno eden od jezikov, skupaj več kot 240 milijonov besed
- MULTEXT-East: oblikoslovno označen večjezični korpus, večjezične oblikoslovne oznake in računalniški leksikon
- TURK: večjezični korpus turističnih besedil
Projekti:
- CLARIN.SI: slovenska raziskovalna infrastruktura za jezikovne vire in tehnologije
- SSJ: razvoj referenčnega korpusa in leksikalne baze slovenskega jezika s slovničnim analizatorjem ter razvoj pedagoških priročnikov za poučevanje slovenščine
- IMP: jezikovni viri starejše slovenščine
- JOS: jezikoslovno označevanje slovenskega jezika
- SIGNOR: korpus slovenskega znakovnega jezika in pilotna slovnica
- Phonological Development Tools and Cross-linguistic Phonology Project: fonološki razvoj slovenskih otrok (Kanada)
Digitalne knjižnice
- IMP: digitalna knjižnica starejših slovenskih knjig
- dLib.si: Digitalna knjižnica Slovenije
- Wikivir: Slovenska leposlovna klasika: digitalizirano slovensko leposlovje
- e-ZRC: Elektronske znanstvenokritične izdaje slovenskega slovstva
Slovarji in leksikalni viri
Slovarski viri:
- Sloleks: slovenski oblikoslovni leksikon
- SSSJ: spletni slovar slovenskega jezika
- LBS: leksikalna baza slovenskega jezika
- IMP: slovar slovenskih zastarelih besed
- BOS@ZRC: slovarske zbirke na Inštitut za slovenski jezik Frana Ramovša ZRC SAZU
- Termania: portal brezplačnih slovarjev za različne jezike in področja
- gov.si: seznam večjezičnih spletnih slovarjev
- Evroterm: večjezična terminološka zbirka
- Islovar: terminološki slovar informatike
- Angleško-slovenski računalniški slovar
- sloWNet: slovenski semantični leksikon
- Wikislovar: splošni prosti slovar slovenščine
- Razvezani jezik: prosti slovar žive slovenščine
Pedagoški priročniki
Preverjanje in učenje jezika
- Pregibnik: računalnik vam pregiba slovanske besede
- Sloleks: leksikon besednih oblik za slovenščino
- SFT: slovenščina za popotnike
Strojno prevajanje
- Presis: strojni prevajalnik za slovenščino-angleščino in slovenščino-nemščino
- Google translate: statistični strojni prevajalnik za številne jezike
- bing Translator: statistični strojni prevajalnik za številne jezike
- iTranslate: portal statističnih prevajalnikov za številne jezike
Govor
- Govorec: sintetizator govora Amebis Govorec
- Proteus TTS: sintetizator govora
- SAMPA-sl: SAMPA fonetični simboli za slovenski jezik