In English

Raul Sirel

_images/raul.png

Üldine

 • Sünniaeg: 14.11.1986

 • E-mail: rsirel@texta.ee

 • Telefon: Ei tea numbrit? E-kiri on lahendus!

 • Uurimishuvid: keeletehnoloogia, masinõpe, ajalugu, geograafia.

Teenistuskäik

 • 01.01.2017–… TEXTA OÜ, Tehnoloogiajuht; asutaja (1,00)

 • 01.05.2015–31.12.2016 STACC OÜ, Projektijuht (1,00)

 • 01.09.2013–31.12.2013 Lääne-Sydney Ülikool, Külalisteadur (0,50)

 • 01.09.2013–31.12.2013 NICTA Canberra Uurimislabor, Külalisteadur (0,50)

 • 01.07.2011–30.04.2015 STACC OÜ, Teadur (1,00)

 • 15.11.2010–30.06.2011 STACC OÜ, Teadur (0,50)

Haridustee

 • 2011–… Tartu Ülikool, doktoriõpe, üldkeeleteadus

 • 2009–2011 Tartu Ülikool, humanitaarteaduste magister (MA), arvutilingvistika

 • 2006–2009 Tartu Ülikool, humanitaarteaduste bakalaureus (BA), arvutilingvistika

 • 2003–2006 Tallinna Tehnikagümnaasium

Kvalifikatsioon

Akadeemiline kraad

 • Raul Sirel, magistrikraad, 2011, (juh) Margus Treumuth, Poolautomaatne teadmusbaaside konstrueerimine dialoogsüsteemidele, Tartu Ülikool.

 • Raul Sirel, doktorant, (juh) Kadri Muischnek; Jaak Vilo, Eestikeelsete terviselugude andmekaeve, Tartu Ülikool.

Täiendkoolitused

 • 2014 - 13th Estonian Summer School on Computer and Systems Science

 • 2013 - Lisbon Machine Learning Summer School (LxMLS)

 • 2013 - 12th Estonian Summer School on Computer and Systems Science

 • 2013 - Australian Health Informatics Summer School

 • 2012 - 11th Estonian Summer School on Computer and Systems Science

Projektid

Teadusprojektid

 • EMBEDDIA “Cross-Lingual Embeddings for Less-Represented Languages in European News Media”, TEXTA OÜ, H2020: https://cordis.europa.eu/project/id/825153.

 • TAR16013 (EXCITE) “IT Tippkeskus EXCITE (1.09.2016−1.03.2023)”, Maarja Kruusmaa, Tallinna Tehnikaülikool, Infotehnoloogia teaduskond, Biorobootika keskus, Cybernetica AS.

 • EKTR3 “TEXTA Toolkit 2.0 (1.01.2018−31.12.2020)”, Raul Sirel, TEXTA OÜ.

 • IUT34-4 “Andmeteaduse meetodid ja rakendused (DSMA) (1.01.2015−31.12.2020)”, Jaak Vilo, Tartu Ülikool, Loodus- ja täppisteaduste valdkond, arvutiteaduse instituut.

 • EKT108 “TEXTA tööriistakomplekti jätkuarendus ja juurutamine (1.01.2017−31.12.2017)”, Raul Sirel, TEXTA OÜ.

 • EKT68 “Töövahendite raamistik tekstikorpustest teadmuse tuletamiseks (1.01.2015−31.12.2016)”, Raul Sirel, STACC OÜ.

 • ETF9124 “Suhtlusagendi modelleerimine ja Eesti dialoogikorpus (1.01.2012−31.12.2014)”, Mare Koit, Tartu Ülikool, Matemaatika-informaatikateaduskond.

 • EKT5 “Eestikeelse dialoogi pragmaatika analüsaator (1.01.2011−31.12.2013)”, Mare Koit, Tartu Ülikool, Matemaatika-informaatikateaduskond.

 • SF0180078s08 “Loomulike keelte arvutitöötluse formalismide ja efektiivsete algoritmide väljatöötamine ning eesti keelele rakendamine (1.01.2008−31.12.2013)”, Mare Koit, Tartu Ülikool, Matemaatika-informaatikateaduskond.

 • ETF7503 “Suhtlusstrateegiad suhtlusmudelis: eestikeelse dialoogi modelleerimine arvutil (1.01.2008−31.12.2011)”, Mare Koit, Tartu Ülikool, Matemaatika-informaatikateaduskond.

 • EKKTT09-65 “Automaatne parafraaside leidmine ning sõnade ja lühifraaside tõlkimine paralleelkorpuste abil (1.01.2009−31.12.2010)”, Maarika Traat, Tartu Ülikool, Matemaatika-informaatikateaduskond.

Äriprojektid

 • MKM “Bürokrati juturobot 1 & 2”, 2020-2021, TEXTA OÜ.

 • MKM “Bürokratt - e-kirjade automaatmärgendamine”, 2020-2021, TEXTA OÜ.

 • TTJA “E-kirjade automaatmärgendamine”, 2020-2021, TEXTA OÜ.

 • Rahvusraamatukogu “Märksõnastamise KRATT 1 & 2”, 2019-2021, TEXTA OÜ.

 • HTM “Dokumendiregistri andmelekete tuvastamine tekstianalüüsi kasutades”, 2018,TEXTA OÜ.

 • Ekspress Grupp “Kommentaaride automaatmodereerimine”, 2019-…, TEXTA OÜ.

 • RIK “Kohtulahendite automaatne anonümiseerimine”, 2019, TEXTA OÜ.

 • Õhtuleht “Artiklite automaatmärgendamine”, 2018, TEXTA OÜ.

 • Äripäev “Artiklite automaatmärgendamine”, 2018, TEXTA OÜ.

 • CV Online “Tööpakkumiste ja elulookirjelduste soovitusmootor”, 2017, TEXTA OÜ.

 • Õhtuleht “Kommentaaride automaatmodereerimine”, 2016, STACC OÜ.

Juhendatud väitekirjad

 • Katrin Valdson, magistrikraad, 2016, (juh) Raul Sirel; Aleksandr Tkatšenko, Mustripõhine informatsiooni eraldamine Eesti kohtulahenditest, Tartu Ülikool, Loodus- ja täppisteaduste valdkond, arvutiteaduse instituut.

Õpetamine

Publikatsioonid

 • Asula, Marit; Makke, Jane; Freienthal, Linda; Kuulmets, Hele-Andra; Sirel, Raul (2021). Kratt: Developing an Automatic Subject Indexing Tool for the National Library of Estonia. Cataloging & Classification Quarterly, 1−19. DOI: 10.1080/01639374.2021.1998283.

 • Vaik, Kristiina; Asula, Marit; Sirel, Raul (2020). Hybrid Tagger – An Industry-driven Solution for Extreme Multi-label Text Classification. In: Proceedings of the LREC2020 Industry Track (26−30). Language Resources and Evaluation Conference (LREC 2020), Marseille, 11–16 May 2020. European Language Resources Association (ELRA). DOI: 10.5281/zenodo.4306169.

 • Suominen, Hanna; Johnson, Maree; Zhou, Liyuan; Sanchez, Paula; Sirel, Raul; Basilakis, Jim; Hanlen, Leif; Estival, Dominique; Dawson, Linda; Kelly, Barbara (2015). Capturing patient information at nursing shift changes: methodological evaluation of speech recognition and information extraction. Journal of the American Medical Informatics Association, 22 (E1), E48−E66.10.1136/amiajnl-2014-002868.

 • Sirel, Raul (2013). Meetodeid tekstide leksikaalsete ja grammatiliste erinevuste tuvastamiseks meditsiiniliste tarbetekstide näitel. Eesti Rakenduslingvistika Ühingu aastaraamat, 9, 265−278. DOI: 10.5128/ERYa9.17.

 • Reisberg, S; Sirel, R; Kalda, R; Merzin, M; Pruulmann, J; Vilo, J (2013). Elektrooniliste terviselugude analüüsimise võimalused Tartu perearstide infosüsteemi näitel. Eesti Arst, 92 (8), 452−459.

 • Sirel, Raul (2013). Morphostatistical Approach to Medical Document Classification. Proceedings of the 4th International Louhi Workshop on Health Document Text Mining and Information Analysis (Louhi 2013): 11-12 Feb 2013 Sydney. Ed. Suominen, Hanna.

 • Sirel, R. (2012). Knowledge Acquisition Tool for Dialogue Systems. Frontiers in Artificial Intelligence and Applications, 247: Human Language Technologies – The Baltic Perspective, 4.-5. Oct Tartu. Ed. Arvi Tavast, Kadri Muischnek, Mare Koit. Amsterdam: IOS Press, 201−205.

 • Sirel, Raul (2012). Dynamic User Interfaces for Synchronous Encoding and Linguistic Uniforming of Textual Clinical Data. Frontiers in Artificial Intelligence and Applications, 247: Human Language Technologies – The Baltic Perspective, 4.-5. Oct Tartu. Ed. Arvi Tavast, Kadri Muischnek, Mare Koit. Amsterdam: IOS Press, 206−212.

 • Muischnek, K.; Kaalep, H.-J.; Sirel, R. (2011). Korpuslingvistiline lähenemine eesti internetikeele automaatsele morfoloogilisele analüüsile. Metslang, H.; Langemets, M.; Sepper, M.-M. (Toim.). Eesti Rakenduslingvistika Ühingu aastaraamat (111−127). . Tallinn: Eesti Rakenduslingvistika Ühing. DOI: 10.5128/ERYa7.07.