Raul Sirel
Üldine
Sünniaeg: 14.11.1986
E-mail: rsirel@texta.ee
Telefon: Ei tea numbrit? E-kiri on lahendus!
Uurimishuvid: keeletehnoloogia, masinõpe, ajalugu, geograafia.
Teenistuskäik
01.01.2017–… TEXTA OÜ, Tehnoloogiajuht; asutaja (1,00)
01.05.2015–31.12.2016 STACC OÜ, Projektijuht (1,00)
01.09.2013–31.12.2013 Lääne-Sydney Ülikool, Külalisteadur (0,50)
01.09.2013–31.12.2013 NICTA Canberra Uurimislabor, Külalisteadur (0,50)
01.07.2011–30.04.2015 STACC OÜ, Teadur (1,00)
15.11.2010–30.06.2011 STACC OÜ, Teadur (0,50)
Haridustee
2011–… Tartu Ülikool, doktoriõpe, üldkeeleteadus
2009–2011 Tartu Ülikool, humanitaarteaduste magister (MA), arvutilingvistika
2006–2009 Tartu Ülikool, humanitaarteaduste bakalaureus (BA), arvutilingvistika
2003–2006 Tallinna Tehnikagümnaasium
Kvalifikatsioon
Akadeemiline kraad
Raul Sirel, magistrikraad, 2011, (juh) Margus Treumuth, Poolautomaatne teadmusbaaside konstrueerimine dialoogsüsteemidele, Tartu Ülikool.
Raul Sirel, doktorant, (juh) Kadri Muischnek; Jaak Vilo, Eestikeelsete terviselugude andmekaeve, Tartu Ülikool.
Täiendkoolitused
2014 - 13th Estonian Summer School on Computer and Systems Science
2013 - Lisbon Machine Learning Summer School (LxMLS)
2013 - 12th Estonian Summer School on Computer and Systems Science
2013 - Australian Health Informatics Summer School
2012 - 11th Estonian Summer School on Computer and Systems Science
Projektid
Teadusprojektid
EMBEDDIA “Cross-Lingual Embeddings for Less-Represented Languages in European News Media”, TEXTA OÜ, H2020: https://cordis.europa.eu/project/id/825153.
TAR16013 (EXCITE) “IT Tippkeskus EXCITE (1.09.2016−1.03.2023)”, Maarja Kruusmaa, Tallinna Tehnikaülikool, Infotehnoloogia teaduskond, Biorobootika keskus, Cybernetica AS.
EKTR3 “TEXTA Toolkit 2.0 (1.01.2018−31.12.2020)”, Raul Sirel, TEXTA OÜ.
IUT34-4 “Andmeteaduse meetodid ja rakendused (DSMA) (1.01.2015−31.12.2020)”, Jaak Vilo, Tartu Ülikool, Loodus- ja täppisteaduste valdkond, arvutiteaduse instituut.
EKT108 “TEXTA tööriistakomplekti jätkuarendus ja juurutamine (1.01.2017−31.12.2017)”, Raul Sirel, TEXTA OÜ.
EKT68 “Töövahendite raamistik tekstikorpustest teadmuse tuletamiseks (1.01.2015−31.12.2016)”, Raul Sirel, STACC OÜ.
ETF9124 “Suhtlusagendi modelleerimine ja Eesti dialoogikorpus (1.01.2012−31.12.2014)”, Mare Koit, Tartu Ülikool, Matemaatika-informaatikateaduskond.
EKT5 “Eestikeelse dialoogi pragmaatika analüsaator (1.01.2011−31.12.2013)”, Mare Koit, Tartu Ülikool, Matemaatika-informaatikateaduskond.
SF0180078s08 “Loomulike keelte arvutitöötluse formalismide ja efektiivsete algoritmide väljatöötamine ning eesti keelele rakendamine (1.01.2008−31.12.2013)”, Mare Koit, Tartu Ülikool, Matemaatika-informaatikateaduskond.
ETF7503 “Suhtlusstrateegiad suhtlusmudelis: eestikeelse dialoogi modelleerimine arvutil (1.01.2008−31.12.2011)”, Mare Koit, Tartu Ülikool, Matemaatika-informaatikateaduskond.
EKKTT09-65 “Automaatne parafraaside leidmine ning sõnade ja lühifraaside tõlkimine paralleelkorpuste abil (1.01.2009−31.12.2010)”, Maarika Traat, Tartu Ülikool, Matemaatika-informaatikateaduskond.
Äriprojektid
TTJA “E-kirjade automaatmärgendamine 2”, 2021-2022, TEXTA OÜ.
MKM “Bürokrati juturobot 1 & 2”, 2020-2021, TEXTA OÜ.
MKM “Bürokratt - e-kirjade automaatmärgendamine”, 2020-2021, TEXTA OÜ.
TTJA “E-kirjade automaatmärgendamine”, 2020-2021, TEXTA OÜ.
Rahvusraamatukogu “Märksõnastamise KRATT 1 & 2”, 2019-2021, TEXTA OÜ.
HTM “Dokumendiregistri andmelekete tuvastamine tekstianalüüsi kasutades”, 2018,TEXTA OÜ.
Ekspress Grupp “Kommentaaride automaatmodereerimine”, 2019-…, TEXTA OÜ.
RIK “Kohtulahendite automaatne anonümiseerimine”, 2019, TEXTA OÜ.
Õhtuleht “Artiklite automaatmärgendamine”, 2018, TEXTA OÜ.
Äripäev “Artiklite automaatmärgendamine”, 2018, TEXTA OÜ.
CV Online “Tööpakkumiste ja elulookirjelduste soovitusmootor”, 2017, TEXTA OÜ.
Õhtuleht “Kommentaaride automaatmodereerimine”, 2016, STACC OÜ.
Juhendatud väitekirjad
Katrin Valdson, magistrikraad, 2016, (juh) Raul Sirel; Aleksandr Tkatšenko, Mustripõhine informatsiooni eraldamine Eesti kohtulahenditest, Tartu Ülikool, Loodus- ja täppisteaduste valdkond, arvutiteaduse instituut.
Õpetamine
2015 Loomuliku keele töötlus Pythonis (kursus)
2014 Korpuslingvistika (kursus)
Publikatsioonid
Asula, Marit; Makke, Jane; Freienthal, Linda; Kuulmets, Hele-Andra; Sirel, Raul (2021). Kratt: Developing an Automatic Subject Indexing Tool for the National Library of Estonia. Cataloging & Classification Quarterly, 1−19. DOI: 10.1080/01639374.2021.1998283.
Vaik, Kristiina; Asula, Marit; Sirel, Raul (2020). Hybrid Tagger – An Industry-driven Solution for Extreme Multi-label Text Classification. In: Proceedings of the LREC2020 Industry Track (26−30). Language Resources and Evaluation Conference (LREC 2020), Marseille, 11–16 May 2020. European Language Resources Association (ELRA). DOI: 10.5281/zenodo.4306169.
Suominen, Hanna; Johnson, Maree; Zhou, Liyuan; Sanchez, Paula; Sirel, Raul; Basilakis, Jim; Hanlen, Leif; Estival, Dominique; Dawson, Linda; Kelly, Barbara (2015). Capturing patient information at nursing shift changes: methodological evaluation of speech recognition and information extraction. Journal of the American Medical Informatics Association, 22 (E1), E48−E66.10.1136/amiajnl-2014-002868.
Sirel, Raul (2013). Meetodeid tekstide leksikaalsete ja grammatiliste erinevuste tuvastamiseks meditsiiniliste tarbetekstide näitel. Eesti Rakenduslingvistika Ühingu aastaraamat, 9, 265−278. DOI: 10.5128/ERYa9.17.
Reisberg, S; Sirel, R; Kalda, R; Merzin, M; Pruulmann, J; Vilo, J (2013). Elektrooniliste terviselugude analüüsimise võimalused Tartu perearstide infosüsteemi näitel. Eesti Arst, 92 (8), 452−459.
Sirel, Raul (2013). Morphostatistical Approach to Medical Document Classification. Proceedings of the 4th International Louhi Workshop on Health Document Text Mining and Information Analysis (Louhi 2013): 11-12 Feb 2013 Sydney. Ed. Suominen, Hanna.
Sirel, R. (2012). Knowledge Acquisition Tool for Dialogue Systems. Frontiers in Artificial Intelligence and Applications, 247: Human Language Technologies – The Baltic Perspective, 4.-5. Oct Tartu. Ed. Arvi Tavast, Kadri Muischnek, Mare Koit. Amsterdam: IOS Press, 201−205.
Sirel, Raul (2012). Dynamic User Interfaces for Synchronous Encoding and Linguistic Uniforming of Textual Clinical Data. Frontiers in Artificial Intelligence and Applications, 247: Human Language Technologies – The Baltic Perspective, 4.-5. Oct Tartu. Ed. Arvi Tavast, Kadri Muischnek, Mare Koit. Amsterdam: IOS Press, 206−212.
Muischnek, K.; Kaalep, H.-J.; Sirel, R. (2011). Korpuslingvistiline lähenemine eesti internetikeele automaatsele morfoloogilisele analüüsile. Metslang, H.; Langemets, M.; Sepper, M.-M. (Toim.). Eesti Rakenduslingvistika Ühingu aastaraamat (111−127). . Tallinn: Eesti Rakenduslingvistika Ühing. DOI: 10.5128/ERYa7.07.