`In English `_ Raul Sirel ========== .. image:: img/raul.png :width: 200 Üldine ###### * Sünniaeg: 14.11.1986 * E-mail: rsirel@texta.ee * Telefon: Ei tea numbrit? E-kiri on lahendus! * Uurimishuvid: keeletehnoloogia, masinõpe, ajalugu, geograafia. Teenistuskäik ############# * 01.01.2017–... TEXTA OÜ, Tehnoloogiajuht; asutaja (1,00) * 01.05.2015–31.12.2016 STACC OÜ, Projektijuht (1,00) * 01.09.2013–31.12.2013 Lääne-Sydney Ülikool, Külalisteadur (0,50) * 01.09.2013–31.12.2013 NICTA Canberra Uurimislabor, Külalisteadur (0,50) * 01.07.2011–30.04.2015 STACC OÜ, Teadur (1,00) * 15.11.2010–30.06.2011 STACC OÜ, Teadur (0,50) Haridustee ########## * 2011–... Tartu Ülikool, doktoriõpe, üldkeeleteadus * 2009–2011 Tartu Ülikool, humanitaarteaduste magister (MA), arvutilingvistika * 2006–2009 Tartu Ülikool, humanitaarteaduste bakalaureus (BA), arvutilingvistika * 2003–2006 Tallinna Tehnikagümnaasium Kvalifikatsioon ############### Akadeemiline kraad ****************** * Raul Sirel, magistrikraad, 2011, (juh) Margus Treumuth, Poolautomaatne teadmusbaaside konstrueerimine dialoogsüsteemidele, Tartu Ülikool. * Raul Sirel, doktorant, (juh) Kadri Muischnek; Jaak Vilo, Eestikeelsete terviselugude andmekaeve, Tartu Ülikool. Täiendkoolitused ***************** * 2014 - 13th Estonian Summer School on Computer and Systems Science * 2013 - Lisbon Machine Learning Summer School (LxMLS) * 2013 - 12th Estonian Summer School on Computer and Systems Science * 2013 - Australian Health Informatics Summer School * 2012 - 11th Estonian Summer School on Computer and Systems Science Projektid ######### Teadusprojektid *************** * EMBEDDIA "Cross-Lingual Embeddings for Less-Represented Languages in European News Media", TEXTA OÜ, H2020: https://cordis.europa.eu/project/id/825153. * TAR16013 (EXCITE) "IT Tippkeskus EXCITE (1.09.2016−1.03.2023)", Maarja Kruusmaa, Tallinna Tehnikaülikool, Infotehnoloogia teaduskond, Biorobootika keskus, Cybernetica AS. * EKTR3 "TEXTA Toolkit 2.0 (1.01.2018−31.12.2020)", Raul Sirel, TEXTA OÜ. * IUT34-4 "Andmeteaduse meetodid ja rakendused (DSMA) (1.01.2015−31.12.2020)", Jaak Vilo, Tartu Ülikool, Loodus- ja täppisteaduste valdkond, arvutiteaduse instituut. * EKT108 "TEXTA tööriistakomplekti jätkuarendus ja juurutamine (1.01.2017−31.12.2017)", Raul Sirel, TEXTA OÜ. * EKT68 "Töövahendite raamistik tekstikorpustest teadmuse tuletamiseks (1.01.2015−31.12.2016)", Raul Sirel, STACC OÜ. * ETF9124 "Suhtlusagendi modelleerimine ja Eesti dialoogikorpus (1.01.2012−31.12.2014)", Mare Koit, Tartu Ülikool, Matemaatika-informaatikateaduskond. * EKT5 "Eestikeelse dialoogi pragmaatika analüsaator (1.01.2011−31.12.2013)", Mare Koit, Tartu Ülikool, Matemaatika-informaatikateaduskond. * SF0180078s08 "Loomulike keelte arvutitöötluse formalismide ja efektiivsete algoritmide väljatöötamine ning eesti keelele rakendamine (1.01.2008−31.12.2013)", Mare Koit, Tartu Ülikool, Matemaatika-informaatikateaduskond. * ETF7503 "Suhtlusstrateegiad suhtlusmudelis: eestikeelse dialoogi modelleerimine arvutil (1.01.2008−31.12.2011)", Mare Koit, Tartu Ülikool, Matemaatika-informaatikateaduskond. * EKKTT09-65 "Automaatne parafraaside leidmine ning sõnade ja lühifraaside tõlkimine paralleelkorpuste abil (1.01.2009−31.12.2010)", Maarika Traat, Tartu Ülikool, Matemaatika-informaatikateaduskond. Äriprojektid ************ * TTJA "E-kirjade automaatmärgendamine 2", 2021-2022, TEXTA OÜ. * MKM "Bürokrati juturobot 1 & 2", 2020-2021, TEXTA OÜ. * MKM "Bürokratt - e-kirjade automaatmärgendamine", 2020-2021, TEXTA OÜ. * TTJA "E-kirjade automaatmärgendamine", 2020-2021, TEXTA OÜ. * Rahvusraamatukogu "Märksõnastamise KRATT 1 & 2", 2019-2021, TEXTA OÜ. * HTM "Dokumendiregistri andmelekete tuvastamine tekstianalüüsi kasutades", 2018,TEXTA OÜ. * Ekspress Grupp "Kommentaaride automaatmodereerimine", 2019-..., TEXTA OÜ. * RIK "Kohtulahendite automaatne anonümiseerimine", 2019, TEXTA OÜ. * Õhtuleht "Artiklite automaatmärgendamine", 2018, TEXTA OÜ. * Äripäev "Artiklite automaatmärgendamine", 2018, TEXTA OÜ. * CV Online "Tööpakkumiste ja elulookirjelduste soovitusmootor", 2017, TEXTA OÜ. * Õhtuleht "Kommentaaride automaatmodereerimine", 2016, STACC OÜ. Juhendatud väitekirjad ###################### * Katrin Valdson, magistrikraad, 2016, (juh) Raul Sirel; Aleksandr Tkatšenko, Mustripõhine informatsiooni eraldamine Eesti kohtulahenditest, Tartu Ülikool, Loodus- ja täppisteaduste valdkond, arvutiteaduse instituut. Õpetamine ######### * 2023 `Sissejuhatus masinõppesse (loeng) `_ * 2015 Loomuliku keele töötlus Pythonis (kursus) * 2014 Korpuslingvistika (kursus) Publikatsioonid ############### * Asula, Marit; Makke, Jane; Freienthal, Linda; Kuulmets, Hele-Andra; Sirel, Raul (2021). Kratt: Developing an Automatic Subject Indexing Tool for the National Library of Estonia. Cataloging & Classification Quarterly, 1−19. DOI: 10.1080/01639374.2021.1998283. * Vaik, Kristiina; Asula, Marit; Sirel, Raul (2020). Hybrid Tagger – An Industry-driven Solution for Extreme Multi-label Text Classification. In: Proceedings of the LREC2020 Industry Track (26−30). Language Resources and Evaluation Conference (LREC 2020), Marseille, 11–16 May 2020. European Language Resources Association (ELRA). DOI: 10.5281/zenodo.4306169. * Suominen, Hanna; Johnson, Maree; Zhou, Liyuan; Sanchez, Paula; Sirel, Raul; Basilakis, Jim; Hanlen, Leif; Estival, Dominique; Dawson, Linda; Kelly, Barbara (2015). Capturing patient information at nursing shift changes: methodological evaluation of speech recognition and information extraction. Journal of the American Medical Informatics Association, 22 (E1), E48−E66.10.1136/amiajnl-2014-002868. * Sirel, Raul (2013). Meetodeid tekstide leksikaalsete ja grammatiliste erinevuste tuvastamiseks meditsiiniliste tarbetekstide näitel. Eesti Rakenduslingvistika Ühingu aastaraamat, 9, 265−278. DOI: 10.5128/ERYa9.17. * Reisberg, S; Sirel, R; Kalda, R; Merzin, M; Pruulmann, J; Vilo, J (2013). Elektrooniliste terviselugude analüüsimise võimalused Tartu perearstide infosüsteemi näitel. Eesti Arst, 92 (8), 452−459. * Sirel, Raul (2013). Morphostatistical Approach to Medical Document Classification. Proceedings of the 4th International Louhi Workshop on Health Document Text Mining and Information Analysis (Louhi 2013): 11-12 Feb 2013 Sydney. Ed. Suominen, Hanna. * Sirel, R. (2012). Knowledge Acquisition Tool for Dialogue Systems. Frontiers in Artificial Intelligence and Applications, 247: Human Language Technologies – The Baltic Perspective, 4.-5. Oct Tartu. Ed. Arvi Tavast, Kadri Muischnek, Mare Koit. Amsterdam: IOS Press, 201−205. * Sirel, Raul (2012). Dynamic User Interfaces for Synchronous Encoding and Linguistic Uniforming of Textual Clinical Data. Frontiers in Artificial Intelligence and Applications, 247: Human Language Technologies – The Baltic Perspective, 4.-5. Oct Tartu. Ed. Arvi Tavast, Kadri Muischnek, Mare Koit. Amsterdam: IOS Press, 206−212. * Muischnek, K.; Kaalep, H.-J.; Sirel, R. (2011). Korpuslingvistiline lähenemine eesti internetikeele automaatsele morfoloogilisele analüüsile. Metslang, H.; Langemets, M.; Sepper, M.-M. (Toim.). Eesti Rakenduslingvistika Ühingu aastaraamat (111−127). . Tallinn: Eesti Rakenduslingvistika Ühing. DOI: 10.5128/ERYa7.07.