Siirry sisältöön
Tutkimusaineistojen hakupalvelu
FI|EN

Etsi aineistoa

Löytyi 40 aineistoa
  • Metatiedot: 2/5

    Inkeroisen korpus (UHLCS)

    The corpus is available in Kielipankki - the Language Bank of Finland (taito-shell.csc.fi, access rights instructions: http://www.kielipankki.fi/access). The Ingrian text corpus on Heva dialect consists of samples collected by Arvo Laanest. The texts were published in A. Laanest (1966). Isuri murdetekste : Izhorskie dialektnye teksty. Tallinn. 242 pp....
  • Metatiedot: 2/5

    KOTUS Finnish-Swedish Parallel Corpus

    Suomen ja suomenruotsin tekstejä sisältävä rinnakkaiskorpus sisältää yritysten tiedotteita, katsauksia ja kertomuksia sekä lakeja ja asetuksia samoin kuin hallituksen esityksiä eduskunnalle. Korpus on koottu Kotimaisten kielten keskuksessa (Kotus), ja se on valmistunut vuonna 2005. Päätekijä on ollut Alexander Paile (Kotus). Hänen lisäkseen työhön ovat...
  • Metatiedot: 2/5

    Nenetsin korpus (UHLCS)

    The corpus is available in Kielipankki - the Language Bank of Finland (taito-shell.csc.fi, access rights instructions: http://www.kielipankki.fi/access). Contents: Fragments of the Gospel of Luke in the Nenets Language. Translation: Barmich, Mariya Yakovlevna. ISBN 91-88794-05-9. 32 pp. Institute for Bible Translation. Stockholm 1995. The Nenets...
  • Metatiedot: 2/5

    Suomen kielen tekstikokoelma

    Aineisto on saatavilla Kielipankissa (https://korp.csc.fi/#?corpus=ftc), lataus: http://urn.fi/urn:nbn:fi:lb-2014052719 Suomen kielen tekstikokoelma sisältää kirjoitettuja tekstejä 1990-luvulta muun muassa Helsingin Sanomista, Karjalaisesta, Kauppalehdestä, Tekniikan Maailmasta sekä WSOY:n kauno- ja tietokirjoista. Koko aineisto on käytettävissä...
  • Metatiedot: 2/5

    Viron korpus 1 (UHLCS)

    The corpus is available in Kielipankki - the Language Bank of Finland (taito-shell.csc.fi, access rights instructions: http://www.kielipankki.fi/access). The corpus contains excerpts from articles published in Estonian newspapers, magazines, and novels. Estonian Corpus 1 is a part of the Multilingual Resource Collection of the UHLCS. UHLCS has many...
  • Metatiedot: 3/5

    SFNET-keskusteluryhmäkorpuksen Helsinki-Korp-versio

    The resource, a variant of SFNET Corpus (http://urn.fi/urn:nbn:fi:lb-20150126), will be made available at korp.csc.fi
  • Metatiedot: 2/5

    Suomen korpus (raamatut) (UHLCS)

    Aineisto on saatavilla Kielipankin sovelluspalvelimella (taito-shell.csc.fi, käyttöoikeuksien hakemisesta ks. https://www.kielipankki.fi/kayttajaksi/). Suomen kielen korpuksiin kuuluu kaksi versiota Raamatusta. Toinen on vuodelta 1938 ja toinen vuodelta 1992. Suomen korpus on osa UHLCS-kokoelmaa. UHLCS:llä on monta eri omistajaa. Kokoelmaan liittyvistä...
  • Metatiedot: 2/5

    PERSO Databases for Finnish Speech Synthesis

    The PERSO speech database is the result of two research projects: Personalized Hidden Markov Modeling –based Text-To-Speech Synthesis: Assistive Technology for People with Communication Disabilities (funded by Tekes) and Adaptive spatial model for vocal expression: emotional speech synthesis for Finnish (funded by Academy of Finland). The projects were...
  • Metatiedot: 2/5

    FinStud86 Corpus

    Finnish language essays / compositions written by Finnish-speaking students taking the matriculation examination in 1986. The corpus is available in Kielipankki - the Language Bank of Finland in Korp (https://korp.csc.fi/). Corpus access instruction: https://www.kielipankki.fi/support/corpus-location/ (in Finnish:...
  • Metatiedot: 2/5

    Studentsvenska 79-80 Corpus

    Swedish language essays / compositions written by Finnish-speaking students taking the Matriculation examination in 1979-80; tagged in a number of ways. The corpus is available available in Kielipankki - the Language Bank of Finland in Korp (http://urn.fi/urn:nbn:fi:lb-2016081701). Access rights instructions: https://www.kielipankki.fi/support/access (in...
  • Metatiedot: 2/5

    Komisyrjäänin korpus (UHLCS)

    The corpus is available in Kielipankki - the Language Bank of Finland (taito-shell.csc.fi, access rights instructions: http://www.kielipankki.fi/access). Contents: 1. Jesus Friend of Children. ISBN 91-88394-64-6, ISBN 952-9790-13-9. Institute for Bible Translation. Stockholm & Helsinki 1994. 65 pp. Document type: running text. Size of the corpus:...
  • Metatiedot: 2/5

    Digitaalinen muoto-opin arkisto

    Arkisto on saatavilla Kielipankissa, http://urn.fi/urn:nbn:fi:lb-2016032102 DMA:ssa on 401 729 signumoitua eli morfologisesti koodattua lause-esimerkkiä 160 pitäjänmurteesta. Lause-esimerkkien tietokanta on käytettävissä Creative Commons Nimeä 4.0 Kansainvälinen -lisenssillä. DMA:n sanalippuihin (http://urn.fi/urn:nbn:fi:lb-2016032101) voi tarvittaessa...
  • Metatiedot: 2/5

    Suomen kielen tekstikokoelman Helsinki-Korp-versio

    The resource is available in Kielipankki - the Language Bank of Finland. After gaining access rights via https://lbr.csc.fi/ you can find the corpus in Korp (https://korp.csc.fi) by clicking on the direct link http://urn.fi/urn:nbn:fi:lb-2016112317 License information: http://urn.fi/urn:nbn:fi:lb-20150304137 For more information see...
  • Metatiedot: 2/5

    Hantin korpus (pohjoishantin aineistot ja käännökset) (UHLCS)

    The corpus is available in Kielipankki - the Language Bank of Finland (taito-shell.csc.fi, access rights instructions: http://www.kielipankki.fi/access). The Khanty computer corpus contains the following sub-corpora: Khanty, Atlym dialect, 519 words, 3967 characters Khanty, Kazym dialect, 62766 words, 585659 characters Khanty, Konda dialect, 1115 words,...
  • Metatiedot: 2/5

    Tšuvassin korpus (UHLCS)

    Aineisto on saatavilla Kielipankin sovelluspalvelimella (taito-shell.csc.fi, käyttöoikeuksien hakemisesta ks. https://www.kielipankki.fi/kayttajaksi/). Tšuvassin korpus sisältää seuraavat dokumentit: Gebräuche und Volksdichtung der Tschuwassen. Gesammelt von Heikki Paasonen, herausgeben von Eino Karahka und Matti Räsänen. Mémoires de la Société...
  • Metatiedot: 2/5

    Englannin korpus (UHLCS)

    The corpus is available in Kielipankki - the Language Bank of Finland (taito-shell.csc.fi, access rights instructions: http://www.kielipankki.fi/access). The English Corpus is a part of the UHLCS corpus collection. Contents: The English Gutenberg Corpora (for more information on the Gutenberg corpora, cf. the following web-addresses: (1)...
  • Metatiedot: 2/5

    Lyydin korpus (UHLCS)

    The corpus is available in Kielipankki - the Language Bank of Finland (taito-shell.csc.fi, access rights instructions: http://www.kielipankki.fi/access). The corpus contains samples of folklore of the Lude (Ludian) dialect of Karelian. The data is based on audio tape recordings. The corpus was donated to the University of Helsinki Language Corpus Server...
  • Metatiedot: 2/5

    Collection of OTA Texts in Public Use

    This is a snapshot of the Oxford Text Archive, for testing purposes. For more up-to-date versions of the archive see http://ota.ox.ac.uk/ The snapshot is available in Kielipankki - the Language Bank of Finland (taito-shell.csc.fi, /appl/kielipankki/ota). For information regarding corpus access contact kielipankki@csc.fi
  • Metatiedot: 2/5

    Oulun korpus

    Aineisto on saatavilla Kielipankin sovelluspalvelimella (taito-shell.csc.fi, käyttöoikeuksien hakemisesta ks. http://www.kielipankki.fi/KielipankkiKayttooikeudet). Oulun korpus on 1960-luvun suomen yleiskielen sähköinen tutkimusaineisto, joka on tutkimuskeskuksessa muunnettu SGML-muotoon. Ulkopuoliset tutkijat voivat käyttää Oulun korpusta...
  • Metatiedot: 2/5

    Helsinki Corpus of Swahili 2.0 (HCS 2.0)

    Helsinki Corpus of Swahili 2.0 is now available for research purposes in Kielipankki - the Language Bank of Finland. The corpus contains about 25 million words of written text, and it is available in two formats. The annotated version contains morphological and syntactic annotation as well as glosses in English. The not annotated version contains plain...