Siirry sisältöön
Tutkimusaineistojen hakupalvelu
FI|EN

Etsi aineistoa

Löytyi 7 731 aineistoa
Lisää kategorioita…
  • Metatiedot: 2/5

    Relative frequencies of part-of-speech n-grams in native and translated Finni...

    These files contain data from Matias Tamminen's MA thesis study "Then shall I know fully: Relative frequencies of part-of-speech n-grams in native and translated Finnish literary prose" by Matias Tamminen (2018), University of Helsinki. The material will be available at the Language Bank of Finland (Kielipankki) download service, access location...
  • Metatiedot: 4/5

    Pääkaupunkiseudun matka-aikamatriisi 2018

    Pääkaupunkiseudun matka-aikamatriisi käsittää matka-aika- ja etäisyystiedot kävellen, pyöräillen, joukkoliikenteellä ja autolla kaikista pääkaupunkiseudun YKR-ruuduista (13 231 kpl) kaikkiin pääkaupunkiseudun YKR-ruutuihin (13 231 kpl). Sovellus aineistoon tutustumiseksi ja lataamiseksi: http://www.mapple.fi/ Koordinaattijärjestelmä: ETRS-TM35FIN...
  • Metatiedot: 3/5

    Automatic Speaker Verification Spoofing and Countermeasures Challenge (ASVspo...

    The database has been used in the first Automatic Speaker Verification Spoofing and Countermeasures Challenge (ASVspoof 2015). Genuine speech is collected from 106 speakers (45 male, 61 female) and with no significant channel or background noise effects. Spoofed speech is generated from the genuine data using a number of different spoofing algorithms. The...
  • Metatiedot: 3/5

    The Voice Conversion Challenge 2018: database and results

    Voice conversion (VC) is a technique to transform a speaker identity included in a source speech waveform into a different one while preserving linguistic information of the source speech waveform. In 2016, we have launched the Voice Conversion Challenge (VCC) 2016 at Interspeech 2016. The objective of the 2016 challenge was to better understand...
  • Metatiedot: 2/5

    Suomen kielen puupankki 3

    The corpus is available in Kielipankki - the Language Bank of Finland (https://korp.csc.fi), http://urn.fi/urn:nbn:fi:lb-2016051001 and downloadable at http://urn.fi/urn:nbn:fi:lb-2016011501 The FinnTreeBank project is creating a treebank and a parsebank for Finnish. This work is licensed under Creative Commons Attribution 3.0. log 26.11.2018 link...
  • Metatiedot: 2/5

    Kansalliskirjaston klassikkokirjasto - Kielipankki-versio

    This corpus comprises works written in Finnish and Swedish, which are part of the Classics Library of the National Library of Finland and have been published under the license Public Domain. The data set in Finnish includes 686 works and the data set in Swedish includes 282 works out of the whole data set of 968 works in Finnish and Swedish, gathered...
  • Metatiedot: 2/5

    Kansalliskirjaston klassikkokirjaston suomenkielinen osakorpus - Kielipankin ...

    This corpus will be made available for Download in Kielipankki - the Language Bank of Finland. It comprises works written in Finnish, which are part of the Classics Library of the National Library of Finland and published under the license Public Domain. The data set in Finnish includes 686 works out of the whole data set of 968 works in Finnish and...
  • Metatiedot: 2/5

    Kansalliskirjaston klassikkokirjaston ruotsinkielinen osakorpus - Kielipankki...

    This corpus will be made available for the interface Korp in Kielipankki - the Language Bank of Finland (korp.csc.fi). It comprises works written in Swedish, which are part of the Classics Library of the National Library of Finland and published under the license Public Domain. The data set in Swedish includes 282 works out of the whole data set of 968...
  • Metatiedot: 2/5

    Kansalliskirjaston klassikkokirjaston ruotsinkielinen osakorpus - Kielipankin...

    This corpus will be made available for Download in Kielipankki - the Language Bank of Finland. It comprises works written in Swedish, which are part of the Classics Library of the National Library of Finland and published under the license Public Domain. The data set in Swedish includes 282 works out of the whole data set of 968 works in Finnish and...
  • Metatiedot: 3/5

    Raja-Karjalan korpus

    Raja-Karjalan korpus sisältää yht. 119 t 4 min 58 s audiotiedostoja (.wav) sekä niiden suomalais-ugrilaisella tarkekirjoituksella tuotetut transkriptiot, jotka ovat UTF-8-merkistökoodattuja raakatekstitiedostoja (.txt) ja jotka on kohdistettu lausumatasolle äänteitä vastaamattomista merkeistä riisuttuina TextGrid-tiedostoina. Yhteensä aineiston koko on...
  • Metatiedot: 2/5

    Paul Sinebrychoffin kirjekorpuksen Kielipankki-versio

    Paul ja Fanny Sinebrychoff keräsivät Suomen oloissa ainutlaatuisen taidekokoelman. Tähän sähköiseen kirjearkistoon on kerätty ne, vuosina 1895-1909 kirjoitetut kirjeet, jotka käsittelevät kokoelman hankintaa. Kirjearkisto sisältää kirjeenvaihtoa useiden eri asiantuntijoiden ja keräilijöiden kanssa. Oy Sinebrychoff Ab:n myöntämän tuen avulla kirjekokoelma...
  • Metatiedot: 2/5

    Kansalliskirjaston klassikkokirjaston suomenkielinen osakorpus - Kielipankki-...

    This corpus will be made available at korp.csc.fi. It comprises works written in Finnish, which are part of the Classics Library of the National Library of Finland and published under the license Public Domain. The data set in Finnish includes 686 works out of the whole data set of 968 works in Finnish and Swedish, gathered from Doria and processed by...
  • Metatiedot: 2/5

    Suomenkielinen Gutenberg -korpus

    Korpus on saatavilla Kielipankin Korp-alustalla, http://urn.fi/urn:nbn:fi:lb-2014102101. Korpus sisältää Gutenberg-projektin saataville asettamia suomenkielisiä kirjoja. Aineistoa ei ole kieliopillisesti jäsennetty. Luettelo korpuksen sisältämistä teoksista: http://urn.fi/urn:nbn:fi:lb-2014102102
  • Metatiedot: 2/5

    Suomi 24 2001-2014 (näyte) -korpus, Helsinki-Korp-versio

    The resource is available in Kielipankki - the Language Bank of Finland at http://urn.fi/urn:nbn:fi:lb-2015113001 For more information see http://urn.fi/urn:nbn:fi:lb-2015120101
  • Metatiedot: 2/5

    Suomen kielen näytteitä -korpuksen Helsinki-Korp-versio

    The corpus, which is the Korp version of the Samples of Spoken Finnish corpus, is available at http://urn.fi/urn:nbn:fi:lb-2015040101 For more information see http://urn.fi/urn:nbn:fi:lb-201407141
  • Metatiedot: 2/5

    Digitaalinen muoto-opin arkisto

    Arkisto on saatavilla Kielipankissa, http://urn.fi/urn:nbn:fi:lb-2016032102 DMA:ssa on 401 729 signumoitua eli morfologisesti koodattua lause-esimerkkiä 160 pitäjänmurteesta. Lause-esimerkkien tietokanta on käytettävissä Creative Commons Nimeä 4.0 Kansainvälinen -lisenssillä. DMA:n sanalippuihin (http://urn.fi/urn:nbn:fi:lb-2016032101) voi tarvittaessa...
  • Metatiedot: 2/5

    Finnish TreeBank 2

    The FinnTreeBank project is creating a treebank and a parsebank for Finnish. This work is licensed under Creative Commons Attribution 3.0. The second version of the treebank is annotated by hand and based on 17.000 model senctences in the Large Grammar of Finnish VISK - Iso Suomen Kielioppi. Brief samples of text from other sources, e.g. news items and...
  • Metatiedot: 2/5

    Udmurtin besermanin murteen korpus, Kielipankki-versio

    The corpus is available in Kielipankki - the Language Bank of Finland (korp.csc.fi) at http://urn.fi/urn:nbn:fi:lb-2016092601 The Corpus of Beserman Udmurt comprises 65 000 tokens. The Beserman dialect of Udmurt is used in daily communication approximately by 2 000 speakers (according to the 2010 census). The Beserman live in the basin of the Cheptsa...
  • Metatiedot: 2/5

    Finnish Wortschatz

    A Finnish corpus of around 2 million 600 thousand running words collected from all domains from 2002 to 2007. Freely downloadable at http://corpora.informatik.uni-leipzig.de/download.html. log 25.11.2018 link http://islrn.org/resources/514-343-841-340-0 removed
  • Metatiedot: 2/5

    Finnish TreeBank 1

    The example sentences from Iso suomen kielioppi [Large Grammar of Finnish], manually annotated with dependency-syntactic descriptions. This is a Grammar Definition Corpus intended as a model for further automatic analysis of Finnish. The corpus is available in Kielipankki - the Language Bank of Finland. log 25.11.2018 link...