Siirry sisältöön
Tutkimusaineistojen hakupalvelu
FI|EN

TÄRKEÄÄ TIETOA ETSIMEN KÄYTÖSTÄ! Vanha Etsin -palvelu (etsin.avointiede.fi) siirtyy osaksi uudistettua Etsin -palvelua (etsin.fairdata.fi) heinäkuun alussa 2019. CSC siirtää kaikki vanhassa Etsimessä JULKAISTUT aineistot uuteen Etsimeen.
Aineistojen kuvailu päättyy vanhassa Etsimessä 12.6.2019. Aineistot kuvailaan jatkossa uuteen Etsimeen uuden Qvain -palvelun avulla, joka otetaan käyttöön heinäkuun 2019 alussa.
Huom! Muista julkaista aineistosi, jos haluat niiden siirtyvän uuteen Etsimeen.

Etsi aineistoa

Löytyi 9 872 aineistoa
Lisää kategorioita…
  • Metatiedot: 2/5

    Parsed Corpus of Early English Correspondence

    The Parsed Corpus of Early English Correspondence contains 4970 personal letters by 666 writers, altogether 2.2 million words of running text from the years 1410-1681. The letters have been selected to be as socially representative of the literate social ranks of the time as possible. In addition to the flat text version, the corpus has also been provided...
  • Metatiedot: 2/5

    FinDialogue - spontaanin suomenkielisen puheen korpus

    The FinDialogue corpus is a subcorpus of FinINTAS. FinDialogue consists of ten spontaneous dialogues between friends, duration 45-55 minutes each. The corpus includes audio files (WAV) and phonetic annotation files (Praat TextGrid). FinDialogue will be made available at http://lat.csc.fi in the near future, along with FinRead. The dialogues are numbered...
  • Metatiedot: 3/5

    Helsingin puhekielen pitkittäiskorpus (1970, 1990, 2010)

    Korpus on saatavilla Kielipankin LAT-alustalla, http://urn.fi/urn:nbn:fi:lb-100110016072. Pääsy aineistoon edellyttää henkilökohtaista käyttöoikeutta, jota haetaan Kielipankin kautta. Kielivaran käyttötarkoitus tulee määritellä tutkimussuunnitelmassa. Aineiston käyttöä rajoitetaan siinä esiintyvien henkilöiden yksityisyyden suojaamiseksi. Lisenssiteksti...
  • Metatiedot: 2/5

    Helsingin puhekielen pitkittäiskorpuksen (1970, 1990, 2010) LAT-versio 2

    The corpus, which is the LAT version of The Longitudinal Corpus of Finnish Spoken in Helsinki (1970s, 1990s and 2010s), version 2, will be made available in Kielipankki - the Language Bank of Finland. For more information, see Documentation.
  • Metatiedot: 2/5

    Elias Lönnrotin kirjeenvaihto

    The corpus consists of the correspondence of Elias Lönnrot with private individuals as well as institutions from 1823 until Lönnrot's death. Elias Lönnrot was the creator of the Kalevala, medical doctor and professor of language (1802 – 1884). The letters and drafts of letters belong to the Archive of the Finnish Literature Society and have been...
  • Metatiedot: 2/5

    Kotimaisten kielten keskuksen aikakauslehtikorpus, tarkistettu

    This sub-corpus of the The Magazine Corpus of the Institute for the Languages of Finland contains the data, where the OCR (optical character recognition) has been checked. The size of this sub-corpus is 670 000 tokens. It contains one 1935 issue from 'Historiallinen Aikakauskirja', 'Lakimies' and 'Suomi', as well as 4 issues of 'Suomen Kuvalehti' from...
  • Metatiedot: 2/5

    Oulun korpus

    Aineisto on saatavilla Kielipankin sovelluspalvelimella (taito-shell.csc.fi, käyttöoikeuksien hakemisesta ks. http://www.kielipankki.fi/KielipankkiKayttooikeudet). Oulun korpus on 1960-luvun suomen yleiskielen sähköinen tutkimusaineisto, joka on tutkimuskeskuksessa muunnettu SGML-muotoon. Ulkopuoliset tutkijat voivat käyttää Oulun korpusta...
  • Metatiedot: 3/5

    Lauseopin arkiston murrekorpus

    Korpus on saatavilla Kielipankissa (Korpissa oleva versio: http://urn.fi/urn:nbn:fi:lb-2014052715; LATissa oleva versio: http://urn.fi/urn:nbn:fi:lb-1001100111532) lisenssillä CC BY ND 4.0.; latauspalvelussa oleva versio: http://urn.fi/urn:nbn:fi:lb-2019092001) 142 äänitteestä ja niihin liittyvistä XML-, EAF- ja TextGrid-muotoisista annotaatiotiedostoista...
  • Metatiedot: 3/5

    Vapaaehtoistyö Suomessa 2018

    Aineisto käsittelee vapaaehtoistyötä Suomessa. Tutkimuksen on toteuttanut Taloustutkimus Kansalaisareenan, Opintokeskus Siviksen ja Kirkkohallituksen toimeksiannosta. Tutkimuksen alussa kartoitettiin, kuinka monta tuntia vapaaehtoistyötä vastaaja on tehnyt eri toimialoilla, liittyen muun muassa liikuntaan ja urheiluun, vertaistukeen ja ikäihmisiin....
  • Metatiedot: 1/5

    Käännössuomen korpus

    Käännössuomen korpus on koostettu vuonna 1999 nykyisessä Itä-Suomen yliopistossa (silloisessa Joensuun yliopistossa sen kansainvälisen viestinnän laitoksella) Suomen Akatemian professori Anna Maurasen johtamassa tutkimushankkeessa Käännössuomi ja kääntämisen universaalit. Korpus sisältää kaksi osaa: aluperin suomeksi kirjoitettua kieltä (supisuomi) ja...
  • Metatiedot: 2/5

    Suomalaisen viittomakielen korpus: keskusteluaineisto, ladattava versio

    This subcorpus is part of the Corpus of Finnish Sign Language collected in the CFINSL project. The subcorpus comprises conversations from 18 Finnish Sign Language signers who belong to different age groups and live in different parts of Finland. The material covers four fixed tasks performed by the signers: introductions, discussing work/hobbies,...
  • Metatiedot: 2/5

    Kotimaisten kielten keskuksen aikakauslehtikorpus

    Korpus sisältää neljän aikakauslehden (Suomen Kuvalehti, Historiallinen aikakauskirja, Lakimies ja Suomi) eri vuosikertoja. Aineisto julkaistaan Korpissa (https://korp.csc.fi/). Korpuksessa on neljän 1900‐luvulla ilmestyneen aikakauslehden vuosikertoja: Historiallisen Aikakauskirjan, Lakimiehen, Suomen Kuvalehden ja Suomen. Aikakauslehtiä on yhteensä 385,...
  • Metatiedot: 2/5

    Paul Sinebrychoffin kirjekorpuksen Kielipankki-version suomenkielinen osakorpus

    The sub-corpus is available in Kielipankki - the Language Bank of Finland (korp.csc.fi) at http://urn.fi/urn:nbn:fi:lb-2016092702 For more information see http://urn.fi/urn:nbn:fi:lb-201407303
  • Metatiedot: 2/5

    Kotimaisten kielten keskuksen aikakauslehtikorpus, tarkistamaton, ladattava v...

    The resource is a sub-corpus of The Magazine Corpus of the Institute for the Languages of Finland, where the OCR has not been checked. The resource will be made available at http://kielipankki.fi/download.
  • Metatiedot: 2/5

    Lauseopin arkisto

    Lauseopin arkisto koostuu kaikkiaan 172:sta morfologisesti ja syntaktisesti koodatusta aineistoyksiköstä (joista 142 kuuluu aineistoon Lauseopin arkiston murrekorpus) ja aineiston käytön mahdollistavasta ohjelmasta. Lisätietoja aineistosta. http://www.utu.fi/fi/yksikot/hum/yksikot/suomi-sgr/palvelut-yhteistyo/arkistot/Sivut/home.aspx log 25.11.2018 linkki...
  • Metatiedot: 2/5

    Murteenseuruukorpus

    Aineisto on saatavilla Kielipankin LAT-alustalla http://urn.fi/urn:nbn:fi:lb-100110017700, lisenssi CLARIN RES +PLAN+PRIV (ks. http://urn.fi/urn:nbn:fi:lb-2015041307). Korpuksen käyttäminen edellyttää henkilökohtaista käyttöoikeutta. Käyttötarkoitus on kuvattava tutkimussuunnitelmassa. Käyttöoikeuden hakeminen: Kielipankin käyttöoikeusjärjestelmien...
  • Metatiedot: 2/5

    Opusparcus: Open Subtitles Paraphrase Corpus for Six Languages (version 1.0)

    Opusparcus is a paraphrase corpus for six European languages: German, English, Finnish, French, Russian, and Swedish. The paraphrases are extracted from the OpenSubtitles2016 corpus, which contains subtitles from movies and TV shows. The data in Opusparcus has been extracted from OpenSubtitles2016 (http://opus.nlpl.eu/OpenSubtitles2016.php), which is in...
  • Metatiedot: 2/5

    Suomen kielen verbaalisia koloratiivikonstruktioita

    The resource contains Finnish verbal colorative constructions from the database of the word notes used when creating the dictionaries Nykysuomen sanakirja and Kielitoimiston sanakirja (http://www.kielitoimistonsanakirja.fi/), from various literary works, from a query test made by Maria-Magdalena Jürvetson as well as from different Internet sources. The...
  • Metatiedot: 2/5

    Mikael Agricolan teosten morfosyntaktinen tietokanta

    Tietokannan hakuliittymä on Kielipankin Korp (http://korp.csc.fi/). Aineisto on julkaistu beta-versiona: http://urn.fi/urn:nbn:fi:lb-201803273. Mikael Agricolan teosten morfosyntaktinen tietokanta on Mikael Agricolan teosten (Abckiria, Rukouskiria, Se Wsi testamenti, Käsikiria, Messu, Piina, Psaltari, Veisut, Profeetat) suomenkieliset osat käsittävä...
  • Metatiedot: 3/5

    Koltansaamen dokumentaatiokorpus (2016)

    Aineisto koostuu Kotimaisten kielten keskuksen tekemistä koltansaamenkielisistä nauhoituksista, jotka on annotoitu Helsingin yliopistossa Matti Miestamon johtamassa Koltansaamen dokumentaatiohankkeessa (nykykielten laitos, yleinen kielitiede). Annotaatioihin kuuluu litteraatio ja suomenkielinen käännös ja suuressa osassa nauhoista myös englanninkielinen...