Siirry sisältöön
Tutkimusaineistojen hakupalvelu
FI|EN

TÄRKEÄÄ TIETOA ETSIMEN KÄYTÖSTÄ! Vanha Etsin -palvelu (etsin.avointiede.fi) siirtyy osaksi uudistettua Etsin -palvelua (etsin.fairdata.fi) heinäkuun alussa 2019. CSC siirtää kaikki vanhassa Etsimessä JULKAISTUT aineistot uuteen Etsimeen.
Aineistojen kuvailu päättyy vanhassa Etsimessä 12.6.2019. Aineistot kuvailaan jatkossa uuteen Etsimeen uuden Qvain -palvelun avulla, joka otetaan käyttöön heinäkuun 2019 alussa.
Huom! Muista julkaista aineistosi, jos haluat niiden siirtyvän uuteen Etsimeen.

Etsi aineistoa

Löytyi 9 871 aineistoa
Lisää kategorioita…
  • Metatiedot: 2/5

    STT:n uutisarkisto 1992-2018, Kielipankin Korp-versio

    Aineisto julkaistaan Kielipankin Korp-konkordanssityökalussa ei-kaupalliseen käyttöön, jossa konteksti rajoittuu virkkeeseen tai kappaleeseen. Suomen Tietotoimiston (STT) uutisarkisto sisältää uutisjakelun [lisäys: suomenkieliset] artikkelit, jotka STT on lähettänyt media-asiakkaidensa käytettäväksi vuosina 1992-2018. Arkistossa on yhteensä noin 2,8...
  • Metatiedot: 2/5

    The "Hallituskausi 2007–2011" Translation Memory

    The "Hallituskausi 2007–2011" translation memory is intended for those translating administrative texts between Finnish and English. It includes key policy reports published by the Finnish ministries on their websites. The memory features some 58,000 Finnish-to-English translation segments. The tmx format requires a SDL Trados Studio programme. The...
  • Metatiedot: 2/5

    Suomenkielinen Wikipedia 2017, lähdemateriaali

    Suomenkielinen Wikipedia 2017 lähdemateriaali julkaistaan Kielipankin latauspalvelussa korp.csc.fi/download Aineisto kattaa Wikipedian suomenkielisen artikkelien leipätekstit vuoden 2017 lopulta. Tekstit on eristetty Wikipedian tarjoamista kielikohtaisista kokonaisaineistoista (https://dumps.wikimedia.org/). Aineisto on jaettu arikkeleihin, kappaleisiin...
  • Metatiedot: 2/5

    Suomenkielinen OpenSubtitles 2017, lähdemateriaali

    Suomenkielinen OpenSubtitles 2017 lähdemateriaali julkaistaan Kielipankin latauspalvelussa korp.csc.fi/download Aineisto kattaa Opensubtitles.org sivuston jakamat elokuvien ja tv-ohjelmien suomenkieliset tekstitykset. Aineisto on johdannainen monikielisestä Opensubtitles2018 korpuksesta (http://opus.nlpl.eu/OpenSubtitles2018.php). Aineisto on jaettu...
  • Metatiedot: 1/5

    STT:n uutisarkisto

    The Finnish News Agency Archive corpus comprises newswire articles made public by the Finnish News Agency (STT) during1992 to 2018. The corpora will be available through the corpus interface Korp (korp.csc.fi) as scrambled sentences (CC BY NC) and in the download service as whole texts (CLARIN RES).
  • Metatiedot: 2/5

    Suomenkielinen Wikipedia 2017, Kielipankin Korp-versio

    Aineisto kattaa Wikipedian suomenkielisen artikkelien leipätekstit vuoden 2017 lopulta. Tekstit on eristetty Wikipedian tarjoamista kielikohtaisista kokonaisaineistoista (https://dumps.wikimedia.org/). Aineisto on jaettu arikkeleihin, kappaleisiin ja lauseisiin. Lauseet on morfosyntaktisesti jäsennetty käyttäen Turku Dependenssi -jäsennintä...
  • Metatiedot: 2/5

    Suomenkielinen OpenSubtitles 2017, Kielipankin Korp-versio

    Aineisto kattaa Opensubtitles.org sivuston jakamat elokuvien ja tv-ohjelmien suomenkieliset tekstitykset. Aineisto on johdannainen monikielisestä Opensubtitles2018 korpuksesta (http://opus.nlpl.eu/OpenSubtitles2018.php). Aineisto on jaettu lähteisiin ja lauseisiin. Lauseet on morfosyntaktisesti jäsennetty käyttäen Turku Dependenssi jäsennintä...
  • Metatiedot: 2/5

    1990- ja 2000-luvun suomalaisia aikakaus- ja sanomalehtiä -korpuksen ladattav...

    The resource, containing entire newspaper and magazine articles, has been made available for Download in Kielipankki - the Language Bank of Finland at http://urn.fi/urn:nbn:fi:lb-201712201 The data consists of source data in PDF form or as plain text and is not annotated. An annotated version (lehdet90ff-vrt-v2) is available, see links below Relations on...
  • Metatiedot: 2/5

    Iijoki, Oulun yliopiston Päätalo-kokoelma, Kielipankki Korp -versio

    Iijoki-sarjan kuvaus löytyy sivulta http://urn.fi/urn:nbn:fi:lb-2019041401 ja Oulun yliopiston Päätalo-kokoelman tietosivu Kielipankin sivustolta osoitteesta https://www.kielipankki.fi/aineistot/oulun-yliopiston-paatalo-kokoelma/ Lisenssisivu: http://urn.fi/urn:nbn:fi:lb-2019102106 Aineiston on julkaistu konkordanssityökalu Korpissa...
  • Metatiedot: 1/5

    Iijoki, Oulun yliopiston Päätalo-kokoelma, Kielipankki TDPP Korp-versio

    Iijoki-sarjan kuvaus löytyy sivulta http://urn.fi/urn:nbn:fi:lb-2019041401. Lisenssisivu: http://urn.fi/urn:nbn:fi:lb-2019102106 Sarjan 26 kirjaa on jäsennetty Kielipankissa kahdella eri jäsentimellä. Molemmat julkaistaan Kielipankin Korp-konkordanssipalvelussa (korp.csc.fi). Tämän aineisto on jäsennetty Turku Dependency Parser Pipeline (TDPP)...
  • Metatiedot: 2/5

    Iijoki, Oulun yliopiston Päätalo-kokoelma

    Iijoki-korpus on Oulun yliopiston Kielipankkiin tallettama kirjailija Kalle Päätalon (11.11.1919-20.11.2000) omaelämäkerrallinen pääteos. Päätaloa voidaan luonnehtia ainutlaatuiseksi suomalaisen lähihistorian ja työn kuvaajaksi sekä Koillismaan murteen tallentajaksi. Hänen kirjojensa aiheita olivat muun muassa nälkäaika, pula-ajat, metsätyöt,...
  • Metatiedot: 3/5

    Arkipäivän kokemuksia köyhyydestä: seuranta-aineisto 2012

    Aineisto koostuu 'Arkipäivän kokemuksia köyhyydestä' -kirjoituskilpailuun vuonna 2006 osallistuneiden henkilöiden uusista, vuonna 2012 kirjoittamista kirjoituksista. Kirjoituskutsu lähetettiin valikoidusti vuoden 2006 kirjoituskilpailuun osallistuneille henkilöille. Tarkoituksena oli selvittää, mitä köyhyyskirjoituskilpailuun osallistuneille henkilöille...
  • Metatiedot: 3/5

    Arkipäivän kokemuksia köyhyydestä -kirjoituskilpailu 2006

    Aineisto koostuu "Arkipäivän kokemuksia köyhyydestä" -kirjoituskilpailun kautta kerätyistä teksteistä. Kirjoituksia saapui eri puolilta Suomea, ja kirjoittajat edustavat monipuolisesti eri väestöryhmiä, kuten lapsiperheitä, yksinhuoltajia, mielenterveyskuntoutujia, pitkäaikaissairaita, pienituloisia työntekijöitä, pienyrittäjiä, velkaantuneita,...
  • Metatiedot: 2/5

    Elias Lönnrotin kirjeenvaihdon ruotsinkielinen osakorpus - Kielipankki-versio

    This corpus will be made available at korp.csc.fi. It comprises letters and drafts written in Swedish, which are part of the correspondence corpus 'Elias Lönnrot Letters Online'. The data set in Swedish includes 3354 letters and drafts out of the whole data set of 4511 letters written in Finnish and Swedish. The letters and drafts of letters belong to the...
  • Metatiedot: 2/5

    Elias Lönnrotin kirjeenvaihdon suomenkielinen osakorpus - Kielipankki-versio

    This corpus will be made available at korp.csc.fi. It comprises letters and drafts written in Finnish, which are part of the correspondence corpus 'Elias Lönnrot Letters Online'. The data set in Finnish includes 1157 letters and drafts out of the whole data set of 4511 letters written in Finnish and Swedish. The letters and drafts of letters belong to the...
  • Metatiedot: 2/5

    Lauseopin arkiston murrekorpuksen Helsinki ladattava versio

    The corpus, which is the Download version of The Finnish Dialect Syntax Archive's Helsinki Korp Version (http://urn.fi/urn:nbn:fi:lb-2016040702), is available in Kielipankki - the Language Bank of Finland Download service korp.csc.fi/download under the license CC BY ND 4.0. For more information see the metadata of The Finnish Dialect Syntax Arhive...
  • Metatiedot: 2/5

    1990- ja 2000-luvun suomalaisia aikakaus- ja sanomalehtiä -korpus (VRT), vers...

    The corpus is available for Download in Kielipankki - the Language Bank of Finland The data is annotated and identical to the data used as basis for lehdet90ff-v2. A short documentation of the VRT file format can be found via the Documentation section. Reference instructions: See Attribution Details under Documentation. When quoting, also the name of the...
  • Metatiedot: 2/5

    Ylen suomenkielisen uutisarkiston selkouutiset 2011-2018, lähdemateriaali

    Korpus sisältää Ylen uutisarkiston selkouutiset vuosilta 2011-2018. Alkuperäinen aineisto, Ylen suomenkielinen uutisarkisto 2011-2018, lähdeaineisto (pysyväistunniste http://urn.fi/urn:nbn:fi:lb-2017070501) on harvestoitu Ylen uutisarkistosta 8.3.2019 kielikoodilla "fi". Selkouutisten korpus on koostettu Ylen suomenkielisen uutisarkiston aineistossa...
  • Metatiedot: 2/5

    Finnish News Corpus for Named Entity Recognition

    The corpus consists of 953 articles (193,742 word tokens) with six named entity classes (organization, location, person, product, event,and date). The articles are extracted from the archives of Digitoday, a Finnish online technology news source. The data sets are available at https://github.com/mpsilfve/finer-data and will be available in the download...
  • Metatiedot: 2/5

    STT:n uutisarkisto 1992-2018, lähdemateriaali

    Suomen Tietotoimiston (STT) uutisarkisto sisältää uutisjakelun [lisäys: suomenkieliset] artikkelit, jotka STT on lähettänyt media-asiakkaidensa käytettäväksi vuosina 1992-2018. Arkistossa on yhteensä noin 2,8 miljoonaa yksittäistä kohdetta. Valtaosa artikkeleista on uutisjuttuja, joiden pituus vaihtelee hyvin lyhyistä ”viivauutisista” uutissähkeisiin ja...