Siirry sisältöön
Tutkimusaineistojen hakupalvelu
FI|EN

TÄRKEÄÄ TIETOA ETSIMEN KÄYTÖSTÄ! Vanha Etsin -palvelu (etsin.avointiede.fi) siirtyy osaksi uudistettua Etsin -palvelua (etsin.fairdata.fi) heinäkuun alussa 2019. CSC siirtää kaikki vanhassa Etsimessä JULKAISTUT aineistot uuteen Etsimeen.
Aineistojen kuvailu päättyy vanhassa Etsimessä 12.6.2019. Aineistot kuvailaan jatkossa uuteen Etsimeen uuden Qvain -palvelun avulla, joka otetaan käyttöön heinäkuun 2019 alussa.
Huom! Muista julkaista aineistosi, jos haluat niiden siirtyvän uuteen Etsimeen.

Etsi aineistoa

Löytyi 292 aineistoa
Lisää kategorioita…
  • Metatiedot: 2/5

    Ylen ruotsinkielinen uutisarkisto 2012-2018, Korp (BETA)

    The corpus, containing the articles from Svenska YLE https://svenska.yle.fi from 2012 onwards up to 2018 inclusive, is available at Korp as a Beta version, which means it may be subject to unannounced changes. The licence is available at http://urn.fi/urn:nbn:fi:lb-2019120401
  • Metatiedot: 2/5

    Ylen ruotsinkielinen uutisarkisto 2012-2018, sekoitettu, Korp (BETA)

    The corpus, containing the articles from Svenska YLE https://svenska.yle.fi from 2012 onwards up to 2018 inclusive as scrambled sentences, is available at Korp as a Beta version, which means it may be subject to unannounced changes.
  • Metatiedot: 2/5

    The "Hallituskausi 2011–2015" Translation Memory

    The "Hallituskausi 2011–2015" translation memory is intended for those translating administrative texts between Finnish and English. It includes key policy reports published by the Finnish ministries on their websites during the ongoing electoral period. The memory features some 11,000 Finnish-to-English translation segments. The translation memory runs...
  • Metatiedot: 2/5

    The "Hallituskausi 2007–2011" Translation Memory

    The "Hallituskausi 2007–2011" translation memory is intended for those translating administrative texts between Finnish and English. It includes key policy reports published by the Finnish ministries on their websites. The memory features some 58,000 Finnish-to-English translation segments. The tmx format requires a SDL Trados Studio programme. The...
  • Metatiedot: 2/5

    Open Richly Annotated Cuneiform Corpus, ladattava versio, syyskuu 2017

    This version contains the data that were available on the Oracc project website in September 2017. Open Richly Annotated Cuneiform Corpus (Oracc) brings together the work of several Assyriological projects to publish online editions of cuneiform texts. This version of ORACC contains the following Oracc projects: Corpus of Ancient Mesopotamian Scholarship;...
  • Metatiedot: 2/5

    STT:n uutisarkisto 1992-2018, Kielipankin Korp-versio

    Aineisto julkaistaan Kielipankin Korp-konkordanssityökalussa ei-kaupalliseen käyttöön, jossa konteksti rajoittuu virkkeeseen tai kappaleeseen. Suomen Tietotoimiston (STT) uutisarkisto sisältää uutisjakelun [lisäys: suomenkieliset] artikkelit, jotka STT on lähettänyt media-asiakkaidensa käytettäväksi vuosina 1992-2018. Arkistossa on yhteensä noin 2,8...
  • Metatiedot: 2/5

    Suomenkielinen Wikipedia 2017, lähdemateriaali

    Suomenkielinen Wikipedia 2017 lähdemateriaali on saatavilla Kielipankin latauspalvelussa. Aineisto kattaa Wikipedian suomenkielisen artikkelien leipätekstit vuoden 2017 lopulta. Tekstit on eristetty Wikipedian tarjoamista kielikohtaisista kokonaisaineistoista (https://dumps.wikimedia.org/). Aineisto on jaettu arikkeleihin, kappaleisiin ja lauseisiin....
  • Metatiedot: 2/5

    Suomenkielinen OpenSubtitles 2017, lähdemateriaali

    Suomenkielinen OpenSubtitles 2017 lähdemateriaali on saatavilla Kielipankin latauspalvelussa. Aineisto kattaa Opensubtitles.org sivuston jakamat elokuvien ja tv-ohjelmien suomenkieliset tekstitykset. Aineisto on johdannainen monikielisestä Opensubtitles2018 korpuksesta (http://opus.nlpl.eu/OpenSubtitles2018.php). Aineisto on jaettu lähteisiin ja...
  • Metatiedot: 2/5

    Iijoki, Oulun yliopiston Päätalo-kokoelma, Kielipankki Korp -versio

    Iijoki-sarjan kuvaus löytyy sivulta http://urn.fi/urn:nbn:fi:lb-2019041401 ja Oulun yliopiston Päätalo-kokoelman tietosivu Kielipankin sivustolta osoitteesta https://www.kielipankki.fi/aineistot/oulun-yliopiston-paatalo-kokoelma/ Lisenssisivu: http://urn.fi/urn:nbn:fi:lb-2019102106 Aineiston on julkaistu konkordanssityökalu Korpissa...
  • Metatiedot: 2/5

    Lauseopin arkiston murrekorpuksen Helsinki ladattava versio

    The corpus, which is the Download version of The Finnish Dialect Syntax Archive's Helsinki Korp Version (http://urn.fi/urn:nbn:fi:lb-2016040702), is available in Kielipankki - the Language Bank of Finland Download service korp.csc.fi/download under the license CC BY ND 4.0. For more information see the metadata of The Finnish Dialect Syntax Arhive...
  • Metatiedot: 1/5

    Sata suomalaista kielellistä elämäkertaa

    Hankkeessa on haastateltu yli sataa suomalaista eri puolilta Suomea. Haastateltavat ovat 6–104-vuotiaita miehiä ja naisia eri sosiaaliryhmistä. He edustavat paitsi eri puolella Suomea puhuttavia suomen ja ruotsin kielimuotoja, myös muunkielisiä väestöryhmiä. Haastateltavien valinnassa on otettu huomioon väestöpainotettu alueellinen edustavuus siten, että...
  • Metatiedot: 2/5

    1990- ja 2000-luvun suomalaisia aikakaus- ja sanomalehtiä -korpus (VRT), vers...

    The corpus is available for Download in Kielipankki - the Language Bank of Finland The data is annotated and identical to the data used as basis for lehdet90ff-v2. A short documentation of the VRT file format can be found via the Documentation section. Reference instructions: See Attribution Details under Documentation. When quoting, also the name of the...
  • Metatiedot: 2/5

    Multimodal Translation with the Blind: Team

    Korpus “mutable-team” on osa MUTABLE-aineistokokoelmaa (Multimodal Translation with the Blind), johon on kerätty videoita kuvailutulkkaukseen liittyvistä työprosesseista sekä sokeiden ja näkevien välisestä vuorovaikutuksesta. Mutable-team sisältää n. 25 tuntia aitojen ryhmätyöskentelytilanteiden videoita sekä niihin kohdistettuja ortografisia...
  • Metatiedot: 2/5

    Multimodal Translation with the Blind: Art

    mutable-art Korpus “mutable-art” on osa MUTABLE-aineistokokoelmaa (Multimodal Translation with the Blind), johon on kerätty videoita kuvailutulkkaukseen liittyvistä työprosesseista sekä sokeiden ja näkevien välisestä vuorovaikutuksesta. Mutable-art sisältää kahden kuvailutulkatun taidenäyttelykierroksen videoinnit (yht. n. 2 h) sekä näiden ortografiset...
  • Metatiedot: 2/5

    Open Richly Annotated Cuneiform Corpus, Korp-versio, toukokuu 2019

    Open Richly Annotated Cuneiform Corpus (Oracc) brings together the work of several Assyriological projects to publish online editions of cuneiform texts. The Korp version of Oracc allows extensive searches on the texts and presents the results as a KWIC concordance list. Korp also offers statistical information and comparison of the search results....
  • Metatiedot: 2/5

    Ylen suomenkielisen uutisarkiston selkouutiset 2011-2018, lähdemateriaali

    Korpus sisältää Ylen uutisarkiston selkouutiset vuosilta 2011-2018. Alkuperäinen aineisto, Ylen suomenkielinen uutisarkisto 2011-2018, lähdeaineisto (pysyväistunniste http://urn.fi/urn:nbn:fi:lb-2017070501) on harvestoitu Ylen uutisarkistosta 8.3.2019 kielikoodilla "fi". Selkouutisten korpus on koostettu Ylen suomenkielisen uutisarkiston aineistossa...
  • Metatiedot: 2/5

    Finnish News Corpus for Named Entity Recognition

    The corpus consists of 953 articles (193,742 word tokens) with six named entity classes (organization, location, person, product, event,and date). The articles are extracted from the archives of Digitoday, a Finnish online technology news source. The data sets are available at https://github.com/mpsilfve/finer-data and will be available in the download...
  • Metatiedot: 2/5

    Iijoki, Oulun yliopiston Päätalo-kokoelma

    Iijoki-korpus on Oulun yliopiston Kielipankkiin tallettama kirjailija Kalle Päätalon (11.11.1919-20.11.2000) omaelämäkerrallinen pääteos. Päätaloa voidaan luonnehtia ainutlaatuiseksi suomalaisen lähihistorian ja työn kuvaajaksi sekä Koillismaan murteen tallentajaksi. Hänen kirjojensa aiheita olivat muun muassa nälkäaika, pula-ajat, metsätyöt,...
  • Metatiedot: 2/5

    STT:n uutisarkisto 1992-2018, lähdemateriaali

    Suomen Tietotoimiston (STT) uutisarkisto sisältää uutisjakelun [lisäys: suomenkieliset] artikkelit, jotka STT on lähettänyt media-asiakkaidensa käytettäväksi vuosina 1992-2018. Arkistossa on yhteensä noin 2,8 miljoonaa yksittäistä kohdetta. Valtaosa artikkeleista on uutisjuttuja, joiden pituus vaihtelee hyvin lyhyistä ”viivauutisista” uutissähkeisiin ja...
  • Metatiedot: 2/5

    Fenno-Ugrica Kielipankin ladattava versio

    The Kielipankki downloadable version of Fenno-ugrica (http://urn.fi/urn:nbn:fi:lb-2014073056) is available in Kielipankki - the Language Bank of Finland at http://urn.fi/urn:nbn:fi:lb-2019032501