Siirry sisältöön
Tutkimusaineistojen hakupalvelu
FI|EN

TÄRKEÄÄ TIETOA ETSIMEN KÄYTÖSTÄ! Vanha Etsin -palvelu (etsin.avointiede.fi) siirtyy osaksi uudistettua Etsin -palvelua (etsin.fairdata.fi) heinäkuun alussa 2019. CSC siirtää kaikki vanhassa Etsimessä JULKAISTUT aineistot uuteen Etsimeen.
Aineistojen kuvailu päättyy vanhassa Etsimessä 12.6.2019. Aineistot kuvailaan jatkossa uuteen Etsimeen uuden Qvain -palvelun avulla, joka otetaan käyttöön heinäkuun 2019 alussa.
Huom! Muista julkaista aineistosi, jos haluat niiden siirtyvän uuteen Etsimeen.

Etsi aineistoa

Löytyi 289 aineistoa
Lisää kategorioita…
  • Metatiedot: 2/5

    Suomen korpus (raamatut) (UHLCS)

    Aineisto on saatavilla Kielipankin sovelluspalvelimella (taito-shell.csc.fi, käyttöoikeuksien hakemisesta ks. https://www.kielipankki.fi/kayttajaksi/). Sijainti: /appl/kielipankki/mrc-uhlcs/general-linguistics/uralic-lgs/finno-ugric-lgs/baltic-finnic-lgs/finnish/bible Suomen kielen aineisto sisältää vanhat käännökset Vanhasta testamentista (1933) ja...
  • Metatiedot: 2/5

    Eduskunnan täysistunnot, Kielipankin Korp-versio 1.1

    Aineisto sisältää ajalla 10.09.2008 - 1.7.2016 pidettyjen eduskunnan täysistuntojen videotallenteista tehtyjen transkriptioiden ensimmäisen version. Tekstimuotoinen aineisto on saatavilla Kielipankin Korp-palvelussa, ks. Access location. Osa aineistosta on tarjolla myös LAT-palvelussa. Hakutuloksissa on tällöin linkki istunnon LAT-versioon. Transkriptiot...
  • Metatiedot: 2/5

    Eduskunnan täysistunnot, ladattava versio 1

    Aineisto sisältää ajalla 10.9.2008-1.7.2016 pidettyjen eduskunnan täysistuntojen äänitteet WAV-muodossa sekä niihin kohdistetut transkriptiot ELANin EAF-muodossa. Aineisto on saatavilla Kielipankin latauspalvelussa, http://urn.fi/urn:nbn:fi:lb-201712181 Huomaa, että tässä ladattavassa aineistossa olevia transkriptioita on saatettu hieman päivittää jo...
  • Metatiedot: 2/5

    Open Richly Annotated Cuneiform Corpus, ladattava versio, syyskuu 2017

    This version contains the data that were available on the Oracc project website in September 2017. Open Richly Annotated Cuneiform Corpus (Oracc) brings together the work of several Assyriological projects to publish online editions of cuneiform texts. This version of ORACC contains the following Oracc projects: Corpus of Ancient Mesopotamian Scholarship;...
  • Metatiedot: 2/5

    STT:n uutisarkisto 1992-2018, Kielipankin Korp-versio

    Aineisto julkaistaan Kielipankin Korp-konkordanssityökalussa ei-kaupalliseen käyttöön, jossa konteksti rajoittuu virkkeeseen tai kappaleeseen. Suomen Tietotoimiston (STT) uutisarkisto sisältää uutisjakelun [lisäys: suomenkieliset] artikkelit, jotka STT on lähettänyt media-asiakkaidensa käytettäväksi vuosina 1992-2018. Arkistossa on yhteensä noin 2,8...
  • Metatiedot: 2/5

    Suomenkielinen Wikipedia 2017, lähdemateriaali

    Suomenkielinen Wikipedia 2017 lähdemateriaali julkaistaan Kielipankin latauspalvelussa korp.csc.fi/download Aineisto kattaa Wikipedian suomenkielisen artikkelien leipätekstit vuoden 2017 lopulta. Tekstit on eristetty Wikipedian tarjoamista kielikohtaisista kokonaisaineistoista (https://dumps.wikimedia.org/). Aineisto on jaettu arikkeleihin, kappaleisiin...
  • Metatiedot: 2/5

    Suomenkielinen OpenSubtitles 2017, lähdemateriaali

    Suomenkielinen OpenSubtitles 2017 lähdemateriaali julkaistaan Kielipankin latauspalvelussa korp.csc.fi/download Aineisto kattaa Opensubtitles.org sivuston jakamat elokuvien ja tv-ohjelmien suomenkieliset tekstitykset. Aineisto on johdannainen monikielisestä Opensubtitles2018 korpuksesta (http://opus.nlpl.eu/OpenSubtitles2018.php). Aineisto on jaettu...
  • Metatiedot: 2/5

    Iijoki, Oulun yliopiston Päätalo-kokoelma, Kielipankki Korp -versio

    Iijoki-sarjan kuvaus löytyy sivulta http://urn.fi/urn:nbn:fi:lb-2019041401 ja Oulun yliopiston Päätalo-kokoelman tietosivu Kielipankin sivustolta osoitteesta https://www.kielipankki.fi/aineistot/oulun-yliopiston-paatalo-kokoelma/ Lisenssisivu: http://urn.fi/urn:nbn:fi:lb-2019102106 Aineiston on julkaistu konkordanssityökalu Korpissa...
  • Metatiedot: 2/5

    Lauseopin arkiston murrekorpuksen Helsinki ladattava versio

    The corpus, which is the Download version of The Finnish Dialect Syntax Archive's Helsinki Korp Version (http://urn.fi/urn:nbn:fi:lb-2016040702), is available in Kielipankki - the Language Bank of Finland Download service korp.csc.fi/download under the license CC BY ND 4.0. For more information see the metadata of The Finnish Dialect Syntax Arhive...
  • Metatiedot: 1/5

    Sata suomalaista kielellistä elämäkertaa

    Hankkeessa on haastateltu yli sataa suomalaista eri puolilta Suomea. Haastateltavat ovat 6–104-vuotiaita miehiä ja naisia eri sosiaaliryhmistä. He edustavat paitsi eri puolella Suomea puhuttavia suomen ja ruotsin kielimuotoja, myös muunkielisiä väestöryhmiä. Haastateltavien valinnassa on otettu huomioon väestöpainotettu alueellinen edustavuus siten, että...
  • Metatiedot: 2/5

    1990- ja 2000-luvun suomalaisia aikakaus- ja sanomalehtiä -korpus (VRT), vers...

    The corpus is available for Download in Kielipankki - the Language Bank of Finland The data is annotated and identical to the data used as basis for lehdet90ff-v2. A short documentation of the VRT file format can be found via the Documentation section. Reference instructions: See Attribution Details under Documentation. When quoting, also the name of the...
  • Metatiedot: 2/5

    Multimodal Translation with the Blind: Team

    Korpus “mutable-team” on osa MUTABLE-aineistokokoelmaa (Multimodal Translation with the Blind), johon on kerätty videoita kuvailutulkkaukseen liittyvistä työprosesseista sekä sokeiden ja näkevien välisestä vuorovaikutuksesta. Mutable-team sisältää n. 25 tuntia aitojen ryhmätyöskentelytilanteiden videoita sekä niihin kohdistettuja ortografisia...
  • Metatiedot: 2/5

    Multimodal Translation with the Blind: Art

    mutable-art Korpus “mutable-art” on osa MUTABLE-aineistokokoelmaa (Multimodal Translation with the Blind), johon on kerätty videoita kuvailutulkkaukseen liittyvistä työprosesseista sekä sokeiden ja näkevien välisestä vuorovaikutuksesta. Mutable-art sisältää kahden kuvailutulkatun taidenäyttelykierroksen videoinnit (yht. n. 2 h) sekä näiden ortografiset...
  • Metatiedot: 2/5

    Open Richly Annotated Cuneiform Corpus, Korp-versio, toukokuu 2019

    Open Richly Annotated Cuneiform Corpus (Oracc) brings together the work of several Assyriological projects to publish online editions of cuneiform texts. The Korp version of Oracc allows extensive searches on the texts and presents the results as a KWIC concordance list. Korp also offers statistical information and comparison of the search results....
  • Metatiedot: 2/5

    Ylen suomenkielisen uutisarkiston selkouutiset 2011-2018, lähdemateriaali

    Korpus sisältää Ylen uutisarkiston selkouutiset vuosilta 2011-2018. Alkuperäinen aineisto, Ylen suomenkielinen uutisarkisto 2011-2018, lähdeaineisto (pysyväistunniste http://urn.fi/urn:nbn:fi:lb-2017070501) on harvestoitu Ylen uutisarkistosta 8.3.2019 kielikoodilla "fi". Selkouutisten korpus on koostettu Ylen suomenkielisen uutisarkiston aineistossa...
  • Metatiedot: 2/5

    Finnish News Corpus for Named Entity Recognition

    The corpus consists of 953 articles (193,742 word tokens) with six named entity classes (organization, location, person, product, event,and date). The articles are extracted from the archives of Digitoday, a Finnish online technology news source. The data sets are available at https://github.com/mpsilfve/finer-data and will be available in the download...
  • Metatiedot: 2/5

    Iijoki, Oulun yliopiston Päätalo-kokoelma

    Iijoki-korpus on Oulun yliopiston Kielipankkiin tallettama kirjailija Kalle Päätalon (11.11.1919-20.11.2000) omaelämäkerrallinen pääteos. Päätaloa voidaan luonnehtia ainutlaatuiseksi suomalaisen lähihistorian ja työn kuvaajaksi sekä Koillismaan murteen tallentajaksi. Hänen kirjojensa aiheita olivat muun muassa nälkäaika, pula-ajat, metsätyöt,...
  • Metatiedot: 2/5

    STT:n uutisarkisto 1992-2018, lähdemateriaali

    Suomen Tietotoimiston (STT) uutisarkisto sisältää uutisjakelun [lisäys: suomenkieliset] artikkelit, jotka STT on lähettänyt media-asiakkaidensa käytettäväksi vuosina 1992-2018. Arkistossa on yhteensä noin 2,8 miljoonaa yksittäistä kohdetta. Valtaosa artikkeleista on uutisjuttuja, joiden pituus vaihtelee hyvin lyhyistä ”viivauutisista” uutissähkeisiin ja...
  • Metatiedot: 2/5

    Fenno-Ugrica Kielipankin ladattava versio

    The Kielipankki downloadable version of Fenno-ugrica (http://urn.fi/urn:nbn:fi:lb-2014073056) is available in Kielipankki - the Language Bank of Finland at http://urn.fi/urn:nbn:fi:lb-2019032501
  • Metatiedot: 2/5

    Relative frequencies of part-of-speech n-grams in native and translated Finni...

    These files contain data from Matias Tamminen's MA thesis study "Then shall I know fully: Relative frequencies of part-of-speech n-grams in native and translated Finnish literary prose" by Matias Tamminen (2018), University of Helsinki. The material is available at the Language Bank of Finland (Kielipankki) download service, access location...