Siirry sisältöön
Tutkimusaineistojen hakupalvelu
FI|EN

TÄRKEÄÄ TIETOA ETSIMEN KÄYTÖSTÄ! Vanha Etsin -palvelu (etsin.avointiede.fi) siirtyy osaksi uudistettua Etsin -palvelua (etsin.fairdata.fi) heinäkuun alussa 2019. CSC siirtää kaikki vanhassa Etsimessä JULKAISTUT aineistot uuteen Etsimeen.
Aineistojen kuvailu päättyy vanhassa Etsimessä 12.6.2019. Aineistot kuvailaan jatkossa uuteen Etsimeen uuden Qvain -palvelun avulla, joka otetaan käyttöön heinäkuun 2019 alussa.
Huom! Muista julkaista aineistosi, jos haluat niiden siirtyvän uuteen Etsimeen.

Etsi aineistoa

Löytyi 9 880 aineistoa
Lisää kategorioita…
  • Metatiedot: 2/5

    Open Richly Annotated Cuneiform Corpus, ladattava versio, syyskuu 2017

    This version contains the data that were available on the Oracc project website in September 2017. Open Richly Annotated Cuneiform Corpus (Oracc) brings together the work of several Assyriological projects to publish online editions of cuneiform texts. This version of ORACC contains the following Oracc projects: Corpus of Ancient Mesopotamian Scholarship;...
  • Metatiedot: 2/5

    STT:n uutisarkisto 1992-2018, Kielipankin Korp-versio

    Aineisto julkaistaan Kielipankin Korp-konkordanssityökalussa ei-kaupalliseen käyttöön, jossa konteksti rajoittuu virkkeeseen tai kappaleeseen. Suomen Tietotoimiston (STT) uutisarkisto sisältää uutisjakelun [lisäys: suomenkieliset] artikkelit, jotka STT on lähettänyt media-asiakkaidensa käytettäväksi vuosina 1992-2018. Arkistossa on yhteensä noin 2,8...
  • Metatiedot: 2/5

    Suomenkielinen Wikipedia 2017, lähdemateriaali

    Suomenkielinen Wikipedia 2017 lähdemateriaali julkaistaan Kielipankin latauspalvelussa korp.csc.fi/download Aineisto kattaa Wikipedian suomenkielisen artikkelien leipätekstit vuoden 2017 lopulta. Tekstit on eristetty Wikipedian tarjoamista kielikohtaisista kokonaisaineistoista (https://dumps.wikimedia.org/). Aineisto on jaettu arikkeleihin, kappaleisiin...
  • Metatiedot: 2/5

    Suomenkielinen OpenSubtitles 2017, lähdemateriaali

    Suomenkielinen OpenSubtitles 2017 lähdemateriaali julkaistaan Kielipankin latauspalvelussa korp.csc.fi/download Aineisto kattaa Opensubtitles.org sivuston jakamat elokuvien ja tv-ohjelmien suomenkieliset tekstitykset. Aineisto on johdannainen monikielisestä Opensubtitles2018 korpuksesta (http://opus.nlpl.eu/OpenSubtitles2018.php). Aineisto on jaettu...
  • Metatiedot: 2/5

    Iijoki, Oulun yliopiston Päätalo-kokoelma, Kielipankki Korp -versio

    Iijoki-sarjan kuvaus löytyy sivulta http://urn.fi/urn:nbn:fi:lb-2019041401 ja Oulun yliopiston Päätalo-kokoelman tietosivu Kielipankin sivustolta osoitteesta https://www.kielipankki.fi/aineistot/oulun-yliopiston-paatalo-kokoelma/ Lisenssisivu: http://urn.fi/urn:nbn:fi:lb-2019102106 Aineiston on julkaistu konkordanssityökalu Korpissa...
  • Metatiedot: 1/5

    Iijoki, Oulun yliopiston Päätalo-kokoelma, Kielipankki TDPP Korp-versio

    Iijoki-sarjan kuvaus löytyy sivulta http://urn.fi/urn:nbn:fi:lb-2019041401. Lisenssisivu: http://urn.fi/urn:nbn:fi:lb-2019102106 Sarjan 26 kirjaa on jäsennetty Kielipankissa kahdella eri jäsentimellä. Molemmat julkaistaan Kielipankin Korp-konkordanssipalvelussa (korp.csc.fi). Tämän aineisto on jäsennetty Turku Dependency Parser Pipeline (TDPP)...
  • Metatiedot: 2/5

    Elias Lönnrotin kirjeenvaihdon ruotsinkielinen osakorpus - Kielipankki-versio

    This corpus will be made available at korp.csc.fi. It comprises letters and drafts written in Swedish, which are part of the correspondence corpus 'Elias Lönnrot Letters Online'. The data set in Swedish includes 3354 letters and drafts out of the whole data set of 4511 letters written in Finnish and Swedish. The letters and drafts of letters belong to the...
  • Metatiedot: 2/5

    Elias Lönnrotin kirjeenvaihdon suomenkielinen osakorpus - Kielipankki-versio

    This corpus will be made available at korp.csc.fi. It comprises letters and drafts written in Finnish, which are part of the correspondence corpus 'Elias Lönnrot Letters Online'. The data set in Finnish includes 1157 letters and drafts out of the whole data set of 4511 letters written in Finnish and Swedish. The letters and drafts of letters belong to the...
  • Metatiedot: 1/5

    Käännössuomen korpus

    Käännössuomen korpus on koostettu vuonna 1999 nykyisessä Itä-Suomen yliopistossa (silloisessa Joensuun yliopistossa sen kansainvälisen viestinnän laitoksella) Suomen Akatemian professori Anna Maurasen johtamassa tutkimushankkeessa Käännössuomi ja kääntämisen universaalit. Korpus sisältää kaksi osaa: aluperin suomeksi kirjoitettua kieltä (supisuomi) ja...
  • Metatiedot: 2/5

    Suomalaisen viittomakielen korpus: keskusteluaineisto, ladattava versio

    This subcorpus is part of the Corpus of Finnish Sign Language collected in the CFINSL project. The subcorpus comprises conversations from 18 Finnish Sign Language signers who belong to different age groups and live in different parts of Finland. The material covers four fixed tasks performed by the signers: introductions, discussing work/hobbies,...
  • Metatiedot: 2/5

    Suomalaisen viittomakielen korpus: kerronta-aineisto, ladattava versio

    This subcorpus is part of the Corpus of Finnish Sign Language collected in the CFINSL project. The subcorpus comprises elicited narratives from 21 Finnish Sign Language signers who belong to different age groups and live in different parts of Finland. The material covers three fixed tasks performed by the signers: narrating about short cartoon strips,...
  • Metatiedot: 2/5

    Lauseopin arkiston murrekorpuksen Helsinki ladattava versio

    The corpus, which is the Download version of The Finnish Dialect Syntax Archive's Helsinki Korp Version (http://urn.fi/urn:nbn:fi:lb-2016040702), is available in Kielipankki - the Language Bank of Finland Download service korp.csc.fi/download under the license CC BY ND 4.0. For more information see the metadata of The Finnish Dialect Syntax Arhive...
  • Metatiedot: 1/5

    The INA MeMAD Media Corpus

    The corpus contains television and radio programs from the archives of INA, the French National Audiovisual Institute. The corpus is made of 8 full days of programs on six French public television channels and radio stations (May 19th to 26th, 2014), corresponding to 2014 European elections. The corpus has been created and licensed for the MeMAD project,...
  • Metatiedot: 1/5

    Sata suomalaista kielellistä elämäkertaa

    Hankkeessa on haastateltu yli sataa suomalaista eri puolilta Suomea. Haastateltavat ovat 6–104-vuotiaita miehiä ja naisia eri sosiaaliryhmistä. He edustavat paitsi eri puolella Suomea puhuttavia suomen ja ruotsin kielimuotoja, myös muunkielisiä väestöryhmiä. Haastateltavien valinnassa on otettu huomioon väestöpainotettu alueellinen edustavuus siten, että...
  • Metatiedot: 2/5

    1990- ja 2000-luvun suomalaisia aikakaus- ja sanomalehtiä -korpus (VRT), vers...

    The corpus is available for Download in Kielipankki - the Language Bank of Finland The data is annotated and identical to the data used as basis for lehdet90ff-v2. A short documentation of the VRT file format can be found via the Documentation section. Reference instructions: See Attribution Details under Documentation. When quoting, also the name of the...
  • Metatiedot: 2/5

    Suomen kielen tekstikokoelman ladattava versio - kaupallinen käyttö

    This downloadable sub corpus of FTC is available for commercial use. The resource is available in Kielipankki - the Language Bank of Finland at http://urn.fi/urn:nbn:fi:lb-201908071 For information about the licence, see http://urn.fi/urn:nbn:fi:lb-20150304139 The corpus available for commercial use is a subcorpus of the Finnish Text Collection. More...
  • Metatiedot: 1/5

    The Yle MeMAD Media Corpus

    The corpus contains tv programs and videos from the archives of Yle, The Finnish Broadcasting Company. Journalistic programs (news, current affairs etc, no drama) have been selected on various topics and from time period ranging from 1966 to 2018. Each browse-quality video file is accompanied with their descriptive metadata and subtitles. Main audio and...
  • Metatiedot: 2/5

    Multimodal Translation with the Blind: Team

    Korpus “mutable-team” on osa MUTABLE-aineistokokoelmaa (Multimodal Translation with the Blind), johon on kerätty videoita kuvailutulkkaukseen liittyvistä työprosesseista sekä sokeiden ja näkevien välisestä vuorovaikutuksesta. Mutable-team sisältää n. 25 tuntia aitojen ryhmätyöskentelytilanteiden videoita sekä niihin kohdistettuja ortografisia...
  • Metatiedot: 2/5

    Multimodal Translation with the Blind: Art

    mutable-art Korpus “mutable-art” on osa MUTABLE-aineistokokoelmaa (Multimodal Translation with the Blind), johon on kerätty videoita kuvailutulkkaukseen liittyvistä työprosesseista sekä sokeiden ja näkevien välisestä vuorovaikutuksesta. Mutable-art sisältää kahden kuvailutulkatun taidenäyttelykierroksen videoinnit (yht. n. 2 h) sekä näiden ortografiset...
  • Metatiedot: 2/5

    Open Richly Annotated Cuneiform Corpus, Korp-versio, toukokuu 2019

    Open Richly Annotated Cuneiform Corpus (Oracc) brings together the work of several Assyriological projects to publish online editions of cuneiform texts. The Korp version of Oracc allows extensive searches on the texts and presents the results as a KWIC concordance list. Korp also offers statistical information and comparison of the search results....