Siirry sisältöön
Tutkimusaineistojen hakupalvelu
FI|EN

TÄRKEÄÄ TIETOA ETSIMEN KÄYTÖSTÄ! Vanha Etsin -palvelu (etsin.avointiede.fi) siirtyy osaksi uudistettua Etsin -palvelua (etsin.fairdata.fi) heinäkuun alussa 2019. CSC siirtää kaikki vanhassa Etsimessä JULKAISTUT aineistot uuteen Etsimeen.
Aineistojen kuvailu päättyy vanhassa Etsimessä 12.6.2019. Aineistot kuvailaan jatkossa uuteen Etsimeen uuden Qvain -palvelun avulla, joka otetaan käyttöön heinäkuun 2019 alussa.
Huom! Muista julkaista aineistosi, jos haluat niiden siirtyvän uuteen Etsimeen.

Etsi aineistoa

Löytyi 6 aineistoa
  • Metatiedot: 2/5

    Corpus of Contemporary American English - Kielipankin ladattava versio 2017H1

    Nykyamerikanenglannin korpus COCA sisältää noin 440 miljoonaa sanetta ja 190 000 tekstiä vuosilta 1990-2012. Korpus on jaettu tekstilajin (puhuttu kieli, fiktio, aikakauslehdet, sanomalehdet, akateeminen genre) mukaan samankokoisiin osiin, joista kukin kattaa noin 88 miljoonaa sanetta.
  • Metatiedot: 2/5

    Corpus of Global Web-Based English - Kielipankin ladattava versio 2017H1

    Maailmanlaajuisen verkkoenglannin korpus GloWbE sisältää noin 1,8 miljardia sanetta ja 1 800 000 tekstiä Yhdysvalloista, Iso-Britanniasta, Australiasta, Intiasta ja 16 muusta maasta. Noin 60 % teksteistä on peräisin blogeista.
  • Metatiedot: 2/5

    Corpus of Historical American English - Kielipankin Korp-versio 2017H1

    Aineisto on saatavilla Kielipankissa (korp.csc.fi). Historiallisen amerikanenglannin korpus COHA sisältää noin 385 miljoonaa sanetta ja 115 000 tekstiä vuosilta 1810-2009. Kultakin vuosikymmeneltä on mukana suunnilleen yhtä paljon fiktiota, aikakauslehtitekstiä, sanomalehtitekstiä ja kirjoja (pl. fiktio). Pääsy ja lisenssi: Tätä korpusversiota voi...
  • Metatiedot: 2/5

    Corpus of Contemporary American English - Kielipankin Korp-versio 2017H1

    Aineisto on saatavilla Kielipankissa (korp.csc.fi). Nykyamerikanenglannin korpus COCA sisältää noin 440 miljoonaa sanetta ja 190 000 tekstiä vuosilta 1990-2012. Korpus on jaettu tekstilajin (puhuttu kieli, fiktio, aikakauslehdet, sanomalehdet, akateeminen genre) mukaan samankokoisiin osiin, joista kukin kattaa noin 88 miljoonaa sanetta. Pääsy ja lisenssi:...
  • Metatiedot: 2/5

    Corpus of Global Web-Based English - Kielipankin Korp-versio 2017H1

    Aineisto on saatavilla Kielipankissa (korp.csc.fi). Maailmanlaajuisen verkkoenglannin korpus GloWbE sisältää noin 1,8 miljardia sanetta ja 1 800 000 tekstiä Yhdysvalloista, Iso-Britanniasta, Australiasta, Intiasta ja 16 muusta maasta. Noin 60 % teksteistä on peräisin blogeista. Pääsy ja lisenssi: Tätä korpusversiota voi käyttää kirjautumalla...
  • Metatiedot: 2/5

    Corpus of Contemporary American English - Kielipankki

    Nykyamerikanenglannin korpus COCA sisältää noin 440 miljoonaa sanetta ja 190 000 tekstiä vuosilta 1990-2012. Korpus on jaettu tekstilajin (puhuttu kieli, fiktio, aikakauslehdet, sanomalehdet, akateeminen genre) mukaan samankokoisiin osiin, joista kukin kattaa noin 88 miljoonaa sanetta. Lisenssi: Korpus on saatavilla Korp-palvelun kautta FIN-CLARINin...