Siirry sisältöön
Tutkimusaineistojen hakupalvelu
FI|EN

TÄRKEÄÄ TIETOA ETSIMEN KÄYTÖSTÄ! Vanha Etsin -palvelu (etsin.avointiede.fi) siirtyy osaksi uudistettua Etsin -palvelua (etsin.fairdata.fi) heinäkuun alussa 2019. CSC siirtää kaikki vanhassa Etsimessä JULKAISTUT aineistot uuteen Etsimeen.
Aineistojen kuvailu päättyy vanhassa Etsimessä 12.6.2019. Aineistot kuvailaan jatkossa uuteen Etsimeen uuden Qvain -palvelun avulla, joka otetaan käyttöön heinäkuun 2019 alussa.
Huom! Muista julkaista aineistosi, jos haluat niiden siirtyvän uuteen Etsimeen.

Etsi aineistoa

Löytyi 60 aineistoa
Lisää kategorioita…
  • Metatiedot: 2/5

    The "Hallituskausi 2007–2011" Translation Memory

    The "Hallituskausi 2007–2011" translation memory is intended for those translating administrative texts between Finnish and English. It includes key policy reports published by the Finnish ministries on their websites. The memory features some 58,000 Finnish-to-English translation segments. The tmx format requires a SDL Trados Studio programme. The...
  • Metatiedot: 2/5

    Helsinki Corpus TEI-XML Edition (2011), Korp

    The Helsinki Corpus TEI-XML Edition (2011) is a structured multi-genre diachronic corpus, which includes periodically organized text samples from Old, Middle and Early Modern English. Each sample is preceded by a list of parameter codes giving information on the text and its author. The Corpus is useful particularly in the study of the change of...
  • Metatiedot: 2/5

    Parsed Corpus of Early English Correspondence

    The Parsed Corpus of Early English Correspondence contains 4970 personal letters by 666 writers, altogether 2.2 million words of running text from the years 1410-1681. The letters have been selected to be as socially representative of the literate social ranks of the time as possible. In addition to the flat text version, the corpus has also been provided...
  • Metatiedot: 2/5

    Opusparcus: Open Subtitles Paraphrase Corpus for Six Languages (version 1.0)

    Opusparcus is a paraphrase corpus for six European languages: German, English, Finnish, French, Russian, and Swedish. The paraphrases are extracted from the OpenSubtitles2016 corpus, which contains subtitles from movies and TV shows. The data in Opusparcus has been extracted from OpenSubtitles2016 (http://opus.nlpl.eu/OpenSubtitles2016.php), which is in...
  • Metatiedot: 2/5

    ERME Erzya and Moksha Extended Corpora

    ERME on pääasiassa ersä- ja mokšamordvan kirjallisuusaineisto. Aineisto koostuu useamman median julkaisuista aina 1800-luvulta 2000-luvulle asti. Sitä on kartoitettu sekä Saranskissa vuosina 1997-2004 että Helsingissä vuodesta 2004. Korpusten alkeellisin muoto on XML-formatti, jonka rakeisuus ulottuu kappaletasolle. Päämäärä on korpuksia, joissa...
  • Metatiedot: 2/5

    Helsinki Corpus of English Texts (1991)

    The Helsinki Corpus of English Texts is a structured multi-genre diachronic corpus, which includes periodically organized text samples from Old, Middle and Early Modern English. Each sample is preceded by a list of parameter codes giving information on the text and its author. The Corpus is useful particularly in the study of the change of linguistic...
  • Metatiedot: 2/5

    Uzbekki-englanti sanakirja (UHLCS)

    The corpus is available in Kielipankki - the Language Bank of Finland (taito-shell.csc.fi, access rights instructions: http://www.kielipankki.fi/access). Location: /appl/kielipankki/mrc-uhlcs/multilingual-language-archive/turkic-lgs/south-east-turkic-lgs/uzbek The Uzbek-English dictionary was compiled by Daniel Kimmage. Size of the dictionary: approx....
  • Metatiedot: 2/5

    Hantin korpus (pohjoishantin aineistot ja käännökset) (UHLCS)

    The corpus is available in Kielipankki - the Language Bank of Finland (taito-shell.csc.fi, access rights instructions: http://www.kielipankki.fi/access). Location: /appl/kielipankki/mrc-uhlcs/multilingual-language-archive/uralic-lgs/finno-ugric-lgs/ugric-lgs/khanty The Khanty computer corpus contains the following sub-corpora: Khanty, Atlym dialect, 519...
  • Metatiedot: 2/5

    Englannin korpus (UHLCS)

    The corpus is available in Kielipankki - the Language Bank of Finland (taito-shell.csc.fi, access rights instructions: http://www.kielipankki.fi/access). Location: /appl/kielipankki/mrc-uhlcs/general-linguistics/indo-european-lgs/germanic-lgs/english The English Corpus is a part of the UHLCS corpus collection. Contents: The English Gutenberg Corpora...
  • Metatiedot: 2/5

    Tšuvassin korpus (UHLCS)

    Aineisto on saatavilla Kielipankin sovelluspalvelimella (taito-shell.csc.fi, käyttöoikeuksien hakemisesta ks. https://www.kielipankki.fi/kayttajaksi/). Tšuvassin korpus sisältää seuraavat dokumentit: Gebräuche und Volksdichtung der Tschuwassen. Gesammelt von Heikki Paasonen, herausgeben von Eino Karahka und Matti Räsänen. Mémoires de la Société...
  • Metatiedot: 2/5

    The "Hallituskausi 2011–2015" Translation Memory

    The "Hallituskausi 2011–2015" translation memory is intended for those translating administrative texts between Finnish and English. It includes key policy reports published by the Finnish ministries on their websites during the ongoing electoral period. The memory features some 11,000 Finnish-to-English translation segments. The translation memory runs...
  • Metatiedot: 2/5

    Muunnellun puheen korpus

    Korpus koostuu puhenäytteistä, joissa puhujat lukevat tekstiä ääneen joko normaalilla äänellään tai siten, että he pyrkivät kuulostamaan eri-ikäiseltä henkilöltä. Aineisto sisältää näytteet 60 aikuiselta puhujalta (31 naista, 29 miestä), joista jokainen osallistui kahteen äänitykseen. Kummassakin äänityksessä puhuja luki ääneen kaksi suomenkielistä...
  • Metatiedot: 3/5

    Linked ontology on metadata on Russian open governmental data

    Linked open data ontology that describes open governmental data portals in the Russian Federation. Data was collected from May to September 2018.
  • Metatiedot: 4/5

    Aineisto artikkeliin “Modernization of Russian district heating systems with ...

    Haastatteluäänitteet, sanomalehtiartikkelit
  • Metatiedot: 2/5

    Murteita käsittelevien fennististen väitöskirjojen lähdetietokanta

    Lähdetietokanta tullaan julkaisemaan Kielipankin latauspalvelussa korp.csc.fi/download. Lähdetietokanta koostuu 41 suomen kielen alalla ilmestyneen murteita käsittelevän väitöskirjan lähdeluetteloista. Tietokanta sisältää jokaisesta lähdeluetteloviitteestä seuraavat tiedot: tekijä; julkaisuvuosi; nimike; julkaisutiedot kuten painos- ja kustantajatiedot;...
  • Metatiedot: 2/5

    MULCOLD, monikielinen lakitekstien rinnakkaiskorpus

    The corpus is available in Kielipankki - the Language Bank of Finland (korp.csc.fi) at http://urn.fi/urn:nbn:fi:lb-201405277 The sub-corpora containing the Russian, German and Russian texts respectively are available at http://urn.fi/urn:nbn:fi:lb-2016031001 The corpus contains international conventions and treaties arranged as a parallel corpus aligned...
  • Metatiedot: 2/5

    TAITO-hankkeen kirjalliset ja suulliset aineistot

    Korpus koostuu sekä opiskelijoiden kirjoittamista teksteistä opintojen alussa ja ensimmäisen opiskeluvuoden loppupuolella (mukana saksan, ranskan, italian, ruotsin ja englannin opiskelijoita) että osittain litteroitujen keskustelujen videoinneista. Keskusteluissa on mukana yleensä kaksi opiskelijaa ja yksi natiivipuhuja. Korpus sisältää myös...
  • Metatiedot: 2/5

    MULCOLD, monikielisen lakitekstien rinnakkaiskorpuksen englanninkielinen osak...

    The sub-corpus is available in Kielipankki - the Language Bank of Finland (korp.csc.fi) at http://urn.fi/urn:nbn:fi:lb-2016042605 For more information see http://urn.fi/urn:nbn:fi:lb-201405278
  • Metatiedot: 3/5

    Helsinki Archive of Regional English Speech – Cambridgeshire Sampler

    HARES is a collection of audio-recorded interviews that were gathered in England in the 1970s and 1980s. The fieldworkers were Finnish graduate and post-graduate students from the University of Helsinki, who shared a common interest in the study of dialect syntax. The informants were elderly persons who had lived in the region all their lives and who had...
  • Metatiedot: 3/5

    Uptake of new ICT in Arctic marine industry

    This interview series deals with use of new technologies, in particular ICT - information and communication technologies, in the Arctic industries. The goal of the research interviews is to find out more about which technologies the Arctic industries find particularly useful, what are the risks and benefits of new technologies, what are the barriers to...