Skip to content
Research data finder
FI|EN

IMPORTANT INFORMATION ABOUT ETSIN! Old Etsin (etsin.avointiede.fi) will be migrated into new Etsin (etsin.fairdata.fi) at the end of June 2019. After the migration all PUBLISHED datasets will be visible in new Etsin.
Describing the datasets in Etsin will not be possible after 12th June 2019. Instead, describing the datasets will be done in new metadata tool, Qvain, which will be launched at the begin of July 2019.
Note! Remember to publish your dataset if you want it to be migrated into new Etsin.

Search for a Dataset

9,816 datasets found

Organization

More categories…
  • Metadata: 2/5

    Classics of Finnish Literature, Kielipankki Version

    Works of established Finnish authors published from 1880s to 1940s. Includes prose fiction, plays, poetry and aphorisms, some written originally in Swedish. The corpus is available in Kielipankki - the Language Bank of Finland, http://urn.fi/urn:nbn:fi:lb-2016081601
  • Metadata: 2/5

    ERME Erzya and Moksha Extended Corpora

    ERME contains predominantly Erzya and Moksha literature. It consists of several media publications from the 19th to the 20th century. ERME was mapped in Saransk in 1997-2004, while in Helsinki it has been mapped since 2004. The most basic format used is XML, with a granularity extending to chapter level. The goal is to create corpora with a granularity...
  • Metadata: 2/5

    Corpus of Early Modern Finnish, Kielipankki Version

    Written Finnish from the 19th century (mostly from the years between 1810 and 1880), browsable and searchable on the web. The collection contains published literature, periodicals, newspapers, and dictionaries, among others, with a focus on the earliest and most important publications and a wide thematic coverage. Texts written originally in Finnish were...
  • Metadata: 2/5

    The Morpho-Syntactic Database of Mikael Agricola's Works

    The database is available through the Interface Korp at http://korp.csc.fi/ through http://urn.fi/urn:nbn:fi:lb-201803273. The Morpho-Syntactic Database of Mikael Agricola's Works contains the Finnish parts of Mikael Agricola’s works (Abckiria, Rukouskiria, Se Wsi testamenti, Käsikiria, Messu, Piina, Psaltari, Veisut, Profeetat). The database was created...
  • Metadata: 2/5

    FinDe Corpus

    This contrastive language corpus contains German and Finnish literature and press texts and their respective translations into the other language.
  • Metadata: 3/5

    EduMAP: Interviews with Adult Education Policy-Makers and Personnel on the So...

    Aineistossa on haastateltu Iso-Britannian aikuiskoulutussektorin koulutushenkilöstöä ja päättäjiä, jotka työskentelevät haavoittuvassa asemassa olevien nuorten aikuisten kanssa. Haastatteluissa käsitellään organisaatioiden nuorille aikuisille suunnattujen koulutusohjelmien tai muun toiminnan sisältöjä, pedagogisia lähestymistapoja, sukupuolten välistä...
  • Metadata: 3/5

    Employment Survey of Tampere University Bachelor Graduates of 2015-2016

    Aineistossa kartoitettiin vuosina 2015-2016 valmistuneiden kandidaattien työelämään sijoittumista erilaisilla työtilanteeseen, työhistoriaan ja työllistymiseen liittyvillä kysymyksillä. Kysely lähetettiin kandidaateille, jotka olivat valmistumisen jälkeisenä vuonna suorittaneet enintään kymmenen opintopistettä. Tällä on pyritty kohdistamaan kysely...
  • Metadata: 3/5

    Cross-national Survey on the Future of the Welfare State 2015

    Tutkimuksessa selvitettiin luottamusta hyvinvointivaltion tulevaisuuteen sekä Euroopan unionin roolia sosiaalipolitiikassa ja sosiaalietuuksissa. Tutkimuksen toteutti Vision Europe Summit -yhteenliittymä, joka koostuu seuraavista asiantuntijaryhmistä, säätiöistä ja rahastoista: vuoden isäntäorganisaatio Bertelsmann Stiftung (Gütersloh) sekä Bruegel...
  • Metadata: 2/5

    Yle Swedish News Archive 2012-2018, source

    The corpus, containing the articles from Svenska YLE https://svenska.yle.fi from 2012 onwards up to 2018 inclusive, is available at korp.csc.fi/download The licence is available at http://urn.fi/urn:nbn:fi:lb-2019032201
  • Metadata: 3/5

    SFNET Corpus

    The corpus is available for download in Kielipankki - the Language Bank of Finland: http://urn.fi/urn:nbn:fi:lb-2017022701 You should be able to download it by just logging in with your university credentials. In case you cannot log in, even though you are affiliated to a university, see instructions at https://www.kielipankki.fi/lic/aca-status/ A copy...
  • Metadata: 2/5

    Jyväskylä Corpus of Middle French

    The corpus is available in Kielipankki - the Language Bank of Finland (taito-shell.csc.fi, access rights instructions: https://www.kielipankki.fi/support/access/). Licence: https://www.kielipankki.fi/lic/kra/ A digitized corpus for the study of the lexis and syntax of Middle French and for text editions. The corpus consists of 14 documents and 430 000...
  • Metadata: 2/5

    Yle Finnish News Archive 2011-2018, source

    The corpus, containing the articles from YLE https://yle.fi from 2011-2018, is available at korp.csc.fi/download The licence is available at http://urn.fi/urn:nbn:fi:lb-2019032203
  • Metadata: 2/5

    KOTUS Finnish-Swedish Parallel Corpus

    The corpus is available in Kielipankki - the Language Bank of Finland (korp.csc.fi), http://urn.fi/urn:nbn:fi:lb-2015101601 (Finnish sub-corpus) and https://korp.csc.fi/?mode=swedish#?lang=fi&prequery_within=sentence&cqp=[]&corpus=kfspc_sv (Swedish sub-corpus) with a Creative Commons BY 4.0 license. The corpus contains corporate press...
  • Metadata: 2/5

    Finnish TreeBank 3

    The corpus is available in Kielipankki - the Language Bank of Finland (https://korp.csc.fi), http://urn.fi/urn:nbn:fi:lb-2016051001 and downloadable at http://urn.fi/urn:nbn:fi:lb-2016011501 The FinnTreeBank project is creating a treebank and a parsebank for Finnish. This work is licensed under Creative Commons Attribution 3.0. A parsebank for Finnish...
  • Metadata: 2/5

    Finnish TreeBank 2

    The FinnTreeBank project is creating a treebank and a parsebank for Finnish. This work is licensed under Creative Commons Attribution 3.0. The second version of the treebank is annotated by hand and based on 17.000 model senctences in the Large Grammar of Finnish VISK - Iso Suomen Kielioppi. Brief samples of text from other sources, e.g. news items and...
  • Metadata: 2/5

    Finnish TreeBank 1

    The example sentences from Iso suomen kielioppi [Large Grammar of Finnish], manually annotated with dependency-syntactic descriptions. This is a Grammar Definition Corpus intended as a model for further automatic analysis of Finnish. The corpus is available in Kielipankki - the Language Bank of Finland. Download location:...
  • Metadata: 3/5

    Elderly Care and Services 2010

    Tutkimuksessa tutkittiin yli 75-vuotiaiden ikäihmisten kokemuksista palveluista ja tarpeista. Tutkimus toteutettiin Jyväskylässä ja Tampereella. Tutkimuksen rahoittajana toimi Suomen Akatemia. Aluksi kysyttiin vastaajien asumisesta ja heidän yhteyksistään läheisiinsä. Lisäksi kysyttiin vastaajien arjen haasteista ja selviytymisestä sekä kuka mahdollisesti...
  • Metadata: 3/5

    Employment Service Statistics 2006-2012

    Aineisto sisältää työvoimaa, työttömyyttä, tukitoimenpiteitä ja avoimia työpaikkoja kuvaavia muuttujia työ- ja elinkeinotoimistoittain. Työvoimaa ja työttömyyttä koskevia muuttujia ovat mm. työvoiman määrä, työttömyysaste, työttömien työnhakijoiden ja lomautettujen määrät sekä pitkäaikais- ja toistuvaistyöttömien määrät. Aineisto sisältää myös tietoja...
  • Metadata: 2/5

    Wanca 2016, Korp Version

    The Korp version of Wanca 2016 is a collection of web corpora in small Uralic languages. The collection is composed of 29 sentence corpora in different languages. The corpora have been collected from the Internet using the automated system developed in the Finno-Ugric Languages and the Internet project (SUKI) supported by the Kone foundation from their...
  • Metadata: 2/5

    The Karjalainen Corpus

    Computer corpus of Finnish newspaper texts of the 1990s (newspaper Karjalainen, Joensuu). The purpose of the resource use must be outlined in a research plan.