translation
translation
{ "cs": "Následný postup na základě usnesení Parlamentu: viz zápis", "en": "Action taken on Parliament's resolutions: see Minutes" }
{ "cs": "Předložení dokumentů: viz zápis", "en": "Documents received: see Minutes" }
{ "cs": "Písemná prohlášení (článek 116 jednacího řádu): viz zápis", "en": "Written statements (Rule 116): see Minutes" }
{ "cs": "Texty smluv dodané Radou: viz zápis", "en": "Texts of agreements forwarded by the Council: see Minutes" }
{ "cs": "Složení Parlamentu: viz zápis", "en": "Membership of Parliament: see Minutes" }
{ "cs": "Členství ve výborech a delegacích: viz zápis", "en": "Membership of committees and delegations: see Minutes" }
{ "cs": "Budoucí akce v oblasti patentů (předložené návrhy usnesení): viz zápis", "en": "Future action in the field of patents (motions for resolutions tabled): see Minutes" }
{ "cs": "Pořad jednání příštího zasedání: viz zápis", "en": "Agenda for next sitting: see Minutes" }
{ "cs": "Ukončení zasedání", "en": "Closure of sitting" }
{ "cs": "(La seduta è tolta alle 23.55)", "en": "(The sitting was closed at 11.55 p.m.)" }
{ "cs": "Zahájení zasedání", "en": "Opening of the sitting" }
{ "cs": "(\" συνεδρίαση αρχίζει στις 9 π.μ.)", "en": "(The sitting was opened at 9 a.m.)" }
{ "cs": "Předložení dokumentů: viz zápis", "en": "Documents received: see Minutes" }
{ "cs": "Schválení zápisu z předchozího zasedání: viz zápis", "en": "Approval of Minutes of previous sitting: see Minutes" }
{ "cs": "Členství ve výborech a delegacích: viz zápis", "en": "Membership of committees and delegations: see Minutes" }
{ "cs": "1.", "en": "1." }
{ "cs": "Dohoda ES/Bulharsko: účast na činnosti Evropského monitorovacího centra pro drogy a drogovou závislost (hlasování)", "en": "EC-Bulgaria Agreement: participation in the work of the European Monitoring Centre for Drugs and Drug Addiction (vote)" }
{ "cs": "2.", "en": "2." }
{ "cs": "Dohoda ES/Rumunsko: účast na činnosti Evropského monitorovacího centra pro drogy a drogovou závislost (hlasování)", "en": "EC-Romania Agreement: participation in the work of the European Monitoring Centre for Drugs and Drug Addiction (vote)" }
{ "cs": "3.", "en": "3." }
{ "cs": "Dohoda ES/Turecko: účast na činnosti Evropského monitorovacího centra pro drogy a drogovou závislost (hlasování)", "en": "EC-Turkey Agreement: participation in the work of the European Monitoring Centre for Drugs and Drug Addiction (vote)" }
{ "cs": "4.", "en": "4." }
{ "cs": "Dohoda mezi Evropským společenstvím a Singapurem o některých aspektech leteckých služeb (hlasování)", "en": "Agreement between the EC and Singapore on certain aspects of air services (vote)" }
{ "cs": "5.", "en": "5." }
{ "cs": "Dohoda mezi ES a Austrálií o některých aspektech leteckých služeb (hlasování)", "en": "Agreement between the EC and Australia on certain aspects of air services (vote)" }
{ "cs": "6.", "en": "6." }
{ "cs": "Dohoda ES/Nový Zéland o některých aspektech leteckých služeb (hlasování)", "en": "Agreement between the EC and New Zealand on certain aspects of air services (vote)" }
{ "cs": "7.", "en": "7." }
{ "cs": "Dohoda ES/ Uruguay o některých aspektech leteckých služeb (hlasování)", "en": "Agreement between the EC and Uruguay on certain aspects of air services (vote)" }
{ "cs": "8.", "en": "8." }
{ "cs": "Dohoda mezi Evropským společenstvím a Maledivskou republikou o některých aspektech leteckých služeb (hlasování)", "en": "Agreement between the EC and the Maldives on certain aspects of air services (vote)" }
{ "cs": "9.", "en": "9." }
{ "cs": "Řízení evropských družicových navigačních programů (hlasování)", "en": "Management of the European satellite radio-navigation programmes (vote)" }
{ "cs": "10.", "en": "10." }
{ "cs": "Požadovaná jakost vod pro měkkýše (kodifikované znění) (hlasování)", "en": "Quality required of shellfish waters (codified version) (vote)" }
{ "cs": "11.", "en": "11." }
{ "cs": "Klamavá a srovnávací reklama (kodifikované znění) (hlasování)", "en": "Misleading and comparative advertising (vote)" }
{ "cs": "12.", "en": "12." }
{ "cs": "Doba ochrany autorského práva a určitých práv s ním souvisejících (kodifikované znění) (hlasování)", "en": "Protection of copyright and certain related rights (codified version) (vote)" }
{ "cs": "13.", "en": "13." }
{ "cs": "Právo na pronájem a půjčování a některá práva v oblasti duševního vlastnictví související s autorským právem (kodifikované znění) (hlasování)", "en": "Rights related to copyright (vote)" }
{ "cs": "14.", "en": "14." }
{ "cs": "Ochrana proti štítence zhoubné (kodifikované znění) (hlasování)", "en": "Control of San José Scale (codified version) (vote)" }
{ "cs": "15.", "en": "15." }
{ "cs": "Glukóza a laktóza (kodifikované znění) (hlasování)", "en": "Glucose and lactose (vote)" }
{ "cs": "16.", "en": "16." }
{ "cs": "Změna článků 3 a 4 jednacího řádu Parlamentu (hlasování)", "en": "Amendment of Rules 3 and 4 of Parliament's Rules of Procedure (vote)" }
{ "cs": "19.", "en": "19." }
{ "cs": "Statistická klasifikace ekonomických činností NACE (hlasování)", "en": "Statistical classification of economic activities - NACE Rev. 2 (vote)" }
{ "cs": "20.", "en": "20." }
{ "cs": "Mimořádná finanční pomoc Společenství Kosovu (hlasování)", "en": "Exceptional Community financial assistance to Kosovo (vote)" }
{ "cs": "21.", "en": "21." }
{ "cs": "Evropská agentura pro obnovu (hlasování)", "en": "European Agency for Reconstruction (vote)" }
{ "cs": "25.", "en": "25." }
{ "cs": "Dobré životní podmínky a ochrana zvířat (2006-2010) (hlasování)", "en": "The protection and welfare of animals 2006-2010 (vote)" }
{ "cs": "26.", "en": "26." }
{ "cs": "Následné kroky po zprávě o soutěži v oblasti volných profesí (hlasování)", "en": "Follow-up to the report on competition in professional services (vote)" }
{ "cs": "Opravy hlasování a sdělení o úmyslu hlasovat: viz zápis", "en": "Corrections to votes and voting intentions: see Minutes" }
{ "cs": "Složení Parlamentu: viz zápis", "en": "Membership of Parliament: see Minutes" }
{ "cs": "Rozhodnutí o určitých dokumentech: viz zápis", "en": "Decisions concerning certain documents: see Minutes" }
{ "cs": "Předání přijatých textů během schůze: viz zápis", "en": "Forwarding of texts adopted during the sitting: see Minutes" }
{ "cs": "Termíny příštích zasedání: viz zápis", "en": "Dates for next sittings: see Minutes" }
{ "cs": "Přerušení zasedání", "en": "Adjournment of the session" }
{ "cs": "(Se levanta la sesión a las 12.10 horas)", "en": "(The sitting was closed at 12.10 p.m.)" }
{ "cs": "Schválení zápisu z předchozího zasedání: viz zápis", "en": "Approval of Minutes of previous sitting: see Minutes" }
{ "cs": "Členství ve výborech a delegacích: viz zápis", "en": "Membership of committees and delegations: see Minutes" }
{ "cs": "Podepisování aktů přijatých postupem spolurozhodování: viz zápis", "en": "Signature of acts adopted under codecision: see Minutes" }
{ "cs": "Sdělení předsednictva: viz zápis", "en": "Announcement by the President: see Minutes" }
{ "cs": "Vztahy mezi Evropskou unií a Ruskem po vraždě novinářky Anny Politkovské (předložené návrhy usnesení)", "en": "Relations between the European Union and Russia following the assassination of journalist Anna Politkovskaya (motions for resolution tabled)" }
{ "cs": "Předložení dokumentů: viz zápis", "en": "Documents received: see Minutes" }
{ "cs": "Petice: viz zápis", "en": "Petitions: see Minutes" }
{ "cs": "Převody prostředků: viz zápis", "en": "Transfers of appropriations: see Minutes" }
{ "cs": "Texty smluv dodané Radou: viz zápis", "en": "Texts of agreements forwarded by the Council: see Minutes" }
{ "cs": "Následný postup na základě usnesení Parlamentu: viz zápis", "en": "Action taken on Parliament's resolutions: see Minutes" }
{ "cs": "Písemná prohlášení (článek 116 jednacího řádu): viz zápis", "en": "Written declarations (Rule 116): see Minutes" }
{ "cs": "Pořad jednání příštího zasedání: viz zápis", "en": "Agenda for next sitting: see Minutes" }
{ "cs": "Ukončení zasedání", "en": "Closure of sitting" }
{ "cs": "(La seduta è tolta alle 22.20)", "en": "(The sitting was closed at 10.20 p.m.)" }
{ "cs": "Rozpravy o případech porušování lidských práv, demokracie a právního státu (oznámení předložených návrhů usnesení): viz zápis", "en": "Debates on cases of breaches of human rights, democracy and the rule of law (announcement of motions for resolutions tabled): see Minutes" }
{ "cs": "1.", "en": "1." }
{ "cs": "Organizace spojených národů: schvalování vozidel kategorie M2 nebo M3 z hlediska jejich celkové konstrukce (hlasování)", "en": "United Nations: approval of category M2 or M3 vehicles with regard to their general construction (vote)" }
{ "cs": "2.", "en": "2." }
{ "cs": "Přistoupení Bulharska a Rumunska - nábor úředníků Evropských společenství (hlasování)", "en": "Accession of Bulgaria and Romania: recruitment of officials of the European Communities (vote)" }
{ "cs": "3.", "en": "3." }
{ "cs": "Změna stanov společného podniku Galileo (hlasování)", "en": "Amendment of the Statutes of the Galileo Joint Undertaking (vote)" }
{ "cs": "4.", "en": "4." }
{ "cs": "Finanční účast Norska na práci Evropského monitorovacího centra pro drogy a drogovou závislost (EMCDDA) (hlasování)", "en": "Norway and the EMCDDA (vote)" }
{ "cs": "5.", "en": "5." }
{ "cs": "Žádost o zbavení imunity Bogdana Golika (hlasování)", "en": "Request for waiver of the immunity of Bogdan Golik (vote)" }
{ "cs": "6.", "en": "6." }
{ "cs": "Žádost na ochranu imunity a výsad pana Maria Borghezia (hlasování)", "en": "Defence of immunity of Mario Borghezio (vote)" }
{ "cs": "7.", "en": "7." }
{ "cs": "Návrh opravného rozpočtu Evropské unie č. 3/2006 na rozpočtový rok 2006 (hlasování)", "en": "Draft amending budget No 3/2006 (vote)" }
{ "cs": "8.", "en": "8." }
{ "cs": "Návrh opravného rozpočtu Evropské unie č. 5/2006 na rozpočtový rok 2006 (hlasování)", "en": "Draft amending budget No 5/2006 (vote)" }
{ "cs": "9.", "en": "9." }
{ "cs": "Strategické partnerství mezi Evropskou unií a Jihoafrickou republikou (hlasování)", "en": "An EU-South Africa Strategic Partnership (vote)" }
{ "cs": "10.", "en": "10." }
{ "cs": "Finanční nástroj pro životní prostředí (LIFE+) (hlasování)", "en": "LIFE + (vote)" }
{ "cs": "11.", "en": "11." }

Dataset Card for "wmt19"

Dataset Summary

Warning: There are issues with the Common Crawl corpus data (training-parallel-commoncrawl.tgz):

  • Non-English files contain many English sentences.
  • Their "parallel" sentences in English are not aligned: they are uncorrelated with their counterpart.

We have contacted the WMT organizers.

Translation dataset based on the data from statmt.org.

Versions exist for different years using a combination of data sources. The base wmt allows you to create a custom dataset by choosing your own data/language pair. This can be done as follows:

from datasets import inspect_dataset, load_dataset_builder

inspect_dataset("wmt19", "path/to/scripts")
builder = load_dataset_builder(
    "path/to/scripts/wmt_utils.py",
    language_pair=("fr", "de"),
    subsets={
        datasets.Split.TRAIN: ["commoncrawl_frde"],
        datasets.Split.VALIDATION: ["euelections_dev2019"],
    },
)

# Standard version
builder.download_and_prepare()
ds = builder.as_dataset()

# Streamable version
ds = builder.as_streaming_dataset()

Supported Tasks and Leaderboards

More Information Needed

Languages

More Information Needed

Dataset Structure

Data Instances

cs-en

  • Size of downloaded dataset files: 2.02 GB
  • Size of the generated dataset: 1.32 GB
  • Total amount of disk used: 3.33 GB

An example of 'validation' looks as follows.


Data Fields

The data fields are the same among all splits.

cs-en

  • translation: a multilingual string variable, with possible languages including cs, en.

Data Splits

name train validation
cs-en 7270695 2983

Dataset Creation

Curation Rationale

More Information Needed

Source Data

Initial Data Collection and Normalization

More Information Needed

Who are the source language producers?

More Information Needed

Annotations

Annotation process

More Information Needed

Who are the annotators?

More Information Needed

Personal and Sensitive Information

More Information Needed

Considerations for Using the Data

Social Impact of Dataset

More Information Needed

Discussion of Biases

More Information Needed

Other Known Limitations

More Information Needed

Additional Information

Dataset Curators

More Information Needed

Licensing Information

More Information Needed

Citation Information


@ONLINE {wmt19translate,
    author = "Wikimedia Foundation",
    title  = "ACL 2019 Fourth Conference on Machine Translation (WMT19), Shared Task: Machine Translation of News",
    url    = "http://www.statmt.org/wmt19/translation-task.html"
}

Contributions

Thanks to @patrickvonplaten, @mariamabarham, @thomwolf for adding this dataset.

Downloads last month
3,162
Edit dataset card
Evaluate models HF Leaderboard

Models trained or fine-tuned on wmt19