Datasets:
Tasks:
Translation
Multilinguality:
translation
Size Categories:
10M<n<100M
Language Creators:
found
Annotations Creators:
no-annotation
License:
unknown
translation
translation
|
---|
{
"cs": "Následný postup na základě usnesení Parlamentu: viz zápis",
"en": "Action taken on Parliament's resolutions: see Minutes"
} |
{
"cs": "Předložení dokumentů: viz zápis",
"en": "Documents received: see Minutes"
} |
{
"cs": "Písemná prohlášení (článek 116 jednacího řádu): viz zápis",
"en": "Written statements (Rule 116): see Minutes"
} |
{
"cs": "Texty smluv dodané Radou: viz zápis",
"en": "Texts of agreements forwarded by the Council: see Minutes"
} |
{
"cs": "Složení Parlamentu: viz zápis",
"en": "Membership of Parliament: see Minutes"
} |
{
"cs": "Členství ve výborech a delegacích: viz zápis",
"en": "Membership of committees and delegations: see Minutes"
} |
{
"cs": "Budoucí akce v oblasti patentů (předložené návrhy usnesení): viz zápis",
"en": "Future action in the field of patents (motions for resolutions tabled): see Minutes"
} |
{
"cs": "Pořad jednání příštího zasedání: viz zápis",
"en": "Agenda for next sitting: see Minutes"
} |
{
"cs": "Ukončení zasedání",
"en": "Closure of sitting"
} |
{
"cs": "(La seduta è tolta alle 23.55)",
"en": "(The sitting was closed at 11.55 p.m.)"
} |
{
"cs": "Zahájení zasedání",
"en": "Opening of the sitting"
} |
{
"cs": "(\" συνεδρίαση αρχίζει στις 9 π.μ.)",
"en": "(The sitting was opened at 9 a.m.)"
} |
{
"cs": "Předložení dokumentů: viz zápis",
"en": "Documents received: see Minutes"
} |
{
"cs": "Schválení zápisu z předchozího zasedání: viz zápis",
"en": "Approval of Minutes of previous sitting: see Minutes"
} |
{
"cs": "Členství ve výborech a delegacích: viz zápis",
"en": "Membership of committees and delegations: see Minutes"
} |
{
"cs": "1.",
"en": "1."
} |
{
"cs": "Dohoda ES/Bulharsko: účast na činnosti Evropského monitorovacího centra pro drogy a drogovou závislost (hlasování)",
"en": "EC-Bulgaria Agreement: participation in the work of the European Monitoring Centre for Drugs and Drug Addiction (vote)"
} |
{
"cs": "2.",
"en": "2."
} |
{
"cs": "Dohoda ES/Rumunsko: účast na činnosti Evropského monitorovacího centra pro drogy a drogovou závislost (hlasování)",
"en": "EC-Romania Agreement: participation in the work of the European Monitoring Centre for Drugs and Drug Addiction (vote)"
} |
{
"cs": "3.",
"en": "3."
} |
{
"cs": "Dohoda ES/Turecko: účast na činnosti Evropského monitorovacího centra pro drogy a drogovou závislost (hlasování)",
"en": "EC-Turkey Agreement: participation in the work of the European Monitoring Centre for Drugs and Drug Addiction (vote)"
} |
{
"cs": "4.",
"en": "4."
} |
{
"cs": "Dohoda mezi Evropským společenstvím a Singapurem o některých aspektech leteckých služeb (hlasování)",
"en": "Agreement between the EC and Singapore on certain aspects of air services (vote)"
} |
{
"cs": "5.",
"en": "5."
} |
{
"cs": "Dohoda mezi ES a Austrálií o některých aspektech leteckých služeb (hlasování)",
"en": "Agreement between the EC and Australia on certain aspects of air services (vote)"
} |
{
"cs": "6.",
"en": "6."
} |
{
"cs": "Dohoda ES/Nový Zéland o některých aspektech leteckých služeb (hlasování)",
"en": "Agreement between the EC and New Zealand on certain aspects of air services (vote)"
} |
{
"cs": "7.",
"en": "7."
} |
{
"cs": "Dohoda ES/ Uruguay o některých aspektech leteckých služeb (hlasování)",
"en": "Agreement between the EC and Uruguay on certain aspects of air services (vote)"
} |
{
"cs": "8.",
"en": "8."
} |
{
"cs": "Dohoda mezi Evropským společenstvím a Maledivskou republikou o některých aspektech leteckých služeb (hlasování)",
"en": "Agreement between the EC and the Maldives on certain aspects of air services (vote)"
} |
{
"cs": "9.",
"en": "9."
} |
{
"cs": "Řízení evropských družicových navigačních programů (hlasování)",
"en": "Management of the European satellite radio-navigation programmes (vote)"
} |
{
"cs": "10.",
"en": "10."
} |
{
"cs": "Požadovaná jakost vod pro měkkýše (kodifikované znění) (hlasování)",
"en": "Quality required of shellfish waters (codified version) (vote)"
} |
{
"cs": "11.",
"en": "11."
} |
{
"cs": "Klamavá a srovnávací reklama (kodifikované znění) (hlasování)",
"en": "Misleading and comparative advertising (vote)"
} |
{
"cs": "12.",
"en": "12."
} |
{
"cs": "Doba ochrany autorského práva a určitých práv s ním souvisejících (kodifikované znění) (hlasování)",
"en": "Protection of copyright and certain related rights (codified version) (vote)"
} |
{
"cs": "13.",
"en": "13."
} |
{
"cs": "Právo na pronájem a půjčování a některá práva v oblasti duševního vlastnictví související s autorským právem (kodifikované znění) (hlasování)",
"en": "Rights related to copyright (vote)"
} |
{
"cs": "14.",
"en": "14."
} |
{
"cs": "Ochrana proti štítence zhoubné (kodifikované znění) (hlasování)",
"en": "Control of San José Scale (codified version) (vote)"
} |
{
"cs": "15.",
"en": "15."
} |
{
"cs": "Glukóza a laktóza (kodifikované znění) (hlasování)",
"en": "Glucose and lactose (vote)"
} |
{
"cs": "16.",
"en": "16."
} |
{
"cs": "Změna článků 3 a 4 jednacího řádu Parlamentu (hlasování)",
"en": "Amendment of Rules 3 and 4 of Parliament's Rules of Procedure (vote)"
} |
{
"cs": "19.",
"en": "19."
} |
{
"cs": "Statistická klasifikace ekonomických činností NACE (hlasování)",
"en": "Statistical classification of economic activities - NACE Rev. 2 (vote)"
} |
{
"cs": "20.",
"en": "20."
} |
{
"cs": "Mimořádná finanční pomoc Společenství Kosovu (hlasování)",
"en": "Exceptional Community financial assistance to Kosovo (vote)"
} |
{
"cs": "21.",
"en": "21."
} |
{
"cs": "Evropská agentura pro obnovu (hlasování)",
"en": "European Agency for Reconstruction (vote)"
} |
{
"cs": "25.",
"en": "25."
} |
{
"cs": "Dobré životní podmínky a ochrana zvířat (2006-2010) (hlasování)",
"en": "The protection and welfare of animals 2006-2010 (vote)"
} |
{
"cs": "26.",
"en": "26."
} |
{
"cs": "Následné kroky po zprávě o soutěži v oblasti volných profesí (hlasování)",
"en": "Follow-up to the report on competition in professional services (vote)"
} |
{
"cs": "Opravy hlasování a sdělení o úmyslu hlasovat: viz zápis",
"en": "Corrections to votes and voting intentions: see Minutes"
} |
{
"cs": "Složení Parlamentu: viz zápis",
"en": "Membership of Parliament: see Minutes"
} |
{
"cs": "Rozhodnutí o určitých dokumentech: viz zápis",
"en": "Decisions concerning certain documents: see Minutes"
} |
{
"cs": "Předání přijatých textů během schůze: viz zápis",
"en": "Forwarding of texts adopted during the sitting: see Minutes"
} |
{
"cs": "Termíny příštích zasedání: viz zápis",
"en": "Dates for next sittings: see Minutes"
} |
{
"cs": "Přerušení zasedání",
"en": "Adjournment of the session"
} |
{
"cs": "(Se levanta la sesión a las 12.10 horas)",
"en": "(The sitting was closed at 12.10 p.m.)"
} |
{
"cs": "Schválení zápisu z předchozího zasedání: viz zápis",
"en": "Approval of Minutes of previous sitting: see Minutes"
} |
{
"cs": "Členství ve výborech a delegacích: viz zápis",
"en": "Membership of committees and delegations: see Minutes"
} |
{
"cs": "Podepisování aktů přijatých postupem spolurozhodování: viz zápis",
"en": "Signature of acts adopted under codecision: see Minutes"
} |
{
"cs": "Sdělení předsednictva: viz zápis",
"en": "Announcement by the President: see Minutes"
} |
{
"cs": "Vztahy mezi Evropskou unií a Ruskem po vraždě novinářky Anny Politkovské (předložené návrhy usnesení)",
"en": "Relations between the European Union and Russia following the assassination of journalist Anna Politkovskaya (motions for resolution tabled)"
} |
{
"cs": "Předložení dokumentů: viz zápis",
"en": "Documents received: see Minutes"
} |
{
"cs": "Petice: viz zápis",
"en": "Petitions: see Minutes"
} |
{
"cs": "Převody prostředků: viz zápis",
"en": "Transfers of appropriations: see Minutes"
} |
{
"cs": "Texty smluv dodané Radou: viz zápis",
"en": "Texts of agreements forwarded by the Council: see Minutes"
} |
{
"cs": "Následný postup na základě usnesení Parlamentu: viz zápis",
"en": "Action taken on Parliament's resolutions: see Minutes"
} |
{
"cs": "Písemná prohlášení (článek 116 jednacího řádu): viz zápis",
"en": "Written declarations (Rule 116): see Minutes"
} |
{
"cs": "Pořad jednání příštího zasedání: viz zápis",
"en": "Agenda for next sitting: see Minutes"
} |
{
"cs": "Ukončení zasedání",
"en": "Closure of sitting"
} |
{
"cs": "(La seduta è tolta alle 22.20)",
"en": "(The sitting was closed at 10.20 p.m.)"
} |
{
"cs": "Rozpravy o případech porušování lidských práv, demokracie a právního státu (oznámení předložených návrhů usnesení): viz zápis",
"en": "Debates on cases of breaches of human rights, democracy and the rule of law (announcement of motions for resolutions tabled): see Minutes"
} |
{
"cs": "1.",
"en": "1."
} |
{
"cs": "Organizace spojených národů: schvalování vozidel kategorie M2 nebo M3 z hlediska jejich celkové konstrukce (hlasování)",
"en": "United Nations: approval of category M2 or M3 vehicles with regard to their general construction (vote)"
} |
{
"cs": "2.",
"en": "2."
} |
{
"cs": "Přistoupení Bulharska a Rumunska - nábor úředníků Evropských společenství (hlasování)",
"en": "Accession of Bulgaria and Romania: recruitment of officials of the European Communities (vote)"
} |
{
"cs": "3.",
"en": "3."
} |
{
"cs": "Změna stanov společného podniku Galileo (hlasování)",
"en": "Amendment of the Statutes of the Galileo Joint Undertaking (vote)"
} |
{
"cs": "4.",
"en": "4."
} |
{
"cs": "Finanční účast Norska na práci Evropského monitorovacího centra pro drogy a drogovou závislost (EMCDDA) (hlasování)",
"en": "Norway and the EMCDDA (vote)"
} |
{
"cs": "5.",
"en": "5."
} |
{
"cs": "Žádost o zbavení imunity Bogdana Golika (hlasování)",
"en": "Request for waiver of the immunity of Bogdan Golik (vote)"
} |
{
"cs": "6.",
"en": "6."
} |
{
"cs": "Žádost na ochranu imunity a výsad pana Maria Borghezia (hlasování)",
"en": "Defence of immunity of Mario Borghezio (vote)"
} |
{
"cs": "7.",
"en": "7."
} |
{
"cs": "Návrh opravného rozpočtu Evropské unie č. 3/2006 na rozpočtový rok 2006 (hlasování)",
"en": "Draft amending budget No 3/2006 (vote)"
} |
{
"cs": "8.",
"en": "8."
} |
{
"cs": "Návrh opravného rozpočtu Evropské unie č. 5/2006 na rozpočtový rok 2006 (hlasování)",
"en": "Draft amending budget No 5/2006 (vote)"
} |
{
"cs": "9.",
"en": "9."
} |
{
"cs": "Strategické partnerství mezi Evropskou unií a Jihoafrickou republikou (hlasování)",
"en": "An EU-South Africa Strategic Partnership (vote)"
} |
{
"cs": "10.",
"en": "10."
} |
{
"cs": "Finanční nástroj pro životní prostředí (LIFE+) (hlasování)",
"en": "LIFE + (vote)"
} |
{
"cs": "11.",
"en": "11."
} |
Dataset Card for "wmt19"
Dataset Summary
Warning: There are issues with the Common Crawl corpus data (training-parallel-commoncrawl.tgz):
- Non-English files contain many English sentences.
- Their "parallel" sentences in English are not aligned: they are uncorrelated with their counterpart.
We have contacted the WMT organizers.
Translation dataset based on the data from statmt.org.
Versions exist for different years using a combination of data
sources. The base wmt
allows you to create a custom dataset by choosing
your own data/language pair. This can be done as follows:
from datasets import inspect_dataset, load_dataset_builder
inspect_dataset("wmt19", "path/to/scripts")
builder = load_dataset_builder(
"path/to/scripts/wmt_utils.py",
language_pair=("fr", "de"),
subsets={
datasets.Split.TRAIN: ["commoncrawl_frde"],
datasets.Split.VALIDATION: ["euelections_dev2019"],
},
)
# Standard version
builder.download_and_prepare()
ds = builder.as_dataset()
# Streamable version
ds = builder.as_streaming_dataset()
Supported Tasks and Leaderboards
Languages
Dataset Structure
Data Instances
cs-en
- Size of downloaded dataset files: 2.02 GB
- Size of the generated dataset: 1.32 GB
- Total amount of disk used: 3.33 GB
An example of 'validation' looks as follows.
Data Fields
The data fields are the same among all splits.
cs-en
translation
: a multilingualstring
variable, with possible languages includingcs
,en
.
Data Splits
name | train | validation |
---|---|---|
cs-en | 7270695 | 2983 |
Dataset Creation
Curation Rationale
Source Data
Initial Data Collection and Normalization
Who are the source language producers?
Annotations
Annotation process
Who are the annotators?
Personal and Sensitive Information
Considerations for Using the Data
Social Impact of Dataset
Discussion of Biases
Other Known Limitations
Additional Information
Dataset Curators
Licensing Information
Citation Information
@ONLINE {wmt19translate,
author = "Wikimedia Foundation",
title = "ACL 2019 Fourth Conference on Machine Translation (WMT19), Shared Task: Machine Translation of News",
url = "http://www.statmt.org/wmt19/translation-task.html"
}
Contributions
Thanks to @patrickvonplaten, @mariamabarham, @thomwolf for adding this dataset.
- Downloads last month
- 3,162
Homepage:
statmt.org
Size of downloaded dataset files:
2.02 GB
Size of the auto-converted Parquet files (First 5GB):
5.63 GB
Number of rows (First 5GB):
45,215,305
Models trained or fine-tuned on wmt19
Translation
•
Updated
•
44.2k
•
15