Databáze IATE může být stažena jako TBX
Thread poster: Milan Condak
Milan Condak
Milan Condak  Identity Verified
Local time: 14:15
English to Czech
Mar 27, 2015

InterActive Terminology for Europe

Příspěvek
(Part of) the IATE database can now be downloaded as a massive TBX!
Thread poster: Michael Beijer ze dne 10. července 2014... See more
InterActive Terminology for Europe

Příspěvek
(Part of) the IATE database can now be downloaded as a massive TBX!
Thread poster: Michael Beijer ze dne 10. července 2014

http://www.proz.com/forum/translator_resources/271879-part_of_the_iate_database_can_now_be_downloaded_as_a_massive_tbx.html

obsahuje odkaz na stránku

Download IATE and the IATE extraction tool IATExtract.jar

popisující databázi a SW, které je možno stáhnout

http://iate.europa.eu/tbxPageDownload.do

You can download the file by clicking on the link below.
IATE_download_27012015.zip (Publication date: 27/01/2015)

Statistics
The download file contains 1.3 million entries, 8 million terms in 24 official EU languages.
Language Number of terms

Czech 28865
(Podle tabulky má méně výrazů než čeština pouze chorvatština.)

Poslední příspěvek na ProZ.com je starší než lednová databáze.

http://www.proz.com/forum/translator_resources/271879-
part_of_the_iate_database_can_now_be_downloaded_as_a_massive_tbx-page3.html

Very useful Oct 20, 2014
-
V červenci 2014 jsem si stáhl zazipovaný soubor.
Vyextrahoval jsem dvojici CS a EN. Soubor TBX má velikost 17,1 MB. Soubor jsem otevřel v
programu Xbench a vyexportoval jsem jsem z něj textový soubor EN-CS v kódování UTF-8.
Červencový soubor má 19642 českých výrazů.
V programu LF-Editor jsem smazal všechny sloupce, kromě prvních dvou. TXT soubor má velikost 1,3 MB. Glosář mohu použít například v OmegaT.

Milan
Collapse


 
Milan Condak
Milan Condak  Identity Verified
Local time: 14:15
English to Czech
TOPIC STARTER
Databáze z listopadu 2016 Feb 23, 2017

Milan Condak wrote:

Very useful Oct 20, 2014
-
V červenci 2014 jsem si stáhl zazipovaný soubor.
Vyextrahoval jsem dvojici CS a EN. Soubor TBX má velikost 17,1 MB. Soubor jsem otevřel v
programu Xbench a vyexportoval jsem jsem z něj textový soubor EN-CS v kódování UTF-8.
Červencový soubor má 19642 českých výrazů.
V programu LF-Editor jsem smazal všechny sloupce, kromě prvních dvou. TXT soubor má velikost 1,3 MB. Glosář mohu použít například v OmegaT.

Milan


Letos jsem vyzkoušel import TBX do demoverze Wordfastu 4 a editaci textového souboru ve Wordfastu Classic. V OmegaT jsem využíval TBX jako glosář nebo jako slovník StarDict.

Během pěti dnů jsem udělal pět prezentací.

Rekapitulace prezentací o TBX, IATE, EuroVocu a nástrojích Wordfast a OmegaT

http://www.condak.cz/nove/2017-02/21/cs/03.html

Otázka zní: co je vhodné PEMT, MT, slovník, glosář nebo TM?

Můj názor: nejlepší je zdroje konfrontovat a použít terminologii zákazníka. Když je zákazníkem orgán EU jsou k dispozici překladové paměti nebo vícejazyčné náhledy (například DGT, eur-lex nebo IATE) nebo text v cílovém jazyce.

Pro prezentaci jsem překládal soubor PDF: Minimální platy v EU

http://ec.europa.eu/eurostat/documents/2995521/7860532/3-10022017-AP-EN.pdf

V prezentaci jsem se zmínil o překladu "national". Jiný příklad je "United Kingdom": My Memory (Google Translate) překládá jako Velká Británie, EU, například v tiskových zprávách, překládá jako "Spojené království". Takový termín je nutné vložit do glosáře a nesprávný překlad do blacklistu.

Terminologie je to, co je definované a závazné. IATE je sbírka možných překladů a výklady významu výrazů a rozpis zkratek = pouhé návrhy.

Milan
http://www.condak.cz/nove/


 
Milan Condak
Milan Condak  Identity Verified
Local time: 14:15
English to Czech
TOPIC STARTER
Databáze ze srpna 2017 Sep 28, 2017

Milan Condak wrote:

InterActive Terminology for Europe

Vyextrahoval jsem dvojici CS a EN. Soubor TBX má velikost 17,1 MB. Soubor jsem otevřel v
programu Xbench a vyexportoval jsem jsem z něj textový soubor EN-CS v kódování UTF-8.
Červencový soubor má 19.642 českých výrazů.
V programu LF-Editor jsem smazal všechny sloupce, kromě prvních dvou. TXT soubor má velikost 1,3 MB.



Dnes je státní svátek a tak jsem porovnal dvě informace a opět jsem udělal vlastní pokus.

1. Na stránkách (5,6,7 a 8) jsou k zakoupení glosáře a termbáze pro různé CAT nástroje.

https://www.tm-town.com/terminology-marketplace?button=&marketplace_language_pair=All&page=6&search=&seller=428&utf8=✓

Czech to English IATE terminology package
63,769 Term Concepts | 0 sales Czech to English
€5.50
general

Bilingual files extracted from the European Union’s IATE Termbase and formatted for various CAT-tools.
===
2. Na stránce IATE je zdroj všech dat

http://iate.europa.eu/tbxPageDownload.do

You can download the file by clicking on the link below.

IATE_download.zip (Publication date: 18/08/2017)

Statistics
The download file contains 1.3 million entries, 8 million terms in 24 official EU languages.

3. Porovnal jsem uvedené údaje. Levý sloupec IATE uvádí 38.845 českých termínů. Pravý sloupec TM-town uvádí páry čeština plus další jazyk. Pokud je počet českých výrazů 38.845, tak údaje v pravém sloupci, které jsou větší než 38.845 jsou velmi nepravděpodobné.

Language Number of terms
IATE TM-town za 5,50 €

Czech to XX
Bulgarian 41.321 34.313
Czech 38.845
Danish 57.3267 50.641
German 944.297 54.071
Greek 492.120 44.578
English 1.305.010 63.769
Spanish 582.572 49.042
Estonian 47.545 36.100
Finnish 325.975 47.121
French 1.231.278 55.187
Irish 68.990 31.357
Croatian 19.063 15.133
Hungarian 45.090 34.746
Italian 658.604 50.207
Lithuanian 48.848 36.772
Latvian 42.413 34.302
Maltese 55.499 39.836
Dutch 657.496 49.760
Polish 72.413 42.435
Portuguese 484.414 45.816
Romanian 49.942 37.383
Slovak 45.593 37.383
Slovenian 53.290 38.595
Swedish 304.231 40.643
Latin 62.602

Multilinugal 5.540
All 8.256.258
==
4. Extrakce aglicko-české terminologie

Stažený zip má velikost 127,136 356 MB.

a) extrahovaný TBX s češtinou a angličtinou má velikost 25.538 MB
b) do programu Xbench jsem načetl TBX a vyexportoval jsem TMX; soubory mají 29.062 položek
c) do programu TM Lookup jsem naimportoval TMX a vyexportoval soubor TXT v kódování UTF-8; textový soubor má velikost 1,679 MB

Tož tak. Abych přidal trochu moravského folklóru.

Milan


 
Milan Condak
Milan Condak  Identity Verified
Local time: 14:15
English to Czech
TOPIC STARTER
Aktualizace souboru IATE z 30.1.2018 Feb 1, 2018

Milan Condak wrote:

Language Number of terms

Bulgarian 41.321 34.313
Czech 38.845
English 1.305.010 63.769
Polish 72.413 42.435
...

a) extrahovaný TBX s češtinou a angličtinou má velikost 25.538 MB
b) do programu Xbench jsem načetl TBX a vyexportoval jsem TMX; soubory mají 29.062 položek



Polský slovník v OmegaT

http://www.condak.cz/nove/2018-01/31/cs/00.html

01 IATE - česko-polský soubor TBX
02 TMLookUp, import TMX, export TXT
03 StarDict Editor
04 Glosář a slovník v OmegaT

Milan


 
Milan Condak
Milan Condak  Identity Verified
Local time: 14:15
English to Czech
TOPIC STARTER
Aktualizace IATE k 29.8.2018 Oct 20, 2018



http://www.condak.cz/nove/2018-10/03/cs/00.html

IATE - EN-PT update 2018-08-29

a folha plus TBX, TMX, TXT

01 IATE - update 2018-08
02 Looking for freeware TBX editor
03 Export EN-PT TBX from IATE
04 Projekt PT-CS a folha DGT
05 Projekt PT-EN a folha + IATE TMX
06 Analýza programem JEX
07 Projekt PT-EN a folha + IATE TBX
08 Archivní Eurovoc, pár EN-CS

Milan 03.10.2018 (data)

publikovano 20.10.2018
--
Postupně TBX, Xbench, TMX, Goldpan, Exel, JEX, eurovoc, OmegaT. Koupenou licenci mám pouze na Exel.


 
Milan Condak
Milan Condak  Identity Verified
Local time: 14:15
English to Czech
TOPIC STARTER
eTranslate a změny na webech IATE a EurLexu Nov 12, 2018

Tentokrát jsem terminologii nestahoval, pouze informuji o změnách. Datum posledního sestavení: 08/11/2018.

Milan Condak wrote:

http://www.condak.cz/nove/2018-10/03/cs/00.html

IATE - EN-PT update 2018-08-29

Milan 03.10.2018 (data)

publikovano 20.10.2018


EurLex a IATE používají eTranslate (neuronový překladač EU) a mají aktualizované webové stránky.
=======================

1. https://iate.europa.eu/download-iate

Velikost nekomprimovaného souboru: 1,97 gigabytes
Velikost komprimovaného (staženého) souboru: 112 megabytes
Datum posledního sestavení: 08/11/2018

Statistika
Počet hesel: 1.1 MM
Termíny: 7.5 MM
Jazyky: 26

Bulgarian 45202 Termíny
Czech 44047 Termíny
Danish 513307 Termíny
atd.
--
2. https://iate.europa.eu/home

Počet hesel
1 185 876

Počet termínů
8 216 152

O IATE

IATE (InterAktivní Terminologie pro Evropu) je terminologická databáze EU. Orgány a agentury EU ji používají již od léta 2004 pro shromažďování, šíření a správu terminologie specifické pro EU. Projekt byl zahájen v roce 1999 s cílem poskytnout webovou infrastrukturu pro všechny terminologické zdroje EU, a tím zlepšit dostupnost a standardizaci informací.

3. Vyhledám co to je "CEF" a uvedu pro mně relevantní výsledky

https://iate.europa.eu/search/standard/result/1542058809887/1

3536351
finance EU (1021) [EVROPSKÁ UNIE]
komunikační systém [VZDĚLÁVÁNÍ A KOMUNIKACE > komunikace]
DOPRAVA (48)
ENERGETIKA (66)

en Connecting Europe Facility
cs Nástroj pro propojení Evropy

3577849
institucionální struktura [EVROPSKÁ UNIE > orgány EU a evropská veřejná služba]

en Friends of the Presidency Group (Connecting Europe Facility)
cs Skupina přátel předsednictví (Nástroj pro propojení Evropy)
===
Po týdnu studia tématu eTranslation jsem pochopil, že CEF jsou peníze (finance) vynakládané na "propojení Evropy". U jednotlivých bloků a modulů jde i o SW a výukové materiály.

Milan


 
Milan Condak
Milan Condak  Identity Verified
Local time: 14:15
English to Czech
TOPIC STARTER
Stav databáze IATE 10/2019 Nov 2, 2019

Milan Condak wrote:

3. Vyhledám co to je "CEF" a uvedu pro mně relevantní výsledky

Po týdnu studia tématu eTranslation jsem pochopil, že CEF jsou peníze (finance) vynakládané na "propojení Evropy". U jednotlivých bloků a modulů jde i o SW a výukové materiály.

Milan


Z CEF je financován EU Council Presidency

https://www.proz.com/forum/post_editing_machine_translation/336184-eu_council_presidency_translator.html

Letos jsem TBX stáhl. Extrahoval jsem TBX se 4 jazyky.

http://www.condak.cz/nove/2019-10/30/cs/00.html

IATE 10/2019

Doména 0416 otevřená v Goldpanu

01 Databáze IATE v říjnu 2019
02 Doména 0416 otevřená v Goldpanu
03 Xbench je pro dva jazyky
04 TMLookup
05 Přidání terminologie do PC Translatoru

Konverze TBX a využití bez připojení k internetu.

Milan


 
Milan Condak
Milan Condak  Identity Verified
Local time: 14:15
English to Czech
TOPIC STARTER
Stažení dat z IATE v roce 2021 Mar 5, 2021

IA není AI. IA je inter-active = EC propaguje komunikovat se serverem. Přesto je možno data i nadále stahovat.
Kromě jednojazyčného seznamu a zobrazení přeložených položek jsem prozatím nenašel možnost využít data v novém formátu. Možná dodatečně objevím editor, který otevře TBX s novou strukturou dat.

<
... See more
IA není AI. IA je inter-active = EC propaguje komunikovat se serverem. Přesto je možno data i nadále stahovat.
Kromě jednojazyčného seznamu a zobrazení přeložených položek jsem prozatím nenašel možnost využít data v novém formátu. Možná dodatečně objevím editor, který otevře TBX s novou strukturou dat.

http://www.condak.cz/nove/2021-02/27/cs/00.html

Stažení dat z IATE v roce 2021

IATE nabízí především interaktivní připojení

01 Kam vložit stažená data?
02 V roce 2019
03 Žádost o stažení
04 Počet přeložených položek

Milan
Collapse


 
Milan Condak
Milan Condak  Identity Verified
Local time: 14:15
English to Czech
TOPIC STARTER
Xbench: TBX to TMX Mar 30, 2021

Na základě dotazu jak vytvořit TMX z TBX jsem udělal dvě jednostránkové prezenrace

Xbench: TBX to TMX

http://www.condak.cz/nove/2021-03/29/en/00.html DE-CS

http://www.condak.cz/nove/2021-03/30/en/00.html NL-CS Animace

V dis
... See more
Na základě dotazu jak vytvořit TMX z TBX jsem udělal dvě jednostránkové prezenrace

Xbench: TBX to TMX

http://www.condak.cz/nove/2021-03/29/en/00.html DE-CS

http://www.condak.cz/nove/2021-03/30/en/00.html NL-CS Animace

V diskuzi na ProZu Samuel Murray poskytl odkaz ke stažení extrahovaného TBX z části databáze z roku 2018 a neuvedl, který obor nebo téma.

Milan

[Edited at 2021-03-31 06:03 GMT]
Collapse


 
Milan Condak
Milan Condak  Identity Verified
Local time: 14:15
English to Czech
TOPIC STARTER
Post scriptum k tématu IATE Apr 8, 2021

České části databáze IATE jsem vzhledem k její nevýznamnosti věnoval zbytečně dlouho pozornost. Závěrem komentuji komentáře zahraničních uživatelů.

http://www.condak.cz/nove/2021-03/31/cs/00.html

Import TBX

Struktura souboru TBX

01 Goldpan
02 Heartsome TMX Editor
03 Úplnost dat
04 Xbench

Milan


 
Milan Condak
Milan Condak  Identity Verified
Local time: 14:15
English to Czech
TOPIC STARTER
Heartsome Translation Studio Apr 27, 2021

Milan Condak wrote:

02 Heartsome TMX Editor


Podíval jsem se na vlastnosti ikony Heartsome TMX Editor a ve stejné složce jsem našel i odzipované "Heartsome Translation Studio"-

Na stránku 02.html jsem přidal obrázky menu: Tools a Databases.

http://www.condak.cz/nove/2021-03/31/cs/02.html

Na položky Tools jsem už dávno zapomněl. Zdají se být užitečné.

Milan


 


There is no moderator assigned specifically to this forum.
To report site rules violations or get help, please contact site staff »


Databáze IATE může být stažena jako TBX






Trados Studio 2022 Freelance
The leading translation software used by over 270,000 translators.

Designed with your feedback in mind, Trados Studio 2022 delivers an unrivalled, powerful desktop and cloud solution, empowering you to work in the most efficient and cost-effective way.

More info »
Protemos translation business management system
Create your account in minutes, and start working! 3-month trial for agencies, and free for freelancers!

The system lets you keep client/vendor database, with contacts and rates, manage projects and assign jobs to vendors, issue invoices, track payments, store and manage project files, generate business reports on turnover profit per client/manager etc.

More info »