Databáze IATE může být stažena jako TBX Thread poster: Milan Condak
|
InterActive Terminology for Europe
Příspěvek
(Part of) the IATE database can now be downloaded as a massive TBX!
Thread poster: Michael Beijer ze dne 10. července 2014 ... See more InterActive Terminology for Europe
Příspěvek
(Part of) the IATE database can now be downloaded as a massive TBX!
Thread poster: Michael Beijer ze dne 10. července 2014
http://www.proz.com/forum/translator_resources/271879-part_of_the_iate_database_can_now_be_downloaded_as_a_massive_tbx.html
obsahuje odkaz na stránku
Download IATE and the IATE extraction tool IATExtract.jar
popisující databázi a SW, které je možno stáhnout
http://iate.europa.eu/tbxPageDownload.do
You can download the file by clicking on the link below.
IATE_download_27012015.zip (Publication date: 27/01/2015)
Statistics
The download file contains 1.3 million entries, 8 million terms in 24 official EU languages.
Language Number of terms
Czech 28865
(Podle tabulky má méně výrazů než čeština pouze chorvatština.)
Poslední příspěvek na ProZ.com je starší než lednová databáze.
http://www.proz.com/forum/translator_resources/271879-
part_of_the_iate_database_can_now_be_downloaded_as_a_massive_tbx-page3.html
Very useful Oct 20, 2014
-
V červenci 2014 jsem si stáhl zazipovaný soubor.
Vyextrahoval jsem dvojici CS a EN. Soubor TBX má velikost 17,1 MB. Soubor jsem otevřel v
programu Xbench a vyexportoval jsem jsem z něj textový soubor EN-CS v kódování UTF-8.
Červencový soubor má 19642 českých výrazů.
V programu LF-Editor jsem smazal všechny sloupce, kromě prvních dvou. TXT soubor má velikost 1,3 MB. Glosář mohu použít například v OmegaT.
Milan ▲ Collapse | | | Milan Condak Local time: 14:15 English to Czech TOPIC STARTER Databáze z listopadu 2016 | Feb 23, 2017 |
Milan Condak wrote:
Very useful Oct 20, 2014
-
V červenci 2014 jsem si stáhl zazipovaný soubor.
Vyextrahoval jsem dvojici CS a EN. Soubor TBX má velikost 17,1 MB. Soubor jsem otevřel v
programu Xbench a vyexportoval jsem jsem z něj textový soubor EN-CS v kódování UTF-8.
Červencový soubor má 19642 českých výrazů.
V programu LF-Editor jsem smazal všechny sloupce, kromě prvních dvou. TXT soubor má velikost 1,3 MB. Glosář mohu použít například v OmegaT.
Milan
Letos jsem vyzkoušel import TBX do demoverze Wordfastu 4 a editaci textového souboru ve Wordfastu Classic. V OmegaT jsem využíval TBX jako glosář nebo jako slovník StarDict.
Během pěti dnů jsem udělal pět prezentací.
Rekapitulace prezentací o TBX, IATE, EuroVocu a nástrojích Wordfast a OmegaT
http://www.condak.cz/nove/2017-02/21/cs/03.html
Otázka zní: co je vhodné PEMT, MT, slovník, glosář nebo TM?
Můj názor: nejlepší je zdroje konfrontovat a použít terminologii zákazníka. Když je zákazníkem orgán EU jsou k dispozici překladové paměti nebo vícejazyčné náhledy (například DGT, eur-lex nebo IATE) nebo text v cílovém jazyce.
Pro prezentaci jsem překládal soubor PDF: Minimální platy v EU
http://ec.europa.eu/eurostat/documents/2995521/7860532/3-10022017-AP-EN.pdf
V prezentaci jsem se zmínil o překladu "national". Jiný příklad je "United Kingdom": My Memory (Google Translate) překládá jako Velká Británie, EU, například v tiskových zprávách, překládá jako "Spojené království". Takový termín je nutné vložit do glosáře a nesprávný překlad do blacklistu.
Terminologie je to, co je definované a závazné. IATE je sbírka možných překladů a výklady významu výrazů a rozpis zkratek = pouhé návrhy.
Milan
http://www.condak.cz/nove/ | | | Milan Condak Local time: 14:15 English to Czech TOPIC STARTER Databáze ze srpna 2017 | Sep 28, 2017 |
Milan Condak wrote:
InterActive Terminology for Europe
Vyextrahoval jsem dvojici CS a EN. Soubor TBX má velikost 17,1 MB. Soubor jsem otevřel v
programu Xbench a vyexportoval jsem jsem z něj textový soubor EN-CS v kódování UTF-8.
Červencový soubor má 19.642 českých výrazů.
V programu LF-Editor jsem smazal všechny sloupce, kromě prvních dvou. TXT soubor má velikost 1,3 MB.
Dnes je státní svátek a tak jsem porovnal dvě informace a opět jsem udělal vlastní pokus.
1. Na stránkách (5,6,7 a 8) jsou k zakoupení glosáře a termbáze pro různé CAT nástroje.
https://www.tm-town.com/terminology-marketplace?button=&marketplace_language_pair=All&page=6&search=&seller=428&utf8=✓
Czech to English IATE terminology package
63,769 Term Concepts | 0 sales Czech to English
€5.50
general
Bilingual files extracted from the European Union’s IATE Termbase and formatted for various CAT-tools.
===
2. Na stránce IATE je zdroj všech dat
http://iate.europa.eu/tbxPageDownload.do
You can download the file by clicking on the link below.
IATE_download.zip (Publication date: 18/08/2017)
Statistics
The download file contains 1.3 million entries, 8 million terms in 24 official EU languages.
3. Porovnal jsem uvedené údaje. Levý sloupec IATE uvádí 38.845 českých termínů. Pravý sloupec TM-town uvádí páry čeština plus další jazyk. Pokud je počet českých výrazů 38.845, tak údaje v pravém sloupci, které jsou větší než 38.845 jsou velmi nepravděpodobné.
Language Number of terms
IATE TM-town za 5,50 €
Czech to XX
Bulgarian 41.321 34.313
Czech 38.845
Danish 57.3267 50.641
German 944.297 54.071
Greek 492.120 44.578
English 1.305.010 63.769
Spanish 582.572 49.042
Estonian 47.545 36.100
Finnish 325.975 47.121
French 1.231.278 55.187
Irish 68.990 31.357
Croatian 19.063 15.133
Hungarian 45.090 34.746
Italian 658.604 50.207
Lithuanian 48.848 36.772
Latvian 42.413 34.302
Maltese 55.499 39.836
Dutch 657.496 49.760
Polish 72.413 42.435
Portuguese 484.414 45.816
Romanian 49.942 37.383
Slovak 45.593 37.383
Slovenian 53.290 38.595
Swedish 304.231 40.643
Latin 62.602
Multilinugal 5.540
All 8.256.258
==
4. Extrakce aglicko-české terminologie
Stažený zip má velikost 127,136 356 MB.
a) extrahovaný TBX s češtinou a angličtinou má velikost 25.538 MB
b) do programu Xbench jsem načetl TBX a vyexportoval jsem TMX; soubory mají 29.062 položek
c) do programu TM Lookup jsem naimportoval TMX a vyexportoval soubor TXT v kódování UTF-8; textový soubor má velikost 1,679 MB
Tož tak. Abych přidal trochu moravského folklóru.
Milan | | | Milan Condak Local time: 14:15 English to Czech TOPIC STARTER Aktualizace souboru IATE z 30.1.2018 | Feb 1, 2018 |
Milan Condak wrote:
Language Number of terms
Bulgarian 41.321 34.313
Czech 38.845
English 1.305.010 63.769
Polish 72.413 42.435
...
a) extrahovaný TBX s češtinou a angličtinou má velikost 25.538 MB
b) do programu Xbench jsem načetl TBX a vyexportoval jsem TMX; soubory mají 29.062 položek
Polský slovník v OmegaT
http://www.condak.cz/nove/2018-01/31/cs/00.html
01 IATE - česko-polský soubor TBX
02 TMLookUp, import TMX, export TXT
03 StarDict Editor
04 Glosář a slovník v OmegaT
Milan | |
|
|
Milan Condak Local time: 14:15 English to Czech TOPIC STARTER Aktualizace IATE k 29.8.2018 | Oct 20, 2018 |
http://www.condak.cz/nove/2018-10/03/cs/00.html
IATE - EN-PT update 2018-08-29
a folha plus TBX, TMX, TXT
01 IATE - update 2018-08
02 Looking for freeware TBX editor
03 Export EN-PT TBX from IATE
04 Projekt PT-CS a folha DGT
05 Projekt PT-EN a folha + IATE TMX
06 Analýza programem JEX
07 Projekt PT-EN a folha + IATE TBX
08 Archivní Eurovoc, pár EN-CS
Milan 03.10.2018 (data)
publikovano 20.10.2018
--
Postupně TBX, Xbench, TMX, Goldpan, Exel, JEX, eurovoc, OmegaT. Koupenou licenci mám pouze na Exel. | | | Milan Condak Local time: 14:15 English to Czech TOPIC STARTER eTranslate a změny na webech IATE a EurLexu | Nov 12, 2018 |
Tentokrát jsem terminologii nestahoval, pouze informuji o změnách. Datum posledního sestavení: 08/11/2018.
EurLex a IATE používají eTranslate (neuronový překladač EU) a mají aktualizované webové stránky.
=======================
1. https://iate.europa.eu/download-iate
Velikost nekomprimovaného souboru: 1,97 gigabytes
Velikost komprimovaného (staženého) souboru: 112 megabytes
Datum posledního sestavení: 08/11/2018
Statistika
Počet hesel: 1.1 MM
Termíny: 7.5 MM
Jazyky: 26
Bulgarian 45202 Termíny
Czech 44047 Termíny
Danish 513307 Termíny
atd.
--
2. https://iate.europa.eu/home
Počet hesel
1 185 876
Počet termínů
8 216 152
O IATE
IATE (InterAktivní Terminologie pro Evropu) je terminologická databáze EU. Orgány a agentury EU ji používají již od léta 2004 pro shromažďování, šíření a správu terminologie specifické pro EU. Projekt byl zahájen v roce 1999 s cílem poskytnout webovou infrastrukturu pro všechny terminologické zdroje EU, a tím zlepšit dostupnost a standardizaci informací.
3. Vyhledám co to je "CEF" a uvedu pro mně relevantní výsledky
https://iate.europa.eu/search/standard/result/1542058809887/1
3536351
finance EU (1021) [EVROPSKÁ UNIE]
komunikační systém [VZDĚLÁVÁNÍ A KOMUNIKACE > komunikace]
DOPRAVA (48)
ENERGETIKA (66)
en Connecting Europe Facility
cs Nástroj pro propojení Evropy
3577849
institucionální struktura [EVROPSKÁ UNIE > orgány EU a evropská veřejná služba]
en Friends of the Presidency Group (Connecting Europe Facility)
cs Skupina přátel předsednictví (Nástroj pro propojení Evropy)
===
Po týdnu studia tématu eTranslation jsem pochopil, že CEF jsou peníze (finance) vynakládané na "propojení Evropy". U jednotlivých bloků a modulů jde i o SW a výukové materiály.
Milan | | | Milan Condak Local time: 14:15 English to Czech TOPIC STARTER Stav databáze IATE 10/2019 | Nov 2, 2019 |
Milan Condak wrote:
3. Vyhledám co to je "CEF" a uvedu pro mně relevantní výsledky
Po týdnu studia tématu eTranslation jsem pochopil, že CEF jsou peníze (finance) vynakládané na "propojení Evropy". U jednotlivých bloků a modulů jde i o SW a výukové materiály.
Milan
Z CEF je financován EU Council Presidency
https://www.proz.com/forum/post_editing_machine_translation/336184-eu_council_presidency_translator.html
Letos jsem TBX stáhl. Extrahoval jsem TBX se 4 jazyky.
http://www.condak.cz/nove/2019-10/30/cs/00.html
IATE 10/2019
Doména 0416 otevřená v Goldpanu
01 Databáze IATE v říjnu 2019
02 Doména 0416 otevřená v Goldpanu
03 Xbench je pro dva jazyky
04 TMLookup
05 Přidání terminologie do PC Translatoru
Konverze TBX a využití bez připojení k internetu.
Milan | | | Milan Condak Local time: 14:15 English to Czech TOPIC STARTER Stažení dat z IATE v roce 2021 | Mar 5, 2021 |
IA není AI. IA je inter-active = EC propaguje komunikovat se serverem. Přesto je možno data i nadále stahovat.
Kromě jednojazyčného seznamu a zobrazení přeložených položek jsem prozatím nenašel možnost využít data v novém formátu. Možná dodatečně objevím editor, který otevře TBX s novou strukturou dat.
<... See more IA není AI. IA je inter-active = EC propaguje komunikovat se serverem. Přesto je možno data i nadále stahovat.
Kromě jednojazyčného seznamu a zobrazení přeložených položek jsem prozatím nenašel možnost využít data v novém formátu. Možná dodatečně objevím editor, který otevře TBX s novou strukturou dat.
http://www.condak.cz/nove/2021-02/27/cs/00.html
Stažení dat z IATE v roce 2021
IATE nabízí především interaktivní připojení
01 Kam vložit stažená data?
02 V roce 2019
03 Žádost o stažení
04 Počet přeložených položek
Milan ▲ Collapse | |
|
|
Milan Condak Local time: 14:15 English to Czech TOPIC STARTER | Milan Condak Local time: 14:15 English to Czech TOPIC STARTER Post scriptum k tématu IATE | Apr 8, 2021 |
České části databáze IATE jsem vzhledem k její nevýznamnosti věnoval zbytečně dlouho pozornost. Závěrem komentuji komentáře zahraničních uživatelů.
http://www.condak.cz/nove/2021-03/31/cs/00.html
Import TBX
Struktura souboru TBX
01 Goldpan
02 Heartsome TMX Editor
03 Úplnost dat
04 Xbench
Milan | | | Milan Condak Local time: 14:15 English to Czech TOPIC STARTER Heartsome Translation Studio | Apr 27, 2021 |
Milan Condak wrote:
02 Heartsome TMX Editor
Podíval jsem se na vlastnosti ikony Heartsome TMX Editor a ve stejné složce jsem našel i odzipované "Heartsome Translation Studio"-
Na stránku 02.html jsem přidal obrázky menu: Tools a Databases.
http://www.condak.cz/nove/2021-03/31/cs/02.html
Na položky Tools jsem už dávno zapomněl. Zdají se být užitečné.
Milan | | | There is no moderator assigned specifically to this forum. To report site rules violations or get help, please contact site staff » Databáze IATE může být stažena jako TBX Trados Studio 2022 Freelance | The leading translation software used by over 270,000 translators.
Designed with your feedback in mind, Trados Studio 2022 delivers an unrivalled, powerful desktop
and cloud solution, empowering you to work in the most efficient and cost-effective way.
More info » |
| Protemos translation business management system | Create your account in minutes, and start working! 3-month trial for agencies, and free for freelancers!
The system lets you keep client/vendor database, with contacts and rates, manage projects and assign jobs to vendors, issue invoices, track payments, store and manage project files, generate business reports on turnover profit per client/manager etc.
More info » |
|
| | | | X Sign in to your ProZ.com account... | | | | | |