[Hájtek] konverzió kódlapok között: iconv

2011.08.06. 11:00 | TrueY | 2 komment

Címkék: windows linux 2011 hájtek cygwin

Hogyan lehet unicode-ban (UTF8-8, UTF-16, UTF-32) kódolt file-okat ISO-8859-2 formátumba konvertálni? Pl. azért, hogy az mplayer jól jelenítse meg a a feliratokat. Linux és Cygwin alatt egyaránt felhasználható megoldást kerestem. Meglepetésemre a két rendszer alatti verzió eltérően viselkedik! A Cygwin-es sokkal intelligencsebb.

A parancs az iconv. Az mplayer egyébként tudja közvetlenül is kezelni az iconv könyvtárat a -subcp parancs megadásával. Csak nem mindig működik jól. Az okok számomra érthetetlenek.

A teljes cygwin megoldás:

iconv -f UTF-16 -t L2 --unicode-subst='<%X>' --byte-subst='?%X?' filename

-f - from. A file eredeti kódolása. A 16, 32-nél problémás lehet, hogy little endian, vagy big endian a kódolás. UTF-16-nál pl. szokott lenne BOM (Byte Order Mark), ami 2 byte: ff fe, vagy fe ff. Az előbbi a little-endian, a második a big endian kódolású. Ha ez nincs, akkor nekünk kell kísérletezni. UTF-16BE, UTF-16LE. Hasonlóan UTF-32-re is. Az összes lehetséges kódolás elnevezését, egyébként az "iconv -l" paranccsal listázhatjuk ki.
-t - to. Mibe szeretnénk kódoltatni. Az L2 a LATIN2 rövidítése, ami az ISO-8859-2 rövidítése.
--unicode-subst='<%X>' - Azokat a unicode kódokat, amiket nem lehet átkonvertálni a cél kódkészletbe, hogyan írja ki.
--byte-subst='?%X?' - A hibás byte-okat hogyan írja ki.
Az stdout-ra teszi ki a szöveget.

A linux verzió kevesebbet tud:

iconv -f UTF-16 -t L2//TRANSLIT filename

Itt nem lehet olyan szofisztikáltan lekezelni a hibákat. A //TRANSLIT figyelmen kívül hagyja a konverziónál a nem konvertálható karaktereket.
A //IGNORE a hibás karaktereket hagyja szó nélkül. Ezeket kombinálhatjuk is "-t L2//TRANSLIT//IGNORE".

A //TRANSLIT és //IGNORE is használható a cygwin-es verzióban is. Annak ellenére, hogy a man page-ben említés sem esik róla.

Konvertálódjunk minden nap!

Facebook Tumblr Tweet Pinterest Tetszik

A bejegyzés trackback címe:

https://qltura.blog.hu/api/trackback/id/tr882176721

Kommentek:

A hozzászólások a vonatkozó jogszabályok értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

iwanmakarchuk 2011.08.11. 08:39:41

курсы <a href=http://seo-miheeff.ru>раскрутка сайтов</a> в социальных сетях

Válasz erre

TrueY · http://qltura.blog.hu 2011.08.11. 09:38:08

болшое спасиба а я не интересен

Válasz erre

+jegyzések

nk: Na, azért csak nem. Ugye? Buék! (2022.01.01. 18:35) [Adáshiba] THE END ####################
mongolili: V/14. ELP=Emerson, Lake and Palmer (a Cozy Powell-es felállás csak egyfajta "utóélet" volt) (2020.04.11. 22:45) [Zene] After Crying: 6 (1997)
törzsmókus: az első tecső link Chopint ad, nem Mahalát :( a másodiknál meg biztos van azóta jobb minőség… (2016.11.11. 13:27) [Zene] Besh o droM: Macsó hímzés
TrueY: @NYJetsTD: Hidd el, nem örülök ennek annyira. :) Sajnos csak 1 napot nyaraltam. A többit kórházban... (2016.10.12. 23:00) [Adáshiba] Achilles-ín
NYJetsTD: Ronaldoooooo.... milyen ügyes vagy. Mostantól egész életedben mondhatod, hogy sportsérülésed volt,... (2016.10.11. 21:01) [Adáshiba] Achilles-ín
Utolsó 20

QL.túra miazmás

Minden, ami az általános műveltségből kimaradt...

QL.túra

Legnézettebb

Keresés

Címkék

Archív

+jegyzések

Feedek

Most ...

eKönyvek

[Hájtek] konverzió kódlapok között: iconv

2011.08.06. 11:00 | TrueY | 2 komment

Címkék: windows linux 2011 hájtek cygwin

A bejegyzés trackback címe:

Kommentek:

iwanmakarchuk 2011.08.11. 08:39:41

TrueY · http://qltura.blog.hu 2011.08.11. 09:38:08

QL.túra miazmás

Minden, ami az általános műveltségből kimaradt...

QL.túra

Legnézettebb

Keresés

Címkék

Archív

+jegyzések

Feedek

Most ...

eKönyvek

[Hájtek] konverzió kódlapok között: iconv

2011.08.06. 11:00 | TrueY | 2 komment

Címkék: windows linux 2011 hájtek cygwin

Ajánlott bejegyzések:

A bejegyzés trackback címe:

Kommentek:

iwanmakarchuk 2011.08.11. 08:39:41

TrueY · http://qltura.blog.hu 2011.08.11. 09:38:08