[BSD] nagy allomanyon beluli karakter-konverzio

Fazekas Mihály michael at goliat.eik.bme.hu
2008. Ápr. 16., Sze, 11:11:36 CEST


Sziasztok,

Adott egy sql dump (~2.5G).

Nehany tabla nem UTF8 -ban lett hasznalva, ezert a visszatoltesnel
hisztizik:
----------------------------------------
invalid byte sequence for encoding "UTF8".
----------------------------------------


Hogy lehet ezt megcsinalni?:
1. lepes: mgkeresi a "COPY <tablename>" -vel kezdodo sort
2. mindaddig cserelgeti (iconv -vel konvertalgatja,....), ameddig
    el nem er  akovetkezo "COPY ...." -val kezdodo sorra
(Sajnos ilyen szinten nem ertek a regex -hez meg hasonlokhoz :( )

Ha ez egyszerubb lenne, akkor ez is megfelel:
Pl. iconv -vel cserelgeti a(z iso8859-2 -es) karaktereket
UTF -8 -ra, de ha UTF-8 -at talal, akkor azt ne cserelgesse,
csak siman tegye ki az output -ra.

-- 
mailto:michael at goliat.eik.bme.hu
Phone: 463-1966



További információk a(z) BSD levelezőlistáról