[BSD] nagy allomanyon beluli karakter-konverzio
Fazekas Mihály
michael at goliat.eik.bme.hu
2008. Ápr. 16., Sze, 11:11:36 CEST
Sziasztok,
Adott egy sql dump (~2.5G).
Nehany tabla nem UTF8 -ban lett hasznalva, ezert a visszatoltesnel
hisztizik:
----------------------------------------
invalid byte sequence for encoding "UTF8".
----------------------------------------
Hogy lehet ezt megcsinalni?:
1. lepes: mgkeresi a "COPY <tablename>" -vel kezdodo sort
2. mindaddig cserelgeti (iconv -vel konvertalgatja,....), ameddig
el nem er akovetkezo "COPY ...." -val kezdodo sorra
(Sajnos ilyen szinten nem ertek a regex -hez meg hasonlokhoz :( )
Ha ez egyszerubb lenne, akkor ez is megfelel:
Pl. iconv -vel cserelgeti a(z iso8859-2 -es) karaktereket
UTF -8 -ra, de ha UTF-8 -at talal, akkor azt ne cserelgesse,
csak siman tegye ki az output -ra.
--
mailto:michael at goliat.eik.bme.hu
Phone: 463-1966
További információk a(z) BSD levelezőlistáról