本帖最后由 hongdongyu 于 2012-8-6 17:09 编辑
如题:
我只选择最关键的语句:iconv -f gb18030 -t utf-8 $1 > $2
这样会出现“未知xxx处的非法输入序列”,我想可能是有些汉字字符识别不出来。
于是,我把它改为iconv -c -f gb18030 -t utf-8 $1 > $2,多加了一个-c,忽略无效的字符。
发现转化过来基本正确(起码汉字的翻译全对了,也没有丢失数据),但是有个小地方出错了,如下图2.
而且转化过来的大小也不一样,如下图1.
这个有办法解决吗?假如代码量比较大的话,转过来又要去核对是否正确,那也是相当麻烦,而且一点都不可靠。
期待高手解决 |