请首先正确的理解什么叫做统一编码.
不统一的编码就意味着一个值, 比如1, 在一个编码下表示A另一个编码下表示c,再一个编码下表示d.
说回乱码,乱码就是, 你用的编码格式是A, 但是人家用编码格式是B打开了. 于是, 对于原本是编码格式是A的编码, 就"有可能"乱码.
这个"有可能"的原因是, 不同编码之间不代表是完全的不兼容的.
utf-8兼容ascii编码, 所以用utf-8打开ascii编码不会乱码.
GB-2312, GBK等编码在英文上兼容ascii编码, 所以用GB-2312,GBK打开ascii编码的英文也不会乱码, 所以, 很显然, 用utf-8编码打开GB2312编码, 英文部分不会乱码.
我不知道你是否能够理解为什么utf8和GB2312之间英文不乱码而中文乱码的一个必然性, 我觉得你应该是理解不了的. 因为你从始至终就根本没有试图去理解其中的概念, 都是自己一个人在那里胡思乱想, 有着全球统一的Unicode不用, 妄想自己搞一个新的"汉字编码"格式, 我比较好奇, 你的这个新编码格式搞出来一个会有哪些人用? |