1、只需通过文本文件最开始的两个字节,即可判断其使用的字符集,步骤如下:1. 读取文件的一个字节,并向高位移动8位,即低位空余出8个0;2. 再读取一个字节,加到上面移位后的字节上,即将两个字节组合;3. 根据文件前两个字节和几个固定值比较,可获取该文件使用的编码字符集。
2、准备第一个测试文件:创建一个文本文件 testUTF8.txt, 设置其内容使用字符集 UTF-8。
3、准备第二个测试文件:创建一个文本文件 testGBK.txt, 设置其内容使用字符集 GBK。
4、编写本地测试代码,获取上述两个文件文件使用的编码字符集。
5、运行本地测试主方法,观察控制台输出,符合我们的设置,测试通过。