java - FileWriter不知何故用中文写
问题描述
请帮我解决这个问题。我正在尝试编写一个读取 .txt 文件的代码,然后它会计算文件中每个字母的频率。这就是我想出的:
public static void charCount(String file) throws IOException {
FileReader fr = new FileReader(file);
BufferedReader br = new BufferedReader(fr);
int[] count = new int[26];
String line;
while ((line = br.readLine()) != null) {
line = line.toUpperCase();
char[] characters = line.toCharArray();
for (int i = 0; i < line.length(); i++) {
if ((characters[i] >='A') && (characters[i] <='Z')) {
count[characters[i] - 'A']++;
}
}
}
File file2 = new File("D:/Project/Aufgabe/Winter_2019/frequency.txt");
file2.createNewFile();
FileWriter fw = new FileWriter(file2);
for (int i = 0; i < 26; i++) {
fw.write(((char)(i + 'A')) + ": " + count[i]);
}
fw.close();
br.close();
}
当我尝试使用 System.out.println() 在控制台中打印结果时,它会给出以下结果:
A: 15
B: 4
C: 9
D: 10
E: 2
F: 1
G: 0
H: 3
I: 5
J: 6
K: 3
L: 0
M: 2
N: 7
O: 3
P: 1
Q: 1
R: 0
S: 4
T: 0
U: 2
V: 0
W: 5
X: 0
Y: 1
Z: 0
这就是我想要的。但是当我尝试将其写入文件时,它会在 .txt 文件中给出以下结果:
㩁ㄠ䈵›䌴›䐹›〱㩅㈠㩆ㄠ㩇〠㩈㌠㩉㔠㩊㘠㩋㌠㩌〠㩍㈠㩎㜠㩏㌠㩐ㄠ㩑ㄠ㩒〠㩓㐠㩔〠㩕㈠㩖〠㩗㔠㩘〠㩙ㄠ㩚〠
我还是java新手,所以非常感谢您的帮助。
解决方案
虽然您的程序有一些可以改进的地方,但它们都不是您看到汉字的原因。事实上,您的程序似乎工作得很好,并且生成的文件实际上包含您在尝试使用System.out.println
.
我已经复制了您的输出示例,使用记事本将其粘贴到一个新文件中,保存后,使用 HEX 编辑器(此处为 HxD)查看了该文件。十六进制数据是这样开始的:FF FE 41 3A 20 31 35 42... “翻译”为ÿþA: 15B...
. 这正是您的预期结果加上在保存文件时由记事本创建的 BOM(字节顺序标记),因此不是原始数据的一部分。
那么为什么你会看到奇怪的结果呢?原因不是您的程序,而是您使用的文本查看器。如果文件丢失了 BOM,其中许多会尝试进行有根据的猜测,以决定(在 Windows 记事本的情况下)是否应该使用 cp1252(Windows Latin-1)、UTF-8 或 Unicode/UTF-16 读取文件。有不同的算法,所以很难说为什么你的观众认为这可能是 UTF-16,但事实就是这样 ;-)
我有一个猜测,解决您的问题的方法可能是改变
fw.write(((char)(i + 'A')) + ": " + count[i]);
至
fw.write(((char)(i + 'A')) + ": " + count[i] + "\r\n");
或者,使用包含 BOM 的字符集编写文件,例如 UTF-8 或 UTF-16。使用 Java 11,您可以FileWriter
直接执行此操作(有一个允许设置的新构造函数),如果您必须使用旧版本的 Java,则需要使用OutputStreamWriter
:
OutputStreamWriter fw = new OutputStreamWriter(new FileOutputStream(file2), "UTF8");
另外:如果“打开文件”对话框允许您明确指定字符集,请检查您的文本查看器,德语 Windows 系统上的记事本调用选项“Codierung”并且“ANSI”是“cp1252”(您的 Java 虚拟机应该使用的字符集在FileWriter
没有特定字符集的情况下使用)。
推荐阅读
- java - Android 在尝试解析 documentBuilder 的路径时抛出 java.io.FileNotFoundException
- c++ - 基于数据峰值的 C++ 对齐 CSV 文件
- python - 为什么我收到 Django page not found 错误?
- node.js - 新版本的软件包已发布,但未显示在 npm 上,并且用户尚未安装
- git - Azure DevOps Powershell git push 命令抛出“无法提示,因为终端提示已被禁用”安全错误
- python - ValueError: 'c' 参数有 1 个元素,不能与大小为 400 的 'x' 和大小为 400 的 'y' 一起使用
- sql-server - 如果响应超过 1192 字节,SQL Server 断开连接
- mysql - 尝试从表中在 phpmyAdmin 中创建函数
- python - 如何根据 for 循环的结果制作矩阵
- javascript - 如何使用 React 测试库选择没有标签的输入表单?