java - 使用 unicode 字符读取文件
问题描述
我想读取一个包含 HTML 内容的文件,例如
<li> Face palm </li>
<li> Ass spade card </li>
<li> Water pistol </li>
当我尝试读取文件时
new String(Files.readAllBytes(expectedFilePath), StandardCharsets.UTF_8);
我得到第一行Face palm ߤ¦
。所以很明显Unicode字符1F926
编码不正确。更改为UTF_16
不会有太大帮助。如何正确读取文件?
解决方案
推荐阅读
- python - ImageGenerator.flow_from_directory (class_mode) 的区别?
- javascript - 如果更改了所选选项,如何动态附加特定的 div?
- javascript - .replace() 内容可编辑的负正则表达式
- random - 具有固定种子和可变精度的 boost::multiprecision 随机数
- javascript - 为什么我的 javascript 不能重定向以下代码,我尝试了多种解决方案,我在 StackOverFlow 中找到了
- javascript - Express 路由器在应返回 Not Found (404) 时调用另一条路由
- azure-devops - Azure DevOps - 如何在不重新创建新管道的情况下更新管道存储库源?
- python - 如何在 Tornado 中编写非阻塞、分块的 RequestHandler
- sqlite - SQFLite:当字段值为 json_encode 时如何获取数据?
- mongodb - MongoDB聚合 - 如果提供则匹配输入参数否则不匹配