utf-8 - 如何使用 fscanf 读取 UTF-8 编码
问题描述
Octave 4.2.2ISO-8859-1
使用命令读取字符fscanf
(格式化为读取空格):
foo = fscanf(foofile1, "%*s %[^\n]");
而fgetl
读取本机UTF-8
:
foo = fgetl(foofile2);
这两个文件都显示为编码UTF-8
:
$ file -i foofile1.csv
foofile1.csv: text/plain; charset=utf-8
$ file -i foofile2.html
foofile2.html: text/html; charset=utf-8
有什么方法可以读取格式的HTML
文件吗?UTF-8
fscanf
更新:正如@TS 所指出的,这已被报告为savannah.gnu.org中的一个错误。
解决方案
无需更改代码。UTF8 旨在与大多数不支持 UTF8 的单字节字符串函数(如上述)一起使用,只要您不必使用解码的代码点,例如将字符串打印到屏幕上。
推荐阅读
- azure - O365,使用 Powershell 管理分发列表组
- hadoop - 使用包含空值的多个数组列展开配置单元表
- javascript - React-Native-Crop-Image 在 android 上不起作用,如何在 android 上裁剪图像,对于 ios 也应该相同
- django - 如何使用 Django REST 框架返回自定义 json 响应?
- javascript - SVG 图标在 OpenLayers 中不可见,而其他 SVG 工作正常
- javascript - 如何使用回调函数使用地图方法javascript显示整个月份
- python - 在 DataFrame 中查找最频繁的组合
- firebase - 如何访问firebase中的文档字段?
- javascript - TypeError:无法读取未定义的属性“值”(d 未定义)
- javascript - 赛普拉斯:从响应体中提取值到变量