unicode - 从命令行检测单字节字符集?
问题描述
我在一个目录中有一堆文本文件。他们有文字,比如说,英语和阿拉伯语 - 或两者兼而有之。仅英语的仅使用 windows-1252 代码页中的字符(或 ISO-8859-1 / Latin-1,如果您愿意),而阿拉伯语则使用 windows-1256(或 iso-8859-6,如果您愿意)。
我的问题:我可以从(Unix'ish)命令行检测哪个文件使用哪个代码页,并且具有不错的可靠性吗?
注意:file -i
不要这样做...
解决方案
推荐阅读
- php - Laravel RESTful api - 查询参数的动态数量
- powershell - 如何在powershell中获取连续3天失败的字符串名称
- java - webview自动打开时点击搜索输入
- postgresql - 使这个查询更快
- php - 如何在 Cakephp2 中为控制器注册事件监听器?
- c# - 未找到 System.Windows.Controls 程序集参考 VSCODE
- sql - SQL中带间隔的聚合和平均值
- setuptools - 我想从 iPhone 上进行所有编码,它是如何设置的?
- ruby-on-rails - M1 Mac Ruby on Rails msgpack
- javascript - 如何将在 html 文本字段中输入的内容传输到 js 变量?