首页 > 解决方案 > 从命令行检测单字节字符集?

问题描述

我在一个目录中有一堆文本文件。他们有文字,比如说,英语和阿拉伯语 - 或两者兼而有之。仅英语的仅使用 windows-1252 代码页中的字符(或 ISO-8859-1 / Latin-1,如果您愿意),而阿拉伯语则使用 windows-1256(或 iso-8859-6,如果您愿意)。

我的问题:我可以从(Unix'ish)命令行检测哪个文件使用哪个代码页,并且具有不错的可靠性吗?

注意:file -i不要这样做...

标签: unicodecharacter-encodingcharset

解决方案


推荐阅读