python - urdu 字符串看起来相同,但相比之下发现不相等的 python3
问题描述
在我的应用程序中,我在文本文件中列出了(乌尔都语)单词,(目前像这样的单个单词)
我还有另一个包含 urdu 字符串的文本文件(目前像这样的单个单词并且完全相同)
现在我需要查找字符串文件的字符串是否包含单词文件中存在的任何单词。为此,我将两个文件都读入这样的列表中;
// 读取字符串的文本文件...
fileToRead = codecs.open('string.txt', mode, encoding=encoding)
fileData = fileToRead.read()
lstFileData = fileData.split('\n')
wordListToRead = codecs.open('words.txt', mode, encoding=encoding)
wordData = wordListToRead.read()
lstWords = wordData.split('\n')
我只是像这样遍历列表;
for string in lstFileData:
if string in lstWords:
// do further work
它不工作而且我不知道为什么?虽然字符串是 'فلسفے' 并且 lstWords 中有这个字符串。我需要添加一些编码吗?任何形式的帮助将不胜感激。
解决方案
刚刚在 python3 中尝试过,它似乎对我有用:
lstWords = ['a', 'فلسفے', 'b']
string = 'فلسفے'
if string in lstWords:
print("yes")
编辑:再次,刚刚使用文件 IO 测试了您更新的代码,它工作正常(我没有指定编码)。这是它的工作链接:https ://trinket.io/python3/3890d8b261
推荐阅读
- python - 在 python 中保存巨大的 numpy
- reactjs - 使用 useMemo() 防止上下文重新渲染
- python - Pandas 中的列宽太宽(jupyter notebook)
- unity3d - Unity Terrain 看起来很奇怪
- python - crowdstrike falcon API 脚本
- json - 使用 JSON 格式化单个字段以基于选择字段值显示按钮
- javascript - 按索引删除 localStorage vuejs 数组中的文章
- arrays - 如何在 Rust 中直接在堆上创建巨大的数组,跳过堆栈?
- amazon-s3 - 正则表达式组匹配文件中的每条记录,其中换行符不是新记录的指示符
- angular - Angular 提供者:使用现有的或创建一个(如果未提供)