python - 使用 Python 删除阿拉伯语变音符号
问题描述
我想通过使用 Python 删除阿拉伯语变音符号来过滤我的文本
例如
文本: اللَّهمَّ اغْفِرْ لنَا ولوالدِينَا 后填充: اللهم اغفر لنا ولوالدينا
我发现这可以使用 CAMeL 工具完成,但我不确定如何
解决方案
您可以像这样使用库pyArabic:
import pyarabic.araby as araby
before_filter="اللَّهمَّ اغْفِرْ لنَا ولوالدِينَا"
after_filter = araby.strip_diacritics(before_filter)
print(after_filter)
# will print : اللهم اغفر لنا ولوالدينا
您可以尝试不同的 stip 过滤器:
araby.strip_harakat(before_filter) # 'اللّهمّ اغفر لنا ولوالدينا'
araby.strip_lastharaka(before_filter) # 'اللَّهمَّ اغْفِرْ لنَا ولوالدِينَا'
araby.strip_shadda(before_filter) # 'اللَهمَ اغْفِرْ لنَا ولوالدِينَا'
araby.strip_small(before_filter) # 'اللَّهمَّ اغْفِرْ لنَا ولوالدِينَا'
araby.strip_tashkeel(before_filter) # 'اللَّهمَّ اغْفِرْ لنَا ولوالدِينَا'
araby.strip_tatweel(before_filter) # 'اللَّهمَّ اغْفِرْ لنَا ولوالدِينَا'
推荐阅读
- angular - 如何在Angular 5+中的路由导航之间保持客户端对象状态
- python - pygame gameDisplay.fill 颜色不显示?
- angular - tabview 中的 ListView 不更新
- java - 单链表使用 setter & getter
- servicenow - 将 servicenow 与 onedrive 集成。同时尝试获取 onedrive 的 OAuth 令牌获取无效范围错误
- apache-spark - 在 Spark 中分支?
- javascript - 为 JS 动画文本添加延迟
- node.js - npm v6.4.1 未在 docker 内运行`prepare`
- visual-studio-2017 - 防止表单重新缩放自身 - DPI 意识
- angular - 子组件的角度导航