python-3.x - 如何在 Python 中检查字符串语言
问题描述
我在列表中有一些文本。该文本是用某些语言编写的,例如“印地语”和“英语”。如何检测文本的语言?文字没有意义。那么我怎么能检测到这个textblob
库langdetect
对我不起作用,因为文本没有意义。
解决方案
据我了解,您想知道字符串是否包含任何 devnagri/印地语文本。这应该有助于:
import codecs,string
def is_hindi(character):
maxchar = max(character)
if u'\u0900' <= maxchar <= u'\u097f':
return True
else:
return False
推荐阅读
- google-cloud-firestore - Firebase/云 Firestore:onSnapshot() 与 on()
- java - 从 Java 连接到 Apache Kafka 的问题
- vba - 如何使用 VBA 在多个 Word 文档中查找和替换文本
- antlr - antlr4:简单语法的输入不匹配
- reactjs - React 测试函数传递给子组件
- dart - Dart Hive TypeAdapter 对 write() 方法的合理性
- github-pages - 您如何将 MathJax 整合到 GitHub Pages 站点中?
- css - Flexbox 没有垂直居中
- javascript - 这种类型的字符串叫什么?
- javascript - nuxtjs:如何强制页面重新加载并调用 asyncData()?