首页 > 解决方案 > 如何使用 Google Cloud Natural Language 分析重音字符

问题描述

我正在尝试在 Python3 (collab) 上使用 python 客户端来分析带有重音字符的文本。我正在设置类型为 PLAIN_TEXT 的文档对象。

# Run a sentiment analysis request on text
def nlp_analyze_text(text, lang=nlp_def_language):
  client = language.LanguageServiceClient()

  document = types.Document(
      content=text,
      language=lang,      
      type=enums.Document.Type.PLAIN_TEXT)
  entities = client.analyze_entities(document=document, encoding_type='UTF32')
  syntax = client.analyze_syntax(document=document)

  return (entities, syntax)

因此,输入客户端的输入包含多字节字符。

text = u"Mi vieja mula ya no es lo que era? Qué era entonces? Era de Bs.As. Saludos!"
nlp_analyze_text(text)

我认为 Google Cloud NL 没有正确理解这一点。

sentences {
   text {
     content: "Qu\303\251 era entonces?"
     begin_offset: -1
   }
 }

那么,我应该如何设置代码来分析带有重音字符的文本。

谢谢

标签: google-cloud-platformnatural-language-processinggoogle-cloud-automl-nl

解决方案


毕竟,我正在查看转义字符,因为正在打印的对象是如何实现其str的。当我打印更深的属性时,我看到字符串未转义。

希望这篇文章对其他人有所帮助。


推荐阅读