google-cloud-platform - 如何使用 Google Cloud Natural Language 分析重音字符
问题描述
我正在尝试在 Python3 (collab) 上使用 python 客户端来分析带有重音字符的文本。我正在设置类型为 PLAIN_TEXT 的文档对象。
# Run a sentiment analysis request on text
def nlp_analyze_text(text, lang=nlp_def_language):
client = language.LanguageServiceClient()
document = types.Document(
content=text,
language=lang,
type=enums.Document.Type.PLAIN_TEXT)
entities = client.analyze_entities(document=document, encoding_type='UTF32')
syntax = client.analyze_syntax(document=document)
return (entities, syntax)
因此,输入客户端的输入包含多字节字符。
text = u"Mi vieja mula ya no es lo que era? Qué era entonces? Era de Bs.As. Saludos!"
nlp_analyze_text(text)
我认为 Google Cloud NL 没有正确理解这一点。
sentences {
text {
content: "Qu\303\251 era entonces?"
begin_offset: -1
}
}
那么,我应该如何设置代码来分析带有重音字符的文本。
谢谢
解决方案
毕竟,我正在查看转义字符,因为正在打印的对象是如何实现其str的。当我打印更深的属性时,我看到字符串未转义。
希望这篇文章对其他人有所帮助。
推荐阅读
- google-apps-script - 从一个工作簿导入到具有不同源单元格的主工作簿
- lua - Nodemcu 固件无法解析 DNS 或使用 http 客户端。但它连接到一个正常工作的 Wi-Fi 接入点。
- laravel - 比较 laravel 集合
- vba - 将照片发送到 Telegram (API / Bot)
- qt - 未安装错误模块“QtQuick.Dialogs”
- mongodb - 获取不同表中字段的 dup 键
- lxml - LXML 在第一个嵌套标签处剪切文本
- phpmailer - phpmailer 正在本地主机上工作,但不在我的 Windows 服务器中(plesk onyx)
- mysql - 数据库中发生冲突“
- linux - Apache2 在没有 LD_LIBRARY_PATH 的情况下启动