首页 > 解决方案 > Google Translate API:将符号翻译成乱码 - Python

问题描述

我正在使用 Google Translate API 将 excel 列从日语翻译成英语。日文栏不仅包含日文字符,还包含一些数字符号,如①、⑥等。

翻译日文字符没有问题,但符号被转换成乱码。
示例:
日语:#⑥その他<br> 英语:#â'¥ 其他

但同样的文字适用于谷歌翻译网络

在此处输入图像描述

如何防止在 Google Translate API 中翻译符号?

标签: excelpython-3.xgoogle-translate

解决方案


问题来自将数字符号与语言混合,从那时起,翻译 API 就更难检测到哪种是源语言。

我不知道您使用哪种方法来调用翻译 API,但无论如何,指定源语言可以解决问题

例如,使用来自命令行界面的 REST 调用:

curl -X POST -H "Authorization: Bearer "\
$(gcloud auth application-default print-access-token) \
-H "Content-Type: application/json; charset=utf-8" --data "{
  'q': '#⑥その他',
  'source': 'ja',
  'target': 'en'
}" "https://translation.googleapis.com/language/translate/v2"

"# ⑥ Other"作为翻译结果返回。


推荐阅读