首页 > 解决方案 > 编码“UTF8”的无效字节序列 - Talend

问题描述

这是一个宇宙时代的问题,我正在从 MySQL (Latin1) 到 Postgres (UTF8) 获取数据并得到无效字节错误。

我对所有解决方案的设置:Postgres 的附加 jdbc 参数:“characterEncoding=utf8”tDBRow_1:“SET NAMES 'utf8'”

在此处输入图像描述

是的,我已经在这件事上检查了 Stack。到目前为止,没有任何效果。尝试的选项:仅 - “SET NAMES 'utf8'”

convert(cast(convert(data using latin1) as binary) using utf8) as data - in iot SQL query

CONVERT(CAST(data as BINARY) USING utf8) as data - in iot SQL query

CAST(CONVERT(data USING utf8) AS binary) - 在 iot SQL 查询中

修剪(数据中的两个 CHAR(0x00)) - 在 iot SQL 查询中

row1.data.replace("\x00", " ") - 在 tMap

data.replace('\0', ' ') - 在 tJava 中

data.replaceAll("\0", "") - 在 tJava 中

剩下的:-将目标中的其他参数更改为:noDatetimeStringSync=true&characterEncoding=utf8

-将目标中的其他参数更改为:useOldUTF8Behavior=true

-将 tDBRow_1 更改为 SET CLIENT_ENCODING 为 utf8

但我此刻的想法已经用完了,互联网也是如此。

标签: talend

解决方案


推荐阅读