首页 > 解决方案 > 在 Python 中使用 Apache Beam/Dataflow 读取 UTF-16 csv

问题描述

关于读取 UTF-16 格式的 csv 文件的问题。安装的 Apache Beam 版本为 2.7.0,带有 Python2.7。在 Apache Beam 的 github 上,据说该函数ReadAllFromText(PTransform)无法处理 UTF-8 [1]。有没有用 Apache Beam 读取 UTF-16 csv 文件的替代方法?

[1] https://github.com/apache/beam/blob/master/sdks/python/apache_beam/io/textio.py

标签: google-cloud-dataflowapache-beam

解决方案


推荐阅读