database - 如何使用 pygrametl 将 csv 文件中的 unicode 数据导入数据库?
问题描述
当我尝试使用 pygrametl 中的以下代码在 PostgreSQL 的数据仓库中导入泰语数据时:
inputdata = CSVSource(open(file_name, 'r', encoding="utf8"), delimiter=',')
for row in inputdata:
row['text'] = pygrametl.getstr(row['text']).encode("utf-8")
facttbl.insert(row)
它有效,但它在文本中添加了“b”。如果我删除了 encode("utf-8") 部分,那么它会给我错误:
“列文本的缺失值”
如果我将文本更改为英文,则无需添加 encode("utf-8") 即可。仅当我正在读取的 csv 文件中有一些 unicode 字符时,才会显示该错误。
解决方案
推荐阅读
- cypress - 未给出值属性时如何在赛普拉斯中查找文本?
- perforce - 从 Perforce 的流库中仅获取一个文件夹
- c# - 使用 StartsWith() 时如何提高查找性能
- hibernate - JPA:OneToMany 双向映射存在问题 - 分离实体传递给持久化:
- go - 解析时间戳字符串时出错
- vb.net - VB.NET TIMER 如果定时器工作,不要重新启动
- typescript - 如何在 TypeScript 中使用泛型索引记录?
- java - 为什么第一个不能执行?如果我想使用第一个,我应该添加什么?是 sum = (long) sum + n % 10; ? 帮助见面
- python - 跟踪 python 需求文件中的更改并将更改自动同步到我的 conda env
- python-3.x - 与日期重叠的事件数