amazon-web-services - 在 AWS 上以 map reduce 方式转换 CSV 中的行
问题描述
只是想知道 AWS 数据管道或 AWS EMR 上是否有 map-reduce 方式,以便我可以将S3 上的GZIPPED CSV文件转换为 DynamoDB 备份格式?
我认为这可以通过数据管道中的 EMRActivity 来完成,但我对大数据非常陌生,没有弄清楚这一点。
CSV 架构是:
id,name,date
1,abc,2021-08-01
2,bcd,2021-08-02
需要将其转换为 DynamoDB 备份格式:
{"id":{"s":"1"},"name":{"s":"abc"},"uploadDate":{"s":"2021-08-01"}}
{"id":{"s":"2"},"name":{"s":"bcd"},"uploadDate":{"s":"2021-08-02"}}
解决方案
推荐阅读
- flutter - 是否可以获得具有重复字符的字符串的排列?
- firebase - Firestore 按字段分组
- c# - Swashuckle SwaggerDocument 对象检索
- python - 使用条形图绘制变量的均值
- python - 多处理中的 structlog 和 stdlib 日志记录配置
- java - TreeCellEditor 的 fireEditingStopped() 方法
- flutter - 如何使用提供者异步更新数据状态?
- javascript - 用其他词替换消息中的多个词?
- javascript - 将数组划分为许多子数组,其中每个子数组的长度为块大小
- c# - 如果 ChargeSucceeded 在 c# 中如何从 StripeEvents 获取 CustomerID