python - 将包含日期的列表添加到 PySpark Dataframe
问题描述
我创建了一个日期列表,我想用 StructType = StringType 添加到 Spark 数据框中。但是,下面的最终 df 仅包含空值。
#Step 1:创建数据范围并放入列表
start_date = '2020-05-01'
end_date = '2020-05-10'
my_dates = pd.date_range(start_date,end_date).tolist()
#Step 2:将列表添加到 Spark Df
cSchema = StructType([StructField("date", ArrayType(StringType()))])
df2 = spark.createDataFrame(my_dates,schema,cSchema)
解决方案
也许您可以尝试以下方法:
start_date = '2020-05-01'
end_date = '2020-05-10'
my_dates = pd.date_range(start_date,end_date).tolist()
new_df = spark.createDataFrame([(value,) for value in mydates], ['date'])
new_df.show()
推荐阅读
- groovy - Groovy:如果条件,则添加根闭包
- html - 尝试从 Youtube 实现 CSS 动画
- java - 如何在哈希图中使用日期作为键
- javascript - 优化 AJAX 函数以从用户输入中获取 SQL 数据到下拉菜单并附加到表 Javascript
- amazon-web-services - CodePipeline 未将所有文件保存在源工件中
- css - 位置属性是否覆盖显示属性?
- r - r中的奇怪矩阵行为
- android - android sqlitedatabasehelper 数据库未找到问题/错误
- radiance - 有没有“你好世界!” 光辉的例子?
- java - 为什么这个简单的 Junit 5 测试不起作用