python - 迄今为止的pyspark字符串
问题描述
我正在尝试将字符串转换为日期格式,日期列按这样的顺序包含数据,但这是字符串数据类型
20191130
20191231
使用字符串到日期时,日期应显示为
2019-11-31
2019-12-31
我尝试了这种方法,但脚本返回错误
df = spark.sql('select * from tablename) df2 = df.withColumn('Date', expr("cast(as_of_date,'yyyyMMdd) as date"))
我也试过这个脚本,它可以工作,但是,有了这个,它显示的日期和时间不是我想要的
df2 = df.withColumn("Date",expr("cast(unix_timestamp(as_of_date ,'yyyyMMdd') as date)")).show()
解决方案
尝试使用to_date
?
df2 = df.withColumn('Date', to_date(col('as_of_date'), 'yyyyMMdd'))
推荐阅读
- search - 数字报纸图书馆的搜索引擎是如何工作的?
- python - 计算两个笛卡尔坐标的距离
- r - 我需要找出 37 个术语之间的重叠
- javascript - 为什么 JEST 测试中的 getComputedStyle() 会向 Chrome / Firefox DevTools 中的计算样式返回不同的结果
- c# - 从嵌套 Gridvew 行编辑调用时,HiddenField 的值重复
- excel - SUMIF 公式中的嵌套 MIN
- c# - 如何在 Visual Studio 中为 nuget 包创建脱机存储库
- c# - 字段表达式 GroupBy 不返回包含的对象
- sql - 将数据从 SQL Server 迁移到 PostgreSQL
- python - pyodbc - 在 ms 访问中将新的数据列写入现有表