dataframe - 如何从 pyspark pr sparksql 中的 date_time 捕获时间部分?
解决方案
如果要截断时间,请使用date_trunc()
函数。
- 如果要转换为日期,请使用
to_date
()函数。
Example:
df.show()
#+--------------------+
#|visit_start_time_gmt|
#+--------------------+
#| 1522555602|
#| 1522622390|
#+--------------------+
from pyspark.sql.functions import *
df.withColumn("date_hour",date_trunc("HOUR",to_timestamp(col("visit_start_time_gmt")))).\
withColumn("date",to_date(to_timestamp(col("visit_start_time_gmt")))).\
show()
+--------------------+-------------------+----------+
|visit_start_time_gmt| date_hour| date|
+--------------------+-------------------+----------+
| 1522555602|2018-04-01 04:00:00|2018-04-01|
| 1522622390|2018-04-01 22:00:00|2018-04-01|
+--------------------+-------------------+----------+
推荐阅读
- javascript - JavaScript 中的对象,如何循环以向对象添加键和值?
- swift - 为什么在更新 pod 后,我不断收到“StorageMetadata”类型的值没有成员“downloadURL”?
- java - 如何通过主类从另一个类调用方法?
- visual-studio-code - 根据语言配置字体
- bash - Alpine Linux:无法运行 .sh 文件
- python - 从 python 中的现有时间戳创建日期时间对象的最佳方法是什么?
- linux - dnf.exceptions.error 来自本地存储库的某些包的校验和不正确
- c++ - 抛出存储在基类指针中的派生类对象
- r - KableExtra 不适用于 tableby
- python - 我不确定为什么会收到 KeyError: 在下面的示例代码中