python - 关于时间戳的 pyspark 数据框的问题
解决方案
假设您的时间戳列名称是时间:
from pyspark.sql.functions import *
df2 = df1.withColumn('year',year('time')).withColumn('quarter',quarter('time')).withColumn('weekOfTheYear',weekofyear('time')).withColumn('dayOfTheWeek', dayofweek('time')).withColumn('dayofmonth',dayofmonth('time'))
推荐阅读
- c# - 当实际的泛型返回类型是方法定义的返回类型的子类时,如何返回泛型?
- powershell - 用于删除或存档旧日志文件的 PowerShell 脚本在本地运行良好,但在远程位置无法运行
- algorithm - 查找未排序数组的最小值和最大值的算法
- flutter - Flutter web 发布模式错误。而其他所有模式都工作正常
- typescript - 参数类型不可分配给参数类型 Config
- ruby-on-rails - Less::ParseError: 在生产环境中编译时变量@box-border-radius 未定义
- android - 如何从 webview 应用程序外部(例如重定向到 Chrome 浏览器)或 webview android 应用程序内部的 blob url 下载 pdf?
- javascript - ReactJS-useEffect 一次又一次地运行
- php - 如何将容器中的 symfony 5 DATABASE_URL(在 .env 中)连接到本地主机上的 wamp
- c++ - 如何使用 Qt 扩展策略在布局中找到 QWidget 的真实高度?