java - 在数据框 spark 1.6 java 中将字符串转换为日期或整数
问题描述
如何在数据框 spark 1.6 中将字符串转换为日期或整数。我想将我的数据分组为 1/10/100 年,dataFrame 有列“dt”-java 示例的字符串编码:
我怎样才能做到这一点?
解决方案
DataFrame dataFrame = sqlContext.read()
.format("com.databricks.spark.csv")
.option("inferSchema", "true")
.option("header", "true")
.load(filePath.getAbsolutePath());
DataFrame withDate = dataFrame.withColumn("date",col("dt").cast("date"));
withDate.withColumn(
"year",
year(col("date"))
).withColumn(
"month",
month(col("date"))
).withColumn(
"day",
dayofmonth(col("date"))
).show();
或者
DataFrame inputFrame = sqlContext.read()
.format("com.databricks.spark.csv")
.option("inferSchema", "true")
.option("header", "true")
.load(filePath.getAbsolutePath());
DataFrame with_data_frame = inputFrame
.withColumn(
"date", col("dt").cast("date"))
.withColumn(
"year",year(col("date"))
);
with_data_frame.show();
完美的)
推荐阅读
- azure - 在 Azure 中,使用 powershell 脚本将负载均衡器详细信息保存到 csv 文件中
- reactjs - Highcharts addPoint 动画
- python - 如何使用python在json文件中查找不完整的数据
- azure - 如何使用 pyodbc 将 pandas 数据帧的多行插入 Azure Synapse SQL DW?
- scala - 使用整数将相同的行添加到 Spark Dataframe
- firebase - 如何从 Firebase 数据库中检索子数据的值?
- javascript - 使用 opencv.js 的红色免费图像
- git - 做了一个 git reset --hard,但在 git pull 上仍然有冲突
- firebase - Flutter 中使用 Google SignIn 的有效登录屏幕,但用户数据未显示在我的 Firebase 控制台中
- mongodb - 如何在 mongoDB 中找到不同格式的 b/w 2 日期差异