apache-spark - SparkContext'没有属性'builder error
问题描述
我正在尝试从 pyspark 中的数据框中注册临时表。代码:
from pyspark.sql import SQLContext
from pyspark import SparkContext
sc = SparkContext.builder.appName("Python Spark").getOrCreate()
sqlCtx = SQLContext()
data = sqlCtx.read.csv("D:/Customers_v01.csv", header=True, inferSchema=True)
data.registerTempTable("data")
spark.sql("SELECT * from data").show()
但这会引发 AttributeError 错误:类型对象'SparkContext'没有属性'builder'。
数据看起来像
CM,503004,(d$όνυ$F|'.h*Λ!ψμ=(.ξ; ,.ʽ|!3-2-704 ,.ʽ/8μAθr ,(d$όνυ<<*έθr ,C51,CN-511450
我是不是错过了什么。请帮忙
解决方案
你需要使用这种方式。
from pyspark.sql import SparkSession
spark = SparkSession \
.builder \
.appName("Python Spark SQL basic example") \
.getOrCreate()
创建 spark 会话后,您可以通过这种方式读取 csv。
data = spark.read.csv("D:/Customers_v01.csv", header=True, inferSchema=True, encoding='ISO-8859-1')
推荐阅读
- javascript - 寻找一种更好的方法来在 javascript 中存储动态创建的对象列表
- c++ - C++ 如何从函数返回一个字符数组?
- ios - 我已在 App Store 中上传 IPA,但 ipa 未在 App Store 中上传。在 App Store 中显示一些错误
- facebook - 跟踪 facebook 按钮(不推荐使用 edge.create)。是否有替代方案,但没有 Webhooks?
- java - 来自 Google Play 的安全警告!弱势阶层
- javascript - 通过推送更新出现不一致的数据 - 多个服务人员同时处于活动状态?
- ssis - BIDS 2008 DTS 包删除密码
- jquery - Jquery 选择器:如何选择元素
- r - 将带有坐标的数据框和带有 shapefile 的数据框结合起来,以创建带有多边形和点的地图
- angular - Angular 反应式表单或模板驱动表单,用于简单表单但同时用户使用相同数据?