首页 > 解决方案 > Spark(Scala):来自数据帧计数()的 println 的流氓“%”符号

问题描述

我正在使用Yelp 学术数据集,并且我从评论样本中抽取了一小部分样本,以确定小规模不同的、经过审查的企业的数量。

val distinctReviewedBusinesses = reviewsDataFrame.select("business_id").distinct()
print("Number of distinct, reviewed businesses: " + distinctReviewedBusinesses.count())

我不是要求解决问题,而是关于输出的错误,它有一个流氓百分号'%'(如下所示)。它在那里有什么业务?

不同的、经过审查的企业数量:6600%

在下图中,您可以看到,由于某种原因,百分号被突出显示。

在此处输入图像描述

标签: scalaapache-sparkdataframeprintln

解决方案


我假设你正在使用 zsh。在 zsh 中,该符号表示输出的最后一行没有终止换行符。发生这种情况是因为您使用的是 print 而不是 println。在 SuperUser 上查看更多信息。


推荐阅读