首页 > 解决方案 > 如何有条件地从列中删除前两个字符

问题描述

我有一些电话记录的以下数据,我想从每条记录中删除前两个值,因为它们是国家代码。我可以通过什么方式使用 Scala、SparkHive做到这一点?

phone
|917799423934|
|019331224595|
|  8981251522|
|917271767899|

我希望结果是:

phone
|7799423934|
|9331224595|
|8981251522|
|7271767899|

我们如何从该列的每条记录或每一行中删除前缀 91,01?

标签: scalaapache-sparkhadoophive

解决方案


电话大小可以不同,可以使用这样的构造(Scala):

df.withColumn("phone", expr("substring(phone,3,length(phone)-2)"))

推荐阅读