apache-pig - 如何从列中的字符串列表中提取特定单词
问题描述
我在表中有以下数据。
Archer late
Patrick late
Marie Walter late
Michael-d'souza late
我想用猪从这个列表中删除后期?我可以regex
用来删除这个词吗?有人可以帮我解决这个问题吗?
编辑:
我使用了以下命令但失败了:
EXTRACT(姓氏,'(\b[Dd]+[Ee]+[Cc]+[Ee]+[Aa]+[Ss]+[Ee]+[Dd]+\b)'))
解决方案
调用 REPLACE 怎么样?
A = LOAD 'input.txt' AS (a0:chararray);
B = FOREACH A GENERATE REPLACE(a0, 'late','');
dump B;
推荐阅读
- ios - 由于未捕获的异常“NSInvalidArgumentException”而终止应用程序,原因:“-[__NSCFTimer encodeWithCoder:]
- r - R中按条件分组的动态列名
- swift - 采用 Swift HTTP POST 并解码 JSON 响应
- python - 试图将 python 文件(我有函数)导入到我的主要 python 文件中
- c# - 路由中的命名空间是什么?
- c# - 如何开始 wopi 协议与 Web 版 Office 集成?使用azure部署wopi主机
- java - android 图库应用程序中从在线存储下载的图像和视频的时间戳不正确?
- java - 如何在 Windows 和 Java 11 上调试“软件导致连接中止:recv 失败”?
- flutter - Android 不支持所选的 imageFormatGroup
- c++ - 如何用无符号长乘法得到准确的结果?