首页 > 解决方案 > 如何从 hive 中的 DNS 数据中提取域

问题描述

如何从 DNS 数据中提取域名。

我想从中提取域的示例:

www.google.com

结果应该是google

我正在使用 hive 从 Hadoop 获取数据并使用常规提取功能。

标签: regexhive

解决方案


像这样的东西:

   select case when size(site_name_splitted )=3 then site_name_splitted[1]
               when size(site_name_splitted )=2 then site_name_splitted[0]
             end as domain
      from
    (
        select split(col,'\\.') as site_name_splitted from mytable
    )s

推荐阅读