首页 > 解决方案 > 如何在 APACHE Sqoop 中导入 HTML 内容

问题描述

我需要使用 scoop 将 HTML 内容(MS SQL Server 表中的字段)导入文本文件。虽然我没有收到任何错误,但应该导入字段。缺少一些 HTML 标记。任何帮助,将不胜感激。下面是sqoop评论

sqoop 导入 --driver "net.sourceforge.jtds.jdbc.Driver" --connect \ "jdbc:jtds:sqlserver://abcd;instance=MSSQLSERVER;databaseName=abcd;domain=abcd.com" --username abcd - P \ --query "select * from abcd.html" --target-dir /user/abcd/abcd --split-by id --fields-terminated-by '|'

HTML 内容示例:

EMAIL SUBJECT: FW: The Update Site URL<br />
EMAIL BODY: <div>
<p style="margin: 0;"><span style="color:#1F497D">Hello.&nbsp; I will need assistance with this so the radio 
can download calls to our server.&nbsp; Thank you.</span></p>
<p style="margin: 0;"><span style="color:#1F497D"></span></p>
<p style="margin: 0;"><span style="color:#1F497D"></span></p>

标签: sqoop

解决方案


推荐阅读