csv - 如何在 solr 中使用 dih 索引 csv 文件
问题描述
我是 solr 的新手,所以我可能写错了 dih。我的 solr db 中已经有数据,我需要扩展我的 dih 文件,以便它可以索引包含更多信息的 csv 文件,并且 csv 和 solr db 数据由common id.我所做的是 -find 在下面的代码中
这是我的 csv 文件-->
Node_IP probe_name Global_ID
10.53.3.87 ILRNAPSUD03 4b44aaff1e09f3d793fe9
10.224.47.26 ILRNAPSUD03 47eebea2c2d485b59
这是一个dih片段-->
<entity name="tmin"
processor="XPathEntityProcessor"
dataSource="FileDataSource"
stream="true"
url="${pickupdir.fileAbsolutePath}"
onError="skip"
forEach="/execution/"
transformer="script:makePair,script:makeLogPair, TemplateTransformer,
RegexTransformer, HTMLStripTransformer"
>
<field column="jobid_t" xpath="/execution/@jobId" />
<field column="destinationid_t" xpath="/execution/@destinationid" />
<field column="id" template="${tmin.destinationid_t}" />
<field column="log_param" xpath="/execution/log/@severity" />
<field column="log" xpath="/execution/log" />
<entity name="importcsv"
processor="LineEntityProcessor"
url="C:\Users\arpiagar\Desktop\IP Probe name_ILRNAPSUD01.csv"
rootEntity="false"
dataSource="FileDataSource"
header="true"
separator=","
transformer="TemplateTransformer, RegexTransformer,script:mapcsv"
>
<field column="rawLine" groupNames="Node_IP,probe_name,Global_ID"/>
<field column="id" name="Global_ID" />
<field column="probe_name" name="probe_name" />
</entity>
</entity>
我需要将 tmin 实体中的 id 与我们在索引 csv 数据和索引 probe_name 和 node_ip 在该特定 id 后获得的 id 映射。