首页 > 解决方案 > 层次结构的输入特征

问题描述

我有层次结构的输入特征。每个特征由一个标题元素和相同结构的 0 到 n 个子特征组成。此外,n 没有上限,并且 n 可能因特征而异。还应该可以在具有不同数量的子特征的特征之间建立关系。

如何格式化这些数据,以便它可以用于训练不同的(机器)学习算法?

一个输入特征与 2 个子特征的示例:

<header code="21268_2" date_begin="2018-07-07T00:00:00" date_end="2018-07-07T00:00:00" reason=“2”&gt;
     <d code="I6"/>
     <class="general”/>
</header>
<subelements>
    <record amount="69.02" code=“439.0010" date_begin="2018-07-07T00:00:00" date_end="2018-07-07T00:00:00" quantity="1" record_id="2" tariff_type="001" unit_factor="0.82"/>
    <record amount="46.32" code=“93.1950" date_begin="2018-07-07T12:00:00" date_end="2018-07-07T12:00:00" quantity="1" record_id="5" tariff_type="001" unit_factor="0.82"/>
</subelements>

标签: machine-learninghierarchical-data

解决方案


推荐阅读