machine-learning - 层次结构的输入特征
问题描述
我有层次结构的输入特征。每个特征由一个标题元素和相同结构的 0 到 n 个子特征组成。此外,n 没有上限,并且 n 可能因特征而异。还应该可以在具有不同数量的子特征的特征之间建立关系。
如何格式化这些数据,以便它可以用于训练不同的(机器)学习算法?
一个输入特征与 2 个子特征的示例:
<header code="21268_2" date_begin="2018-07-07T00:00:00" date_end="2018-07-07T00:00:00" reason=“2”>
<d code="I6"/>
<class="general”/>
</header>
<subelements>
<record amount="69.02" code=“439.0010" date_begin="2018-07-07T00:00:00" date_end="2018-07-07T00:00:00" quantity="1" record_id="2" tariff_type="001" unit_factor="0.82"/>
<record amount="46.32" code=“93.1950" date_begin="2018-07-07T12:00:00" date_end="2018-07-07T12:00:00" quantity="1" record_id="5" tariff_type="001" unit_factor="0.82"/>
</subelements>
解决方案
推荐阅读
- java - Android Studio - 生成签名的 APK:图像加载问题
- java - 逆词输入的逻辑校正-[ Tom Cat ] O/p [Cat Tom] 不使用拆分功能
- javascript - 当我打开 Bootstrap Modal 时,标签一直出现?
- c++ - Winsock recv() 阻止客户端应用程序
- javascript - 在此对象生成的 HTML 元素中引用 JS 对象
- asp.net - 在序列化具有一对多关系的实体时检测到循环引用
- django - Django循环表单集导致管理表单中的ValidationError
- c# - 无法使 Webclient.DownloadString() 的结果成为公共变量
- r - 对不同列表元素的行进行平均(对应于正确的日期)
- nativescript - 如何在 NativeScript 中访问 android 的 R 对象?