首页 > 解决方案 > TFRecord 数据集中的多变量可变长度时间序列

问题描述

我正在尝试从 UCI 存储库中编写一个 TFRecord 数据集:https ://archive.ics.uci.edu/ml/datasets/Character+Trajectories

数据由 2858 个样本组成,每个样本都有一个类别和一个多变量 (=3) 测量序列。最大长度为 205 步。

当我创建 TFRecord 数据集时,似乎要使用 tf.train.SequenceExample 对象。但所有示例仅涵盖单变量时间序列。

with tf.python_io.TFRecordWriter('/tmp/test.tfrecord') as writer:
for seq, cls in zip(sequences, classes)):
    LEN = seq.shape[1]
    example = tf.train.SequenceExample()
    example.context.feature["length"].int64_list.value.append(LEN)
    example.context.feature["class"].int64_list.value.append(cls)
    example_tokens = record_seq.feature_lists.feature_list['sequence']
    for i in range(LEN):
        #THIS does not work for 3xLEN sequences
        example_tokens.feature.add().float_list.value.append(seq[:,i])

如何使用 SequenceExample 将 3xLEN 序列写入 TFrecord?

标签: tensorflowmachine-learningtfrecord

解决方案


推荐阅读