首页 > 解决方案 > numpy 数组格式的张量流排序输入数据

问题描述

到目前为止,我可以为 Tensorflow Ranking 找到的所有示例都只采用稀疏特征,我已经有一个数据集预处理为以下格式的 numpy 数组:

relevance, query, feature_1, feature_2, ... feature_100
   2,      "a",       0.1,         0.2, ...  0.15
   1,      "a",       0.2,        0.21, ...  0.15

我正在查看这个示例,它读取 libsvm 数据并返回一个特征字典,其中每个键都是特征列名称:https://github.com/tensorflow/ranking/blob/master/tensorflow_ranking/examples/tf_ranking_libsvm。 py#L136[query_size * list_size, feature_count]但随后它在输入图表之前 被展平到一个维度。https://github.com/tensorflow/ranking/blob/master/tensorflow_ranking/examples/tf_ranking_libsvm.py#L323

我是否必须重新格式化我的数据才能使用 tensorflow 排名?我看到example_feature_columns是用在encode_listwise_featuresand中,是为 tf 排名encode_pointwise_features创建必须的吗?example_feature_columns

标签: tensorflowranking

解决方案


推荐阅读