首页 > 解决方案 > (Vowpal Wabbit) 上下文强盗模拟错误

问题描述

我正在使用 vowpal wabbit 离线模拟和评估我的模型。所以我使用了网站https://vowpalwabbit.org/tutorials/cb_simulation.html教程部分中的功能。

运行模型时出现错误。

错误是: cb_adf: badly formatted example, only one line can have a cost

所以我打印了格式,看看它是否真的如此,但对我来说格式没问题,因为我在错误弹出之前得到了这种格式:

shared |User client=1425 ord_amt=69.90674997927502 PM=24.676111110999997
|Action actions=0 
|Action actions=1 
|Action actions=2 
|Action actions=3 
|Action actions=4 
|Action actions=5 
0:44.83788:0.82222 |Action actions=6 
|Action actions=7 
|Action actions=8 

此外,这个错误总是在第 16 次迭代中弹出,我的用户在每次运行时都是随机挑选的。

有些人面临同样的错误,或者有人可以为我指明解决方案的方向?

标签: pythonreinforcement-learningvowpalwabbit

解决方案


推荐阅读