首页 > 解决方案 > ValueError:发现样本数量不一致的输入变量:[24, 2]

问题描述

我试图做一个股票预测算法,几乎完成了——我只需要实现线性 SVC 算法。所以,我已经清理了数据,我想使用 train_test_split 库来拆分数据,以便我可以将预测模型拟合到它上面。但是,当我尝试拆分数据时,出现此错误:

ValueError: Found input variables with inconsistent numbers of samples: [24, 2]

我一直非常细致,并验证了我的所有特征的长度都相同 - 格式为 [[Feature1][Feature2][Feature3][Feature4]] 并且我的 Y 与数据长度的长度相同。

我正在使用时间线 2010/01/01 - 2010/01/10 使其更具可读性。不幸的是,在查看了几个线程和一些文档之后,我无法弄清楚为什么我的拆分不起作用。如果您知道发生了什么,请告诉我。

预测器类:

#I want to use Linear SVC
#Sci Kit Learn
class Predictor:
    def __init__(self, stock):


    from sklearn.svm import LinearSVC as lsvc
    from sklearn.model_selection import train_test_split as tts         

    features = []

    for i in stock.features:
        inner = []

        for ii in i.featureData:
            inner.append(ii)
        features.append(inner)

    y =  stock.two_list

    clf = lsvc(random_state=0, tol=1e-5)

    xTrain, xTest, yTrain, yTest = tts(features, y)

    #clf.fit(xTrain, yTrain)

    #>>> X_train, X_test, y_train, y_test = train_test_split(
    #...     X, y, test_size=0.33, random_state=42)


    #print(clf.score(xTest, yTest))

在此处运行代码: https ://repl.it/@JacksonEnnis/Stock-Alg

标签: pythonscikit-learn

解决方案


推荐阅读