首页 > 解决方案 > 如何在决策树中获取新数据的标签编码器

问题描述

我在以下示例数据的帮助下执行决策树。

在此处输入图像描述

所以我把上面的数据转换成LabelEncoder来执行Decision Tree,成功创建了一个DT模型。

在此处输入图像描述

所以现在我的要求是我想预测下面的值,那么如何在 python 代码中传递这些值。

在此处输入图像描述

为了预测现有值,我可以使用下面的预测代码。

model.predict([[2,1,1]])

完整代码

import pandas as pd

df = pd.read_csv(r"salaries.csv")
df.head()

inputs = df.drop('salary_more_then_100k',axis='columns')
target = df['salary_more_then_100k']

from sklearn.preprocessing import LabelEncoder
le_company = LabelEncoder()
le_job = LabelEncoder()
le_degree = LabelEncoder()

inputs['company_n'] = le_company.fit_transform(inputs['company'])
inputs['job_n'] = le_job.fit_transform(inputs['job'])
inputs['degree_n'] = le_degree.fit_transform(inputs['degree'])

inputs_n = inputs.drop(['company','job','degree'],axis='columns')

from sklearn import tree
model = tree.DecisionTreeClassifier()
model.fit(inputs_n, target)

model.score(inputs_n,target)

标签: python-3.xpandasdecision-treelabel-encoding

解决方案


推荐阅读