python - 如何通过指定列名获取所需的列数据
问题描述
我有以下代码,
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats
dataFileName='RFInput.xlsx'
sheetName='Rawdata'
sheetNamePara='paraList'
dataRaw=pd.read_excel(dataFileName, sheetname = sheetName)
datapara=pd.read_excel(dataFileName, sheetname = sheetNamePara)
noData=len(dataRaw)
import matplotlib.pylab as plt
from sklearn.cross_validation import train_test_split
from sklearn.cross_validation import cross_val_score
from sklearn.preprocessing import StandardScaler
labels = datapara
x = dataRaw[labels]
y = dataRaw['classVariable']
我所需的列名在 datapara 中指定,但它读取所有 vales 为 NaN
解决方案
目前,labels
参考数据框。要选择多个列,您需要在标签中指定一个列表,如下所示:
labels = datapara.columns
x = dataRaw[labels]
推荐阅读
- python - Tkinter 列表框转到错误的功能
- haskell - Idris/cabal 在 Windows 上从 removePathRecursive 安装问题
- html - CSS - 图标的布局随着屏幕大小的变化从水平变为垂直
- kubernetes - Kubernetes:使用自定义资源更新 configMap
- html - IE中不显示背景图片
- java - 使用带有整数(索引)作为键的 HashMap 与使用 ArrayList
- android - Android模拟器在启动期间关闭
- javascript - 访问下拉列表的选定值时未定义
- python - 有什么方法可以比 for 循环更快地遍历数组吗?
- django - Django Python 在 html 中显示函数