python - 如何在 python 中“写入新的 .CSV 文件”或“另存为新的 .CSV 文件”
问题描述
我有一个 CSV 文件,我想应用一个热编码,然后将新的数据帧(数据集)保存为新的 CSV 文件。但是当新文件保存时,它只写入了 5 Rows of dummy 和原始数据集的所有行!
我只想将所有行和列保存在新的 file.csv 中,数据集的最终形状是(237124, 417)
.
我的代码包含:
import numpy as np
import pandas as pd
from sklearn.preprocessing import OneHotEncoder
from sklearn.preprocessing import LabelEncoder
import csv
dataset=pd.read_csv("C:/Users/User/Desktop/data.csv",encoding='cp1252')
dataset.shape
#output: (237124, 37)
dummies = pd.get_dummies(dataset, columns=["name","mark",....... ]).head()
dummies.shape
#output : (5, 380)
dataset = pd.concat([dataset, dummies], axis=1)
dataset.shape
#output: (237124, 417)
# i want this shape(original+dummies)
dataset.to_csv('OneHotEncodnig.csv', index=False)
解决方案
您df.head()
在此行中调用:
dummies = pd.get_dummies(dataset, columns=["name","mark",....... ]).head()
这就是为什么你只得到 5 个虚拟行的原因。删除.head()
,您将获得所有行。
推荐阅读
- python - 从稳定基线绘制熵、平均奖励等
- java - 如何检查arrayList的所有元素是否相同?
- ios - 如何快速更改base64编码中的sha1?
- python - 从Python中的字典中检索第一个键值对而不使用列表,iter
- python - 如何在 Python 中创建可变代码?
- python - 如何让 Django 使用当前应用程序的模板文件夹?
- json - Couchbase 中的索引 - 使用主索引而不是二级索引
- javascript - 如何以及何时检查数组中的所有对象值是否不为空?
- swift - Swift 闭包定义为类属性不能访问其他类属性
- react-native - React Navigation - 当我在屏幕之间导航时内存增加