python - 我的数据框标题在 Python Google Colab 中没有正确显示
问题描述
我正在尝试以这种方式在 Google Colab 中创建一个数据框,因为我计划稍后对大约 1000 个文件进行分析。我的变量名标头没有正确注册时遇到问题。我已经链接了我的代码输出以及预期的标题。
我的输出:-
我的代码如下:
import numpy as np
import pandas as pd
from pandas import DataFrame
import pandas_datareader as pdr
from pathlib import Path
import glob
import csv
import sys
import os
import io
# Load the Drive helper and mount
from google.colab import drive
# This will prompt for authorization.
drive.mount('/content/drive')
iter_changes = "Prediction"
PATH_TO_DRIVE_ML_DATA = "/content/drive/My Drive/Root_Work_Sample/inputs"
INPUT_PATH = PATH_TO_DRIVE_ML_DATA+"/work_sample"
OUTPUT_PATH = PATH_TO_DRIVE_ML_DATA+"/outputs/"+iter_changes
# check if directory already exists
if not os.path.exists(OUTPUT_PATH):
os.makedirs(OUTPUT_PATH)
print("Directory created", OUTPUT_PATH)
else:
pass
#raise Exception("Directory already exists. Don't override.")
df = pd.read_csv(os.path.join(INPUT_PATH, 'Root_Work_Sample_Stadardized_Test.csv'), engine='python')
#df = pd.read_csv(io.BytesIO(uploaded['Root_Work_Sample_Stadardized_Test.csv']))
print(df.shape)
print(df.columns)
display(df.head(5))
print(df.dtypes)
我的输出与正确的标题:-
解决方案
我不确定为什么会发生这种情况,因为我无权访问您的数据,但解决此问题的一种方法是对列名进行硬编码:
header = ["your", "column", "names"]
df = pd.read_csv(os.path.join(INPUT_PATH, 'Root_Work_Sample_Stadardized_Test.csv'),
engine='python',
names = header)
推荐阅读
- json - 即使 json 发送了正确的信息,higcharts 中的一个系列名称也没有被填充
- mysql - 一对一关系在 MySQL 工作台数据建模图中创建两个外键
- sql - 更改表以根据某些先前选择的查询添加动态列
- html - 如何设置配置以便 Thymeleaf 呈现我的 html 模板
- r - R表,2个因子变量,无法生成列百分比
- ios - Branch.io quicklink TEST 与 LIVE 有不同的数据
- java - 使用 ExtentXReporter 合并多个范围 html 报告
- command-line - “没有这样的文件或目录” - 但它确实存在 - Windows 7
- javascript - 多次调用类构造函数
- sql - SQL查询从多对多表中替换模板中的多个值