首页 > 解决方案 > 在 jupyter nonotebook 中读取巨大的 csv 文件时缺少列

问题描述

所以我试图通过如下代码读取一个csv文件:

import pandas as pd
user_cols = ['id','listing_type','status','listing_class','property_type','street_address','city','state',' 'zip_4','cross_street','street_index','unit','floor','location','Latitude',
             'longitude','subway','neighborhood','price','incentives','fee_type','fee_percentage','fee_details_broker',
             'fee_details_clients','application_information','maintenance','taxes','max_financing','other_costs','beds',
             'baths','full_baths','three_quarter_baths','half_baths','total_rooms','square_feet','exterior_square_feet',
            'lot_area','lot_dimensions','date_available','date_listed','closed_on','year_built','recent_renovation',
             'lease_min','lease_max','date_added','date_edited','date_update','contact','access','keys','mls_name','mls_id',
            'courtesy_of','vow_opt_out','idx_opt_out','pet_details','notes','sync','private','listing_score','added_by_id',
            'featured_office_id','date_expires','exclusive_file_id','condition','guarantor','blast_link']

data = pd.read_csv("C:\\Users\\Desktop\\dump-4.csv", low_memory=False, dtype=object, header=None, names=user_cols)

我能够读取文件,但是当我尝试显示列时,大约有 15-16 个列名丢失。为什么会发生这种情况,我该怎么办。

标签: pythonpandasjupyter-notebook

解决方案


因此,当我删除 dtype=object 和 header=None..它确实打印了所有列。不太确定什么是正确的 dtype !不管怎么说,还是要谢谢你!:)


推荐阅读