首页 > 解决方案 > 从 csv 文件中提取一个带有希伯来语列名的列,python

问题描述

我正在使用 pandads read_csv 读取文件并提取特定列。我可以很容易地使用带有拉丁字母列名的文件,首先通过以下方式识别列名: x=pd.read_csv('file_name') print(x).head(0)) 然后简单地通过 desired_column= 选择一列x('desired_conumn_name')

当列名是希伯来语时,我不知道如何应用此过程。在这种情况下 print(x).head(0)) 打印jibrish。即使我通过使用 excel 识别(希伯来语)列名 'מאושפזים' ,并在 desired_column= x( 'מאושפזים') 中使用它

它不起作用并响应:文件“pandas_libs\hashtable_class_helper.pxi”,第 1627 行,在 pandas._libs.hashtable.PyObjectHashTable.get_item

KeyError:'מאושפזים'

拉丁字母列名的示例效果很好:

mob_file='C:\D_on_external_drive\papers\RESEARCH DATASETS\Global_Mobility_Report.csv'
mobility=pd.read_csv(mob_file)
print(mobility.head(0))
vv=mobility['country_region']

希伯来语列名不起作用的示例:

cov_file='https://data.gov.il/dataset/f54e79b2-3e6b-4b65-a857-f93e47997d9c/resource/e4bf0ab8-ec88-4f9b-8669-f2cc78273edd/download/corona_hospitalization_ver_0033.csv'
covid=pd.read_csv(cov_file)
print(covid.head(0))
uu=covid['מאושפזים']

谢谢

标签: pandaspython-2.7

解决方案


由于您正在使用python2.7,请尝试将字符串设置为 unicode

uu=covid[u'מאושפזים'] # note the u

推荐阅读