首页 > 解决方案 > 读入熊猫数据框的特殊字符

问题描述

我正在尝试从包含特殊字符的 json 文件中读取一些名称。不幸的是,当我在 json.load 中使用编码 utf-8 时,它仍然没有将特殊字符读入我的 pandas 数据帧。

def player_matrix(player_file): 
    with open(player_file) as f:
        data = json.load(f, encoding='utf-8')
    all_players = pd.DataFrame(data)
    
    player_dataset = pd.DataFrame(columns=['player_id','name','short name', 'nation', 'team_id' ])
    
    for index,player in all_players.iterrows():
        player_dataset.at[index,'player_id']=player['wyId']
        player_dataset.at[index,'name'] =  str(player['firstName'])+' '+str(player['lastName'])
        player_dataset.at[index,'short name'] =  player['shortName']
        player_dataset.at[index,'nation'] =  player['currentNationalTeamId']
        player_dataset.at[index,'team_id'] =  player['currentTeamId']

    return player_dataset

players_df = player_matrix(playerfile)
players_df

我的输出如下所示: 输出

我该怎么做才能将这些特殊字符读入jupyter笔记本而不是unicode表示?

编辑:这是 json 文件的示例(在 excel 中打开) 在此处输入图像描述

标签: pythonpandasunicode

解决方案


推荐阅读