首页 > 解决方案 > 使用 Pandas,我如何根据第一个空格进行拆分。

问题描述

所以我有一列代码:“dataset.csv”

0020-004241 purple
00532 - Blue
00121 - Yellow
055 - Greem
0025-097 - Orange

期望的输出:

code              name_of_code
    0020-004241         purple 
    00532               blue 

我希望将代码和代码的单词分成两个不同的列。

我试过了:

df =pandas.read_csv(dataset.txt)

df = pandas.concat([df, df.columnname.str.split('/s', expand=True)], 1)
df = pandas.concat([df, df.columnname.str.split('-', expand=True)], 1)

` 它给出了意想不到的输出:紫色无蓝色无黄色无绿色无橙色无

我应该如何正确拆分这些数据?

标签: pythonstringpandasdataframesplit

解决方案


使用str.split(" ", 1)

前任:

import pandas as pd
df = pd.read_csv(filename,names=['code'])
df[['code','name_of_code']] = df["code"].str.split(" ", 1, expand=True)
df["name_of_code"] = df["name_of_code"].str.strip("-")
print(df)

输出:

          code name_of_code
0  0020-004241       purple
1        00532         Blue
2        00121       Yellow
3          055        Greem
4     0025-097       Orange

推荐阅读