首页 > 解决方案 > 拆分数据 Python

问题描述

大家好,我有这样的数据;

0 1 2
-- 州:美国各州(按编号)- 不计入... 但如果考虑 应该被认为是名义上的(名义上的)
-- 县:县的数字代码 - 不是预... 和许多缺失值(数字)
... ... ...

但我想变成这样;

0 1 2
状态 美国各州(按数字) - 不计入...但如果考虑 应该被认为是名义上的(名义上的)
县的数字代码 - 不是 predi ...和许多缺失值(数字)
... ...... ……

或者简单地说;

0
状态
国家
……

我写了这段代码,但我想知道有没有办法更快地做到这一点..

variable_names = pd.read_csv("path", header = None)

df = variable_names[0]
df = df.str.split(': ', expand = True)

df = df[0]
df = df.str.split('-- ', expand = True)

标签: pythonpandasperformance

解决方案


解决此问题的一种方法是:

# This becomes a pandas dataframe.
variable_names = pd.read_csv("path", header = None)

# Using simple apply works on all rows.
variable_names[0] = variable_names[0].apply(lambda x:x.split(': ')[0])
variable_names[0] = variable_names[0].apply(lambda x:x.split('-- ')[1])

请检查这是否适合您。


推荐阅读