首页 > 解决方案 > 从 StackOverflow 内容创建数据帧示例的最快方法

问题描述

对于 StackOverflow 上与 pandas 相关的问题,人们通常会提供如下示例数据:

          a         b         c         d         e
0 -0.420430 -0.394562  0.760232  0.152246 -0.671229
1  0.388447  0.676054 -0.058273 -0.246588  0.811332
2 -0.498263 -0.108011  0.952489  0.504729 -0.385724
3  1.069371  0.143752  0.414916 -1.180362 -0.029045
4 -0.245684 -0.150180  0.210579  0.063154  0.261488
5  0.064939 -0.396667  0.857411 -0.460206  0.039658

在我自己的 jupyer notebook 中创建数据的最有效方法是什么,以便我可以进一步调查这个问题?

通常,我会将有关数据复制到记事本并用逗号替换空格并执行以下代码来创建相同的数据:

data = np.array([-0.420430,-0.394562,0.760232,0.152246,...]) # paste the result from notepad here
df = pd.DataFrame(data.reshape(-1,5),columns=[HEADERS_OF_DATA]) # 5 is number of columns

然而,这是相当缓慢和不方便的。有没有更快的方法呢?

标签: pythonpandasdataframe

解决方案


奇妙的是,您可以使用pd.read_clipboard().

只需从问题中复制发布的 DataFrame,然后这行代码将使用以下代码将其解析为 DataFrame pd.read_table()

df = pd.read_clipboard()

推荐阅读