python - 从 StackOverflow 内容创建数据帧示例的最快方法
问题描述
对于 StackOverflow 上与 pandas 相关的问题,人们通常会提供如下示例数据:
a b c d e
0 -0.420430 -0.394562 0.760232 0.152246 -0.671229
1 0.388447 0.676054 -0.058273 -0.246588 0.811332
2 -0.498263 -0.108011 0.952489 0.504729 -0.385724
3 1.069371 0.143752 0.414916 -1.180362 -0.029045
4 -0.245684 -0.150180 0.210579 0.063154 0.261488
5 0.064939 -0.396667 0.857411 -0.460206 0.039658
在我自己的 jupyer notebook 中创建数据的最有效方法是什么,以便我可以进一步调查这个问题?
通常,我会将有关数据复制到记事本并用逗号替换空格并执行以下代码来创建相同的数据:
data = np.array([-0.420430,-0.394562,0.760232,0.152246,...]) # paste the result from notepad here
df = pd.DataFrame(data.reshape(-1,5),columns=[HEADERS_OF_DATA]) # 5 is number of columns
然而,这是相当缓慢和不方便的。有没有更快的方法呢?
解决方案
奇妙的是,您可以使用pd.read_clipboard()
.
只需从问题中复制发布的 DataFrame,然后这行代码将使用以下代码将其解析为 DataFrame pd.read_table()
:
df = pd.read_clipboard()
推荐阅读
- python - 从 numpy 数组中提取总和为所需输出的组合
- c++ - 调用 emptyStack.top() 时返回什么
- google-apps-script - 在 Google 脚本中将值从一列复制到另一列
- excel - 单元格的列表验证
- c - 为什么在处理ucontext时打印到stderr会导致分段错误?
- jenkins - 在 ansibel 版本 2.4.0.0 中过滤带有“标签”名称的 EC2 实例的正确语法是什么?
- swift - 如何修复“使用未解析的标识符‘flowLayout’”
- python - Python GTK+ 3 教程 Hello World 中没有名为“gi”的模块
- php - 如何使用 hasManyThrough 通过 Eager Loading 获取嵌套关系值?
- javascript - 如何将数据对象用于样式标签?Vue.js