python - 从数据框中提取矩阵
问题描述
我有这样的事情:
import holoviews as hv
import pandas as pd
from holoviews import opts, dim
hv.extension('bokeh')
renderer = hv.renderer('bokeh')
csv_path = r'C:\Users\jose\Downloads\enron-v1.csv'
df_csv = pd.read_csv(csv_path ,index_col=0)
df_filter = df_csv[["fromJobtitle", "toJobtitle"]]
df_final = df_filter.groupby(df_filter.columns.tolist(),as_index=False).size()
这将产生如下内容:
fromJobtitle toJobtitle size
0 CEO CEO 65
1 CEO Director 23
2 CEO Employee 56
3 CEO In House Lawyer 7
4 CEO Manager 104
我想提取这个矩阵作为将数据绘制为全息视图中的桑基图的一种方式:
[['CEO', 'CEO', 65],
['CEO', 'Director', 23],
['CEO', 'Employee', 56]]
.......etc
解决方案
pd.DataFrame
已经以这种格式存储它们,所以你只需要这样做:
df_final.values
Out[149]:
array([['CEO', 'CEO', 65],
['CEO', 'Director', 23],
['CEO', 'Employee', 56],
['CEO', 'Lawyer', 7],
['CEO', 'Manager', 104]], dtype=object)
推荐阅读
- amazon-web-services - 如何在火花中加载存储在ec2单节点hadoop集群中的数据集
- java - Mockito 验证方法如何工作?
- javascript - 您如何使用 GraphQL 和 Mongoose 处理多个验证错误?
- javascript - 关闭弹出窗口?
- sql - 如果某些列有数据,则从两个表中选择比较删除 id
- amazon-web-services - 如何获得从 AWS Lambda 到 Redis 的安全访问?是否需要 VPC?
- javascript - 如何从功能组件调用调度程序?
- android - 在启动、安装和重新启动时初始化应用程序?
- arrays - 扩展 Tableview 部分。检查部分是否扩展的问题
- c - 命令访问不存在的文件时弹出错误状态