python - Python重塑数据框
问题描述
我在重塑我的数据框时遇到问题,其中包含某人的购物历史。
d = {'0': ["cars", "clothes","food"], '1': ["electronics", "food","food"]}
df = pd.DataFrame(data=d)
现在我想制作新的数据框,其中每一行包含最后一个感兴趣的类别和新的一个,所以一个 2 列的数据框看起来像这样:
d = {'0': ["cars", "clothes"],'1':["clothes","food"] '2': ["electronics", "food"],'3':["food","food"]}
df = pd.DataFrame(data=d)
我可以用 for 循环来做到这一点,但由于我有一个大数据集,这需要很长时间。有没有更快的方法来做到这一点?
`
#create pairs from each path
totalArr = list()
for pa in dataset['channel']:
newArr = list()
for ind,chan in enumerate(pa):
maxlen = len(pa)
if(ind < maxlen-1):
newArr.append([pa[ind],pa[ind+1]])
totalArr.append(newArr)
fromToDf = pd.DataFrame(columns=['from','to'])
for a in totalArr:
for b in a:
fromToDf= fromToDf.append(pd.DataFrame(data={'from':[str(b[0])],'to':[str(b[1])]}))
`
解决方案
推荐阅读
- python-3.x - Inno Setup Compiler:安装的 Python 文件立即关闭
- cpu-architecture - LRU缓存替换策略的混淆图
- angular - 离子电容器地理定位是缓存位置/位置。无法获取新位置
- snowflake-cloud-data-platform - 提高此查询的展平性能
- android - PdfRenderer 在呈现受密码保护的文件后总是抛出“需要密码”SecurityException
- javascript - 为什么没有从 Chrome 扩展程序正确更新 React 控制的输入元素的值?
- c# - ASP.NET MVC。Hot 将数据从视图传输到控制器而不会丢失数据
- http - 有没有办法检查 HTTP 请求中的无效查询参数?
- java - 创建了我自己的二进制搜索版本,不明白为什么它比常规方法更快?
- javascript - 正则表达式模式 - 简单的字符串模板,对象映射