python - 在 Python 中向量化函数
问题描述
我有一个要矢量化的函数:
import pandas as pd
import numpy as np
import random
import statsmodels.api as sm
data = pd.DataFrame({
'state': ['a', 'b', 'c']*200,
'read': [random.uniform(10,50) for i in range(600)],
'write': [random.uniform(0,10) for i in range(600)],
'cansu': [random.uniform(11,20) for i in range(600)],
'brink': [random.uniform(2,10) for i in range(600)]
})
loop = pd.DataFrame({
'state': ['a','a','c','b','c'],
'x': [1,2,3,2,4],
'y': [2,3,4,4,1]
})
def regress(z,x,y):
X = data.query("state==@z").iloc[:,x].values
X = sm.add_constant(X)
Y = data.query("state==@z").iloc[:,y].values
result = sm.OLS(Y,X).fit()
return result.params[1]
我知道我可以使用apply, list comprehensions, itertools, map, filter, reduce, np.vectorize, etc.
所有很酷的功能。但是,我希望能够做这样的事情:
loop['slope'] = regress(loop['state'].values, loop['x'].values, loop['y'].values)
目前不起作用。这可能吗?如果是,我如何重写或修改我的函数以使其成为可能?
解决方案
以这种方式尝试
与您的代码相同:
import statsmodels.api as sm
data = pd.DataFrame({
'state': ['a', 'b', 'c']*200,
'read': [random.uniform(10,50) for i in range(600)],
'write': [random.uniform(0,10) for i in range(600)],
'cansu': [random.uniform(11,20) for i in range(600)],
'brink': [random.uniform(2,10) for i in range(600)]
})
loop = pd.DataFrame({
'state': ['a','a','c','b','c'],
'x': [1,2,3,2,4],
'y': [2,3,4,4,1]
})
def regress(z,x,y):
X = data.query("state==@z").iloc[:,x].values
X = sm.add_constant(X)
Y = data.query("state==@z").iloc[:,y].values
result = sm.OLS(Y,X).fit()
return result.params[1]
在列表中执行:
loop['slope'] = regress(list(loop['state'].values), list(loop['x'].values), list(loop['y'].values))
推荐阅读
- javascript - 如何分别为每个 rangeSelector 按钮设置 xAxis maxRange/minRange
- python - mysqlclient-1.4.6 现在在 3.6 下安装时无法安装(Python 3.9)(已解决)
- android - 使用 viewmodel 将项目添加到 MutableList
- node.js - 为什么将 SocketIO 与 Express 和 React 一起使用时 CORS 会被阻止
- python - 在索引后合并两个 Numpy 布尔数组
- python - vscode 中的 Python linter 类型检查不完整(预期...得到...)
- html - 如何使用自动缩放图像使一些图像适合引导列以填充列
- apache-spark - 什么是 Hive Encoding Charset 以读取特殊字符
- java - 如何将 SQL 日期转换为不同格式的字符串日期?
- java - 当 CSS 用于列宽时,Vaadin 8 Grid 滚动条的行为不正常