r - 在 R 中使用 RODBC 创建循环 SQL QUERY
问题描述
首先,感谢您抽出宝贵时间查看我的问题,无论您是否回答!
我正在尝试创建一个函数,该函数循环遍历我的 df 并使用 R 中的 RODBC 包从 SQL 中查询必要的数据。但是,我在设置查询时遇到了麻烦,因为查询的参数在每次迭代中都会发生变化(例如以下)
所以我的 df 看起来像这样:
ID Start_Date End_Date
1 2/2/2008 2/9/2008
2 1/1/2006 1/1/2007
1 5/7/2010 5/15/2010
5 9/9/2009 10/1/2009
我将如何在我的 sql 程序中指定开始日期和结束日期?
这是我到目前为止所拥有的:
data_pull <- function(df) {
a <- data.frame()
b <- data.frame()
for (i in df$id)
{
dbconnection <- odbcDriverConnect(".....")
query <- paste("Select ID, Date, Account_Balance from Table where ID = (",i,") and Date > (",df$Start_Date,") and Date <= (",df$End_Date,")")
a <- sqlQuery(dbconnection, paste(query))
b <- rbind(b,a)
}
return(b)
}
但是,这不会查询任何内容。我相信这与我如何指定迭代的开始和结束日期有关。
如果有人可以在这方面提供帮助,将不胜感激。如果您需要进一步的解释,请不要犹豫!
解决方案
当前设置会出现几个语法问题:
循环:您不会遍历数据帧的所有行,而只会遍历单列中的原子 ID 值,
df$ID
. 在同一个循环中,您将整个向量传递给查询连接。df$Start_Date
df$End_Date
日期:您的日期格式与“YYYY-MM-DD”的大多数数据库日期格式不一致。还有一些其他的,比如 Oracle,你需要字符串到数据的转换:
TO_DATE(mydate, 'YYYY-MM-DD')
.
前面提到的几个性能/最佳实践问题:
参数化:虽然出于安全原因不需要参数化,因为您的值不是由可以注入恶意 SQL 代码的用户输入生成的,但为了可维护性和可读性,建议使用参数化查询。因此,考虑这样做。
不断增长的对象:根据 Patrick Burn 的Inferno Circle 2:Growing Objects,R 程序员应避免在循环中增长多维对象(如数据帧),这会导致内存中的过度复制。相反,建立一个数据帧列表,
rbind
一旦在循环之外。
话虽如此,您可以通过将数据框保存为数据库表然后连接到最终表以进行过滤、连接查询导入来避免任何循环或列表需求。这假设您的数据库用户具有CREATE TABLE
权限DROP TABLE
。
# CONVERT DATE FIELDS TO DATE TYPE
df <- within(df, {
Start_Date = as.Date(Start_Date, format="%m/%d/%Y")
End_Date = as.Date(End_Date, format="%m/%d/%Y")
})
# SAVE DATA FRAME TO DATABASE
sqlSave(dbconnection, df, "myRData", rownames = FALSE, append = FALSE)
# IMPORT JOINED AND DATE FILTERED QUERY
q <- "SELECT ID, Date, Account_Balance
FROM Table t
INNER JOIN myRData r
ON r.ID = t.ID
AND t.Date BETWEEN r.Start_Date AND r.End_Date"
final_df <- sqlQuery(dbconnection, q)
推荐阅读
- c# - 如何使用 Swashbuckle 记录有条件要求的财产
- c# - 如何在 Xunit.net 测试中查看记录器输出?C#
- c++ - i 的反转对
2*A[j] 使用归并排序 - java - Apache Spark SQL StructType 和 UDF
- javascript - javascript:如何按子项的内容对 div 进行排序
- go - 如何在 Go ASM 中处理切片作为输入和输出
- java - 从数据库中提取数据到地图
- json - 解码 golang http.Client POST 输出
- python - 是否可以通过 Ctypes 调用带有指向 3dim 数组的指针的 C DLL?
- java - 记录器参数变成了一个数组对象