首页 > 解决方案 > 最大化因变量总和的预测模型

问题描述

我正在尝试为一家拖车公司对汽车进行分类。垃圾车被送到垃圾场赚得更多,更有价值的车在拍卖会上赚得更多,尽管有拍卖费。创建一个考虑到品牌、型号、里程、年份和运行状态的逻辑回归有助于我们提高哪些汽车应该去哪里的准确性,但出现了一个困难:有时,一辆被归类为垃圾的汽车实际上可能是一个异常值,并且卖了很多钱。因此,为了优化我们的模型,我们并不真正关心我们在一辆汽车上的正确或错误,而是我们最大化我们的底线。我见过的所有模型(逻辑回归、RF、线性回归)都是逐行进行预测的。什么是一个好的模型来尝试最大化预测的总和?下面是我的数据的代表,以及我使用的基本代码。到目前为止,我实际上尝试的是查看过去的数据,然后根据在拍卖中获得的价格与可用的垃圾价格对应该做的事情进行分类。然后,我针对该分类运行 glm 以预测未来。如上所述,我的代码提高了我们决策的准确性,并且可以正确地发送更多的汽车到垃圾车,但是我们归类为垃圾车的一些在拍卖中卖得太高以至于不值得发送 然后,我针对该分类运行 glm 以预测未来。如上所述,我的代码提高了我们决策的准确性,并且可以正确地发送更多的汽车到垃圾车,但是我们归类为垃圾车的一些在拍卖中卖得太高以至于不值得发送 然后,我针对该分类运行 glm 以预测未来。如上所述,我的代码提高了我们决策的准确性,并且可以正确地发送更多的汽车到垃圾车,但是我们归类为垃圾车的一些在拍卖中卖得太高以至于不值得发送任何垃圾。解决这个问题的正确方法是什么?

cars <- structure(list(YearOfCar = c(2009L, 2009L, 2003L, 2004L), Make = c("Hyundai", "Lexus", "Ford", "Toyota"), Model = c("Sonata", "GS 350", "F-250 Super Duty","Camry"), PickUpState = c("MN", "LA", "MA", "NJ"), Auction_Result = c(650,625,425, 1500), Auction_Fee = c(144.25, 373.54, 213.5, 187), Mileage = c(116120L, 198900L, 140241L, 312927L), Runs = structure(c(1L, 1L, 1L, 2L), .Label = c("No", "Yes"), class = "factor"),   junkyard_Offer = c(230L, 235L, 140L, 300L), Date = structure(c(17592,  17707, 17674, 17583), class = "Date")), row.names = 3:6, class = "data.frame")
cars$hindsight <- ifelse(cars$Auction_Result-cars$Auction_Fee>cars$junkyard_Offer,1,0)
glmodel <- glm(hindsight~Make+Model+Mileage+Runs, data = cars, family="binomial")
prediction <- predict(glmodel, cars, type = 'response')
prediction_classifier <-  if_else(prediction>.501,1,0)
cars$prediction_results <- ifelse(prediction_classifier==1, cars$Auction_Result-cars$Auction_Fee,cars$junkyard_Offer)```



  

标签: rlinear-regressionlogistic-regressionprediction

解决方案


推荐阅读