python - 如何将图像文件从 URL 转换为 scikit-learn 中可用于执行多元线性回归的格式
问题描述
我正在尝试做一个简单的多元线性回归,其中一个特征列是图像。我目前有每张图片的网址。如何将此 URL 列转换为 scikit learn 可以理解的格式(图片的数字版本)?
import pandas as pd
import numpy as np
from sklearn import linear_model
df = pd.read_csv('dtaset.csv')
df.head()
index followers likes urls
0 14928252 132771 https://url1
1 14928252 57671 https://url2
2 14928252 161580 https://url3
3 14928252 60969 https://url4
4 14928252 375567 https://url5
Feature 列是“total_followers”和“urls”,目标列是“likes”
任何人?谢谢!
解决方案
你的问题有一个简单的部分和一个困难的部分。最简单的方法是如何从 URL 读取图像。为此,您将需要 OpenCV。如果您没有它(import cv2
失败),请安装它,例如使用pip install opencv-python
. 比你可以使用这个功能:
import cv2
import requests
def readImage(url, color = False):
with requests.get(url) as r:
return cv2.imdecode(np.frombuffer(r.content, np.uint8), cv2.IMREAD_COLOR if color else cv2.IMREAD_GRAYSCALE)
困难的问题是您将如何处理这些图像?图像(通常)是大量数字,您很可能需要从中提取一些特征和特征,以便在线性回归中使用它们。但这取决于您的任务的性质。
推荐阅读
- java - 无权访问范围 - 亚马逊广告 API
- python - QGraphicsProxyWidget 搞乱了鼠标光标的变化
- ios - Carthage:使用 Forked LoopKit 时依赖图包含一个循环
- sql - 如何在 Postgresql (pgAdmin4) 中导入日期样式不一致的数据集?
- java - HikariCP 在更新 spring-boot 1.xx => 2.xx 后未配置数据源或添加 postgres 连接
- javascript - 如何将获取的数据存储在状态中并将其呈现在我的组件中
- java - 无法在 RecyclerView 项目单击时显示弹出菜单
- ios - 音频 url 列表中的音频持续时间未在表格视图中正确加载
- ssl - Letencrypt 证书 fullchain.pem / cert.pem 转换为 .cer 扩展名,但在 ubuntu 18.04 上获得 .cer 或 .der 扩展名中的错误文件
- python - Pi 触摸屏上的 matplotlib