python - 将大熊猫数据框输入 TensorFlow
问题描述
我正在尝试使用来自 Pandas 数据帧的数据来输入 Tensorflow 管道。我试图这样做:
training_dataset = (tf.data.Dataset.from_tensor_slices((
tf.cast(df[df.columns[:-1]].values, tf.float32),
tf.cast(df[df.columns[-1]].values, tf.int32))))
我的数据框在哪里df
。但是它非常大,我收到了这个错误:
ValueError: Cannot create a tensor proto whose content is larger than 2GB.
我是否应该拆分数据框并创建几个张量数据集,这是否可行?解决这个问题的最佳方法是什么?我想过将数据输入feed_dict
,但我不知道如何去做。
解决方案
无需手动拆分数据框。您可以使用它tf.placeholder
来避免达到 2GB graphdef 限制。DataFrame.values
使用查看此https://www.tensorflow.org/guide/datasets#sumption_numpy_arrays从数据框创建 numpy 数组
推荐阅读
- docker - nextjs 前端在使用 docker 部署后尝试连接到strapi时抛出 ECONNREFUSED
- jquery - 如何停止 ASP.NET 回发(返回 false、e.stopPropagation、e.cancelBubble)不起作用
- javascript - 如何让 runDetection 每 2 秒运行一次?
- c# - 部分 Vue 单页应用程序的 C# & ASP.NET MVC 默认控制器
- flutter - 如何将 build 方法中的变量传递给 Flutter 中的父状态?
- api - 同一集群上的 2 个 API 服务之间的通信不起作用
- linux - 除非由 sh 命令调用,否则 Cron 脚本不起作用
- nearprotocol - NEAR dev-deploy 失败并出现错误:无法签署交易,未找到匹配的密钥对
- php - 在 stderr 中发送的 FastCGI:“主脚本未知”- URL 工作正常,没有提及使用 nginx 反向代理的 index.php
- python - NS3 使用 python 绑定创建简单的拓扑