python - 在数据集中查找 NaN 和 Infinity 值
问题描述
我正在研究泰坦尼克号数据集,但是当我尝试测试我的逻辑回归模型时,它给出了这个错误。
Input contains NaN, infinity or a value too large for dtype('float64')
我已经尝试过这些代码片段来检查我的数据是否有 NaN/Inf。
np.any(np.isnan(test_df))
这返回 True
np.all(np.isfinite(test_df))
这返回 False 请告诉我这些返回值意味着我的测试数据是否具有 NaN 或 Infinity 值
解决方案
您可以在 numpy 文档中轻松找到答案。
所以是的,您的数据集中有 NaN 和 Inf。
在您的逻辑回归期间,可能会出现除以零或下溢/溢出的情况。您可以查看您使用的特定函数的文档,以了解更多关于为什么会发生这种情况,或者是否有更好的拟合/最小化算法可供选择。
推荐阅读
- c# - Blazor WebAssembly 与 Blazor Server 中的 JsonSerializer.Deserialize 性能
- excel - 从用户窗体上的文本框中更新 Excel 电子表格
- r - 在 R 的 Plantecophys 包中使用 fitacis 绘制多条曲线的问题
- amazon-s3 - 在 Linux 上的 azure devops 管道中运行的 S3 同步问题
- elasticsearch - 如何在过滤器(术语)查询中添加多个字段以模拟 ElasticSearch 中的 OR
- c - 如何从 C 中的用户输入正确读取文件?
- laravel - 完整性约束违规:1452 无法添加或更新子行:外键约束失败
- database - 如何在列可能随每个新行更改的上下文中设计数据库表
- python - Webbots Python3“ModuleNotFound”错误MacOS
- tfs - 我们如何在门控签入期间获取搁置集名称并将其分配给 tfs 构建任务中的变量