python-3.x - 有没有办法用熊猫读取 BeautifulSoup 输出来读取表格?
问题描述
我试过这种方式
data = web_soup.findAll("table", {"id": "product-review-table"})```
print(pd.read_html(data))
返回错误:TypeError:无法读取“ResultSet”类型的对象
数据包含一个完整的表格。我只想从 Url 读取特定表,通过将 url 传递给 pd.read_html() 它将获取所有表,但为了节省执行时间我只想读取特定表。我该怎么做?
解决方案
简短的回答:
pd.read_html(str(data))
更长的答案:
的输入read_html()
可以是一个字符串。
从文档:
pandas.read_html(io, ..):
...
io : str or file-like
A URL, a file-like object, or a raw string containing HTML...
...
findAll
(or )的输出find_all
是一个ResultSet
对象。
对象的字符串表示ResultSet
可以使用str(ResultSetObject)
.
data = web_soup.findAll("table", {"id": "product-review-table"})
print(pd.read_html(str(data)))
推荐阅读
- java - 尝试使用 Hazelcast 复制 Spring Boot 会话时出现 java.io.IOException
- php - 从县 ID 的数据透视表中收集订阅者
- google-apps-script - 为什么 GAS 会在数据验证中输入无效范围?
- r - R:我正在尝试将 rollmean(zoo) 应用于列表中的几个数据框中的特定列
- evernote - 如何通过 Evernote API 访问我的个人数据?
- r - 如何使这个 ggplot 中的条与 gganimate 一起出现?
- python - 在 Python 中提取 JSON 文本文件中的值
- c# - 动态 LINQ 查询到表达式树
- python - 从 Pandas 列中删除字符。Str.replace() 不工作
- javascript - 如何仅通过将鼠标悬停在父项上来设置样式子项?