python-3.x - 清理抓取的数据 Python
问题描述
我试图学习如何抓取网站,但在将输出导入 Excel 时无法弄清楚如何“清理”数据。这是我使用的代码:
但是,当打开 Excel 文件时,需要对输出进行一些清理:
我认为我应该把“.text”放在我不知道在哪里的地方。我尝试添加 .text 如下所示,但它导致“AttributeError:'NoneType'对象没有属性'text'”
for i in links:
index.append([i.attrs['title']]).text
summary.append([i.attrs["aria-label"]]).text
解决方案
推荐阅读
- python - PYTHON 文件可以在 IDE 中运行,但是在 CMD 中运行或直接运行 py 文件时显示错误
- angular - Angular 和 Spring Boot 应用程序 gradle 的包大战
- c++ - 将 std::future 传递给 boost::thread 与 std::thread
- python - 未使用的参数“kwargs”与覆盖方法?
- python - 如何通过将另一列中的两个两个值分组来添加两列值
- android - 如何解决 Android 中 ML Kit 文本识别库中的错误?
- r - 从多个答案调查问题中创建多个列(假人)
- css - 使用分词时自动宽度:break-word
- amazon-web-services - cfnUpdate WaiterUnrecoverableException
- javascript - Javascript正则表达式限制每行的字符数