python - 如何格式化 python 数据框超链接,以便我可以使用 Web 浏览器正确打开它们?
问题描述
我正在尝试打开位于 pandas 数据框列中的 url 链接,但每次尝试打开其中一个链接时都会出现错误,无论它们是指向 pdf 的链接还是指向某些网页的链接。
到目前为止,这是我的代码:
url = filtrado.iloc[[0]]['Bases reguladoras']
print(url)
webbrowser.get('safari').open_new(url)
我收到此错误(翻译自西班牙语):“Safari 无法打开指定地址,因为它的第一部分无效”。
这是我要打开的网址之一:“http://www.bocm.es/boletin/CM_Orden_BOCM/2018/08/09/BOCM-20180809-15.PDF”
当我直接打开链接时:
webbrowser.get('safari').open_new("http://www.bocm.es/boletin/CM_Orden_BOCM/2018/08/09/BOCM-20180809-15.PDF")
它工作正常,所以我猜数据框正在以某种方式解析字符串,我无法使用它作为有效地址。
实际上,当尝试使用“请求”库下载内容时:
myfile = requests.get(url)
open('./Prueba_bocm.pdf', 'wb').write(myfile.content)
我收到错误消息:“未找到“22 b'的连接适配器”http://www.bocm.es/boletin/CM_Orden_BOCM/2018/08/09/BOCM-20180809-15.PDF'\n名称:基础规则,数据类型:字节576“”
解决方案
尝试filtrado['Bases reguladoras'].iloc[0]
代替filtrado.iloc[[0]]['Bases reguladoras']
. 后者返回,pandas.core.series.Series
而前者是简单的条目。
推荐阅读
- rabbitmq - 无法使用 logstash 连接到 rabbit mq
- javascript - 当我似乎找不到任何问题时,为什么这段代码不起作用?
- c++ - 如何编译使用 std::chrono 和日期的 CUDA 代码?
- c# - C#:无法将现有字典对象添加到视图模型对象
- php - 比较 symfony 中的两个日期时间对象
- python - 如何在 DataFrame 中有效地更新一组行值?如何使这个算法可扩展?
- excel - 如果单元格中的值等于下降,有没有办法删除活动行?
- c# - 将构建在 64 位系统上的 C# 应用程序匹配到在 32 位系统上运行
- sql - 需要帮助将 3 列的结果合并为 1 (SQL Server 2012)
- javascript - 为什么日期/时间在 node.js 控制台中输出“未定义”?