python - 我想使用 for 循环从文本类型网站中提取某个段落
问题描述
网站 = https://www.sec.gov/Archives/edgar/data/3662/0000950170-98-000413.txt
我想使用for循环从给定的链接中以python的文本格式提取名为“管理层对财务状况和运营结果的讨论和分析”的段落。
解决方案
您可以使用 python urllib2 库来执行此操作。
python代码示例:
import urllib2
data = urllib2.urlopen("https://wordpress.org/plugins/about/readme.txt") # read file
data = data.split("\n") # then split it into lines
for line in data:
if line = "MANAGEMENT'S DISCUSSION AND ANALYSIS OF FINANCIAL CONDITION AND RESULTS OF OPERATIONS"
print line # or what you want to do
推荐阅读
- saml - 使用 SAML 和 Azure AD 设置 SSI 的最佳方式
- javascript - 如何将数据保存到 JSON 服务器
- javascript - Office Word JS - 仅在选定的表格单元格中获取段落项目
- python - 开始使用 REST JSON 请求
- sql-server - SSRS:底层 SQL 使用“union all”——结果集比预期的要小得多——加上比 Tablix 过滤更好的方法
- angular - 如何在 Angular 6/5/4 中没有父子关系的情况下将组件 A 之间的数据传递给组件 B
- android - Android Studio 和蓝牙——不可能的任务
- acumatica - SOOrder 上的 Acumatica 未绑定用户字段
- python-2.7 - 使用默认调度程序的 Dask 内存管理
- django - Django - 类型对象'HttpRequest'没有属性'方法'