首页 > 解决方案 > 我想使用 for 循环从文本类型网站中提取某个段落

问题描述

网站 = https://www.sec.gov/Archives/edgar/data/3662/0000950170-98-000413.txt

我想使用for循环从给定的链接中以python的文本格式提取名为“管理层对财务状况和运营结果的讨论和分析”的段落。

标签: pythonpython-3.6text-extraction

解决方案


您可以使用 python urllib2 库来执行此操作。

python代码示例:

import urllib2

data = urllib2.urlopen("https://wordpress.org/plugins/about/readme.txt")  # read file
data = data.split("\n") # then split it into lines

for line in data:
    if line = "MANAGEMENT'S DISCUSSION AND ANALYSIS OF FINANCIAL CONDITION AND RESULTS OF OPERATIONS"
    print line # or what you want to do

推荐阅读