python - 从熊猫 python 网站获取文本
问题描述
我有一个反应名称列表,我想从中在 ModelSeed 中进行搜索(基本上是“https://modelseed.org/biochem/reactions/”+ 反应名称)。然后我想知道给定名称的 KEGG 路径。
例如,对于反应“rxn00020”,该函数将转到https://modelseed.org/biochem/reactions/rxn00020,然后从那里给我“KEGG:rn00500(淀粉和蔗糖代谢)”。我尝试关注这个线程,但没有完成任何事情......你能帮我吗?非常感谢!
解决方案
页面内容是动态加载的,因此您必须使用selenium
才能抓取它们。这是您的操作方法:
from selenium import webdriver
import time
driver = webdriver.Chrome()
urls = ['https://modelseed.org/biochem/reactions/rxn00020'] #List of all your urls
for url in urls:
driver.get(url)
time.sleep(1.5)
kegg = driver.find_elements_by_class_name('ng-binding')[-2]
print(kegg.text)
输出:
KEGG: rn00500 (Starch and sucrose metabolism)
推荐阅读
- python - 如何跟踪执行中的父/子交易
- sql - 如何选择具有相同时间顺序的所有值?
- javascript - 无法从 For 循环外部访问 For 循环内部的数据
- reactjs - 如何处理来自外部库的初始化和事件?
- mule-studio - splitBy 正则表达式问题 dataweave 2.0
- java - UnsatisfiedDependencyException:创建名为 'procjectController' 的 bean 时出错:通过字段表示的不满足依赖项
- c# - TcpListener 等待客户端和一个队列同时处理
- java - Java 处理 cURL 的方式不同吗?
- python - 如何优化由多个变量组成的结果
- django - Django - 相对模型