python - 试图从 webelements 列表中提取文本,但我只得到第一个
问题描述
我正在尝试从所有网络元素中获取文本,以便使用正则表达式进行进一步处理,但我只从第一个元素中获取文本。剩下的我得到
错误:
AttributeError:“NoneType”对象没有属性“组”
我正在使用 css 选择器,在 devtools 中我可以清楚地看到,这个选择器找到了webelements
我想要的所有东西。
def get_package_value_list(self, SELECTOR):
value_list = self.browser.find_elements(*SELECTOR)
result_list=[]
for value in value_list:
print(value.text)
value = re.sub(r'[\n]',',',value.text)
regex = re.search(Utilities.URL_REGEX_PATTERN, value)
result_list.append(regex.group())
return result_list
解决方案
不知道为什么,换行
value = re.sub(r'[\n]',',',value.text)
至
value = re.sub(r'\n',',', value.get_attribute("innerText"))
帮助,现在一切都按设计工作。但仍然让我感到困惑,为什么它必须是这样的,尽管这个函数之前在代码中的另一个地方再次调用它工作过......
推荐阅读
- node.js - 如何格式化终端窗口节点正在使用的部分
- ffmpeg - 如何处理flowplayer使用的.ts文件?
- jquery - 如何使用谷歌翻译通过点击更改检测到的语言
- javascript - 在 javascript 中传递的变量不会出现在 vue.js 标记中
- firebase - 如何在firestore上的文档中读取和创建所有提要的列表,并创建一个替换以下代码中的标题列表的列表
- c# - Service.Credentials = new WebCredentials(用户名、密码、域名);
- java - 使用spring cloud gateway合并两个微服务的结果
- testing - 在 TestCafe 中的测试运行期间累积所有 JS 警告和错误
- c# - 在客户端中为 StreamSocket 或 SslStream 设置 SNI
- python - 如何使用广播周日历对数据框中的日期时间序列进行分类?