python - 在浏览器中收听文本
问题描述
我想知道是否以及如何“收听”浏览器窗口中的文本。
我特别不想抓取网站,因为我想抓取它们以获取信息,我只是对与使我的浏览器输出文本的任意页面交互感兴趣。
例子
- 假设我在 Stack Overflow 上提问。
- 当我输入标题“在浏览器中收听文本”时,建议出现,其中一个包含纯文本“收听浏览器请求”
- 只要屏幕上出现“请求”这个词,浏览器就会关闭,我点了一份披萨
一个好的解决方案是什么样的
- 我希望能够为几乎任何以某种方式使我的计算机显示简单文本的网站执行此操作。理想情况下,无需了解文本是如何生成的。
- 我希望这有点快,亚秒级应该是可能的
- 我不想访问网站或其 api,只想使用我屏幕上已有的信息。
我对操作系统和浏览器的要求不太挑剔。
我还可以想象可能存在一些很难做到的极端情况(也许文本显示为图片,或者句子的一部分实际上分布在多个文本框中,这些文本框只是相互显示)。现在我只是想知道如何为一个简单的页面做到这一点。
如果它甚至可以从我自己输入的字段中捕获文本,那么我可以在我要说一些愚蠢的话时烫伤自己。
到目前为止我想出了什么
总的来说,我相信一旦将文本放入工具中,我就可以处理它,但主要挑战在于如何收听浏览器。
- 我尝试查看源代码,但似乎不包含此动态文本
- 也许浏览器本身有一个 steraming API,可以输出变化?
- 也许有一种方法可以从浏览器中获取所有文本,可能每秒 10 倍左右
- 使用普通的抓取解决方案完全不是我想要的,所以我不想以每秒 10 倍的速度向网络服务器发出请求。
- 在最坏的情况下,我想我们可以使用截屏软件,然后是文本识别,但我真的希望有更优雅的东西
- 我想可能有自动化/测试软件可以做到这一点。这将是一个答案,但轻量级的东西(例如 python 库)将是最好的。
我试过搜索但没有找到任何解决方案,甚至没有找到问题。大概我用错了词。
解决方案
推荐阅读
- c# - 让班级的孩子互相交流
- azure - 在 Azure DevOps 服务器上获取“window.__contentLoaded 不是函数”
- reactjs - 将日期添加到 react-signature-canvas 的输出
- spring-boot - Spring REST api - 外键ID而不是整个对象
- c# - MSIX 未打包所有依赖项
- c - 使 calloc 缓冲区在函数范围之外可用
- javascript - 通用 cookie 没有从浏览器中删除 cookie
- java - 如何在 Java 中继承泛型静态方法?
- mysql - 需要找出哪些客户正在使用产品 1 和 2 而尚未使用产品 3
- html - 如何使用角度函数显示 HTML?