首页 > 解决方案 > 如何从 url 获取网页的 html

问题描述

所以我认为这个问题非常简单。然而,在这个网站上搜索 JavaScript 和 node js 文档以及其他问题之后,我只发现了与同源策略有关的事情。

我想要的是向一个 url 发出一个简单的请求并阅读它的 html/源代码。这是为了查询 wiki 并从搜索结果中返回顶部链接。我可以自己处理 html,但是对于如何获取 html,我完全傻眼了。我知道如何在一行中使用 Lua 套接字很容易地做到这一点,这就是我在制作 twitch 机器人时所做的,但现在我正在对其进行调整以适应不和谐,我正在用 JavaScript 对其进行编码,而我不是精通JavaScript。

有人知道该怎么做吗?

我当前的代码:

function SearchWiki(query) {
    console.log("I was called, I guess")
    var options = {
        path: encodeURI(query),
        method: "GET"
    }
    var request = http.request("http://pm-challenge.wikia.com/wiki/Special:Search?search=", options, function (res) {
        var data = '';
        res.on('data', function (chunk) {
            data += chunk;
        });
        res.on('end', function () {
            console.log(data);  
        });
    });
    request.on('error', function (e) {
        console.log(e.message);
    });
    request.end();
}

标签: javascripthtmlnode.jsget-request

解决方案


推荐阅读