首页 > 解决方案 > 从域中获取 FQDN

问题描述

这是我在这里的第一个问题,所以我会尽力而为。

我正在尝试从一堆域中获取协议和 FQDN(完全限定域名),即https://es.aliexpress.comaliexpress.com. 我已经尝试过 Selenium webdriver,但是计算所有域需要很长时间(即使超时和阻塞图像)。

我在问是否有人知道在不加载内容的情况下执行此操作的方法,例如 wget 但仅适用于 URL。

感谢您的阅读。

标签: seleniumurlselenium-webdriverweb-scrapingwget

解决方案


并不真地...

首先,httphttps域名无关。这些是传输协议。

忽略那部分,您所称的 FQDN 通常是在您访问它们时生成的。

例如,许多网站m.something.com根据您的用户代理字符串将浏览器从桌面站点重定向到移动版本(典型的)。这意味着www.something.com并且m.something.com都是有效的答案

在您给出的示例 aliexpress.com 中,前置es.这意味着服务器上很可能有一些代码读取您的位置(基于 IP 地址)或浏览器中的区域设置,以将您定向到es该网站的版本与enordk版本相反。

这些更改可以通过.htaccess网站根文件夹中的文件或后端代码来完成。

www.如果您在所有内容栏中输入了 URL,Google Chrome 本身会自动尝试添加。

URL 也可能是一个巨大的重定向。一些网站购买了额外的域名,这些域名都重定向到他们的核心网站。所以即使你输入xyz.com你最终会在abcd.com.

从基本 URL 到您所称的 FQDN 没有算法方法。


PS这是一篇关于 FQDN 含义的文章。


推荐阅读