python - 在域名上集群 IP 地址
问题描述
我有一个 ip 网络,它基本上是一个顺序 ip 地址的列表。从这个列表中,我想将 IP 地址范围聚集成独立的实体。我想为范围内的每个 IP 提供一组属性,例如生存时间、名称服务器和与之关联的域名。
然后我想确定每个 IP 地址与其邻居之间的距离,并根据最短距离开始聚类。
我的问题在于距离函数。TTL 是一个数字,所以这应该不是问题。名称服务器和域名是字符串,但是如何将它们表示为向量中的数字?
基本上,如果 2 个 IP 地址具有相同的名称服务器或非常相似的域名(等于 2LD),您希望它们之间的距离更小。我已经研究过 word2vec 之类的东西,但实际上找不到有用的实现。
解决方案
我会尝试像这样使用 difflib。
from difflib import SequenceMatcher
def similarity(a, b):
return SequenceMatcher(None, a, b).ratio()
然后,您可以针对每组名称调用该函数以获取相似性分数并根据该分数对它们进行分组。
similarity("server1","server1")
1.0
similarity("Server1","Server2")
0.8571428571428571
similarity("foo","bar")
0.0
推荐阅读
- python - minimalmodbus read data bits
- spring - 使用 Spring Boot 进行 AWS CloudWatch 日志记录
- python - 使用 asyncio 有两个无限任务
- android - Eclipse:Android:无法加载 dx.jar
- vba - VBA deleting rows based on cell vale
- vba - How to solve VBA error Subscript out of range
- php - How to disable Gutenberg / block editor for certain post types?
- android - 标记位置不动
- jquery - 如何在达到最大值后停止仪表
- javascript - 启用/禁用带有来自 javascript 的动态 ID 的 Telerik asp.net 组合框