怎样使用追寻代码来发现网站之间的“相关”

访客5年前黑客文章1359

前些年Lawrence Alexander颁发了一篇使用Google Analytics查找网页之间的联络联络的文章,客岁,我也宣告了一个关于若何使用Python自动开掘信息,然后将其可视化的帖子,不幸的是Meanpath API被关闭了,所以多么的技巧便不再有用了。
侥幸的是,Spyonweb.com的还在异常供应就事。就在前不久,南非记者Jan Cronje就在极力地开掘一些他正在研讨的器械的联络联络(点击这儿阅读),这是重组以前的代码的一个完善的机会:使用Spyonweb来找到这些联接,末端再将其可视化。

给你敲代码的手指热热身,并准备好享受一些喜好,因为我们即即将探索若何使用Python自动创造网页之间的联络联络。
使用SpyOnWeb API
SpyOnWeb.com是一个赓续抓取网站追寻代码,称谓就事器和其他信息的网站,所以它能资助体现网站之间的联接。他们的API有许多订价层,从收费初步(抵挡这篇文章,收费的确实完善),一直到每个月69.95美元。
点击这儿前去api.Spyonweb.com
在这儿注册一个账号,然后主控制面板上就会出现一个access token,我们不才面的文章中会用到。

要留心的是,你更好不要和其他人同享你的access token,假设你不小心泄漏了,点击上图赤色箭头旁的小按钮,它会为你重新天然生成access token。
现在我们有了Spyonweb的access token,接下来就是写代码了。
准备
在这篇文章里,你必要一些Python库,可以使用pip设备
pip install networkx requests requests[security]
其他,你假设想在末端中止可视化,那就必要额外下载Gephi。
代码与分析
热热身,发动你最喜好的IDE(我使用的是WingIDE,用着真的不错),新建一个叫website_connections.py的文件,齐备源码【点击这儿下载】。

第1-5行:我们正在导入我们的剧本中所必要的悉数相干Python模块。
第7-8行:我们界说了一个变量spyonweb_access_token,你必要把以前取得的access token粘贴到这儿,然后我们界说了一个变量来保存Spyonweb API调用的URL。
第10-11行:这儿为Google Adsense和Google Analyse准备了两个正则表达式方式,我们将经由进程剧本在意图域名中提取这些代码。
第13-20行:在这儿我们设置命令行参数分析,以便轻松地通报一个域名,一个包含域名列表的文件,并容许为我们的图形输入指定的文件名。
我们现在增加一个简略的函数,它将在 *** 以前清算追寻代码。让我们先来看看:

完善!现在我们我们初步之一个函数,用于从意图域名直接提取追寻代码。将以下片断增加进代码中:


第38行:我们界说了extract_tracking_codes函数来接纳我们要遍历的域名列表来实行提取。
第43行今后:我们初步遍历域名列表(43行),然后在向意图域名发送Web乞求(53行)以前构建恰当的URL(50-51行),假设未能成功联接,则转到下一个域名(57行)。
第62-64行:假设我们成功联接到意图站点,那末就设置一个空缺列表来保存我们提取的代码(62行),我们检验考试使用正则表达式(63行)来找到悉数Google Adsense代码,然后对Google Analyse代码做相同的作业(64行)。
第67-69行:我们遍历提取代码的列表(67行),然后将其经由进程clean_tracking_code函数将其通签到清算和规范代码部分,接下来测验我们能否曾经有了这个代码(72行),假设没有,就将其增加到联接字典中,然后我们就可以对意图域名中止追寻了。
第82行:我们前去联接字典,以便稍后处置效果。
现在我们构建一个函数来向Spyonweb API发送乞求,现在承继增加以下代码:

第87行:我们构建spyonweb_request来接收数据,可以是一个域名,追寻代码,也可以是其他支撑的输入,我们还构建了request_type参数,该参数将组成Spyonweb乞求格式的URL的一部分。
第89-90行:我们创建一个字典,此中包含Spyonweb的access token,它将在HTTP乞求中传给Spyonweb。
第92行:我们使用静态构建的URL将乞求发送给Spyonweb,并传入params字典。
第94-102行:我们中止检讨以保证收到一个有用的HTTP相应(94行),假设乞求成功,就分析 *** ON(96行)。然后测验字典效果(98行)来看看我们能否收到了Spyonweb的有用效果,假设是,前去悉数字典。假设没有取得任何效果,就前去None(102行)。
现在我们将构建一个函数来处置向Spyonweb发送特定乞求的分析代码。

[1] [2]  黑客接单网

相关文章

浏览器进犯结构BeEF Part 5:进犯Web使用与进犯网络

前语 上一章介绍了Tunneling Proxy技能以及怎样运用这项技能来绕过httponly完成高档的会话盗取。本章评论如安在不违背SOP情况下,经过勾连浏览器进犯Web运用与进犯网络。其中有一些进...

你的网站是怎样被黑的

前语 这个标题的来历是@evilcos(余弦大大)在Github上共享的一个PPT,感兴趣的能够去他的repo下载。写这篇博客主要是想给自己最近业余时间学到的安全相关的常识做个总结,主要是关于网站常见...

把PHP LFI缝隙变为Webshell的形式

存眷PHP缝隙的同伙必定知道LFI+phpinfo可以搞出一个webshell。 LFI这个条件还算异常,但phpinfo这个照样比较难凑的,所以有点鸡肋。接下来,我共享一个……异常鸡肋的思绪……人人...

浅谈精准提取日志中的URL-黑客接单平台

布景 在剖析日志的时分发现有些日志中参数中包括其他的URL,例如: http://www.xxx.cn/r/common/register_tpl_shortcut.php?ico_url=http:...

从零开始学Fuzzing系列:带领nduja打破Grinder的壁垒

四年前开源的Grinder项目,和借助于它运转的nduja,着实让浏览器缝隙发掘飞入了寻常百姓家。但随着时刻的检测,Grinder也遇到了让人爱恨交加的为难:分明发生了Crash,可便是无法重现。有多...

本文从现代WAF的基本原理讲起,涵盖WAF指纹识别、多种WAF绕过技术(下)-黑客接单平台

今日咱们来接着上一篇,讲讲WAF绕过技能的其他几个方面。 Unicode标准化 让Unicode标准化是Unicode的一个功用,用于比较看起来类似的Unicode符号。例如,符号“ª”和“ᵃ”有不同...