HT1112 搜索引擎高级使用语法

Posted 信安之路

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了HT1112 搜索引擎高级使用语法相关的知识,希望对你有一定的参考价值。

对于普通人而言,打开浏览器,输入想要搜索的关键词,就可以获得自己想要的结果,绝大多数情况下可以满足需求,但是对于安全从业者而言,由于通过单纯关键词搜索获得的结果不够聚焦,信息繁杂,无法满足高级需求,比如我想查看某个网站上所有的信息,当我们输入网址域名时,输出的结果如下:

谷歌搜索的前两页都是与 xazlsec.com 域名相关内容, 第三页开始有了其他网站的内容,我们使用百度搜索试试:

HT1112 搜索引擎高级使用语法

百度的结果与我们的需求相差甚远,只有第一条是官网的信息,其他的都是 SEO 做得好,比较知名的网站,在用必应试试:

HT1112 搜索引擎高级使用语法

可以看到一条信息都没有,这个应该是必应没有收录 xazlsec.com 网站的信息,不同的搜索引擎对于同一个关键词的搜索结果不尽相同,跟各家的技术和信息抓取方式有关,所以在使用搜索引擎收集目标相关信息时,同时使用多个搜索引擎可以获得比较全的信息。

以上搜索结果,除了谷歌直接使用关键词搜索获得结果比较满足需求外,其他的搜索引擎不是没有数据就是很少的信息,除了直接使用关键词外,这些搜索引擎都提供了一些高级搜索语法,供大家使用,以谷歌为例,还是上面的需求,我只想要域名 xazlsec.com 上的内容,搜索关键词 site:xazlsec.com

HT1112 搜索引擎高级使用语法

翻到几十页开外了还是域名 xazlsec.com 域名上的内容,再看看其他的搜索引擎:

HT1112 搜索引擎高级使用语法

百度的结果也比较好看,都是按照我们的需求返回的数据,必应没有收录 xazlsec.com 上的内容,所以没有搜索结果:

HT1112 搜索引擎高级使用语法

以上内容主要证明不同搜索引擎拥有自己的高级搜索语法,至于还能怎么更高级的使用,下面就以谷歌为例来测试其满足不同需求场景下的使用方法。

场景一:搜索与信息安全相关的 PDF 文档

关键词 filetype: 案例:filetype:pdf 信息安全

HT1112 搜索引擎高级使用语法

通过这种方式能快速找到我们需要的文档,视频、图片等内容,对于文件搜索非常有用。

案例二:搜索使用了 wordpress 的博客网站

Wordpress 是一款知名的开源博客系统,应用广泛,Wordpress 有几个比较有特点的目录,比如 wp-adminwp-content 等,如何搜索 URL 中包含指定关键词的内容呢?

关键词 inurl: 搜索案例:inurl:wp-admin

HT1112 搜索引擎高级使用语法

只要连接中包含关键词 wp-admin 结果就会返回,这种搜索方式会存在一些干扰项,需要获取结果之后进一步验证排除。

案例三:查看某个页面的缓存内容

当某个网站页面更改之后,我们没有来得及保存,想要查看之前版本的内容,可以利用搜索引擎的缓存功能,关键词 cache: 后面加上页面链接,比如:cache:www.xazlsec.com

上面内容可以看到 5 月 5 日的缓存内容,这也是比较常用的高级功能。

其他语法

除了以上介绍的几种能力之外,还有其他的用法,比如 intitle 搜索标题中包含某些关键词的网页、intext 搜索网页正文内容中包含某些关键词的网页、allintitle 与 intitle 功能相似,但可以接多个关键词等。

以上内容掌握,对于搜索引擎的高级利用也就够用了,更多不常见的利用方法,需要大家自行探索,搜索引擎功能强大,数据丰富,如何使用决定了每个人能力的边界。

本文以手工测试的方式来介绍搜索引擎的高级用法,对于大量目标的信息收集,靠手工是非常低效的,所以使用自动化的方式来使用搜索引擎,收集整理目标关键信息是必不可少的,对于搜索引擎而言,均已提供搜索 API 供大家自动化使用,下期内容《搜索引擎自动化利用》,敬请期待!

以上是关于HT1112 搜索引擎高级使用语法的主要内容,如果未能解决你的问题,请参考以下文章

python 高级语法

片段中的片段

百度高级搜索语法

百度/Google 高级搜索语法大全

百度/Google 高级搜索语法大全

Parceable 错误:在偏移量 1112 处解组未知类型代码 7274595