HT1112 搜索引擎高级使用语法
Posted 信安之路
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了HT1112 搜索引擎高级使用语法相关的知识,希望对你有一定的参考价值。
对于普通人而言,打开浏览器,输入想要搜索的关键词,就可以获得自己想要的结果,绝大多数情况下可以满足需求,但是对于安全从业者而言,由于通过单纯关键词搜索获得的结果不够聚焦,信息繁杂,无法满足高级需求,比如我想查看某个网站上所有的信息,当我们输入网址域名时,输出的结果如下:
谷歌搜索的前两页都是与 xazlsec.com 域名相关内容, 第三页开始有了其他网站的内容,我们使用百度搜索试试:
百度的结果与我们的需求相差甚远,只有第一条是官网的信息,其他的都是 SEO 做得好,比较知名的网站,在用必应试试:
可以看到一条信息都没有,这个应该是必应没有收录 xazlsec.com 网站的信息,不同的搜索引擎对于同一个关键词的搜索结果不尽相同,跟各家的技术和信息抓取方式有关,所以在使用搜索引擎收集目标相关信息时,同时使用多个搜索引擎可以获得比较全的信息。
以上搜索结果,除了谷歌直接使用关键词搜索获得结果比较满足需求外,其他的搜索引擎不是没有数据就是很少的信息,除了直接使用关键词外,这些搜索引擎都提供了一些高级搜索语法,供大家使用,以谷歌为例,还是上面的需求,我只想要域名 xazlsec.com 上的内容,搜索关键词 site:xazlsec.com
翻到几十页开外了还是域名 xazlsec.com 域名上的内容,再看看其他的搜索引擎:
百度的结果也比较好看,都是按照我们的需求返回的数据,必应没有收录 xazlsec.com 上的内容,所以没有搜索结果:
以上内容主要证明不同搜索引擎拥有自己的高级搜索语法,至于还能怎么更高级的使用,下面就以谷歌为例来测试其满足不同需求场景下的使用方法。
场景一:搜索与信息安全相关的 PDF 文档
关键词 filetype:
案例:filetype:pdf 信息安全
通过这种方式能快速找到我们需要的文档,视频、图片等内容,对于文件搜索非常有用。
案例二:搜索使用了 wordpress 的博客网站
Wordpress 是一款知名的开源博客系统,应用广泛,Wordpress 有几个比较有特点的目录,比如 wp-admin
、wp-content
等,如何搜索 URL 中包含指定关键词的内容呢?
关键词 inurl:
搜索案例:inurl:wp-admin
只要连接中包含关键词 wp-admin
结果就会返回,这种搜索方式会存在一些干扰项,需要获取结果之后进一步验证排除。
案例三:查看某个页面的缓存内容
当某个网站页面更改之后,我们没有来得及保存,想要查看之前版本的内容,可以利用搜索引擎的缓存功能,关键词 cache:
后面加上页面链接,比如:cache:www.xazlsec.com
上面内容可以看到 5 月 5 日的缓存内容,这也是比较常用的高级功能。
其他语法
除了以上介绍的几种能力之外,还有其他的用法,比如 intitle
搜索标题中包含某些关键词的网页、intext
搜索网页正文内容中包含某些关键词的网页、allintitle
与 intitle
功能相似,但可以接多个关键词等。
以上内容掌握,对于搜索引擎的高级利用也就够用了,更多不常见的利用方法,需要大家自行探索,搜索引擎功能强大,数据丰富,如何使用决定了每个人能力的边界。
本文以手工测试的方式来介绍搜索引擎的高级用法,对于大量目标的信息收集,靠手工是非常低效的,所以使用自动化的方式来使用搜索引擎,收集整理目标关键信息是必不可少的,对于搜索引擎而言,均已提供搜索 API 供大家自动化使用,下期内容《搜索引擎自动化利用》,敬请期待!
以上是关于HT1112 搜索引擎高级使用语法的主要内容,如果未能解决你的问题,请参考以下文章