如何确定网站所使用的开发技术(asp、php、jsp等等)?
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何确定网站所使用的开发技术(asp、php、jsp等等)?相关的知识,希望对你有一定的参考价值。
RT。
是否有便捷的程序或网站,可以直接检测某个网站所使用的Web技术?到哪儿可以查询asp、php、jsp在internet上所占份额?如有独到回答必加分。
心虚的补充:Google Trends只是搜索量的统计吧?只能说明受关注程度的变化趋势,不能说明所占份额问题吧?
.do的是.jsp做的,现在的大多数站都是用CMS系统,把网页都生成静态的。也有伪静态的,很难看出使用什么技术做的。
但是你可以从他们网页中含的js里分析,比如他们网站如果有评论系统的话,可以看源码中js里是否有post,get的路径。
一般都有的。从路径即可分析出使用的是什么技术。
http://www.google.com/trends?hl=zh-CN&q=jsp,c%23,java,php,asp&geo=chn&sa=N
这个可以查中国的各脚本语种的占有比率。
+++++++++++++++++++++++++++++++++
楼主补充问题说的很对,确实没有办法统计出很好的数据,因为没有人能做到这种统计,谷歌做的还算不错了,能帮助你对未来的趋势呈现出来。呵呵~~
就目前的中国来说,asp类的网站还是站了很大份额的。粗略的估计应该能超过 90%的份额。尤其是企业公司的宣传战,几乎上都是asp搞的。Php 的站在最近几年也开始扩大份额了,还有asp.net的。很多大型的购物平台都是用php做的。由于Php经常更新技术版本,现在也算很流行的技术了。
jsp 的大多有政府单位,银行,电信行业等的网站。份额可能小一些。 参考技术A php用的越来越多。有一统网站编程的趋势。
想做网站开发,直选php。
Google Trends能反应关注的多少。但不一定全面。因为它只是搜索量的多少。
http://dev.chinamobile.com/news/technologyproduct/2085.html
这个是统计。
其中,java c 很多桌面编程、嵌入式编程用这两个。
php 几乎只用来做网站。而php仅次于java、c排第三名。
是网站用的最多的。 大网站,三分之二是php。小论坛、企业网站,五分之四左右是php。
因为,论坛差不多都用discuz 等的几个,当然是php。
商城网站,shopex ecshop这些系统,还有mogento这些前几名的,都是php.
在这个互联网蓬勃发展的新时期里,PHP技术和相关的人才,满足了最新的互动式网络开发的应用。目前,国内包括Google、百度、网易、新浪、搜狐、阿里巴巴、奇虎、eBay、腾讯、Yahoo、金山等的各大网站都在寻求PHP高手。PHP的人才缺口是40:1。本回答被提问者采纳 参考技术B 网站的话首选php,asp简单的也可以选用
jsp主要用在一些bs架构的应用上,一般网站用的不多,但是一些集群、跨平台应用的话还是java的多,
.net主要是微软平台,不支持跨平台,企业应用不多,网站用的也不特别多 参考技术C asp网站你点里面的链接url上必然有asp?...字样
php有php字样
jsp网站有可能只有jsp或是*.do字样或 .其他 或者不点 参考技术D 这个无法直接来检测吧,从google里可以看出http://www.google.com/trends?q=jsp%2Cc%23%2Cjava%2Cphp%2Casp&hl=zh-CN
如何确定真正的用户正在浏览我的网站或只是在爬网或在 PHP 中
【中文标题】如何确定真正的用户正在浏览我的网站或只是在爬网或在 PHP 中【英文标题】:How to determine real user are browsing my site or just crawling or else in PHP 【发布时间】:2011-10-01 02:43:00 【问题描述】:我想知道用户是否真的在查看我的网站(我知道它只是由浏览器加载并显示给人类,而不是真正的人类查看它)。
我知道两种方法都行。
Javascript。
如果页面是由浏览器加载的,它会自动运行js代码,除非浏览器禁止。然后使用 AJAX 回调服务器。
html中的1×1透明图片。
使用 img 回调服务器。
有谁知道这些方法的陷阱或更好的方法吗?
另外,我不知道如何确定 0×0 或 1×1 iframe 以防止上述方法。
【问题讨论】:
你到底想达到什么目的? @Gedrox 我想过滤机器人。 那没有回答问题。您担心机器人会在您的网站上做什么?您是否害怕搜索索引机器人或试图隐藏身份的机器人? 【参考方案1】:我同意其他人的观点,这真的很难 - 通常好的爬虫会将自己标识为爬虫,因此使用 User-Agent 是过滤掉这些人的好方法。用户代理字符串的一个很好的来源可以在http://www.useragentstring.com 找到。我过去使用过 Chris Schulds php 脚本 (http://chrisschuld.com/projects/browser-php-detecting-a-users-browser-from-php/) 效果很好。
您还可以使用 Apache 配置或 .htaccess 文件在服务器级别过滤这些家伙,但我发现跟上它是一场失败的战斗。
但是,如果您查看您的服务器日志,您会看到大量使用有效(浏览器)用户代理或时髦用户代理的可疑活动,因此这只能到目前为止。你可以玩黑名单/白名单IP游戏,但那会很快变老。
许多爬虫会加载图片(即 Google 图片搜索),所以我认为这不会一直有效。
很少有爬虫会有 Javascript 引擎,所以这可能是区分它们的好方法。让我们面对现实吧,如今有多少用户真正转向了 Javascript?我已经看到了相关的统计数据,但我认为这些统计数据受到了无法识别自己的爬虫/机器人的绝对数量的影响。但是,需要注意的是,我已经看到 Google bot 确实现在运行 Javascript。
因此,归根结底,这很艰难。我肯定会采用混合策略——如果你使用用户代理、图像、IP 和 javascript 进行过滤,我相信你会得到大多数机器人,但尽管如此,但希望有些机器人能够通过。
另一个想法,您总是可以使用已知的 Javascript 浏览器怪癖来测试报告的用户代理(如果它是浏览器)是否真的是那个浏览器?
【讨论】:
【参考方案2】:检查 http 请求的 User-Agent 标头。 爬虫应该将此设置为除已知浏览器之外的任何内容。
这里是 google-bot 标头 http://code.google.com/intl/nl-NL/web/controlcrawlindex/docs/crawlers.html
在 php 中,您可以通过以下方式获取用户代理:
$Uagent=$_SERVER['HTTP_USER_AGENT'];
然后您只需将其与已知标头进行比较 作为提示 preg_match() 可以很方便地在几行代码中完成所有这些操作。
【讨论】:
【参考方案3】:您可以创建一个谷歌网站管理员帐户 它告诉你如何为机器人配置你的网站 还显示机器人将如何阅读您的网站
【讨论】:
【参考方案4】:像 google 或 yahoo 这样的“好”机器人通常会尊重 robots.txt 文件。按用户代理过滤也可能有帮助。
但最终 - 如果有人想要获得自动访问权限,则很难阻止它;你应该确信这是值得的。
【讨论】:
【参考方案5】:我想知道用户是否真的在查看我的网站(我知道它只是由浏览器加载并显示给人类,而不是真正的人类查看它)。
图像方式似乎更好,因为普通用户也可能会关闭 Javascript。机器人通常不加载图像,所以这确实可以工作。尽管如此,如果您只是想过滤一组已知的机器人(例如 Google 和 Yahoo),您可以简单地检查 HTTP 用户代理标头,因为这些机器人实际上会将自己识别为机器人。
【讨论】:
我想说如果你想过滤 Googlebot,你应该使用robots.txt
。
我想过滤掉所有的机器人,而不仅仅是搜索引擎。恶意机器人会设置一个用户代理来伪装自己。所以这是不信任。【参考方案6】:
机器人可以访问浏览器,例如http://browsershots.org
机器人可以请求该 1x1 图像。
简而言之,没有真实的方法可以分辨。最好的办法是使用 CAPTCHA,但它会降低人类的体验。
只需在需要的地方使用验证码(用户注册等)。
【讨论】:
@hakre:我听说过。以上是关于如何确定网站所使用的开发技术(asp、php、jsp等等)?的主要内容,如果未能解决你的问题,请参考以下文章
从基础的 HTML 到 CSS,乃至进阶的 XMLSQLJSPHP 和 ASP.NET。
怎么看一个网站是用的啥技术开发的啊?(php jsp asp)比如登录一个网站如何能查看它用的技术开发的
如何确定真正的用户正在浏览我的网站或只是在爬网或在 PHP 中