http与www服务概念详解
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了http与www服务概念详解相关的知识,希望对你有一定的参考价值。
HTTP超文本传输协议
html页面标记语言
www万维网
端口21 ftp
22 ssh
25 smtp
3306 mysql
873 rsync
161 snmp
111 rpc
3389
80
443 https
110 pop3
53 dns
curl -I www.baidu.com 查看网站头部信息 200表示服务器返回成功。
http请求流程:
osi模型中的应用层协议,http协议的重要应用是www服务
获取ip在dns本地缓存表查找,网关DNS查找
dns解析流程
建立TCP连接
用户访问网站基本流程
html、xml,shtml,jpg,js,css,swf,avi,wmv,flv等都属于静态页面。
静态网页容易被搜索引擎收录,所以很多时候需要将动态转成静态便于排名靠前增加点击率。
静态网页没有数据库支持,所以大量信息的网站不适合用静态的。
动态网页:服务端解析,效率远不如静态网页。用户注册、用户登录、在线调查,投票、用户管理、订单管理、发博文等。asp、aspx,php,jsp,do,并且常伴随?,&等。
架构优化:效率很差,并发也很低,尽可能转换成静态网页提供服务。
静态:动态-------10:1 系统架构师和程序架构师的职责。
伪静态就是将动态伪装成静态,其实还是动态,主要是修改了域名地址,目的是便于搜索收录,但并不能提升网站的性能,反而下降,转换时消耗资源。并发量不是很大时可以做伪静态,更新频率很快的业务也没必要做动转静,伪静态就非常好。
异步,消息中间件、消息队列就是让动态转静态。
web3.0是web2.0的替代物,以用户为中心,动态页面为主,智能化人与人机器的交流。10兆,全视频的网络,这才像web3.0。
传统页面布局:表格
现在:DIV+CSS,载入更快,降低流量成本提升用户体验,更有效率,保持视觉一致性,有利于搜索引擎收录,对浏览者和浏览器更具有亲和力。
java的解释器:tomcat(小型互联网公司)/resin( 大型互联网公司)/weblogic(传统行业)/jboss(淘宝)
赶集网:日200-300万人访问。
PV:PAGE VIEW 页面浏览量或点击量,用户每次刷新即被计算一次。用户发出,服务器回馈就叫一个pv,打开一个页面就一次pv,打开一个链接就是一次pv,有些网站为防止刷pv会在页面底部嵌入一个js来统计。
如果一个用户访问赶集网,你觉得平均会产生多少pv?几个-几十个
赶集网日ip300万,那么你估计下pv能有多少,3000万+。吹牛可以说pv,最主要的是有多少人看到,这才是广告商中意的。
uv:一个人访问记一个uv,通过不同技术方法来记录,实际会有误差。每次请求的信息内部都包含了你电脑的一些信息,比如:ip地址,请求发出的时间,浏览器版本,操作系统版本等等。也就是满足同一共同特征的就叫同一ip。问题是多人一个电脑。
ip/pv的度量:
pv的度量
1、分析web服务的访问日志(排除js、css各种图片),html,php。
2、在所有页面结尾,嵌入js程序(GA),传给统计服务器。
3、用第三方大家比较信任的统计工具(GA)。
ip的度量:
1、分析web服务的访问日志,去重。
2、在所有页面结尾,嵌入js程序(GA),传给统计服务器。
3、用第三方大家比较信任的统计工具(GA)。
session()和cookie(客户端用户)的区别是uv的一个补充,也就是浏览器发出请求后,服务端会发一个cookie放在客户端的c盘,这个cookie也包含了服务器信息,访问时间,访问了哪些页面等等。也不太精准,比uv好点,但很多用户手动删了cookie就统计不了了。
并发:每秒网站服务器最大响应的用户请求数?
正确理解:单位时间内,服务器能够同时处理的最大连接数。
查看网站排名、ip、pv的地址:
http://alexa.chinaz.com/?domain=google.com
查看网站排名的地址:
http://www.alexa.com/siteinfo/weibo.com
网站 | ip(万) | pv(万) | 机器数 |
www.51cto.com | 40 | 80-100 | 30台 |
www.ganji.com | 120-150 | 1000-1200 | 200 |
www.58.com | 100-12 | 1600 | 30-400 |
www.weibo.com | 3000-4000 | 10000-20000 | 1000多 |
www.taobao.com | 7000-8000 | 60000-100000 | 10000 |
awstats:抓取ip连接数然后排序,可查出ip连接的情况。
uniq:去重,把重复的行去掉。-c 去重计数。相邻一样的才能去重。
sort:对一个文本的行进行排序。-n按数字排序,-r倒序,-t分隔符,类似awk的-F,cut的-d,-k指定按哪列排序。
awk -F “/” ‘{print $3}’ oldboy.log|sort|uniq -c|sort -nr 去重计数按倒序排列。
以上是关于http与www服务概念详解的主要内容,如果未能解决你的问题,请参考以下文章