http与www服务概念详解

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了http与www服务概念详解相关的知识,希望对你有一定的参考价值。

HTTP超文本传输协议

html页面标记语言

www万维网

 端口21  ftp

     22  ssh

     25  smtp

     3306 mysql

     873  rsync

     161  snmp

     111  rpc

     3389  

     80

     443  https

     110  pop3

      53  dns

 

curl -I www.baidu.com 查看网站头部信息 200表示服务器返回成功。

http请求流程:

osi模型中的应用层协议,http协议的重要应用是www服务

获取ipdns本地缓存表查找,网关DNS查找

dns解析流程

建立TCP连接

用户访问网站基本流程

 

htmlxmlshtmljpgjscssswfaviwmvflv等都属于静态页面。

静态网页容易被搜索引擎收录,所以很多时候需要将动态转成静态便于排名靠前增加点击率。

静态网页没有数据库支持,所以大量信息的网站不适合用静态的。

 

动态网页:服务端解析,效率远不如静态网页。用户注册、用户登录、在线调查,投票、用户管理、订单管理、发博文等。aspaspxphp,jsp,do,并且常伴随?&等。

架构优化:效率很差,并发也很低,尽可能转换成静态网页提供服务。

静态:动态-------10:1  系统架构师和程序架构师的职责。

伪静态就是将动态伪装成静态,其实还是动态,主要是修改了域名地址,目的是便于搜索收录,但并不能提升网站的性能,反而下降,转换时消耗资源。并发量不是很大时可以做伪静态,更新频率很快的业务也没必要做动转静,伪静态就非常好。

 

异步,消息中间件、消息队列就是让动态转静态。

web3.0web2.0的替代物,以用户为中心,动态页面为主,智能化人与人机器的交流。10兆,全视频的网络,这才像web3.0

 

传统页面布局:表格

现在:DIV+CSS,载入更快,降低流量成本提升用户体验,更有效率,保持视觉一致性,有利于搜索引擎收录,对浏览者和浏览器更具有亲和力。

 

java的解释器:tomcat(小型互联网公司)/resin( 大型互联网公司)/weblogic(传统行业)/jboss(淘宝)

 

赶集网:日200-300万人访问。

PV:PAGE VIEW 页面浏览量或点击量,用户每次刷新即被计算一次。用户发出,服务器回馈就叫一个pv,打开一个页面就一次pv,打开一个链接就是一次pv,有些网站为防止刷pv会在页面底部嵌入一个js来统计。

 

如果一个用户访问赶集网,你觉得平均会产生多少pv?几个-几十个

赶集网日ip300万,那么你估计下pv能有多少,3000+。吹牛可以说pv,最主要的是有多少人看到,这才是广告商中意的。

uv:一个人访问记一个uv,通过不同技术方法来记录,实际会有误差。每次请求的信息内部都包含了你电脑的一些信息,比如:ip地址,请求发出的时间,浏览器版本,操作系统版本等等。也就是满足同一共同特征的就叫同一ip。问题是多人一个电脑。

ip/pv的度量:

pv的度量

1、分析web服务的访问日志(排除jscss各种图片),htmlphp

2、在所有页面结尾,嵌入js程序(GA),传给统计服务器。

3、用第三方大家比较信任的统计工具(GA)。

ip的度量:

1、分析web服务的访问日志,去重。

2、在所有页面结尾,嵌入js程序(GA),传给统计服务器。

3、用第三方大家比较信任的统计工具(GA)。

 

session()和cookie(客户端用户)的区别是uv的一个补充,也就是浏览器发出请求后,服务端会发一个cookie放在客户端的c盘,这个cookie也包含了服务器信息,访问时间,访问了哪些页面等等。也不太精准,比uv好点,但很多用户手动删了cookie就统计不了了。

 

并发:每秒网站服务器最大响应的用户请求数?

正确理解:单位时间内,服务器能够同时处理的最大连接数。

 

查看网站排名、ippv的地址:

http://alexa.chinaz.com/?domain=google.com

查看网站排名的地址:

http://www.alexa.com/siteinfo/weibo.com

 

网站

ip(万)

pv(万)

机器数

www.51cto.com

40

80-100

30

www.ganji.com

120-150

1000-1200

200

www.58.com

100-12

1600

30-400

www.weibo.com

3000-4000

10000-20000

1000

www.taobao.com

7000-8000

60000-100000

10000


awstats:抓取ip连接数然后排序,可查出ip连接的情况。

uniq:去重,把重复的行去掉。-c 去重计数。相邻一样的才能去重。

sort:对一个文本的行进行排序。-n按数字排序,-r倒序,-t分隔符,类似awk-F,cut-d-k指定按哪列排序。

 

awk -F / {print $3} oldboy.log|sort|uniq -c|sort -nr 去重计数按倒序排列。


以上是关于http与www服务概念详解的主要内容,如果未能解决你的问题,请参考以下文章

http与www服务概念详解

网络协议分析 | 应用层:HTTP协议详解HTTP代理服务器

http协议详解

(转)HTTP协议详解

http协议详解

HTTP协议详解