Linux实际应用之web基础和HTTP协议

Posted 28线不知名云架构师

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Linux实际应用之web基础和HTTP协议相关的知识,希望对你有一定的参考价值。

一、DNS

 1、网络是基于TCP/IP 协议进行通信和连接的,每一台主机都有一个唯一的标识(固定的 工P 地址),用以区别在网络上成千上万个用户和计算机。网络在区分所有与之相 连的网络和主机时,均采用一种唯一、通用的地址格式,即每一个与网络相连接的计算机和服务器都被指派一个独一无二的地址

 2、为了保证网络上每台计算机的IP地址的唯一性,用户必须向特定机构申请注册,分配IP地址11网络中的地址方案分为两套:IP地址系统和域名地址系统。这两套地址系统其实是一一对应的关系 12由于IP地址是数字标识,使用时难以记忆和书写,因此在TP 地址的基础上又发展出一种符号化的地址方案,来代替数字型的 IP地址

小结: 

1、网络上交互是基于TCP/IP协议的,每个主机在逻辑上有一个唯一位置标识(IP地址),物理地址为NAc地址

2、为了保证地址唯一性,用户协议向特地给机构申请注册,分配IP地址网络中的地址有两套方案:

①IP地址系统

②域名地址系统

而由于IP是由32位二进制数字标识,不方便记忆,所以、以IP地址为基础发展出了符号化地址来代替解决方案。

3、DNS 解析 DNS解析方式,三种:

①/etc/hosts linux系统中负责快速解析的文件,包含了ip与主机名的映射关系,在没有DNS服务器的情况下,使用本地/etc/hosts完成解析/映射,实现快速访问

PS:主要用于主机之间(IP和主机名)的映射/解析关系,

示例:192.168.226.128 master

192.168.226.129 node1

192.168.226.130 node2

②/etc/resolv.conf DNS客户端配置文件,主要用于设置DNs服务器的IP和域名,还包含了主机域名的搜索顺序等等,这个文件是由域名解析器〈resolver,一个根据主机名解析IP地址的库)使用的配置文件。

PS:主要用与匹配DNS服务器,示例:

nameserver 114.114.114.114

nameserver 8.8.8.8

③/etc/sysconfig/network-scripts/ifcfg-ens33我们也可以在网卡配置文件中定义DNS1、 DNS2、

二、域名

1、定义:

标识一组主机并提供它们的有关信息的树形结构(主要确定了根在哪,就可以确定每个分支)

域名服务器(分布式,每台主机维护一个部分):

①保持和维护域名空间的程序 ②响应解析器的请求 解析端(客户端) 向DNS服务器发出请求的设备

2、域名空间结构(从右往左看)

①根域位于域名空间最顶层,一般用一个".”表示 6基础单位,除了根域其他都只有一个上级域,有0或多个子域,同层域不可重复的子域或域名

②顶级域 一般代表一种类型的组织机构或国家地区(主要有此两种类型构成),如 net(网络公司)、com(商业)、org(民间团体组织)、edu(教育)、gov(政府)、mil(军事) 、cn(中国)、jp(日本)、hk(中国香港)

三、网页访问(HTTP/HTTPS)

1、网页基本概念

①网页

纯文本格式文件

编写语言为html、HTML5

index .html index.htm index.php

在用户的浏览器中被"潮译”成网页形式显示出来

②网站

由一个一个页面构成的,是多个网页的结合体主页

打开网站后出现的第一个网页称为网站主页(或首页)

③域名

浏览网页时输入的网址

④HTTP/HTTPS

用来传输网页的通信协议(是否加密),是一种通讯/交互的标准/规范  

⑤URL

是一种万维网寻址系统

⑥HTML 用来编写网页的超文本标记语言

⑦超链接

超链接是将网站中不同网页链接起来的功能

⑧发布

将制作好的网页上传到服务器供用户访问的过程

2.HTML文档的结构

HTML网页

头部部分

标题部分

主体部分

网页内容,包括文本、图像等

<html>
<head>
<title>我的第一个网页</title>
</head>

<body>
     hello world
</body>

</html>

网页基本标签

  • 标题标签
  • 行控制相关标签
  • 范围标签
  • 图像标签
  • 超链接标签
  • 特殊符号
<h1>静夜思</h1><p>床前明月光</p>
疑是地上霜<br />
<span>举头望明月</span><img src="linux.jpg" />
<a href="linux.htm">我是郭德纲</a>&nbsp;&quot; &copy; &gt;

四、web

4.1 web

概述 Web (World wide Web)即全球广域网,也称为万维网一种分布式图形信息系统 建立在Internet上的一种网络服务

4.2 web1.0 vs web2.0

Web1.0

以编辑为特征,网站提供给用户的内容是编辑处理后的,然后用户阅读网站提供的内容这个过程是网站到用户的单向行为

web2.0

更注重用户的交互作用,用户既是网站内容的消费者(浏览者),也是网站内容的制造者 加强了网站与用户之间的互动,网站内容基于用户提供,网站的诸多功能也由用户参与建设,实现了网站与用户双向的交流与参与

web2.0特征 用户分享、以兴趣为聚合点的社群、开放的平台,活跃的用户

4.3静态页面与动态页面

(1)静态页面定义

①静态网页是标准的HTML文件

②扩展名是.htm、 .html 例如文本、图像、声音、Flash动画、客户端脚本和ActiveX控件及Java小程序等

③是网站建设的基础,早期网站一般都由静态网页制作

④没有后台数据库、不含程序和不可交互的网页

⑤相对更新起来比较麻烦,适用于一般更新较少的展示型网站

(2)静态页面特点:

①每个静态网页都有一个固定的URL,且URL以.htm、.html、.shtml等常见形式为后缀,而不含有"?"

②网页内容一经发布到网站服务器上,无论是否有用户访问,每个静态网页都是保存在网站服务器上的

③静态网页的内容相对稳定,容易被搜索引擎检索

④静态网页没有数据库的支持,在网站制作和维护方面工作量较大,因此当网站信息量很大时完全依靠静态网页制作方式比较困难

⑤静态网页的交互性较差,在功能方面有较大的限制

⑥页面浏览速度迅速,过程无需连接数据库,开启页面速度快于动态页面

(3) 动态页面

①网页URL不固定,能通过后台与用户交互

②在动态网页网址中有一个标志性的符号—"?"

③常用的语言有PHP、JSP、 Python、 Ruby等

(4)动态页面特点

①交互性

网页会根据用户的要求和选择而动态改变和响应,将浏览器作为客户端界面,这将是今后WBB发展的大势所趋

②自动更新

无须手动地更新HTML文档,便会自动生成新的页面,可以大大节省工作量

③因时因人而变

当不同的时间,不同的人访问同一网址时会产生不同的页面

五、HTTP协议概述

1、 HTTP协议简介、版本 HTTP

(超文本传输协议HyperText Transfer Protocol)协议是互联网上应用最为广泛的一种网络协议,它是基于TCP协议的应用层传输协议,简单来说就是客户端和服务端`行数据传输的一种规则。

HTTP是应用层上的协议,建立在传输层TCP之上,客户端通过与服务端进行TCP连接,之后发送HTTe请求与接收HTTP响应都是通过访问Socket接口来调用TCP协议实现。

HTTP是一种无状态(stateless)协议, HTP协议本身不会对发送过的请求和相应的通信状态进行持久化处理。这样做的目的是为了保持HTre协议的简单性,从而能够快速处理大量的事务,提高效率。

然而,在许多应用场景中,我们需要保持用户登录的状态或记录用户购物车中的商品。由于HTPp是无状态协议,所以必须引入一些技术来记录管理状态,例如Cookie。

cookie和session 都为了实现的是http的短期的持久化(内存/缓存方式,查询快、效率比较高)

cookie 是缓存在用户端〈client)浏览器中的(默认缓存一天),当下次客户端通过同一个浏览器访问客户端的时候,会优先读取cookie中的缓存信息,向服务端进行请求,同时服务端收到客户端请求的时候,读取到cookie文件,知道客户端之前找的是服务器A处理的任务,为了省事儿,省资源,干脆直接讲请求直接再交给服务器A处理

HTTP协议的版本

HTTP 0.9:已过时

☆ HTTP 1.0

☆HTTP 1.1

HTTP 2.0

六、面试题

面试题1:GET 与POST 区别
① 区别一:语义上的区别
  Get向服务器请求数据,依照HTTP协议,get 是用来请求数据。
  Post向服务器发数据,依照HTTP协议,Post的语义是向服务器添加数据,也就是说按照Post的语义,该操作是会修改
服务器上的数据

② 区别二:服务器请求的区别
  Get请求是可以被缓存,示例:
访问百度,访问的方式就是GET,此时访问后的内容会缓被存在浏览器中,短时间再次访问,其实是拿到的浏览器中的缓存内容
另外Get请求只能接收ASCII码的回复
  Post请求是不可以被缓存的。对于Post方式提交表单,刷新页面浏览器会弹出提示框“是否重新提交表单”,
Post可以接收二进制等各种数据形式,所以如果要上传文件一般用Post请求

③ 区别三:参数放请求头和请求体的差别
  Get请求通常没有请求体(当然这也是可以由程序猿心情改变的),在TCP传输中只需传输一次(而不是一个包),
所以Get请求效率相对高。
  Post请求将数据放在请求体中,而实际传输中,会先传输完请求头,再传输请求体,是分为两次传输的(而不是两个包)。
Post请求头会比Get更小(一般不带参数),请求头更容易在一个TCP包中完成传输,更何况请求头中有Content-Length的标识,可以更好地保证Http包的完整性。

HTTP1.0和HTTP1.1之间的区别
① 缓存处理
在HTTP1.0中主要使用header里的If-Modified-Since,Expires来做为缓存判断的标准,HTTP1.1则引入了更多的缓存控制策略例如Entity tag,If-Unmodified-Since, If-Match, If-None-Match等更多可供选择的缓存头来控制缓存策略。

② 带宽优化及网络连接的使用
HTTP1.0中,存在一些浪费带宽的现象,例如客户端只是需要某个对象的一部分,而服务器却将整个对象送过来了,并且不支持断点续传功能,HTTP1.1则在请求头引入了range头域,它允许只请求资源的某个部分,即返回码是206(Partial Content),这样就方便了开发者自由的选择以便于充分利用带宽和连接

③ 错误通知的管理
在HTTP1.1中新增了24个错误状态响应码,如409(Conflict)表示请求的资源与资源的当前状态发生冲突;410(Gone)表示服务器上的某个资源被永久性的删除

④ Host头处理
在HTTP1.0中认为每台服务器都绑定一个唯一的IP地址,因此,请求消息中的URL并没有传递主机名(hostname)。但随着虚拟主机技术的发展,在一台物理服务器上可以存在多个虚拟主机(Multi-homed Web Servers),并且它们共享一个IP地址。HTTP1.1的请求消息和响应消息都应支持Host头域,且请求消息中如果没有Host头域会报告一个错误(400 Bad Request)

⑤ 长连接
HTTP 1.1支持长连接(PersistentConnection)和请求的流水线(Pipelining)处理,在一个TCP连接上可以传送多个HTTP请求和响应,减少了建立和关闭连接的消耗和延迟,在HTTP1.1中默认开启Connection: keep-alive,一定程度上弥补了HTTP1.0每次请求都要创建连接的缺点

 

以上是关于Linux实际应用之web基础和HTTP协议的主要内容,如果未能解决你的问题,请参考以下文章

Linux之Web服务HTTP协议

web开发基础之HTTP协议

001 web基础之HTTP协议

网络通信之应用层协议--Linux

java之servlet学习基础

接口测试之基础篇--http协议