Web基础与HTTP协议

Posted Richard_Chiang

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Web基础与HTTP协议相关的知识,希望对你有一定的参考价值。

Web基础与HTTP协议

域名概述

  • 域名的概念

    • IP地址不易记忆
  • 早期使用Hosts文件解析域名

    • 
      /etc/hosts#配置文件
      IP地址 主机名/域名 ……#组成Hosts文件
    • 主机名称重复
    • 主机维护困难
  • DNS (Domain Name System 域名系统)

    • 分布式的数据库
    • 有层次性地

  • 域名空间结构

    • 根域
    • net
    • 顶级域
    • 组织域
    • 国家/地区域名
  • 二级域名
  • FQDN=主机名.DNS后缀

域名注册

  • 域名注册是Internet中用于解决地址对应问题的一种方法
  • 遵循先申请先注册原则
  • 域名注册步骤

网页的概念

  • 网页
    • 纯文本格式文件
    • 编写语言为html
    • 在用户的浏览器中被"翻译"成网页形式显示出来
  • 网站
    • 由一个一个页面构成的,是多个网页的结合体
  • 主页

    • 打开网站后出现的第一个网页称为网站主页(或首页)
  • 域名
    • 浏览网页时输入的网址
  • HTTP
    • 用来传输网页的通信协议
  • URL

    • 是一种万维网寻址系统
  • HTML

    • 用来编写网页的超文本标记语言
  • 超链接
    • 超链接是将网站中不同网页链接起来的功能
  • 发布
    • 将制作好的网页上传到服务器供用户访问的过程

HTML概述

  • HTML超文本标记语言
    • Hyper Text Markup Language
    • 网页的"源码"
  • 浏览器:“解释和执行” HTML源码的工具

HTML文档的结构

  • HTML网页
    • 头部部分
    • 标题部分
    • 主体部分
    • 网页内容,包括文本、图像等
<htm|>
<head>
<title>我的第一个网页</title>
</head>#标签内容
#主题代码部分    
<body>
    Hello World!
</body>

</htm|>

网页基本标签

  • 网页摘要信息的作用

    • 有利于浏览器解析
    • 有利于搜索引擎搜索
  • <title>标签
  • <meta> 标签

Web概述

  • Web (World Wide Web)即全球广域网,也称为万维网
  • 一种分布式图形信息系统。
  • 建立在Internet上的一种网络服务

Web1.0 vs Web2.0

Web1.0

  • 以编辑为特征,网站提供给用户的内容是编辑处理后的,然后用户阅读
    网站提供的内容
  • 这个过程是网站到用户的单向行为

Web2.0

  • 更注重用户的交互作用,用户既是网站内容的消费者(浏览者),也是
    网站内容的制造者
  • 加强了网站与用户之间的互动,网站内容基于用户提供,网站的诸多功
    能也由用户参与建设,实现了网站与用户双向的交流与
  • Web2.0特征
    • 用户分享、以兴趣为聚合点的社群、开放的平台,活跃的用户

静态网页与动态网页

1.静态网页

在网站设计中,纯粹HTML格式的网页通常被称为"静态网页",静态网页是标准的HTML文件,它的文件扩展名是.htm、.html。静态网页是网站建设的基础,早期的网站一般都是由静态网页制作的。静态网页也可以出现各种动态的效果,如.GIF格式的动画、FLASH、滚动字幕等。这些"动态效果"只是视觉上的,与下面将要介绍的动态网页是不同的概念。

2.动态网页

所谓的动态网页,是指跟静态网页相对的一种网页编程技术。静态网页,随着HTML代码的生成,页面的内容和显示效果就基本上不会发生变化了一除非是修改页面代码。而动态网页则不然,页面代码虽然没有变,但是显示的内容却是可以随着时间、环境或者数据库操作的结果而发生改变的。动态网页URL的后缀不是.htm、.html、.shtml、.xml等静态网页的常见网页制作格式,而是以.aspx、.asp、.jsp、. php、.perl、.cgi等形式为后缀,并且在动态网页网址中有一个标志性的符号"?"。

动态网页是基本的html语法规范与Java、PHP、C#等高级程序设计语言、数据库编程等多种技术的融合,以期实现对网站内容和风格的高效、动态和交互式的管理。因此,从这个意义上来讲,凡是结合了HTML以外的高级程序设计语言和数据库技术进行的网页编程技术生成的网页都是动态网页。

3.动态网页语言

早期的动态网页主要采用通用网关接口CGI (Common Gateway Interface) 技术,虽然CGI技术已经发展成熟而且功能强大,但由于编程困难、效率低下、修改复杂,所以有逐渐被新技术取代的趋势。

目前常用的动态网页编程语言如下

  • PHP
    即 Hypertext Preprocessor (超文本预处理器),它是当今Internet上最 为火热的脚本语言,其语法借鉴了C、Java、PERL等语言,但只需要很少的编程知识你就能使用PHP 建立一个真正交互的Web站点。
  • JSP
    即 Java Server Pages (Java 服务器页面),它是由Sun Microsystem 公司于1999年6月推出的新技术,是基于Java Servlet以及整个Java 体系的Web开发技术。

  • Python
    是一种面向对象、跨平台的动态类计算机程序设计语言,最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越来越多被用于独立的大型项目开发。
  • Ruby
    是一种简单快捷的而向对象(面向对象程序设计)脚本语言,在20世纪90年代由日本人松本行弘(Yukihiro Matsumoto)开发,遵守GPL协议和Ruby License。 它的灵感与特性来自于Perl、Smalltalk、 Eiffel、Ada以及Lisp语言。

HTTP协议概述

  • HTTP协议是互联网上应用最为广泛的一种网络协议,设计这个协议的目的是为了发布和接收Web服务器上的HTML页面
  • HTTP协议的版本
    HTTP 0.9
    HTTP 1.0
    HTTP 1.1
    HTTP 2.0

HTTP协议采用了请求/响应模型。客户端向服务器发送一个请求,请求头包含请求的方法、URL、协议版本、以及包含请求修饰符、客户信息和内容的类似于MIME的消息结构。服务器以一个状态行作为响应,响应的内容包括消息协议的版本,成功或者错误编码加上服务器信息、实体元信息以及可能的实体内容。

HTTP已经演化出了很多版本,它们中的大部分都是向下兼容的。

(1) HTTP/0.9:已过时。只接受GET一种请求方法,没有在通讯中指定版本号,且不支持请求头。由于该版本不支持POST方法,所以客户端无法向服务器传递太多信息。

(2) HTTP/1.0:这是第一个在通讯中指定版本号的HTTP协议版本,至今仍被广泛采用,特别是在代理服务器中。

(3) HTTP/1.1:<u>引入了持久连接</u>(长链接、链接保持),即TCP连接默认不关闭,可以被多个请求复用,能很好地配合代理服务器工作。<u>还支持管道方式机制</u>,即<u>在同一个TCP连接里面,客户端可以同时发送多个请求</u>,以便降低线路负载,提高传输速度。

(4)HTTP/2.0:<u>完全多路复用,在一个连接里</u>,客户端和浏览器都可以同时<u>发送多个请求或回应,而且不用按照顺序一一对应</u>。引入了头信息压缩机制,使用gzip或compress<u>压缩后再发送。支持服务端推送</u>,允许服务器未经请求,主动向客户端发送资源。

HTTP方法

HTTP支持几种不同的请求命令,这些命令被称为HTTP方法(HTTP method)。每条HTTP请求报文都包含一个方法,告诉服务器要执行什么动作,包括:获取一个页面,运行一个网关程序,删除一个文件等。最常用的获取资源的方法是GET、POST 。

HTTP方法 描述
GET 对服务器资源获取的简单请求
PUT 向服务器提交数据,以修改数据
DELETE 删除服务器上的某些资源
POST 用于发送包含用户提交数据的请求
HEAD 请求页面的首部,获取资源的元信息

1、GET请求会向数据库发索取数据的请求,从而来获取信息,该请求就像数据库的select操作一样,只是用来查询一下数据,不会修改、增加数据,不会影响资源的内容,即该请求不会产生副作用。无论进行多少次操作,结果都是一样的。

2、与GET不同的是,PUT请求是向服务器端发送数据的,从而改变信息,该请求就像数据库的update操作一样,用来修改数据的内容,但是不会增加数据的种类等,也就是说无论进行多少次PUT操作,其结果并没有不同。

3、POST请求同PUT请求类似,都是向服务器端发送数据的,但是该请求会改变数据的种类等资源,就像数据库的insert操作一样,会创建新的内容。几乎目前所有的提交操作都是用POST请求的。

4、DELETE请求顾名思义,就是用来删除某一个资源的,该请求就像数据库的delete操作

GET和POST 比较

  • GET方法:从指定的服务器上获得数据
GET请求能被缓存
GET请求会保存在浏览器的浏览纪录里
GET请求有长度的限制
主要用于获取数据
查询的字符串会显示在URL后缀中,不安全,比如http://www.test.com/a.php?Id=123会被明码标识
  • POST方法:提交数据给指定服务器处理
POST请求不能被缓存
POST请求不会保存在浏览器的浏览纪录里
POST请求没有长度限制
查询的字符串不会显示在URL中,比较安全

HTTP状态码

HTTP状态码(HTTP Status Code) 是用以表示网页服务器HTTP 响应状态的3位数字代码,当浏览器请求某一URL时,服务器根据处理情况返回相应的处理状态。
通常正常的状态码为2xx,3xx (如200),如果出现异常会返回4xx,5xx (如404) 。

状态码首部 已定义范围 分类
1xx 100-101 信息提示
2xx 200-206 成功
3xx 300-305 重定向
4xx 400-415 客户端错误
5xx 500-505 服务器错误

HTTP常见状态码

状态码 功能描述
200 一切正常
301 永久重定向
302 临时重定向
401 用户名或PASSWD错误
403 禁止访问(客户端IP地址被拒绝)
404 请求文件不存在
414 请求URI头部过长
500 服务器内部错误
502 无效网关
503 当前服务不可用
504 网关请求超时

HTTP请求流程分析

用户在浏览器输入URL访问时,发起HTTP请求报文,请求中包括请求行、请求头、请求体,服务器收到请求后返回响应报文,包括状态行、响应头、响应体。

请求报文

请求行:请求行由请求方法、URL 以及协议版本三部分组成。
请求头:请求头为请求报文添加了一些附加信息,由“名/值”对组成,每行一对,名和值之间使用冒号分隔。
空行:请求头部的最后会有一个空行,表示请求头部结束,接下来为请求体,这一行非常重要,必不可少。
请求体:请求体是请求提交的参数,GET 方法已经在 URL 中指明了参数,所以提交时没有数据。POST 方法提交的参数在请求体中。

常用的请求头

请求头 描述
Host 接受请求的服务器地址,可以是 IP:端口号,也可以是域名
User-Agent 发送请求的应用程序名称
Connection 指定与连接相关的属性,如 Connection:Keep-Alive
Accept-Charset 通知服务端可以发送的编码格式
Accept-Encoding 通知服务端可以发送的数据压缩格式
Accept-Language 通知服务端可以发送的语言

响应报文

状态行:状态行由协议版本,状态码,状态码描述三部分组成。
响应头:响应头与请求头部类似,为响应报文添加了一些附加信息。
空行:响应头部的最后会有一个空行,表示响应头部结束。
响应体:服务器返回的相应 HTML 数据,浏览器对其解析后显示页面。

常见响应头

响应头 描述
Server 服务器应用程序软件的名称和版本
Content-Type 响应正文的类型(是图片还是二进制字符串)
Content-Length 响应正文长度
Content-Charset 响应正文使用的编码
Content-Encoding 响应正文使用的数据压缩格式
Content-Language 响应正文使用的语言


以上是关于Web基础与HTTP协议的主要内容,如果未能解决你的问题,请参考以下文章

Web基础与HTTP协议

Web基础与HTTP协议(LAMP部署基础知识)

Web与HTTP协议!

Web基础与HTTP协议

Web基础与HTTP协议

Web基础与HTTP协议