Varnish介绍

Posted shenxm

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Varnish介绍相关的知识,希望对你有一定的参考价值。

varnish介绍

varnish

	官方网站
		https://varnish-cache.org/
		http://book.varnish-software.com/4.0/
	Varnish是反向HTTP代理,有时被称为gaHTTP加速器或Web加速器,反向代理是作为普通服务器向客户端显示的代理服务器。
	varnish(高速缓存)存储器中的文件或文件片段,用于减少将来的等效请求时的响应时间和网络带宽消耗。
	varnish设计用于现代硬件,现代操作系统和现代工作负载。
	Varnish采用全新的软件体系结构,和现在的硬件体系配合比较紧密。
	Varnish不仅仅是用缓存内容来加速你服务器的反向HTTP代理,根据安装情况,varnish也可以用作:
		web应用防火墙,DDoS攻击防御者,热链保护器,负载平衡器,整合点,单点登录网关,认证授权策略机制,快速修复不稳定的后端和HTTP路由器。
	varnish是灵活的,因为可以在其Varnish配置语言(VCL)中编写自己的缓存策略,VCL是基于C的域特定语言,配置完成VCL后,将VCL转换为C代码并进行编译,因此Varnish可以快速执行。

varnish的特点

	Varnish基于内存缓存,重启后数据将消失      
	利用虚拟内存方式,io性能好
	支持设置0~60秒内的精确缓存时间
	VCL配置管理比较灵活
	32位机器上缓存文件大小为最大2G
	具有强大的管理功能,例如top,stat,admin,list等
	状态机设计巧妙,结构清晰
	利用二叉堆管理缓存文件,达到积极删除目的

varnish的工作原理

	Varnish 与一般服务器软件类似,分为master 进程和child 进程。
		master进程读入存储配置文件,调用合适的存储类型,然后创建/读入相应大小的缓存文件,接着master 初始化管理该存储空间的结构体,然后fork 并监控child 进程。child进程在主线程的初始化的过程中,将前面打开的存储文件整个mmap 到内存中,此时创建并初始化空闲结构体,挂到存储管理结构体,以待分配。
		child进程分配若干线程进行工作,主要包括一些管理线程和很多worker 线程。
	varnish的某个负责接收新HTTP 连接线程开始等待用户,如果有新的HTTP连接过来,它总负责接收,然后唤醒某个等待中的线程,并把具体的处理过程交给它。
	Worker线程读入HTTP 请求的URI,查找已有的object,如果命中则直接返回并回复用户,如果没有命中,则需要将所请求的内容,从后端服务器中取过来,存到缓存中,然后再回复。
	分配缓存的过程:
		它根据所读到object 的大小,创建相应大小的缓存文件。
		为了读写方便,程序会把每个object的大小变为最接近其大小的内存页面倍数。
		然后从现有的空闲存储结构体中查找,找到最合适的大小的空闲存储块,分配给它。
		如果空闲块没有用完,就把多余的内存另外组成一个空闲存储块,挂到管理结构体上。
		如果缓存已满,就根据LRU 机制,把最旧的object 释放掉。
	释放缓存的过程:
		有一个超时线程,检测缓存中所有object 的生存期,如果超初设定的TTL(Time To Live)没有被访问,就删除之,并且释放相应的结构体及存储内存。
		注意释放时会检查该存储内存块前面或后面的空闲内存块,如果前面或后面的空闲内存和该释放内存是连续的,就将它们合并成更大一块内存。
	整个文件缓存的管理,没有考虑文件与内存的关系,实际上是将所有的object 都考虑是在内存中,如果系统内存不足,系统会自动将其换到swap 空间,而不需要varnish 程序去控制。

varnish的优缺点

	varnish的优点
		Varnish采用了“Visual Page Cache”技术,所有缓存的数据都直接从内存读取。
		Varnish稳定性比Squid高,宕机率很低。
		通过Varnish管理端口,可以使用正则表达式快速、批量地清除部分缓存。
		Varnish可以支持更多的并发连接。
	
	varnish的缺点
		Varnish在高并发状态下,CPU、I/O和内存等资源的开销高于Squid。
		Varnish的进程一旦挂起、崩溃或者重启,缓存的数据都会从内存中释放出来,此时的所有请求都会被发送到后端应用服务器上,在高并发的情况下,就会给后端服务器造成很大压力。

varnish设计原则

	varnish设计目的:
		解决实际问题
		运行于现代硬件(64位多核架构)
		与内核协同工作,而不是针对内核
		将Varnish配置语言VCL翻译成C语言
		可通过varnish模块VMODs扩展
		通过其面向工作区的共享内存模型减少锁定争用
	varnish的重点始终是性能和灵活性。
	Varnish使用面向工作区的内存模型,而不是在运行时分配确切的空间空间。
	varnish不管理其分配的内存,但它将此任务委托给操作系统,因为内核通常可以比用户空间程序更好地执行此任务。
	事件过滤器和通知设施,例如epoll和kqueue是操作系统的高级特性,这些特性是为像varnish这样的高性能的服务器设计的,通过使用这些特性,varnish可以移动大量的复杂信息到操作系统的内核中,这样会更好地决定那些线程会被执行。
	Varnish使用Varnish配置语言VCL,允许准确地指定如何使用和组合Varnish的功能。
	VCL被翻译成C编程语言代码,该代码使用标准C编译器进行编译,然后在运行时直接动态链接到Varnish中。
	当你需要的功能在VCL中没有提供时,你可以在数据库中找到个ip地址,以便于你可以写原始C编码在自己的VCL上。
	那个地址是在线的,但不鼓励使用,相比于在线的C,建议把你的C编码放入varnish的VMOD模块中。
	VMOD通常以VCL和C编程语言编码,实际上,VMOD是一个共享库,具有可以从VCL代码调用的函数。
	varnish共享存储日志(VSL)允许Varnish让其他应用程序解析数据并提取有用的信息,这个过程几乎无需花费时间。

存储对象

		对象:HTTP响应消息的本地存储
		varnish的对象存储在内存中,并通过hash key进行寻址
		可以控制hashing
		多个对象可以具有共同的hash
	对象是本地存储的响应信息且被定义在协议中,这些信息被映射为hash值并存储在内存中,涉及到的相关对象被存储hash树中。
	Varnish的一个相当独特的功能是它允许你控制散列算法的输入。
	默认情况下,hash key是由HTTP主机头和URL制成,且非常重要。
	但是,你也可以通过使用其他东西来创建hash key,例如,你可以使用Cookie或客户端请求的用户代理来创建hash key。
	HTTP指定可以根据客户端的偏好从相同的URL提供多个对象,例如,gzip格式的内容只发送到指示gzip支持的客户端。
	varnish在一个hash key下存储单个压缩对象。
	根据客户端请求,Varnish会检查Accept-Encoding头域。
	如果客户端不接受gzip对象,Varnish会即时解压缩对象并将其发送给客户端。

对象生命周期

	图中显示了缓存对象的生命周期。
	缓存对象具有原始时间戳t_origin和三个持续时间属性:1)TTL,2)grace和3)keep。
	t_origin是在后端创建对象的时间。
	一个对象生活在缓存中,直到经过之后TTL + grace + keep,该对象被Varnish守护进程删除。
	VCL - vcl_backend_fetch和 VCL - vcl_backend_response有选择的解释了varnish是如何处理后端的响应以及这些时间属性是如何影响后续行动的。

varnish的应用程序

	varnish应用程序组成:
		/usr/bin/varnishadm
		/usr/bin/varnishhist
		/usr/bin/varnishlog
		/usr/bin/varnishncsa
		/usr/bin/varnishstat
		/usr/bin/varnishtest
		/usr/bin/varnishtop
		/usr/sbin/varnishd
		。。。。
	varnissh最重要的部分是守护进程(后台服务)varnishd。
	核心进程varnish的接收来自客户端的HTTP请求,并将请求发送到后端backend,缓存返回的缓存的结果并回复客户端请求。 
	varnishtest是用于测试您的Varnish安装的脚本驱动程序, varnishtest非常强大,因为它允许创建客户端模型,从模型或真实的后端中获取内容,与实际的Varnish配置交互,并说明预期的行为。
	varnishadm控制正在运行的Varnish实例,该 varnishadm 实用程序建立在的命令行界面(CLI)连接的varnishd上,此实用程序是唯一可能影响运行的Varnish实例的实用程序,可以使用varnishadm开始和停止varnishd,更改配置参数,重新加载Varnish配置语言(VCL),查看最新的参数文档等。
	varnish日志varnishlog提供大量信息,因此通常需要对其进行过滤。例如,“只显示与X匹配的”。 
	varnishstat用于访问全局计数器,它提供总体统计信息,例如请求总数,对象数量等, varnishstat在将其varnishlog用于分析您的varnish安装时特别有用。

varnish安装

	varnish官方站点: http://www.varnish-cache.org/
	直接下载安装包进行安装
	采用epel源安装
		yum install varnish
		rpm -ql varnish
		/etc/logrotate.d/varnish
		/etc/varnish
		/etc/varnish/default.vcl
		/etc/varnish/varnish.params
		/run/varnish.pid
		/usr/bin/varnishadm
		/usr/bin/varnishhist
		/usr/bin/varnishlog
		/usr/bin/varnishncsa
		/usr/bin/varnishstat
		/usr/bin/varnishtest
		/usr/bin/varnishtop
		/usr/lib/systemd/system/varnish.service
		/usr/lib/systemd/system/varnishlog.service
		/usr/lib/systemd/system/varnishncsa.service
		/usr/sbin/varnish_reload_vcl
		/usr/sbin/varnishd
		/usr/share/doc/varnish-4.0.4
		/var/lib/varnish
		/var/log/varnish

varnish程序架构

		Manager进程
		Cacher进程,包含多种类型的线程:
				accept, worker, expiry, ... 
		shared memory log:
				统计数据:计数器;
				日志区域:日志记录;
					varnishlog, varnishncsa, varnishstat... 
		配置接口:VCL(Varnish Configuration Language)
				vcl complier --> c complier --> shared object

varnish的程序环境

		varnish环境配置,配置varnish服务进程的工作特性,例如监听的地址和端口,缓存机制:
			/etc/varnish/varnish.params
		VCL配置文件,配置各Child/Cache线程的缓存策略:
			/etc/varnish/default.vcl
		主程序:
				/usr/sbin/varnishd
		CLI interface:
				/usr/bin/varnishadm
		Shared Memory Log交互工具:
				/usr/bin/varnishhist
				/usr/bin/varnishlog
				/usr/bin/varnishncsa
				/usr/bin/varnishstat
				/usr/bin/varnishtop		
		测试工具程序:
				/usr/bin/varnishtest
		VCL配置文件重载程序:
				/usr/sbin/varnish_reload_vcl
		Systemd Unit File:
				/usr/lib/systemd/system/varnish.service:varnish服务
				/usr/lib/systemd/system/varnishlog.service:varnish日志服务
				/usr/lib/systemd/system/varnishncsa.service	:varnish日志持久的服务

以上是关于Varnish介绍的主要内容,如果未能解决你的问题,请参考以下文章

varnish介绍

高性能HTTP加速器varnish实践

Varnish缓存机制详细介绍及简单配置

varnishlogVarnishstat详解

varnish知识点介绍

Varnish简介