varnish详解

Posted 2020-08-19

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了varnish详解相关的知识，希望对你有一定的参考价值。

varnish

简介 | 安装 | 工作流程 | VCL介绍 | 日志系统

简介：

varnish是一个web应用加速器也称为cache型的http反向代理，与传统的 squid 相比，varnish 具有性能更高、速度更快、管理更加方便等诸多优点，除了它的性能，配置语言VCL使得它可以非常灵活，VCL可以让我们编写请求和响应的处理策略，策略可以决定提供什么服务、从哪获取内容以及请求和响应报头怎样修改。

特点：

- 重启后缓存数据失效；
- 利用虚拟内存方式，I/O 性能好；
- VCL 配置管理比较灵活；
- 具有强大的管理功能，top、stat、admin、list 等；
- 状态机设计巧妙，结构清晰；
- 利用二叉堆管理缓存文件，达到积极删除目的。

下载安装： CentOS6.8 varnish-4.0.3-1.el6.x86_64

CentOS上配置好epel源可直接yum安装：

]# yum isntall varnish

若想下载较新版本可从官方网站找到yum源：

http://varnish-cache.org/releases/install_redhat.html#install-redhat

安装后主要文件及命令：

主配置文件：

/etc/sysconfig/varnish 配置varnish工作特性，监听的地址和端口，缓存机制等；

/etc/varnish/default.vcl 各Child/Cache线程的工作属性，缓存策略配置

主程序：

/usr/sbin/varnishd

CLI命令行接口：

/usr/bin/varnishadm

Shared Memory Log交互工具：

/usr/bin/varnishhist

/usr/bin/varnishlog

/usr/bin/varnishncsa

/usr/bin/varnishstat

/usr/bin/varnishtop

测试工具程序：

/usr/bin/varnishtest

VCL配置文件重载程序：

/usr/sbin/varnish_reload_vcl

服务启动脚本：

/etc/rc.d/init.d/varnish

启动varnish：

]# varnishd -f /etc/varnishd/default.vcl -s file,/var/varnish_cache,1G\

-T 127.0.0.0:6081 -a 0.0.0.0:80

各选项解释：

-f 指定 varnish 的配置文件位置

-s 指定 varnish 缓存存储机制，下面有解释

-T address:port 设定 varnish 的管理地址及其端口，用于 varnishadm 管理

-a address:port 接收请求的地址及端口，缓存的后方应用为 http 则可将端口设为 80

注：一般 varnish 的启动选项定义在 /etc/sysconfig/varnish 文件中，以各变量的值作为运行参数，当使用 service varnish start 方式启动服务时会自动加载该文件，文件内容较为容易理解，需注意最后的 # DAEMON_OPTS="" 该变量可添加启动时的额外选项，如：

DAEMON_OPTS="-p thread_pool_min=5 -p thread_pool_max=500 -p thread_pool_timeout=300"

以指定最大空闲线程数、最大线程数、线程超时时长等。

...

# # DAEMON_OPTS is used by the init script.  If you add or remove options, make
# # sure you update this section, too.
DAEMON_OPTS="-a ${VARNISH_LISTEN_ADDRESS}:${VARNISH_LISTEN_PORT}              -f ${VARNISH_VCL_CONF}              -T ${VARNISH_ADMIN_LISTEN_ADDRESS}:${VARNISH_ADMIN_LISTEN_PORT}              -t ${VARNISH_TTL}              -p thread_pool_min=${VARNISH_MIN_THREADS}              -p thread_pool_max=${VARNISH_MAX_THREADS}              -p thread_pool_timeout=${VARNISH_THREAD_TIMEOUT}              -u varnish -g varnish              -S ${VARNISH_SECRET_FILE}              -s ${VARNISH_STORAGE}"
#
## Alternative 4, Do It Yourself. See varnishd(1) for more information.
#
# DAEMON_OPTS=""

varnish的缓存存储机制( Storage Types)：

- malloc[,size]

内存存储,使用malloc()库调用在varnish启动时向操作系统申请指定大小的内存空间以存储缓存对象；可能会产生内存碎片，影响性能

- file[,path[,size[,granularity]]]

文件存储，黑盒,使用特定单个文件存储全部的缓存数据，并通过操作系统的mmap()系统调用将整个缓存文件映射至内存区域,重启后所有缓存项失效；

- persistent,path,size

与file功能相同，黑盒，但可以持久存储数据；目前测试阶段；

可在/etc/sysconfig/varnish文件中定义VARNISH_STORAGE=；或varnishd -s TYPE

Varnish无法追踪某缓存对象是否存入了缓存文件，从而也就无从得知磁盘上的缓存文件是否可用，因此，file存储方法在varnish停止或重启时会清除数据。

设计结构：

工作流程：

Varnish 与一般服务器软件类似，分为 master 进程和 child 进程。Master 进程读入存储配置文件，调用合适的存储类型，然后创建 / 读入相应大小的缓存文件，接着 master 初始化管理该存储空间的结构体，然后 fork 并监控 child 进程。Child 进程分配若干线程进行工作，主要包括一些管理线程和很多 worker 线程。

Varnish 的某个负责接收新 HTTP 连接线程开始等待用户，如果有新的 HTTP 连接过来，它总负责接收，然后唤醒某个等待中的线程，并把具体的处理过程交给它。Worker 线程读入 HTTP 请求的 URI，查找已有的 object，如果命中则直接返回并回复用户。如果没有命中，则需要将所请求的内容，从后端服务器中取过来，存到缓存中，然后再回复。具体决策操作流程由vcl各状态引擎实现

配置Varnish

VCL简介：

VCL（varnish configuration language）是 varnish 域专用的配置语言，用来描述请求处理过程、定义数据的存储策略。VCL 语法比较简单，和 C 和 Perl 比较相似。当新的配置被加载时，主控进程会启用vcc将配置文件编译成二进制程序（所以依赖到 gcc 环境），并组织成共享对象(Shared Object)交由Child进程加载使用，若编译失败会返回相应错误，varnish运行时可随时加载配置文件。

想要配置varnish正常工作。需先了解varnish 的配置语言VCL，“域专用”指的是有些数据仅出现于特定的状态中。

- VCL文件以 vcl 4.0 为起始; /etc/varnish/default.vcl
- //，#，/*..*/ 为注释
- sub定义一个subroutings
- 没有循环，有限状态
- 以一个关键词作为返回状态参数以表示下一步动作，即：return(action)
- 域专用的配置语言
- 操作符：=、==、~、!、&&、||、<、>=

示例： 该为varnish默认策略中的一段，表示若请求方法为GET、HEAD则直接交由后端主机处理

若请求包含认证或Cookie则直接交由后端主机处理

sub vcl_recv {
    ...
    if (req.method != "GET" && req.method != "HEAD") {
        /* We only deal with GET and HEAD by default */
        return (pass);
    }
    if (req.http.Authorization || req.http.Cookie) {
        /* Not cacheable by default */
        return (pass);
    }
    ...
}

vcl state engine 状态引擎：

vcl_recv：用于接收和处理请求；当请求到达并成功接收后被调用，通过判断请求的数据来决定如何处理请求；

vcl_pipe：用于将请求直接传递至后端主机，并将后端响应原样返回客户端；

vcl_pass：用于将请求直接传递至后端主机，但后端主机的响应并不缓存直接返回客户端；

vcl_hit：在执行 lookup 指令后，在缓存中找到请求的内容后将自动调用该函数；

vcl_miss：在执行 lookup 指令后，在缓存中没有找到请求的内容时自动调用该方法，此函数可用于判断是否需要从后端服务器获取内容；

vcl_hash：在vcl_recv调用后为请求创建一个hash值时，调用此函数；此hash值将作为varnish中搜索缓存对象的key；

vcl_purge：pruge操作执行后调用此函数，可用于构建一个响应；

vcl_deliver：将在缓存中找到请求的内容发送给客户端前调用此方法；

vcl_backend_fetch：向后端主机发送请求前，调用此函数，可修改发往后端的请求；

vcl_backend_response：获得后端主机的响应后，可调用此函数；

vcl_backend_error：当从后端主机获取源文件失败时，调用此函数；

vcl_init：VCL加载时调用此函数，经常用于初始化varnish模块(VMODs)

vcl_fini：当所有请求都离开当前VCL，且当前VCL被弃用时，调用此函数，经常用于清理varnish模块；

vcl_synth：自定义返回页面，可在purge操作时调用。

主要语法：

sub subroutine {
...
}
if CONDITION {
...
} else {
...
}
return(), hash_data()

配置示例：

]# vi /etc/varnish/default.vcl

]# varnish_reload_vcl

后端主机健康监测：

probe check {        定义该检查的名称为 check ，当后端主机较多时，直接在 backend 中调用即可。
    .url = "/.healthcheck.html";
    .window = 5;    基于最近多少次探测
    .threshold = 4;  最近.window定义的检查次数中.threshhold定义的次数成功则为健康
    .interval = 2s;    检查时间间隔 
    .timeout = 1s;     超时时长
    .expected_response：  期望的响应码，默认为200；
}

声明并初始化一个后端对象：

backend web1 { 
   .host = "10.1.235.33"; 
   .port = "80"; 
   .probe = check;    调用该检查机制
}
backend web2 { 
   .host = "10.1.235.66"; 
   .port = "80"; 
   .probe = check;
}

清除图片类请求响应首部cookie字段，取消私有标识，并指定可缓存时长ttl （增加）

sub vcl_backend_response {
    if (bereq.http.cache-control !~ "s-maxage") {
        if (bereq.url ~ "(?i)\.jpg$") {        (?i) 表示不区分大小写
            set beresp.ttl = 7200s;
        unset beresp.http.Set-Cookie;
    }
        if (bereq.url ~ "(?i)\css&") {
            set beresp.ttl = 7200s;
            unset beresp.http.Set-Cookie;
        }
    }
}

缓存对象修剪：

purge 自定义的方法，通常请求指定url缓存

ban 通常用来清理表达式匹配的缓存项

acl purge {acl控制，定义可清理缓存的主机地址，防止用户操作
"localhost";
"10.1.235.6"/16;
}
sub vcl_recv {
if (req.method == "PURGE") {     若方法为 PURGE 则执行清理操作
if (!client.ip ~ purge) {    限制来源
return(synth(405,"Not allowed."));
}
    return (purge);    定义下一步
}
}
sub vcl_purge {
return (synth(200,"Purged."));    返回 sycth 定义的页面
}

当有多个backend：动静分离

设定多个后端主机

backend default {
.host = "10.1.235.66";
.port = "80"
}
backend phpsrv {
.host = "10.1.235.77";
.port = "80";
}

接收时策略，对不同类型的资源请求分发到专用的后端服务器上

vcl_recv {
    if (req.url ~ "(?i)\.php$") {
        set req.backend_hint = "phpsrv";
    } else {
        set req.backend_hint = "default";
    }
}

实现负载均衡：缓存可能导致无负载均衡效果，可定义不可缓存文件或目录测试

import directors;    # 需先加载 directors

定义后端主机：

backend web1 {
    .host = "10.1.235.33";
}
backend web2 {
    .host = "10.1.235.66";
}

定义后端服务器组：

sub vcl_init {
    new websrv = directors.round_robin();    round_robin|random 调度算法较少
    websrv.add_backend(web1);
    websrv.add_backend(web2);
}

分发请求时调用该组：

sub vcl_recv {
    # send all traffic to the bar director:
    set req.backend_hint = websrv.backend();
}

日志系统：

varnish 默认将日志记录在一段共享内存中 shared memory log ，内存空间分为两部分，计数器和日志信息，提供非常详细的信息，这提高了性能，但不易于查找问题，记录在内存中的数据无法长时间保存。

内存中日志区域大小有限，如果不使用一个程序将日志信息保存到磁盘上，日志数据将会被不断覆盖。

日志查看命令：

]# varnishlog 动态持续更新显示日志信息

]# varnishtop 对日志信息做了整理排序

-1 仅输出一次静态信息后退出数字 1

-i taglist，可以同时使用多个-i选项，也可以一个选项跟上多个标签；

-I <[taglist:]regex>

-x taglist：排除列表

-X <[taglist:]regex>

]# varnishstat 缓存状态查看

-1 -f FILED_NAME

-l：可用于-f选项指定的字段名称列表；

日志记录服务：

varnishlog 以varnishlog命令输出的格式记录日记，内容较多，不易读

varnishncsa 以类似http访问日志格式记录日志，combined 日志格式

一般可开启 varnishncsa 服务将日志记录于磁盘上

]# service varnishncsa start

默认保存于 /var/log/varnish/varnishncsa.log

本文出自 “平平无奇” 博客，请务必保留此出处http://zzjasper.blog.51cto.com/9781564/1871436

以上是关于varnish详解的主要内容，如果未能解决你的问题，请参考以下文章

varnish详解

34-3 varnish状态引擎详解

36 web系统架构及cache基础varnish4基础应用varnish状态引擎详解及vcl

varnish详解

36补 varnish程序解雇及配置初步vcl使用详解及varnish命令行工具