HadoopLZO压缩配置

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了HadoopLZO压缩配置相关的知识,希望对你有一定的参考价值。

参考技术A 1)hadoop本身并不支持lzo压缩,故需要使用twitter提供的hadoop-lzo开源组件。hadoop-lzo需依赖hadoop和lzo进行编译,编译步骤如下。

2)将编译好后的hadoop-lzo-0.4.20.jar 放入hadoop-3.1.3/share/hadoop/common/

3)同步hadoop-lzo-0.4.20.jar到hadoop103、hadoop104

4)core-site.xml增加配置支持LZO压缩

5)同步core-site.xml到hadoop103、hadoop104

1)创建LZO文件的索引,LZO压缩文件的可切片特性依赖于其索引,故我们需要手动为LZO压缩文件创建索引。若无索引,则LZO文件的切片只有一个。

对上传的LZO文件建索引

     (4)再次执行WordCount程序

Hadoop原生不支持lzo 要手动指定jar包sonnpy原生支持不用指定

3)注意:如果以上任务,在运行过程中报如下异常

解决办法:在hadoop102的/opt/module/hadoop-3.1.3/etc/hadoop/yarn-site.xml文件中增加如下配置,然后分发到hadoop103、hadoop104服务器上,并重新启动集群。

Nginx配置之Gzip压缩

为什么要进行压缩

web服务器将组成网页的文件进行gzip压缩后再传输给浏览器,浏览器获取到压缩文件后进行解压并解析展示网页内容。原本的资源只在传输过程中进行压缩,既节约了带宽,同时也提升了页面的浏览速率。在实际工作中,网页压缩使用的比较多,这里就简单的记录下nginx服务器下Gzip的配置


nginx的Gzip压缩配置

作为一款强大的web服务器,nginx当然也支持Gzip压缩。

编辑配置文件(核心命令参数)

# 开启gzip功能
gzip on;

# 配置nginx使用缓存空间的大小:16指的是缓存空间的个数,8K为单个缓存空间的大小
# 从nginx0.7.28后,默认缓存空间大小为128k:这里是16*8K=128K
gzip_buffers 16 8K;

# 指定压缩级别:1-9;1压缩程度最低,效率最高,9压缩程度最高,效率最低
gzip_comp_level 3;

# 针对某些User_agent关闭gzip功能,后接的是正则表达式
# 这里以MSIE 4/5/6的浏览器为例开启gzip功能
gzip_disable MISE [4-6]\.;

# 指定特定http协议版本(1.0或1.1),选择性开启gzip功能
gzip_http_version 1.1;

# 根据响应页面的大小选择性关闭gzip(比较重要),大于才开启
# 防止出现压缩很小的数据出现压缩后数据量变大的情况,建议设置为1K或以上
gzip_min_length 1024;

# 根据网页的MIME类型选择性改期gzip
gzip_types text/plain application/x-javascript text/css text/html application/xml;

# 使用gzip时是否发送带有“Vary:Accept-Encoding”头域的响应头部
gzip vary on;

# 在客户端不支持Gzip压缩时,服务器将返回解压后的数据;客户端支持gzip,该参数被忽略,返回的是压缩后的数据
gunzip_static on;

gunzip_static命令参数由ngx_http_gunzip_module命令进行处理,该参数的使用需要在编译时添加--with-http_gunzip_module。

以上是关于HadoopLZO压缩配置的主要内容,如果未能解决你的问题,请参考以下文章

Android 安装包优化开启资源压缩 ( 资源压缩配置 | 启用严格模式的资源引用检查 | 自定义保留/移除资源配置 | 资源压缩效果 )

webpack 如何配置 CSS抽取 和 打包压缩

Nginx开启和配置Gzip压缩

Nginx配置之Gzip压缩

Nginx开启和配置Gzip压缩

Nginx 配置 gzip 压缩