HTMLHttp分段下载详解

Posted 2020-10-12

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了HTMLHttp分段下载详解相关的知识，希望对你有一定的参考价值。

一.为什么需要Http分段下载

在实际的业务开发中，大文件使用Http普通下载非常容易OOM(内存溢出)或是链接超时的错误，这种情况下应该就应该考虑使用Http的分段下载了。下面笔者为你介绍，Http协议如何实现分段下载。

二.Http协议的结构介绍

在正式开始之前，这里笔者先介绍一下Http的报文结构。Http的报文结构是由状态行、头部、空行、主体组成。在这里读者需要注意，GET请求和POST得到的报文结构是不一样的，GET请求无请求数据，而POST请求有请求数据。关于Http的详细信息，读者可以参考Http协议详解，而我们接下来讨论的Range就是请求头部中的一个字段。
三.Http协议的头部Range介绍
Range字段是Http1.1开始新增加的，Http1.1和传统的Http1.0相比，最大的特点就是解决1.0中不能支持多请求的缺点。判断一个WEB服务器是否支持分段下载可以通过查看返回头是否有Accept-Ranges:Byte 字段。分段下载分为两种，一种就是一次请求一个字段，一种就是一次请求多个字段。关于超文本传输的报文信息,读者可以通过filter、burp或是浏览器的控制台中查看报文的信息。

（一）一次请求一个分段

    下面看一下Range字段常用表示的写法：
   Range: bytes=0-1024 获取最前面1025个字节
   Range: bytes=-500   获取最后500个字节
   Range: bytes=1025- 获取从1025开始到文件末尾所有的字节
   Range: 0-0          获取第一个字节
   Range: -1           获取最后一个字节
   例如，在一个请求头中有Range:byte=0-1024，那么表示的意思就是请求数据的前1025个字节。
   如果这个分段请求的返回码是206，并且指示的分段范围是0-1024，文件的总大小是7877，那么在响应头中的数据应该表示为：
   Content-Range: bytes 0-1024/7877

（二）一次请求多个分段

    多个分段和单个分段相差无几，只需要在请求头的分段中添加多个分段区域就可以了。
   例如：在请求头出现Range:byte:0-1024,2000-3000，表示的含义就是请求前1025个字节信息，和从2000到3000字节的信息。
   如果分段请求的返回状态码是206，那么Content-Range的返回值和一次请求单个分段一样。

四.使用Java实现文件分段下载

接下来笔者结合Java实现一个多线程分段下载的功能。使用Java多线程实现实现这个功能的大致思想，使用多个线程负责文件的子模块的下载，每个线程都要记录好下载的结束位置，以便于作为下个线程下载的开始位置。直接上代码：

多线程的下载类：

import java.io.InputStream;
import java.io.RandomAccessFile;
import java.net.HttpURLConnection;
import java.net.URL;
import java.util.concurrent.CountDownLatch;

public class MutiThreadDownLoad {
    /**
     * 同时下载的线程数
     */
    private int threadCount;
    /**
     * 服务器请求路径
     */
    private String serverPath;
    /**
     * 本地路径
     */
    private String localPath;
    /**
     * 线程计数同步辅助
     */
    private CountDownLatch latch;
 
    public MutiThreadDownLoad(int threadCount, String serverPath, String localPath, CountDownLatch latch) {
        this.threadCount = threadCount;
        this.serverPath = serverPath;
        this.localPath = localPath;
        this.latch = latch;
    }
 
    public void executeDownLoad() {
 
        try {
            URL url = new URL(serverPath);
            HttpURLConnection conn = (HttpURLConnection) url.openConnection();
            conn.setConnectTimeout(5000);//设置超时时间
            conn.setRequestMethod("GET");//设置请求方式
            int code = conn.getResponseCode();
            if (code == 200) {
                //服务器返回的数据的长度，实际上就是文件的长度,单位是字节
                int length = conn.getContentLength();
                System.out.println("文件总长度:" + length + "字节(B)");
                RandomAccessFile raf = new RandomAccessFile(localPath, "rwd");
                //指定创建的文件的长度
                raf.setLength(length);
                raf.close();
                //分割文件
                int blockSize = length / threadCount;
                for (int threadId = 1; threadId <= threadCount; threadId++) {
                    //第一个线程下载的开始位置
                    int startIndex = (threadId - 1) * blockSize;
                    int endIndex = startIndex + blockSize - 1;
                    if (threadId == threadCount) {
                        //最后一个线程下载的长度稍微长一点
                        endIndex = length;
                    }
                    System.out.println("线程" + threadId + "下载:" + startIndex + "字节~" + endIndex + "字节");
                    new DownLoadThread(threadId, startIndex, endIndex).start();
                }
 
            }
 
        } catch (Exception e) {
            e.printStackTrace();
        }
 
 
    }
 
 
    /**
     * 内部类用于实现下载
     */
    public class DownLoadThread extends Thread {
        /**
         * 线程ID
         */
        private int threadId;
        /**
         * 下载起始位置
         */
        private int startIndex;
        /**
         * 下载结束位置
         */
        private int endIndex;
 
        public DownLoadThread(int threadId, int startIndex, int endIndex) {
            this.threadId = threadId;
            this.startIndex = startIndex;
            this.endIndex = endIndex;
        }
 
 
        @Override
        public void run() {
 
            try {
                System.out.println("线程" + threadId + "正在下载...");
                URL url = new URL(serverPath);
                HttpURLConnection conn = (HttpURLConnection) url.openConnection();
                conn.setRequestMethod("GET");
                //请求服务器下载部分的文件的指定位置
                conn.setRequestProperty("Range", "bytes=" + startIndex + "-" + endIndex);
                conn.setConnectTimeout(5000);
                int code = conn.getResponseCode();
 
                System.out.println("线程" + threadId + "请求返回code=" + code);
 
                InputStream is = conn.getInputStream();//返回资源
                RandomAccessFile raf = new RandomAccessFile(localPath, "rwd");
                //随机写文件的时候从哪个位置开始写
                raf.seek(startIndex);//定位文件
 
                int len = 0;
                byte[] buffer = new byte[1024];
                while ((len = is.read(buffer)) != -1) {
                    raf.write(buffer, 0, len);
                }
                is.close();
                raf.close();
                System.out.println("线程" + threadId + "下载完毕");
                //计数值减一
                latch.countDown();
 
            } catch (Exception e) {
                e.printStackTrace();
            }
 
        }
    }
}

MutiThreadDownLoad

接下来是测试文件：

import java.util.concurrent.CountDownLatch;

public class ClientTest{
    public static void main(String[] args) {
 
        int threadSize = 4;
        String serverPath = "https://www.baidu.com";
        String localPath = "NewsReader.apk";
        CountDownLatch latch = new CountDownLatch(threadSize);
        MutiThreadDownLoad m = new MutiThreadDownLoad(threadSize, serverPath, localPath, latch);
        long startTime = System.currentTimeMillis();
        try {
            m.executeDownLoad();
            latch.await();//等待所有的线程执行完毕
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
        long endTime = System.currentTimeMillis();
        System.out.println("全部下载结束,共耗时" + (endTime - startTime) / 1000 + "s");
    }
}

ClientTest

以上是关于HTMLHttp分段下载详解的主要内容，如果未能解决你的问题，请参考以下文章

在 iOS 中使用解密流式传输分段数据

如何从我的活动中意图在我的标签栏中分段？

QApplication 执行分段故障错误

为啥在访问二级指针时出现分段错误错误？ C语言

如何使用分段控制在 iphone 上添加超过 6 个分段和图像

分段控制的保存和加载状态