m3u8文件格式讲解,Python解析m3u8文件,并获取在线地址

Posted Jason_WangYing

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了m3u8文件格式讲解,Python解析m3u8文件,并获取在线地址相关的知识,希望对你有一定的参考价值。

  1. M3U(Moving Picture Experts Group Audio Layer 3 Uniform Resource Locator)这种文件格式是音视频文件的列表文件,是纯文本文件。你下载下来打开它,播放软件并不是播放它,而是根据它的记录找到网络地址进行在线播放。m3u8就是以utf-8编码的m3u文件

下面这个是没有加密的m3u8文件

#EXTM3U
#EXT-X-VERSION:3
#EXT-X-MEDIA-SEQUENCE:11785
#EXT-X-TARGETDURATION:11
#EXTINF:10.560,
cctv1_2md/1602814775_5190881.ts
#EXTINF:10.560,
cctv1_2md/1602814786_5190882.ts
#EXTINF:10.880,
cctv1_2md/1602814797_5190883.ts
#EXTINF:10.880,
cctv1_2md/1602814808_5190884.ts
#EXTINF:10.560,
cctv1_2md/1602814818_5190885.ts

下面这个是加密的m3u8文件

#EXTM3U
#EXT-X-VERSION:3
#EXT-X-TARGETDURATION:3
#EXT-X-PLAYLIST-TYPE:VOD
#EXT-X-MEDIA-SEQUENCE:0
#EXT-X-KEY:METHOD=AES-128,URI="https://hey07.cjkypo.com/20220223/MKPjICFW/1100kb/hls/key.key"
#EXTINF:2.5,
https://hey07.cjkypo.com/20220223/MKPjICFW/1100kb/hls/9QH3yPzu.ts
#EXTINF:1.667,
https://hey07.cjkypo.com/20220223/MKPjICFW/1100kb/hls/NuS3IonQ.ts
#EXTINF:2.383,
https://hey07.cjkypo.com/20220223/MKPjICFW/1100kb/hls/0qTxIM8x.ts

每个字段含义如下:

#EXTM3U //必需,表示一个扩展的m3u文件,并且必须在文件的第一行,所有的M3U8文件中必须包含这个标签。
#EXT-X-VERSION:3 //hls的协议版本号,暗示媒体流的兼容性,常见的是3(目前最高版本应该是7)。
#EXT-X-MEDIA-SEQUENCE:xx //M3U8直播是的直播切换序列,当播放打开M3U8时,以这个标签的值作为参考,播放对应的序列号的切片。
#EXT-X-ALLOW-CACHE:NO //是否缓存
#EXT-X-TARGETDURATION:5 //每个视频分段最大的时长(单位秒)
#EXT-X-DISCONTINUITY //表示换编码
#EXTINF:<duration> //EXTINF为M3U8列表中每一个分片的duration,如上面例子输出信息中的第一片的duration为10秒。在EXTINF标签中,除了duration值,还可以包含可选的描述信息,主要为标注切片信息,使用逗号分隔开。
#EXT-X-KEY:METHOD=AES-128,URI="http://****/key.key" //这个是提示时加密文件,key值就从后面的URI下载,METHOD是加密方式。

BANDWIDTH:BANDWIDTH的值为最高码率值,当播放EXT-X-STREAM-INF下对应的M3U8时占用的最大码率(必要参数)。

CODECS:CODECS的值用于声明EXT-X-STREAM-INF下面对应M3U8里面的音视频编码、视频编码的信息(可选参数)。

FRAME-RATE:子M3U8中的视频帧率(可选参数)。

特别说明下,偶尔才能遇见

#EXT-X-STREAM-INF:RESOLUTION=1920x1080,FRAME-RATE=30,CODECS="avc1.640028,mp4a.40.2"
https://xxx.com/index.m3u8
格式
#EXT-X-STREAM-INF:<attribute-list>
 <URI>

说明
#EXT-X-STREAM-INF:代表不同的播放流,
后面是属性列表,如上面的FRAME-RATE=30
下面一行是链接地址

关于客户端播放M3U8的标准还有更多的讲究,下面我们来介绍一些:

  1. 分片必须是动态改变的,序列不能相同,并且序列必须是增序的。
  2. 当M3U8没有出现EXT-X-ENDLIST标签时,无论这个M3U8列表中有多少分片,播放分片都是从倒数第三片开始播放,如果不满三片则不应该播放。当然如果有些播放器做了特别定制了,则可以不遵照这个原则。
  3. 以播放当前分片的duration时间刷新M3U8列表,然后做对应的加载动作。
  4. 前一片分片和后一片分片有不连续的时候,播放可能会出错,那么需要X-DISCONTINUTY标签来解决这个错误。
  5. 如果播放列表在刷新之后与之前的列表相同,那么在播放当前分片duration一半的时间内在刷新一次。
     

下面我们再说下,我们是怎么解析到需要下载的ts文件链接的

import threading
import requests
import time
from queue import Queue
import copy
# 取消ssl验证
import urllib3
urllib3.disable_warnings()

#超出连接数,所以设置强制连接数
requests.adapters.DEFAULT_RETRIES = 1
s = requests.session()
s.keep_alive = False


def parse_ts(data):
    try:
        data = str(data)
        finish_data = []
        for line in data.split('\\n'):
            if line.endswith('.ts'):
                finish_data.append(line)
            elif line.find('.ts?') >= 0:
                finish_data.append(line)
            else:
                print('*'*20+'\\n'+'解析错误,未解析到需要的ts文件,具体内容如下:'+line+'\\n'+'*'*20)
    except Exception as e:
        import traceback

        traceback.print_exc()
        print('*'*20+"报错" * 50+'*'*20)
    finally:
        return finish_data



if __name__ == '__main__':
    # 获取m3u8的url,根据url获取ts列表
    res = requests.get(base_url,verify = False)
    if res.status_code == 200:
        ts_list = parse_ts(res.text)
        print(ts_list)
    else:
        print("请求m3u8文件错误")

以上是关于m3u8文件格式讲解,Python解析m3u8文件,并获取在线地址的主要内容,如果未能解决你的问题,请参考以下文章

怎么下载m3u8格式视频?Python爬取A站m3u8格式视频案例讲解

如何解析youku的m3u8文件,拿到mp4文件?

Python3 根据m3u8下载视频,批量下载ts文件并且合并

学Python爬虫,不看看m3u8文件如何加密?i春秋 m3u8 文件加密解析

学Python爬虫,不看看m3u8文件如何加密?i春秋 m3u8 文件加密解析

利用 nodejs 解析 m3u8 格式文件,并下 ts 合并为 mp4