python中,把‘&#’ ‘&#x开头的字符串转换成中文

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python中,把‘&#’ ‘&#x开头的字符串转换成中文相关的知识,希望对你有一定的参考价值。

参考技术A (一)

爬虫时经常遇到'/u'开头的unicode编码的字符串,这时通过decode()来解决.

但偶尔也会遇到以‘&#’ 或者‘&#x’开头的字符串, 这是html、XML 等 SGML 类语言的转义序列(escape sequence)。它们不是「编码」。

如果以‘&#‘ 开头,后接十进制数字,

如果以‘&#x’开头,后接十六进制数字。

在python中的解决方法是:

importhtml

a ='外观'

print(html.unescape(a))

# 输出:外观

希望对你有用

(二)

Python中escape和unescape

Python处理HTML转义字符

在抓网页数据经常遇到例如>或者 这种HTML转义符,抓到字符串里很是烦人。

比方说一个从网页中抓到的字符串

p ='<abc>'

用Python可以这样处理:

import html

p ='<abc>'txt= html.unescape(p)print(txt)

#这样就得到了txt= ''

如果还想转回去,可以这样:

import cgi

q = cgi.escape(html)print(q)

       #这样又回到了 html = '<abc>'

OpenCV|图片与视频的相互转换(C++&Python)

前言

在学习opencv的过程中,终会遇到需要把视频转换成图片处理,或者把处理后的图片保存为视频格式的时候。这篇文章中就来看一下如何进行图片和视频之间的相互转换。

视频转图片

对于这种情况大家应该很熟悉了。因为学习opencv的时候肯定打开过摄像头,比如打开摄像头检测个人脸或者笑脸之类的。在这个过程中,实际就是把摄像头拍摄到的视频转换为一帧一帧的图片连续地进行处理。

我们知道,对于打开视频和摄像头,opencv提供了VideoCapture类,可以方便地通过流操作符>>与Mat类进行交互。这种情况比较常见,我们直接看例子。

#include<opencv2\\opencv.hpp>
using namespace cv;

int main()

    //打开默认摄像头
    VideoCapture cap(0); 
    if (!cap.isOpened())
    
        return -1;
    

    Mat frame;

    // 按Q键退出时,键盘需要调为英文模式
    while(waitKey(30) != 'q')
    
        // 通过流操作符把视频转化为一帧帧图片
        cap >> frame;
        // Do something here !
        imshow("video", frame);
    
    return 0;

如果是要打开视频文件而不是摄像头,只需要像下面这样:

VideoCapture cap("E:\\\\我的视频\\\\视频.mp4");

而视频转成图片也就是那么简单的一句cap >> frame;

图片转视频

视频转图片只需要流操作符简单的一句代码就能实现,那么图片转视频呢?是不是也是这么简单?

答案是肯定的。也是只需要用一句这么简单的代码,而且只需要把流操作符的方向反过来就行了。这时候用到的就是opencv提供的VideoWriter类。VideoCapture和VideoWriter,顾名思义,他俩一个是抓取视频的,一个是写入视频的。

VideoWriter构造函数如下所示:

VideoWriter(const string& filename, int fourcc, double fps, Size frameSize, bool isColor=true)

各参数含义如下:

  • filename: 输出视频文件的名称
  • fourcc:4-character code of codec的缩写,四个字符用来表示压缩帧的编解码。
  • fps:帧率,我猜是frame per second的缩写。
  • frameSize:每帧图片的大小
  • isColor: 如果非零,编码器将希望得到彩色帧并进行编码;否则,是灰度帧(只有在Windows下支持这个标志)

第二个参数,OpenCV提供的格式是未经过压缩的,目前支持的格式如下:

CV_FOURCC(‘P’, ‘I’, ‘M’, ‘1’) = MPEG-1 codec

CV_FOURCC(‘M’, ‘J’, ‘P’, ‘G’) = motion-jpeg codec

CV_FOURCC(‘M’, ‘P’, ‘4’, ‘2’) = MPEG-4.2 codec

CV_FOURCC(‘D’, ‘I’, ‘V’, ‘3’) = MPEG-4.3 codec

CV_FOURCC(‘D’, ‘I’, ‘V’, ‘X’) = MPEG-4 codec

CV_FOURCC(‘U’, ‘2’, ‘6’, ‘3’) = H263 codec

CV_FOURCC(‘I’, ‘2’, ‘6’, ‘3’) = H263I codec

CV_FOURCC(‘F’, ‘L’, ‘V’, ‘1’) = FLV1 codec

还是用一个例子来看:

#include<opencv2\\opencv.hpp>
#include<iostream>

using namespace std;
using namespace cv;

int main()

    // 构造一个VideoWriter
    VideoWriter video("test.avi", CV_FOURCC('M', 'J', 'P', 'G'), 25.0, Size(640, 480));
    // 从一个文件夹下读取多张jpg图片
    String pattern = "G:\\\\temp_picture\\\\*.jpg";
    vector<String> fn;

    glob(pattern, fn, false);

    size_t count = fn.size();
    for (size_t i = 0; i < count; i++)
    
        Mat image = imread(fn[i]);
        // 这个大小与VideoWriter构造函数中的大小一致。
        resize(image, image, Size(640, 480));
        // 流操作符,把图片传入视频
        video << image;
    
    cout << "处理完毕!" << endl;
    // 处理完之后会在得到一个名为test.avi的视频文件。

Python代码

最后还是给出Python版本的示例代码:

视频转图片

import cv2
import numpy 

cap = cv2.VideoCapture(0)

while cv2.waitKey(30)!=ord('q'):
    retval, image = cap.read()
    cv2.imshow("video",image)
cap.release()

图片转视频

# encoding: UTF-8
import glob as gb
import cv2

img_path = gb.glob("G:\\\\temp_picture\\\\*.jpg") 
videoWriter = cv2.VideoWriter('test.mp4', cv2.VideoWriter_fourcc(*'MJPG'), 25, (640,480))

for path in img_path:
    img  = cv2.imread(path) 
    img = cv2.resize(img,(640,480))
    videoWriter.write(img)

额,虽然Python代码没加注释,但是好像还是理解了什么叫人生苦短,我用Python

另外

发现一个有意思的东西,小密圈。据说可能是最好的微信公众号读者论坛。也尝试一下,名字就叫OpenCV实践之路。出了平时发文章之外,也会发一些我平时的参考资料,欢迎加入。

以上是关于python中,把‘&#’ ‘&#x开头的字符串转换成中文的主要内容,如果未能解决你的问题,请参考以下文章

python 把if 写在一行的两种方式

python.day.04——常用数据类型:str&List

OpenCV|图片与视频的相互转换(C++&Python)

python_字符编码&格式化

python 函数&条件,循环

Python常用模块——time&datetime模块