使用 Python PIL 的隐写算法

Posted

技术标签:

【中文标题】使用 Python PIL 的隐写算法【英文标题】:Steganography Algorithm using Python PIL 【发布时间】:2017-05-22 19:53:09 【问题描述】:

我正在尝试使用 Python PIL 为黑白图像编写基本的隐写算法。

使用示例图像,我可以成功提取其中的隐藏图像,并隐藏其他图像以随后提取它们。问题在于隐藏文本然后提取它。

代码如下:

from PIL import Image
import matplotlib.pyplot as plt
import scipy.misc as sci
import numpy as np
import array


#CONVERTS IMAGE TO ARRAY OF BINARY 8-BIT NUMBER#
def getImgArray(image):
    w,h = image.size
    out = []
    for x in range(w):
        for y in range(h):
            pixel = image.getpixel((y,x))
            pixel = format(pixel, '08b')
            out.append(pixel)
    return out

def stringByteConverter(data, mode):
    if (mode == "stringToByte"):
        aux = map(ord,data.encode('utf8'))
        aux = [format(char,'08b') for char in aux]
        return aux
    elif (mode == "byteToString"):
        aux = [int(item,2) for item in data]
        aux = "".join(map(chr, aux))
        return aux
    else:
        print("Invalid mode. Use 'stringToByte' or 'byteToString'")

#GETS HIDDEN IMAGE AND RETURNS IT AS BYTE ARRAY REPRESENTING PIXELS#
def getHiddenImage(image):
    buf = ""
    width,height = image.size
    img_aux = []
    for x in range(width):
        for y in range(height):
            if(len(buf)<8):
                pixel = image.getpixel((y,x))
                pixel = format(pixel,'08b')
                buf += pixel[-2:]
            else:
                img_aux.append(buf)
                buf = ""
                pixel = image.getpixel((y,x))
                pixel = format(pixel,'08b')
                buf += pixel[-2:]
    return img_aux

#CONVERT ARRAY OF BYTES TO PNG IMG AND RETURNS PIL IMG OBJECT#
def saveImgArr(ImgArr, size, outputName):
    pixels = np.empty(size)
    iterator = 0
    for i in range(size[0]):
        for j in range(size[1]):
            try:
                pixels[i][j] = int(ImgArr[iterator],2)
                iterator += 1
            except IndexError:
                break

    aux = Image.fromarray(pixels)
    aux = aux.convert("L")
    aux.save(outputName+'.png', 'PNG')
    return pixels

#HIDE IMAGE <src> IN OTHER IMAGE <img>#
def hideImg(src, img, output):
    iterator = 0
    src = src.convert("L")
    srcArr = getImgArray(src)
    imgArr = getImgArray(img)


    for i in range(len(srcArr)):
        buf = []
        buf.append(srcArr[i][:2])
        buf.append(srcArr[i][2:4])
        buf.append(srcArr[i][4:6])
        buf.append(srcArr[i][6:])
        for j in range(4):
            imgArr[iterator] = imgArr[iterator][:-2] + buf[j]
            iterator += 1
    saveImgArr(imgArr,img.size,output)


#HIDE STRING INSIDE IMG#
def hideText(img, string, outputName):
    imgArr = getImgArray(img)
    stringBytes = stringByteConverter(string, "stringToByte")
    iterator = 0
    for i in range(len(string)):
        buf = []
        buf.append(stringBytes[i][:2])
        buf.append(stringBytes[i][2:4])
        buf.append(stringBytes[i][4:6])
        buf.append(stringBytes[i][6:])
        for j in range(4):
            imgArr[iterator] = imgArr[iterator][:-2] + '00'
            imgArr[iterator] = imgArr[iterator][:-2] + buf[j]
            iterator += 1

    print(imgArr[:len(string)*4]) #test print

    saveImgArr(imgArr,img.size,outputName) 

    temp = Image.open(outputName+'.png')
    tempArr = getImgArray(temp)

    print(tempArr[:len(string)*4]) #test print

def getHiddenText(img, msgSize):
    buf = ''
    width,height = img.size
    output = []
    counter = 0
    for x in range(width):
        for y in range(height):
                if(counter < msgSize*4):
                    pixel = img.getpixel((y,x))
                    pixel = format(pixel,'08b')
                    buf += pixel[-2:]
                    counter += 1

    output = stringByteConverter(buf, "byteToString")
    return output

通过在 hideText() 函数中打印数据数组,我能够获得以下信息:

hideText(lena,'test',"lena_hidden_text")

['10100001', '10100011', '10100001', '10100000', '10100001', '10011110', '10100001', '10100001', '10100101', '10100011', '10100000', '10011111', '10011001', '10100011', '10011101', '10011000']

['10011110', '10100000', '10011110', '10011101', '10011110', '10011011', '10011110', '10011110', '10100011', '10100000', '10011101', '10011100', '10010101', '10100000', '10011001', '10010100']

通过 hideText() 调用获得的第一个向量与它应有的完全一样,但是在使用 saveImgArr() 保存图像并使用 getImgArr() 重新加载后,返回第二个向量并且完全不同。

我一辈子都找不到问题所在。这很奇怪,因为使用图像提取隐藏数据或隐藏数据,这两个功能都可以完美运行。

我只能猜测我以某种方式错误地处理了文本字节。任何见解将不胜感激。

【问题讨论】:

【参考方案1】:

saveImgArr 中有一点看起来可疑:

aux = Image.fromarray(pixels)
aux = aux.convert("L")

Image.fromarray 要使用的默认mode 是从输入的数据类型推导出来的。

在您的情况下,输入的数据类型是 numpy 的默认数据类型(浮点数),因此图像将基于浮点数构造。因此,我预测保存的 png 图像看起来不正确(只是一个空白图像,因为每个像素都会饱和到 1.0)。

要更正此问题,您可以向 numpy 提供正确的数据类型,即更改:

 pixels = np.empty(size)

 pixels = np.empty(size,dtype='uint8')

或通过更改显式向 Image.fromarray 提供模式:

aux = Image.fromarray(pixels)
aux = aux.convert("L")

aux = Image.fromarray(pixels,mode='L')

【讨论】:

就是这样。现在的输出是完美的: ['10100001', '10100011', '10100001', '10100000', '10100001', '10011110', '10100001', '10100001', '10100101', '10100010', ', '10011111', '10011001', '10100011', '10011101', '10011000'] -------------------- ['10100001', '10100011' , '10100001', '10100000', '10100001', '10011110', '10100001', '10100001', '10100101', '10100011', '10100000', '100101111', '1010', '1010' 10011101', '10011000']

以上是关于使用 Python PIL 的隐写算法的主要内容,如果未能解决你的问题,请参考以下文章

Python 中的隐写术 - Stepic

Python-LSB隐写算法

PDF文件中的隐写术[关闭]

C中的隐写术

在 PHP 中阻止图像主机的隐写术?

base64stego 还不懂base64的隐写,详解15行代码带你领略