base64stego 还不懂base64的隐写，详解15行代码带你领略

Posted 2021-05-18 Dba_sys

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了base64stego 还不懂base64的隐写，详解15行代码带你领略相关的知识，希望对你有一定的参考价值。

网上写了好多关于xctf MISC新手篇的base64Stego隐写的教程，但大都不太清楚，基本上都是讲了一段隐写原理，直接上代码了。但是代码是这道题的关键，代码讲了如何解码这个隐写的完整流程，这次我以一个python的源码的解释，完美解决这道题。
可能会花费你很长时间，大约一天半天，但是我们要有信心，恒心！

base64 隐写原理 + 破解隐写的代码

仔细看！！！！！！！
Tr0y\'s Blog baseStego
存在隐写的编码末尾都存在 = ，一个 = 隐写 2bit
隐写的编码，解码后，再编码，最后挨着 = 的字符会发生变化。

史上最完全的源码解析

真小白级此题的隐写解码的python解析,

代码分析

# -*- coding: utf-8 -*-
import base64
b64chars = \'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/\'
with open(\'stego.txt\', \'rb\') as f:
    bin_str = \'\'
    for line in f.readlines():
        stegb64 = str(line, "utf-8").strip("\\n")
        rowb64 =  str(base64.b64encode(base64.b64decode(stegb64)), "utf-8").strip("\\n")
        offset = abs(b64chars.index(stegb64.replace(\'=\',\'\')[-1])-b64chars.index(rowb64.replace(\'=\',\'\')[-1]))
        equalnum = stegb64.count(\'=\') #no equalnum no offset
        if equalnum:
            bin_str += bin(offset)[2:].zfill(equalnum * 2)
        print(\'\'.join([chr(int(bin_str[i:i + 8], 2)) for i in range(0, len(bin_str), 8)]))

1 python 3.8.无法保存

# -*- coding: utf-8 -*-

在 python 3.8 IDE编写的程序文件无法保存，也就无法运行，加上这一行就可以了保存了。

2 这一行为后面求隐写数据提供了标尺，后面再解释

b64chars = \'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/\'

3 python 文件读写

with open(\'1.txt\', \'rb\') as f:

python提供的打开文件的方法，不需要关闭文件，即不需要写 f.close() ,但要注意文件操作的代码都写到 f:下面，有格式要求，有缩进。
注意stego.txt要和脚本放到同一目录下。
"r" - 读取 - 默认值。打开文件进行读取，如果文件不存在则报错。
"b" - 二进制 - 二进制模式（例如图像）。
以二进制读入文件数据，也可以直接读入文本数据。
w3school 文件读写
 博主有梦就要去实现它 with open() as f:

4 隐写数据二进制字符串

bin_str = \'\'

用来存储，隐藏的字符flag, 在后面所有求的的隐写二进制数据都将追加到 bin_str 的尾部

5 readlines()

for line in f.readlines():

可以使用 readline() 方法返回一行：
循环读入文件，每次读取一行，下面就是对每一次读入的二进制数据的一些操作。

6 strip("\\n")

stegb64 = str(line, "utf-8").strip("\\n")  //将读入的二进制串编成文本串，此时和stego.txt中的base64串一样，去除了\\n换行符 假！
rowb64 =  str(base64.b64encode(base64.b64decode(stegb64)), "utf-8").strip("\\n")  //解码后的又编码的base64串，即原来的base64 真！

可以理解为 utf-8的英文字符和 ASCII的英文字符　编码是一致的。　在任何一种编码格式中　0-127所代表的字符都是一样的
在base64隐写中，如果存在隐写的数据，隐写数据后的base64 和没有隐写数据的base64 在最后一个字符会发生变化，即=后面
一个 = 隐藏 2bit数据。集齐8bit,就可以拼出一个字符串

eg.隐写
stegb64 = IHdyaXRpbmcgaGlkZGVuIG1lc3NhZ2VzIGluIHN1Y2ggYSB3YXkgdGhhdCBubyBvbmV=
rowb64 = IHdyaXRpbmcgaGlkZGVuIG1lc3NhZ2VzIGluIHN1Y2ggYSB3YXkgdGhhdCBubyBvbmU=
这里隐写了数据 \'01\'
特别！如果没有变化，也算是一种隐写 ==->\'0000\' =->\'00\' 这个可能根据不同的隐藏方法有关。我也可以定义只有不同的
eg.strip()
a=" gho stwwl\\n"
a.strip("\\n") = \' gho stwwl\'
去掉一行首部和尾部的换行符，若要去一边的话还有 rstrip() lstrip()

7 offset 偏离(数字类型)

offset = abs(b64chars.index(stegb64.replace(\'=\',\'\')[-1])-b64chars.index(rowb64.replace(\'=\',\'\')[-1]))

abs() 返回绝对值 V的位置 - U的位置
stegb64.replace(\'=\',\'\')[-1] 去掉末尾的\'=\' 并且返回它的最后一个字符 V
rowb64.replace(\'=\',\'\')[-1] 去掉末尾的\'=\' 并且返回它的最后一个字符 U
index() 返回这个字符在 b64chars 中的位置

8 计算 \'=\' 的数量

equalnum = stegb64.count(\'=\') #no equalnum no offset
if equalnum:
            bin_str += bin(offset)[2:].zfill(equalnum * 2)

如果存在等号表示隐藏了数据，我们把隐藏的数据转换成二进制存到 bin_str 中以追加的方式

bin(x) 返回一个整数 int 或者长整数 long int 的二进制表示。
bin(1)=\'0b1\' 上面的例子就是这个(U V)
bin(2)=\'0b10\'
bin(4)=\'0b100\'
因为返回的字符串都有 \'0b\' 但我们只要二进制数据
[2:] 从 \'0b\' 之后截取我们取到\'1\'
但是这个隐写了 2bit 所以用到了 zfill()
.zfill(equalnum * 2) 方法返回指定长度的字符串，原字符串右对齐，前面填充0。
str = \'1\'
str.zfill(2) = \'01\'
str.zfill(4) = \'0001\'

经过这次的转换我们求解了 \'01\' 的隐藏数据

经过几个循环

IHdyaXRpbmcgaGlkZGVuIG1lc3NhZ2VzIGluIHN1Y2ggYSB3YXkgdGhhdCBubyBvbmV= \'01\'
LCBhcGFydCBmcm9tIHRoZSBzZW5kZXIgYW5kIGludGVuZGVkIHJlY2lwaWVudCwgc3VzcGU= \'00\'
Y3RzIHRoZSBleGlzdGVuY2Ugb2YgdGhlIG1lc3M= \'00\'
YWdlLCBhIGZvcm0gb2Ygc2VjdXJpdHkgdGhyb3VnaCBvYnNjdXJpdHkuIFS= \'11\'

我们得到了 B 0100 0011 这是码ascii

输出

print(\'\'.join([chr(int(bin_str[i:i + 8], 2)) for i in range(0, len(bin_str), 8)]))

int() 函数用于将一个字符串或数字转换为整型。
int(x, base=10)
x -- 字符串或数字。
base -- 进制数，默认十进制。
join()

Python join() 方法用于将序列中的元素以指定的字符连接生成一个新的字符串。
str.join(sequence)
sequence -- 要连接的元素序列。

str = "-";
seq = ("a", "b", "c"); # 字符串序列
print str.join( seq );
结果： a-b-c

[.. for in range(10)]
方括号中循环的用法

为了匹配 sequence 生成一个字符列表以便用于 join();

最后，这些解码的字符就连接到一起了。

动手写一遍吧

以上是关于base64stego 还不懂base64的隐写，详解15行代码带你领略的主要内容，如果未能解决你的问题，请参考以下文章

记一道CTF隐写题解答过程

记XDCTF的misc之旅---base64隐写

ctf 常用python脚本及在线网站

bugku-writeup-MISC-隐写2