将二进制转换为 ASCII,反之亦然

Posted

技术标签:

【中文标题】将二进制转换为 ASCII,反之亦然【英文标题】:Convert binary to ASCII and vice versa 【发布时间】:2011-11-15 20:18:58 【问题描述】:

使用此代码获取字符串并将其转换为二进制:

bin(reduce(lambda x, y: 256*x+y, (ord(c) for c in 'hello'), 0))

这个输出:

0b110100001100101011011000110110001101111

如果我将它放入this site(在右侧网站上),我会收到hello 的消息。我想知道它使用什么方法。我知道我可以将二进制字符串拼接成 8 个,然后将其与 bin(ord(character)) 或其他方式的相应值匹配。真的在寻找更简单的东西。

【问题讨论】:

你的问题是,“有没有比显而易见的方法更简洁的方法来逆向我的代码”? 相关:b2a_bin extension in Cython 允许直接从字节字符串创建二进制字符串 ("01"),而无需创建中间 Python 整数。 【参考方案1】:

对于 Python 2 上 [ -~] 范围内的 ASCII 字符:

>>> import binascii
>>> bin(int(binascii.hexlify('hello'), 16))
'0b110100001100101011011000110110001101111'

反过来:

>>> n = int('0b110100001100101011011000110110001101111', 2)
>>> binascii.unhexlify('%x' % n)
'hello'

在 Python 3.2+ 中:

>>> bin(int.from_bytes('hello'.encode(), 'big'))
'0b110100001100101011011000110110001101111'

反过来:

>>> n = int('0b110100001100101011011000110110001101111', 2)
>>> n.to_bytes((n.bit_length() + 7) // 8, 'big').decode()
'hello'

支持 Python 3 中的所有 Unicode 字符:

def text_to_bits(text, encoding='utf-8', errors='surrogatepass'):
    bits = bin(int.from_bytes(text.encode(encoding, errors), 'big'))[2:]
    return bits.zfill(8 * ((len(bits) + 7) // 8))

def text_from_bits(bits, encoding='utf-8', errors='surrogatepass'):
    n = int(bits, 2)
    return n.to_bytes((n.bit_length() + 7) // 8, 'big').decode(encoding, errors) or '\0'

这里是单源 Python 2/3 兼容版本:

import binascii

def text_to_bits(text, encoding='utf-8', errors='surrogatepass'):
    bits = bin(int(binascii.hexlify(text.encode(encoding, errors)), 16))[2:]
    return bits.zfill(8 * ((len(bits) + 7) // 8))

def text_from_bits(bits, encoding='utf-8', errors='surrogatepass'):
    n = int(bits, 2)
    return int2bytes(n).decode(encoding, errors)

def int2bytes(i):
    hex_string = '%x' % i
    n = len(hex_string)
    return binascii.unhexlify(hex_string.zfill(n + (n & 1)))

示例

>>> text_to_bits('hello')
'0110100001100101011011000110110001101111'
>>> text_from_bits('110100001100101011011000110110001101111') == u'hello'
True

【讨论】:

@J.F.Sebastian 我用python当前版本尝试了这个方法,似乎它不起作用。 TypeError: 'str' does not support the buffer interface 你会更新你的答案吗 @hamza:它适用于 Python 2。在 Python 3 上,您应该首先将 str 转换为字节,例如 your_string.encode('ascii', 'strict') @J.F.Sebasitian:谢谢,但是当我尝试反之时,unhexlify 函数返回错误消息:binascii.Error: Odd-length string。 @hamza:如果十六进制字符串的长度不均匀,则在其前面加上'0'。如果原始字符串中的第一个字符的 ascii 代码小于 16,例如 '\n''\t',就会发生这种情况。 ascii 字母 [ -~] 永远不会出现奇数长度。【参考方案2】:

内置python

这里是简单字符串的纯python方法,留给后人。

def string2bits(s=''):
    return [bin(ord(x))[2:].zfill(8) for x in s]

def bits2string(b=None):
    return ''.join([chr(int(x, 2)) for x in b])

s = 'Hello, World!'
b = string2bits(s)
s2 = bits2string(b)

print 'String:'
print s

print '\nList of Bits:'
for x in b:
    print x

print '\nString:'
print s2

String:
Hello, World!

List of Bits:
01001000
01100101
01101100
01101100
01101111
00101100
00100000
01010111
01101111
01110010
01101100
01100100
00100001

String:
Hello, World!

【讨论】:

【参考方案3】:

我不确定你认为除了逐个字符之外你还能如何做到这一点——它本质上是一个逐个字符的操作。肯定有代码可以为您执行此操作,但没有比逐个字符执行此操作更“简单”的方法了。

首先,您需要去掉0b 前缀,然后用左零填充字符串,使其长度可以被 8 整除,这样可以轻松地将位串分成字符:

bitstring = bitstring[2:]
bitstring = -len(bitstring) % 8 * '0' + bitstring

然后将字符串分成八个二进制数字块,将它们转换为 ASCII 字符,然后将它们连接回字符串:

string_blocks = (bitstring[i:i+8] for i in range(0, len(bitstring), 8))
string = ''.join(chr(int(char, 2)) for char in string_blocks)

如果你真的想把它当作一个数字,你仍然必须考虑这样一个事实,如果你想从左到右而不是从右到左,最左边的字符最多有七位数字.

【讨论】:

【参考方案4】:

这是我解决你的任务的方法:

str = "0b110100001100101011011000110110001101111"
str = "0" + str[2:]
message = ""
while str != "":
    i = chr(int(str[:8], 2))
    message = message + i
    str = str[8:]
print message

【讨论】:

为什么要在 str = "0" + str[2:] 处添加 '0' ? 0b 需要在这里删除,因为它是开始的。【参考方案5】:

如果你不想导入任何文件,你可以使用这个:

with open("Test1.txt", "r") as File1:
St = (' '.join(format(ord(x), 'b') for x in File1.read()))
StrList = St.split(" ")

将文本文件转换为二进制文件。

你可以用它把它转换回字符串:

StrOrgList = StrOrgMsg.split(" ")


for StrValue in StrOrgList:
    if(StrValue != ""):
        StrMsg += chr(int(str(StrValue),2))
print(StrMsg)

希望对您有所帮助,我已将其与一些自定义加密一起用于通过 TCP 发送。

【讨论】:

【参考方案6】:

您是在寻找执行此操作的代码还是了解算法?

Does this do what you need?特别是a2b_uub2a_uu?那里还有很多其他选项,以防那些不是您想要的。

(注意:不是 Python 人,但这似乎是一个显而易见的答案)

【讨论】:

我一直在研究它,binascii 不适合我,主要是在寻找代码,如果我能看到它我能理解它。尽管感谢编辑:当使用 binascii a2b_uu 将 ascii 转换为二进制时,“h”是 \x00\x00\x00\x00\x00\x00\x00\x00 这不是我需要的,我需要 'hello' 和实际的 1 和 0不是看起来像 ascii 的 shellcode,它也只能按 char 工作 char @Jaxidian 这对我的目的很有帮助。有人将一些数据存储在一个字符串中,我拥有它。我很确定这是填充的 64 二进制 b/c。我可以在上面成功使用b2a_base64,但结果确实令人困惑。如何从那里获取布尔值/整数 (0,1) 列表?【参考方案7】:

将二进制转换为其等效字符。

k=7
dec=0
new=[]
item=[x for x in input("Enter 8bit binary number with , seprator").split(",")]
for i in item:
    for j in i:
        if(j=="1"):
            dec=2**k+dec
            k=k-1
        else:
            k=k-1
    new.append(dec)
    dec=0
    k=7
print(new)
for i in new:
    print(chr(i),end="")

【讨论】:

【参考方案8】:

这是 J.F. Sebastian 的经过修饰的版本。感谢 J.F. Sebastian 的 sn-ps。

import binascii, sys
def goodbye():
    sys.exit("\n"+"*"*43+"\n\nGood Bye! Come use again!\n\n"+"*"*43+"")
while __name__=='__main__':
    print "[A]scii to Binary, [B]inary to Ascii, or [E]xit:"
    var1=raw_input('>>> ')
    if var1=='a':
        string=raw_input('String to convert:\n>>> ')
        convert=bin(int(binascii.hexlify(string), 16))
        i=2
        truebin=[]
        while i!=len(convert):
            truebin.append(convert[i])
            i=i+1
        convert=''.join(truebin)
        print '\n'+'*'*84+'\n\n'+convert+'\n\n'+'*'*84+'\n'
    if var1=='b':
        binary=raw_input('Binary to convert:\n>>> ')
        n = int(binary, 2)
        done=binascii.unhexlify('%x' % n)
        print '\n'+'*'*84+'\n\n'+done+'\n\n'+'*'*84+'\n'
    if var1=='e':
        aus=raw_input('Are you sure? (y/n)\n>>> ')
        if aus=='y':
            goodbye()

【讨论】:

以上是关于将二进制转换为 ASCII,反之亦然的主要内容,如果未能解决你的问题,请参考以下文章

将ASCII TEXT转换为二进制

Perl程序将二进制转换为ascii

在LINUX 系统下如何将二进制转换成ASCII码?

十进制转换了ASCII怎么转换

十进制ASCII码的转换!

C ++将字符串转换为十六进制,反之亦然