将二进制转换为 ASCII,反之亦然
Posted
技术标签:
【中文标题】将二进制转换为 ASCII,反之亦然【英文标题】:Convert binary to ASCII and vice versa 【发布时间】:2011-11-15 20:18:58 【问题描述】:使用此代码获取字符串并将其转换为二进制:
bin(reduce(lambda x, y: 256*x+y, (ord(c) for c in 'hello'), 0))
这个输出:
0b110100001100101011011000110110001101111
如果我将它放入this site(在右侧网站上),我会收到hello
的消息。我想知道它使用什么方法。我知道我可以将二进制字符串拼接成 8 个,然后将其与 bin(ord(character))
或其他方式的相应值匹配。真的在寻找更简单的东西。
【问题讨论】:
你的问题是,“有没有比显而易见的方法更简洁的方法来逆向我的代码”? 相关:b2a_bin
extension in Cython 允许直接从字节字符串创建二进制字符串 ("01"
),而无需创建中间 Python 整数。
【参考方案1】:
对于 Python 2 上 [ -~]
范围内的 ASCII 字符:
>>> import binascii
>>> bin(int(binascii.hexlify('hello'), 16))
'0b110100001100101011011000110110001101111'
反过来:
>>> n = int('0b110100001100101011011000110110001101111', 2)
>>> binascii.unhexlify('%x' % n)
'hello'
在 Python 3.2+ 中:
>>> bin(int.from_bytes('hello'.encode(), 'big'))
'0b110100001100101011011000110110001101111'
反过来:
>>> n = int('0b110100001100101011011000110110001101111', 2)
>>> n.to_bytes((n.bit_length() + 7) // 8, 'big').decode()
'hello'
支持 Python 3 中的所有 Unicode 字符:
def text_to_bits(text, encoding='utf-8', errors='surrogatepass'):
bits = bin(int.from_bytes(text.encode(encoding, errors), 'big'))[2:]
return bits.zfill(8 * ((len(bits) + 7) // 8))
def text_from_bits(bits, encoding='utf-8', errors='surrogatepass'):
n = int(bits, 2)
return n.to_bytes((n.bit_length() + 7) // 8, 'big').decode(encoding, errors) or '\0'
这里是单源 Python 2/3 兼容版本:
import binascii
def text_to_bits(text, encoding='utf-8', errors='surrogatepass'):
bits = bin(int(binascii.hexlify(text.encode(encoding, errors)), 16))[2:]
return bits.zfill(8 * ((len(bits) + 7) // 8))
def text_from_bits(bits, encoding='utf-8', errors='surrogatepass'):
n = int(bits, 2)
return int2bytes(n).decode(encoding, errors)
def int2bytes(i):
hex_string = '%x' % i
n = len(hex_string)
return binascii.unhexlify(hex_string.zfill(n + (n & 1)))
示例
>>> text_to_bits('hello')
'0110100001100101011011000110110001101111'
>>> text_from_bits('110100001100101011011000110110001101111') == u'hello'
True
【讨论】:
@J.F.Sebastian 我用python当前版本尝试了这个方法,似乎它不起作用。 TypeError: 'str' does not support the buffer interface 你会更新你的答案吗 @hamza:它适用于 Python 2。在 Python 3 上,您应该首先将 str 转换为字节,例如your_string.encode('ascii', 'strict')
@J.F.Sebasitian:谢谢,但是当我尝试反之时,unhexlify 函数返回错误消息:binascii.Error: Odd-length string。
@hamza:如果十六进制字符串的长度不均匀,则在其前面加上'0'
。如果原始字符串中的第一个字符的 ascii 代码小于 16,例如 '\n'
或 '\t'
,就会发生这种情况。 ascii 字母 [ -~]
永远不会出现奇数长度。【参考方案2】:
内置仅python
这里是简单字符串的纯python方法,留给后人。
def string2bits(s=''):
return [bin(ord(x))[2:].zfill(8) for x in s]
def bits2string(b=None):
return ''.join([chr(int(x, 2)) for x in b])
s = 'Hello, World!'
b = string2bits(s)
s2 = bits2string(b)
print 'String:'
print s
print '\nList of Bits:'
for x in b:
print x
print '\nString:'
print s2
String:
Hello, World!
List of Bits:
01001000
01100101
01101100
01101100
01101111
00101100
00100000
01010111
01101111
01110010
01101100
01100100
00100001
String:
Hello, World!
【讨论】:
【参考方案3】:我不确定你认为除了逐个字符之外你还能如何做到这一点——它本质上是一个逐个字符的操作。肯定有代码可以为您执行此操作,但没有比逐个字符执行此操作更“简单”的方法了。
首先,您需要去掉0b
前缀,然后用左零填充字符串,使其长度可以被 8 整除,这样可以轻松地将位串分成字符:
bitstring = bitstring[2:]
bitstring = -len(bitstring) % 8 * '0' + bitstring
然后将字符串分成八个二进制数字块,将它们转换为 ASCII 字符,然后将它们连接回字符串:
string_blocks = (bitstring[i:i+8] for i in range(0, len(bitstring), 8))
string = ''.join(chr(int(char, 2)) for char in string_blocks)
如果你真的想把它当作一个数字,你仍然必须考虑这样一个事实,如果你想从左到右而不是从右到左,最左边的字符最多有七位数字.
【讨论】:
【参考方案4】:这是我解决你的任务的方法:
str = "0b110100001100101011011000110110001101111"
str = "0" + str[2:]
message = ""
while str != "":
i = chr(int(str[:8], 2))
message = message + i
str = str[8:]
print message
【讨论】:
为什么要在 str = "0" + str[2:] 处添加 '0' ? 0b 需要在这里删除,因为它是开始的。【参考方案5】:如果你不想导入任何文件,你可以使用这个:
with open("Test1.txt", "r") as File1:
St = (' '.join(format(ord(x), 'b') for x in File1.read()))
StrList = St.split(" ")
将文本文件转换为二进制文件。
你可以用它把它转换回字符串:
StrOrgList = StrOrgMsg.split(" ")
for StrValue in StrOrgList:
if(StrValue != ""):
StrMsg += chr(int(str(StrValue),2))
print(StrMsg)
希望对您有所帮助,我已将其与一些自定义加密一起用于通过 TCP 发送。
【讨论】:
【参考方案6】:您是在寻找执行此操作的代码还是了解算法?
Does this do what you need?特别是a2b_uu
和b2a_uu
?那里还有很多其他选项,以防那些不是您想要的。
(注意:不是 Python 人,但这似乎是一个显而易见的答案)
【讨论】:
我一直在研究它,binascii 不适合我,主要是在寻找代码,如果我能看到它我能理解它。尽管感谢编辑:当使用 binascii a2b_uu 将 ascii 转换为二进制时,“h”是 \x00\x00\x00\x00\x00\x00\x00\x00 这不是我需要的,我需要 'hello' 和实际的 1 和 0不是看起来像 ascii 的 shellcode,它也只能按 char 工作 char @Jaxidian 这对我的目的很有帮助。有人将一些数据存储在一个字符串中,我拥有它。我很确定这是填充的 64 二进制 b/c。我可以在上面成功使用b2a_base64
,但结果确实令人困惑。如何从那里获取布尔值/整数 (0,1) 列表?【参考方案7】:
将二进制转换为其等效字符。
k=7
dec=0
new=[]
item=[x for x in input("Enter 8bit binary number with , seprator").split(",")]
for i in item:
for j in i:
if(j=="1"):
dec=2**k+dec
k=k-1
else:
k=k-1
new.append(dec)
dec=0
k=7
print(new)
for i in new:
print(chr(i),end="")
【讨论】:
【参考方案8】:这是 J.F. Sebastian 的经过修饰的版本。感谢 J.F. Sebastian 的 sn-ps。
import binascii, sys
def goodbye():
sys.exit("\n"+"*"*43+"\n\nGood Bye! Come use again!\n\n"+"*"*43+"")
while __name__=='__main__':
print "[A]scii to Binary, [B]inary to Ascii, or [E]xit:"
var1=raw_input('>>> ')
if var1=='a':
string=raw_input('String to convert:\n>>> ')
convert=bin(int(binascii.hexlify(string), 16))
i=2
truebin=[]
while i!=len(convert):
truebin.append(convert[i])
i=i+1
convert=''.join(truebin)
print '\n'+'*'*84+'\n\n'+convert+'\n\n'+'*'*84+'\n'
if var1=='b':
binary=raw_input('Binary to convert:\n>>> ')
n = int(binary, 2)
done=binascii.unhexlify('%x' % n)
print '\n'+'*'*84+'\n\n'+done+'\n\n'+'*'*84+'\n'
if var1=='e':
aus=raw_input('Are you sure? (y/n)\n>>> ')
if aus=='y':
goodbye()
【讨论】:
以上是关于将二进制转换为 ASCII,反之亦然的主要内容,如果未能解决你的问题,请参考以下文章