将十六进制字符串转换为字节数组
Posted
技术标签:
【中文标题】将十六进制字符串转换为字节数组【英文标题】:Converting a hex string to a byte array 【发布时间】:2013-06-20 03:39:38 【问题描述】:转换可变长度十六进制字符串的最佳方法是什么? "01A1"
到包含该数据的字节数组。
即转换:
std::string = "01A1";
进入这个
char* hexArray;
int hexLength;
或者这个
std::vector<char> hexArray;
这样当我将其写入文件和hexdump -C
时,我会得到包含01A1
的二进制数据。
【问题讨论】:
@alexvii 这不是这个问题的答案。 您可以将 std::streams 设置为十六进制模式,以读取和写入十六进制格式的数字 @makulik 我确实尝试使用流和 std::hex 但无法正常工作。你能给我举个例子吗?谢谢。 我认为不需要任何 ascii 推导,只需使用 c api 转换为 char 数组,除非我有问题。我在***.com/a/17273020/986760下面的ans中指出了api。 根据您对另一个答案的评论,我认为您需要在您的问题中添加当输入为奇数个字符时会发生什么。缺少的 0 应该添加到字符串的开头还是结尾? 【参考方案1】:这应该可以工作:
int char2int(char input)
if(input >= '0' && input <= '9')
return input - '0';
if(input >= 'A' && input <= 'F')
return input - 'A' + 10;
if(input >= 'a' && input <= 'f')
return input - 'a' + 10;
throw std::invalid_argument("Invalid input string");
// This function assumes src to be a zero terminated sanitized string with
// an even number of [0-9a-f] characters, and target to be sufficiently large
void hex2bin(const char* src, char* target)
while(*src && src[1])
*(target++) = char2int(*src)*16 + char2int(src[1]);
src += 2;
根据您的特定平台,可能还有一个标准实现。
【讨论】:
虽然这似乎可行(无法在 atm 试用),但是否有更标准的方法? 我不确定,原来的字符串有相同的元素,为什么我们需要转换为ascii来获得数值等价物? @fayyazkl 你误解了这个问题 - 这是关于将人类可读的 4 字符字符串"01A1"
转换为 2 个内存字节(1 和 161)。因此显然需要 ASCII 转换。
@NielsKeurentjes 我知道我正在回复几年前发布的答案,但我只想对解决方案表示感谢!这正是我所需要的,我使用的是我在网上找到的另一种方式,但它有一些问题,而且它的工作方式与应有的不完全一样。所以再次感谢! :)
喜欢这个解决方案。作为一个小观察,请注意 char2input 可以稍微提高效率,尤其是在大量使用的情况下。请注意,任何有效字符都将 >= '0',因此首先测试第二个字符更有效,如: int char2int(char input) if (input = '0' ) 返回输入 - '0'; if (input = 'A') 返回输入 - 'A' + 10; if (input = 'a') 返回输入 - 'a' + 10;或者按顺序测试 a,然后是 A,然后是 0。【参考方案2】:
此实现使用内置的strtol
函数来处理从文本到字节的实际转换,但适用于任何偶数长度的十六进制字符串。
std::vector<char> HexToBytes(const std::string& hex)
std::vector<char> bytes;
for (unsigned int i = 0; i < hex.length(); i += 2)
std::string byteString = hex.substr(i, 2);
char byte = (char) strtol(byteString.c_str(), NULL, 16);
bytes.push_back(byte);
return bytes;
【讨论】:
好吧,你总是可以为奇数大小的十六进制字符串预先附加“0”【参考方案3】:为了好玩,我很好奇是否可以在编译时进行这种转换。它没有很多错误检查,并且是在 VS2015 中完成的,它还不支持 C++14 constexpr 函数(因此 HexCharToInt 看起来如何)。它采用一个 c 字符串数组,将字符对转换为单个字节,并将这些字节扩展为一个统一的初始化列表,用于初始化作为模板参数提供的 T 类型。 T 可以替换为 std::array 之类的东西以自动返回一个数组。
#include <cstdint>
#include <initializer_list>
#include <stdexcept>
#include <utility>
/* Quick and dirty conversion from a single character to its hex equivelent */
constexpr std::uint8_t HexCharToInt(char Input)
return
((Input >= 'a') && (Input <= 'f'))
? (Input - 87)
: ((Input >= 'A') && (Input <= 'F'))
? (Input - 55)
: ((Input >= '0') && (Input <= '9'))
? (Input - 48)
: throw std::exception;
/* Position the characters into the appropriate nibble */
constexpr std::uint8_t HexChar(char High, char Low)
return (HexCharToInt(High) << 4) | (HexCharToInt(Low));
/* Adapter that performs sets of 2 characters into a single byte and combine the results into a uniform initialization list used to initialize T */
template <typename T, std::size_t Length, std::size_t ... Index>
constexpr T HexString(const char (&Input)[Length], const std::index_sequence<Index...>&)
return THexChar(Input[(Index * 2)], Input[((Index * 2) + 1)])...;
/* Entry function */
template <typename T, std::size_t Length>
constexpr T HexString(const char (&Input)[Length])
return HexString<T>(Input, std::make_index_sequence<(Length / 2)>);
constexpr auto Y = KS::Utility::HexString<std::array<std::uint8_t, 3>>("ABCDEF");
【讨论】:
太棒了!我想要一种从字符串文字初始化数组的方法,这几乎正是我所需要的。【参考方案4】:你可以使用提升:
#include <boost/algorithm/hex.hpp>
char bytes[60] = 0;
std::string hash = boost::algorithm::unhex(std::string("313233343536373839"));
std::copy(hash.begin(), hash.end(), bytes);
【讨论】:
【参考方案5】:您说的是“可变长度”。你的意思是多变?
对于适合 unsigned long 的十六进制字符串,我一直喜欢 C 函数 strtoul
。使其将十六进制传递 16 作为基数值。
代码可能如下所示:
#include <cstdlib>
std::string str = "01a1";
unsigned long val = strtoul(str.c_str(), 0, 16);
【讨论】:
【参考方案6】:如果你想使用 OpenSSL 来做,我发现了一个绝妙的技巧:
BIGNUM *input = BN_new();
int input_length = BN_hex2bn(&input, argv[2]);
input_length = (input_length + 1) / 2; // BN_hex2bn() returns number of hex digits
unsigned char *input_buffer = (unsigned char*)malloc(input_length);
retval = BN_bn2bin(input, input_buffer);
只要确保去掉字符串前导的“0x”即可。
【讨论】:
一定要BN_free【参考方案7】:这可以通过stringstream
来完成,您只需要将值存储在中间数字类型中,例如int
:
std::string test = "01A1"; // assuming this is an even length string
char bytes[test.length()/2];
stringstream converter;
for(int i = 0; i < test.length(); i+=2)
converter << std::hex << test.substr(i,2);
int byte;
converter >> byte;
bytes[i/2] = byte & 0xFF;
converter.str(std::string());
converter.clear();
【讨论】:
【参考方案8】:我会使用sscanf
之类的标准函数将字符串读入无符号整数,然后您已经在内存中拥有所需的字节。如果你在一个大端机器上,你可以从第一个非零字节写出 (memcpy
) 整数的内存。但是,您通常不能安全地假设这一点,因此您可以使用一些位掩码和移位来获取字节。
const char* src = "01A1";
char hexArray[256] = 0;
int hexLength = 0;
// read in the string
unsigned int hex = 0;
sscanf(src, "%x", &hex);
// write it out
for (unsigned int mask = 0xff000000, bitPos=24; mask; mask>>=8, bitPos-=8)
unsigned int currByte = hex & mask;
if (currByte || hexLength)
hexArray[hexLength++] = currByte>>bitPos;
【讨论】:
【参考方案9】:C++11 变体(使用 gcc 4.7 - little endian 格式):
#include <string>
#include <vector>
std::vector<uint8_t> decodeHex(const std::string & source)
if ( std::string::npos != source.find_first_not_of("0123456789ABCDEFabcdef") )
// you can throw exception here
return ;
union
uint64_t binary;
char byte[8];
value;
auto size = source.size(), offset = (size % 16);
std::vector<uint8_t> binary;
binary.reserve((size + 1) / 2);
if ( offset )
value.binary = std::stoull(source.substr(0, offset), nullptr, 16);
for ( auto index = (offset + 1) / 2; index--; )
binary.emplace_back(value.byte[index]);
for ( ; offset < size; offset += 16 )
value.binary = std::stoull(source.substr(offset, 16), nullptr, 16);
for ( auto index = 8; index--; )
binary.emplace_back(value.byte[index]);
return binary;
Crypto++ 变体(使用 gcc 4.7):
#include <string>
#include <vector>
#include <crypto++/filters.h>
#include <crypto++/hex.h>
std::vector<unsigned char> decodeHex(const std::string & source)
std::string hexCode;
CryptoPP::StringSource(
source, true,
new CryptoPP::HexDecoder(new CryptoPP::StringSink(hexCode)));
return std::vector<unsigned char>(hexCode.begin(), hexCode.end());
请注意,第一个变体比第二个变体快大约两倍,同时适用于奇数和偶数个半字节(“a56ac”的结果是 0x0a, 0x56, 0xac)。如果有奇数个 nibbels,Crypto++ 会丢弃最后一个(“a56ac”的结果是 0xa5, 0x6a)并静默跳过无效的十六进制字符(“a5sac”的结果是 0xa5, 0xac)。
【讨论】:
【参考方案10】:#include <iostream>
#include <sstream>
#include <vector>
int main()
std::string s("313233");
char delim = ',';
int len = s.size();
for(int i = 2; i < len; i += 3, ++len) s.insert(i, 1, delim);
std::istringstream is(s);
std::ostringstream os;
is >> std::hex;
int n;
while (is >> n)
char c = (char)n;
os << std::string(&c, 1);
if(is.peek() == delim) is.ignore();
// std::string form
std::string byte_string = os.str();
std::cout << byte_string << std::endl;
printf("%s\n", byte_string.c_str());
// std::vector form
std::vector<char> byte_vector(byte_string.begin(), byte_string.end());
byte_vector.push_back('\0'); // needed for a c-string
printf("%s\n", byte_vector.data());
输出是
123
123
123
'1' == 0x31 等
【讨论】:
【参考方案11】:如果您的目标是速度,我在这里有一个编码器和解码器的 AVX2 SIMD 实现:https://github.com/zbjornson/fast-hex。这些基准测试比最快的标量实现快约 12 倍。
【讨论】:
它会标记无效输入吗?【参考方案12】:有人提到使用 sscanf 来做到这一点,但没有说如何。就是这样。它很有用,因为它也适用于古老版本的 C 和 C++,甚至适用于微控制器的大多数嵌入式 C 或 C++ 版本。
当转换为字节时,此示例中的十六进制字符串解析为 ASCII 文本“Hello there!”然后打印出来。
#include <stdio.h>
int main ()
char hexdata[] = "48656c6c6f20746865726521";
char bytedata[20];
for(int j = 0; j < sizeof(hexdata) / 2; j++)
sscanf(hexdata + j * 2, "%02hhX", bytedata + j);
printf ("%s -> %s\n", hexdata, bytedata);
return 0;
【讨论】:
【参考方案13】:#include <iostream>
using byte = unsigned char;
static int charToInt(char c)
if (c >= '0' && c <= '9')
return c - '0';
if (c >= 'A' && c <= 'F')
return c - 'A' + 10;
if (c >= 'a' && c <= 'f')
return c - 'a' + 10;
return -1;
// Decodes specified HEX string to bytes array. Specified nBytes is length of bytes
// array. Returns -1 if fails to decode any of bytes. Returns number of bytes decoded
// on success. Maximum number of bytes decoded will be equal to nBytes. It is assumed
// that specified string is '\0' terminated.
int hexStringToBytes(const char* str, byte* bytes, int nBytes)
int nDecoded 0;
for (int i 0; str[i] != '\0' && nDecoded < nBytes; i += 2, nDecoded += 1)
if (str[i + 1] != '\0')
int m charToInt(str[i]);
int n charToInt(str[i + 1]);
if (m != -1 && n != -1)
bytes[nDecoded] = (m << 4) | n;
else
return -1;
else
return -1;
return nDecoded;
int main(int argc, char* argv[])
if (argc < 2)
return 1;
byte bytes[0x100];
int ret hexStringToBytes(argv[1], bytes, 0x100);
if (ret < 0)
return 1;
std::cout << "number of bytes: " << ret << "\n" << std::hex;
for (int i 0; i < ret; ++i)
if (bytes[i] < 0x10)
std::cout << "0";
std::cout << (bytes[i] & 0xff);
std::cout << "\n";
return 0;
【讨论】:
【参考方案14】:我修改了 TheoretiCAL 的代码
uint8_t buf[32] = ;
std::string hex = "0123";
while (hex.length() % 2)
hex = "0" + hex;
std::stringstream stream;
stream << std::hex << hex;
for (size_t i= 0; i <sizeof(buf); i++)
stream >> buf[i];
【讨论】:
【参考方案15】:我如何在编译时做到这一点
#pragma once
#include <memory>
#include <iostream>
#include <string>
#include <array>
#define DELIMITING_WILDCARD ' '
// @sean :)
constexpr int _char_to_int( char ch )
if( ch >= '0' && ch <= '9' )
return ch - '0';
if( ch >= 'A' && ch <= 'F' )
return ch - 'A' + 10;
return ch - 'a' + 10;
;
template <char wildcard, typename T, size_t N = sizeof( T )>
constexpr size_t _count_wildcard( T &&str )
size_t count = 1u;
for( const auto &character : str )
if( character == wildcard )
++count;
return count;
// construct a base16 hex and emplace it at make_count
// change 16 to 256 if u want the result to be when:
// sig[0] == 0xA && sig[1] == 0xB = 0xA0B
// or leave as is for the scenario to return 0xAB
#define CONCATE_HEX_FACTOR 16
#define CONCATE_HEX(a, b) ( CONCATE_HEX_FACTOR * ( a ) + ( b ) )
template
< char skip_wildcard,
// How many occurances of a delimiting wildcard do we find in sig
size_t delimiter_count,
typename T, size_t N = sizeof( T )>
constexpr auto _make_array( T &&sig )
static_assert( delimiter_count > 0, "this is a logical error, delimiter count can't be of size 0" );
static_assert( N > 1, "sig length must be bigger than 1" );
// Resulting byte array, for delimiter_count skips we should have delimiter_count integers
std::array<int, delimiter_count> ret;
// List of skips that point to the position of the delimiter wildcard in skip
std::array<size_t, delimiter_count> skips;
// Current skip
size_t skip_count = 0u;
// Character count, traversed for skip
size_t skip_traversed_character_count = 0u;
for( size_t i = 0u; i < N; ++i )
if( sig[i] == DELIMITING_WILDCARD )
skips[skip_count] = skip_traversed_character_count;
++skip_count;
++skip_traversed_character_count;
// Finally traversed character count
size_t traversed_character_count = 0u;
// Make count (we will supposedly have at least an instance in our return array)
size_t make_count = 1u;
// Traverse signature
for( size_t i = 0u; i < N; ++i )
// Read before
if( i == 0u )
// We don't care about this, and we don't want to use 0
if( sig[0u] == skip_wildcard )
ret[0u] = -1;
continue;
ret[0u] = CONCATE_HEX( _char_to_int( sig[0u] ), _char_to_int( sig[1u] ) );
continue;
// Make result by skip data
for( const auto &skip : skips )
if( ( skip == i ) && skip < N - 1u )
// We don't care about this, and we don't want to use 0
if( sig[i + 1u] == skip_wildcard )
ret[make_count] = -1;
++make_count;
continue;
ret[make_count] = CONCATE_HEX( _char_to_int( sig[i + 1u] ), _char_to_int( sig[i + 2u] ) );
++make_count;
return ret;
#define SKIP_WILDCARD '?'
#define BUILD_ARRAY(a) _make_array<SKIP_WILDCARD, _count_wildcard<DELIMITING_WILDCARD>( a )>( a )
#define BUILD_ARRAY_MV(a) _make_array<SKIP_WILDCARD, _count_wildcard<DELIMITING_WILDCARD>( std::move( a ) )>( std::move( a ) )
// -----
// usage
// -----
template <int n>
constexpr int combine_two()
constexpr auto numbers = BUILD_ARRAY( "55 8B EC 83 E4 F8 8B 4D 08 BA ? ? ? ? E8 ? ? ? ? 85 C0 75 12 ?" );
constexpr int number = numbers[0];
constexpr int number_now = n + number;
return number_now;
int main()
constexpr auto shit = BUILD_ARRAY( "?? AA BB CC DD ? ? ? 02 31 32" );
for( const auto &hex : shit )
printf( "%x ", hex );
combine_two<3>();
constexpr auto saaahhah = combine_two<3>();
static_assert( combine_two<3>() == 88 );
static_assert( combine_two<3>() == saaahhah );
printf( "\n%d", saaahhah );
方法也可用于运行时,但为此您可能更喜欢其他更快的方法。
【讨论】:
【参考方案16】:如果您可以使您的数据看起来像这样,例如“0x01”、“0xA1”的数组 然后你可以迭代你的数组并使用 sscanf 创建值数组
unsigned int result;
sscanf(data, "%x", &result);
【讨论】:
这是“提示”还是答案? “试试这个”是什么意思?它会起作用吗?它与现有答案有什么不同吗?怎么样? @jogojapan 我很高兴编写整个代码你真的需要它吗?你能看出基本方法的不同吗? 我的问题是我不明白你想告诉我们什么。有一个提示,有一个字符串(后面是该字符串的另一个版本,前缀为0x
),然后是关于一些迭代的非常简短的声明。这一切的意义,尤其是。在现有答案的背景下,我不清楚。这将对您为此获得的赞成/反对票产生影响。【参考方案17】:
十六进制到字符转换的困难在于十六进制数字成对工作,f.ex:3132 或 A0FF。因此假设偶数个十六进制数字。但是,奇数位数可能是完全有效的,例如:332 和 AFF,应该理解为 0332 和 0AFF。
我建议对 Niels Keurentjes hex2bin() 函数进行改进。 首先我们计算有效的十六进制数字的数量。由于我们必须计算,让我们也控制缓冲区大小:
void hex2bin(const char* src, char* target, size_t size_target)
int countdgts=0; // count hex digits
for (const char *p=src; *p && isxdigit(*p); p++)
countdgts++;
if ((countdgts+1)/2+1>size_target)
throw exception("Risk of buffer overflow");
顺便说一句,要使用isxdigit()
,您必须使用#include <cctype>
。
一旦我们知道有多少个数字,我们就可以确定第一个数字是否是较高的数字(仅对)或不是(第一个数字不是对)。
bool ishi = !(countdgts%2);
然后我们可以逐位循环,使用 bin shift
for (*target=0; *src; ishi = !ishi)
char tmp = char2int(*src++); // hex digit on 4 lower bits
if (ishi)
*target = (tmp << 4); // high: shift by 4
else *target++ |= tmp; // low: complete previous
*target=0; // null terminated target (if desired)
【讨论】:
【参考方案18】:我找到了这个问题,但接受的答案对我来说看起来不像是解决任务的 C++ 方式(这并不意味着它是一个糟糕的答案或任何东西,只是解释了添加这个问题的动机)。我记得this nice answer 并决定实现类似的东西。这是我最终得到的完整代码(它也适用于std::wstring
):
#include <cctype>
#include <cstdlib>
#include <algorithm>
#include <iostream>
#include <iterator>
#include <ostream>
#include <stdexcept>
#include <string>
#include <vector>
template <typename OutputIt>
class hex_ostream_iterator :
public std::iterator<std::output_iterator_tag, void, void, void, void>
OutputIt out;
int digitCount;
int number;
public:
hex_ostream_iterator(OutputIt out) : out(out), digitCount(0), number(0)
hex_ostream_iterator<OutputIt> &
operator=(char c)
number = (number << 4) | char2int(c);
digitCount++;
if (digitCount == 2)
digitCount = 0;
*out++ = number;
number = 0;
return *this;
hex_ostream_iterator<OutputIt> &
operator*()
return *this;
hex_ostream_iterator<OutputIt> &
operator++()
return *this;
hex_ostream_iterator<OutputIt> &
operator++(int)
return *this;
private:
int
char2int(char c)
static const std::string HEX_CHARS = "0123456789abcdef";
const char lowerC = std::tolower(c);
const std::string::size_type pos = HEX_CHARS.find_first_of(lowerC);
if (pos == std::string::npos)
throw std::runtime_error(std::string("Not a hex digit: ") + c);
return pos;
;
template <typename OutputIt>
hex_ostream_iterator<OutputIt>
hex_iterator(OutputIt out)
return hex_ostream_iterator<OutputIt>(out);
template <typename InputIt, typename OutputIt>
hex_ostream_iterator<OutputIt>
from_hex_string(InputIt first, InputIt last, OutputIt out)
if (std::distance(first, last) % 2 == 1)
*out = '0';
++out;
return std::copy(first, last, out);
int
main(int argc, char *argv[])
if (argc != 2)
std::cout << "Usage: " << argv[0] << " hexstring" << std::endl;
return EXIT_FAILURE;
const std::string input = argv[1];
std::vector<unsigned char> bytes;
from_hex_string(input.begin(), input.end(),
hex_iterator(std::back_inserter(bytes)));
typedef std::ostream_iterator<unsigned char> osit;
std::copy(bytes.begin(), bytes.end(), osit(std::cout));
return EXIT_SUCCESS;
还有./hex2bytes 61a062a063 | hexdump -C
的输出:
00000000 61 a0 62 a0 63 |a.b.c|
00000005
And of ./hex2bytes 6a062a063 | hexdump -C
(注意奇数个字符):
00000000 06 a0 62 a0 63 |..b.c|
00000005
【讨论】:
非常好的 char2int() !但我担心当使用奇数个十六进制数字时结果不符合预期。例如,尝试使用 6a062a063。我会理解 6 a0 62 a0 63,但您的代码会从中产生 6a 06 2a 06 3。 你是对的关于奇数的十六进制数字,@Christophe。谢谢!我更新了代码以很好地处理这种情况(顺便说一句,接受的答案不是真的,处理这样的字符串更好)。 应该注意的是,我将接受的答案写为对 OP 问题的最有效的完整解决方案 :) 没有就特殊情况提出任何问题,所以我假设(像许多 stdc 函数一样)预先净化输入。【参考方案19】:输入:“303132”,输出:“012”。输入字符串可以是奇数或偶数长度。
char char2int(char input)
if (input >= '0' && input <= '9')
return input - '0';
if (input >= 'A' && input <= 'F')
return input - 'A' + 10;
if (input >= 'a' && input <= 'f')
return input - 'a' + 10;
throw std::runtime_error("Incorrect symbol in hex string");
;
string hex2str(string &hex)
string out;
out.resize(hex.size() / 2 + hex.size() % 2);
string::iterator it = hex.begin();
string::iterator out_it = out.begin();
if (hex.size() % 2 != 0)
*out_it++ = char(char2int(*it++));
for (; it < hex.end() - 1; it++)
*out_it++ = char2int(*it++) << 4 | char2int(*it);
;
return out;
【讨论】:
【参考方案20】:与这里的其他一些答案非常相似,这就是我所采用的:
typedef uint8_t BYTE;
BYTE* ByteUtils::HexStringToBytes(BYTE* HexString, int ArrayLength)
BYTE* returnBytes;
returnBytes = (BYTE*) malloc(ArrayLength/2);
int j=0;
for(int i = 0; i < ArrayLength; i++)
if(i % 2 == 0)
int valueHigh = (int)(*(HexString+i));
int valueLow = (int)(*(HexString+i+1));
valueHigh = ByteUtils::HexAsciiToDec(valueHigh);
valueLow = ByteUtils::HexAsciiToDec(valueLow);
valueHigh *= 16;
int total = valueHigh + valueLow;
*(returnBytes+j++) = (BYTE)total;
return returnBytes;
int ByteUtils::HexAsciiToDec(int value)
if(value > 47 && value < 59)
value -= 48;
else if(value > 96 && value < 103)
value -= 97;
value += 10;
else if(value > 64 && value < 71)
value -= 65;
value += 10;
else
value = 0;
return value;
【讨论】:
以上是关于将十六进制字符串转换为字节数组的主要内容,如果未能解决你的问题,请参考以下文章