使用sprintf函数时应该注意啥问题

Posted 2023-04-13

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了使用sprintf函数时应该注意啥问题相关的知识，希望对你有一定的参考价值。

在使用sprintf函数时，一些无关的全局变量发生了改变，这是什么原因导致的，在使用sprintf函数时应该特别注意哪些问题？

1. 保证目标缓冲区长度够用
2. 格式串和后边的参数一定要对应, 个数和类型都必须相同
3. 使用"%s"时更要加倍小心, 限制转换长度是个可行的方法, 如: "%.100s"
4. 用snprintf代替sprintf, 要安全一些参考技术A 使用sprintf函数应该特别注意越界问题追问

能说的详细一点吗，谢谢

参考技术B 功能：　函数sprintf()用来作格式化的输出。
用法：　此函数调用方式为int sprintf(char *string,char *format,arg_list);
说明：　函数sprintf()的用法和printf()函数一样，只是sprintf()函数给出第一个参数string(一般为字符数组），然后再调用 outtextxy()函数将串里的字符显示在屏幕上。arg_list为参数表，可有不定个数。通常在绘图方式下输出数字时可调用sprintf()函数将所要输出的格式送到第一个参数，然后显示输出。
函数名: sprintf
功能: 送格式化输出到字符串中
用法: int sprintf(char *string, char *farmat [,argument,...]);
程序例:
#include
#include
int main(void)

char buffer[80];
sprintf(buffer, "An approximation of Pi is %f\n", M_PI);
puts(buffer);
return 0;

sprintf的作用是将一个格式化的字符串输出到一个目的字符串中，而printf是将一个格式化的字符串输出到屏幕。sprintf的第一个参数应该是目的字符串，如果不指定这个参数，执行过程中出现 "该程序产生非法操作,即将被关闭...."的提示。
因为C语言在进行字符串操作时不检查字符串的空间是否够大，所以可能会出现数组越界而导致程序崩溃的问题。即使碰巧，程序没有出错，也不要这么用，因为早晚会出错。所以一定要在调用sprintf之前分配足够大的空间给buf。

由于sprintf 跟printf 在用法上几乎一样，只是打印的目的地不同而已，前者打印到字符串中，
后者则直接在命令行上输出。这也导致sprintf 比printf 有用得多。所以本文着重介绍sprintf，有时
也穿插着用用pritnf。
sprintf 是个变参函数，定义如下：
int sprintf( char *buffer, const char *format [, argument] ... );
除了前两个参数类型固定外，后面可以接任意多个参数。而它的精华，显然就在第二个参数：
格式化字符串上。
printf 和sprintf 都使用格式化字符串来指定串的格式，在格式串内部使用一些以“%”开头的
格式说明符（format specifications）来占据一个位置，在后边的变参列表中提供相应的变量，最终
函数就会用相应位置的变量来替代那个说明符，产生一个调用者想要的字符串。
格式化数字字符串
sprintf 最常见的应用之一莫过于把整数打印到字符串中，所以，spritnf 在大多数场合可以替代
itoa。如：
//把整数123 打印成一个字符串保存在s 中。
sprintf(s, "%d", 123); //产生"123"
可以指定宽度，不足的左边补空格：
sprintf(s, "%8d%8d", 123, 4567); //产生：" 123 4567"
当然也可以左对齐：
sprintf(s, "%-8d%8d", 123, 4567); //产生："123 4567"
也可以按照16 进制打印：
sprintf(s, "%8x", 4567); //小写16 进制，宽度占8 个位置，右对齐
sprintf(s, "%-8X", 4568); //大写16 进制，宽度占8 个位置，左对齐
这样，一个整数的16 进制字符串就很容易得到，但我们在打印16 进制内容时，通常想要一
种左边补0 的等宽格式，那该怎么做呢？很简单，在表示宽度的数字前面加个0 就可以了。
sprintf(s, "%08X", 4567); //产生："000011D7"
上面以”%d”进行的10 进制打印同样也可以使用这种左边补0 的方式。
这里要注意一个符号扩展的问题：比如，假如我们想打印短整数（short）-1 的内存16 进制表
示形式，在Win32 平台上，一个short 型占2 个字节，所以我们自然希望用4 个16 进制数字来打
印它：
short si = -1;
sprintf(s, "%04X", si);
产生“FFFFFFFF”，怎么回事？因为spritnf 是个变参函数，除了前面两个参数之外，后面的
参数都不是类型安全的，函数更没有办法仅仅通过一个“%X”就能得知当初函数调用前参数压栈
时被压进来的到底是个4 字节的整数还是个2 字节的短整数，所以采取了统一4 字节的处理方式，
导致参数压栈时做了符号扩展，扩展成了32 位的整数-1，打印时4 个位置不够了，就把32 位整数
-1 的8 位16 进制都打印出来了。如果你想看si 的本来面目，那么就应该让编译器做0 扩展而不是
符号扩展（扩展时二进制左边补0 而不是补符号位）：
sprintf(s, "%04X", (unsigned short)si);
就可以了。或者：
unsigned short si = -1;
sprintf(s, "%04X", si);
sprintf 和printf 还可以按8 进制打印整数字符串，使用”%o”。注意8 进制和16 进制都不会打
印出负数，都是无符号的，实际上也就是变量的内部编码的直接的16 进制或8 进制表示。
控制浮点数打印格式
浮点数的打印和格式控制是sprintf 的又一大常用功能，浮点数使用格式符”%f”控制，默认保
留小数点后6 位数字，比如：
sprintf(s, "%f", 3.1415926); //产生"3.141593"
但有时我们希望自己控制打印的宽度和小数位数，这时就应该使用：”%m.nf”格式，其中m 表
示打印的宽度，n 表示小数点后的位数。比如：
sprintf(s, "%10.3f", 3.1415626); //产生：" 3.142"
sprintf(s, "%-10.3f", 3.1415626); //产生："3.142 "
sprintf(s, "%.3f", 3.1415626); //不指定总宽度，产生："3.142"
注意一个问题，你猜
int i = 100;
sprintf(s, "%.2f", i);
会打出什么东东来？“100.00”？对吗？自己试试就知道了，同时也试试下面这个：
sprintf(s, "%.2f", (double)i);
第一个打出来的肯定不是正确结果，原因跟前面提到的一样，参数压栈时调用者并不知道跟i
相对应的格式控制符是个”%f”。而函数执行时函数本身则并不知道当年被压入栈里的是个整数，
于是可怜的保存整数i 的那4 个字节就被不由分说地强行作为浮点数格式来解释了，整个乱套了。
不过，如果有人有兴趣使用手工编码一个浮点数，那么倒可以使用这种方法来检验一下你手
工编排的结果是否正确。?
字符/Ascii 码对照
我们知道，在C/C++语言中，char 也是一种普通的scalable 类型，除了字长之外，它与short，
int，long 这些类型没有本质区别，只不过被大家习惯用来表示字符和字符串而已。（或许当年该把
这个类型叫做“byte”，然后现在就可以根据实际情况，使用byte 或short 来把char 通过typedef 定
义出来，这样更合适些）
于是，使用”%d”或者”%x”打印一个字符，便能得出它的10 进制或16 进制的ASCII 码；反过
来，使用”%c”打印一个整数，便可以看到它所对应的ASCII 字符。以下程序段把所有可见字符的
ASCII 码对照表打印到屏幕上（这里采用printf，注意”#”与”%X”合用时自动为16 进制数增加”0X”
前缀）：
for(int i = 32; i < 127; i++)
printf("[ %c ]: %3d 0x%#04X\n", i, i, i);

连接字符串
sprintf 的格式控制串中既然可以插入各种东西，并最终把它们“连成一串”，自然也就能够连
接字符串，从而在许多场合可以替代strcat，但sprintf 能够一次连接多个字符串（自然也可以同时
在它们中间插入别的内容，总之非常灵活）。比如：
char* who = "I";
char* whom = "CSDN";
sprintf(s, "%s love %s.", who, whom); //产生："I love CSDN. "
strcat 只能连接字符串（一段以’\0’结尾的字符数组或叫做字符缓冲，null-terminated-string），
但有时我们有两段字符缓冲区，他们并不是以’\0’结尾。比如许多从第三方库函数中返回的字符数
组，从硬件或者网络传输中读进来的字符流，它们未必每一段字符序列后面都有个相应的’\0’来结
尾。如果直接连接，不管是sprintf 还是strcat 肯定会导致非法内存操作，而strncat 也至少要求第
一个参数是个null-terminated-string，那该怎么办呢？我们自然会想起前面介绍打印整数和浮点数
时可以指定宽度，字符串也一样的。比如：
char a1[] = 'A', 'B', 'C', 'D', 'E', 'F', 'G';
char a2[] = 'H', 'I', 'J', 'K', 'L', 'M', 'N';
如果：
sprintf(s, "%s%s", a1, a2); //Don't do that!
十有八九要出问题了。是否可以改成：
sprintf(s, "%7s%7s", a1, a2);
也没好到哪儿去，正确的应该是：
sprintf(s, "%.7s%.7s", a1, a2);//产生："ABCDEFGHIJKLMN"
这可以类比打印浮点数的”%m.nf”，在”%m.ns”中，m 表示占用宽度（字符串长度不足时补空
格，超出了则按照实际宽度打印），n 才表示从相应的字符串中最多取用的字符数。通常在打印字
符串时m 没什么大用，还是点号后面的n 用的多。自然，也可以前后都只取部分字符：
sprintf(s, "%.6s%.5s", a1, a2);//产生："ABCDEFHIJKL"
在许多时候，我们或许还希望这些格式控制符中用以指定长度信息的数字是动态的，而不是
静态指定的，因为许多时候，程序要到运行时才会清楚到底需要取字符数组中的几个字符，这种
动态的宽度/精度设置功能在sprintf 的实现中也被考虑到了，sprintf 采用”*”来占用一个本来需要一
个指定宽度或精度的常数数字的位置，同样，而实际的宽度或精度就可以和其它被打印的变量一
样被提供出来，于是，上面的例子可以变成：
sprintf(s, "%.*s%.*s", 7, a1, 7, a2);
或者：
sprintf(s, "%.*s%.*s", sizeof(a1), a1, sizeof(a2), a2);
实际上，前面介绍的打印字符、整数、浮点数等都可以动态指定那些常量值，比如：
sprintf(s, "%-*d", 4, 'A'); //产生"65 "
sprintf(s, "%#0*X", 8, 128); //产生"0X000080"，"#"产生0X
sprintf(s, "%*.*f", 10, 2, 3.1415926); //产生" 3.14"
打印地址信息
有时调试程序时，我们可能想查看某些变量或者成员的地址，由于地址或者指针也不过是个32 位的数，你完全可以使用打印无符号整数的”%u”把他们打印出来：
sprintf(s, "%u", &i);
不过通常人们还是喜欢使用16 进制而不是10 进制来显示一个地址：
sprintf(s, "%08X", &i);
然而，这些都是间接的方法，对于地址打印，sprintf 提供了专门的”%p”：
sprintf(s, "%p", &i);
我觉得它实际上就相当于：
sprintf(s, "%0*x", 2 * sizeof(void *), &i);
利用sprintf 的返回值
较少有人注意printf/sprintf 函数的返回值，但有时它却是有用的，spritnf 返回了本次函数调用
最终打印到字符缓冲区中的字符数目。也就是说每当一次sprinf 调用结束以后，你无须再调用一次
strlen 便已经知道了结果字符串的长度。如：
int len = sprintf(s, "%d", i);
对于正整数来说，len 便等于整数i 的10 进制位数。
下面的是个完整的例子，产生10 个[0, 100)之间的随机数，并将他们打印到一个字符数组s 中，
以逗号分隔开。
#include
#include
#include
int main()
srand(time(0));
char s[64];
int offset = 0;
for(int i = 0; i < 10; i++)
offset += sprintf(s + offset, "%d,", rand() % 100);

s[offset - 1] = '\n';//将最后一个逗号换成换行符。
printf(s);
return 0;

设想当你从数据库中取出一条记录，然后希望把他们的各个字段按照某种规则连接成一个字
符串时，就可以使用这种方法，从理论上讲，他应该比不断的strcat 效率高，因为strcat 每次调用
都需要先找到最后的那个’\0’的位置，而在上面给出的例子中，我们每次都利用sprintf 返回值把这
个位置直接记下来了。
使用sprintf 的常见问题
sprintf 是个变参函数，使用时经常出问题，而且只要出问题通常就是能导致程序崩溃的内存访
问错误，但好在由sprintf 误用导致的问题虽然严重，却很容易找出，无非就是那么几种情况，通
常用眼睛再把出错的代码多看几眼就看出来了。
?? 缓冲区溢出
第一个参数的长度太短了，没的说，给个大点的地方吧。当然也可能是后面的参数的问
题，建议变参对应一定要细心，而打印字符串时，尽量使用”%.ns”的形式指定最大字符数。
?? 忘记了第一个参数
低级得不能再低级问题，用printf 用得太惯了。//偶就常犯。：。（
?? 变参对应出问题
通常是忘记了提供对应某个格式符的变参，导致以后的参数统统错位，检查检查吧。尤
其是对应”*”的那些参数，都提供了吗？不要把一个整数对应一个”%s”，编译器会觉得你
欺她太甚了（编译器是obj 和exe 的妈妈，应该是个女的，:P）。
strftime
sprnitf 还有个不错的表妹：strftime，专门用于格式化时间字符串的，用法跟她表哥很像，也
是一大堆格式控制符，只是毕竟小姑娘家心细，她还要调用者指定缓冲区的最大长度，可能是为
了在出现问题时可以推卸责任吧。这里举个例子：
time_t t = time(0);
//产生"YYYY-MM-DD hh:mm:ss"格式的字符串。
char s[32];
strftime(s, sizeof(s), "%Y-%m-%d %H:%M:%S", localtime(&t));
sprintf 在MFC 中也能找到他的知音：CString::Format，strftime 在MFC 中自然也有.
保证目标缓冲区长度够用; 格式串和后边的参数一定要对应, 个数和类型都必须相同
; 使用"%s"时更要加倍小心, 限制转换长度是个可行的方法, 如: "%.100s"; 用snprintf代替sprintf, 要安全一些. 参考技术C 格式

我啥时候应该考虑使用内存数据库，需要注意啥问题？

【中文标题】我啥时候应该考虑使用内存数据库，需要注意啥问题？【英文标题】：When should I consider using a in memory database and what are the issue to look out for?我什么时候应该考虑使用内存数据库，需要注意什么问题？ 【发布时间】：2010-12-08 07:10:37 【问题描述】：

我只是认为现在在您的数据库服务器上有足够的 RAM 来缓存您的完整数据库是很常见的为什么memory database 的专家（例如TimesTen，另请参阅@987654323 @) 几年前风靡一时但没有被更多使用？

似乎随着时间的推移，非基于磁盘的数据库的使用越来越少，例如，现在大多数应用程序都建立在传统的理性数据库之上。我原本预计会出现相反的情况，因为许多服务器的 RAM 已接近免费。

我在问这个问题，因为我刚刚阅读了 stack-overflow-architecture 并且页面上说

这很重要，因为 Stack Overflow的数据库差不多完全在 RAM 中，连接仍然成本太高了。

但我认为如果使用“指针”和“集合”而不是普通的 btree，这将不是问题。 Btree 非常聪明地获得了磁盘访问速度的限制，例如，它们交换 CPU 使用率以减少磁盘使用率。但是我们现在有这么匹配的 ram。

但我们仍然需要数据库，就像你自己做的那样

锁定死锁检测事务记录正在恢复等

很难。

@S.Lott，鉴于我们都花了很长时间选择索引、避免连接和调查数据库性能问题。一定会有更好的办法。几年前，我们被告知“内存数据库”是更好的方法。所以在我开始使用一个 etc 之前，我想知道为什么其他人没有更多地使用它们。

（我自己不太可能使用 TimesTen，因为它价格昂贵 ($41,500.00 / Processor)，而且我不喜欢与 Oracle 销售人员交谈 - 我宁愿花时间编写代码。）

另请参阅：

Alternative to the TimesTen in memory database Has anyone published a detailed comparison between different in-memory RDBMSs?

更新：

很久前我问过这个问题，现在 Microsoft SQL Server 有“In-Memory OLTP”，这是一个集成到 SQL Server 引擎中的内存优化数据库引擎。它并不便宜，但对于某些工作负载来说似乎非常快。

【问题讨论】：

"没有被更多使用？"超过什么？你有一些指标、数字或调查吗？我不明白这个问题。你有一个应该使用但不是的具体例子吗？或者这只是一个讨论话题？你需要了解什么？你有什么编程问题？内存够用吗？即使是小型应用程序也可以轻松使用 100GB 的磁盘空间。我很少使用为单个应用程序提供这么多内存的服务器。 【参考方案1】：

没有人真正回答“我什么时候应该考虑使用内存数据库以及需要注意什么问题？”这个问题。所以我会试一试。

在以下情况下，您应该考虑使用内存数据库： 1. 目标系统有数据要管理，但没有持久化媒体 2. 持久化数据库根本无法满足性能要求

对于 #1，请考虑机顶盒 (STB) 中的电视指南。低端机顶盒（即没有 DVR 功能的机顶盒）没有持久存储，也不需要持久存储。但包含 400 个频道、14 天的电视指南的数据库并非易事。这里也有性能要求，因为数据从转发器轮播高速到达，这是“捕获它或等到轮播再次出现”的情况。但没有必要坚持。我们都看到了这一点；当您在家中断电时，当它重新出现在电视指南上时，会显示“很快就会可用”，因为它正在从转发器或电缆前端进行自我配置。网络路由器具有相同的特性：没有持久存储，需要速度快，并且可以从外部来源（网络上的对等路由器，在这种情况下，重新填充路由表）提供数据库。

#2 的例子数不胜数：军事系统、高频交易系统等中的实时定位。

关于问题的第二部分，“需要注意的问题”：有很多。

如果您需要只有内存数据库才能提供的性能，请确保您评估的是真正的内存数据库。缓存持久性数据库是不一样的。在 RAM 驱动器中投入持久性数据库是不一样的。使用固有地执行事务日志记录的内存数据库（如 TimesTen）是不一样的（即使您登录到 /dev/null）。

确保您评估的是数据库系统，而不仅仅是缓存（例如 memcache）。数据库系统将支持具有 ACID 属性的事务、多个索引选项、支持并发访问等等。

关于 ACID：内存数据库系统不缺少“D”（持久性）。它只需要结合上下文来考虑。持久数据库中的事务只有在其存储的介质是持久的时才是持久的。内存数据库也是如此。无论哪种情况，如果您关心耐用性，最好有一个备份。

【讨论】：

【参考方案2】：

很可能没有成熟的内存数据库产品可以完全替代经典数据库。

关系数据库是一个非常古老的概念。尽管有许多方法可以推进和开发新技术，例如。面向对象的数据库，关系数据库并没有真正改变它们的概念。不要期望事情变化太快，因为数据库在过去十年或十五年甚至更长时间内没有太大变化。

我认为，技术的发展并没有人们想象的那么快。新概念的成熟和确立需要几十年的时间。首先是数据库技术，成熟度比其他任何事情都重要。

十年或二十年后，数据库可能与今天不同。如果内存数据库是未来——今天没有人能说清楚——他们只是需要更多的时间来开发。

【讨论】：

【参考方案3】：

趋势似乎是积极缓存并使用数据库填充缓存。无论数据库位于何处，连接仍然很昂贵，因此首选似乎是执行一次连接并将结果缓存在Memcached 或Velocity 之类的位置。

仍然有内存数据库并且它们被使用，但这取决于您想要使用它们的上下文。例如，SQLite 在测试数据层时经常用作内存数据库。

【讨论】：

【参考方案4】：

最重要的原因是货物文化，以及IT知识水平非常低。无论使用哪种持久性解决方案，大多数应用程序都可以很好地运行，而且随着计算机每年的速度越来越快，没有足够的人能感受到痛苦并能够查明问题。

微软和甲骨文通过他们的数据库产品赚了太多钱，以至于他们（在政治上）有可能想出更好的方法。

使用关系数据库的开发成本不透明，因此管理层不知道存在问题，更不用说解决方案了。

【讨论】：

【参考方案5】：

嗯，内存数据库在本质上通常缺乏 ACID（原子性、一致性、隔离性、持久性）中的 D（持久性）。这可以通过“混合”方法在一定程度上克服，但是在某些时候必须将某些东西（数据本身或事务日志）保存在某处以提供持久性方面。这通常会降低内存数据库解决方案的性能或引入其他不受欢迎的属性

相比之下，今天的大多数 RDBMS 都具有 ACID 的完整补充，并且在它们背后有数十年的发展。这导致基于磁盘的数据库系统具有非常高的性能，尤其是现代 RDBMS 系统经过多年的改进和优化（您的 BTree 示例只是众多示例之一）。

另一个因素是我们作为应用程序开发人员通过caching 等机制减少数据库负载的能力，从而从应用程序的数据层压缩更多感知性能。事实上，缓存本身在最近几年已经有了广泛的发展，现在分布式缓存很常见（例如，看看users of memcached 的数量）。

具有讽刺意味的是，现代缓存系统在很多方面都在慢慢变形为类似于真正的内存数据库系统的东西。内存数据库，就像面向对象的数据库一样，在很大程度上是“新的孩子”，所以看看所有这些及时去哪里会很有趣。甲骨文现已收购 TimesTen，据this wikipedia article 称，微软正在考虑很快进入内存数据库市场。这是传统 RDBMS 领域的两个现代“大玩家”，他们正在认真对待内存数据库系统。

【讨论】：

Time10 使用事务日志来提供持久性，我认为它还可以节省检查点以加快重新加载。因此，自己编写很难。 “微软正在考虑很快进入内存数据库市场”——你有这个链接吗？ Erlang 拥有 Mnesia 内置数据库，能够进行仅内存（也可仅用于磁盘或混合）操作，并通过多个节点的复制提供持久性。值得一试，也许你以后可以使用它。 @Ian - Re:Microsoft - 我只有***的文章，但是，它又链接到这里：intelligent-enterprise.informationweek.com/channels/… @CraigTP，我刚刚阅读了智能企业的文章，在我的阅读中，它适用于大多数只读数据仓库系统，例如大立方体。【参考方案6】：

这也是一个选项：http://www.memsql.com/

我没有亲自使用过它，但它应该类似于内存中 MySQL 的直接替代品。

【讨论】：

【参考方案7】：

各种便携式 SQL 版本，工作效率相同，主要针对移动设备设计。

SQLite

SQL Server Compact Edition

这些只是大玩家，可能还有其他选择，但大玩家在发布它时会处理最低要求.. :)

并且在内存数据库中，如果出现波动或断电，您会不断备份数据，您可能会丢失全部数据。与其他将作为其在辅助内存 (HDD) 中处理的一样，与内存 DB 相比，丢失的可能性为 10%。

我希望这可能会有所帮助:)

【讨论】：

【参考方案8】：

数据库最典型的用例是持久性，这使得大多数内存数据库不适合。使用内存数据库的一个普遍原因是出于测试目的。但这需要您使用既可以设置为内存中的数据库，也可以设置为其他数据库。

该领域的热门选择似乎是适用于 .Net 开发人员的 RavenDB 和适用于 Java 开发人员的 OrientDB。因为两者都可以用作内存数据库，并且根据配置“其他”，所以您可以根据您的配置使用其中一种（.Net 中的 app.config、Java 中的 Maven 或 Ant 设置）。

【讨论】：

【参考方案9】：

数据处理需求变得越来越复杂，产品生态系统也在不断发展以满足这些新需求。基于磁盘的 RDBMS、内存缓存和内存数据库用于满足不同的需求。你应该选择适合你需要的东西 -

传统的 RDBMS：您的 MySQL 集群足够快，易于维护，并且您喜欢 ACID 合规性的可靠性。

内存中分布式缓存：您的应用程序需要进行快速读取和写入，而不必过多担心一致性或复杂事务。

内存中 RDBMS：

速度

复杂性

可扩展性

可维护性

警告

【讨论】：

以上是关于使用sprintf函数时应该注意啥问题的主要内容，如果未能解决你的问题，请参考以下文章