我应该读/写多少字节到一个套接字?
Posted
技术标签:
【中文标题】我应该读/写多少字节到一个套接字?【英文标题】:How many bytes should I read/write to a socket? 【发布时间】:2014-11-03 02:36:10 【问题描述】:我对在 Unix 上应该通过 C 中的套接字写入/读取的字节数有一些疑问。我习惯发送 1024 字节,但有时发送短字符串时确实太多了。
我从一个文件中读取一个字符串,我不知道这个字符串是多少字节,它每次都可以变化,可以是10、20或1000。我只知道它是strlen())。那么,无论我从文件中读取的字符串的长度如何,唯一的解决方案是始终读取最大字节数(在这种情况下为 1024)?
例如,使用以下代码:
read(socket,stringBuff,SIZE);
如果我想读取一个 10 字节的字符串,如果 SIZE
是 10 而不是 1024 不是更好吗?
【问题讨论】:
recv()
返回通过套接字接收的字节数。
请不要用一个问题来宣传另一个问题。
@timrau 是的,我知道,也读过,但如果我没记错的话,当你写一个读调用时,你应该写一些类似 read(socket,stringBuff,SIZE) 的东西,并且在SIZE 您必须指定要读取的字符数。我的意思是,如果我读取一个 10 字符的字符串,如果 SIZE 是 10 而不是 1024 会更好吗?
为您使用的任何协议的标头读取足够的字节,然后从该标头中计算出预期的长度,然后读取那么多字节
【参考方案1】:
在您问题的代码中,如果只有 10 个字节要读取,那么 SIZE
是 10 个字节、1,024 个字节还是 1,000,024 个字节都没有区别 - 它仍然只会读取 10 个字节。唯一的区别是您为其预留了多少内存,如果您可以接收最多 1,024 字节的字符串,那么无论如何您都必须预留这么多内存。
但是,无论您尝试读取多少字节,您始终必须为read()
实际读取不同数量的字节的可能性做好准备。特别是在网络上,当您在传输中遇到延迟时,即使您的服务器正在发送一个 1,024 字节的字符串,在您的客户端调用 read()
时到达的字节数也可能少于该字节数,在这种情况下,您将阅读少于 1,024。
因此,您必须随时准备好在不止一个read()
电话中获得您的意见。这意味着您需要能够判断何时完成读取输入 - 您不能仅依靠 read()
已返回来告诉您您已完成的事实。如果您的服务器在您阅读第一条消息之前可能会发送多条消息,那么您显然不能指望这一点。
您有三个主要选择:
始终发送大小相同的消息,必要时可能用零填充较小的字符串。这对于 TCP 流来说通常不是最理想的。只需阅读,直到您收到准确的字节数。
有某种哨兵机制来告诉您消息何时结束。这可能是换行符、CRLF
、空行或一行上的一个点,后跟一个空行,或者任何适用于您的协议的内容。继续阅读,直到您收到此哨兵。为了避免一次对一个字符进行低效的系统调用,您需要实现某种缓冲机制以使其正常工作。如果您可以确定您的服务器正在向您发送以单个 '\n'
字符结尾的行,那么可以选择使用 fdopen()
和标准 C I/O 库。
让您的服务器告诉您消息有多大(在初始固定长度字段中,或使用第 2 点中的相同类型的哨兵机制),然后继续阅读,直到您获得该数量字节。
【讨论】:
【参考方案2】:read()
系统调用会阻塞,直到它可以读取一个或多个字节,或者直到发生错误。
它不保证它会读取您请求的字节数!使用 TCP 套接字时,read()
返回的比您请求的少是很常见的,因为它无法返回仍在通过网络传播的字节。
因此,您必须检查 read()
的返回值,如果您没有获得所需的一切,则必须再次调用它以获取更多数据,一次又一次,直到您拥有一切。
【讨论】:
感谢您的帮助!以上是关于我应该读/写多少字节到一个套接字?的主要内容,如果未能解决你的问题,请参考以下文章