ROS取数线程分析: 不带组装: socket选项SO_SNDBUF,SO_RCVBUF对带宽和CPU的影响
Posted 小荷才楼尖尖角
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了ROS取数线程分析: 不带组装: socket选项SO_SNDBUF,SO_RCVBUF对带宽和CPU的影响相关的知识,希望对你有一定的参考价值。
昨天用ROS, iperf, nettest测试了cmm02node06——>cmm02node01的带宽和cpu占用率,发送的包长为2KB,测试的结果为:
带宽 发送端CPU占用率 接收端CPU占用率
ROS 4.42Gb/s, 80% 100%
iperf 4.66Gb/s, 100% 70%
nettest 4.38Gb/s, 100% 71%
发现iperf和nettest都是发送端cpu达到100%, 而接受端只占到70%;ROS是接收端cpu达到了100%,发送端cpu占80%。为什么ROS的cpu占用率与其他两个软件不同呢?
为什么ROS接收端的CPU占用率为100%呢?先排除ROS的查询,判断,buffer等的影响,将ROS的取数线程简化为一个直接recv的线程:
1. SequentialInputHandler_directrecv.cpp文件,将requriment里的SequentialInputHandler替换成SequentialInputHandler_directrecv,主要是将readyToReadout和ReleaseFragment注释掉了. 见:
http://files.cnblogs.com/files/zengtx/ROS_SequentialInputHandler_directrecv.pdf
2. SequentialDataChannel.cpp里的inputFragment函数注释掉,换成简单的:
/*****************************************************/
unsigned int SequentialDataChannel::inputFragment(void)
/*****************************************************/
{
// if(!buffer) buffer = new char[m_robPageSize*100000*401] ;
char buffer[2048*20];
this->getNextFragment((unsigned int*)buffer, (unsigned long)m_robPageSize);
return 0 ;
}
这样ROS接收端的取数模型简化为阻塞recv的while循环。
此时的测试结果为:(msg_size = 2048)带宽为6.7Gb/s,接收端的cpu占用率仍为100%,发送端cpu占用率为83%。
带宽 发送端CPU占用率 接收端CPU占用率
ROS 4.42Gb/s, 80% 100%
ROS_directrecv 6.7Gb/s 83% 100%
iperf 4.66Gb/s, 100% 70%
nettest 4.38Gb/s, 100% 71%
接收端线程简化后,用来recv的时间比例增加,使得发送端的cpu占用率提高了一些。但是接收端cpu为什么比发送端cpu先达到100%呢?为什么ROS_directrecv的带宽比iperf,nettest的带宽更高呢?
通过比较了nettest和ROS的代码后发现,ROS的代码中多了两个socket选项设置:SO_SNDBUF,SO_RCVBUF,这两个值都被设置为256*1024。将这两个设置选项注释掉,再进行一次测试。
带宽 发送端CPU占用率 接收端CPU占用率
ROS 4.42Gb/s, 80% 100%
ROS_directrecv 6.7Gb/s 83% 100%
ROS_directrecv_nosetsockopt 4.64Gb/s 100% 70%
iperf 4.66Gb/s, 100% 70%
nettest 4.38Gb/s, 100% 71%
发现注释掉SO_SNDBUF,SO_RCVBUF选项设置后,测得的带宽变小了,发送端的CPU占用率为100%,接收端的CPU为70%,与iperf,nettest的测试结果接近。
查阅:http://bbs.csdn.net/topics/310236933
“SO_SNDBUF和SO_RCVBUF设置系统缓冲区的大小,在接受和发送数据时直接影响系统遍历缓冲区的行为,比如你实际发送的数据比较少,接收缓冲区却很大,系统做无效遍历的内容会增多,肯定会影响效率的。”
SO_SNDBUF, SO_RCVBUF在传输包长小,cpu为瓶颈时,这两个选项值会影响系统性能,具体值设为多少最优,需要做具体的测试确定。
以上是关于ROS取数线程分析: 不带组装: socket选项SO_SNDBUF,SO_RCVBUF对带宽和CPU的影响的主要内容,如果未能解决你的问题,请参考以下文章