socket接收汉字问题

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了socket接收汉字问题相关的知识,希望对你有一定的参考价值。

Java端为客户端,c语言的服务端,客户端通过socket发送带有汉字的字符串,服务端接收,为什么接收到的汉字是乱码,无论是一个字节一个字节的接收还是用一个buff一起接收都是乱码,
char rcvbuf[256];
memset(rcvbuf,0x00,sizeof(rcvbuf));
..
iRet = recv(nfp, rcvbuf, 1, MSG_DONTWAIT);
..

这个涉及字符编码问题。

你可以在java端一般是Utf8格式的,c语言一般和系统一样是GBK编码的。所以需要你做一下编码转换。

服务器端接收之后,对接收到的字符串,进行编码转换。转成GBK编码,再显示,就没问题了
参考技术A 1. C/C++默认用 GBK 编码,GBK汉字点二个字节,java 端也要用GBK,java UTF-8 点三个字节

2、C++ 网络字节序是大端,java是小端,所以java需要转换一下
如java端int型转换成大端字节序:
private byte[] liob(int n)

byte[] b = new byte[4];
b[0] = (byte) (n & 0xff);
b[1] = (byte) (n >> 8 & 0xff);
b[2] = (byte) (n >> 16 & 0xff);
b[3] = (byte) (n >> 24 & 0xff);
return b;
追问

第一点是明白了,第二点大端小端是什么意思啊 ........ 谢谢

追答

通常我们认为,在空中传输的字节的顺序即网络字节序为标准顺序,考虑到与协议的一致以及与同类其它平台产品的互通,在程序中发数据包时,将主机字节序转换为网络字节序,收数据包处将网络字节序转换为主机字节序。网络字节顺序是TCP/IP中规定好的一种数据表示格式,它与具体的CPU类型、操作系统等无关,从而可以保证数据在不同主机之间传输时能够被正确解释。网络字节顺序采用big endian排序方式。
例子:在内存中双字0x01020304(DWORD)的存储方式
内存地址
4000 4001 4002 4003
小端:LE 04 03 02 01
大端:BE 01 02 03 04
补充:无论是大端到小端,还是小端到大端,只要是大于一个字节的,就要转换。

参考技术B 客户端和服务端字符编码统一下,试下吧,最好两边全是UTF-8 参考技术C 首先要收发的字符编码要一样,比如都是utf8的。
然后要保证数据编码要一样,比如都是 big-end的。
才能进行通信

当接收器离线时,socket.io 发出不工作

【中文标题】当接收器离线时,socket.io 发出不工作【英文标题】:socket.io emit not working when the receiver is offline 【发布时间】:2021-11-04 06:57:21 【问题描述】:

我想从用户那里接收值,将其更新到 MongoDb,然后将其转发给具有特定 targetId 的接收器。现在,当两个用户都在线时,它工作正常,但是当接收器离线时,应用程序崩溃并且错误是无法读取未定义的属性发射。请帮我解决这个问题。

socket.on('data',Accmsg => 
    const findRsvpAndUpdate = (result,callback)=>
        var value = summa.findOneAndUpdate(
            $or:[sourceId:Accmsg.sourceId,targetId:Accmsg.targetId,sourceId: Accmsg.targetId,targetId: Accmsg.sourceId],
            receive:Accmsg.receive,give:Accmsg.give,sourceId:Accmsg.sourceId,targetId:Accmsg.targetId,upsert: true,new:true,
            function (error,results)
                if (error) 
                    callback(error);
                 else 
                    callback(null, results);
                
            )
    
        findRsvpAndUpdate(Accmsg, (error, result) => 
            if (error) 
                console.log(error);
             else 
                console.log("The result is " +result);
                try 
                    let targetId = Accmsg.targetId;
                    clients[targetId].emit('clientAccount', Accmsg);// problem causing code line
                catch (e)
                    console.log(e);
                

            
        );
);

【问题讨论】:

在调用.emit() 之前检查clients[targetId] 是否未定义。 因为接收器没有连接所以clients[targetId]不是socket。 【参考方案1】:

我解决了这个问题。我使用try catch 处理此错误,现在它工作正常。

【讨论】:

请添加更多详细信息以扩展您的答案,例如工作代码或文档引用。

以上是关于socket接收汉字问题的主要内容,如果未能解决你的问题,请参考以下文章

java Httpserver 传递过来的json里面的汉字 接收到的每个汉字对应一个问号“?” 请问该如何解决这个问题

python 怎么解析 websocket 传来的汉字 乱码

python用socket 接收数据问题?

C++ socket传送和接收结构体问题,求大神帮忙

Socket压力测试问题,服务端Socket长连接循环接收并处理信息

Socket压力测试问题,服务端Socket长连接循环接收并处理信息