R字符串编码西里尔字母

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R字符串编码西里尔字母相关的知识,希望对你有一定的参考价值。

我的数据库中似乎有一些以字母顺序存储为UTF-8的西里尔字符串。但是我需要使用R来恢复西里尔文。

例如,在数据库中,它存储为:"õÆ¿ª®Ï"。我需要的是Москва

我尝试了一些使用iconv的东西,但不确定我是否需要首先双重转换字符串:

1. iconv(x, "UTF-8", "CP1251")  # I get NA
2. iconv(x, "CP1251", "UTF-8")  # I get  ûûû "òƸл°¸»ª¿-õƸƺ±Ð"

我假设我需要先将字符串从UTF-8恢复为西里尔字母,但我得到了NA。

帮助赞赏

答案

enc2nativeenc2utf8分别将字符向量的元素转换为本机编码或UTF-8,并考虑任何标记的编码。它们是原始函数,旨在进行最小化复制。

以上是关于R字符串编码西里尔字母的主要内容,如果未能解决你的问题,请参考以下文章

GB2312 编码

转GB2312 编码

Firebird 数据库无法识别 unicode/西里尔字母

西里尔字母的 iOS 推送通知

PHP 中的西里尔字母音译

PHP 中的西里尔字母音译