R字符串编码西里尔字母
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R字符串编码西里尔字母相关的知识,希望对你有一定的参考价值。
我的数据库中似乎有一些以字母顺序存储为UTF-8的西里尔字符串。但是我需要使用R来恢复西里尔文。
例如,在数据库中,它存储为:"õÆ¿ª®Ï"
。我需要的是Москва
。
我尝试了一些使用iconv的东西,但不确定我是否需要首先双重转换字符串:
1. iconv(x, "UTF-8", "CP1251") # I get NA
2. iconv(x, "CP1251", "UTF-8") # I get ûûû "òƸл°¸»ª¿-õƸƺ±Ð"
我假设我需要先将字符串从UTF-8恢复为西里尔字母,但我得到了NA。
帮助赞赏
答案
enc2native
和enc2utf8
分别将字符向量的元素转换为本机编码或UTF-8,并考虑任何标记的编码。它们是原始函数,旨在进行最小化复制。
以上是关于R字符串编码西里尔字母的主要内容,如果未能解决你的问题,请参考以下文章