将语言环境设置为系统默认 UTF-8

Posted

技术标签:

【中文标题】将语言环境设置为系统默认 UTF-8【英文标题】:Set locale to system default UTF-8 【发布时间】:2014-01-01 21:16:44 【问题描述】:

在 rApache 中运行 R 时,语言环境是从 Apache 网络服务器继承的,因此 Sys.getlocale() 始终等于 "C"。我希望我的网络应用程序使用UTF8,所以我使用:

Sys.setlocale("LC_ALL", 'en_US.UTF-8')

但是,这在没有此语言环境可用的机器上不起作用:

1: Setting LC_CTYPE failed, using "C" 
2: Setting LC_COLLATE failed, using "C" 
3: Setting LC_TIME failed, using "C" 
4: Setting LC_MESSAGES failed, using "C" 
5: Setting LC_MONETARY failed, using “C”

有没有办法使用Sys.setlocale 将语言环境设置为系统默认UTF-8? IE。也可以在 Windows 或德语 Linux 上运行?

【问题讨论】:

您是否考虑过将任何从“外部”读取的编码设置为“UTF-8”? 我不确定你的意思 我记错了本周早些时候在 rdev 上阅读的内容。也许其中之一会有所帮助:***.com/questions/9387910/…***.com/questions/17985201/…***.com/questions/5674519/… 【参考方案1】:

试试这个:

Sys.setlocale(category = "LC_ALL", locale = "English_United States.1252")

【讨论】:

是的,没错。我只在 Windows 7、64 位上测试过它。我不确定 linux 版本,但我记得有一次我在 ubuntu 上遇到这个问题,我按照这个链接上的说明更改了我的语言环境设置。 askubuntu.com/questions/162391/how-do-i-fix-my-locale-issue。请不要引用我的 linux 版本,因为我不确定。 我刚刚在我的 ubuntu 机器上测试了这个。我点击了我之前评论中的链接。然后,我打开了一个新的“R”会话。区域设置自动更改为 en_US.UTF8。如果要恢复为“C”语言环境类型或“POSIX”类型,请使用函数:Sys.setlocale(category = "LC_ALL", locale = "C")。 HTH 这实际上并未将语言环境设置为 UTF-8。此设置是 latin1。 就我而言,我通过使用同一行但将"en_US.UTF-8" 设置为区域设置解决了我的编码问题。非常感谢这个【参考方案2】:

回答我自己的问题:在 Ubuntu 上,默认 LANG/etc/default/locale 中定义:

jeroen@dev:~⟫ cat /etc/default/locale
# Created by cloud-init v. 0.7.7 on Wed, 29 Jun 2016 11:02:51 +0000
LANG="en_US.UTF-8"

所以在 R 中我们可以这样做:

readRenviron("/etc/default/locale")
LANG <- Sys.getenv("LANG")
if(nchar(LANG))
   Sys.setlocale("LC_ALL", LANG)

Apache 在/etc/apache2/envvars 中还有一行可以取消注释以启用此功能。

【讨论】:

谢谢,这确实解决了 RApache 在以 UTF-8 向 Web 服务发送文本时的问题【参考方案3】:

我猜你需要检查一下操作系统。语言环境名称因操作系统而异,请参阅帮助文件中的示例。

?Sys.getlocale()

Examples

Sys.getlocale()
Sys.getlocale("LC_TIME")
## Not run: 
Sys.setlocale("LC_TIME", "de")     # Solaris: details are OS-dependent
Sys.setlocale("LC_TIME", "de_DE.utf8")   # Modern Linux etc.
Sys.setlocale("LC_TIME", "de_DE.UTF-8")  # ditto
Sys.setlocale("LC_TIME", "de_DE")  # OS X, in UTF-8
Sys.setlocale("LC_TIME", "German") # Windows

## End(Not run)
Sys.getlocale("LC_PAPER")          # may or may not be set

## Not run: 
Sys.setlocale("LC_COLLATE", "C")   # turn off locale-specific sorting,
                                   # usually, but not on all platforms
## End(Not run)

【讨论】:

以上是关于将语言环境设置为系统默认 UTF-8的主要内容,如果未能解决你的问题,请参考以下文章

Sonar以Sonar默认语言环境之外的其他语言显示违规消息

在Ubuntu 20.04上构建ROS 2 Foxy Fitzroy

在Ubuntu 20.04上构建ROS 2 Foxy Fitzroy

R语言-环境变量设置

如何设置linux服务器的语言 字符encode为utf-8编码

options:R语言环境变量设置