[R]R语言的module工程化

Posted odoraemon

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了[R]R语言的module工程化相关的知识,希望对你有一定的参考价值。

很遗憾,这还是一个挖坑的问题,解决方案并不是很确定。

需求是,大多数的语言都提供import包或module的功能,避免全部代码写到一个文件中,方便管理与维护。

如常用的database模块,每次写R脚本都需要声明一次数据库连接的话,不仅安全性差,账户密码到处散落,而且修改起来也十分麻烦。

然而很有意思的是,你根本搜不到这方面的内容,似乎没人用R这么做。一般的library或require包并不适用于自己写的脚本模块,而且介绍将R脚本打包的资料我也没有找到。

Hadly Wickham 的Advanced R也没有提及相关内容。

几年前看Rob J Hydman的一篇文章,介绍R的workflow,推荐将一个项目分解为load.R, function.R, do.R等几个文件。其中文件与文件的调用是通过source去载入。

可能是习惯了其他语言的module或包机制,从个人感觉上,使用source多少有些膈应。虽然你看linux上也是通过source文件使配置生效,但感觉不是很直观。

所以,R有没有import module这样的包机制及工程化指导?隐隐感觉source好像就是其解决方案。

 

以上是关于[R]R语言的module工程化的主要内容,如果未能解决你的问题,请参考以下文章

当R语言遇上Docker

R语言使用特征工程泰坦尼克号数据分析应用案例

JavaScript模块化-require.js,r.js和打包发布

R语言caret包构建xgboost模型实战:特征工程(连续数据离散化因子化无用特征删除)配置模型参数(随机超参数寻优10折交叉验证)并训练模型

R语言构建xgboost模型:使用xgboost模型训练tweedie回归模型,特征工程(dataframe转化到data.table独热编码缺失值删除DMatrix结构生成)

大数据工程师的必备技能