R说话中的哪些呼吁可能包让你相知恨晚 架构&设计

来源:互联网 / 作者:SKY / 2016-08-17 21:30 / 点击:
我从开始学R到此刻一向都在发明“相知恨晚”的R包。

我从开始学R到此刻一向都在发明“相知恨晚”的R包。

说明与建模:

Matrix包:先辈的稀少矩阵处理赏罚,不相识稀少矩阵观念的时辰内存占用和运行速率都不忍直视。

Reshape2/ddply:数据处理赏罚不消愁。

*apply系列:比for更好用的函数,个中tapply远不如lapply风行,中国站长站,可是适用水平不在其下。现实上lapply有没有变快得看大师的实现,由于固然lapply挪用了C实现,可是它照旧要转头挪用在R里用户界说的函数才气做计较,这个函数速率怎样才是要害。

compiler包:纵然代码里有for也可以加快。

foreach:通用的并行接口,跨平台多成果。

lubridate:处理赏罚时刻日期名目不求人。

gbm:结果和randomForest临近,可是占用内存很少很幸福,并且支持多核 CrossValidation 运算。

stats::optim():做优化的最傻瓜选择。不信看这个三行R代码做出SVM:weibo.com/1459604443/A3,不懂牛顿法也不要紧。


陈诉与可视化:

knitr/slidify:knitr是 @谢益辉 的代表作。做陈诉、幻灯片 so easy,可是slidify的作者不喜好写文档,以是很头疼。

shiny:用R天生Web App,后端强劲接口同一。譬喻:hetong.shinyapps.io/img 。

recharts:在R中利便快捷地天生可交互图形,再也不消从R换到js了。


其他:

devtools::install_github():离开CRAN强权统治,Github让天下更柔美。

base::match():许多环境下比which,is.element不知高到那边去了。

utils::read.table():配置nrows能提前分派内存,配置comment.char=""与colClasses更能加速读入。

OpenBLAS库:固然不是R包,可是多核CPU上对矩阵运算的加快结果其实是太利便明明晰,并且Ubuntu上安装利便,并不必要从头编译R。

界说启动项:假如对stringsAsFactors永久默以为TRUE深痛恶觉,可以修改Rprofile.site文件,加上每次启动都自动运行的呼吁。 @任坤 在评述中提到:界说启动项较量伤害,不留意的话会使得代码的可移植性呈现题目哦,放到别人电脑上一运行发明各类factor。

进级R包:R的版本更迭之后,可以把老R包复制到新版本的library目次下,然后运行 update.packages(checkBuilt=TRUE, ask=FALSE) ,这是官方的提醒,放在FAQ里,不知道有几多人寄望了:

阅读延展

1
3