R
Awesome R¶
很棒的 R 包和工具的精选列表. 灵感来自 awesome-machine-learning.
前 50 个CRAN 下载包或回购 400+
- Awesome R
- 2020
- 2019
- 2018
- Integrated Development Environments
- Syntax
- Data Manipulation
- Graphic Displays
- Html Widgets
- Reproducible Research
- Web Technologies and Services
- Parallel Computing
- High Performance
- Language API
- Database Management
- Machine Learning
- Natural Language Processing
- Bayesian
- Optimization
- Finance
- Bioinformatics and Biostatistics
- Network Analysis
- Spatial
- R Development
- Logging
- Data Packages
- Other Tools
- Other Interpreters
- Learning R
- Resources
- Other Awesome Lists
- Contributing
2020¶
- VSCode - vscode-R + vscode-r-lsp VSCode R 语言支持
- gt - 从 R 轻松生成信息丰富、出版质量高的表格
- lightgbm
- 光梯度提升机.
- torch - 具有“GPU”加速的张量和神经网络.
2019¶
Integrated Development Environments¶
集成开发环境
- VSCode
- vscode-R + vscode-r-lsp VSCode R 语言支持
- RStudio
- 强大而高效的 R 用户界面.在 Windows、Mac 和 Linux 上运行良好.
- Emacs + ESS - Emacs Speaks Statistics 是 emacs 文本编辑器的附加包.
- Sublime Text + R-Box - Sublime Text ⅔ 的附加包.
- TextMate + r.tmblundle - TextMate ½ 的附加包.
- StatET - 基于 Eclipse 的 R IDE.
- Microsoft R - Revolution R 将免费提供给学术用户,商业软件将专注于大数据、大规模多处理器功能.
- R Commander - 提供基本图形用户界面的包.
- Deducer - 菜单驱动的数据分析 GUI,带有类似数据编辑器的电子表格.
- Radiant - 一个独立于平台的基于浏览器的界面,用于 R 中的业务分析,基于 Shiny.
- Vim-R - R 的 Vim 插件.
- Nvim-R - R 的 Neovim 插件.
- Jamovi 和 JASP - Desktop software for both Bayesian 和 Frequentist methods, using a UI familiar to SPSS users.
- Bio7 - IDE 包含用于生态建模的模型创建、科学图像分析和统计分析的工具.
- RTVS - 用于 Visual Studio 的 R 工具.
- RKWard - 用于 R 的可扩展 IDE/GUI.
Syntax¶
软件包改变了您使用 R 的方式.
Data Manipulation¶
烹饪数据包.
- tidyr - 使用传播和收集功能轻松整理数据.
- rlist - 用于使用列表进行非表格数据操作的工具箱.
- ff - 旨在存储大型数据集的数据结构.
- lubridate - 一组处理日期和时间的函数.
- bigmemory - 共享内存和内存映射矩阵. big* 包提供了额外的工具,包括线性模型(biglm) 和随机森林 (bigrf).
- fuzzyjoin - 在不精确匹配时将表连接在一起.
- tidyverse - 从 tidyverse 轻松安装和加载包.
- snakecase - 自动解析字符串并将其转换为 snake 或 camel 等大小写.
- DataExplorer - 使用最少的代码进行快速探索性数据分析.
Data Formats¶
用于读取和写入不同格式数据的包.
- arrow
- Arrow C++ 库的接口.
- fst
- R 数据帧的闪电般快速序列化.
- haven - 改进了在 R 中导入 SPSS、Stata 和 SAS 文件的方法.
- jsonlite - 一种在 R 中解析 JSON 文件的可靠且快速的方法.
- qs - R 对象的快速序列化.
- readxl
- 将 excel 文件(.xls 和 .xlsx)读入 R.
- rio - 用于数据 I/O 的瑞士军刀.
- readODS - 将 OpenDocument 电子表格作为 data.frames 读入 R.
- RcppTOML - Rcpp 绑定到 TOML 文件的 C++ 解析器.
- vroom - 快速阅读分隔文件.
- writexl - 便携式、轻量级数据框到 R 的 xlsx 导出器.
- yaml - 用于将对象与 YAML 相互转换的 R 包.
Graphic Displays¶
显示数据的包.
- ggfortify - A unified interface to ggplot2 popular statistical packages using one line of code.
- ggrepel - 将重叠的文本标签相互排斥.
- ggalt - ggplot2 的额外坐标系、Geoms 和统计转换.
- ggstatsplot - 基于 ggplot2 的具有统计详细信息的图
- ggtree - 系统发育树的可视化和注释.
- ggtech - ggplot2 技术主题和尺度
- ggplot2 Extensions - ggplot2 扩展展示.
- lattice - 一个强大而优雅的高级数据可视化系统.
- corrplot - 相关矩阵或一般矩阵的图形显示. 它还包含一些算法来进行矩阵重新排序.
- rgl - R 的 3D 可视化设备系统.
- Cairo - 使用 cairo 图形库创建高质量显示输出的 R 图形设备.
- extrafont - 在 R 图形中使用字体的工具.
- showtext - 启用 R 图形设备以使用系统字体显示文本.
- animation - 在 R 中生成动画图形的简单方法,使用 ImageMagick.
- gganimate - 使用 ggplot2 创建简单的动画.
- misc3d - 处理 3d 图、等值面等的强大功能.
- xkcd - 在图形中使用 xkcd 样式.
- imager - 基于 CImg 库的图像处理包,用于处理图像并显示它们.
- hrbrthemes - 以排版为中心的 ggplot2 主题和主题组件.
- waffle - 在 R 中制作华夫饼(方形饼图)图表.
- dendextend - 可视化、调整和比较层次聚类树.
- idendro - 树状图(层次聚类树)的交互式探索.
- r2d3 - D3 可视化的 R 接口
- Patchwork - 将单独的 ggplots 合并到同一个图形中.
- plot3D - 绘制多维数据
- plot3Drgl - 绘制多维数据 - 使用“rgl”
- httpgd - R 的异步 http 服务器图形设备.
HTML Widgets¶
交互式可视化包.
- heatmaply - 使用 D3 的交互式热图.
- d3heatmap - D3 的交互式热图(不再维护).
- DataTables - 将 R 矩阵或数据框显示为交互式 HTML 表格.
- dygraphs - 在 R 中绘制时间序列数据图表.
- Leaflet - 最流行的 JavaScript 库交互式地图之一.
- MetricsGraphics - 可以轻松创建 D3 散点图、折线图和直方图.
- networkD3 - 来自 R 的 D3 JavaScript 网络图.
- scatterD3 - 使用 D3 的交互式散点图.
- rbokeh -R 接口 Bokeh.
- threejs - 交互式 3D 散点图和地球仪.
- timevis - 创建完全交互式的时间线可视化.
- visNetwork - 使用 vis.js 库进行网络可视化.
- wordcloud2 - R interface to wordcloud2.js.
- highcharter - 基于 htmlwidgets 的 highcharts 的 R 包装器
- echarts4r - Echarts 版本 4 的 R 包装器
Reproducible Research¶
用于文学编程和可重现工作流程的软件包.
- redoc - 可逆可复制文件
- tinytex - 轻量级且易于维护的 LaTeX 发行版
- xtable - 将表格导出为 LaTeX 或 HTML.
- rapport - 一个 R 模板系统.
- rmarkdown
- R 的动态文档.
- Sweave - 旨在使用 R 编写 LaTeX 报告的软件包.
- texreg - 在 LaTex 和 HTML 中格式化统计模型.
- checkpoint - 从检查点服务器上的快照安装包.
- brew - 预计算数据以增强您的报告模板. 可以与 knitr 结合使用.
- officer - 用于生成 Microsoft Word、Microsoft PowerPoint 和 HTML 报告的 R 包.
- flextable - 用于在 Microsoft Word、Microsoft PowerPoint 和 HTML 报告中嵌入复杂表格(合并单元格、多级页眉和页脚、条件格式)的 R 包. 它与 [officer] 包合作并与 [rmarkdown] 报告集成.
- bookdown - 使用 R Markdown 创作书籍.
- ezknitr - 使用“knitr”时避免典型的工作目录痛苦
- drake - 一个 rOpenSci package for reproducible data science workflows too big for knitr.
- R Suite - 用于为 R 设计灵活且可重现的部署工作流程的软件包.
- kable - 使用来自“knitr”的“kable()”构建精美的 HTML 或“LaTeX”表格.
Web Technologies and Services¶
用于上网冲浪的套餐.
- Web Technologies List - 关于如何一起使用 R 和万维网的信息.
- shinyjs - 在几秒钟内轻松改善 Shiny 应用程序中的用户交互和用户体验.
- RCurl - R 的通用网络(HTTP/FTP/...)客户端接口.
- curl - 用于 R 的现代且灵活的 Web 客户端.
- httpuv - HTTP 和 WebSocket 服务器库.
- XML
- 在 R 中解析和生成 XML 的工具.
- xml2
- 用于在 R 中解析和生成 XML 的优化工具.
- OpenCPU
- 用于 R 处理并发调用的 HTTP API,基于 Apache2 网络服务器,将 R 代码公开为 REST 网络服务,并创建全尺寸、多页面的网络应用程序.
- Rfacebook - 通过 R 访问 Facebook API.
- RSiteCatalyst - Adobe Analytics 的 R 客户端库.
- plumber - 将现有 R 代码公开为 Web API 的库.
- golem - 用于构建生产级 Shiny 应用程序的框架.
Parallel Computing¶
并行计算包.
- parallel - R 从 2.14.0 版开始,其中包括一个新的包并行合并(略微修改)包的副本 multicore 和 snow.
- Rmpi - Rmpi 为 MPI API 提供接口(包装器). 它还提供交互式 R 从属环境.
- foreach
- 并行执行循环.
- future
- 一个最小的、高效的、跨平台的统一未来 API,用于 R 中的并行和分布式处理; 专为初学者和高级开发人员设计.
- DistributedR - 来自 HP Vertica Analytics Team 的可扩展高性能平台.
- ddR - 提供分布式数据结构并简化 R 中的分布式计算.
- sparklyr - 来自 RStudio 的 Apache Spark 的 R 接口.
- batchtools - 使用 LSF、TORQUE、Slurm、OpenLava、SGE 和 Docker Swarm 的高性能计算.
High Performance¶
使 R 更快的包.
- Rcpp
- Rcpp 在 R 之上提供了一个强大的 API,使 R 中的功能变得非常快.
- Rcpp11 - Rcpp11 是对 Rcpp 的完全重新设计,针对 C++11.
- compiler - 使用 JIT 加速你的 R 代码
- cpp11 - cpp11 是一个仅包含标头的 R 包,可帮助 R 包开发人员使用 C++ 代码处理 R 对象. 它类似于 Rcpp,但具有不同的设计权衡和功能.
Language API¶
其他语言的包.
- rJava - 低级 R 到 Java 接口.
- jvmr - R、Java 和 Scala 的集成.
- reticulate
- 与“Python”的接口.
- rJython - 通过 Jython 与 Python 的 R 接口.
- rPython - 允许 R 调用 Python 的包.
- runr - 从 R 运行 Julia 和 Bash.
- RJulia - R 包调用 Julia.
- JuliaCall - R 和 Julia 之间的无缝集成.
- RinRuby - 在 Ruby 中集成 R 解释器的 Ruby 库.
- R.matlab - 读写 MAT 文件以及 R 到 MATLAB 的连接.
- RcppOctave - 与 Octave 和 Matlab 的无缝接口.
- RSPerl - 用于从 Perl 调用 R 和从 R 调用 Perl 的双向接口.
- V8 - 嵌入式 JavaScript 引擎.
- htmlwidgets - 为 R 带来最好的 JavaScript 数据可视化.
- rpy2 - R 的 Python 接口.
Database Management¶
用于管理数据的包.
- RODBC - R 的 ODBC 数据库访问.
- DBI - 定义 R 和数据库管理系统之间的通用接口.
- elastic - Elasticsearch HTTP API 的包装器
- mongolite - 用于 R 的流式 Mongo 客户端
- odbc - 连接到 ODBC 数据库(使用 DBI 接口)
- RMariaDB - MariaDB 的 R 接口(旧 RMySQL 包的替代品)
- RMySQL - MySQL 数据库的 R 接口.
- ROracle - 用于 R 的基于 OCI 的 Oracle 数据库接口.
- RPostgres - 与 postgres 数据库兼容的 DBI 接口.
- RPostgreSQL - PostgreSQL 数据库系统的 R 接口.
- RSQLite - R 的 SQLite 接口
- RJDBC - 通过 JDBC 接口提供对数据库的访问.
- rmongodb - MongoDB 的 R 驱动程序.
- redux - R 的 Redis 客户端.
- RCassandra - Apache Cassandra 最基本功能的直接接口(非 Java).
- RHive - R 扩展通过 Apache Hive 促进分布式计算.
- RNeo4j - Neo4j 图形数据库驱动程序.
- rpostgis - 与 PostGIS 数据库的 R 接口并在 R 中获取空间对象.
Machine Learning¶
使 R 更聪明的软件包.
- anomalize - 使用 Twitter 的 AnomalyDetection 方法进行整洁的异常检测.
- ahaz - 半参数附加风险回归的正则化.
- arules - 挖掘关联规则和频繁项集
- bigrf - 大随机森林:分类和回归森林 大数据集
- bigRR - 广义岭回归(对 p >> n 具有特殊优势 cases)
- bmrm - 正规化风险最小化包的捆绑方法
- Boruta - 用于所有相关特征选择的包装算法
- bst - 梯度提升
- C50 - C5.0 决策树和基于规则的模型
- caret
- 分类和回归训练
- Clever Algorithms For Machine Learning
- CORElearn - 分类、回归、特征评估和序数 evaluation
- CoxBoost - Cox 模型通过基于可能性的单次生存提升 终点或竞争风险
- Cubist - 基于规则和实例的回归建模
- e1071 - 维也纳工业大学统计系的其他职能 (e1071)
- earth - 多元自适应回归样条模型
- elasticnet - 用于稀疏估计和稀疏 PCA 的 Elastic-Net
- ElemStatLearn - 书中的数据集、函数和示例:“元素 统计学习、数据挖掘、推理和 预测”,作者:Trevor Hastie、Robert Tibshirani 和 Jerome Friedman
- evtree - 全局最优树的进化学习
- fable - 常用的单变量和多变量时间序列预测模型的集合
- FSelector - 基于子集搜索或特征排名方法的特征选择框架.
- frbs - 用于分类和回归任务的基于模糊规则的系统
- GAMBoost - 基于似然的广义线性和加性模型 boosting
- gamboostLSS - GAMLSS 的提升方法
- gbm - 广义增强回归模型
- glmnet
- 套索和弹性网正则化广义线性模型
- glmpath - 广义线性模型和 Cox 的 L1 正则化路径 Proportional Hazards Model
- GMMBoost - 广义混合模型的基于可能性的提升
- grplasso - 使用 Group Lasso 惩罚来拟合用户指定的模型
- grpreg - 分组回归模型的正则化路径 covariates
- h2o
- 深度学习、随机森林、GBM、KMeans、PCA、GLM
- hda - 异方差判别分析
- ipred - 改进的预测器
- kernlab - kernlab:基于内核的机器学习实验室
- klaR - 分类和可视化
- kohonen - 监督和无监督的自组织地图.
- L0Learn - 最佳子集选择的快速算法
- lars - 最小角度回归、Lasso 和 Forward Stagewise
- lasso2 - L1 约束估计又名“套索”
- LiblineaR - 基于 Liblinear C/C++ 库的线性预测模型
- lightgbm
- 光梯度提升机.
- nlme
- 混合效应模型,处理用户指定的残差协方差矩阵,与纵向试验中重复观察的分析相关
- glmmTMB - 广义混合效应模型,处理用户指定的残差协方差矩阵,与纵向试验中重复观察的分析相关
- LogicReg - 逻辑回归
- maptree - 映射、修剪和绘制树模型
- mboost - 基于模型的提升
- mlr - 用于分类、回归、生存分析和聚类的可扩展框架 [已弃用]
- mvpart - 多元分区
- ncvreg - SCAD 和 MCP 惩罚回归的正则化路径 models
- nnet - 前馈神经网络和多项式对数线性模型
- oblique.tree - 分类数据的斜树
- pamr - Pam:微阵列的预测分析
- party - 递归派对实验室
- partykit - 递归派对工具包
- penalized - L1(套索和融合套索)和 L2(脊)惩罚估计 在 GLM 和 Cox 模型中
- penalizedLDA - 使用 Fisher 的线性判别式进行惩罚分类
- penalizedSVM - 使用惩罚函数的特征选择支持向量机
- quantregForest - quantregForest:分位数回归森林
- randomForest - randomForest:用于分类和回归的 Breiman 和 Cutler 的随机森林.
- randomForestSRC - randomForestSRC:用于生存、回归和分类的随机森林 (RF-SRC).
- ranger - 随机森林的快速实施.
- rattle - 用于 R 中数据挖掘的图形用户界面.
- rda - 收缩质心正则化判别分析
- rdetools - 特征空间中的相关维度估计(RDE)
- REEMtree - 具有纵向随机效应的回归树(面板) Data
- relaxo - 放松套索
- rgenoud - R 版本的遗传优化使用衍生物
- rgp - R遗传编程框架
- Rmalschains - 使用本地模因算法进行持续优化 R 中的搜索链 (MA-LS-Chains)
- rminer - 更简单地使用数据挖掘方法(例如 NN 和 SVM) 分类和回归
- ROCR - 可视化评分分类器的性能
- RoughSets - 使用粗糙集和模糊粗糙集理论进行数据分析
- rpart - 递归分区和回归树
- RPMM - 递归分区混合模型
- RSNNS - 使用 Stuttgart 神经网络的 R 神经网络 模拟器(SNNS)
- Rsomoclu - 自组织映射的并行实现.
- RWeka - R/Weka 接口
- RXshrink - RXshrink:通过广义岭或最小的最大似然收缩 角度回归
- sda - 收缩判别分析和 CAT 分数变量选择
- SDDA - 逐步对角判别分析
- SuperLearner 和 subsemble - 多算法集成学习包.
- survminer - 生存分析和可视化
- survival - 生存分析
- svmpath - svmpath:SVM路径算法
- tgp - 贝叶斯树高斯过程模型
- tidymodels - 一组用于建模和统计分析的包,它们共享 tidyverse 的基本设计理念、语法和数据结构.
- torch - 具有“GPU”加速的张量和神经网络.
- tree - 分类和回归树
- varSelRF - 使用随机森林进行变量选择
Natural Language Processing¶
自然语言处理包.
- text2vec - 用于矢量化和词嵌入的快速文本挖掘框架.
- tm - 一个全面的 R 文本挖掘框架.
- openNLP - Apache OpenNLP 工具界面.
- koRpus - 用于文本分析的 R 包.
- zipfR - 词频分布的统计模型.
- NLP - 自然语言处理的基本功能.
- LDAvis - 主题模型的交互式可视化.
- topicmodels - 由 David M. Blei 为主题建模(潜在狄利克雷分配 (LDA) 和相关主题模型 (CTM))开发的 C 代码的主题建模接口.
- syuzhet - 使用三种不同的情感词典从文本中提取情感.
- SnowballC - 基于 C libstemmer UTF-8 库的 Snowball 词干提取器.
- quanteda - 用于文本数据定量分析的 R 函数.
- Topic Models Resources - 主题模型学习和 R 相关资源.
- MonkeyLearn -R 包,用于使用 Monkeylearn 进行文本分析.
- tidytext - 将 Hadley Wickham 的整洁原则应用于文本挖掘.
- utf8 - 处理和打印 UTF-8 文本,修复了 R 的 UTF-8 处理中的多个错误.
- corporaexplorer - 文本集合的动态探索
Bayesian¶
贝叶斯推理包.
- coda - MCMC 的输出分析和诊断.
- mcmc - 马尔可夫链蒙特卡洛.
- MCMCpack - 马尔可夫链蒙特卡洛 (MCMC) 包.
- R2WinBUGS - 从 R/S-PLUS 运行 WinBUGS 和 OpenBUGS.
- BRugs - OpenBUGS MCMC 软件的 R 接口.
- rjags - JAGS MCMC 库的 R 接口.
- rstan
- Stan MCMC 软件的 R 接口.
Optimization¶
优化包.
- lpSolve - 与“Lp_solve”的接口以求解线性/整数程序.
- minqa - 通过二次近似的无导数优化算法.
- nloptr - NLopt 是一个用于非线性优化的免费/开源库.
- ompr - 直接在 R 中以代数方式对混合整数线性程序建模.
- Rglpk - R/GNU 线性编程工具包接口
- ROI - R 优化基础结构(“ROI”)是用于处理 R 中优化问题的复杂框架.
Finance¶
处理金钱的套餐.
- quantmod
- R 的定量金融建模和交易框架.
- pedquant - 公共经济数据和定量分析
- TTR - 使用 R 构建技术交易规则的功能和数据.
- PerformanceAnalytics - 用于绩效和风险分析的计量经济学工具.
- zoo
- 用于规则和不规则时间序列的 S3 基础设施.
- xts - 可扩展时间序列.
- tseries - 时间序列分析和计算金融.
- fAssets - 分析和建模金融资产.
- scorecard - 信用风险记分卡
Bioinformatics and Biostatistics¶
用于处理生物数据集的包.
- Bioconductor
- 用于分析和理解高通量基因组数据的工具.
- genetics - 处理遗传数据的类和方法.
- gap - 用于对人口和家庭数据进行遗传数据分析的综合包.
- ape - 系统发育和进化分析.
- pheatmap - 漂亮的热图变得简单.
- lme4 - 广义混合效应模型.
- nlme - 混合效应模型,处理用户指定的残差协方差矩阵,与纵向试验中重复观察的分析相关.
- glmmTMB - 广义混合效应模型,处理用户指定的残差协方差矩阵,与纵向试验中重复观察的分析相关.
Network Analysis¶
用于构建、分析和可视化网络数据的软件包.
- Network Analysis List - 网络分析相关资源.
- igraph
- 网络分析工具的集合.
- network - 在 R 中操作关系数据的基本工具.
- sna - 基本网络措施和可视化工具.
- netdiffuseR - 网络传播分析工具.
- networkDynamic - 支持动态、(间)时间网络.
- ndtv - 以各种格式构建动态网络数据动画可视化的工具.
- statnet - 许多 R 网络分析包背后的项目.
- ergm - R 中的指数随机图模型.
- latentnet - 网络对象的潜在位置和集群模型.
- tnet - 加权、双模和纵向网络的网络测量.
- rgexf - 将网络对象从 R 导出到 GEXF,用于使用网络软件进行操作,例如 Gephi 或者 Sigma.
- visNetwork - 使用 vis.js 库进行网络可视化.
- tidygraph - 用于图形操作的整洁 API
Spatial¶
探索地球的套餐.
- CRAN Task View: Analysis of Spatial Data- 空间分析相关资源.
- Leaflet - 最流行的 JavaScript 库交互式地图之一.
- ggmap - 使用 ggplot2 在 R 中绘制地图.
- REmap - 用于交互式地图数据可视化的 JavaScript 库 ECharts 的 R 接口.
- sf - 改进了空间数据的类和方法.
- sp - 空间数据的类和方法.
- rgeos - 几何引擎接口 - 开源
- rgdal - 地理空间数据抽象库的绑定
- maptools - 读取和处理空间对象的工具
- gstat - 空间和时空地质统计建模、预测和模拟.
- spacetime - 时空数据的 R 类和方法.
- RColorBrewer - 为地图提供配色方案
- spatstat - 空间点模式分析、模型拟合、模拟、测试
- spdep - 空间相关性:加权方案、统计数据和模型
- tigris - 在 R 中下载并使用 Census TIGER/Line 形状文件
- GWmodel - 地理加权模型
- tmap - 专题地图的R包
R Development¶
包包包.
- Package Development List - R 包以改进包开发.
- promises - 基于承诺的异步编程的抽象
- lineprof - 在 R 中可视化线路分析结果.
- packrat - Make your R projects more isolated, portable, and reproducible.
- installr - 从 R 中安装软件的功能(适用于 Windows).
- import - R 的导入机制.
- modules - R 的替代(Python 风格)模块系统.
- RStudio Addins - RStudio 插件列表.
- drat - 在 GitHub 或其他存储库上创建和使用 R 存储库.
- covr - 测试 R 包的覆盖率并(可选)将结果上传到 coveralls 或者 codecov.
- lintr - R 的静态代码分析以强制执行代码风格.
- staticdocs - 为 R 包生成静态 html 文档.
- sinew - 生成 roxygen2 骨架,其中填充了从函数脚本中获取的信息.
Logging¶
记录包
- futile.logger - 类似于 log4j 的 R 中的日志记录包
- log4r - R 的 log4j 导数
- logging - 模拟 python 日志包的日志包.
Data Packages¶
方便的数据包
- engsoccerdata - 英国和欧洲足球成绩 1871-2016.
- gapminder - 摘自 Gapminder 数据集(过去 50 年有关国家的数据).
- wbstats - 用于从世界银行数据 API 和世界银行数据目录 API 搜索和下载数据和统计数据的工具.
- ICON - 来自复杂网络索引 (ICON) 数据库的复杂系统和网络数据集 webpage.
- RCOBOLDI - 将 COBOL CopyBook 数据文件作为正确结构化的数据帧直接导入 R. 软件包构建可通过 Drat 和 DockerHub.
Other Tools¶
R 的便捷工具
Other Interpreters¶
替代 R 引擎.
- CXXR - 将 R 重构为 C++.
- fastR - FastR 是基于 Truffle 和 Graal 的 Java 中 R 语言的实现.
- pqR - R 的“相当快”的实现
- renjin - 一个基于 JVM 的 R 解释器.
- rho - 将 R 语言的解释器重构为完全兼容、高效的 R VM.
- riposte - 用于 R 的快速解释器和 JIT.
- TERR - R 的 TIBCO 企业运行时.
Learning R¶
R学习包
- swirl
- 直接在 R 控制台中的交互式 R 教程.
Resources¶
在哪里可以发现新的 R 资源.
Websites¶
Manuals¶
- R-project - 用于统计计算的 R 项目.
- An Introduction to R - 关于 R 的非常好的介绍性文本,还涵盖了一些高级主题. 另请参阅“手册”部分 CRAN
- CRAN Contributed Docs - CRAN 提供多种语言的文档.
- Quick-R - 极好的快速参考
- tryR - 入门 R 的快速课程.
Tools and References¶
- RDocumentation - 使用 RDocumentation 搜索所有 CRAN、Bioconductor、Github 包及其档案.
- rdrr.io - 查找 R 包文档. 在浏览器中尝试 R 包.
- CRAN Task Views - CRAN 包的任务视图.
- rnotebook.io - 免费创建在线 R Jupyter 笔记本.
News and Info¶
- R Weekly - 关于 R 和数据科学的每周更新. R Weekly 在 GitHub 上公开开发.
- R Bloggers - 网络上散布着一些关于 R 的博客.这只是其中许多提要的聚合器.
- R-users - R 用户(以及希望雇用他们的人)的工作板
Books¶
Free and Online¶
- R for Data Science by Garrett Grolemund & Hadley Wickham - 来自 RStudio 开发人员的免费书籍,重点介绍数据科学工作流程.
- R Cookbook by Winston Chang - 支持他的以问题为导向的在线书籍 R Graphics Cookbook, 2nd ed. (2018).
- Advanced R, 2nd ed. by Hadley Wickham (2019)
- 高级 R 书籍的在线版本.
- R Packages, 2nd ed. by Hadley Wickham & Jennifer Bryan - 一本关于编写 R 包的书(纸质和网站格式).
- 作为约翰霍普金斯大学数据科学专业的一部分编写的书籍:
- Exploratory Data Analysis with R by Roger D. Peng (2016) - 对 R 中各种数据的基本分析技能.
- R Programming for Data Science by Roger D. Peng (2019) - 更高级的数据分析依赖于 R 编程.
- Report Writing for Data Science in R by Roger D. Peng (2019) - 用于可重复研究和报告生成的基于 R 的方法.
- R for SAS and SPSS users by Bob Muenchen (2012) - 对于已经熟悉 SAS 或 SPSS 的用户来说,这是一个很好的资源.
- Introduction to Statistical Learning with Application in R by Gareth James et al. (2017) - 统计学习要素的简化和“操作”版本. 作者提供的免费软拷贝.
- The R Inferno by Patrick Burns (2011) - Patrick Burns 深入了解 R 的来龙去脉及其怪癖!
- Efficient R Programming by Colin Gillespie & Robin Lovelace (2017) - O'Reilly 图书的在线版本:Efficient R Programming.
- The R Programming Wikibook - R 协作手册.
Paid¶
- The Art of R Programming - 它是系统学习 R 中对象类型、控制语句、变量范围、类和调试等基础知识的好资源.
- R Cookbook, 2nd ed. by JD Long & Paul Teetor (2019) - 快速简单地介绍如何使用 R 执行许多常见的统计任务.
- R in Action - 本书面向所有级别的用户,包括初级、中级和高级 R 的部分,从“探索 R 数据结构”到运行回归和进行因子分析.
- Use R! Series by Springer - 这一系列来自 Springer 的廉价且重点突出的书籍出版了针对从业者的较短书籍. 书籍可以讨论 R 在特定主题领域的使用,例如贝叶斯网络、ggplot2 和 Rcpp.
- Learning R Programming - 学习 R 作为一种编程语言,从基础知识到高级主题.
Book/monograph Lists and Reviews¶
- R Books List - R 书籍清单.
- Readings in Applied Data Science - 这些读物反映了 Hadley 对应用数据科学的个人想法.
Podcasts¶
- Not So Standard Deviations - 数据科学播客.
- @Roger Peng 和 @Hilary Parker.
- R World News - R World News 帮助您了解 R 社区内的动态.
- @Bob Rudis 和 @Jay Jacobs.
- The R-Podcast - 提供有关如何使用 R 的实用建议.
- @Eric Nantz.
- R Talk - 统计软件和 R 语言的新闻和讨论.
- @Oliver Keyes, @Jasmine Dumas, @Ted Hart 和 @Mikhail Popov.
- R Weekly - 关于 R 社区的每周新闻更新.
Reference Cards¶
- RStudio Cheat Sheets
- R Reference Card 2.0 - 经 Emmanuel Paradis 许可来自 R for Beginners 的材料(Matt Baggott 的第 2 版).
- Regression Analysis Refcard - 用于回归分析的 R 参考卡.
- Reference Card for ESS - ESS 参考卡.
MOOCs¶
海量开放在线课程.
- Johns Hopkins University Data Science Specialization - 9 门课程,包括:R 简介、文学分析工具、Shiny 等.
- HarvardX Biomedical Data Science - 生命科学 R 简介.
- Explore Statistics with R - 涵盖 R 中的介绍、数据处理和统计分析.
Lists¶
学习领域知识的重要资源.
- Books - R 书籍清单.
- ggplot2 Extensions - ggplot2 扩展展示.
- Network Analysis - 网络分析相关资源.
- Open Data - 使用 R 获取、解析、操作、创建和共享开放数据.
- Posts - 很棒的 R 博客文章或 Rticles.
- Package Development - R 包以改进包开发.
- R Project Conferences - 有关用户的信息! 会议和 DSC 会议.
- RStartHere - 一些最有用的 R 包的指南,按工作流组织.
- RStudio Addins - RStudio 插件列表.
- Topic Models - 主题模型学习和 R 相关资源.
- Web Technologies - 关于如何一起使用 R 和万维网的信息.
R Ecosystems¶
R 社区和包集合(按字母顺序排列):
- rOpenGov 开放政府数据、计算社会科学、数字人文
- rOpenHealth 公共卫生数据
- rOpenSci 开放科学
2018¶
- fable - 单变量和多变量时间序列预测模型
- r2d3 - D3 可视化的 R 接口
- rstats-ed - 课程列表教学R
- promises - 基于承诺的异步编程的抽象
- tinytex - 轻量级且易于维护的 LaTeX 发行版
- Readings in Applied Data Science - 这些读物反映了 Hadley 对应用数据科学的个人想法.
2017¶
- prophet - 为具有线性或非线性增长的多重季节性的时间序列数据生成高质量预测的工具.
- tidyverse - 从 tidyverse 轻松安装和加载包
- purrr - R 的函数式编程工具包
- hrbrthemes - 以排版为中心的 ggplot2 主题和主题组件
- xaringan - 使用 R Markdown 和 JavaScript 库创建 HTML5 幻灯片
- blogdown - 使用 R Markdown 创建博客和网站
- glue - 将字符串粘合到 R 中的数据.小、快速、无依赖性的解释字符串文字.
- covr - R 的测试覆盖率报告
- lintr - R 的静态代码分析
- reprex - 呈现 R 代码位以供共享,例如,在 GitHub 或 StackOverflow 上.
- reticulate - Python 的 R 接口
- tensorflow - 用于 R 的 TensorFlow
- utf8 - 处理和打印 UTF-8 文本,修复了 R 的 UTF-8 处理中的多个错误.
- Patchwork - 将单独的 ggplots 合并到同一个图形中.
Other Awesome Lists¶
Contributing¶
随时欢迎您的贡献!
本作品根据 Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License 获得许可 - CC BY-NC-SA 4.0