R语言由近几年随着数据挖掘、机器学习在国内兴起而大热,现在R已经发展成为一个社区语言,有者非常多的packages支持工程应用,几乎任何问题都可以在R的packages中找到解决方案,这是R优于SPSS和SAS(模块化分析)的一个强大功能。此外,对于没有编程基础的统计学和金融学领域分析人员,R语言以较易的代码任务而胜过python(需要专门训练的编程项目)。
目前在CRAN和GitHub上的packages大约超过1万个。整理了一些常见学科使用频率较高的 packages:
教育类:
learnr:支持使用markdown等工具创建交互式的教材,进行R和R包的学习
olsrr:辅助进行普通最小二乘回归的学习和实践
rODE:内置大量函数,展示学生的一些自然状态下的表现,如常微分方程如何求解,如何更有效的构建方程等。
repurrrsive:包含R对象、JSON和XML的形式递归的列表,用于在教学中使用示例,包括调色板、GitHub库等。
金融:
alphavantager :提供了alpha vantage API,可以获取股票、物理货币和数字货 币等历史交易数据。
音乐:
billboard 包含了从1960年到2016年公告牌百强榜单上歌曲的数据集,包括给定年份的排名、音乐特征和歌词。
地图:
mapsapi:提供了谷歌地图数据接口。
学术语义:
microdemic:支持在Microsoft Academ Graph中对学术文章的程序化访问。
数据挖掘:
Rattle:可视化数据挖掘工具
是使用RGtk2包提供的Gnome图形用户界面
Rattle的安装:1)install.packages(“RGtk2”)
2) install.packages(“rattle”)
3)需要安装XQutrz启用X11
交互:
GoogleVis API在R制作网页HRML,调用Google charts作图,交互式的HTML图表
Manipulate:人际互动
Rcharts:用R与javascript做交互式可视化产品
Shiny:制作嵌入网页的交互式R程序平台
Solidify:制作和发布基于R的报告
文本处理:
wordmatch:用于两个word文本对照
readtext:支持文本文件或格式化的文本文件导入,
:.csv,.tab,.json,.xml,.pdf,.doc,.docx,.xls,.xlsx
数据库:
hdf5r:提供一个使用R6类的HDF5 API的面向对象包装器。
RMariaDB:实现与MariaDB and MySQL数据库兼容的DBI接口。
可视化(Data Visualization):
rgl:3D可视化
ggplot2:高级绘图包
ggplotgui:支持shiny app创建和优化ggplot2图形,并产生要求的R代码
lattice:高级绘图包
wordcloud2:绘制词云
ggjoy:joyplots提供了时间和空间分布的变化
DescriptiveStats.O Beu:包含部分函数为OpenBudgets.eu数据集提供估计和返回可视化所需的相关参数。
统计学:
adaptiveGPCA:自适应的主成分分析算法实践
sfdct:支持针对简单的对象构建德劳内三角
cnbdistr:条件负二项分布的分布函数
llogitstic:密度、分布、带参数的l-logistic分布分位数和随机数生成函数
RBest:提供支持贝叶斯证据合成的工具集,包括荟萃分析、历史数据的先验推导、操作特性分析
SMM:提供了多状态离散时间半马尔可夫和马尔可夫模型多模拟和估计功能。
BayesRS:适用于分层线性贝叶斯模型,并计算出与savge-dickey密切比有关的群参数的贝叶斯因子。
CovTools:提供了几何和推理工具,方便分析协方差结构和多元统计中的协方差分析。
emmeans:提供了许多函数,计算线性/广义线性/混合模型的估计边际均值(EMMS)
NLP:自然语言处理
Natural Language Processing
tm:英文分词工具
jiebaR:中文分词工具,本身是C++写的,具有极高的运算处理速度
Rwordseg:中文分词工具,Mac版依赖旧版本的Java,较难安装,版本更新慢,不推荐使用
chinese.misc:中文分词工具,内核基于Rwordseg
rmmseg4j:
snowball:英文词干化
lexiconPT:为情绪分析提供对葡萄牙词汇的访问
越往后越扯淡……
QAQ
数据处理(Numerical Mathematics):
Matrix
MASS
gsl
polynom
signal
GetLattesData:实现了一个API,支持从Lattes直接下载和读取XML数据
贝叶斯分类(Bayesian Inference):
BACCO
bayesm
bayesSurv
LaplacesDemon
MIBayesOpt:提供了一套支持贝叶斯优化方法的计算框架,辅助支持向量机、随机森林和极端梯度增强模型优化超参数。
生物:
CytobankAPIstats:提供了从细胞库获取和处理细胞数据的工具。
聚类(Cluster Analysis & Finite Mixture Models):
apcluster
clusterSim
clustMixType
evclust
trimcluster
apcluster
原文地址:CSDN博客
本文链接: https://konelane.github.io/2018/04/09/r包/
-- EOF --
转载请注明出处 署名-非商业性使用-禁止演绎 3.0 国际(CC BY-NC-ND 3.0)