用R语言对数据进行分组汇总
跟大家分享下用R语言对数据进行分组汇总的方法。
操作方法
- 01
首先,原始数据是由name(名字),class(班级),course(课程)和score(分数)组成的,将其导入R语言并存储在Mydata对象里
- 02
接下来,我们利用sqldf包来处理分组汇总的问题。
- 03
由于sqldf包不是R语言自带的,所以先用以下代码安装sqldf包: install.packages("sqldf") 然后选择“China(Beijing)”镜像站点进行安装,R语言会同时自动安装“sqldf”包的依赖包。
- 04
安装好sqldf包及其依赖包后,输入以下代码加载sqldf包: library(sqldf)
- 05
一切准备就绪,接下来用sqldf统计每个同学的总成绩和平均分: sqldf("select name,sum(score) as score_sum,avg(score) as score_avg from Mydata group by name")
- 06
统计每个班级的总成绩: sqldf("select class,sum(score) as score_sum from Mydata group by class")
- 07
统计每个班级的每门课程的总成绩和平均分: sqldf("select class,course,sum(score) as score_sum,avg(score) as score_avg from Mydata group by class,course")
- 08
关于用sqldf包进行数据分组汇总的介绍就到这里,大家可以根据自己的需要对上述代码进行修改。
赞 (0)