1、运行RStudio,并输入如下代码。#载入需要的软件包。library(funModeling)#探索性数据分析、数据准备和模型性能评估library(tidyverse)#数据科学集成窄忾行崦包library(Hmisc)#高级计算函数、绘图功能等
2、导入数据集。#输入数据data=data.frame(ro嘛术铹砾w.names=c("Zhangsan","Lisi","Wangwu","zhaoda","Bob","Tom"), sex=c("Male","Male","Male","Female","Male","Male"), age=c(35,43,23,57,35,28), like=c("music","music","sport","drink","music","sport"), score=c(90,46,87,78,69,NA))
3、查看数据的变量个数、数据类型、样本观测值等情况。#数据概览glimpse(data)
4、##数据清洗df_status(data)#查看变量类型及空值情况data=na.omit(data)#删除空值
5、分类数据分析,下列代码可以计算各分类变量每个值的频数,并绘制出直方图。#查看分类数据的频率分布freq(data)
6、分析数值型数据,以下代码自动识别数值型变量,进行了数据分组,并绘制频数分布直方图。#查看数值型数据的统计数据profiling_num(data)#绘制数值型数据的直方图plot_num(data,bins=3)