R语言如何探索数据集的变量情况

 时间:2024-10-14 04:07:14

1、获取数据集。这里以MASS软件包中的Insurance数据集为例。data(Insurance) #获取数据集。如果没有则需要先安装MASS。dim(Insurance) #查看数据集维度head(Insurance) #查看数据前若干行

R语言如何探索数据集的变量情况

2、查看数据集的属性列表。attributes(Insurance)结果中展示了数据集中各变量的名称、数据集格式、数据集的行名称。

R语言如何探索数据集的变量情况

3、探索数据集的内部结构。str(Insurance)从结果中可以看出Insurance数据集共有64个观测值、5个变量,其中Distric为定性数据,Group、Age为定序数据,Holders和Claims为整数形定量数据。

R语言如何探索数据集的变量情况

4、查看各变量的统计指标值。summary(Insurance)结果中可以看到定性数据的各类取值频数,以及定量数据的四分位点数据。

R语言如何探索数据集的变量情况

5、利用Hmisc软件包中的describe函数查看变量详情。install.packages("Hmisc")library(Hmisc) #安装并加载Hmisc软件包describe(Insurance) #变量的描述统计结果中可以看到各个定性变量的总观测值个数、缺失个数、水平个数,以及每个水平下的频数和频率;定量变量则显示了0.05到0.95的一系列分位数取值,以及频率最高和最低的5个水平值。

R语言如何探索数据集的变量情况

6、利用fBasics软件包中的basicStats函数查看数据集信息。install.packages("fBasics")library(fBasics) #安装并加载软件包basicStats(Insurance[,4:5]) #获取数据集的各定量变量统计信息可以看出,该函数给出了峰度、偏度等分布指标结果。

R语言如何探索数据集的变量情况
  • r语言读取excel数据
  • 如何调用R语言自带的数据集
  • R语言怎么做相关性分析
  • 如何使用R语言中的MASS第三方包获取数据
  • R语言怎么读取CSV文件
  • 热门搜索
    法律伴我行手抄报内容 走进汉字王国手抄报 数学的手抄报 儿童手抄报春节 关于月亮的手抄报图片 英语环保手抄报 感恩的手抄报内容 日行一善手抄报名言 一年级手抄报怎么写 关于传统文化的手抄报