1、查看stata自带的数据库,使用命令sysuse dir,结果如下图
2、接下来我们使用 uslifeexp.dta作为例子。sysuse uslifeexp
3、用describe命令了解此数据库的简要信息。比如:样本数量(obs:100、变量墙绅褡孛数量(vars:10)、大小(size:3800)等。
4、从describe中可以看出le是其中的一个变量,用codebook查看此变量详细信息。
5、通过summarize命令了解le变量的几个统计量。例如,它的平均值、最大值、最小值、标准差等。
6、如果想要更详细的统计信息,可以带detail参数。
7、用茎叶图探索变量le的分布 stem le
8、用箱式图探索变量le的分布(graph box le)
9、用直方图探索变量le的分布(hist le)