1、二维散点图二维散点图使用 scatter 函数创建,用于显示前两个十字路口的流量之间的关系:
2、使用 cov 函数计算的协方差计算两个变量之间的线性关系强度(数据在散点图中沿着最小二乘直线排列的松紧度):C12 = cov([c1 c2])
3、结果以对称的方阵形式显示,并在第 (i, j) 个位置中显示第 i 个和第 j 个变量的协方差。第 i 个对角线元素是第 i 个变量的方差。
4、协方差的缺点是:取决于度量各个变量所使用的单位。您可以将变量的协方差除以标准差,以将值归一化为介于 +1 和 –1 之间。corrcoef 函数计算相关系数:R12 = corrcoef([c1 c2])
5、r12 = R12(1,2) % Correlation coefficient
6、r12sq = r12^2 % Coefficient of determination
7、由于但诌诎箬已经过归一化,因此相关系数的值可以方便地与其他成对的十字路口的值相比较。相关系数的平方(即决定系数傧韭茆鳟)是最小二乘直线的方差除以均值方差的结果。因此,它与响应(在本示例中为第 2 个十字路口的流量)中的方差成比例,在散点图中,该方差已被清除,或者用最小平方直线以统计方式说明。
8、三维散点图三维散点图使用 scatter3 函数创建,用于显示所有三个十字路口的流量之间的关系:使用在上述步骤中创建的变量 c1、c2 和 c3:
9、通过使用 eig 函数计算协方差矩阵的特征值来度量三维散点图中的变量之间的线性关系强度。vars = eig(cov([c1 c2 c3]))
10、explained = max(vars)/sum(vars)
11、特征值是基于数据的主分量的方差。变量 explained 度量数据轴上第一个主分量说明的方差的比例。与二维散点图的决定系数不同的是,此度量会区分预测器和响应变量。
12、散点图数组使用 plotmatrix 函数比较多对十字路口之间的关系:figureplotmatrix(count)
13、位于数组第 (i, j) 个位置的绘图是一个散点图,第 i 个变量位于纵轴上,第 j 个变量位于横轴上。第 i 个对角线位置的绘图是第 i 个变量的直方图。