1、从工作表读取所有数据调用readtable以读取工作表中名为2008的所有数据,然后仅显示前10行和列。使用Sheet名称-值对参数指定工作表名称。如果您的数据位于文件的第一个工作表中,则无需指定Sheet。
2、命令行键入:T = readtable('airlinesmall_subset.xlsx','Sheet','2008');T(1:10,1:10)
3、从特定工作表中读取选定范围在指定的工作表中1996,通过指定范围,仅从前5列中读取10行数据'A1:E11'。该readtable函数返回一个10×5表。
4、命令行键入:T_selected = readtable('airlinesmall_subset.xlsx','Sheet','1996','Range','A1:E11')
5、将变量转换为日期时间,持续时间或分类在导入过程中,readtable自动检测变量的数据类型。但是,如果您的数据包含非标准的日期,持续时间或重复的标签,则可以将这樱厮吞簌些变量转换为正确的数据类型。将变量转换为正确的数据类型可让您执行有效的计算和比较,并改善内存使用率。例如,表示变量Year,Month和DayofMonth作为一个datetime变量,则UniqueCarrier如categorical,和ArrDelay作为duration在分钟。
6、命令行键入:data = T(:,{ 'Year补朱锚卦39;,'Month',泌驾台佐39;DayofMonth','UniqueCarrier','ArrDelay' });data.Date = datetime(data.Year,data.Month,data.DayofMonth);data.UniqueCarrier =类别(data.UniqueCarrier);data.ArrDelay =分钟(data.ArrDelay);
7、查找延迟时间最长的一年中的某天,然后显示日期。
8、命令行键入:ind =查找(data.ArrDelay == max(data.ArrDelay));data.Date(ind)
9、从电子表格文件中读取所有工作表数据存储对于处理分布在多个工作表或多个电子表格文件中的任意大量数据很有用。您可以通过数据存储区执行数据导入和数据处理。从中的工作表集合创建数据存储airlinesmall_subset.xlsx,选择要导入的变量,然
10、命令行键入:ds =电子表格数据存储区('airli艘绒庳焰nesmall_subset.xlsx');ds.Sele艘早祓胂ctedVariableNames = { 'Year','Month','DayofMonth','UniqueCarrier','ArrDelay' };预览(ds)
11、导入数据之前,您可以指定要使用的数据类型。对于此示例,请导入UniqueCarrier作为分类变量。命令行键入:ds.SelectedVariableTypes(4)= { '类别' };
12、使用readall或read函数导入数据。该readall功能要求所有数据都适合内存,这对于示例数据来说是正确的。导入后,计算该数据集的最大到达延迟。命令行键入:alldata = readall(ds);最大(alldata.ArrDelay)/ 60
13、对于大型数据集,请使用read函数导入文件的某些部分。有关更多信息,请参见阅读集合或电子表格文件序列。