1、训练时需要相同大小的图片才能组成一个batch,在openpose中有两种做法:一是直接resize到指定大小的尺寸;二是源码提供了一种稍微有特色的做法。
2、先指定长和宽x,y。然后将图片的长/宽和x/y比较,看是否大于1,然后,选择长一些的边(长>x?,宽>y?),固定长宽比缩放到给定尺寸 .
3、再然后,为另一条边加padding,两边加相同的padding,最后,resize到制定大小。
4、怎么处理预测图尺寸和输入真实值烹挹戢愠尺寸不匹配的问题一种方式是de-convolution到原来的大小,二是源码中指出的方法,因为是只有base net中有图片缩放的过程,在vgg结构中,有三次pooling过程,所以缩放比例是8,将resize后的mask淹膜图片和PAF以及身体部位heatmap三者都缩放8倍。
5、因为本身有一个核函数处理过程,所以孀晏弁钾也不用特别要求达到像素级别的精度,反正缩放过程中最大值丢不了。另外,因为这儿有8倍关系,所以resize的时候要选择一个合适的长与宽,实际上,源码中强制转成1鲂番黟谊6的倍数。