新NN。 一个有线电视新闻网可以接受培训,以检测到一个单一的对象在一个图像。 然而,如果任何图像数据集中可能包含的任何n#的对象。 这不是一个问题,以CNNs作出密集层必须有固定的尺寸? 你会怎么解决这个问题?
例如: 我们说我随机地抽样的2的图像,从这一设置。 图1 2对象和图2中有5对象。 Y标签img1将包含的边界框坐标2的对象;y标签img2将包含坐标5的对象--更大的y矢量比img1.
一个可能的解决办法? :
我需要找到图像中最大的对象(指定该价值为M)。 让我也说一个对象有4坐标。 如果M=5中,我将需要一个y矢量的20. 如果图像已有1的目的,y矢量将含有4个非零的价值观和16零值。 4个非零数值表示的标和16零数值表示会坐标的其他不存在的对象。