我想问一下,第二步已经裁剪过图片,并且保存过标注信息了,为什么第三步进行目标检测create_VOC_annotation_official.py转成voc格式时还有裁剪图片的操作,不是直接对第二步的结果直接转换成voc格式吗,如果不是将第二步结果转成voc格式第二步还有用吗?