这个部分跟自编码器很像,是自监督的过程,由label生成特征,再由特征还原回label
可以看到使用VGG作为图像基础网络时,SSAH准确率领先其他方法很多。
SSAH的PR曲线基本都是在其他模型的曲线之上
相对于另一种深度学习方法DCMH,SSAH只要比较短的时间就能得到比较好的效果
可以看到,超参数变化时,准确率依然能维持在比较高的水平
其中, SSAH-1: remove LabNet SSAH-2: TxtNet改成三层全连接 SSAH-3: 去掉对抗网络 可以看到在I2T任务中,标签生成网络是很重要的,在T2I任务中对抗网络的效果更明显。