Detect -> Track -> Retrieval
提取颜色,纹理,空间结构,容易可靠测量,不同人不同摄像头间这些特征都有一些区分度
从视觉特征中提取语义用于re-id,比如发型,衣服风格
距离测量
人群re-id