DeepSORT的细节
一、整体把握 目标在每帧中的轨迹状态是如何表示的? 作者用8维向量[u,v,r,h,x’,y’,r’,h’]来表示目标所处的轨迹状态, u,v,r,h分别对应目标的中心坐标、r是长宽比、h是高。而x’,y’,r’,h’这四个参数代表目标对应的运动速度(可将其看成前四个参数分别的运动数据)。该轨迹向量同时提供了目标在当前帧的bbox信息以及bbox的运动信息,为预测bbox下一帧可能的位置提供了数据。 轨迹如何具体理解? 可以将轨迹理解成在不同时刻的位置序列[u,v,r,h]。 预测下一帧中目标的bbox是如何做到的? 利用轨迹状态中的参数,用卡尔曼滤波对相应目标预测轨迹。卡尔曼滤波采用的为匀速模型和线性观测模型,其观测变量为u,v,r,h这四个变量。 如何确定轨迹的出现和终止?(轨迹处理的细节) 跟踪目标的实际过程中,会出现旧的目标(已在轨迹池中的目标)走出视野,新的目标进入视野,因此每个轨迹的出现和终止是非常重要的问题。 显而易见,若旧目标丢失就终止其轨迹,那如何确定目标丢失了呢? 作者对轨迹池中的每个目标都增加一个记录其最后一次匹配成功到当前时刻的时长变量a,若a大于最大允许阈值Amax则认为该目标已丢失,需终止。 那新的目标是如何确定并处理的呢? 首先检测器会将所有检测到的目标(仅当前帧通过目标检测网络检测得出,将其称为detection