m_t
和上一帧矩阵
m_{t-1}
做差:
d
=
|m_t
-
m_{t-1}|
?t如果某个像素差值大于阈值(比如
0。2),说明这里有变化。
?t变化区域提取:
?t根据变化点的分布,用轮廓检测或连通区域标记,找到“方块”位置。
?t用方块坐标裁剪原彩色图
→
得到目标小图。
?
3。
样本分类(人脸或人识别)
?t你说的随机森林可以做,但在视觉领域更常用cnn(卷积神经网络),因为它能自动提取空间特征。
?t样本准备:
?t把抓到的小图分两类:和目标有关
无关。
?t提取特征(像素值、hog特征、深度特征等)。
?t训练分类器(随机森林、svm、cnn等)。
?t预测时,把新的方块特征输入模型,输出类别标签。
?
4。
跟踪(tracking)
?t检测是找到目标,跟踪是保持它在视频里的位置。
?t常用方法:
?t卡尔曼滤波(kalman
filter):预测下个位置。
?tkcf
sse
跟踪器:基于模板匹配的快速跟踪。
?tsort