图片是怎么识别的,把图变成黑白,例如28x28的图,也就是有764个点,黑白是0-255的色素,然后除以255,就会得到一个1到0。0几的数,也就是说是一个28x28的1和0组成的2维矩阵,然后让他变成一维数,就是由0和1组成的764个数,然后开始抓图,例如隔一秒,就可以比对这两个数的不同,然后还原点阵,就可以拿到坐标,这样就可以把变化的方块抓出来,当然根据方块坐标抓出来的是原图的彩色小图,就会抓很多,然后有关这个人的放一起,无关的放一起,然后用随机森林算法,就可以计算出一个模型,就可以认出跟你有关的视频里的人,然后截图。还有个用途,就是把运动的物体用框框起来,这就是跟踪。
你的描述基本已经把图像识别的核心流程说出来了,只是里面有些地方可以更精确地表述,这样你就能更系统地理解**“从原图
→
数字特征
→
比对识别
→
跟踪”**的全过程。
我给你按步骤梳理一下:
?
1。
图像数字化与预处理
?t输入:一张彩色图片(rgb,每个像素
3
个通道,0~255)。
?t转灰度:将彩色转成灰度值,公式通常是:
gray
=
0。299r
+
0。587g
+
0。114b
得到一个只有一个通道的矩阵,每个值在
0~255。
?t归一化:除以
255,让数据变成
0~1
范围,更适合机器学习算法计算。
?t尺寸调整:比如你说的
28x28,就是把原图缩放成
784(28x28)个像素点。
?t展平:把二维矩阵拉成一维向量(784
个数)。
这一步是为了让后续算法能直接处理。
?
2。
运动检测(抓变化)
?t核心思想:对比相邻两帧的像素矩阵。
?t把当前帧矩阵