且构网

分享程序员开发的那些事...
且构网 - 分享程序员编程开发的那些事

《Visual C++数字图像模式识别技术详解(第2版)》一3.2 幅值特征

更新时间:2022-09-30 13:25:49

3.2 幅值特征

图像的统计特征只反映了图像整体的像素灰度分布特性,并没有反映不同灰度像素在图像中的位置分布信息,而图像的幅值特征则可以反映这些特性。图像的幅值特征主要包括两个,分别是矩特征和投影特征。
1.矩
由于图像幅值的分布是与空间相关的,因此对幅值与空间综合考虑得到的是相应的矩运算。对于一个M×N图像,其(i + j)阶矩定义如下:

    (3-6)

其中,f(x,y)是图像中坐标(x,y)的像素灰度值。i,j分别等于0,1,2…
按照上述矩定义,矩M00就表示总灰度值的积累,其为:

    (3-7)

矩M10代表了灰度沿x方向发布的情况。M10大,则表明灰度值大的像素在x方向的高端;反之则分布在x轴的低端。

    (3-8)

类似于物理学中质量的重心值的计算,也可用下式来表示一个区域的灰度分布重心,其为:

    (3-9)

表示了一定形状图像区域中灰度分布的中心,在许多情况下,它往往是位于区域中最明亮的部分,也是一般人的视觉最集中的部分。
此外,以为中心,所获得的矩称为中心矩,其为:

    (3-10)

与中心矩有关的一个概念就是主轴,它类似于对称轴。它是通过中心的一根直线,主轴的一个重要特性是,对它计算如式(3-11)的二阶矩可得到最小值,因此主轴可用下列方法求得。
设主轴的方向为,则惯量为:

    (3-11)

对它做的导数并使之为0,则可得方程:

    (3-12)

解此方程可得值。即:

    (3-13)

主轴在视觉上起到灰度分布的对称轴作用。
如图3-2所示两幅图像中的物体,我们尝试通过图像的幅值特征对这两个物体进行区分。首先,两个物体的矩M00、M10、M10完全相同,即物体重心是相同的,但两个物体的中心矩和不同,图像a中的物体;图像b中的物体。与之相对应,图像主轴也不同,图像a是垂直主轴,而图像b是水平主轴。
《Visual C++数字图像模式识别技术详解(第2版)》一3.2 幅值特征

2.投影
投影就是把图像在某一方向上进行投影,图像在x,y轴上的投影Px,Py分别如下:

    (3-14)

Px,Py记录了沿x轴或y轴方向的灰度的累积值,即表示了沿该方向的总的明暗变化程度,因此对某一方向灰度的总体明暗变化程度可用该方向的灰度投影来表示。
如图3-3所示,通过图像投影特征,清楚地显示了车牌中的字符位置,从而为字符分割和识别算法的实现打下良好的基础。

《Visual C++数字图像模式识别技术详解(第2版)》一3.2 幅值特征