最大类间方差法(otsu)的原理:
阈值将原图象分成前景,背景两个图象。
前景:用 n1, csum, m1 来表示在当前阈值下的前景的点数,质量矩,平均灰度
后景:用 n2, sum-csum, m2 来表示在当前阈值下的背景的点数,质量矩,平均灰度
当取最佳阈值时,背景应该与前景差别最大,关键在于如何选择衡量差别的标准
而在 otsu 算法中这个衡量差别的标准就是最大类间方差(英文简称 otsu,这也就是这
个算法名字的来源)
在本程序中类间方差用 sb 表示,最大类间方差用 fmax
关于最大类间方差法(otsu)的性能:
类间方差法对噪音和目标大小十分敏感,它仅对类间方差为单峰的图像产生较好的分
割效果。
当目标与背景的大小比例悬殊时,类间方差准则函数可能呈现双峰或多峰,此时效果
不好,但是类间方差法是用时最少的。
最大最大类间方差法(otsu)的公式推导:
记 t 为前景与背景的分割阈值,前景点数占图像比例为 w0, 平均灰度为 u0;背景点
数占图像比例为 w1,平均灰度为 u1。
则图像的总平均灰度为:u=w0*u0+w1*u1。
前景和背景图象的方差:g=w0*(u0-u)*(u0-u)+w1*(u1-u)*(u1-u)=w0*w1*(u0-u1)*(u0-u1),
此公式为方差公式,可参照概率论课本
上面的 g 的公式也就是下面程序中的 sb 的表达式
当方差 g 最大时,可以认为此时前景和背景差异最大,也就是此时的灰度是最佳阈值
C 程序 :
unsafe public int GetThreshValue(Bitmap image)
{
BitmapData bd = image.LockBits(new Rectangle(0, 0, image.Width, image.Height),
ImageLockMode.WriteOnly, image.PixelFormat);
//图象直方图,共 256 个点
//total 为总和,累计值
//sb 为类间方差,fmax 存储最大方差值
byte* pt = (byte*)bd.Scan0;
int[] pixelNum = new int[256];
byte color;
byte* pline;
int n, n1, n2;
int total;
double m1, m2, sum, csum, fmax, sb;
int k, t, q;
int threshValue = 1;
int step = 1;
switch (image.PixelFormat)
{
// 阈值
case PixelFormat.Format24bppRgb:
step = 3;
break;
case PixelFormat.Format32bppArgb:
step = 4;
break;
case PixelFormat.Format8bppIndexed:
step = 1;
break;
}
//生成直方图
for (int i = 0; i < image.Height; i++)
{
pline = pt + i * bd.Stride;
for (int j = 0; j < image.Width; j++)
{
color = *(pline + j * step);
pixelNum[color]++;
//返回各个点的颜色,以 RGB 表示
//相应的直方图加 1
}
}
//直方图平滑化
for (k = 0; k <= 255; k++)
{
total = 0;
for (t = -2; t <= 2; t++)
{
q = k + t;
if (q < 0)
q = 0;
if (q > 255)
q = 255;
//与附近 2 个灰度做平滑化,t 值应取较小的值
//越界处理
total = total + pixelNum[q];
//total 为总和,累计值
}
pixelNum[k] = (int)((float)total / 5.0 + 0.5);
//平滑化,左边 2 个+中间 1 个+右边 2
个灰度,共 5 个,所以总和除以 5,后面加 0.5 是用修正值
}
//求阈值
sum = csum = 0.0;
n = 0;
//计算总的图象的点数和质量矩,为后面的计算做准备
for (k = 0; k <= 255; k++)
{
sum += (double)k * (double)pixelNum[k];
//x*f(x)质量矩,也就是每个灰度的值乘
以其点数(归一化后为概率),sum 为其总和
n += pixelNum[k];
//n 为图象总的点数,归一化后就是累积概率
}
fmax = -1.0;
//类间方差 sb 不可能为负,所以 fmax 初始值为-1 不影响
计算的进行
n1 = 0;
for (k = 0; k < 255; k++)
//对每个灰度(从 0 到 255)计算一次分割后的类
间方差 sb
{
n1 += pixelNum[k];
if (n1 == 0) { continue; }
n2 = n - n1;
if (n2 == 0) { break; }
//n1 为在当前阈值遍前景图象的点数
//没有分出前景后景
//n2 为背景图象的点数
//n2 为 0 表示全部都是后景图象,与 n1=0 情况类似,
之后的遍历不可能使前景点数增加,所以此时可以退出循环
//前景的“灰度的值*其点数”的总和
//m1 为前景的平均灰度
csum += (double)k * pixelNum[k];
m1 = csum / n1;
m2 = (sum - csum) / n2;
sb = (double)n1 * (double)n2 * (m1 - m2) * (m1 - m2);
if (sb > fmax)
{
//m2 为背景的平均灰度
//如果算出的类间方差大于前一次算出的类间方差
//sb 为类间方差
//fmax 始终为最大类间方差(otsu)
//取最大类间方差时对应的灰度的 k 就是最佳阈值
fmax = sb;
threshValue = k;
}
}
image.UnlockBits(bd);
image.Dispose();
return threshValue;
}