前些时间我需要用 python 写一段代码来判别一个曲线图中有多少个峰,曲
线图类型大概如下图所示:
图 1 原始曲线图
如果用肉眼鉴别,很容易就知道图中峰的个数为 2。然而,计算机不是人脑
的思维方式,它靠的是数据和算法,因此需要将形象的东西数值化并将判别公式
化。当时我在百度以各种关键词查询如何写一段 python 程序来判别峰值并进行
个数的计算。然而都没有好的方法。
最简单粗暴的回答是,寻找这个曲线的最大值和最小值,显然,这个方法是
行不通的,从上面的图可以看到,第二个峰并不是最大值,但它确实是一个峰。
图 2 寻找最大值和最小值确定波峰和波谷
然后我又查找了一下,有这么个方法,所谓峰值就是前后两个值都比当前的
值小,这样子的值便可以定义为峰值,并设计了代码如下:
图 3 寻找极值作为峰值
这方法看上去很合理,可是在不平滑的曲线上会接连遇到问题,首选我们看
一下图 1,红色箭头指示的两个位置,一个是噪声(箭头 1),它符合前后的值都
小于它的条件,会被判别为峰,而另一个(箭头 2),由于最高峰位置是个平顶,
不符合前后都大于它,会被认为不是峰,这些均导致了上述方法也行不通!
图 4 有噪声不规则曲线判别存在的问题
为了消除噪声被误判为峰,我们需要设定一个阈值,大于该阈值的才会被确
认为峰值,避免噪声也被判为峰。
图 5 阈值设置
而对于平顶的情况,处理起来比较复杂,我们先一步一步说明。除了平顶的
情况,按照上面的判别算法,即便设置了阈值,如果在一个峰的顶部有尖峰,也
会被判为一个峰,如果有几个尖峰,就一个就变成了几个。
图 6 尖峰导致错判
面对平顶或者有尖峰的情况,最好的办法就是将粗糙的曲线进行平滑。下图
可以看到,经过平滑后情况便好了很多。
图 7 进行曲线平滑的情况
基本平滑以后可以防止上述错误的出现,但为了保险起见(主要防止平顶和
尖峰在平滑后还是存在),我们可以认为大于阈值的比前后都大的值以及与前或
后都值相同的都是峰,然后设置峰的宽度,目的是保证在这个宽度内的所有尖峰
都视同是同一个峰。
总的来说,就是先进行曲线平滑,然后设置阈值和峰宽度,然后寻找符合阈
值的极值和平顶值,在根据峰的宽度看这些值是否在宽度内,如果在宽度内将被
认为是同一个峰。我试了一下基本都可以。以下是程序(注意:输入的曲线我当
时是用了已经归一化的曲线,所以值是在 0-1 范围):
###对信号(signal)进行均值滤波,滤波窗口大小为 window_size
###要求信号(signal)是一个列表(list)
def gen(l, window_size):
index = 0
ans = 0
times = 0
while True:
while index < window_size:
ans += l[times + index]
index += 1
yield float(ans) / float(window_size)
###Reset
index = 0
ans = 0
times += 1
def mean_filter(signal, window_size):
window_size =8
temp = gen(signal, window_size)
filtered = []
for i in range(len(signal) - window_size):
filtered.append(next(temp))
return filtered
def find_peak(filtered_signal, length_data, thre, peak_width):
l=[];
for i in range(1, length_data - 1): # 在整个 B 的长度内找出极值
if filtered_signal[i - 1] < filtered_signal[i] and filtered_signal[i] > filtered_signal[i + 1]
and filtered_signal[i] > thre: # 找出极值,并设置阈值,这里阈值设为 20
l.append(i); # 找出极值的位置
elif filtered_signal[i] == filtered_signal[i - 1] and filtered_signal[i] > thre:
l.append(i); # 最高点前后可能有相等的情况
CC = len(l) # 统计极值有几个,如果有两条线,就会有两个,如果有一条线就只有一
个
# print(CC)
# print(l)
cou = 0
for j in range(1, CC):
if l[j] - l[j - 1] < peak_width: # 此判断用于将位于同一个峰内的极值点去除
cou = cou + 1
rcou = CC - cou
return rcou
def main():
signal = D
window_size =8
filtered_signal = mean_filter(signal, window_size)
plt.plot(filtered_signal)
plt.show()
length_data = len(filtered_signal)
thre = 0.3 #峰的阈值高度,只有高于此值才算一个峰,否则算是噪声波动,建议这个值
在均值之上
peak_width =20 #为了避免一个峰内出现几个尖峰而导致被判别为多个峰,这里设定峰
的宽度,在此宽度内均认为属于同一个峰
rcou = find_peak(filtered_signal, length_data, thre, peak_width)
print(rcou)
if __name__ == "__main__":
main()