logo资料库

MIT-BIH数据库详解.doc

第1页 / 共5页
第2页 / 共5页
第3页 / 共5页
第4页 / 共5页
第5页 / 共5页
资料共5页,全文预览结束
MIT-BIH 心律失常数据库 MIT-BIH 的数据格式: MIT-BIH 为了节省文件长度和存储空间,使用了自定义的格式。一个心电 记录由三个部分组成: 1.头文件(.hea),存储方式是 ASCII 字符。 2.数据文件(.dat),按二进制存储,每三个字节存储两个数,一个数是 12 位。 3.注释文件(.art),按二进制存储。 头文件[.hea] 头文件的内容是由一行或者多行 ASCII 码字符组成,并且至少包含一个记录 行,通常还有信号技术规范行,片段技术规范行(对于多片段数据记录)和信息 注释行。 记录行从左到右依次记录了信号的名称,片段数(可选),信号数量,采样 频率,计数频率(可选),计数基值(可选,与计数频率配合使用并且以圆括号 而非空格分隔),每个信号的采样数量,采样开始时间(可选),采样日期(可选), 这些字段除了计数频率和计数基值之外都以空格分隔。 紧跟记录行的是信号技术规范行,改行主要包含了存储信号的文件名,存储 格式,ADC 增益,基线值,ADC 分辨率,ADC零值,信号初始值等字段。 片段技术规范行主要包括记录名称和每信号的采样数两个字段,该行只有在 多片段记录的头文件中才有。 信息注释行一般在头文件的最后,每行的开头以“#”开始,内容一般是患 者的性别、年龄以及患者的用药情况。 下面以 100.hea 为例,文件内容如下: 100 2 360 650000 100.dat 212 200 11 1024 995 -22131 0 MLII 100.dat 212 200 11 1024 1011 20052 0 V5 # 69 M 1085 1629 x1
# Aldomet, Inderal 该文件的第一行为记录行,指出该记录为一包含两个采样率为 360Hz,每 一信号为 650000 个采样点,采样开始时间和日期没有记录。后面紧跟的两 行为信号技术规范行,从上面可以看出,这两个信号都是存储在 100.dat 文件中,存储格式是每 12bit 存储一个采样值(既 212 格式),ADC 增益是 200ADC Units/mV,ADC 的分辨率为 11 位,ADC 的零值是 1024,在这里基线 值没有明确给出,但可以认为它等于 ADC 的零值 1024,两个信号的第一个 采样值分别是 995 和 1011,65 万个采样点得校验数分别为 -22131 和 20052, 输入输出可以以任意尺寸的块来执行,信号描述字段说明了这两个信号分 别是修正肢体导联 II(MLII)和修正导联 V5。文件的最后包含了两行信息 注释行,第一行说明了患者的年龄和性别以及记录数据,第二行说明了患 者的用药情况。 数据文件[.dat] MIT-BIH 数据库的存储格式是 Format8、Format16 、Format80、 Format212、 Format310 等 8 种。具体到某一数据文件的存储格式会在相应的头文件说明, 在每一种格式种都是将赖在两个或者多个信号采样得到的数据交替存储。 下面就存储格式 Format212 进行详细介绍: 格式 212 是针对两个信号的数据库记录,我们假定这两个信号分别为信 号 1 和信号 2,在.dat 文件中这两个信号的采样值交替存储,每三个字节 存储两个数据,这两个数据分别是信号 1 和信号 2 的采样值,信号 1 的采 样数据由第二个字节的低四位和第一个字节组成,信号 2 的采样数据由第 二个字节的高四位与第三个字节组成。这两个信号的所有数据都是按照这 种方式连续存储。 下面以 100.dat 文件为例进行说明: 按照“212”格式,从第一个字节开始读起,每三个字节表示两个值,第一组为: “E3 33 F3”,根据信号 1 是由第二个字节的低四位和第一个字节组成得到信号 1 的第一个采样值为 0X3E3。信号 2 由第二个字节的剩余 4 位和第三个字节组成, 可得到信号 2 的第一个采样值 0X3F3,转化为十进制分别为 995 和 1011。后面依 次类推,分别表示这两个信号的采样值。
注释文件[.art] 注释文件记录了心电专家对相应心电信号的诊断信息,主要有两种格式:MIT 格式和 AHA 格式。MIT 格式是一种紧凑型格式,每一注释的长度占偶数个字节的 空间,多数情况下是占用两个字节,多用于在线的注释文件。而 AHA 格式是每 一注释信息占用 16 个字节的空间,多用于交换文件的情况。这两种格式的判别 主要取决于前两个字节,若文件的第一个字节不为 0 或者第二个字节的值等于 0X5B/0X5D,则该文件是按照 MIT 格式存储的,否则是按照 AHA 格式存储的。 下面主要介绍 MIT 格式: MIT 格式每一个注释单元的前两个字节的第一个字节为最低有效位,16 位中的 最高 6 位表示注释类型码,剩余的 10 位说明了该注释点的发生时间或为辅助信 息。若为发生时间,其值为该注释点到前一注释点的时间间隔(对于第一个注释 点为记录的开始到该点的间隔),若为辅助信息则说明了附加信息的长度。 下面以记录 100 的注释文件 100.art 为例进行说明: 从上图可以看出 100.dat 文件的第一个字节不为 0,可知该文件是以 MIT 格式存 储的。从第一个字节开始按照 MIT 格式进行分析,首先读出 16 位的值是 0X7012, 其中高六位是 0X1C(十进制是 28),低十位是 0X12(十进制是 18),该类型代 码是 28,代表的是节律变化,发生时间是在 0.05 秒(18 / 360Hz)。接着读出后 面的 16 位是 0XFC03,其中高六位是 0X3F(十进制是 63),低十位是 0X03(十 进制是 3),该类型代码是 63,代表的是在该 16 值后附加 3(低十位值代表的数) 个字节的辅助信息,若字节个数为奇数,则再附加一个字节的空值,在本例中就 是“28 4E 00 00”,然后再从下一个字节读取 16 位的值 0X043B,其中高六位是 0X01,低十位是 0X3B(十进制是 59),该类型代码是 1,代表正常心跳,发生 时间为 0.214 秒((18+59)/360Hz),依次类推就可以读出所有注释,当读到 16 位值为 0 时就表示到了文件尾。
注释代码 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 N L R a V F J A S E j / Q ~ | s T * D " = 说明 No TQRS Normal beat 正常心跳 Left bundle branch block beat Right bundle branch block beat Aberrated atrial premature beat Premature ventricular contraction 室性早搏 Fusuion of ventricular and normal beat Nodal (junctional) premature beat Atrial premature beat 房性早搏 Premature or ectopic supraventricular beat Ventricular escape beat Nodal (junctional) escape beat Paced beat Unclassifiable beat Signal quality change Not specified Isolated QRS-like artifact Not specified ST change T-wave change Systole Diastole Comment annotation Measurement annotation
24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 p B ^ t + u ? ! [ ] e n x f ( ) r P-wave peak Left or right bundle branch block Non-conducted pacer spike T-wave peak Rythm change U-wave peak Learning Ventricular flutter wave Start of ventricular flutter/fibrillation End of ventricular flutter/fibrillation Atrial escape beat Supraventricular espace beat Not specified Non-conducted P-wave (blocked APB) Fusion of paced and normal beat Waveform onset, PQ junction(begin of QRS) Waveform end, JPT(J point, end of QRS) R-on-T premature ventricular contraction
分享到:
收藏