第40卷 第24期
2020年12月
光 学 学 报
Acta Optica Sinica
Vol. 40, No. 24
December, 2020
结合深度卷积神经网络与影像学特征的
肺结节良恶性鉴别方法
高大川, 聂生东*
上海理工大学医疗器械与食品学院, 上海 200082
摘要 提出一种将卷积神经网络(CNN)学习特征与传统影像学特征结合的肺结节良恶性鉴 别 方 法。首 先,从 电 子
计算机断层扫描(CT)图像中分割出肺结节区域,并使用传统机器学习方法提取结节区域的影像学特征;然后,使用
截取的肺结节训练3D-Inception-ResNet模型,提取网络学习的CNN 特征,组合两类特征,并利用随 机 森 林(RF)模
型进行特征选择;最后,采 用 支 持 向 量 机(SVM)、RF 等 传 统 分 类 器 对 肺 结 节 进 行 良 恶 性 鉴 别 诊 断。 使 用 LIDC-
IDRI数据库中的1036个肺结节进行实验验证,最终所提方法 的 分 类 准 确 率、敏 感 度、特 异 度 及 接 受 者 操 作 特 性 曲
线(ROC)下面积(AUC)分别达94.98%、90.02%、97.03% 及97.43%。实 验 结 果 表 明,所 提 方 法 能 准 确 地 判 别 肺
结节的良恶性,并优于大部分主流方法。
关键词 图像处理; 肺癌早期诊断; CT 影像; 肺结节良恶性鉴别; LIDC-IDRI数据库
doi: 10.3788/AOS202040.2410002
中图分类号 TP391.41 文献标志码 A
Method for Identifying Benign and Malignant Pulmonary Nodules
Combing Deep Convolutional Neural Network and Hand-Crafted Features
School of Medical Instrument and Food Engineering University of Shanghai for Science and Technology
Gao Dachuan Nie Shengdong*
Shanghai 200082 China
Abstract Here we present a method for identifying benign and malignant pulmonary nodules that combines
convolutional neural network CNN learning features and conventional hand-crafted features First the pulmonary
nodules area is segmented from computed tomography CT images and traditional machine learning methods are
used to extract the image features of the nodule area Then the CNN features of network learning are extracted
using the intercepted pulmonary nodules to train the 3D-Inception-ResNet model and the 2 kinds of features are
combined the random forest RF model is used for feature selection Finally support vector machine SVM and
RF classifier are used to identify benign and malignant pulmonary nodules The 1036 pulmonary nodules in the
LIDC-IDRI database are used for experimental verification Classification accuracy sensitivity specificity and area
under the receiver operating characteristic ROC curve AUC of the proposed method can reach 94 98%
90 02% 97 03% and 97 43% respectively The proposed method can accurately distinguish benign and
malignant lung nodules more effectively than most existing mainstream methods as shown by the experimental
results
Key words image processing early diagnosis of lung cancer CT image classification of benign and malignant
nodules LIDC-IDRI database
OCIS codes 100 4996 100 6950
1 引 言
肺癌已成为患者因恶性肿瘤死亡的首要原因,
发病率和死亡率呈逐年上升趋势[1]。“早发现、早诊
断、早治疗”是提高肺癌患者生存率的关键。与晚期
肺癌相比,经早期诊断的肺癌患者存活率大大提高。
基金项目: 国家自然 科 学 基 金(81830052)、上 海 市 分 子 影 像 学 重 点 实 验 室 项 目(18DZ2260400)、上 海 市 自 然 科 学 基 金
收稿日期: 2020-07-13; 修回日期: 2020-09-02; 录用日期: 2020-09-15
(20ZR1438300)
*E-mail: nsd4647@163.com
2410002-1
光 学 学 报
基于传统影像学方法的肺结节良恶性诊断总体
一种基于 临 床 医 生 标 注 属 性 加 权 的 肺 结 节 分 类 模
肺癌早期一般表现为肺结节,因此,对肺结节进行检
测与诊断是降低肺癌患者死亡率的关键[2]。
影像学检查是筛选肺癌的主要方法之一[3]。在
临床治疗中,医生会 根 据 患 者 电 子 计 算 机 断 层 扫 描
(CT)影像中结节的形态、位置及纹理等特征分析病
变信息[4]。但是由 于 我 国 医 疗 资 源 匮 乏,放 射 科 医
生平均每天需要审 阅 百 余 位 病 人 的 影 像,这 无 疑 是
一项耗时、费力、高 强 度 的 工 作,并 且 不 同 放 射 医 师
对结节的诊断能力 与 自 身 资 历 有 很 大 关 系,具 有 很
强主观性[5]。因此,计算机辅助 诊 断(CAD)系 统 应
运而生,它能作为医生的“第 二 意 见”辅 助 放 射 科 医
生进行临床诊断[6]。
流程主要包括肺 结 节 分 割、特 征 提 取、特 征 优 化、使
用分类模型进 行 良 恶 性 分 类[7]。通 常,分 类 精 度 与
3个因素有关:肺结节分割精度;肺结节提取特征的
代表性;分类器 的 性 能。因 此 常 通 过 优 化 上 述 因 素
来提高肺结节良恶性分类精度。Dhara等[8]提出了
型,该模型建立结节属性与良恶性程度的权重映射,
并计算172种结节特征,使用分类器预测结节属性,
最后根据属性加权得到良恶性分类结果。作者使用
LIDC-IDRI数据集对所提模型进行验证,最终在集
成随机森林(RF)、集 成 支 持 向 量 机(SVM)及 K 最
近邻域分类器中,模型的分类精度分别达84.89%、
83.86%及79.59%。Kaya等[9]使 用 半 自 动 化 技 术
分割肺结节,并 计 算 肺 结 节 形 状、纹 理 及 边 缘 等 特
征,最后利用SVM 对 结 节 进 行 分 类。 作 者 在 三 种
样本配置情 况 下 通 过 使 用 LIDC-IDRI数 据 集 中 的
891个结节来评估方法的有效性(恶性评分为1和2
的肺结节为良性,恶性 评 分 为4 和5 的 肺 结 节 为 恶
性,三种配置分别认为评分3的结节为丢弃、良性及
恶性),最 终 接 受 者 操 作 特 性(ROC)曲 线 下 面 积
(AUC)分别为0.9505、0.8822及0.8488。
近年来,深度学习在医学图像分析领域取得显
著进展,在肺结节良恶性分类领域,很多性能优良的
网络模型被陆续提出。相较于传统的影像学特征分
类模型,卷积神经网络(CNN)使 用 原 始 CT 影 像 作
为模型输入,自动学习特征并进行分类,省略了特征
设计环节。 一 般 情 况 下,性 能 优 异 的 CNN 模 型 都
需 要 庞 大 的 数 据 集 进 行 训 练 学 习。Nibali等[10]采
用课程学习、迁移学习、深度残差网络来提高分类性
能,并提取了肺结节 沿 三 个 方 向 的 切 片(横 截 面、矢
状面、冠状面),同时训练了三个ResNet-18网络,通
2410002-2
过融合三个平面的分类结果获得最终分类结果。作
者使用LIDC-IDRI数据集对该网络进行验证,准确
率为89.90%。Shen等[11]提出了一种多尺度CNN
模型来区分良性 结 节 与 恶 性 结 节。首 先,在 结 节 区
域提取出多个尺度的结节块,包括32×32×32像素
块、64×64×64 像素块、96×96×96 像素块;然后,
通过训练三 个 CNN 模 型 来 学 习 深 度 特 征;最 后 使
用RF 和SVM 进行分类。作者使用LIDC-IDRI数
据集中的880个良性和495个恶性结节对模型进行
评估,准确率达86.84%。
目前,基于CT 影像的肺结节良恶性分类研究主
要都是基于上述两类方法而单独进行的,很少有文献
结合两类方法展开研究。本文结合两种不同方法,提
出一种结合深度CNN 与影像学特征的肺结节良恶性
鉴别方法。该方法使用传统机器学习方法提取出肺
结节影像学特征,并结合3D-Inception-ResNet模型的
高级特 征,利 用 RF 模 型 进 行 特 征 选 择,最 后 采 用
SVM、RF等传统分类器进行分类鉴别。实验结果表
明,两类不同特征的组合使用大大丰富了结节特征的
代表性,这既克服了传统影像学特征不能充分反映病
灶区域信息的缺点,又弥补了在数据量不足的情况下
3D CNN 分类效果不好的劣势。所提方法对肺结节
良恶性分类的准确率有明显提高。
2 基本原理
名放射科专家勾画的肺结节边界作为结节分割的结
使用LIDC-IDRI数据 集 开 展 实 验,首 先 使 用4
果;然后对每个肺结节样本提取灰度、形状、纹理、小
波 域 等 多 种 传 统 影 像 学 特 征,并 训 练 改 进 3D-
Inception-ResNet模 型,得 到 肺 结 节 CNN 特 征;组
合两类特征,使用 RF 模型进行特征选择;最后采用
SVM、RF 等传统 分 类 器 进 行 分 类 鉴 别。 图1 为 所
提方法的流程图,主要包括三部分:传统肺结节影像
学特征提取部分;CNN 提取特征部分;分类部分。
2.1 传统肺结节影像学特征提取部分
使用LIDC-IDRI数据 集[12]中4 名 放 射 科 专 家
勾画的肺结节边界作为结节分割的结果。该数据库
提供1010 个 病 例 的1018 套 胸 腔 CT 图 像 数 据,每
个病例中包 含 病 人 的 DICOM 图 像、4 位 放 射 科 专
家标注的结节位 置 和 临 床 征 象 信 息。首 先,排 除 切
片厚度大于3 mm 的CT 影像中的结节,研究表明,
厚层CT 影 像 不 利 于 肺 结 节 良 恶 性 鉴 别[13];然 后,
挑选出至 少 被3 名 专 家 同 时 勾 画 的 结 节,并 通 过
P-MAP融合方法[14]确定结节分割结果;最终,得到
光 学 学 报
图1 所提方法的流程图
Fig 1 Flow chart of proposed method
1036个64×64×64 肺 结 节 像 素 块,其 中 良 性 结 节
380个,恶 性 结 节300 个,良 恶 性 不 确 定 结 节356
个。图2为结节融合 方 法 示 意 图,图2(e)为 至 少3
名专家所勾画区域的公共部分。
图2 结节融合方法示意图。(a)~(d) 4名放射医师手动分割的肺结节区域;(e)结节融合方法分割的肺结节区域
e pulmonary nodule area segmented by nodule fusion method
Fig 2 Schematic of nodule fusion method a -- d Pulmonary nodule areas are manually segmented by four radiologists
特征 提 取 是 将 图 像 信 息 数 字 化 的 重 要 转 换 手
图3为 搭 建 的3D-Inception-ResNet分 类 模 型
结构。首 先 根 据 LIDC-IDRI数 据 库 中 放 射 科 专 家
段。特征分布的差异性是肺结节良恶性鉴别的重要
判据,如恶性结节具有分叶征、毛刺征、血管相融、囊
的标注信息,从512×512×S×1原始CT 影像中截
性气隙等临床征象,而 良 性 结 节 通 常 位 于 边 缘 位 置
取出以肺结节为中心的64×64×64×1 像 素 块,其
且表面光滑[15-16]。因 此,对 每 个 肺 结 节 样 本 提 取 纹
中S为CT 影像切片数(S>64);然后,在三个维度
(即x轴、y轴和z轴)对每个肺结节样本进行平移、
理、灰度、形状等103种传统影像学特征[17]。
翻转、旋转等操作来扩增实验数据,并将增强后的数
2.2 卷积神经网络提取特征部分
搭建了3D-Inception-ResNet模型,相较于传统
据中心采样至48×48×48×1 像 素 块,以 消 除 数 据
增强操作对结节块边界值的影响;最后,使用扩增数
二维网络模型,三维 模 型 能 够 学 习 更 丰 富 的 结 节 空
间信 息,使 CNN 提 取 的 高 级 特 征 更 具 代 表 性[18]。
据训练3D-Inception-ResNet模 型。 模 型 共 包 含3
Inception-ResNet 模 型 由 Szegedy 等[19] 提 出,在
个卷积层、5个池化层、3个Inception-ResNet模块、
1个 输 出 层。 本 文 提 取 了3D-Inception-ResNet模
Inception模块中 引 入 ResNet残 差 结 构 后,该 模 型
具备更优异的分类性能。
型分类输出前一层的特征,总共512种CNN 特征。
2410002-3
光 学 学 报
图3 3D-Inception-ResNet模型架构
Fig 3 Architecture of 3D-Inception-ResNet model
图 4 为 Inception-ResNet 模 块。 与 原 始
Inception模 块 相 比,Inception-ResNet模 块 增 加 了
shortcut结构,基于输入数据共有4条卷积分支,分
别模拟不同大小的感受 野;叠 加 使 用3×3×3 卷 积
核,可以在替代大卷积核的同时减少模型参数量;最
后对各卷积分支所得特征图进行级联,使用1×1×
1卷积操作对齐维度,将结果与输入数据相加,得到
Inception-ResNet模块输出。
pi= expyi
对于二分类网络,Softmax函数被定义为
expy0 +expy1, i=0,1,
(1)
式中:y0,y1 均为CNN 的输出;pi 为肺结节样本预
测为良性或恶性的概率。通过最小化损失函数来训
练网络模型,损失函数被定义为
L=-1N∑[qlogp1 +(1-q)logp0], (2)
式中:N 为批处理大小,设置为16;q为肺结节样本
的真实 标 签,q=0 或1,即 良 性 或 恶 性。 使 用 一 阶
Adam 算 法 优 化 目 标 函 数[20],初 始 学 习 率 为
0.0015,每训练8轮次后,学习率将缩小1/10,直至
训练结束,总共学习30轮次。
2.3 分类部分
为了更大程度地丰富肺结节特征的代表性,组
合两类特征,图5为特征集可视化图。行表示结节,
共包括LIDC-IDRI数据集中的680个肺结节样本;
列 表 示 特 征,包 含 传 统 影 像 学 特 征 103 个。3D-
Inception-ResNet模 型 提 取 特 征512 个,共615 个
特征。由 于 影 像 学 特 征 与 CNN 特 征 产 生 方 式 不
同,在两类特征的过渡点存在明显的灰度差异,特征
被归一化至[0,1],以便可视化。接下来使用组合特
征集完成分类鉴别。
图4 Inception-ResNet模块
Fig 4 Inception-ResNet module
2410002-4
光 学 学 报
因此,特征优化 有 助 于 提 高 分 类 模 型 的 性 能。采 用
RF 模型进行特征选择,挑 选 出 权 重 值 高 于0.01 的
图像特征构成特征子集[21]。最后,将优化特征子集
输入SVM、RF 等 传 统 分 类 器 中,实 现 肺 结 节 良 恶
性分类鉴别。
3 分析与讨论
3.1 实验设置
实验设置如表1所示,包含3种实验:1)分别基
于传统 影 像 学 特 征、3D-Inception-ResNet模 型、结
合CNN 特征与 影 像 学 特 征 的 分 类 实 验;2)在 三 种
不同样本配置方案 下 的 分 类 实 验,样 本 配 置 方 案 如
表2 所 示,三 种 样 本 配 置 方 案 分 别 认 为 恶 性 度 为3
的结节为丢 弃、良 性、恶 性;3)与3D-DenseNet、3D-
ResNet等经典网 络 架 构 的 对 比 实 验。 为 确 保 实 验
的可靠性,训练集与 验 证 集 采 用 十 折 交 叉 验 证 方 法
确定,所有分类 器 都 被 设 置 为 默 认 参 数,CNN 模 型
是基 于 TensorFlow 框 架 实 现 的,在 配 备 有Intel
Xeon E5-2673 CPU 2.4GHz处 理 器,NVIDIA Ge
Force GTX 1080显卡的工作站上完成实验。
图5 特征集可视化图
Fig 5 Visualization map of features
准确、有效的特征向量可以提高肺结节的分类
精度,但当特征冗余达到一定程度时,不仅会增加整
个模型的运算量,而且还会降低肺结节分类的精度。
表1 实验设置说明
Table 1 Description of experiment setting
Experiment
1
2
3
Sub experiment
a
b
c
d
Description
Classification based on traditional hand-crafted features
Classification based on 3D-Inception-ResNet model
Classification on the Shanghai Chest Hospital dataset
Classification combining CNN features and hand-crafted features
Classification under three different sample configuration schemes
Contrast of different architectures (including DenseNet and ResNet)
表2 三种肺结节样本配置方案
Table 2 Configuration scheme of three pulmonary nodule samples
Number of benign
Configuration
Description
‘1’, ‘2’ as benign and ‘4’, ‘5’ as malignant
‘1’, ‘2’, ‘3’ as benign and ‘4’, ‘5’ as malignant
‘1’, ‘2’ as benign and ‘3’,‘4’, ‘5’ as malignant
采用以下评价指标衡量分类模型性能:1)准确度
(A),正确分类 的 样 本 占 所 有 样 本 的 比 例;2)敏 感 度
(SEN),正确分类的恶性结节占所有真实恶性结节的比
例;3)特异度(SPE),正确分类的良性结节占所有真实良
性结节的比例;4)AUC、ROC曲线是一种显示分类器真
阳性率与假阳性率之间折中的图像化方法[22]。AUC
通常用于评估分类模型的性能。NTP 和 NTN 分别表
示正确分类的恶性结节、良性结节样本数;NFP 和NFN
分别表示错误预测为恶性结节、良性结节样本数。
2410002-5
1
2
3
A=
Number of malignant
nodules
300
300
656
nodules
380
736
380
(NTP +NTN)
NTP +NFN,
NTN
NTN +NFP。
(NTP +NTN +NFP +NFN), (3)
(4)
SEN =
(5)
SPE =
NTP
3.2 结果与分析
3.2.1 结 合 CNN 特 征 与 影 像 学 特 征 的 肺 结 节 良
表3为实验1 分 类 结 果,其 中 NB 为 朴 素 贝 叶
恶性分类
光 学 学 报
斯分类器,KNN 为 K 最 近 邻 分 类 器,LDA 为 线 性
判别分类器。组合 特 征 在 RF 分 类 器 与SVM 中 表
现优异,分别取得92.75% 与94.98% 的 分 类 精 度。
与传统影像 学 特 征 分 类 方 法 相 比,融 合 CNN 特 征
的 分 类 方 法 的 各 评 价 指 标 显 著 提 高,证 明 3D-
Inception-ResNet模型提取了能有效反 映 病 灶 区 域
信息的CNN 特 征,从 而 进 一 步 提 高 了 肺 结 节 良 恶
性分类精度。
表3 实验1分类结果比较
Table 3 Comparison of classification results in experiment 1
Method
Hand-crafted features+Gaussian-NB
Hand-crafted features+KNN
Hand-crafted features+RF
Hand-crafted features+LDA
Hand-crafted features+SVM
Combined features+Gaussian-NB
A /%
89.69
90.72
91.64
91.75
91.81
91.44
91.75
91.81
92.75
90.72
94.98
从LIDC-IDRI数 据 库 中 选 择4 个 典 型 结 节 证
明所提方法的有效性,如图6所示。图6(a)结节为
良性结节,图6(b)为 恶 性 结 节,基 于 传 统 影 像 学 特
征 方 法 对 这 两 种 结 节 的 预 测 都 是 正 确 的,而3D-
Inception-ResNet模型却预测错误;相反地,图6(c)
3D-Inception-ResNet
Combined features+KNN
Combined features+RF
Combined features+LDA
Combined features+SVM
SEN /%
85.18
83.33
89.42
86.21
88.66
92.87
86.21
88.66
92.12
88.46
90.02
SPE /%
91.43
94.03
93.06
94.12
94.59
91.09
94.11
94.59
93.34
91.55
97.03
AUC /%
95.19
95.54
96.78
96.18
96.53
96.27
95.99
96.53
97.11
96.46
97.43
为良 性 结 节,图 6(d)为 恶 性 结 节,3D-Inception-
ResNet模型对这两种结节的预测都是正确的,而传
统影像学特征方法却预测错误。所提方法能正确分
类鉴别这4种结节,充分说明,组合特征能更大程度
丰富肺结节特征,提高结节分类精度。
图6 LIDC-IDRI数据库中4个典型结节。(a)~(d)肺结节二维切片;(e)~(h)对应结节的三维显示图
Fig 6 Four typical nodules in LIDC-IDRI database a -- d 2D slices of nodules
e -- h 3D displays of corresponding nodules
除此之外,在 保 证 所 有 数 据 匿 名 的 情 况 下,使
用上海 市 胸 科 医 院(SCH)的36 名 肺 癌 诊 断 患 者
数据进行额外验证,每例数据均包括 CT 影 像 和 病
理检验报告,根据 医 生 标 注 结 果 与 病 理 活 检 结 果,
最终得 到66 个 肺 结 节 样 本,其 中 良 性 结 节 有24
个,恶性结节有42 个。 该 数 据 仅 作 为 测 试 数 据 来
验证 所 提 方 法 的 临 床 可 实 施 性。 表4 为 实 验 结
果,SCH 测 试 集 数 据 仍 然 能 达 到 较 高 的 分 类 精 度,
充分说明 所 提 方 法 具 有 鲁 棒 性,是 一 种 有 效 的 计
算机辅助诊断方法。
表4 SCH 数据集分类结果
Table 4 Classification results of SCH dataset
Dataset
LIDC-IDRI
SCH
A /%
94.98
90.91
SEN /%
90.02
88.10
2410002-6
SPE /%
97.03
95.83
AUC /%
97.43
95.58
光 学 学 报
分类
3.2.2 三种不同 样 本 配 置 方 案 下 的 肺 结 节 良 恶 性
表5 为 三 种 不 同 样 本 配 置 方 案 的 分 类 结 果 比
较。图7 为 三 种 配 置 方 案 的 ROC 曲 线 对 比。 配
置1的总 体 分 类 性 能 优 于 配 置2 和 配 置3,证 明 去
除专家标注的恶性度为‘3’的不确定结节后,结节恶
性度特征更明确,分 类 结 果 更 好。配 置2 的 分 类 性
能优于配置3,证明专家标注的恶性度为‘3’的不确
定结节本质上更趋向于良性结节,这与 Dhara等[8]
实验结论一致。实 验 结 果 表 明,所 提 方 法 对 不 确 定
性结节也具有较强的分辨能力。
Table 5 Comparison of classification results in three different sample configuration schemes
Configuration
Configuration 1
Configuration 2
Configuration 3
Method
表5 三种不同样本配置方案的分类结果比较
SEN /%
92.12
90.02
70.87
70.20
85.11
82.35
Combined features+RF
Combined features+SVM
Combined features+RF
Combined features + SVM
Combined features+RF
Combined features+SVM
A /%
92.75
94.89
86.04
85.86
80.38
79.73
SPE /%
93.34
97.03
90.20
90.55
72.37
74.91
AUC /%
97.11
97.43
91.70
91.12
87.26
85.31
图7 在不同分类器中的ROC 曲线。(a) RF; (b) SVM
Fig 7 ROC curves in different classifiers a RF b SVM
2410002-7
光 学 学 报
3.2.3 经典卷积神经网络架构对比
为了进一步评估所提方法的有效性,在相同数
据 集 划 分 情 况 下,使 用 3D-DenseNet[23]、3D-
ResNet[24-25]等经典CNN 架构提取CNN 特征,并组
合影像学 特 征 进 行 分 类 实 验。 图8 为 搭 建 的3D-
DenseNet与3D-ResNet模型图。
图8 经典CNN 架构。(a) 3D-DenseNet模型;(b) 3D-ResNet模型
Fig 8 Classic CNN architecture a 3D-DenseNet model b 3D-ResNet model
表6为不同3D CNN 的分类结果对比,实验结
果 表 明:在 3D CNN 分 类 模 型 中,3D-Inception-
ResNet 的 分 类 性 能 优 于 3D-DenseNet 与 3D-
ResNet;相较于CNN 分类模型,结合传统影像学与
CNN 特征的分类模型具有更优异的分类性能。
表6 不同CNN 架构的分类结果对比
Table 6 Comparison of classification results of different CNN architectures
SPE /%
Architecture
3D-DenseNet
94.55
89.47
3D-ResNet
90.91
91.07
91.09
97.03
A /%
89.69
90.72
84.69
90.82
91.44
94.98
法 与 其 他 方 法 的 结 果 比 较。Causey 等[26] 使 用
NoduleX 分类模型进行肺结节良恶性分类,通过 构
建2D-CNN21与2D-CNN47网络提取高级特征,并
AUC /%
92.64
94.20
88.13
95.38
96.27
97.43
SEN /%
87.10
90.00
76.74
90.48
92.87
90.02
3D-DenseNet combining hand-crafted features
3D-ResNet combining hand-crafted features
3D-Inception-ResNet
3D-Inception-ResNet combining hand-crafted features
3.2.4 最新研究成果对比
为了更客观地评估所提方法,对所提方法和近
些年使用的其他相似方法进行对比。表7为所提方
2410002-8