logo资料库

基于深度学习的图像检索研究.pdf

第1页 / 共55页
第2页 / 共55页
第3页 / 共55页
第4页 / 共55页
第5页 / 共55页
第6页 / 共55页
第7页 / 共55页
第8页 / 共55页
资料共55页,剩余部分请下载后查看
封面
声明
摘要
英文摘要
目录
图表目录
第一章 绪论
1.1 前言
1.2 国内外研究热点
1.3 著名的图像检索系统介绍
1.4 本文研究内容和组织结构
第二章 相关理论基础
2.1 基于内容图像检索的相关知识
2.1.1 基于内容的图像检索系统结构
2.1.2 图像的特征提取
2.1.3 相似性度量
2.1.4 评判标准
2.2 人工神经网络基础
2.2.1 神经网络概念的提出
2.2.2 神经元模型
2.2.3 神经网络的学习和类别
2.3 BP网络模型
2.3.1 BP网络的基本原理
2.3.2 BP网络的优劣
2.4 本章小结
第三章 深度学习网络模型
3.1 深度学习简介
3.2 深度学习的基本思想和训练方法
3.2.1 深度学习的基本思想
3.2.2 深度学习的训练过程
3.3 深度学习的常用方法
3.3.1 自动编码器
3.3.2 受限玻尔兹曼机
3.4 受限玻尔兹曼机(RBM)
3.4.1 受限玻尔兹曼机模型
3.4.2 受限玻尔兹曼机的学习算法
3.4.3 受限玻尔兹曼机的评估方法
3.5 深度信念神经网络
3.6 本章小结
第四章 基于深度学习的图像检索
4.1 图片样本库的建立
4.2 BP神经网络
4.2.1 输入设置
4.2.2 改进后的即神经网络
4.2.3 检索结果分析
4.3 深度信念神经网络
4.3.1 输入设置
4.3.2 网络层数的选择
4.3.3 隐层节点数的设计
4.3.4 构建RBM模型
4.3.5 RBM模型的学习算法
4.3.6 Softmax分类器
4.3.7 实验结果与分析
4.4 两种网络模型比较
4.5 本章小结
第五章 总结与展望
5.1 总结
5.2 展望
参考文献
致谢
分类号 !里3窆! U D C 10126—3 1 109002 密级—— 编号—— 论文题目 研究生: 指导教师: 呈釜擅 高光塞教援 专 业: 让箕扭型堂皇拉苤 研究方向; 多堪佳技苤 所在学院: .i士篡扭堂院 2014年5月2日
原创性声明 本人声明:所呈交的学位论文是本人在导师的指导下进行的研究工作及取得的研究成 果。除本文已经注明引用的内容外,论文中不包含其他人已经发表或撰写过的研究成果,也 不包含为获得内蒙直太堂及其他教育机构的学位或证书而使用过的材料。与我~同工作的同 志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。 学位论文作者签名:豸叁丝 指导教师签名:l至呈兰丝 日 期:塑丝:笸:丕 日 期:盈丝:五!至 在学期间研究成果使用承诺书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:内蒙古大学有权将 学位论文韵全部内容或部分保留并向国家有关机构、部门送交学位论文的复印件和磁盘,允 许编入有关数据库进行检索,也可以采用影印、缩印或其他复制手段保存、汇编学位论文。 为保护学院和导师的知识产权,作者在学期间取得的研究成果(含计算机软件、程序)属于 内蒙古大学计算机学院。作者今后使用涉及在学期间主要研究内容或研究成果,须征得内 蒙古大学计算机学院就读期间导师的同意;若用于发表论文,版权单位必须署名为内蒙古大 学计算机学院方可投稿或公开发表。 、 学位论文作者签名:j阻 期:.地,左!丕 日
基于深度学习的图像检索研究 摘要 深度学习(Deep Learning)是近年来提出的一种利用具有多个隐层的深度 神经网络(Deep Nepal Network,DNN)完成学习任务的机器学习方法。其实质 是,通过构建具有多个隐层的神经网络模型并使用大量的训练数据来学习得到 更有用的特征,进而提升模型预测或分类的准确性。与以往的浅层神经网络的 不同之处在于,深度学习主要强调了神经网络的深度(通常有大于1层的隐层), 还突出了特征学习的重要性,从大数据中学习特征,这些特性可以刻画数据丰 富的内在信息。 基于内容的图像检索(Content-b嬲ed ImageRetrieval,cBm)的基本思想是通过 分析图像本身的内容(如颜色、纹理、形状等),再从图像库中查找相似或相近 的图像。本文在简要介绍了基于文本的图像检索和基于内容的图像检索,并对 两者进行了优劣分析之后,又概述了基于内容的图像检索的研究背景和国内外 的发展与应用现状。在着重介绍了基于内容的图像检索的关键技术和深度学习 的相关知识后,本文设计了一个基于深度学习的图像检索系统。与传统的图像 检索一一需要预先提取图片的底层特征的方法不同的是:基于深度学习的图像 检索可以直接对原图片进行处理,这就消除了不同的底层特征对检索结果所带 来的影响。 关键词:深度学习;基于内容的图像检索;人工神经网络;多隐层
RESEARCH ON眦GE RETRIEVAL BASED ON DEEP LEARNING ABSTRACT Deep Learning is a recently proposed neural networks with multiple hidden layers.Its essence is through building a machine learning model with multiple hidden layers and a lot of training data to leam more useful features.Thus,enhance the accuracy of prediction or classification.Different with the traditional shallow learning is that Deep Learning emphasizes the depth model(hidden layer is usually not less than two layers),highlighting the importance of feature learning,using large data to learn features,describing the internal information ofdata. The basic idea of content-based image retrieval is analyzing the content of the image itself, such as color,texture,shape etc.,then find similar images from image database.This paper briefly descdbed the content-based image retrieval and text-based image retrieval,then analyzing the pros and cons of both.An overview of research background of CBIR(Content-based Image Retrieval) and development situation at home and abroad.After introducing key technologies of content-based image retrieval and knowledges of Deep Learning,this paper designed a image retrieval system based on Deep Learning.The traditional image retrieval system needs to extract features from picture,then retrieve similar pictures based on the features.Different from this is that image retrieval system based on deep neural network retrieve similar images based on the content of the whole image no need to extract features.This can reduces the influence from different features. Different from shallow learning is that the initialization ofnetwork through unsupervised training of a set oftest(not random),SO the initial data is close to optimal. KEYWORDS:Deep Learning;CBIR;Content-based image retrieval;artificial neural network
目录 摘要…………………………………………………………………………………………………………………………………..I ABSTRACT…………………………………………………………………………………………….II 目录……………………………………………………………………………………………………………………………….III 图表目录……………………………………………………………………………………………一V 第一章绪论………………………………………………………………………………………..1 1.1前言………………………………………………………………………………………….1 1.2国内外研究热点……………………………………………………………………………3 1.3著名的图像检索系统介绍………………………………………………………………….4 1.4本文研究内容和组织结构…………………………………………………………………5 第二章相关理论基础………………………………………………………………………………..7 2.1基于内容图像检索的相关知识……………………………………………………………7 2.1.1基于内容的图像检索系统结构……………………………………………………..7 2.1.2图像的特征提取……………………………………………………………………..8 2.1.3相似性度量…………………………………………………………………………..9 2.1.4评判标准……………………………………………………………………………一9 2.2人工神经网络基础…………………………………………………………………………11 2.2.1神经网络概念的提出………………………………………………………………1 1 2.2.2神经元模型…………………………………………………………………………1 1 2.2.3神经网络的学习和类别……………………………………………………………13 2.3 BP网络模型……………………………………………………………………………….13 2.3.1 BP网络的基本原理…………………………………………………………………13 2.3.2 BP网络的优劣………………………………………………………………………14 2.4本章小结…………………………………………………………………………………..1 5 第三章深度学习网络模型………………………………………………………………………16 3.1深度学习简介……………………………………………………………………………..16
基王邃度堂盈曲图像捡塞班究 3.2深度学习的基本思想和训练方法………………………………………………………..1 8 3.2.1深度学习的基本思想………………………………………………………………18 3.2.2深度学习的训练过程………………………………………………………………18 3.3深度学习的常用方法……………………………………………………………………..1 8 3.3.1自动编码器…………………………………………………………………………l 8 3.3.2受限玻尔兹曼机……………………………………………………………………19 3.4受限玻尔兹曼机(RBM)………………………………………………………………..19 3.4.1受限玻尔兹曼机模型………………………………………………………………19 3.4。2受限玻尔兹曼机的学习算法………………………………………………………2l 3.4.3受限玻尔兹曼机的评估方法【23】...………………………………………………..23 3.5深度信念神经网络………………………………………………………………………..24 3.6本章小结……………………………………………………………………………………25 第四章基于深度学习的图像检索……………………………………………………………….26 4.1图片样本库的建立………………………………………………………………………..27 4.2 BP神经网络……………………………………………………………………………….27 4.2.1输入设置…………………………………………………………………………….27 4.2.2改进后的BP神经网络…………………………………………………………….28 4.2.3检索结果分析…………………………………………………………………………28 4.3深度信念神经网络………………………………………………………………………..32 4.3.1输入设置……………………………………………………………………………32 4.3.2网络层数的选择……………………………………………………………………..33 4.3.3隐层节点数的设计………………………………………………………………….33 4.3.4构建RBM模型……………………………………………………………………..33 4.3.5 RBM模型的学习算法………………………………………………………………34 4.3.6 Softmax分类器………………………………………………………………………35 4.3.7实验结果与分析……………………………………………………………………36 4.4两种网络模型比较……………………………………………………………………………38 4.5本章小结…………………………………………………………………………………..40 第五章总结与展望……………………………………………………………………………….41 5.1总结……………………………………………………………………………………………………………………..41
内筮直太堂亟±堂位监奎 一一一.—— 5.2展望………………………………………………………………………………………。42 参考文献……………………………………………………………………………………………43 致谢………………………………………………………………………………………………………………………………。45 V
图表目录 表1.1基于文本的图像检索与基于内容的图像检索的比较………………………………………1 图I.1基于文本检索方法的一般流程………………………………………………………………2 图1.2基于内容的图像检索的一般框架…………………………………………………………..3 图2.1 CBIR系统结构【25】...…………………………………………………………………………7 图2.2神经元模型…………………………………………………………………………………12 图2.3三层BP神经网络结构图………………………………………………………………….13 图2.4 BP算法流程图……………………………………………………………………………14 图3.1一张图片可以由一些基本结构组成[211………………………………………………….16 图3.2深度学习的处理过程【2l】-..………………………………………………………………..17 图3.3从不同的对象训练学习到的特征…………………………………………………………17 图3.4一般玻尔兹曼机和受限玻尔兹曼机………………………………………………………20 图3.5多层RBM和对应的深信度网络………………………………………………………….24 图3.6产生具有二层隐层的深度神经网络的过程………………………………………………25 图4.1检索特征的提取……………………………………………………………………………26 表4.1样本数据归一化…………………………………………………………………………….27 图4.2向日葵的阈值与准确率/查全率的相应关系………………………………………………30 图4.3山的阈值与准确率/查全率的相应关系…………………………………………………….30 表4.2 BP网络的检索结果…………………………………………………………………………31 图4.4 BP网络中向日葵的检索结果………………………………………………………………31 图4.5 BP网络中山的检索结果……………………………………………………………………32 图4.6深层网络与浅层网络的区别………………………………………………………………32 图4.7向日葵的阈值与准确率和查全率的相应关系……………………………………………36 图4.8脑结构图的阈值与准确率/查全率的相应关系……………………………………………37 表4.3 DBN网络的检索结果……………………………………………………………………….37 图4.9 RBM重构表现………………………………………………………………………………38 图4.10 BP和DBN检索结果的F值比较…………………………………………………………39
分享到:
收藏