自制AI图像搜索引擎
作者:明恒毅
出版时间:2019年版
内容简介
图像搜索引擎有两种实现方式—基于图像上下文文本特征的方式和基于图像视觉内容特征的方式。本书所指的图像搜索引擎是基于内容特征的图像检索,也就是通常所说的“以图搜图”来检索相似图片。本书主要讲解了搜索引擎技术的发展脉络、文本搜索引擎的基本原理和搜索引擎的一般结构,详细讲述了图像搜索引擎各主要组成部分的原理和实现,并构建了一个基于深度学习的Web图像搜索引擎。
目录
第 1章 从文本搜索到图像搜索 1
1.1 文本搜索引擎的发展 1
1.2 文本搜索引擎的结构与实现 2
1.2.1 文本预处理 3
1.2.2 建立索引 5
1.2.3 对索引进行搜索 7
1.3 搜索引擎的一般结构 10
1.4 从文本到图像 10
1.5 现有图像搜索引擎介绍 12
1.5.1 Google图像搜索引擎 12
1.5.2 百度图像搜索引擎 13
1.5.3 TinEye图像搜索引擎 14
1.5.4 淘宝图像搜索引擎 15
1.6 本章小结 16
第 2章 传统图像特征提取 17
2.1 人类怎样获取和理解一幅图像 17
2.2 计算机怎样获取和表示一幅图像 18
2.2.1 采样 18
2.2.2 量化 19
2.2.3 数字图像的存储 19
2.2.4 常用的位图格式 20
2.2.5 色彩空间 20
2.2.6 图像基本操作 21
2.3 图像特征的分类 29
2.4 全局特征 30
2.4.1 颜色特征 30
2.4.2 纹理特征 41
2.4.3 形状特征 67
2.5 局部特征 82
2.5.1 SIFT描述符 82
2.5.2 SURF描述符 86
2.6 本章小结 88
第3章 深度学习图像特征提取 89
3.1 深度学习 89
3.1.1 神经网络的发展 89
3.1.2 深度神经网络的突破 92
3.1.3 主要的深度神经网络模型 95
3.2 深度学习应用框架 97
3.2.1 TensorFlow 97
3.2.2 Torch 98
3.2.3 Caffe 98
3.2.4 Theano 98
3.2.5 Keras 99
3.2.6 DeepLearning4J 99
3.3 卷积神经网络 99
3.3.1 卷积 99
3.3.2 卷积神经网络概述 103
3.3.3 经典卷积神经网络结构 110
3.3.4 使用卷积神经网络提取图像特征 130
3.3.5 使用迁移学习和微调技术进一步提升提取特征的精度 134
3.4 本章小结 141
第4章 图像特征索引与检索 142
4.1 图像特征降维 142
4.1.1 主成分分析算法降维 142
4.1.2 深度自动编码器降维 150
4.2 图像特征标准化 153
4.2.1 离差标准化 153
4.2.2 标准差标准化 153
4.3 图像特征相似度的度量 154
4.3.1 欧氏距离 154
4.3.2 曼哈顿距离 155
4.3.3 海明距离 155
4.3.4 余弦相似度 155
4.3.5 杰卡德相似度 156
4.4 图像特征索引与检索 157
4.4.1 从最近邻(NN)到K最近邻(KNN) 157
4.4.2 索引构建与检索 158
4.5 本章小结 173
第5章 构建一个基于深度学习的Web图像搜索引擎 174
5.1 架构分析与技术路线 174
5.1.1 架构分析 174
5.1.2 技术路线 175
5.2 程序实现 175
5.2.1 开发环境搭建 175
5.2.2 项目实现 176
5.3 优化策略 204
5.4 本章小结 205