图书介绍

深度学习与计算机视觉 算法原理、框架应用与代码实现【2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载】

深度学习与计算机视觉 算法原理、框架应用与代码实现
  • 叶韵编著 著
  • 出版社: 北京:机械工业出版社
  • ISBN:9787111573678
  • 出版时间:2017
  • 标注页数:327页
  • 文件大小:145MB
  • 文件页数:347页
  • 主题词:计算机视觉-研究

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

深度学习与计算机视觉 算法原理、框架应用与代码实现PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1篇 基础知识2

第1章 引言2

1.1 人工智能的新焦点——深度学习2

1.1.1 人工智能——神话传说到影视漫画2

1.1.2 人工智能的诞生3

1.1.3 神经科学的研究4

1.1.4 人工神经网络的兴起5

1.1.5 神经网络的第一次寒冬6

1.1.6 神经网络的第一次复兴8

1.1.7 神经网络的第二次寒冬9

1.1.8 2006年——深度学习的起点10

1.1.9 生活中的深度学习11

1.1.10 常见深度学习框架简介12

1.2 给计算机一双眼睛——计算机视觉14

1.2.1 计算机视觉简史14

1.2.2 2012年——计算机视觉的新起点16

1.2.3 计算机视觉的应用17

1.2.4 常见计算机视觉工具包19

1.3 基于深度学习的计算机视觉19

1.3.1 从ImageNet竞赛到A1phaGo战胜李世石——计算机视觉超越人类19

1.3.2 GPU和并行技术——深度学习和计算视觉发展的加速器21

1.3.3 基于卷积神经网络的计算机视觉应用22

第2章 深度学习和计算机视觉中的基础数学知识27

2.1 线性变换和非线性变换27

2.1.1 线性变换的定义27

2.1.2 高中教科书中的小例子28

2.1.3 点积和投影28

2.1.4 矩阵乘法的几何意义(1)30

2.1.5 本征向量和本征值34

2.1.6 矩阵乘法的几何意义(2)37

2.1.7 奇异值分解38

2.1.8 线性可分性和维度39

2.1.9 非线性变换42

2.2 概率论及相关基础知识43

2.2.1 条件概率和独立43

2.2.2 期望值、方差和协方差44

2.2.3 熵45

2.2.4 最大似然估计(Maximum Likelihood Estimation,MLE)47

2.2.5 KL散度(Kullback-Leibler divergence)49

2.2.6 KL散度和MLE的联系49

2.3 维度的诅咒50

2.3.1 采样和维度50

2.3.2 高维空间中的体积51

2.3.3 高维空间中的距离53

2.3.4 中心极限定理和高维样本距离分布的近似54

2.3.5 数据实际的维度56

2.3.6 局部泛化58

2.3.7 函数对实际维度的影响59

2.3.8 PCA——什么是主成分60

2.3.9 PCA——通过本征向量和本征值求主成分60

2.3.10 PCA——通过主成分分析降维61

2.3.11 PCA——归一化和相关性系数63

2.3.12 PCA——什么样的数据适合PCA64

2.3.13 其他降维手段65

2.4 卷积66

2.4.1 点积和卷积66

2.4.2 一维卷积67

2.4.3 卷积和互相关68

2.4.4 二维卷积和图像响应69

2.4.5 卷积的计算70

2.5 数学优化基础71

2.5.1 最小值和梯度下降72

2.5.2 冲量(Momentum)73

2.5.3 牛顿法75

2.5.4 学习率和自适应步长77

2.5.5 学习率衰减(Learning Rate Decay)78

2.5.6 AdaGrad:每个变量有自己的节奏78

2.5.7 AdaDelta的进一步改进79

2.5.8 其他自适应算法80

2.5.9 损失函数81

2.5.10 分类问题和负对数似然82

2.5.11 逻辑回归83

2.5.12 Softmax:将输出转换为概率84

2.5.13 链式求导法则84

第3章 神经网络和机器学习基础87

3.1 感知机87

3.1.1 基本概念87

3.1.2 感知机和线性二分类87

3.1.3 激活函数88

3.2 神经网络基础89

3.2.1 从感知机到神经网络89

3.2.2 最简单的神经网络二分类例子90

3.2.3 隐层神经元数量的作用93

3.2.4 更加复杂的样本和更复杂的神经网络94

3.3 后向传播算法95

3.3.1 求神经网络参数的梯度95

3.3.2 计算图(Computational Graph)95

3.3.3 利用后向传播算法计算一个神经网络参数的梯度97

3.3.4 梯度消失99

3.3.5 修正线性单元(ReLU)100

3.3.6 梯度爆炸101

3.3.7 梯度检查(gradient check)102

3.3.8 从信息传播的角度看后向传播算法103

3.4 随机梯度下降和批量梯度下降104

3.4.1 全量数据(full-batch)梯度下降104

3.4.2 随机梯度下降(SGD)和小批量数据(mini-batch)104

3.4.3 数据均衡和数据增加(data augmentation)106

3.5 数据、训练策略和规范化108

3.5.1 欠拟合和过拟合108

3.5.2 训练误差和测试误差109

3.5.3 奥卡姆剃刀没有免费午餐111

3.5.4 数据集划分和提前停止112

3.5.5 病态问题和约束113

3.5.6 L2规范化(L2 Regularization)113

3.5.7 L1规范化(L1 Regulaization)114

3.5.8 集成(Ensemble)和随机失活(Dropout)115

3.6 监督学习、非监督学习、半监督学习和强化学习117

3.6.1 监督学习、非监督学习和半监督学习117

3.6.2 强化学习(reinforcement learning)118

第4章 深度卷积神经网络120

4.1 卷积神经网络120

4.1.1 基本概念120

4.1.2 卷积层和特征响应图121

4.1.3 参数共享123

4.1.4 稀疏连接124

4.1.5 多通道卷积125

4.1.6 激活函数125

4.1.7 池化、不变性和感受野126

4.1.8 分布式表征(Distributed Representation)128

4.1.9 分布式表征和局部泛化130

4.1.10 分层表达131

4.1.11 卷积神经网络结构131

4.2 LeNet——第一个卷积神经网络132

4.3 新起点——AlexNet133

4.3.1 网络结构133

4.3.2 局部响应归一化(Local ResponseNormalization,LRN)136

4.4 更深的网络——GoogLeNet136

4.4.1 1×1卷积和Network In Network136

4.4.2 Inception结构138

4.4.3 网络结构138

4.4.4 批规一化(Batch Normalization,BN)140

4.5 更深的网络——ResNet142

4.5.1 困难的深层网络训练:退化问题142

4.5.2 残差单元142

4.5.3 深度残差网络144

4.5.4 从集成的角度看待ResNet144

4.5.5 结构更复杂的网络146

第2篇 实例精讲148

第5章 Python基础148

5.1 Python简介148

5.1.1 Python简史148

5.1.2 安装和使用Python149

5.2 Python基本语法150

5.2.1 基本数据类型和运算150

5.2.2 容器153

5.2.3 分支和循环156

5.2.4 函数、生成器和类159

5.2.5 map、reduce和filter162

5.2.6 列表生成(list comprehension)163

5.2.7 字符串163

5.2.8 文件操作和pickle164

5.2.9 异常165

5.2.10 多进程(multiprocessing)165

5.2.11 os模块166

5.3 Python的科学计算包——NumPy167

5.3.1 基本类型(array)167

5.3.2 线性代数模块(1inalg)172

5.3.3 随机模块(random)173

5.4 Python的可视化包——matplotlib175

5.4.1 2D图表175

5.4.2 3D图表178

5.4.3 图像显示180

第6章 OpenCV基础182

6.1 OpenCV简介182

6.1.1 OpenCV的结构182

6.1.2 安装和使用OpenCV183

6.2 Python-OpenCV基础184

6.2.1 图像的表示184

6.2.2 基本图像处理185

6.2.3 图像的仿射变换188

6.2.4 基本绘图190

6.2.5 视频功能192

6.3 用OpenCV实现数据增加小工具193

6.3.1 随机裁剪194

6.3.2 随机旋转194

6.3.3 随机颜色和明暗196

6.3.4 多进程调用加速处理196

6.3.5 代码:图片数据增加小工具196

6.4 用OpenCV实现物体标注小工具203

6.4.1 窗口循环203

6.4.2 鼠标和键盘事件205

6.4.3 代码:物体检测标注的小工具206

第7章 Hello World!212

7.1 用MXNet实现一个神经网络212

7.1.1 基础工具、NVIDIA驱动和CUDA安装212

7.1.2 安装MXNet213

7.1.3 MXNet基本使用214

7.1.4 用MXNet实现一个两层神经网络215

7.2 用Caffe实现一个神经网络219

7.2.1 安装Caffe219

7.2.2 Caffe的基本概念220

7.2.3 用Caffe实现一个两层神经网络221

第8章 最简单的图片分类——手写数字识别227

8.1 准备数据——MNIST227

8.1.1 下载MNIST227

8.1.2 生成MNIST的图片227

8.2 基于Caffe的实现228

8.2.1 制作LMDB数据229

8.2.2 训练LeNet-5230

8.2.3 测试和评估235

8.2.4 识别手写数字239

8.2.5 增加平移和旋转扰动240

8.3 基于MXNet的实现242

8.3.1 制作Image Recordio数据242

8.3.2 用Module模块训练LeNet-5243

8.3.3 测试和评估245

8.3.4 识别手写数字247

第9章 利用Caffe做回归249

9.1 回归的原理249

9.1.1 预测值和标签值的欧式距离249

9.1.2 EuclideanLoss层250

9.2 预测随机噪声的频率250

9.2.1 生成样本:随机噪声250

9.2.2 制作多标签HDF5数据252

9.2.3 网络结构和Solver定义253

9.2.4 训练网络259

9.2.5 批量装载图片并利用GPU预测260

9.2.6 卷积核可视化262

第10章 迁移学习和模型微调264

10.1 吃货必备——通过Python采集美食图片264

10.1.1 通过关键词和图片搜索引擎下载图片264

10.1.2 数据预处理——去除无效和不相关图片267

10.1.3 数据预处理——去除重复图片267

10.1.4 生成训练数据269

10.2 美食分类模型271

10.2.1 迁移学习271

10.2.2 模型微调法(Finetune)272

10.2.3 混淆矩阵(Confusion Matrix)276

10.2.4 P-R曲线和ROC曲线278

10.2.5 全局平均池化和激活响应图284

第11章 目标检测288

11.1 目标检测算法简介288

11.1.1 滑窗法288

11.1.2 PASCAL VOC、mAP和IOU简介289

11.1.3 Selective Search和R-CNN简介290

11.1.4 SPP、ROI Pooling和Fast R-CNN简介291

11.1.5 RPN和FasterR-CNN简介293

11.1.6 YOLO和SSD简介294

11.2 基于PASCAL VOC数据集训练SSD模型296

11.2.1 MXNet的SSD实现296

11.2.2 下载PASCALVOC数据集297

11.2.3 训练SSD模型298

11.2.4 测试和评估模型效果299

11.2.5 物体检测结果可视化299

11.2.6 制作自己的标注数据302

第12章 度量学习304

12.1 距离和度量学习304

12.1.1 欧氏距离和马氏距离304

12.1.2 欧式距离和余弦距离305

12.1.3 非线性度量学习和Siamese网络306

12.1.4 Contrastive Loss:对比损失函数307

12.2 用MNIST训练Siamese网络307

12.2.1 数据准备307

12.2.2 参数共享训练309

12.2.3 结果和可视化314

12.2.4 用ι-SNE可视化高维特征316

第13章 图像风格迁移317

13.1 风格迁移算法简介317

13.1.1 通过梯度下降法进行图像重建317

13.1.2 图像风格重建和Gram矩阵318

13.1.3 图像风格迁移320

13.2 MXNet中的图像风格迁移例子320

13.2.1 MXNet的风格迁移实现321

13.2.2 对图片进行风格迁移326

热门推荐