图书介绍

数据科学导引【2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载】

数据科学导引
  • 欧高炎,朱占星,董彬,鄂维南 著
  • 出版社: 北京:高等教育出版社
  • ISBN:9787040489118
  • 出版时间:2017
  • 标注页数:396页
  • 文件大小:30MB
  • 文件页数:406页
  • 主题词:数据管理-高等学校-教材

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

数据科学导引PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第一章 绪论11

1.1 数据科学的基本内容11

1.2 对学科发展的影响18

1.3 对科学研究的影响21

1.4 数据科学的课程体系23

1.5 本书内容介绍23

第二章 数据预处理26

2.1 特征编码27

2.2 缺失值处理29

2.3 数据标准化33

2.4 特征离散化37

2.5 离群值检测46

2.6 其他预处理方法50

案例与实战51

第三章 回归模型53

3.1 线性回归53

3.2 线性回归正则化57

3.3 非线性回归63

案例与实战67

第四章 分类模型69

4.1 逻辑回归70

4.2 K近邻74

4.3 决策树79

4.4 朴素贝叶斯91

4.5 支持向量机95

案例与实战104

第五章 集成模型106

5.1 集成方法综述106

5.2 随机森林112

5.3 AdaBoost116

5.4 应用实例:个人信用风险评估124

案例与实战131

第六章 聚类模型133

6.1 K-means聚类134

6.2 层次聚类138

6.3 谱聚类142

6.4 基于密度的聚类144

6.5 小结147

案例与实战148

第七章 关联规则挖掘150

7.1 关联规则概述150

7.2 Apriori算法153

7.3 FP-Growth算法157

案例与实战166

第八章 降维169

8.1 主成分分析169

8.2 线性判别分析172

8.3 多维尺度变换178

8.4 局部线性嵌入183

8.5 其他降维方法188

案例与实战189

第九章 特征选择191

9.1 特征选择的一般过程191

9.2 特征选择常用的方法193

9.3 无监督特征选择197

9.4 小结199

案例与实战199

第十章 EM算法201

10.1 EM算法201

10.2 EM的应用:高斯混合模型204

10.3 小结208

案例与实战208

第十一章 概率图模型211

11.1 概率图模型概述211

11.2 隐马尔可夫模型215

11.3 条件随机场226

11.4 小结232

案例与实战233

第十二章 文本分析235

12.1 文本表示模型236

12.2 主题模型246

12.3 情感分析253

案例与实战262

第十三章 图与网络分析264

13.1 基本概念265

13.2 几何特征270

13.3 链接分析276

13.4 社区发现281

13.5 知识图谱285

案例与实战290

第十四章 深度学习292

14.1 多层感知机294

14.2 深度学习模型的优化302

14.3 卷积神经网络309

14.4 循环神经网络315

14.5 小结322

案例与实战324

第十五章 分布式计算325

15.1 Hadoop:分布式存储与处理326

15.2 常见模型的MapReduce实现332

15.3 Spark:分布式数据分析338

15.4 其他分布式系统344

附录345

A.矩阵运算345

B.概率论基础350

C.优化算法355

D.距离360

E.模型评估364

参考文献378

热门推荐