数据科学导论
作 者: 杨旭,汤海京,丁刚毅 编
出版时间: 2014
丛编项: 普通高等教育"十二五"规划教材
内容简介
数据科学,作为一门正在蓬勃发展的新学科,关注的是如何在大数据时代背景下运用各门与数据相关的技术和理论来服务社会。《数据科学导论/普通高等教育“十二五”规划教材》系统性地讲述了与数据科学相关的各方面知识,着重培养数据工程师所需要的技能与思维。《数据科学导论/普通高等教育“十二五”规划教材》从与数据科学相关的概念出发,通过丰富翔实的案例,从各个方面展示数据科学的运用方式,让读者有一个更为直观的认识,也可以从中感受到运用数据科学处理各个领域问题的方法和流程,并且在其中穿插了数据科学研究方式下新的思维模式的讲解。《数据科学导论/普通高等教育“十二五”规划教材》还从工程概论的流程角度来讲述数据科学的工程体系架构,展望数据科学的未来发展。《数据科学导论/普通高等教育“十二五”规划教材》可作为计算机相关专业的本科生教材,也可供相关专业技术人员阅读参考。
目录
第1章 引论
1.1 序言
1.2 数据
1.2.1 数据的概念
1.2.2 数据的发展史
1.2.3 数据、信息与知识
1.3 大数据
1.3.1 大数据时代的来临
1.3.2 大数据的概念
1.3.3 大数据的特征
1.3.4 大数据对社会所产生的影响
1.3.5 迎接大数据时代的挑战
1.4 数据科学
1.5 本书结构
第2章 数据科学在商业金融领域的应用
2.1 啤酒与尿布
2.1.1 案例详析
2.1.2 大数据挖掘技术
2.1.3 购物篮分析法
2.1.4 对我们的思维模式启示
2.2 比价网站的成功
2.2.1 Farecast案例详析
2.2.2 Decide案例详析
2.2.3 对我们的思维模式启示
2.3 基于大数据的个性化推荐系统
2.3.1 基于亚马逊云的个性化推荐系统
2.3.2 潘多拉(Pandora)——基于基因的推荐系统
2.4.Target的大数据营销
2.4.1 案例详析
2.4.2 给我们的思维模式启示
2.5 社交网络数据之于对冲基金
第3章 数据科学在生物医学领域的应用
3.1 流行病预测
3.1.1 谷歌的流感预测
3.1.2 利用微博来预测流感
3.1.3 给我们的思维模式启示——大数据时代的科学伦理问题
3.2 大数据与智慧医疗
3.2.1 临床操作
3.2.2 付款/定价
3.2.3 研发
3.2.4 新的商业模式
3.2.5 公众健康
3.2.6 给我们的思维模式启示
3.3 疾病监控
3.3.1 大数据服务心脏病患者
3.3.2 “魔毯”病人的监控
3.3.3 大数据监测脑外伤病人恢复
3.4 可穿戴技术、大数据与智慧医疗
3.4.1 什么是可穿戴技术
3.4.2 可穿戴设备简析
3.4.3 可穿戴设备与智慧医疗
3.4.4 给我们的思维模式启示——可穿戴设备的缺陷
第4章 数据科学在智慧城市领域的应用
4.1 概述
4.1.1 什么是智慧城市
4.1.2 产生背景
4.1.3 IT企业相继介入智慧城市领域
4.1.4 国际实践
4.2 韩国的松岛新城
4.3 美国的智慧城市建设
4.3.1 哥伦布市
4.3.2 其他智慧城市建设的举措
4.4 英国的智慧城市建设
4.5 日本的智慧城市建设
4.6 北欧智慧城市——爱沙尼亚
4.7 荷兰阿姆斯特丹的智慧城市计划
4.8 巴西里约热内卢的智慧城市建设
4.9 智慧城市建设中所应用的数据科学技术
4.9.1 数据信息的收集:利用传感网络收集数据信息
4.9.2 数据信息的整合:不同数据信息的整合和统一管理
4.9.3 数据信息分析与应用:大容量、实时性分析技术
第5章 数据科学在影视娱乐领域的应用
5.1 大数据捧红《纸牌屋》
5.1.1 案例详析
5.1.2 大数据如何捧红《纸牌屋》
5.1.3 给我们的思维模式启示
5.2 谷歌预测电影票房
5.2.1 案例详析
5.2.2 谷歌的预测机理
5.2.3 给我们的思维模式启示
5.3 利用数据预测奥斯卡奖项
第6章 数据科学在其他领域的应用实例
6.1 大数据帮助奥巴马赢得大选
6.1.1 案例详析
6.1.2 给我们的思维模式启示
6.2 棱镜门
6.2.1 案例详析
6.2.2 “棱镜”计划
6.2.3 加拿大的“棱镜门”
6.2.4 给我们的思维模式启示
6.3 大数据帮助寻根问祖
6.3.1 案例分析
6.3.2 运作机理
6.4 大数据与社会治安
第7章 数据科学工程概论
7.1 科学研究的第四范式——数据密集型研究方法
7.1.1 范式和范式的演变
7.1.2 科学研究的第四范式
7.2 数据密集型科学研究兴起的社会环境
7.2.1 数据洪流的到来
7.2.2 科学界对海量数据的关注
7.2.3 关联数据运动
7.2.4 政府数据开放运动
7.3 对数据密集型科学研究范式的分析
7.3.1 科学数据和科学研究的问题
7.3.2 相应的解决方案
7.4 数据的收集
7.4.1 客观世界(Matter)中的数据
7.4.2 主观世界(Mind)中的数据
7.4.3 细谈数据
7.5 数据的存储
7.6 数据的管理
7.6.1 NoSQL数据库简介
7.6.2 NoSQL数据库的特点
7.6.3 开源的NoSQL数据库软件
7.7 数据的处理
7.7.1 Hadoop的起源
7.7.2 优点
7.7.3 架构
7.7.4 MapReduce流程
7.8 数据的可视化
7.8.1 Excel
7.8.2 Raphael
7.8.3 Visual.ly
7.8.4 Crossfiltet
7.8.5 PolyMaps
7.8.6 Kartograph
7.8.7 Processing
7.8.8 R
7.8.9 Weka
7.8.10 Gephi
第8章 数据科学的未来展望
8.1 从业前景广阔
8.2 对未来数据科学发展的探讨
8.2.1 提防进入数据误区
8.2.2 数据不是万能的