社会媒体挖掘
作者:作 者: (美)扎法拉尼(Reza Zafarani)(美)阿巴西(Mohammad Ali Abbasi)(美)刘(Huan Liu)
著;刘挺,秦兵,赵妍妍译
出版时间:2015年版
内容简介
本书集成了近年来社会媒体、社会网络分析以及数据挖掘的前沿成果,为学生、从业者、研究人员和项目经理提供了一个方便的平台,以便理解社会媒体挖掘的基础知识和潜能。本书介绍了社会媒体数据的问题,并阐述了网络分析和数据挖掘的基本概念、新问题以及有效的算法。目录
第1 章 引言 1
1.1 什么是社会媒体挖掘 1
1.2 挖掘领域的新挑战 2
1.3 本书概览和读者指南 3
1.4 小结 5
1.5 参考文献及注释 5
1.6 习题 6
**部分 基础知识
第2 章 图的基本要素 10
2.1 图的基础知识 11
2.1.1 结点 11
2.1.2 边 11
2.1.3 度和度的分布 12
2.2 图的表示 14
2.2.1 邻接矩阵 14
2.2.2 邻接表 15
2.2.3 边列表 15
2.3 图的类型 16
2.4 图的连通性 17
2.5 特殊图 21
2.5.1 树和森林 21
2.5.2 特殊子图 21
2.5.3 完全图 23
2.5.4 平面图 23
2.5.5 二分图 23
2.5.6 正则图 24
2.5.7 桥 25
2.6 图算法 25
2.6.1 图/树的遍历 25
2.6.2 *短路径算法 27
2.6.3 *小生成树 29
2.6.4 网络流算法 31
2.6.5 二分图**匹配 34
2.6.6 桥检测 35
2.7 小结 36
2.8 参考文献及注释 37
2.9 习题 37
第3 章 网络度量 40
3.1 中心性 40
3.1.1 度中心性 40
3.1.2 特征向量中心性 42
3.1.3 Katz 中心性 44
3.1.4 PageRank 46
3.1.5 中间中心性 47
3.1.6 接近中心性 48
3.1.7 群体中心性 50
3.2 传递性与相互性 51
3.2.1 传递性 51
3.2.2 相互性 53
3.3 平衡和地位 55
3.4 相似度 57
3.4.1 结构等价性 57
3.4.2 规则等价性 59
3.5 小结 61
3.6 参考文献及注释 61
3.7 习题 62
第4 章 网络模型 64
4.1 真实世界网络的属性 64
4.1.1 度分布 65
4.1.2 聚类系数 66
4.1.3 平均路径长度 67
4.2 随机图模型 67
4.2.1 随机图的演变 69
4.2.2 随机图的属性 71
4.2.3 基于随机图的真实世界网络
建模 73
4.3 小世界模型 73
4.3.1 小世界模型的属性 75
4.3.2 基于小世界模型对真实世界
网络建模 77
4.4 优先链接模型 77
4.4.1 优先链接模型的属性 78
4.4.2 基于优先链接模型对真实世界
网络进行建模 80
4.5 小结 80
4.6 参考文献及注释 81
4.7 习题 81
第5 章 数据挖掘的基本要素 83
5.1 数据 84
5.2 数据预处理 87
5.3 数据挖掘算法 89
5.4 监督学习 89
5.4.1 决策树 90
5.4.2 朴素贝叶斯分类器 92
5.4.3 *近邻分类器 93
5.4.4 利用社交信息辅助分类 94
5.4.5 回归 96
5.4.6 监督学习评估 99
5.5 无监督学习 99
5.5.1 聚类算法 100
5.5.2 无监督学习的评估 102
5.6 小结 104
5.7 参考文献及注释 105
5.8 习题 106
第二部分 社区和交互
第6 章 社区分析 110
6.1 社区发现 112
6.1.1 社区发现算法 113
6.1.2 基于成员的社区发现 114
6.1.3 基于群组的社区发现 119
6.2 社区演变 126
6.2.1 网络是如何演变的 126
6.2.2 演变网络中的社区发现 129
6.3 社区评价 131
6.3.1 存在真实答案时的评价 131
6.3.2 无真实答案的评价 134
6.4 小结 135
6.5 参考文献及注释 136
6.6 习题 137
第7 章 社会媒体中的信息传播 139
7.1 羊群效应 140
7.1.1 羊群效应的贝叶斯建模 142
7.1.2 干预 144
7.2 信息级联 145
7.2.1 独立级联模型 145
7.2.2 级联范围**化 147
7.2.3 干预 149
7.3 社交网络中的创新扩散 149
7.3.1 创新的特征 150
7.3.2 创新扩散模型 150
7.3.3 创新扩散过程建模 152
7.3.4 干预 155
7.4 流行病模型 155
7.4.1 定义 156
7.4.2 SI 模型 156
7.4.3 SIR 模型 158
7.4.4 SIS 模型 159
7.4.5 SIRS 模型 160
7.4.6 干预 161
7.5 小结 161
7.6 参考文献及注释 162
7.7 习题 163
第三部分 应用
第8 章 影响力和同质性 166
8.1 度量同配性 167
8.1.1 度量符号属性的同配性 167
8.1.2 度量序数属性的同配性 170
8.2 影响力 172
8.2.1 度量影响力 172
8.2.2 影响力建模 175
8.3 同质性 179
8.3.1 度量同质性 179
8.3.2 同质性建模 179
8.4 区分影响力和同质性 180
8.4.1 洗牌测试 180
8.4.2 边缘反转测试 181
8.4.3 随机化测试 181
8.5 小结 184
8.6 参考文献及注释 184
8.7 习题 185
第9 章 社会媒体中的推荐 187
9.1 挑战 188
9.2 经典的推荐算法 188
9.2.1 基于内容的算法 189
9.2.2 协同过滤 189
9.2.3 将个人推荐推广到群体推荐 195
9.3 基于社会背景知识的推荐系统 197
9.3.1 单独使用社会背景知识 198
9.3.2 基于社会背景知识的经典算法
扩展 198
9.3.3 社会背景知识受限的推荐 200
9.4 推荐系统评价 202
9.4.1 评估预测的准确率 202
9.4.2 评估推荐的相关性 203
9.4.3 评估推荐的排序 204
9.5 小结 205
9.6 参考文献及注释 206
9.7 习题 207
第10 章 行为分析 208
10.1 个体行为 208
10.1.1 个体行为分析 209
10.1.2 个体行为建模 213
10.1.3 个体行为预测 214
10.2 群体行为 217
10.2.1 群体行为分析 217
10.2.2 群体行为建模 221
10.2.3 群体行为预测221
10.3 小结 222
10.4 参考文献及注释 223
10.5 习题 224
参考文献 225