Python数据整理
作者:(美)提尔塔吉奥蒂 萨卡〈Tirthajyoti Sarkar),(印)舒布哈迪普 罗伊乔杜里(Shubhadeep Roychowdhury) 著 马羚等译
出版时间:2020年版
内容简介
《Python数据整理》是一本实用的Python数据整理入门教程。书中全面、系统地阐释数据整理和提炼过程背后的所有核心思想,通过大量的练习和实例,帮助你全方位理解并掌握相关概念、工具和技术。《Python数据整理》内容共分为9章,第1章详细介绍数据整理的重要性及工作重点,并介绍Python的基本数据结构及其实现;第2章是《Python数据整理》的基础,阐述Python中的高级数据结构和操作系统的文件操作功能;第3章着重描述Python中NumPy、pandas和Matplotlib三个基本库的基础知识;第4章深入分析pandasDataFrames的相关知识;第5章介绍应用于现实生活的网页抓取的数据整理技术;第6章提出现实生活中发生的数据问题,并学习如何解决这些问题;第7章学习如何从网页、XML文件和API中收集数据;第8章解释数据库的概念,包括数据库的创建、操作和控制,以及如何将表格转换为pandasDataFrame;第9章将前面所学的知识应用到实际数据集中,并对其不同方面进行研究。为了使数据有用且有意义,必须对其进行整理和提炼。《Python数据整理》将向你揭示这些过程背后的核心思想,并让你掌握该领域中流行的工具和技术的相关知识。《Python数据整理》以Python为基础,重点关注数据结构,然后深入到数据整理的基本工具,如Numpy和pandas库。你将深入了解为什么应该远离基于其他语言实现的传统数据清理方式,而利用Python中特定的预建例程。Python提示和技巧的组合将演示如何使用相同的Python后端从各种数据源(包括互联网、大型数据库和Excel财务表)提取和转换数据。为了帮你应对更具挑战性的场景,《Python数据整理》将向你介绍如何处理缺失数据或错误数据,并根据下游分析工具要求重新格式化数据。《Python数据整理》将通过现实世界的例子和数据集进一步帮助你掌握相关概念。通过《Python数据整理》的学习,你将有信心对各种不同的数据源进行高效的提取、清理、转换并格式化数据。,通过阅读《Python数据整理》,你将学到:使用与操作复杂和简单的数据结构。在运行时充分利用DataFrame和Numpy数组。使用BeautifuISoup4和htm151ib执行网络抓取。使用正则表达式(RegEX)执行高级字符串搜索和操作。通过pandas处理异常值与执行数据填充。描述性统计和绘图技术的使用。基于数据生成技术的数据整理和建模。
目录
译者序
前言
第1章 Python数据整理入门
1.1 引言
1.2 Python数据整理
1.3 列表、集合、字典、元组和字符串
1.3.1 列表
练习1:访问列表成员
练习2:生成列表
练习3:遍历列表并检查成员
练习4:列表排序
练习5:生成随机列表
活动1:处理列表
1.3.2 集合
1.3.3 字典
练习6:访问和设置字典中的值
练习7:遍历字典
练习8:再次讨论唯一值列表问题
练习9:删除字典中的值
练习10:字典推导式
1.3.4 元组
练习11:处理元组
1.3.5 字符串
练习12:访问字符串
练习13:字符串切片
练习14:字符串拆分与合并
活动2:分析多行字符串并生成唯一单词数量
1.4 小结
第2章 高级数据结构和文件处理
2.1 引言
2.2 高级数据结构
2.2.1 迭代器
练习15:迭代器介绍
2.2.2 栈
练习16:在Python中实现栈
练习17:使用用户定义的方法实现栈
2.2.3 Lambda表达式
练习18:用Lambda表达式证明三角恒等式
练习19:用于排序的Lambda表达式
练习20:多元素成员检查
2.2.4 队列
练习21:在Python中实现队列
活动3:Permutations、迭代器、Lambda、列表
2.3 Python基本文件操作
练习22:写入和读取环境变量
练习23:打开和关闭文件
练习24:逐行读取文件
练习25:写入文件
活动4:设计专属CSV解析器
2.4 小结
第3章 NumPy、pandas和Matplotlib简介
3.1 引言
3.2 NumPy数组操作
练习26:从列表中创建NumPy数组
练习27:两个NumPy数组相加
练习28:NumPy数组的数学运算
练习29:NumPy数组的高级数学运算
练习30:使用arange和linspace生成数组
练习31:创建多维数组
练习32:二维数组的维度、形状、大小和数据类型
练习33:全零、全一、随机、单位矩阵和向量
……
第4章 深入学习Python数据整理
第5章 适应不同类型的数据源
第6章 学习数据整理的隐藏秘密
第7章 高级网络抓取和数据收集
第8章 关系数据库管理系统和结构化查询语言
第9章 数据整理在现实生活中的应用
附录 活动实施步骤