作者: 张俊红
出版社: 电子工业出版社
出品方: 博文视点
出版年: 2019-2
下载地址(回复可见):
内容简介
集Python、Excel、数据分析为一体是本书的一大特色。
《对比Excel,轻松学习Python数据分析》围绕整个数据分析的常规流程:熟悉工具—明确目的—获取数据—熟悉数据—处理数据—分析数据—得出结论—验证结论—展示结论进行Excel和Python的对比实现,告诉你每一个过程中都会用到什么,过程与过程之间有什么联系。本书既可以作为系统学习数据分析操作流程的说明书,也可以作为一本数据分析师案头必备的实操工具书。
本书通过对比Excel功能操作去学习Python的代码实现,而不是直接学习Python代码,大大降低了学习门槛,消除了读者对代码的恐惧心理。适合刚入行的数据分析师,也适合对Excel比较熟练的数据分析师,以及从事其他岗位想提高工作效率的职场人。
目录
入门篇
第1章数据分析基础
1.1数据分析是什么
1.2为什么要做数据分析
1.2.1现状分析
1.2.2原因分析
1.2.3预测分析
1.3数据分析究竟在分析什么
1.3.1总体概览指标
1.3.2对比性指标
1.3.3集中趋势指标
1.3.4离散程度指标
1.3.5相关性指标
1.3.6相关关系与因果关系
1.4数据分析的常规流程
1.4.1熟悉工具
1.4.2明确目的
1.4.3获取数据
1.4.4熟悉数据
1.4.5处理数据
1.4.6分析数据
1.4.7得出结论
1.4.8验证结论
1.4.9展示结论
1.5数据分析工具:Excel与Python
实践篇
第2章熟悉锅——Python基础知识
2.1Python是什么
2.2Python的下载与安装
2.2.1安装教程
2.2.2IDE与IDLE
2.3介绍JupyterNotebook
2.3.1新建JupyterNotebook文件
2.3.2运行你的第一段代码
2.3.3重命名JupyterNotebook文件
2.3.4保存JupyterNotebook文件
2.3.5导入本地JupyterNotebook文件
2.3.6JupyterNotebook与Markdown
2.3.7为JupyterNotebook添加目录
2.4基本概念
2.4.1数
2.4.2变量
2.4.3标识符
2.4.4数据类型
2.4.5输出与输出格式设置
2.4.6缩进与注释
2.5字符串
2.5.1字符串的概念
2.5.2字符串的连接
2.5.3字符串的复制
2.5.4获取字符串的长度
2.5.5字符串查找
2.5.6字符串索引
2.5.7字符串分隔
2.5.8移除字符
2.6数据结构——列表
2.6.1列表的概念
2.6.2新建一个列表
2.6.3列表的复制
2.6.4列表的合并
2.6.5向列表中插入新元素
2.6.6获取列表中值出现的次数
2.6.7获取列表中值出现的位置
2.6.8获取列表中指定位置的值
2.6.9删除列表中的值
2.6.10对列表中的值进行排序
2.7数据结构——字典
2.7.1字典的概念
2.7.2新建一个字典
2.7.3字典的keys()、values()和items()方法
2.8数据结构——元组
2.8.1元组的概念
2.8.2新建一个元组
2.8.3获取元组的长度
2.8.4获取元组内的元素
2.8.5元组与列表相互转换
2.8.6zip()函数
2.9运算符
2.9.1算术运算符
2.9.2比较运算符
2.9.3逻辑运算符
2.10循环语句
2.10.1for循环
2.10.2while循环
2.11条件语句
2.11.1if语句
2.11.2else语句
2.11.3elif语句
2.12函数
2.12.1普通函数
2.12.2匿名函数
2.13高级特性
2.13.1列表生成式
2.13.2map函数
2.14模块
第3章Pandas数据结构
3.1Series数据结构
3.1.1Series是什么
3.1.2创建一个Series
3.1.3利用index方法获取Series的索引
3.1.4利用values方法获取Series的值
3.2DataFrame表格型数据结构
3.2.1DataFrame是什么
3.2.2创建一个DataFrame
3.2.3获取DataFrame的行、列索引
3.2.4获取DataFrame的值
第4章准备食材——获取数据源
4.1导入外部数据
4.1.1导入.xlsx文件
4.1.2导入.csv文件
4.1.3导入.txt文件
4.1.4导入sql文件
4.2新建数据
4.3熟悉数据
4.3.1利用head预览前几行
4.3.2利用shape获取数据表的大小
4.3.3利用info获取数据类型
4.3.4利用describe获取数值分布情况
第5章淘米洗菜——数据预处理
5.1缺失值处理
5.1.1缺失值查看
5.1.2缺失值删除
5.1.3缺失值填充
5.2重复值处理
5.3异常值的检测与处理
5.3.1异常值检测
5.3.2异常值处理
5.4数据类型转换
5.4.1数据类型
5.4.2类型转换
5.5索引设置
5.5.1为无索引表添加索引
5.5.2重新设置索引
5.5.3重命名索引
5.5.4重置索引
第6章菜品挑选——数据选择
6.1列选择
6.1.1选择某一列/某几列
6.1.2选择连续的某几列
6.2行选择
6.2.1选择某一行/某几行
6.2.2选择连续的某几行
6.2.3选择满足条件的行
6.3行列同时选择
6.3.1普通索引+普通索引选择指定的行和列
6.3.2位置索引+位置索引选择指定的行和列
6.3.3布尔索引+普通索引选择指定的行和列
6.3.4切片索引+切片索引选择指定的行和列
6.3.5切片索引+普通索引选择指定的行和列
第7章切配菜品——数值操作
7.1数值替换
7.1.1一对一替换
7.1.2多对一替换
7.1.3多对多替换
7.2数值排序
7.2.1按照一列数值进行排序
7.2.2按照有缺失值的列进行排序
7.2.3按照多列数值进行排序
7.3数值排名
7.4数值删除
7.4.1删除列
7.4.2删除行
7.4.3删除特定行
7.5数值计数
7.6唯一值获取
7.7数值查找
7.8区间切分
7.9插入新的行或列
7.10行列互换
7.11索引重塑
7.12长宽表转换
7.12.1宽表转换为长表
7.12.2长表转换为宽表
7.13apply()与applymap()函数
第8章开始烹调——数据运算
8.1算术运算
8.2比较运算
8.3汇总运算
8.3.1count非空值计数
8.3.2sum求和
8.3.3mean求均值
8.3.4max求最大值
8.3.5min求最小值
8.3.6median求中位数
8.3.7mode求众数
8.3.8var求方差
8.3.9std求标准差
8.3.10quantile求分位数
8.4相关性运算
第9章炒菜计时器——时间序列
9.1获取当前时刻的时间
9.1.1返回当前时刻的日期和时间
9.1.2分别返回当前时刻的年、月、日
9.1.3返回当前时刻的周数
9.2指定日期和时间的格式
9.3字符串和时间格式相互转换
9.3.1将时间格式转换为字符串格式
9.3.2将字符串格式转换为时间格式
9.4时间索引
9.5时间运算
9.5.1两个时间之差
9.5.2时间偏移
第10章菜品分类——数据分组/数据透视表
10.1数据分组
10.1.1分组键是列名
10.1.2分组键是Series
10.1.3神奇的aggregate方法
10.1.4对分组后的结果重置索引
10.2数据透视表
第11章水果拼盘——多表拼接
11.1表的横向拼接
11.1.1连接表的类型
11.1.2连接键的类型
11.1.3连接方式
11.1.4重复列名处理
11.2表的纵向拼接
11.2.1普通合并
11.2.2索引设置
11.2.3重叠数据合并
第12章盛菜装盘——结果导出
12.1导出为.xlsx文件
12.1.1设置文件导出路径
12.1.2设置Sheet名称
12.1.3设置索引
12.1.4设置要导出的列
12.1.5设置编码格式
12.1.6缺失值处理
12.1.7无穷值处理
12.2导出为.csv文件
12.2.1设置文件导出路径
12.2.2设置索引
12.2.3设置要导出的列
12.2.4设置分隔符号
12.2.5缺失值处理
12.2.6设置编码格式
12.3将文件导出到多个Sheet
第13章菜品摆放——数据可视化
13.1数据可视化是什么
13.2数据可视化的基本流程
13.2.1整理数据
13.2.2明确目的
13.2.3寻找合适的表现形式
13.3图表的基本组成元素
13.4Excel与Python可视化
13.5建立画布和坐标系
13.5.1建立画布
13.5.2用add_subplot函数建立坐标系
13.5.3用plt.subplot2grid函数建立坐标系
13.5.4用plt.subplot函数建立坐标系
13.5.5用plt.subplots函数建立坐标系
13.5.6几种创建坐标系方法的区别
13.6设置坐标轴
13.6.1设置坐标轴的标题
13.6.2设置坐标轴的刻度
13.6.3设置坐标轴的范围
13.6.4坐标轴的轴显示设置
13.7其他图表格式的设置
13.7.1网格线设置
13.7.2设置图例
13.7.3图表标题设置
13.7.4设置数据标签
13.7.5图表注释
13.7.6数据表
13.8绘制常用图表
13.8.1绘制折线图
13.8.2绘制柱形图
13.8.3绘制条形图
13.8.4绘制散点图
13.8.5绘制气泡图
13.8.6绘制面积图
13.8.7绘制树地图
13.8.8绘制雷达图
13.8.9绘制箱形图
13.8.10绘制饼图
13.8.11绘制圆环图
13.8.12绘制热力图
13.8.13绘制水平线和垂直线
13.9绘制组合图表
13.9.1折线图+折线图
13.9.2折线图+柱形图
13.10绘制双坐标轴图表
13.10.1绘制双y轴图表
13.10.2绘制双x轴图表
13.11绘图样式设置
进阶篇
第14章典型数据分析案例
14.1利用Python实现报表自动化
14.1.1为什么要进行报表自动化
14.1.2什么样的报表适合自动化
14.1.3如何实现报表自动化
14.2自动发送电子邮件
14.3假如你是某连锁超市的数据分析师
14.3.1哪些类别的商品比较畅销
14.3.2哪些商品比较畅销
14.3.3不同门店的销售额占比
14.3.4哪些时间段是超市的客流高峰期
14.4假如你是某银行的数据分析师
14.4.1是不是收入越高的人坏账率越低
14.4.2年龄和坏账率有什么关系
14.4.3家庭人口数量和坏账率有什么关系
第15章NumPy数组
15.1NumPy简介
15.2NumPy数组的生成
15.2.1生成一般数组
15.2.2生成特殊类型数组
15.2.3生成随机数组
15.3NumPy数组的基本属性
15.4NumPy数组的数据选取
15.4.1一维数据选取
15.4.2多维数据选取
15.5NumPy数组的数据预处理
15.5.1NumPy数组的类型转换
15.5.2NumPy数组的缺失值处理
15.5.3NumPy数组的重复值处理
15.6NumPy数组重塑
15.6.1一维数组重塑
15.6.2多维数组重塑
15.6.3数组转置
15.7NumPy数组合并
15.7.1横向合并
15.7.2纵向合并
15.8常用数据分析函数
15.8.1元素级函数
15.8.2描述统计函数
15.8.3条件函数
15.8.4集合关系
下载地址(回复可见):
感谢楼主分享~
好东西谢谢~~
感谢分享~
好东西谢谢
谢谢,好东西
谢谢,好东西
好东西呀
感谢分享
想看
感谢大佬!
感谢
非常棒啊!
感谢
感谢
kk
人人时代:无组织的组织力量
想看
学习学习,感谢!
看看
回复
看看怎么样