课程背景
最近几年大热的编程语言非 Python 莫属, 很多职场人借助它来数据分析,高效办公。虽然 Python 学习门槛不高,但知识点零散、枯燥,不仅记忆困难,更是难以学以致用。现实中,很多 Python 学习者,最终都未能有效使用 Python,将它变为职场利器。
所以,到底如何学习 Python 最有效?如何应用 Python 才能高效处理、分析数据,提升工作效率?
你会学到什么?
学习 Python,最快、最有效果的方式就是多多动手。
所以,专栏依据 Python 语言基础、数据集获取、数据加载及处理、数据预测、数据的可视化呈现,这 5 个功能关卡,带你掌握 Python 做数据分析关键流程,在此基础上,融入了 9 大实战项目,以练带学,帮你做到真正会应用。
① 第一模块,Python 语言基础。
这一模块重点讲述后续课程中需要用到的 Python 语言基础,比如理解程序是如何运行的,学习 Python 的常用指令……即使你 0 编程基础,也能迅速上手,为后面的应用知识打好基础。
② 第二模块,获取数据集。
这一模块我会着重介绍用 Python 获取、筛选、保存网页上数据的技巧和方法。学完之后,你就可以构建任意工作领域的数据集。
③ 第三模块,加载、查看与数据处理。
这一模块会将上一步我们构建的数据集加载到 Python 中,查看、修改,以及清洗掉一些冗余的脏数据。这样你在实际工作中,就能从多种类型的数据文件中加载数据、查看数据、清洗数据,使数据标准化。
④ 第四模块,深挖数字背后的逻辑。
这一模块我会介绍如何操作数值列,轻松完成统计分析常用的矩阵计算、回归分析等任务。这样你才能在数据中发现“金子”,助力业务,比如预测未来业务数据的趋势等。
⑤ 第五模块,可视化你的分析思路。
这一模块会将之前的数据通过各种形式的图表呈现出来(散点图、直方图、线图、饼图、图例、注解等),你还可以绘制可交互的图表,让你的方案汇报更加清晰、有亮点。
⑥ 第六模块,综合项目实战篇。
这一部分会通过多个实际、高级、综合的数据分析任务,比如全球新冠肺炎区域确诊病例趋势分析、电影票房预测模型、用户流失预测与分析等。让你融会贯通所学技巧,同时学会数据分析的基本套路与方法。
课程目录
开篇词
开篇词 | 数据赋能未来,Python 势不可挡
课前基础 | 计算机运行一个程序的过程
课前准备 | 搭建一个高效的 Python 开发环境
千里之行,始于足下:Python 语言基础
01 | Python 常用的变量与数据类型
02 | 流程控制:如何控制代码执行的顺序?
03 | 函数:快速实现代码的复用
04 | 类与对象:更好地组织你的代码
05 | 案例实战:日程管理小工具
兵马未动,粮草先行:获取用于数据分析的数据集
06 | 获取数据:公开数据集与 DIY 数据集
07 | 下载网页:如何使用模拟请求下载真实的网页?
08 | 提取数据:如何从网页中提取感兴趣的内容?
09 | 保存数据:如何将爬取的数据保存成 CSV 格式
10 | 实战:手把手教你构建国产电视剧评分数据集
数据处理的银弹:加载、浏览和修改数据
课前准备 | 安装 Pandas 工具包
11 | 文件处理:如何读取多种文件(csv/excel)的数据?
12 | DataFrame:如何以表格的形式查看和操作数据?
13 | 高级索引:过滤与查看表格中的局部数据
14 | 数据清洗:表格数据缺失值与异常值的处理
15 | 时间序列:时间数据的解析与应用
16 | 案例实战:如何用 Python 分析电商用户行为?
深挖数字背后的逻辑:进行统计、预测分析
课前准备 | 安装 NumPy 工具包
17 | 如何快速实现数据的批量计算?
18 | 基础统计:如何统计数据的均值、方差等特征?
19 | 回归分析:如何预测未来数据趋势?
20 | 案例实战:电商用户对商品喜好的预测
可视化你的分析思路:用各类图表展示你的数据
课前准备 | 安装 Matplotlib 和 Seaborn 工具包
21 | 特征与轴:如何将表中的数据特征画成图?
22 | 散点图与线图:如何展示不同特征之间的相关性?
23 | 直方图、条形图和饼图:如何分析数据分布与占比?
24 | 图像的脊柱、注解和图例:如何画出更专业的图表?
25 | Seaborn:实现用户可交互的图标
26 | 案例实战:用图例可视化用户行为分析和喜好预测过程
综合项目实战篇
27 | 初识探索性数据分析(EDA)
28 | EDA 实战:全球新冠肺炎区域确诊病例趋势分析
29 | AI 落地实战:训练通用电影票房预测模型
30 | 综合实战:网络服务用户流失预测与分析
31 | 综合实战:国产电视剧评分预测与分析
结束语
结束语 | Python 未来之路
讲师介绍
千帆
BAT 高级技术专家,前创业公司 CTO
BAT 高级技术专家、前创业公司 CTO,有 8 年 Python 开发经验,是国内使用 Python 实现分布式后端业务系统的先驱者。
创业期间,通过 Python 语言搭建并实现了,包含分布式爬虫、电商大促秒杀、订单物流运营管理、异构数据源多维度可视化报表系统,以及移动端 API Service 等多个子系统的业务后台系统。
目前在一线大厂,致力于使用 Python 实现自动化数据分析与机器学习系统,通过订阅多个异构数据源定期生成数据报告,分析指标走向,以及根据增量数据自动训练场景化的预测模型,提升 CTR。