你将获得什么?
- 深入理解 Hadoop 生态系统;
- 7 种大数据技术应用场景解析;
- 工程师必须掌握的大数据算法;
- 高效且完整的大数据学习路径。
课程介绍
随着近些年大数据技术的发展,以 Hadoop、Spark 为代表的大数据开源项目早已迭代成熟,构建起生态化系统。与此对应,不论是开发者还是企业,关注点也已经从技术的演进转向如何更好地应用大数据,去支撑业务和云计算、人工智能的深度融合。在这个智能的时代,不论是否从事大数据开发,掌握大数据的原理和架构也早已成为每个工程师的必备技能。
但是,不论是大数据的技术还是应用,都始终处于动态变化的过程中。对于很多刚开始接触大数据、考虑使用大数据的人来说,这无疑带来了很多困惑。
- 天天听别人讲大数据,自己也看了不少资料,却不得要领,看不到完整的大数据知识轮廓。
- 即使工作和大数据相关,但仍不清楚大数据平台究竟是如何运作的。
- 领导让我搭建一套大数据平台,而我却是一头雾水,不知从何处入手。
如果你也有这样的困惑,不要着急。其实在很大程度上这是大数据知识体系的繁杂造成的,没有专家的明晰指导,多数人都很难真正做到入门,并且通过构建知识体系达到融会贯通。
在这个专栏里,李智慧将结合自己多年大数据开发、应用的经验,帮助你构建一套立体化的知识体系,并从不同视角、不同领域带你找到你在大数据领域的突破口,真正从普通开发者晋升为拥有大数据思维并能解决复杂问题的技术专家。
一套完整的大数据知识体系,将包含 6 个模块。
模块一 Hadoop 大数据原理与架构
为什么讲大数据都要从 Hadoop 开始?大数据的问题和挑战不同以往,它的处理方法与技巧也颇有不同。理解大数据面对的问题以及处理技巧,是构建大数据知识体系的源头。理解大数据,从理解 Hadoop 开始。
模块二 大数据生态体系主要产品原理与架构
大数据领域不只有 Hadoop,还有数据仓库 Hive、NoSQL 系统 HBase、计算引擎 Spark、流计算引擎 Storm、Flink,以及分布式一致性解决方案 ZooKeeper 等,它们构成了一个完整的大数据生态体系,解决各种场景下的不同问题。
模块三 大数据开发实践
本模块以大数据开发者的视角重新审视大数据的各个方面,结合作者在阿里巴巴、Intel 从事大数据开发的实践经历,从“局内人”的视角为你揭秘大数据开发的内里乾坤。
模块四 大数据平台与系统集成
大数据从哪里来?算出来的结果又到哪里去?如何将大数据技术集成到当前系统中去?需不需要自己开发?有没有商业的解决方案?这可能是使用大数据时最迫切需要解决的问题。
模块五 大数据分析与运营
数据分析是大数据应用的一个重要场景,互联网企业运营常用的数据分析指标有哪些?如何呈现?数据分析结果异常了,企业关键绩效指标下滑了,该如何去追踪定位其原因?这些应用场景和问题答案都可以在本模块中找到。
模块六 大数据算法
大数据最激动人心的应用还是大数据机器学习,但大数据机器学习算法是不是真的有那么难?数学不好还能不能学好、用好大数据算法呢?这个模块告诉你,其实大数据算法并不难,原理一样很简单。
课程目录
开篇词 (1讲)
开篇词 | 为什么说每个软件工程师都应该懂大数据技术?
预习模块 (3讲)
预习 01 | 大数据技术发展史:大数据的前世今生
预习 02 | 大数据应用发展史:从搜索引擎到人工智能
预习 03 | 大数据应用领域:数据驱动一切
模块一 Hadoop大数据原理与架构 (7讲)
04 | 移动计算比移动数据更划算
05 | 从RAID看垂直伸缩到水平伸缩的演化
06 | 新技术层出不穷,HDFS依然是存储的王者
07 | 为什么说MapReduce既是编程模型又是计算框架?
08 | MapReduce如何让数据完成一次旅行?
09 | 为什么我们管Yarn叫作资源调度框架?
10 | 模块答疑:我们能从Hadoop学到什么?
模块二 大数据生态体系主要产品原理与架构 (7讲)
11 | Hive是如何让MapReduce实现SQL操作的?
12 | 我们并没有觉得MapReduce速度慢,直到Spark出现
13 | 同样的本质,为何Spark可以更高效?
14 | BigTable的开源实现:HBase
15 | 流式计算的代表:Storm、Flink、Spark Streaming
16 | ZooKeeper是如何保证数据一致性的?
17 | 模块答疑:这么多技术,到底都能用在什么场景里?
模块三 大数据开发实践 (8讲)
18 | 如何自己开发一个大数据SQL引擎?
19 | Spark的性能优化案例分析(上)
20 | Spark的性能优化案例分析(下)
21 | 从阿里内部产品看海量数据处理系统的设计(上):Doris的立项
22 | 从阿里内部产品看海量数据处理系统的设计(下):架构与创新
23 | 大数据基准测试可以带来什么好处?
24 | 从大数据性能测试工具Dew看如何快速开发大数据系统
25 | 模块答疑:我能从大厂的大数据开发实践中学到什么?
模块四 大数据平台与系统集成 (6讲)
26 | 互联网产品 + 大数据产品 = 大数据平台
27 | 大数据从哪里来?
28 | 知名大厂如何搭建大数据平台?
29 | 盘点可供中小企业参考的商业大数据平台
30 | 当大数据遇上物联网
31 | 模块答疑:为什么大数据平台至关重要?
模块五 大数据分析与运营 (5讲)
32 | 互联网运营数据指标与可视化监控
33 | 一个电商网站订单下降的数据分析案例
34 | A/B测试与灰度发布必知必会
35 | 如何利用大数据成为“增长黑客”?
36 | 模块答疑:为什么说数据驱动运营?
模块六 大数据算法 (6讲)
37 | 如何对数据进行分类和预测?
38 | 如何发掘数据之间的关系?
39 | 如何预测用户的喜好?
40 | 机器学习的数学原理是什么?
41 | 从感知机到神经网络算法
42 | 模块答疑:软件工程师如何进入人工智能领域?
智慧写给你的寄语 (1讲)
所有的不确定都是机会——智慧写给你的新年寄语
结束语 (3讲)
结束语 | 未来的你,有无限可能
第2季回归丨大数据之后,让我们回归后端
结课测试 | 这些大数据的知识你都掌握了吗?
讲师介绍
李智慧,极客时间专栏《后端技术面试 38 讲》作者,同程艺龙交通首席架构师、Apache Spark 代码贡献者,长期从事大数据、大型网站架构的研发工作,曾担任阿里巴巴技术专家、Intel 亚太研发中心架构师、宅米和 WiFi 万能钥匙 CTO,有超过 6 年的线下咨询、培训经验,著有畅销书《大型网站技术架构:核心原理与案例分析》。