[课程简介]:培训目标 掌握大数据处理平台(Hadoop、Spark、Storm)技术架构、以及平台的安装部署、运维配置、应用开发;掌握主流大数据Hadoop平台和Spark实时处理平台的技术架构和实际应用;利用Hadoop+Spark对行业大数据进行存储管理和分析挖掘的技术应用;讲解Hadoop生态系统组件,包括Storm,HDFS,MapReduce,HIVE,HBase,Spark,GraphX,MLib,Shark, ElasticSearch等大数据存储管理、分布式数据库、大型数据仓库、大数据查询与搜索、大数据分析挖掘与分布式处理技术 ...
【时间地点】 | 2020年1月09-11日 上海 | |
【培训讲师】 | 张老师 | |
【参加对象】 | 业务支撑建设维护室、业务维护室、经营分析室人员;网络部、网管中心、网优中心从事大数据相关工作的人员 | |
【参加费用】 | ¥6800元/人 (含教材、培训费、考证费以及学习用具等费用) 食宿统一安排,费用自理。 | |
【会务组织】 | 森涛培训网(www.stpxw.com).广州三策企业管理咨询有限公司 | |
【咨询电话】 | 020-34071250;020-34071978(提前报名可享受更多优惠) | |
【联 系 人】 | 庞先生,邓小姐;13378458028、18924110388(均可加微信) | |
【在线 QQ 】 | 568499978 | 课纲下载 |
【温馨提示】 | 本课程可引进到企业内部培训,欢迎来电预约! |
课程介绍
1. 需求理解
Hadoop 设计之初的目标就定位于高可靠性、高可拓展性、高容错性和高效性,正是这些设计上与生俱来的优点,才使得Hadoop 一出现就受到众多大公司的青睐,同时也引起了研究界的普遍关注。
对电信运营商而言,用户上网日志包含了大量用户个性化需求、喜好信息,对其进行分析和挖掘,能更好地了解客户需求。传统经营分析系统小型机加关系型数据库的架构无法满足对海量非结构化数据的处理需求,搭建基于X86的Hadoop 平台,引入大数据处理技术的方式,实现高效率、低成本、易扩展的经营分析系统混搭架构成为电信运营商最为倾向的选择。本课程将全面介绍Hadoop平台开发和运维的各项技术,对学员使用该项技术具有很高的应用价值。
2. 培训课程架构与设计思路
(1)培训架构:
本课程分为三个主要部分:
第一部分:重点讲述大数据技术在的应用,使学员对大数据技术的广泛应用有清晰的认识,在这环节当中会重点介绍Hadoop技术在整个大数据技术应用中的重要地位和应用情况。
第二部分:具体对hadoop技术进行模块化分拆,从大数据文件存储系统技术和分布式文件系统平台及其应用谈起,介绍Hadoop技术各主要应用工具和方法,以及在运维维护当中的主流做法,使学员全面了解和掌握Hadoop技术的精华。
第三部分:重点剖析大数据的应用案例,使学员在案例当中对该项技术有更深入的感观印象
(2)设计思路:
本课程采用模块化教学方法,以案例分析为主线,由浅入深、循序渐进、由理论到实践操作进行设计。
(3)与企业的贴合点:
本课程结合企业转型发展及大数据发展战略,围绕企业大数据业务及行业应用市场拓展发展目标,重点讲授Hadoop的应用技术,提升企业IT技术人员的开发和运维能力,有很强的贴合度。
培训目标
掌握大数据处理平台(Hadoop、Spark、Storm)技术架构、以及平台的安装部署、运维配置、应用开发;掌握主流大数据Hadoop平台和Spark实时处理平台的技术架构和实际应用;利用Hadoop+Spark对行业大数据进行存储管理和分析挖掘的技术应用;讲解Hadoop生态系统组件,包括Storm,HDFS,MapReduce,HIVE,HBase,Spark,GraphX,MLib,Shark, ElasticSearch等大数据存储管理、分布式数据库、大型数据仓库、大数据查询与搜索、大数据分析挖掘与分布式处理技术
培训大纲
(1)课程框架
时间 |
培训内容 |
教学方式 | |
第一天 |
上午 |
第一部分:移动互联网、大数据、云计算相关技术介绍 |
理论讲授+案例分析 |
下午 |
第三部分:大数据文件存储系统技术和分布式文件系统平台及其应用 |
理论讲授+案例分析+小组讨论 | |
第二天 |
上午 |
第五部分:Hadoop运维管理与性能调优 |
理论讲授+案例分析+实战演练 |
下午 |
第七部分:类SQL语句工具——Hive |
理论讲授+案例分析+实战演练 | |
第三天 |
上午 |
第九部分:Kafka基础介绍 |
理论讲授+案例分析 |
下午 |
第十一部分:当前数据中心的改造和转换分析-以国内外运营商、互联网公司为例 |
理论讲授+案例分析+小组讨论 |
(2)培训内容介绍
课程模块 |
课程主题 |
主要内容及案例和演示 | |
模块一 |
移动互联网、大数据、云计算相关技术介绍 |
| |
模块二 |
大数据的挑战和发展方向 |
| |
模块三 |
大数据文件存储系统技术和分布式文件系统平台及其应用 |
| |
模块四 |
Hadoop文件系统HDFS最佳实战 |
| |
模块五 |
Hadoop运维管理与性能调优 |
| |
模块六 |
NOSQL数据库Hbase与Redis |
| |
模块七 |
类SQL语句工具——Hive |
| |
模块八 |
数据挖掘SPARK建模基础介绍 |
| |
模块九 |
Kafka基础介绍 |
| |
模块十 |
大数据典型应用与开发案例分析:互联网数据运营 |
| |
模块十一 |
当前数据中心的改造和转换分析-以国内外运营商、互联网公司为例 |
| |
模块十二 |
|
课程总结与问题答疑 |
师资介绍
张老师:阿里大数据高级专家,国内资深的Spark、Hadoop技术专家、虚拟化专家,对HDFS、MapReduce、HBase、Hive、Mahout、Storm、spark和openTSDB等Hadoop生态系统中的技术进行了多年的深入的研究,更主要的是这些技术在大量的实际项目中得到广泛的应用,因此在Hadoop开发和运维方面积累了丰富的项目实施经验。近年主要典型的项目有:某电信集团网络优化、中国移动某省移动公司请账单系统和某省移动详单实时查询系统、中国银联大数据数据票据详单平台、某大型银行大数据记录系统、某大型通信运营商全国用户上网记录、某省交通部门违章系统、某区域医疗大数据应用项目、互联网公共数据大云(DAAS)和构建游戏云(Web Game Daas)平台项目等。