Spark系列课程
- 授课地址:在线课程
- 授课学校:课工场
- 关注人数:600
- 课程原价:
- 网上报名价:259元元
- 课程详情
Spark系列课程目录共8节课程,已更新完毕
-
第1节 Spark框架-基础开发 免费试看
-
免费spark standalone 部署适合人群:
具备Linux及Hadoop基础或对Spark开发感兴趣的人群。
课程描述:Spark是目前比较流行的大数据处理框架,以简单、易用、性能卓越著称。丰富的程序接口和库文件也使得Spark成为业内数据快速处理和分布式机器学习的必备工具。
学习目标:
1.了解Spark的组件和应用场景 ;
2.能够部署Spark Standalone模式 ;
3.能够使用Spark进行交互式开发 ;
4.能够发布独立应用程序并使用spark-submit 提交 。
学习建议:
建议先熟悉linux基本操作,了解eclipse基本的使用。
目录1基础开发课程目标07:44Spark基本概念16:43Spark安装版本选择09:35Spark的安装19:20Spark启动26:22Spark交互式开发26:04发布独立应用程序113:27发布独立应用程序218:08 -
-
第2节 RDD基本操作
-
¥49.00rdd 创建 转化适合人群:
能够独立部署spark 并运行scala交互式shell。
课程描述:学习目标:
1.了解RDD的概念 ;
2.掌握如何创建RDD ;
3.掌握RDD的转化操作 ;
4.掌握RDD的行动操作 。
学习建议:
建议先熟悉MapReduce及hadoop基本操作,对学习RDD编程有很大帮助。
目录1RDD基本操作RDD的概念05:48创建RDD11:14RDD的转化操作116:39RDD的转化操作223:36 -
-
第3节 RDD高级操作
-
¥49.00rdd pair rdd 累加器 广播适合人群:
掌握spark基本操作。
课程描述:学习目标:
1.掌握Pair RDD的操作 ;
2.掌握Pair RDD如何与一般RDD结合 ;
3.掌握RDD的输出操作 ;
4.了解RDD的持久化、累加器和广播变量 。
学习建议:
建议熟练掌握RDD一般操作后学习本课程,避免因基本概念混淆导致API使用错误 。
目录1RDD高级操作本课目标02:00PairRDD的操作20:58常用操作实例(1)11:04常用操作实例(2)20:03RDD的输出操作09:22持久化、累加器和广播变量10:45 -
-
第4节 RDD特性与优化
-
rdd 作业执行 图形化工具适合人群:
熟练掌握RDD操作并希望了解内部原理的人群。
课程描述:学习目标:
1.理解RDD的特性 ;
2.理解Spark作业执行过程 ;
3.掌握Spark图形化工具的查看 。
学习建议:
熟悉spark启动过程并能区分转换和行动操作,对理解本课内容非常有帮助。
目录1RDD特性与优化学习目标04:10RDD的特性23:13测试Spark作业执行过程22:06 -
-
第5节 Spark-SQL基本操作
-
¥49.00spark sql dataframel 数据源 udf适合人群:
通过sparksql操作hive和结构化数据的人群。
课程描述:学习目标:
1.掌握DataFrame的操作 ;
2.掌握不同数据源的加载方法 ;
3.了解UDF的定义方法 。
学习建议:
建议大家先熟悉sql99标准,掌握sql的基本使用。
目录1Spark-SQL基本操作学习目标01:45DataFrame的操作23:38测试RDD转换DataFrame的方法117:10RDD转换DataFrame的方法209:48数据源的加载方法19:39 -
-
第6节 Spark Streaming基本操作
-
¥49.00spark streaming 流式框架 流式计算适合人群:
掌握rdd操作及spark sql 相关知识的人群。
课程描述:学习目标:
1.了解Spark Streaming的特点 ;
2.掌握流式处理的基本操作 ;
3.理解状态操作和窗口操作的概念 。
学习建议:
由于流式处理框架的应用场景并不普及,所以大家对流式计算相对更陌生,希望大家首先了解流式计算的基础知识再观看本节课程即可。
目录1spark streaming基本操作Spark Streaming的特点08:34流式处理基本操作106:45流式处理基本操作217:26流式处理基本操作308:17窗口操作的概念07:50第7节 构建大数据日志分析平台 -
¥49.00spark组件 thrift 接口适合人群:
掌握spark操作和hadoop操作的人群。
课程描述:本节课主要结合以前spark的知识,根据日志系统的特性,选择合适的组件,并能够根据生产环境特点,组织基于spark sql 的周期任务完成基本日志系统的构建。
学习目标:
1.掌握不同需求下Spark组件的选择 ;
2.掌握Spark参数调优 ;
3.掌握各组件之间的调用及thrift接口的使用 。
学习建议:
建议熟悉linux命令 hadoop spark常用操作,并希望运用到生产环境的人群学习。
目录1构建大数据日志分析平台项目背景与步骤11:17搭建Hadoop工作环境12:18搭建Spark集群15:16周期统计任务jar包13:03周期统计spark sql08:37 -
-
第8节 Spark MLlib实现玩家付费行为聚类
希望掌握spark mllib库和了解机器学习算法的人群。
本节课主要介绍了机器学习的算法和spark使用mllib处理聚类问题的基本思路。
学习目标:
1.了解Spark作为机器学习工具的优势 ;
2.了解机器学习算法的分类 ;
3.通过K-means算法进行玩家付费行为聚类 。
学习建议:
需要熟悉rdd的基本操作和jar包的打包方法。
讲师介绍
-
尹会生
毕业于北京理工大学,现任西山居高级工程师,奇点大数据知名公账号创始人之一,《白话大数据与机器学习》作者之一,曾担任新浪网研发中心技术经理和某知名机构高级讲师,曾多次在企业中进行机器和内核调优相关课程的培训,目前专注于计算机视觉和机器学习领域。
想要了解更多关于Spark系列课程方面的资讯,可以来79招生网网上报名免费咨询!
更多课程推荐:
课工场开设有:人工智能学院、大数据学院、区块链学院、云计算学院、创意设计学院、互联网软件学院、互联网营销学院、代码学院等。
课工场提供互联网企业岗位相关的课程,面向互联网企业中热门的产品,技术,设计,运维等方向提供岗位路线课程,也擅长制作精美的入门基础课程,精选了大量课件免费提供给在校大学生。课工场的技术岗位课程包括多个专业方向:前端开发工程师课程、HTML5+CSS3开发工程师、JavaScript网页特效、Android开发工程师、JAVA开发工程师、互联网+大数据开发工程师等。
课工场全称北京课工场教育科技有限公司,是由北京大学优秀校办产业北大青鸟集团全资建设的互联网教育平台,创始团队来自中国IT职业教育领军企业北大青鸟研究院。团队在泛IT职业教育领域深耕细作19年,始终秉持北京大学严谨的治学精神,深谙互联网+职业教育的运营之道,与北京大学保持良好的合作关系。北京大学教育学院师资力量派驻课工场,为课工场提供教育理论研究支持。
课工场汇聚了中国和北美数百位来自知名互联网企业的行业大咖,向寻求就业和技术提升的人群提供直播、录播、面授等多模式教学场景,并通过遍布全国的线下服务中心提供成熟学习服务,形成完善的“互联网+教育”解决方案。同时,课工场也为高校、企业、行业提供教育技术赋能,依托Transformer智能教育生态平台,打造智慧校园、企业大学、行业培训的教育场景,提供一站式教育解决方案。
- 暂无评论!
      79招生网为第三方平台,不会向学员收取任何费用;内容素材如有侵权、虚假不实、违法违规信息等请联系我们 020-26225931。
      课程信息由培训机构(或其代理)自行发布(或提供),请用户在自辨课程虚实、有效性、及时性时留意以实际授课为准。