admin 发表于 2017-10-8 12:02:54

Spark MLlib 机器学习算法与源码解析


官方地址:
http://www.dataguru.cn/myclassnew.php?mod=new_basicforlesson&op=basic&lessonid=775
课程简介:
Spark是一个开源集群运算框架,最初是由加州大学柏克利分校AMPLab所开辟。Spark利用了内存内运算技术,在内存上的运算速度比Hadoop MapReduce的运算速度快上100倍,即即是在磁盘上运转也能快10倍。Spark答应将数据加载至集群内存,并屡次对其停止查询,很是适适用于机械进修算法。
今朝,Spark成为了现在大数据范畴最火的开源软件,Spark也被很多企业特别是互联网企业普遍利用到贸易项目中,在国内包括阿里、百度、腾讯、网易、搜狐等。
本课程首要讲授Spark MLlib,Spark MLlib是一种高效、快速、可扩大的散布式计较框架;实现了常用的机械进修,如:聚类、分类、回归等算法。本课拒绝死板的报告,将循序渐进从Spark的根本常识、矩阵向量的根本常识起头,然后再透彻讲授各个算法的理论、具体展现Spark源码实现,最初均会经过实例停止剖析实战,帮助大师真正从理论到理论周全把握Spark MLlib散布式机械进修。
经过该课程的进修,同学们可以周全把握Spark MLlib机械进修,进而可以在现实工作中停止MLlib的利用开辟和定制开辟。且该课程优异结业生都可获得教员内推机遇,职位:数据挖掘工程师,就职企业:久邦数码、唯品会、腾讯等。把握技术,高薪失业,课程期待你的加入!
课程纲领:
第一课 Spark MLlib根本入门
1、Spark先容
2、Spark MLlib先容
3、课程的根本情况
4、Spark RDD操纵
5、RDD操纵的代码实操
第二课 Spark MLlib矩阵向量
1、Spark MLlib矩阵向量
2、矩阵向量的代码实操
第三课 Spark MLlib线性回归算法
1、线性回归算法
2、源码分析
3、实例
4、实例的代码实操
第四课 Spark MLlib逻辑回归算法
1、逻辑回归算法
2、源码分析
3、实例
4、实例的代码实操
第五课 Spark MLlib贝叶斯分类算法
1、贝叶斯分类算法
2、源码分析
3、实例
4、实例的代码实操
第六课 Spark MLlib决议树算法
1、决议树算法
2、源码分析
3、实例
4、实例的代码实操
第七课 Spark MLlib KMeans聚类算法
1、KMeans聚类算法
2、源码分析
3、实例
4、实例的代码实操
第八课 Spark MLlib FPGrowth关联法则算法
1、FPGrowth关联法则算法
2、源码分析
3、实例
4、实例的代码实操
第九课 Spark MLlib协同过滤保举算法
1、协同过滤保举算法
2、源码分析
3、实例
4、实例的代码实操
第十课 Spark MLlib神经收集算法
1、神经收集算法
2、源码分析
3、实例
4、实例的代码实操
进修根本:
进修者需要有一些Spark/Scala/线性代数根本常识。
课程情况:
Spark1.4.1, Spark 1.5.1
预期收获:
经过该课程的进修,同学们可以周全把握Spark MLlib机械进修,进而可以在现实工作中停止MLlib的利用开辟和定制开辟。该课程优异结业生都可获得教员内推机遇,职位:数据挖掘工程师,就职企业:久邦数码、唯品会、腾讯等。**** Hidden Message *****
页: [1]
查看完整版本: Spark MLlib 机器学习算法与源码解析