课程称号: 炼数成金 深入BI - Kettle 篇 视频教程 讲授视频 课程简介: 有人统计过,在全部数据分析进程里,收集、整理数据的工作大致占全数工作量的90%,建模进程不敷10%,可见ETL是数据处置流程中一个很是重要的环节。ETL工程师,在数据仓库类职位中占有很大比例,而且薪水都不差。IT人一会儿转型数据分析师能够腾跃度比力浩劫度高,先转型数据仓库/ETL工程师再择机往更高处走是公道挑选之一。在ETL软件中,利用最多的是开源的Kettle,完全免费,功用和性能不弱于datastage这类贸易ETL软件,利用Kettle和别的开源数据平台软件,例如Mysql集群,Hadoop集群等组合在一路,是性价比极高的架构挑选。本课程系统讲授Kettle及其奥秘。 课程先容: ETL (Extract,Transformation,Load)工具是构建数据仓库、停止数据整合工作所必须利用的工具。今朝市道有多种贸易 ETL 工具,如Informatica,Datastage等。今朝市场上开源且适用的 ETL 工具比力少,Kettle 就是这不多的开源 ETL 工具之一。 本课程将首要讲授开源 ETL 工具 Kettle 的根基利用和二次开辟方式,并连系现实项目案例,讲授 Kettle 若何在现实中利用,以及利用中能够会出现的题目。针对今朝大数据的利用情况,本课程也将连系大数据,报告 Kettle 若何支持 Hadoop、HBase、MongoDB、MapReduce 等大数据技术。除了Kettle 的利用,在本课程的后几个课时,将报告 Kettle 的二次开辟: 包括 Kettle 代码阅读指导, Kettle API 的说明以及利用方式, Kettle 插件的开辟方式。 课程内容: 第一周:ETL 的概念,Kettle 的概念、功用、操纵 第二周:Kettle 资本库、日志、运转方式 第三周:输入步调(表输入、文本文件输入、XML 文件输入...) 第四周:输出步调(表输出、更新、删除、文本文件输出、XML文件输出...) 第五周:转换步调(过滤、字符串处置、拆分字段、计较器...) 第六周:转换步调(字段挑选、排序、增加校验列、去除反复记录...) 第七周:利用步调、流程步调(处置文件、履行法式、发送邮件、空操纵、阻塞步调、中断等...) 第八周:查询步调、毗连步调(数据库查询、流查询、合并记录、记录集毗连、笛卡尔...) 第九周:剧本步调(JAVAscript,Java Class、正则表达式...) 第十周:作业项(拷贝、移动、ftp、sftp…) 第十一周:Kettle 的参数和变量、Kettle 集群 第十二周:Kettle 代码编译、代码结构、利用集成、各类设置文件 第十三周:插件开辟 - 步调、作业项 第十四周:作业设想技能、毛病处置、调试转换、循环和分支 第十五周:大数据插件(Hadoop 文件输入/输出,HBase输入/输出,MapReduce输入/输出,MongoDB输入/输出) 方针人群: 1. ETL 工程师,Java 开辟工程师, 2. 经常要做数据处置的 DBA 3. 有一定数据库根本 和 Java 根本的门生。 课程预期方针: 1. 了解 Kettle 软件的根基功用。 2. 能利用 Kettle 完成根基的数据处置工作。 3. 领会 Kettle 软件的一些高级功用 4. 对有Java 开辟经历的同学,对 Kettle 代码结构有一定领会,能开辟一些 Java 的根基插件。 下载地址: |
欢迎光临 IT视频教程资源网 (http://buyallchip.top/) | Powered by Discuz! X3.2 |