教學(xué)優(yōu)勢
曙海教育的課程培養(yǎng)了大批受企業(yè)歡迎的工程師。大批企業(yè)和曙海
建立了良好的合作關(guān)系。曙海集團的課程在業(yè)內(nèi)有著廣泛的美譽度和響亮的知名度。
秉承二十幾年積累的教學(xué)品質(zhì),本課程以真實項目實戰(zhàn)為導(dǎo)向,授課工程師將會與您分享設(shè)計的全流程及工具的綜合使用技巧、經(jīng)驗。
Big Data on AWS_v2.0培訓(xùn)課程
課程介紹?
Big Data on AWS 課程將向您介紹基于云的大數(shù)據(jù)解決方案,例如 Amazon Elastic MapReduce (EMR)、Amazon Redshift、Amazon Kinesis 和其余 AWS 大數(shù)據(jù)平臺。在 本課程中,我們將向您介紹如何使用 Amazon EMR 來利用諸如 Hive 和 Hue 等廣泛 Hadoop 工具體系處理數(shù)據(jù)。講授內(nèi)容還包括如何創(chuàng)建大數(shù)據(jù)環(huán)境、使用 Amazon DynamoDB、Amazon Redshift 和Amazon Kinesis,利用最佳實踐來設(shè)計大數(shù)據(jù)環(huán)境, 從而實現(xiàn)安全性和經(jīng)濟性。
?學(xué)員基礎(chǔ)?
我們建議參加學(xué)習(xí)本課程的人員符合以下先決條件:
? ? 基本熟悉大數(shù)據(jù)技術(shù),包括 Apache Hadoop、MapReduce、HDFS 和 SQL/NoSQL 查詢
? ? 學(xué)員應(yīng)完成 Big Data Technology Fundamentals 網(wǎng)絡(luò)培訓(xùn)或具備同等經(jīng)驗
? ? 具有核心 AWS 服務(wù)和公有云實施工作經(jīng)驗
? ? 學(xué)員應(yīng)完成 AWS Technical Essentials 課程或具備同等經(jīng)驗
? ? 了解數(shù)據(jù)倉庫、關(guān)系數(shù)據(jù)庫系統(tǒng)和數(shù)據(jù)庫設(shè)計基礎(chǔ)
?
?課程目標(biāo)?
本課程中您將學(xué)習(xí):
? ?適用大數(shù)據(jù)體系內(nèi)的 AWS 解決方案
? ?在 Amazon EMR 環(huán)境中使用 Apache Hadoop
? ?確定 Amazon EMR 集群的組件
? ?啟動并配置 Amazon EMR 集群
? ?利用 Amazon EMR 的常用編程框架,包括 Hive、Pig 和 Streaming
? ?利用 Hue 提高 Amazon EMR 的易用性
? ?在 Amazon EMR 上搭配使用內(nèi)存分析及 Spark 和 Spark SQL
? ?選擇適當(dāng)?shù)?AWS 數(shù)據(jù)存儲選項
? ?確定使用 Amazon Kinesis 以近乎實時的速度處理大數(shù)據(jù)的優(yōu)勢
? ?定義數(shù)據(jù)倉庫和列式數(shù)據(jù)庫的概念
? ?利用 Amazon Redshift 有效地存儲和分析數(shù)據(jù)
? ?了解和管理 Amazon EMR 及 Amazon Redshift 部署的成本和安全性
? ?確定用于獲取、傳輸和壓縮數(shù)據(jù)的選項
? ?使用可視化軟件描述數(shù)據(jù)和查詢
? ?利用 AWS Data Pipeline 編排大數(shù)據(jù)工作流 目標(biāo)人群
?
?課程大綱?
注意:課程大綱可能不盡相同,具體取決于授課的地區(qū)位置和 / 或語言。
本課程將在各天中講解下列概念:
? ?大數(shù)據(jù)概述
? ?獲取、傳輸和壓縮
? ?存儲解決方案
? ?在 DynamoDB 中存儲和查詢數(shù)據(jù)
? ?大數(shù)據(jù)處理和 Amazon Kinesis
? ?Apache Hadoop 及 Amazon EMR 簡介
? ?使用 Amazon Elastic MapReduce
? ?Hadoop 編程框架
? ?在 Amazon EMR 上利用 Hive 處理服務(wù)器日志
? ?在 Amazon EMR 上利用 Hadoop 流處理化學(xué)數(shù)據(jù)
? ?利用 Hue 簡化您的 Amazon EMR 體驗
? ?在 Amazon EMR 上的 Hue 中運行 Pig 腳本
? ?Amazon EMR 上的 Spark
? ?利用 Amazon EMR 上的 Spark 和 Spark SQL 以互動方式創(chuàng)建和查詢表
? ?管理 Amazon EMR 成本
? ?保護您的 Amazon EMR 部署
? ?數(shù)據(jù)倉庫和列式數(shù)據(jù)存儲
? ?Amazon Redshift 和大數(shù)據(jù)
? ?優(yōu)化您的 Amazon Redshift 環(huán)境
? ?大數(shù)據(jù)設(shè)計模式 ? ? 大數(shù)據(jù)的可視化及編制
? ?使用 Tibco Spotfire 可視化大數(shù)據(jù)
?