階段:javase+mysql+jdbc
1.1 開班典禮
1.1.1 班主任講話
1.1.2 負(fù)責(zé)人講話
1.1.3 講師講話
1.1.4 摸底考試
...
1.3 - 流程控制
1.3.1 分支流程控制-if
1.3.2 分支流程控制-switch
1.3.3 循環(huán)流程控制-while
...
1.5 - 數(shù)組
1.5.1 數(shù)組的定義與元素訪問
1.5.2 數(shù)組的內(nèi)存分析
1.5.3 數(shù)組的常見操作
...
1.7 - 面向?qū)ο筮M(jìn)階
1.7.1 包(package)的創(chuàng)建與使用
1.7.2 構(gòu)造方法
1.7.3 代碼塊
...
1.9 - 多態(tài)
1.9.1 對(duì)象的轉(zhuǎn)型
1.9.2 instanceof關(guān)鍵字
1.9.3 抽象類與抽象方法
...
1.11 - 包裝類型與常用類
1.11.1 包裝類型
1.11.2 常用類
1.11.3 枚舉
...
1.13 – 字符串
1.13.1 String類常用方法
1.13.2 StringBuffer/StringBuffer的常用方法
1.13.3 正則表達(dá)式
...
1.15 – 多線程基礎(chǔ)
1.15.1多線程概念
1.15.2 并發(fā)與并行
1.15.3 創(chuàng)建線程的方式
...
1.17 – IO流
1.17.1 流的基礎(chǔ)
1.17.2 流的分類
1.17.3 字節(jié)流
...
1.19 - 反射
1.19.1 Class類
1.19.2 Class獲取對(duì)象的三種方式
1.19.3 Constructor構(gòu)造方法
...
1.21 - MySql
1.21.1 SQL簡介
1.21.2 SQL表的概念
1.21.3 數(shù)據(jù)庫的安裝卸載
...
1.23 階段考試
1.25 linux中軟件安裝
1.25.1 軟件安裝介紹
1.25.2 二進(jìn)制安裝
1.25.3 rpm安裝
...
1.27 awk
1.27.1 awk簡介
1.27.2 使用方法
1.27.3 入門實(shí)例
...
1.2 - 基礎(chǔ)語法
1.2.1 計(jì)算機(jī)理論介紹
1.2.2 編程基礎(chǔ)--進(jìn)制分類,進(jìn)制轉(zhuǎn)換等
1.2.3 什么是Java
1.2.4 常用DOS命令
...
1.4 - 方法
1.4.1 方法的定義與調(diào)用
1.4.2 方法的參數(shù)與返回值
1.4.3 方法的重載
...
1.6 - 面向?qū)ο笕腴T
1.6.1 面向?qū)ο笈c面向過程
1.6.2 類的設(shè)計(jì)
1.6.3 對(duì)象的實(shí)例化
...
1.8 - 繼承
1.8.1 繼承基本的概念
1.8.2 繼承中的特點(diǎn)
1.8.3 繼承中的構(gòu)造方法
...
1.10 - 設(shè)計(jì)模式
1.10.1 單例設(shè)計(jì)模式
1.10.2 工廠設(shè)計(jì)模式
1.10.3 Lambda表達(dá)式
...
1.12 – 異常
1.12.1 異常定義
1.12.2 常用結(jié)構(gòu).
1.12.3 finally關(guān)鍵的應(yīng)用
...
1.14 - 集合框架
1.14.1 集合框架Collection
1.14.2 集合中元素排序
1.14.3 Collections工具類
...
1.16 - 線程高級(jí)
1.16.1 線程生命周期
1.16.2 臨界資源問題
1.16.3 同步代碼段synchronized關(guān)鍵字
...
1.18 - Socket網(wǎng)絡(luò)編程
1.18.1 TCP
1.18.2 Socket
1.18.3 ServerSocket
...
1.20 – 其他
1.20.1 代理模式
1.20.2 注解
1.20.3 Junit
...
1.22 - JDBC
1.22.1 JDBC概述
1.22.2 JDBC原理
1.22.3 JDBC的實(shí)現(xiàn)
...
1.24 linux的基礎(chǔ)
1.24.1 linux的主要特性
1.24.2 常用的linux版本
1.24.3 Vmvare的安裝
...
1.26 shell腳本
1.26.1 Shell介紹
1.26.2 Shell運(yùn)行環(huán)境和運(yùn)行方式
1.26.3 變量
...
第二階段:分布式理論簡介
2.1 CAP理論
2.1.1 Consistency 一致性
2.1.2 Availability 可用性
2.1.3 Partition tolerance 分區(qū)容忍性
2.2.4 數(shù)據(jù)量分布
2.3 一致性、2PC和3PC
2.3.1 一致性
2.3.2 2PC流程
2.3.3 3PC流程
2.3.4 一致性算法
2.2數(shù)據(jù)分布方式
2.2.1 哈希方式
2.2.2 一致性哈希
2.2.3 范圍分布
2.2.4 數(shù)據(jù)量分布
2.4 大數(shù)據(jù)集成架構(gòu)概述
2.4.1 大數(shù)據(jù)架構(gòu)簡介
...
第三階段:離線場景下的數(shù)據(jù)存儲(chǔ)與計(jì)算
3.1 協(xié)調(diào)服務(wù)ZK(1T)
3.1.1 zk的概念
3.1.2 zk架構(gòu)
3.1.3 zk讀寫
...
3.3 數(shù)據(jù)存儲(chǔ)alluxio(1T)
3.3.1 alluxio應(yīng)用場景及架構(gòu)組成
3.3.2 alluxio 存儲(chǔ)管理
3.3.3 alluxio with spark
...
3.5 數(shù)據(jù)采集logstash
3.5.1 Logstash介紹
3.5.2 Input組件介紹
3.5.3 Filter組件介紹
...
3.7 數(shù)據(jù)同步datax(0.5T)
3.7.1 datax簡介
3.7.2 datax核心架構(gòu)
3.7.3 datax插件介紹
...
3.9 計(jì)算模型MR與DAG(1T)
3.9.1 MR計(jì)算模型及流程
3.9.2 DAG計(jì)算模型流程
3.9.3 MR過程及調(diào)優(yōu)...
3.11 Impala(1T)
3.11.1 impala簡介
3.11.2 impala架構(gòu)
3.11.3 impala工作原理
...
3.13 任務(wù)調(diào)度airflow
3.13.1 airflow簡介
3.13.2 執(zhí)行器
3.13.3 架構(gòu)
...
3.2 數(shù)據(jù)存儲(chǔ)hdfs(2T)
3.2.1 hdfs應(yīng)用場景與架構(gòu)組成
3.2.2 hdfs HA 環(huán)境搭建
3.2.3 hdfs 元數(shù)據(jù)瓶頸及解決
...
3.4 數(shù)據(jù)采集flume(1T)
3.4.1 flume簡介-基礎(chǔ)知識(shí)
3.4.2 flume安裝與測試
3.4.3 flume部署方式
...
3.6 數(shù)據(jù)同步Sqoop(0.5T)
3.6.1 Sqoop簡介以及使用
3.6.2 Sqoop shell使用
3.6.3 Sqoop-import
...
3.8 數(shù)據(jù)同步mysql-binlog(1T)
3.8.1 mysql-binlog簡介
3.8.2 啟停binlog
3.8.3 常用binlog日志操作命令
...
3.10 hive(5T)
3.10.1 Hive是什么
3.10.2 Hive的特點(diǎn)
3.10.3 Hive架構(gòu)簡述
...
3.12 任務(wù)調(diào)度Azkaban(1T)
3.12.1 Azkaban簡介
3.12.2 Azkaban和oozie的對(duì)比
3.12.3 Azkaban server安裝配置
...
第四階段:數(shù)倉建設(shè)(13T)
4.1 數(shù)倉倉庫(1T)
4.1.1 數(shù)倉的歷史
4.1.2 數(shù)倉的背景
4.1.3 數(shù)倉的定義
...
4.3 多維數(shù)據(jù)模型處理kylin(3.5T)
4.3.1 kylin的概覽
4.3.2 安裝部署
4.3.3 集群模式部署
...
4.2 離線數(shù)倉項(xiàng)目-伴我汽車(5T)
4.2.1 項(xiàng)目業(yè)務(wù)描述
4.2.2 項(xiàng)目技術(shù)
4.2.3 項(xiàng)目架構(gòu)
...
4.4 離線數(shù)倉項(xiàng)目-伴我汽車升級(jí)
4.4.1 加入kylin進(jìn)行多維分析
3.7.2 datax核心架構(gòu)
3.7.3 datax插件介紹
...
第五階段:分布式計(jì)算引擎(22T)
5.1 分布式計(jì)算引擎概述
5.1.1 計(jì)算引擎介紹
5.1.2 計(jì)算引擎分類
...
5.3 spark
5.3.1 大數(shù)據(jù)架構(gòu)體系
5.3.2 架構(gòu)詳解
5.3.3 Spark集群介紹
...
5.5 數(shù)據(jù)存儲(chǔ)redis
5.5.1 什么是NoSQL
5.5.2 NoSQL數(shù)據(jù)庫的分類
5.5.2 NoSQL數(shù)據(jù)庫的分類
...
5.7 離線項(xiàng)目-某p2p平臺(tái)
5.7.1 項(xiàng)目描述
5.7.2 項(xiàng)目技術(shù)
5.7.3 spark多數(shù)據(jù)源讀寫
...
5.2 scala語言(4T)
5.2.1 變量的聲明
5.2.2 數(shù)據(jù)類型和操作符
5.2.3 if流程控制
...
5.4 數(shù)據(jù)存儲(chǔ)hbase
5.4.1 Hbase來源
5.4.2 Hbase的架構(gòu)
5.4.3 Hbase集群搭建
...
5.6 Kudu
5.6.1 kudu簡介
5.6.2 kudu架構(gòu)/原理
5.6.3 kudu底層數(shù)據(jù)模型
...
5.8 第二階段考試
第六階段:實(shí)時(shí)場景下的數(shù)據(jù)存儲(chǔ)與計(jì)算(22T)
6.1 數(shù)據(jù)通道(4T)
6.1.1 Kafka的基本概念
6.1.2 Kafka的發(fā)展歷史
6.1.3 Kafka的應(yīng)用背景
...
6.3 流式數(shù)據(jù)處理flink(6T)
6.3.1 flink應(yīng)用場景及架構(gòu)組成
6.3.2 flink 流式處理
6.3.3 flink sql
...
6.5 流式處理項(xiàng)目-某交通大數(shù)據(jù)平臺(tái)(5T)
6.5.1 實(shí)時(shí)場景處理業(yè)務(wù)數(shù)據(jù)
6.5.2 可以進(jìn)行數(shù)據(jù)明細(xì)的全文查詢
6.5.3 實(shí)時(shí)累計(jì)業(yè)務(wù)統(tǒng)計(jì)
...
6.2 實(shí)時(shí)數(shù)倉druid(5T)
6.2.1 druid應(yīng)用場景及架構(gòu)組成
6.2.2 druid內(nèi)部流程
6.2.3 druid 數(shù)據(jù)攝取
...
6.4 SparkStreaming(2T)
6.4.1 Spark Streaming概述
6.4.2 Spark Streaming的原理介紹
6.4.3 Spark Streaming與Storm對(duì)比
...
6.6 第三階段考試
第七階段:數(shù)據(jù)搜索(2T)
7.1 elasticsearch
7.1.1 全文檢索技術(shù)簡介
7.1.2 ES安裝配置入門
7.1.3 ES插件安裝
7.1.4 ES基本操作
7.1 elasticsearch
7.1.9 CURL操作REST命令
7.1.10 Windows安裝CURL
7.1.11 創(chuàng)建索引
7.1.12 RestApi:練習(xí)
7.1 elasticsearch
7.1.17 更新文檔數(shù)據(jù)
7.1.18 刪除文檔數(shù)據(jù)
7.1.19 條件查詢QueryBuilder
7.1.20 queryStringQuery搜索內(nèi)容查詢
7.1 elasticsearch
7.1.25 regexpQuery正則表達(dá)式查詢
7.1.26 matchAllQuery查詢所有數(shù)據(jù)
7.1.27 K分詞器集成ES
7.1.28 ES常用編程操作
7.1 elasticsearch
7.1.33查詢文檔分頁操作
7.1.34得分(加權(quán))
7.1.35在Query的查詢中定義加權(quán)
7.1.36 在Field字段的映射中定義加權(quán)
7.1 elasticsearch
7.1.5 Index的概念
7.1.6 Document的概念
7.1.7 Type的概念
7.1.8 map映射的概念
7.1 elasticsearch
7.1.13 使用Java操作客戶端
7.1.14 新建文檔(自動(dòng)創(chuàng)建索引和映射)
7.1.15 搜索文檔數(shù)據(jù)(單個(gè)索引)
7.1.16 搜索文檔數(shù)據(jù)(多個(gè)索引)
7.1 elasticsearch
7.1.21 wildcardQuery通配符查詢
7.1.22 termQuery詞條查詢
7.1.23 boolQuery布爾查詢
7.1.24 fuzzyQuery模糊查詢
7.1 elasticsearch
7.1.29 索引相關(guān)操作
7.1.30 映射相關(guān)操作
7.1.31 文檔相關(guān)操作
7.1.32 IK分詞器自定義詞庫
7.1 elasticsearch
7.1.37 過濾器
7.1.38 范圍過濾器
7.1.39 布爾過濾器
第八階段:數(shù)據(jù)治理(2T)
8.1 概念及構(gòu)成
8.1.1 數(shù)據(jù)標(biāo)準(zhǔn)
8.1.2 數(shù)據(jù)分類
8.1.3 數(shù)據(jù)建模
...
8.3 元數(shù)據(jù)、血緣及數(shù)據(jù)質(zhì)量
8.3.1 元數(shù)據(jù)及血緣構(gòu)建
8.3.2 基于Hive Hook的元數(shù)據(jù)及血緣構(gòu)建
8.3.3 Apache Atlas 開源元數(shù)據(jù)及血緣管理框架介紹
...
8.5 Spark Listener
...
8.7 數(shù)據(jù)治理項(xiàng)目-數(shù)據(jù)地圖(5T)
8.7.1 項(xiàng)目描述
8.7.2 項(xiàng)目選型
8.7.3 項(xiàng)目實(shí)現(xiàn)
...
8.2 neo4j
8.2.1 圖存儲(chǔ)與查詢介紹
8.2.2 環(huán)境搭建
8.2.3 cypher語言學(xué)習(xí)
...
8.4 Hive Hook
...
8.6 JanusGraph
...
第九階段:BI系統(tǒng)(2T)
9.1 Superset(BT)
9.1.1 Superset簡介
9.1.2 Superset編譯
9.1.3 Superset安裝
9.1.4 創(chuàng)建數(shù)據(jù)源
9.1.5 添加數(shù)據(jù)表
9.1.6 表操作
9.1.7 數(shù)據(jù)探索分析
9.1.8 數(shù)據(jù)可視化
9.1.9 可視化圖表類型選擇
9.1.10 數(shù)據(jù)時(shí)間范圍
9.1.11 自定義
9.2 Graphna (RealTime)
9.2.1 grafana簡介
9.2.2 grafana安裝部署
9.2.3 grafana特征
9.2.4 數(shù)據(jù)源
9.2.5 快捷鍵
9.2.6 插件
9.2.7 http的api
第十階段:數(shù)據(jù)挖掘(10T)
10.1 機(jī)器學(xué)習(xí)中的數(shù)學(xué)體系
10.1.1微分學(xué)與梯度下降
10.1.2數(shù)學(xué)分析與概率論
10.1.3數(shù)理統(tǒng)計(jì)與參數(shù)估計(jì)
10.1.4線性代數(shù)與信息論
10.1.5凸優(yōu)化
...
10.2 Spark MLlib機(jī)器學(xué)習(xí)算法庫
10.2.1 機(jī)器學(xué)習(xí)框架—假設(shè)函數(shù)、目標(biāo)函數(shù)和zui優(yōu)函數(shù)
10.2.2 特征工程—數(shù)值型特征、類別型特征和有序特征
10.2.3 離散化處理
10.2.4 讀熱向量編碼
10.2.5 TF-IDF權(quán)重
...
10.3 Python scikit-learn機(jī)器學(xué)習(xí)算法庫
10.3.1 回歸與分類算法(理論上)
10.3.2回歸與分類算法(代碼實(shí)戰(zhàn)下)
10.3.3支持向量機(jī)(理論上)
10.3.4支持向量機(jī)(實(shí)戰(zhàn)下)
10.3.5決策樹(Decision Tree)—>ID3、C4.5、Gini系數(shù)(理論上)
...
10.4 機(jī)器學(xué)習(xí)結(jié)合大數(shù)據(jù)項(xiàng)目
10.4.1《金融風(fēng)控領(lǐng)域用戶貸款信用評(píng)分預(yù)測》
10.4.2《搜狗知識(shí)圖譜》
...