課程簡介:大數據(big data,mega data)或稱巨量資料,指的是需要新處理模式才能具有更強的決策力、洞察力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產。
課程目標:用完全零基礎的大數據課程,不斷更新緊隨技術發(fā)展浪潮,更真實深度還原企業(yè)應用場景,更全面典型技術的點線面橫向擴展,拓寬就業(yè)領域。
課程大綱:
第一章 操作系統(tǒng)基礎
1.1 計算機基礎知識
1.2 Linux環(huán)境搭建
1.3 數據庫環(huán)境搭建
1.4 SQL語言
1.5 Superset部署和開發(fā)
1.6 案例架構
第二章 Java語言編程
2.1 Java程序基礎數據類型
2.2 Java異常處理機制
2.3 Jsoup的網絡爬蟲開發(fā)
2.4 JDBC操作
2.5 ETL數據處理和BI報表開發(fā)
第三章 Hadoop技術棧
3.1 shell編程
3.2 ZooKeeper原理及應用
3.3 HDFS的使用和MapReduce編程
3.4 Yarn的原理和調優(yōu)
3.5 Hive的使用和調優(yōu)
第四章 數據微服務接口開發(fā)
4.1 SpringBoot整合SpringMVC開發(fā)
4.2 SpringBoot整合MyBatis開發(fā)
4.3 Eureka搭建
4.4 Feign的應用
第五章 實時生態(tài)圈
5.1 Redis原理及架構
5.2 Hbase原理及架構
5.3 Phoneix二級索引優(yōu)化查詢
5.4 ELK開發(fā)
5.5 基于Flink進行實時和離線數據處理和分析
第六章 Spark技術棧
6.1 Scala語言基礎、數據結構
6.2 Spark Streaming整合Kafka完成實時數據處理
6.3 park Streaming偏移量管理及Checkpoint
6.4 Structured Streaming整合多數據源完成實時數據處理