Skip to content

Latest commit

 

History

History
47 lines (39 loc) · 1.61 KB

README.md

File metadata and controls

47 lines (39 loc) · 1.61 KB

Spark tutorial for imac

本項目將儲存所有於分享會以及課程上,所接觸的系統建置、Spark API撰寫、HDFS 操作...等教學與整理,主要授課人員為 NUTC imac 內部團隊自我訓練。

主要包含項目

  1. Spark 概念整理
  2. Spark 環境部署模式
  3. Spark API 簡單操作
  4. Spark SQL API(Hive on Spark)
  5. Spark Streaming API(DStream)
  6. Message Queue Broker(such as MQTT, Kafka...etc)
  7. Spark MLlib
  8. ELK logs 分析
  9. Spark 串接 s3 與 swift
  10. Spark NoSQL 串接
  11. Spark Dataframe

以上內容我們會逐一整理,並寫成文件來分享給大家。

參與貢獻

任何團隊成員都可以對該 git 做貢獻,未來也會請大家針對不一樣的作業進行提交,一個基本的貢獻流程如下所示:

  1. Githubfork 到自己的 Repository,例如:<User>/Spark-tutorial.git,然後 clone到 local 端,並設定 Git 使用者資訊。
git clone https://github.com/imac-cloud/Spark-tutorial.git
cd spark-tutorial
git config user.name "User"
git config user.email [email protected]
  1. 修改程式碼或頁面後,透過 commit 來提交到自己的 Repository:
git commit -am "Fix issue #1: change helo to hello"
git push

若新增採用一般文字訊息,如Add Spark MLlib example ...

  1. 在 GitHub 上提交一個 Pull Request。
  2. 持續的針對 Project Repository 進行更新內容:
git remote add upstream  https://github.com/imac-cloud/Spark-tutorial.git
git fetch upstream
git checkout master
git rebase upstream/master
git push -f origin master