如何使用 Spark-Submit 將 JAR 檔案新增至 Spark 作業?
使用Spark-Submit 將JAR 檔案新增至Spark 作業
使用Spark-Submit 時,有多個選項可用於將JAR 檔案新增至Spark 作業,每個選項都包含它本身對類別路徑、檔案分佈和優先順序的影響。
ClassPath 效果
Spark-Submit 透過下列選項影響ClassPath:
- spark.driver.extraClassPath 或--driver-class-path:為驅動程式節點指定額外的類路徑。
- spark.executor.extraClassPath:為工作節點指定額外的類別路徑。
用於要包含的檔案在兩個 ClassPath 上,都需要在 both 標誌中指定。
檔案分佈
檔案分佈取決於執行模式:
- 客戶端模式: Spark 透過HTTP 伺服器將檔案分發到工作節點。
- 叢集模式: Spark 不分發文件,您必須透過 HDFS 或其他共用儲存手動使它們可供所有工作節點使用。
接受的 URI 格式
Spark-Submit 支援以下 URI 前綴進行檔案分發:
- file:: 由驅動程式 HTTP 伺服器提供服務。
- hdfs:, http:, https:, ftp:: 從指定的 URI 拉取。
- local:: 必須是每個工作節點上的本機檔案。
受影響的選項
問題中提到的選項影響JAR 檔案處理,如下所示:
- --jars 和SparkContext.addJar :不將JAR 新增到ClassPaths 的等效選項。
- SparkContext.addFile:用於不是執行時間依賴項的任意檔案。
- --conf spark.driver.extraClassPath 或 - -driver-class-path:驅動程式類別路徑修改的別名。
- --conf spark.driver.extraLibraryPath 或 --driver-library-path:驅動程式庫路徑的別名。
- -- conf spark.executor.extraClassPath:用於無法包含在 über JAR 中的執行時間依賴項。
- --conf spark.executor.extraLibraryPath:指定 JVM 的 java.library.path 選項。
優先權
直接在 SparkConf 上設定的屬性具有最高優先權,其次是 Spark-Submit 標誌,然後是 Spark-defaults.conf 中的選項。因此,程式碼中設定的任何值都將覆蓋相應的標誌或選項。
同時新增JAR 檔案
在客戶端模式下,可以安全地使用所有三個主要選項新增JAR 檔案:
但是,在叢集模式下,您應該只使用--jars 新增文件,並自行手動將它們分發到工作節點。應避免將 JAR 檔案傳遞給 --driver-library-path 等冗餘參數。
以上是如何使用 Spark-Submit 將 JAR 檔案新增至 Spark 作業?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

公司安全軟件導致部分應用無法正常運行的排查與解決方法許多公司為了保障內部網絡安全,會部署安全軟件。 ...

將姓名轉換為數字以實現排序的解決方案在許多應用場景中,用戶可能需要在群組中進行排序,尤其是在一個用...

系統對接中的字段映射處理在進行系統對接時,常常會遇到一個棘手的問題:如何將A系統的接口字段有效地映�...

在使用IntelliJIDEAUltimate版本啟動Spring...

在使用MyBatis-Plus或其他ORM框架進行數據庫操作時,經常需要根據實體類的屬性名構造查詢條件。如果每次都手動...

Java對象與數組的轉換:深入探討強制類型轉換的風險與正確方法很多Java初學者會遇到將一個對象轉換成數組的�...

電商平台SKU和SPU表設計詳解本文將探討電商平台中SKU和SPU的數據庫設計問題,特別是如何處理用戶自定義銷售屬...

Redis緩存方案如何實現產品排行榜列表的需求?在開發過程中,我們常常需要處理排行榜的需求,例如展示一個�...
