hadoop资源调度器

Jun 07, 2016 pm 04:30 PM
hadoop マルチユーザー サポート 環境 スケジュール設定 リソース

? ? ? ? ?hadoop支持多用户环境,在生产环境中,往往一个大的hadoop集群,供多个应用如Hive,Mahout等之类的使用。在多用户环境下,有的用户提交的工作量很大、很频繁,而有的很少,还有的优先级很高,那么如何保证“按需”来为各个用户分配资源(内存、CPU

? ? ? ? ?hadoop支持多用户环境,在生产环境中,往往一个大的hadoop集群,供多个应用如Hive,Mahout等之类的使用。在多用户环境下,有的用户提交的工作量很大、很频繁,而有的很少,还有的优先级很高,那么如何保证“按需”来为各个用户分配资源(内存、CPU、带宽、IO、磁盘)呢?这就需要用到资源调度器。

? ?? ? ?这里,我对hadoop的资源调度做个简单的归纳总结:

? ? ? ?? 一、基本术语

? ? ? ? 用户分组管理

? ? ? ? 用于按组为单位组织管理,某个用户只能向固定分组中提交作业,只能使用固定分组中配置的资源;同时可以限制每个用户提交的作业数,使用的资源量等

? ? ? ? 作业管理

? ? ? ? 包括作业提交权限控制,作业运行状态查看权限控制等。如:可限定可提交作业的用户;可限定可查看作业运行状态的用户;可限定普通用户只能修改自己作业的优先级,kill自己的作业;高级用户可以控制所有作业等。

? ? ? ? 用户(User)

? ? ? ? Hadoop使用Linux用户管理,Hadoop中的用户就是Linux中的用户

? ? ? ? 分组(group)

? ? ? ? Hadoop使用Linux分组管理,Hadoop中的分组就是Linux中的分组

? ? ? ? 池(pool)

? ? ? ? Hadoop Fair Scheduler中的概念,一个pool可以是一个user,一个group,或者一个queue。

? ? ? ? 队列(Queue)

? ? ? ? 队列是Hadoop提出的概念,一个Queue可以由任意几个Group和任意几个User组成。

?

?

? ? ? ? 二、资源调度管理简介

? ? ? ? Hadoop的资源管理核心

? ? ? ? ? ? ? ?存储容量管理

? ? ? ? ? ? ? ? ? ? ?HDFS存储管理

? ? ? ? ? ? ? ?计算容量管理

? ? ? ? ? ? ? ? ? ? ?MR任务槽管理

? ? ? ? ? ? ? ? ? ? ?任务调度器

?

?

? ? ? ? ? 三、存储容量管理

?

? ? ? ? ? ? ? ?主要是对HDFS的管理:

? ? ? ? ? ? ? ? ? ? HDFS本身也是一种文件系统,与Linux文件系统有类似之处

? ? ? ? ? ? ? ? ? ? 对用户组、用户、路径设置Quotas(包括空间大小和文件数量)

? ? ? ? ? ? ? ? ? ? Hadoop dfsadmin -setSpaceQuota size path

? ? ? ? ? ? ? ? ? ? hadoop dfsadmin -setQuota number path

? ? ? ? ? ? ? ? ? ? Hadoop共享Linux的用户组和用户

? ? ? ? ? ? ? ? ? ? HDFS的权限控制:用户和用户组

?

?

?

? ? ? ? ? 四、计算容量管理

? ? ? ? ? ? ? ? ? 主要是对MapReduce任务槽的管理,任务槽也可以理解为服务器的资源综合统称:

? ? ? ? ? ? ? ? ? ? ? ? ?CPU(如何设置MR,见下面备注)

? ? ? ? ? ? ? ? ? ? ? ? ?内存(设置子任务的jvm参数和GC参数。在1 . 0以后的版本中,可以全局M/R内存和Job ? ? ? ? ? ? ? M/R内存)

? ? ? ? ? ? ? ? ? ? ? ? ?网络带宽

? ? ? ? ? ? ? ? ? ? ? ? ?磁盘IO

? ? ? ? ? ? ? ? ? ? ? ? ?单台主机或整个集群资源是有限的。在多任务、多用户环境下,大量并发提交和执行任务是非常常见的,这就导致资源不足而竞争,如何保证在有限资源或业务约束下有序调度和执行任务,需要有一个协调者,这就是Hadoop的资源调度器。

?

?

? ? ? ? ? ? ? ? ? Hadoop的调度器

? ? ? ? ? ? ? ? ? ? ? ? FIFO(default)。先进先出调度器?

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? Hadoop默认提供。

? ? ? ? ? ? ? ? ? ? ? ? Fair Scheduler(plugin)。公平调度器

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? Facebook提供。

? ? ? ? ? ? ? ? ? ? ? ? Capacity Scheduler (plugin)。容量调度器

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? Yahoo提供。

?

?

?

? ? ? ? ? ? ? ? 1、 FIFO Scheduler

? ? ? ? ? ? ? ? ? ?先进先出调度器

? ? ? ? ? ? ? ? ? ?优点:

? ? ? ? ? ? ? ? ? ? ? ? ? ?Hadoop默认提供。非常简单、JobTracker无负担

? ? ? ? ? ? ? ? ? ? ? ? ? ?支持五级优先级,每级一个队列,从队列优先级高低提取任务执行。五级分别是:Very Low 、Low 、Normal 、High 、Very Hign;

? ? ? ? ? ? ? ? ? ? ? ? ? ?在同级队列中,按提交Job的时间先后顺序执行

? ? ? ? ? ? ? ? ? ? ? ? ? ?无需额外配置

? ? ? ? ? ? ? ? ? ? 缺点:

? ? ? ? ? ? ? ? ? ? ? ? ? ?完全忽略不同作业的需求差异

? ? ? ? ? ? ? ? ? ??

?

?

? ? ? ? ? ? ? ? ? 2、Fair Scheduler?

? ? ? ? ? ? ? ? ? 公平分享调度器:在多个用户之间共享集群资源。它按资源池来组织作业,并把资源按时间公平地分到这些资源池里。在每一个资源池内,会使用公平共享地方法在运行作业之间共享容量。

?

? ? ? ? ? ? ? ? ? 特征:

? ? ? ? ? ? ? ? ? ? ? ? ? 支持多用户(默认一个用户对一个池,依赖于Linux多用户环境)

? ? ? ? ? ? ? ? ? ? ? ? ? 资源公平共享(公平共享量由优先级决定,同优先级按FIFO调度)

? ? ? ? ? ? ? ? ? ? ? ? ? 保证最小共享量

? ? ? ? ? ? ? ? ? ? ? ? ? 支持时间片抢占

? ? ? ? ? ? ? ? ? ? ? ? ? 限制作业并发量,以防止中间数据塞满磁盘

? ? ? ? ? ? ? ? ? ? ? ? ??



?

?

? ? ? ? ? ? ? ? ? ?3、Capacity Scheduler?

? ? ? ? ? ? ? ? ? ? ?容量调度器:使多个用户可以安全地共享一个大的集群,应用程序可以在容量限度下获取到需要的资源,最大化集群的吞吐率和利用率。它按队列来组织作业,每个队列会配置一定比例的计算资源,且所有提交到队列中的作业共享该队列中的资源。

? ? ? ? ? ? ? ? ? ??

? ? ? ? ? ? ? ? ? ? ?特征:

? ? ? ? ? ? ? ? ? ? ? ? ? ? 层次化的队列

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 层次化的队列支持在一个组织内子队列的优先共享资源,从而提供了更多的控制和预

测的能力,不支持抢占

? ? ? ? ? ? ? ? ? ? ? ? ? ? 资源容量保证

? ? ? ? ? ? ? ? ? ? ? ? ? ?队列实现了一种资源的划分,所有的应用都会被指定到特定的队列,这些应用所能使用到的资源受到队列所拥有资源的限制

? ? ? ? ? ? ? ? ? ? ? ? ? ? 安全性?

? ? ? ? ? ? ? ? ? ? ? ? ? ?每一个队列都有一个严格的ACL来控制那些用户可以访问队列,并且有一个safe-guard来保证用户不能够看或者修改其他用户的应用,而且每个队列或系统都可以设置管理员角色。?

? ? ? ? ? ? ? ? ? ? ? ? ? ? 弹性

? ? ? ? ? ? ? ? ? ? ? ? ??空闲的资源可以分配给任何队列,这样可能超出队列的资源限制。也就是说,如果集群有空闲的资源,而有些队列需要的资源超出了分给他的限制,这些空闲的资源将被分配给这些队列,这样就保证了资源的可预测性和弹性,从而防止了人工孤岛,帮助实现资源的优化利用。

? ? ? ? ? ? ? ? ? ? ? ? ? ? 多用户

? ? ? ? ? ? ? ? ? ? ? ? ? ?系列的综合设置可以防止单一的应用或用户占用队列或集群的全部资源,防止集群被单用户过度使用,从而保证了多用户可以共同使用集群

? ? ? ? ? ? ? ? ? ? ? ? ? ? 可操作性

? ? ? ? ? ? ? ? ? ? ? ? ? ?RuntimeConfiguration:一些设置可以在运行时进行配置,例如资源分配的容量, ? ? ? ? ? ? ? ? ? ? ACL

? ? ? ? ? ? ? ? ? ? ? ? ? ? 基于资源的调度?

? ? ? ? ? ? ? ? ? ? ? ? ? ? 支持资源密集型的应用,应用可以被指定分配超出缺省设置的更多的资源

?



?

? ? ? ? ? ? ?Fair VS Capacity

?

? ? ? ? ? ? ? 相同点

? ? ? ? ? ? ? ? ? ? 均支持多用户多队列,即:适用于多用户共享集群的应用环境

? ? ? ? ? ? ? ? ? ? 单个队列均支持优先级和FIFO调度方式

? ? ? ? ? ? ? ? ? ? 均支持资源共享,即某个queue中的资源有剩余时,可共享给其他缺资源的queue

? ? ? ? ? ? ? 异同点

? ? ? ? ? ? ? ? ? ? ?核心调度策略不同。 计算能力调度器的调度策略是,先选择资源利用率低的queue,然后在queue中同时考虑FIFO和memory constraint因素;而公平调度器仅考虑公平,而公平是通过作业缺额体现的,调度器每次选择缺额最大的job(queue的资源量,job优先级等仅用于计算作业缺额)。

? ? ? ? ? ? ? ? ? ? ?内存约束。计算能力调度器调度job时会考虑作业的内存限制,为了满足某些特殊job的特殊内存需求,可能会为该job分配多个slot;而公平调度器对这种特殊的job无能为力,只能杀掉这种task。

单一用户环境下,Fair只能共享一个池,Capacity可以多队列

?



已有 0 人发表留言,猛击->> 这里

ITeye推荐
  • —软件人才免语言低担保 赴美带薪读研!—



hadoop资源调度器

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

Windows 回復環境を起動できない Windows 回復環境を起動できない Feb 19, 2024 pm 11:12 PM

Windows 回復環境 (WinRE) は、Windows オペレーティング システムのエラーを修復するために使用される環境です。 WinRE に入ると、システムの復元、出荷時設定へのリセット、アップデートのアンインストールなどを実行できます。 WinRE を起動できない場合、この記事では問題を解決するための修正方法を説明します。 Windows 回復環境を起動できない Windows 回復環境を起動できない場合は、以下の修正プログラムを使用してください。 Windows 回復環境のステータスを確認する 他の方法を使用して Windows 回復環境に入る Windows 回復パーティションを誤って削除しましたか?以下の Windows のインプレース アップグレードまたはクリーン インストールを実行します。これらすべての修正については詳しく説明しています。 1]Wiをチェックする

Windows Hello のサポートされていないカメラの問題を解決する方法 Windows Hello のサポートされていないカメラの問題を解決する方法 Jan 05, 2024 pm 05:38 PM

Windows Shello を使用しているときに、対応しているカメラが見つからない場合は、使用しているカメラが顔認証に対応していない、カメラドライバーが正しくインストールされていないなどが原因として考えられますので、設定方法を見てみましょう。 Windowshello でサポートされているカメラ チュートリアルが見つかりません: 理由 1: カメラ ドライバーが正しくインストールされていません 1. 一般的に、Win10 システムはほとんどのカメラのドライバーを自動的にインストールできます。次のように、カメラを接続した後に通知が表示されます; 2.このとき、デバイスを開き、マネージャーでカメラドライバーがインストールされているかどうかを確認し、インストールされていない場合は手動で行う必要があります。 WIN+X、次にデバイス マネージャーを選択します; 3. デバイス マネージャー ウィンドウでカメラ オプションを展開すると、カメラ ドライバー モデルが表示されます。

115 ネットワーク ディスク上のリソースを見つける方法 115 ネットワーク ディスク上のリソースを見つける方法 Feb 23, 2024 pm 05:10 PM

115 ネットワーク ディスクには大量のリソースが存在しますが、リソースを見つけるにはどうすればよいでしょうか?ユーザーはソフトウェア内で必要なリソースを検索し、ダウンロード インターフェイスに入り、ネットワーク ディスクに保存することを選択できます。 115 ネットワーク ディスク上のリソースを検索する方法のこの紹介では、具体的な内容を説明します。 115 ネットワーク ディスク上のリソースを見つけるにはどうすればよいですか? 回答: ソフトウェアでコンテンツを検索し、クリックしてネットワーク ディスクに保存します。詳細な紹介: 1. まず、アプリに必要なリソースを入力します。 2. 次に、表示されるキーワードのリンクをクリックします。 3. 次に、ダウンロード インターフェイスに入ります。 4. 内部のネットワーク ディスクに保存をクリックします。

ASUS TUF Z790 PlusはASUS MCP79メモリ周波数と互換性があります ASUS TUF Z790 PlusはASUS MCP79メモリ周波数と互換性があります Jan 03, 2024 pm 04:18 PM

ASUS tufz790plus はメモリ周波数をサポート ASUS TUFZ790-PLUS マザーボードは、デュアルチャネル DDR4 メモリをサポートし、最大 64GB のメモリをサポートする高性能マザーボードです。そのメモリ周波数は非常に強力で、最大 4800MHz です。サポートされる具体的なメモリ周波数には、2133MHz、2400MHz、2666MHz、2800MHz、3000MHz、3200MHz、3600MHz、3733MHz、3866MHz、4000MHz、4133MHz、4266MHz、4400MHz、4533MHz、4600MHz、4733MHz、4800MHzが含まれます。 。日常使用でも、高パフォーマンスのニーズでも

長所と短所の分析: オープンソース ソフトウェアの長所と短所を詳しく見る 長所と短所の分析: オープンソース ソフトウェアの長所と短所を詳しく見る Feb 23, 2024 pm 11:00 PM

オープンソース ソフトウェアの長所と短所: オープンソース プロジェクトの長所と短所を理解するには、具体的なコード例が必要です。 今日のデジタル時代において、オープンソース ソフトウェアはますます注目と尊敬を集めています。オープンソース ソフトウェアは、協力と共有の精神に基づいたソフトウェア開発モデルとして、さまざまな分野で広く使用されています。ただし、オープンソース ソフトウェアには多くの利点があるにもかかわらず、いくつかの課題や制限もあります。この記事では、オープンソース ソフトウェアの長所と短所を詳しく掘り下げ、具体的なコード例を通じてオープンソース プロジェクトの長所と短所を示します。 1. オープンソース ソフトウェアの利点 1.1 オープン性と透明性 オープンソース ソフトウェア

PyCharm Community Edition は十分なプラグインをサポートしていますか? PyCharm Community Edition は十分なプラグインをサポートしていますか? Feb 20, 2024 pm 04:42 PM

PyCharm Community Edition は十分なプラグインをサポートしていますか?特定のコード例が必要 ソフトウェア開発の分野で Python 言語がますます広く使用されるようになるにつれて、プロ仕様の Python 統合開発環境 (IDE) として PyCharm が開発者に好まれています。 PyCharmはプロフェッショナル版とコミュニティ版の2つのバージョンに分かれており、コミュニティ版は無料で提供されますが、プラグインのサポートがプロフェッショナル版に比べて制限されています。そこで問題は、PyCharm Community Edition は十分なプラグインをサポートしているかということです。この記事では、具体的なコード例を使用して、

macOS で「クリックしてデスクトップを表示」機能を無効にする方法 macOS で「クリックしてデスクトップを表示」機能を無効にする方法 Nov 23, 2023 pm 02:31 PM

デフォルトでは、デスクトップの壁紙をクリックすると、macOSSonoma はアクティブなウィンドウをすべて非表示にします。これは、デスクトップ上にアクセスする必要のあるファイルが大量にある場合に便利です。ただし、この動作が腹立たしいと感じた場合は、それをオフにする方法があります。 Apple の最新の macOS Sonoma Mac オペレーティング システムには、「壁紙をクリックしてデスクトップを表示する」という新しいオプションがあります。デフォルトで有効になっているこのオプションは、複数のウィンドウを開いている傾向があり、ウィンドウを最小化したり移動したりせずにデスクトップ上のファイルやフォルダーにアクセスしたい場合に特に便利です。この機能を有効にしてデスクトップの壁紙をクリックすると、開いているすべてのウィンドウが一時的に脇に追いやられ、デスクトップに直接アクセスできるようになります。完了したら、もう一度行うことができます

GTX960 と XP システム間の互換性と関連手順 GTX960 と XP システム間の互換性と関連手順 Dec 28, 2023 pm 10:22 PM

XP システムを使用しており、グラフィック カードを gtx960 にアップグレードしたいと考えているユーザーもいますが、gtx960 が XP システムをサポートしているかどうかはわかりません。実はgtx960はXP系をサポートしています。公式WebサイトからXPシステムに適したドライバーをダウンロードするだけで、gtx960を使用できるようになります。以下、具体的な手順を見ていきましょう。 gtx960 は XP システムをサポートしていますか: GTX960 は XP システムと互換性があります。ドライバーをダウンロードしてインストールするだけで準備完了です。まず、NVIDIA 公式 Web サイトを開いて、ホームページに移動する必要があります。次に、ページの上にあるラベルまたはボタンを見つける必要があります。おそらく「ドライバー」というラベルが付いています。このオプションを見つけたら、クリックする必要があります

See all articles