ノード障害検出は分散システムでは避けられない問題です。クラスターはノードの生存を感知し、適切な調整を行う必要があります。通常、障害検出にはハートビート方式が使用され、外部とのハートビートを維持できるノードは正常にサービスを提供できると考えられています。優れた障害検出戦略では、次のことが可能でなければなりません。
分散システムによって構造が異なり、一貫性、可用性、スケーラビリティの要件も異なるため、上記の点に関して異なる決定やトレードオフが行われます。 Ceph がどのようにそれを実行するかを見てみましょう。 Ceph 障害検出メカニズム Ceph は集中型分散構造であるため、メタデータの保守と更新は当然、その中心ノードである Ceph Monitor の責任となります。ノードの生存ステータスが変化すると、モニターはメタデータを検出して更新し、すべての OSD ノードに通知する必要もあります。最も自然に考えられるのは、中央ノードのモニターがすべての OSD ノードと頻繁にハートビートを維持するようにすることですが、この方法では、OSD ノードが数百または数千ある場合、モニターにかかる負荷が大きくなります。以前、Ceph Monitor と Paxos では、Ceph の設計思想は、よりスマートな OSD とクライアントを通じて中央ノード Monitor への負荷を軽減することであると紹介しました。同様に、ノード障害検出にも OSD とモニターの連携が必要です。以下の紹介は、現在の*** バージョン 11.0.0 に基づいています。 OSD間のハートビート 同じ pg に属する OSD はパートナー OSD と呼ばれます。相互に PING\PONG メッセージを送信し、送信時間と受信時間を記録します。 OSD は、パートナー OSD が cron でタイムアウトしたことを検出すると、それを failure_queue キューに追加し、後続のレポートを待機します。 パラメータ: osd_heartbeat_interval(6): パートナーOSDにpingを送信する間隔。実際には、ピークを回避するために、この基準にランダムな時間が追加されます。 osd_heartbeat_grace(20): 相手がダウンしていると判断する前に応答を受信するのにどのくらいの時間がかかりますか? OSDはパートナーOSDの障害をモニターに報告します 1. OSDがエラーレポートを送信する
2. 統計をオフラインで監視する OSD モニターは OSD からパートナー障害レポートを収集します。 エラー レポートによって示された OSD 障害が特定のしきい値を超え、十分な数の OSD がその障害を報告すると、OSD はオフラインになります。 パラメータ: osd_heartbeat_grace(20): OSD障害を確認するための時間しきい値。 mon_osd_reporter_subtree_level("host"): エラーレポートの数をカウントするレベル。デフォルトは host で、異なるホストからの osd レポートをカウントします。 mon_osd_min_down_reporters(2): 異なるmon_osd_reporter_subtree_level osdからのダウンレポートの最小数 mon_osd_adjust_heartbeat_grace(true): OSD 障害を確認するための時間しきい値を計算するときに OSD の履歴遅延を考慮するかどうか。そのため、障害の時間しきい値は通常、osd_heartbeat_grace で指定された値よりも大きくなります。 ハートビートを監視するOSD
パラメータ: mon_osd_report_timeout(900): osd からレポートが受信されなくなるまでの時間。その時点でモニターはそれをダウンとしてマークします。 osd_mon_report_interval_max(600): OSDがモニターにレポートする最大時間。 osd_mon_report_interval_min(5): OSDがモニターにレポートする最小間隔 要約する Ceph では、パートナー OSD が障害ノードを報告する方法と、モニターが OSD からのハートビートをカウントする方法の 2 つの方法で OSD ノード障害を検出できることがわかります。記事の冒頭で述べた、適切な障害検出メカニズムが実行する必要があるポイントに戻り、Ceph の実装方法と組み合わせてその設計思想を理解しましょう。
|
>>: 効率性の束縛を打ち破るUAI-Trainにより、ARKieは設計ニーズをより深く理解できるようになります
2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています過激な分裂...
小学校の先生がこう言ったのを今でも覚えています。「張強、君の作文の題名はまた的外れだよ。」今でもこの...
Hostpair は 2009 年に設立され、主な事業は海外仮想ホスティング、米国 VPS、再販業者...
中国では新たなインフラ政策が積極的に推進されており、データセンター、クラウドコンピューティング、ビッ...
インターネットの急速な発展とネットワークの普及に伴い、中国のインターネットユーザー数も急増しています...
vsys.host は 2009 年に設立されたウクライナの商人です。主にウクライナのキエフとオラン...
本日、AutoNavi Open Platformは北京で2018年の戦略説明会を開催し、「GAIA...
SEO は非常にシンプルで、8 つの単語で表すと「コンテンツが王様、外部リンクが女王」だと言う人もい...
クラウドファンディングは、公的資金調達や大量資金調達を意味する外国語「crowdfunding」を翻...
メガレイヤーはどうですか?メガレイヤーUSAはどうですか? Megalayer の米国サーバーは、サ...
個人情報保護に関する国家基準が本日施行される。記者らは本紙(段晨群記者)は、本日、中国初の個人情報保...
今年 3 月以来、ウェブマスターたちは Baidu が開始した新機能、Baidu Share の「い...
ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービスWeiboマーケティング...
HAYTEK TECHNOLOGIES が所有するブランドである vds4you は、21% 割引の...
1. 金融管理において、YiFuBaoがYu’EBaoに挑戦し、Suningが追随アリ氏の余宝に続き...