OpenStack Cinder サービスステータスのトラブルシューティング

OpenStack Cinder サービスステータスのトラブルシューティング

[[333895]]

この記事はWeChatの公開アカウント「New Titanium Cloud Service」から転載したもので、著者はShu Zhuです。この記事を転載する場合は、Xintai Cloud Service公式アカウントまでご連絡ください。

最近、OpenStack 環境を手動で構築しました。ハードディスクの作成に失敗しました。ログを確認したところ、スケジュール設定が実行できないというメッセージが表示されました。シンダーノードに問題があるのではないかと疑いました。 Cinder ノードにアクセスしてサービスを確認したところ、ステータスは正常でした。

  1. systemctl ステータス openstack-cinder-volume.service

次に、コントロールノードのcinderサービス、openstackボリュームサービスリストを確認します。

通常、次のように表示されます:

その結果、燃え殻の量が減少していることが判明しました。ログを確認したところ、エラー情報は見つかりませんでした。さまざまな cinder サービスを再起動しても効果はありませんでした。最終的に、ソース コードを追跡することにしました (注: 記事内のコードは OpenStack Train バージョンに対応しています)。

OpenStack ボリューム サービス リストに対応する実装コードを見つけます。

  1. now = timeutils.utcnow(with_timezone= True )

コントローラーノード上で openstack-cinder-api.servic サービスが開始されるため、コントローラーノードの現在の時刻が取得されます。

services = objects.ServiceList.get_all(context, filters) は、最終的に cinder データベースの services テーブルからすべてのサービス データを取得します。

alive = abs(delta_sec) <= CONF.service_down_time の場合、時間差の絶対値が設定された service_down_time より小さいかどうかを比較します。デフォルトの service_down_time は 60 秒です。

  1. cfg.IntOpt( 'サービスダウンタイム' ,
  2. デフォルト=60、
  3. help= 'サービスが終了されるまでの最後のチェックインからの最大時間'  
  4. 「考慮される」 )、

art = "up" if alive else "down" 差が 60 未満の場合、サービス ステータスは up です。それ以外の場合は down です。 cinder サービスの状態値は、cinder データベース内のサービス テーブルの各行の updated_at 列の値と現在のコントローラー ノードの時間差が設定された範囲内にあるかどうかによって決まることがわかります。

問題を解決する

cinder-volume がダウンしている理由は、openstack-cinder-volume.service サービスを実行しているストレージノードとコントローラーノード間の時間差が大きすぎるためです。ステータスがアップであることを確認するには、2 つのノード間の時間差が service_down_time - report_interval 以内である必要があります。デフォルトでは、差は 50 秒です。そこで、2 つのサーバーの時間を同期した後、再度確認したところ、cinder-volume の状態が up に変わっていることがわかりました。

Cinder サービス更新メカニズム

次に、Cinder サービスの更新メカニズムについて説明します。

report_interval のデフォルトの時間は 10 秒です。

  1. cfg.IntOpt( 'レポート間隔' ,
  2. デフォルト= 10、
  3. help= 'ノードが状態を報告する間隔(秒単位)'  
  4. 'データストアへ' )、

<<:  クラウドネイティブ時代は Java か Go か?

>>:  aPaaS プラットフォームとは何ですか?

推薦する

ウェブサイトの掲載に影響し、改善できない要因

ウェブサイトのインクルードは非常に厄介な問題です。友好的なリンクを交換するとき、ほとんどのウェブマス...

budgetvm-7.99$/1g メモリ/2g バースト/35g SSD/2IP/3T トラフィック

SSD ハードドライブを搭載した budgetvm の openvz ベースの VPS をお勧めしま...

SEOの観点から見た360度旅行

今日、偶然、360 Travelのウェブサイトが注目を集める形で立ち上げられたことを発見しました。一...

A5ウェブマスターネットワーク初のB2Bウェブサイト運用研修の受講受付開始

近年、電子商取引市場の規模は飛躍的に拡大し、総合型B2B電子商取引プラットフォームも十分に発達するで...

Haiyun Jiexun: OpenStack を深く掘り下げて管理を容易にする

最近、海雲捷訊はテンセントの戦略的投資による大規模な資金調達のニュースを発表しました。これは、Boy...

justhost: ノボシビルスク・アドマン・データセンターの無制限トラフィックVPSの簡単なレビュー

justhost は、ロシア極東のノボシビルスク データ センターで、デフォルトの最小帯域幅 200...

MogujieのChen Qi氏:「Taobaoは必然的に垂直的な電子商取引セグメントに細分化されるだろう」

モグジエのCEOである陳奇氏にインタビューする前に、私はある疑問について考えていました。なぜ、同じく...

Longhorn クラウド ネイティブ コンテナ分散ストレージ - Python クライアント

[[421320]]この記事はWeChatの公開アカウント「Hacker Afternoon Tea...

SEOの成功を測定する方法

SEO を始める前に行うべき最も重要なことの 1 つは、ビジネス目標を明確にすることです。たとえば、...

2021年に主流になる4つのクラウドコンピューティング技術

IT 企業におけるクラウド コンピューティング技術の重要性はすでに周知の事実ですが、今年は新たな市場...

VDI テスト チェックリスト: VDI 展開をテストするための重要な手順

IT プロフェッショナルが VDI を導入する場合、リソースの過剰プロビジョニングや不足プロビジョニ...

ウェブサイトの最適化におけるワインと下水の法則についての考察

経営には興味深い法則があります。それは「ワインと汚水の法則」です。つまり、スプーン一杯のワインをバケ...

クラウドネイティブ時代にコンテナセキュリティをどうマスターするか?

クラウドネイティブ時代において、コンテナのセキュリティは無視できない重要な課題となっています。コンテ...

企業はクラウド コンピューティング テクノロジーにおけるビッグ データの主な課題にどのように対処できるでしょうか?

かつては、多くの人がビッグデータとクラウドコンピューティングを別々のテクノロジーとして見ていました。...

百度ランキング11位の企業ウェブサイトについての考察と概要分析

著者の最近の企業サイトは、最も労力がかかったサイトでもありますが、百度で11位に降格しました。今日、...