分散トランザクションとは何ですか? また、そのソリューションは何ですか?

分散トランザクションとは何ですか? また、そのソリューションは何ですか?

 

分散トランザクションとは何ですか?

回答: 大規模な操作はさまざまな小規模な操作で構成されていることを意味します。これらの小さな操作は、異なるサーバーに分散されます。分散トランザクションでは、これらの小さな操作がすべて成功するか、すべて失敗するかを保証する必要があります。本質的に、分散トランザクションは、異なるデータベース間でのデータの一貫性を確保するように設計されています。

分散トランザクションの原因は何ですか?

1 データベースシャーディング

データベースの単一テーブル内のデータが数千万に達すると、データベースとテーブルを分割して、元の 1 つのデータベースを複数のデータベースに分割することを検討する必要があります。たとえば、操作がデータベース 01 とデータベース 02 の両方を操作し、データの一貫性を保証する必要がある場合は、分散トランザクションを使用する必要があります。

2 アプリケーションSOA

いわゆる SOA はサービス指向ビジネスを意味します。たとえば、電子商取引プラットフォームで注文を行うと、在庫を減算するために在庫サービスが呼び出され、注文データを更新するために注文サービスが呼び出されます。この場合、注文データベースと在庫データベースが関係します。データの一貫性を確保するには、分散トランザクションが必要です。

要約: 実際、上記の 2 つのシナリオは、最終的には複数のデータベースを操作し、データの一貫性を確保して、分散トランザクションを生成することを目的としています。

分散トランザクションソリューション

1. 2フェーズコミット(2PC)

XA は、Tuxedo によって提案された分散トランザクション プロトコルです。 XA は、トランザクション マネージャーとローカル リソース マネージャーの 2 つの部分に大まかに分かれています。ローカル リソース マネージャーは、多くの場合、データベースによって実装されます。たとえば、Oracle、MySQL、およびその他のデータベースはすべて XA インターフェイスを実装しており、トランザクション マネージャーはグローバル スケジューラとして各ローカル リソースのコミットとロールバックを担当します。

分散トランザクションを実装する XA の原則は次のとおりです。

要約する

2 フェーズ コミットはアトミック操作を提供するように見えますが、いくつかの欠点があります。

  • 同期ブロッキング問題: 実行プロセス中、参加しているすべてのノードはトランザクション ブロッキング タイプです。参加者がパブリック リソースを占有する場合、他のサードパーティ ノードがパブリック リソースにアクセスできないようにブロックする必要があります。
  • 単一障害点: (トランザクション マネージャー) コーディネーターの重要性により、コーディネーターに障害が発生すると、 (ローカル リソース マネージャー) 参加者は無期限にブロックされます。特に第 2 フェーズでは、コーディネーターが失敗すると、すべての参加者がトランザクション リソースをロックした状態のままになり、トランザクション操作を完了し続けることができません。 (コーディネーターが失敗した場合、新しいコーディネーターが再選されますが、コーディネーターの失敗により参加者がブロックされる問題は解決されません。)
  • データの不整合: 2 フェーズ コミットのフェーズ 2 では、コーディネーターが参加者にコミット要求を送信した後、ローカル ネットワークの異常が発生するか、コミット要求の送信プロセス中にコーディネーターが失敗し、その結果、一部の参加者のみがコミット要求を受信することになります。コミット要求を受信すると、これらの参加者はコミット操作を実行します。ただし、コミット要求を受信して​​いない他のマシンはトランザクションのコミットを実行できません。その結果、分散システム全体でデータの不整合が発生しました。
  • 第 2 フェーズで解決できない問題: 参加者がコミット メッセージを送信した後にクラッシュし、このメッセージを受信した唯一のコーディネーターも同時にクラッシュします。その後、コーディネーターが選挙プロトコルを通じて新しいコーディネーターを生成したとしても、このトランザクションのステータスは不確実であり、トランザクションが送信されたかどうかは誰にもわかりません。

2. 3相コミット(3PC)

3PC は実際には 2PC に基づいて CanCommit ステージを追加します。これは 2PC のバリエーションであり、タイムアウト メカニズムを導入します。トランザクション参加者がコーディネータからのコミット要求を受信できない場合、自動的にローカル コミットが実行され、コーディネータの単一障害点の問題が効果的に解決されます。ただし、パフォーマンスとデータの一貫性の問題は根本的に解決されていません。

3PCはCanCommit、PreCommit、DoCommitの3つの段階に分かれています。

CanCommit ステージ

これは 2PC の準備フェーズと非常によく似ています。コーディネーターは参加者にコミット要求を送信し、参加者は送信できる場合は Yes 応答を返し、そうでない場合は No 応答を返します。

  • トランザクションの照会: コーディネーターは参加者に CanCommit リクエストを送信します。トランザクションのコミット操作を実行できるかどうかを尋ねます。参加者の反応を待ちます
  • 応答フィードバック: 参加者が CanCommit 要求を受信した後、通常の状況では、トランザクションが正常に実行できると判断した場合は、Yes 応答を返し、準備完了状態になります。それ以外の場合はNoを返す

事前コミットフェーズ

コーディネーターは、参加者の応答に基づいて、トランザクションの PreCommit 操作を実行するかどうかを決定します。応答に応じて、次の 2 つの可能性があります。

  • コーディネーターがすべての参加者から Yes 応答を受け取った場合、トランザクションが実行されます。
  • 事前コミット要求を送信する: コーディネーターは参加者に PreCommit 要求を送信し、準備フェーズに入ります。
  • トランザクションの事前コミット: PreCommit 要求を受信した後、参加者はトランザクション操作を実行し、元に戻す情報とやり直し情報をトランザクション ログに記録します。
  • 応答フィードバック: 参加者がトランザクション操作を正常に実行すると、ACK 応答が返され、参加者は最終指示の待機を開始します。
  • いずれかの参加者がコーディネータに「いいえ」応答を送信した場合、待機時間がタイムアウトした場合、またはコーディネータが参加者からの応答を受信しなかった場合、トランザクションは中断されます。
  • 中止要求を送信する: コーディネーターはすべての参加者に中止要求を送信します。
  • トランザクションの中断: 参加者がコーディネータから中止要求を受信した後 (またはタイムアウト後もコーディネータからの要求を受信しない場合)、トランザクションは中断されます。

doCommitフェーズ

このフェーズは実際のトランザクションをコミットするために使用され、次の 2 つの状況に分けることができます。

  • 実行 送信
  • コミット要求を送信します。コーディネーションは、参加者から送信された ACK 応答を受信すると、コミット前状態からコミット状態に入ります。そして、すべての参加者に doCommit リクエストを送信します。
  • トランザクションのコミット: doCommit 要求を受信した後、参加者は正式なトランザクションのコミットを実行し、トランザクションのコミットが完了した後にすべてのトランザクション リソースを解放します。
  • 応答フィードバック: トランザクションがコミットされると、ACK 応答がコーディネータに送信されます。
  • トランザクションを完了する: コーディネーターがすべての参加者から ACK 応答を受信すると、トランザクションが完了します。
  • トランザクションの中断
  • コーディネータが参加者から送信された ACK 応答を受信しない場合 (受信者が ACK 応答を送信しなかったか、応答がタイムアウトした可能性があります)、トランザクションは中断されます。
  • 中止要求を送信: コーディネータはすべての参加者に中止要求を送信します
  • トランザクション ロールバック: 中止要求を受信した後、参加者はフェーズ 2 で記録された元に戻す情報を使用してトランザクション ロールバック操作を実行し、ロールバックが完了したらすべてのトランザクション リソースを解放します。
  • フィードバック結果: 参加者がトランザクションのロールバックを完了すると、コーディネータに ACK メッセージを送信します。
  • トランザクションを中断する: コーディネータは参加者からフィードバックされた ACK メッセージを受信すると、トランザクションを中断します。

概略図は以下のとおりです。

要約する

2PC と比較すると、3PC はコーディネータと参加者の両方にタイムアウトを設定しますが、2PC ではコーディネータのみにタイムアウト メカニズムがあります。この最適化により、参加者が独自のタイムアウト メカニズムを持ち、タイムアウト後にリソースを解放するためのローカル コミットを自動的に行うため、参加者がコーディネーター ノードと長時間通信できない場合にリソースを解放できないという問題が解決されます。このメカニズムにより、トランザクション全体のブロック時間と範囲も間接的に削減されます。しかし、データの一貫性の問題はまだ解決されていません。つまり、参加者がPreCommitリクエストを受信して​​最終指示を待つときに、コーディネーターがこの時点で参加者と正常に通信できない場合、参加者はトランザクションを送信し続け、データの不整合が発生します。

3. 補償取引(TCC)

TCC (Try-Confirm-Cancel) は補償取引とも呼ばれます。実際のところ、これは 2PC や 3PC と同様に、分散トランザクションの単なる実装です。これは 3 つの操作に分かれています。

  • 試行フェーズ: 主にビジネス システムをテストし、リソースを予約します。
  • 確認フェーズ: 業務遂行の実行を確認します。
  • キャンセルステージ: ビジネス操作をキャンセルします。

TCC トランザクションの処理フローは 2PC 2 フェーズ コミットの処理フローと似ていますが、2PC は通常 DB レベルであるのに対し、TCC は基本的にアプリケーション レベルの 2PC であり、ビジネス ロジックを通じて実装する必要があります。その利点は、アプリケーション自体がデータベース操作の粒度を定義できるため、ロックの競合と送信スループットが削減されることです。

ただし、これはアプリケーションに非常に影響を及ぼし、ビジネス ロジックの各ブランチで、試行、確認、キャンセルの 3 つの操作を実装する必要があります。

TCC の回路図は次のとおりです。

4. メッセージトランザクション + 最終的な一貫性

いわゆるメッセージ トランザクションは、メッセージ ミドルウェアに基づく 2 フェーズ コミットです。本質的には、ミドルウェアの特別な使用法です。ローカル トランザクションとメッセージ送信を分散トランザクションに配置して、ローカル操作が成功し、外部メッセージ送信が成功するか、または両方が失敗することを保証します。オープンソースの RocketMQ はこの機能をサポートしています。具体的な原則は次のとおりです。

手順は次のとおりです。

  1. サービス A は、メッセージ ミドルウェアに準備メッセージを送信します。
  2. メッセージ ミドルウェアは準備されたメッセージを保存し、成功を返します。
  3. サービス A はローカル トランザクションを実行します。
  4. サービス A はメッセージ ミドルウェアにコミット メッセージを送信し、サービス B はメッセージを受信した後にローカル トランザクションを実行します。

メッセージ ミドルウェアに基づく 2 フェーズ コミットは、同時実行性の高いシナリオでよく使用されます。分散トランザクションをメッセージ トランザクション (サービス A のローカル操作 + メッセージの送信) + サービス B のローカル操作に分割します。サービス B の操作はメッセージによって実行されます。メッセージ トランザクションが成功する限り、サービス A は成功し、メッセージが送信される必要があります。このとき、サービス B はローカル操作を実行するためのメッセージを受信します。ローカル操作が失敗した場合、サービス B の操作が成功するまでメッセージは再送信されます。このようにして、A と B の分散トランザクションが偽装されて実現されます。

上記の手順では異常な状況が発生する可能性があり、現在分析中です。

  • ステップ 1 でエラーが発生すると、トランザクション全体が失敗し、サービス A のローカル操作は実行されません。
  • ステップ 2 でエラーが発生すると、トランザクション全体が失敗し、サービス A のローカル操作は実行されません。
  • ステップ 3 でエラーが発生します。準備されたメッセージをロールバックする必要があります。サービス A は、メッセージ ミドルウェアのコールバック インターフェイスを実装します。メッセージ ミドルウェアは、コールバック インターフェイスを継続的に実行して、サービス A のトランザクションが正常に実行されたかどうかを確認します。失敗した場合、準備されたメッセージはロールバックされます。
  • ステップ 4 でエラーが発生します。この時点では、サービス A のローカル トランザクションは成功していますが、メッセージ ミドルウェアをロールバックする必要はありません。実際、コールバック インターフェイスを通じて、メッセージ ミドルウェアはサービス A が正常に実行されたことを確認できます。現時点では、サービスはコミット メッセージを送信する必要はありません。メッセージ ミドルウェアはメッセージを単独で送信できるため、メッセージ トランザクション全体が完了します。

<<:  エッジコンピューティングはネットワーク攻撃対象領域を拡大させる可能性がある

>>:  クラウド2.0時代のクラウドコンピューティング大手間の競争は加速している

推薦する

IDC: パブリッククラウドのIaaSとPaaSの収益は2025年に4,000億ドルを超える

業界データIDC は、パブリック クラウド IaaS および PaaS 市場の総収益が 2021 年...

タオバオストアの譲渡が解禁へ:まずは離婚による譲渡と死亡時の相続がテストされる

「離婚譲渡」と「死亡相続」がまず試される譲渡禁止の解除には法的承認が前提条件となる。来週、タオバオは...

ウェブサイト構造の最適化とユーザーエクスペリエンスの関係の分析

現在、インターネット上で議論されるユーザーエクスペリエンスは、コンテンツと外部リンクの2つの観点から...

Kafka はなぜこんなに速いのでしょうか?

システム設計では、メッセージ ミドルウェアは、サービスを非同期にしたり、システムを分離したり、トラフ...

海外VPSレンタルはどれが良いですか?海外VPSの使用経験10年についてみんなとチャットするだけ

VPSレンタル事業者は多すぎて、初心者がそれを見分けるのは本当に難しいです。海外の VPS をレンタ...

2018年上半期の中国モバイルインターネット業界レポート!

2018年上半期、中国のモバイルインターネットユーザートラフィックの成長は鈍化しました。同時に、1人...

2019 年にクラウド コンピューティング サービスを比較する際に尋ねるべき 6 つの質問

今日では、企業は基本的にクラウド コンピューティングを通じてあらゆるビジネス目標を達成できると言って...

広告業界関係者によると、追跡クッキーは最長5年間保存される可能性がある

北京時間4月28日、海外メディアの報道によると、ブリリグ広告市場の副社長ポール・チミノ氏は、追跡機能...

IT サービス管理を強化し、IT 主導のビジネスを促進 - Zhongyi Technology が EVO-ITSM3.0 をリリース

[51CTO.com からのオリジナル記事] IT サービス管理システムは、企業の統合運用を確実にす...

百度、今日頭条、広東通など5大チャンネルの詳しい説明

チャネルに精通しているということは、宣伝する製品に適したチャネルを選択できるかどうかを意味します。ま...

Amazon Elasticsearch Service の紹介

Amazon Elasticsearch Service を使用すると、ログ分析、全文検索、アプリケ...

分散トランザクションに関する面接で必ず聞くべき知識ポイント!

[[433051]]友人のほとんどは、面接官が面接中に投げかけた表面的な質問にしか答えないと思います...

ウェブサイト運営:ターゲットユーザーはどこにいるのか?

宝くじサイトの存在の根本的な理由と意義はユーザーです。宝くじサイトのターゲットユーザーグループを獲得...

ネットワーク仮想化 VXLAN ネットワーク アーキテクチャ

VXLAN は NVO3 のネットワーク仮想化技術です。元のホストから UDP で送信されたデータ ...

分散コンピューティング時代のデータセンターを保護するための 8 つのステップ

今日の情報セキュリティがビジネスと IT のスピードに追いつけないのは周知の事実です。データ センタ...