分散トランザクションとは何ですか? また、そのソリューションは何ですか?

分散トランザクションとは何ですか? また、そのソリューションは何ですか?

 

分散トランザクションとは何ですか?

回答: 大規模な操作はさまざまな小規模な操作で構成されていることを意味します。これらの小さな操作は、異なるサーバーに分散されます。分散トランザクションでは、これらの小さな操作がすべて成功するか、すべて失敗するかを保証する必要があります。本質的に、分散トランザクションは、異なるデータベース間でのデータの一貫性を確保するように設計されています。

分散トランザクションの原因は何ですか?

1 データベースシャーディング

データベースの単一テーブル内のデータが数千万に達すると、データベースとテーブルを分割して、元の 1 つのデータベースを複数のデータベースに分割することを検討する必要があります。たとえば、操作がデータベース 01 とデータベース 02 の両方を操作し、データの一貫性を保証する必要がある場合は、分散トランザクションを使用する必要があります。

2 アプリケーションSOA

いわゆる SOA はサービス指向ビジネスを意味します。たとえば、電子商取引プラットフォームで注文を行うと、在庫を減算するために在庫サービスが呼び出され、注文データを更新するために注文サービスが呼び出されます。この場合、注文データベースと在庫データベースが関係します。データの一貫性を確保するには、分散トランザクションが必要です。

要約: 実際、上記の 2 つのシナリオは、最終的には複数のデータベースを操作し、データの一貫性を確保して、分散トランザクションを生成することを目的としています。

分散トランザクションソリューション

1. 2フェーズコミット(2PC)

XA は、Tuxedo によって提案された分散トランザクション プロトコルです。 XA は、トランザクション マネージャーとローカル リソース マネージャーの 2 つの部分に大まかに分かれています。ローカル リソース マネージャーは、多くの場合、データベースによって実装されます。たとえば、Oracle、MySQL、およびその他のデータベースはすべて XA インターフェイスを実装しており、トランザクション マネージャーはグローバル スケジューラとして各ローカル リソースのコミットとロールバックを担当します。

分散トランザクションを実装する XA の原則は次のとおりです。

要約する

2 フェーズ コミットはアトミック操作を提供するように見えますが、いくつかの欠点があります。

  • 同期ブロッキング問題: 実行プロセス中、参加しているすべてのノードはトランザクション ブロッキング タイプです。参加者がパブリック リソースを占有する場合、他のサードパーティ ノードがパブリック リソースにアクセスできないようにブロックする必要があります。
  • 単一障害点: (トランザクション マネージャー) コーディネーターの重要性により、コーディネーターに障害が発生すると、 (ローカル リソース マネージャー) 参加者は無期限にブロックされます。特に第 2 フェーズでは、コーディネーターが失敗すると、すべての参加者がトランザクション リソースをロックした状態のままになり、トランザクション操作を完了し続けることができません。 (コーディネーターが失敗した場合、新しいコーディネーターが再選されますが、コーディネーターの失敗により参加者がブロックされる問題は解決されません。)
  • データの不整合: 2 フェーズ コミットのフェーズ 2 では、コーディネーターが参加者にコミット要求を送信した後、ローカル ネットワークの異常が発生するか、コミット要求の送信プロセス中にコーディネーターが失敗し、その結果、一部の参加者のみがコミット要求を受信することになります。コミット要求を受信すると、これらの参加者はコミット操作を実行します。ただし、コミット要求を受信して​​いない他のマシンはトランザクションのコミットを実行できません。その結果、分散システム全体でデータの不整合が発生しました。
  • 第 2 フェーズで解決できない問題: 参加者がコミット メッセージを送信した後にクラッシュし、このメッセージを受信した唯一のコーディネーターも同時にクラッシュします。その後、コーディネーターが選挙プロトコルを通じて新しいコーディネーターを生成したとしても、このトランザクションのステータスは不確実であり、トランザクションが送信されたかどうかは誰にもわかりません。

2. 3相コミット(3PC)

3PC は実際には 2PC に基づいて CanCommit ステージを追加します。これは 2PC のバリエーションであり、タイムアウト メカニズムを導入します。トランザクション参加者がコーディネータからのコミット要求を受信できない場合、自動的にローカル コミットが実行され、コーディネータの単一障害点の問題が効果的に解決されます。ただし、パフォーマンスとデータの一貫性の問題は根本的に解決されていません。

3PCはCanCommit、PreCommit、DoCommitの3つの段階に分かれています。

CanCommit ステージ

これは 2PC の準備フェーズと非常によく似ています。コーディネーターは参加者にコミット要求を送信し、参加者は送信できる場合は Yes 応答を返し、そうでない場合は No 応答を返します。

  • トランザクションの照会: コーディネーターは参加者に CanCommit リクエストを送信します。トランザクションのコミット操作を実行できるかどうかを尋ねます。参加者の反応を待ちます
  • 応答フィードバック: 参加者が CanCommit 要求を受信した後、通常の状況では、トランザクションが正常に実行できると判断した場合は、Yes 応答を返し、準備完了状態になります。それ以外の場合はNoを返す

事前コミットフェーズ

コーディネーターは、参加者の応答に基づいて、トランザクションの PreCommit 操作を実行するかどうかを決定します。応答に応じて、次の 2 つの可能性があります。

  • コーディネーターがすべての参加者から Yes 応答を受け取った場合、トランザクションが実行されます。
  • 事前コミット要求を送信する: コーディネーターは参加者に PreCommit 要求を送信し、準備フェーズに入ります。
  • トランザクションの事前コミット: PreCommit 要求を受信した後、参加者はトランザクション操作を実行し、元に戻す情報とやり直し情報をトランザクション ログに記録します。
  • 応答フィードバック: 参加者がトランザクション操作を正常に実行すると、ACK 応答が返され、参加者は最終指示の待機を開始します。
  • いずれかの参加者がコーディネータに「いいえ」応答を送信した場合、待機時間がタイムアウトした場合、またはコーディネータが参加者からの応答を受信しなかった場合、トランザクションは中断されます。
  • 中止要求を送信する: コーディネーターはすべての参加者に中止要求を送信します。
  • トランザクションの中断: 参加者がコーディネータから中止要求を受信した後 (またはタイムアウト後もコーディネータからの要求を受信しない場合)、トランザクションは中断されます。

doCommitフェーズ

このフェーズは実際のトランザクションをコミットするために使用され、次の 2 つの状況に分けることができます。

  • 実行 送信
  • コミット要求を送信します。コーディネーションは、参加者から送信された ACK 応答を受信すると、コミット前状態からコミット状態に入ります。そして、すべての参加者に doCommit リクエストを送信します。
  • トランザクションのコミット: doCommit 要求を受信した後、参加者は正式なトランザクションのコミットを実行し、トランザクションのコミットが完了した後にすべてのトランザクション リソースを解放します。
  • 応答フィードバック: トランザクションがコミットされると、ACK 応答がコーディネータに送信されます。
  • トランザクションを完了する: コーディネーターがすべての参加者から ACK 応答を受信すると、トランザクションが完了します。
  • トランザクションの中断
  • コーディネータが参加者から送信された ACK 応答を受信しない場合 (受信者が ACK 応答を送信しなかったか、応答がタイムアウトした可能性があります)、トランザクションは中断されます。
  • 中止要求を送信: コーディネータはすべての参加者に中止要求を送信します
  • トランザクション ロールバック: 中止要求を受信した後、参加者はフェーズ 2 で記録された元に戻す情報を使用してトランザクション ロールバック操作を実行し、ロールバックが完了したらすべてのトランザクション リソースを解放します。
  • フィードバック結果: 参加者がトランザクションのロールバックを完了すると、コーディネータに ACK メッセージを送信します。
  • トランザクションを中断する: コーディネータは参加者からフィードバックされた ACK メッセージを受信すると、トランザクションを中断します。

概略図は以下のとおりです。

要約する

2PC と比較すると、3PC はコーディネータと参加者の両方にタイムアウトを設定しますが、2PC ではコーディネータのみにタイムアウト メカニズムがあります。この最適化により、参加者が独自のタイムアウト メカニズムを持ち、タイムアウト後にリソースを解放するためのローカル コミットを自動的に行うため、参加者がコーディネーター ノードと長時間通信できない場合にリソースを解放できないという問題が解決されます。このメカニズムにより、トランザクション全体のブロック時間と範囲も間接的に削減されます。しかし、データの一貫性の問題はまだ解決されていません。つまり、参加者がPreCommitリクエストを受信して​​最終指示を待つときに、コーディネーターがこの時点で参加者と正常に通信できない場合、参加者はトランザクションを送信し続け、データの不整合が発生します。

3. 補償取引(TCC)

TCC (Try-Confirm-Cancel) は補償取引とも呼ばれます。実際のところ、これは 2PC や 3PC と同様に、分散トランザクションの単なる実装です。これは 3 つの操作に分かれています。

  • 試行フェーズ: 主にビジネス システムをテストし、リソースを予約します。
  • 確認フェーズ: 業務遂行の実行を確認します。
  • キャンセルステージ: ビジネス操作をキャンセルします。

TCC トランザクションの処理フローは 2PC 2 フェーズ コミットの処理フローと似ていますが、2PC は通常 DB レベルであるのに対し、TCC は基本的にアプリケーション レベルの 2PC であり、ビジネス ロジックを通じて実装する必要があります。その利点は、アプリケーション自体がデータベース操作の粒度を定義できるため、ロックの競合と送信スループットが削減されることです。

ただし、これはアプリケーションに非常に影響を及ぼし、ビジネス ロジックの各ブランチで、試行、確認、キャンセルの 3 つの操作を実装する必要があります。

TCC の回路図は次のとおりです。

4. メッセージトランザクション + 最終的な一貫性

いわゆるメッセージ トランザクションは、メッセージ ミドルウェアに基づく 2 フェーズ コミットです。本質的には、ミドルウェアの特別な使用法です。ローカル トランザクションとメッセージ送信を分散トランザクションに配置して、ローカル操作が成功し、外部メッセージ送信が成功するか、または両方が失敗することを保証します。オープンソースの RocketMQ はこの機能をサポートしています。具体的な原則は次のとおりです。

手順は次のとおりです。

  1. サービス A は、メッセージ ミドルウェアに準備メッセージを送信します。
  2. メッセージ ミドルウェアは準備されたメッセージを保存し、成功を返します。
  3. サービス A はローカル トランザクションを実行します。
  4. サービス A はメッセージ ミドルウェアにコミット メッセージを送信し、サービス B はメッセージを受信した後にローカル トランザクションを実行します。

メッセージ ミドルウェアに基づく 2 フェーズ コミットは、同時実行性の高いシナリオでよく使用されます。分散トランザクションをメッセージ トランザクション (サービス A のローカル操作 + メッセージの送信) + サービス B のローカル操作に分割します。サービス B の操作はメッセージによって実行されます。メッセージ トランザクションが成功する限り、サービス A は成功し、メッセージが送信される必要があります。このとき、サービス B はローカル操作を実行するためのメッセージを受信します。ローカル操作が失敗した場合、サービス B の操作が成功するまでメッセージは再送信されます。このようにして、A と B の分散トランザクションが偽装されて実現されます。

上記の手順では異常な状況が発生する可能性があり、現在分析中です。

  • ステップ 1 でエラーが発生すると、トランザクション全体が失敗し、サービス A のローカル操作は実行されません。
  • ステップ 2 でエラーが発生すると、トランザクション全体が失敗し、サービス A のローカル操作は実行されません。
  • ステップ 3 でエラーが発生します。準備されたメッセージをロールバックする必要があります。サービス A は、メッセージ ミドルウェアのコールバック インターフェイスを実装します。メッセージ ミドルウェアは、コールバック インターフェイスを継続的に実行して、サービス A のトランザクションが正常に実行されたかどうかを確認します。失敗した場合、準備されたメッセージはロールバックされます。
  • ステップ 4 でエラーが発生します。この時点では、サービス A のローカル トランザクションは成功していますが、メッセージ ミドルウェアをロールバックする必要はありません。実際、コールバック インターフェイスを通じて、メッセージ ミドルウェアはサービス A が正常に実行されたことを確認できます。現時点では、サービスはコミット メッセージを送信する必要はありません。メッセージ ミドルウェアはメッセージを単独で送信できるため、メッセージ トランザクション全体が完了します。

<<:  エッジコンピューティングはネットワーク攻撃対象領域を拡大させる可能性がある

>>:  クラウド2.0時代のクラウドコンピューティング大手間の競争は加速している

推薦する

テクノロジー分野で最も影響力のある人物トップ50:シスコのCEOが1位

テンセントテクノロジーニュース(トム)北京時間6月24日、海外メディアの報道によると、消費者向けテク...

ビッグデータ症候群

どの業界であっても、ユーザーの悩みや痛みを解決できれば、お金を稼ぐことに不安を感じることはありません...

百度のランキングメカニズムの変化を解明

今回の百度の調整で多くのウェブサイト管理者が傷ついたと思います。特定のキーワードで長年トップ3にラン...

SEO 診断の直帰率は SEO ランキングにどの程度影響しますか?

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っていますSEO は...

#BlackFriday# tmhhost: すべてのリチャージに10%のリチャージバック、日本cn2\日本ソフトバンク\韓国CN2\香港cn2\米国3ネットワークcn2、今年最低価格

tmhhost は、ブラック フライデー ゴールデン ウィーク中にスーパー プロモーションを実施しま...

NetEase、ウェブサイト提携への参入を発表

5月17日、網易は北京で記者会見を開き、ウェブサイト連合の正式発足と総額1億5000万元のウェブマス...

無料のオンラインプロモーションのための 5 つの魔法のツール

現在、多くの企業がオンラインプロモーションにおいて共通の問題に直面しています。つまり、有料のオンライ...

エンタープライズレベルのSaaS製品のチャネル戦争に勝つには、たった3つのステップで十分です

エンタープライズレベルの SaaS 製品は、プラットフォームベースのものでも、人気のある垂直分野をタ...

2019年のクラウドコンピューティング業界に期待すること

2019 年を迎えるにあたり、企業が標準的な導入を超えて、事業部門全体でクラウド コンピューティング...

レイヤー化を使用した Docker イメージの最適化

1. Dockerイメージ階層化ストレージイメージの再利用を最大限に高め、操作を高速化し、メモリとデ...

Baidu 6.22 および 6.28 の問題の詳細

百度は6月22日と6月28日の大規模な降格についてすでに公式説明をしており、皆さんも理解していると思...

激動の2012年——Baiduのルール調整と2012年のSEOの見通しについて簡単に解説

2012年ももう終わりに近づいており、年末になると不安を感じるのも無理はありません。自分を総括するの...

Cirssic-VPS 9% 割引プロモーション/512m メモリ KVM 月額支払い 3.6 米ドル

cirssic は、 LET10PERCENTという馬鹿げた 10% オフの割引コードを思いつきまし...

ハイブリッドクラウドとマルチツールの世界で秩序を維持する方法

[[343867]]組織が重要性と競争力を維持するために、デジタル変革はますます重要になっています。...