史上最も包括的な分散データベースの概要

史上最も包括的な分散データベースの概要

[[331009]]

1. はじめに

従来のデータベース技術の成熟度が高まり、コンピュータ ネットワーク技術が急速に発展し、その適用範囲が拡大するにつれて、データベース アプリケーションは一般的にコンピュータ ネットワーク上に構築されるようになりました。現時点では、集中型データベース システムには欠点があります。データは実際のニーズに応じてネットワーク上に分散されて保存されており、集中処理では必然的に通信オーバーヘッドが大きくなってしまいます。アプリケーションプログラムが 1 台のコンピュータに集中しており、そのコンピュータに障害が発生するとシステム全体に影響が及び、信頼性が高くありません。集中処理では、システムの規模と構成に柔軟性がなくなり、システムのスケーラビリティが低下します。このような状況下で、集中型 DB の「集中コンピューティング」という概念は、「分散コンピューティング」という概念へと発展しました。分散コンピューティングは、主にクライアント/サーバー モデルと分散データベース アーキテクチャという 2 つの側面に反映されます。

2. 分散データベースシステムの概要

伝統的なデータベース技術が成熟するにつれて、コンピュータネットワーク技術が急速に発展し、その適用範囲が拡大し、分散を主な特徴とするデータベースシステムの研究開発が注目を集めています。分散データベースは、データベース技術とネットワーク技術の組み合わせの産物であり、データベース分野の一分野を形成しています。分散データベースの研究は 1970 年代半ばに始まりました。世界初の分散データベース システム SDD-1 は、1979 年に Computer Corporation of America (CCA) によって DEC コンピュータに実装されました。1990 年代以降、分散データベース システムは商用アプリケーションの段階に入りました。従来のリレーショナル データベース製品は、コンピュータ ネットワークとマルチタスク オペレーティング システムを中核とする分散データベース製品へと発展しました。同時に、分散データベースは徐々にクライアント/サーバー モデルへと進化してきました。

3. DDBS(分散データベースシステム)の分類

(1)同種DDBS:すべてのサイトで同じタイプのデータモデル(たとえば、すべてがリレーショナル)と同じタイプのDBMSを使用します。

(2)同種DDBS:各サイトは同じタイプのデータモデルを使用しますが、DBMSモデルはDB2、ORACLE、SYBASE、SQL Serverなど異なります。

(3)異種DDBS:異なるサイトのデータモデルは、モデルもタイプも異なります。コンピュータ ネットワーク技術の発展により、異機種マシンのネットワーク化の問題は十分に解決されました。このとき、異種 DDBS を使用して、ネットワーク全体のさまざまな異種ローカル ライブラリにデータを保存およびアクセスできます。

4. DDBSの特徴、利点、欠点

DDBS の基本機能:

(1)物理的な分散:データは1か所に保存されるのではなく、コンピュータネットワーク上の複数の場所に保存されます。

(2)論理的整合性:データは物理的には複数のサイトに分散されているが、論理的には一体となっている。すべてのユーザー(グローバル ユーザー)で共有され、DDBMS によって一元的に管理されます。

(3)サイトの自律性:各サイトのデータは、サイトのアプリケーション(ローカルアプリケーション)を完了するための自律的な処理機能を備えたローカルDBMSによって管理されます。

(4)会場間の連携:各会場は高い自治権を持ちながらも、互いに連携し全体を形成している。

DDBSのその他の機能

(1)データの独立性

(2)中央集権と自律性を組み合わせた制御機構

(3)データの冗長性を適切に高める

(4)取引管理の分散

DDBSの利点

(1)柔軟なアーキテクチャ

(2)分散型管理統制組織への適応

(3)優れた経済パフォーマンス

(4)高いシステム信頼性と優れた可用性

(5)ローカルアプリケーションの応答速度が速い

(5)優れた拡張性と既存システムとの容易な統合

DDBSの欠点

(1)システムオーバーヘッドは、主に通信部分で比較的大きい。

(2)複雑なアクセス構造(補助索引やファイルリンク技術など)は、集中型DBSにおける効率的なデータアクセスのための重要な技術であるが、分散型システムでは効果的でない可能性がある。

(3)データのセキュリティと機密性の取り扱いが難しい。

[[331010]]

5. データシャーディング

タイプ:

(1)水平シャーディング:特定の条件に従って、グローバルリレーションのすべてのタプルを複数の重複しないサブセットに分割し、各サブセットはリレーションのフラグメントです。

(2)垂直シャーディング:グローバルリレーションの属性セットを複数のサブセットに分割し、これらのサブセットに対して射影演算を実行する。各突起は垂直シャードと呼ばれます。

(3)エクスポートシャーディング:エクスポート水平シャーディングとも呼ばれ、水平シャーディングの条件はこの関係の属性の条件ではなく、他の関係属性の条件です。

(4)ハイブリッドシャーディング:上記3つの方法を組み合わせたもの。最初に水平にシャーディングしてから垂直にシャーディングすることも、最初に垂直にシャーディングしてから水平にシャーディングすることも、その他の方法でシャーディングすることもできますが、結果は異なります。

状態:

(1)完全性条件:グローバルリレーションのすべてのデータはフラグメントにマッピングされなければならず、グローバルリレーションに属しているがそのフラグメントのいずれにも属さないデータを持つことは許可されない。

(2)再構築条件:同一のグローバル関係の断片からグローバル関係を再構築できることが保証されなければならない。水平シャーディングの場合、結合操作を使用してグローバル関係を再構築できます。垂直シャーディングの場合、結合操作を使用してグローバル関係を再構築できます。

(3)非交差条件:グローバルリレーションシップを分割した後に得られるデータフラグメントが互いに重複しないことを要求する(垂直シャーディングの主キーを除く)。

6. データ配信方法

(1)集中化:すべてのデータ断片が同じ場所に配置されます。

(2)パーティション化:すべてのデータのコピーは1つだけ存在し、複数の論理フラグメントに分割され、各論理フラグメントは特定の場所に割り当てられます。

(4)完全複製:データは各場所に繰り返し保存されます。つまり、各サイトにはデータの完全なコピーが存在します。

(5)ハイブリッド:分割型と完全複製型の中間の分散方式です。

7. 建築

  • データ シャーディングとデータ分散の概念を分離することで、「独立したデータ分散」という概念が形成されます。
  • データの冗長性の明示的な制御。分散モードでは各サイトのデータの分散が明確に表示されるため、システム管理が容易になります。
  • ローカル DBMS の独立性。この機能は「ローカル マッピングの透明性」とも呼ばれます。この機能により、ローカル DBMS 固有のデータ モデルを考慮せずに、DDB 管理に関連する問題を調査できます。

8. 分散データベース管理システム

  • ユーザー要求を受け入れ、その要求をどこに送信するか、または要求を満たすためにどのコンピューターにアクセスする必要があるかを決定します。
  • ネットワーク データ ディクショナリにアクセスして、そこに含まれる情報を要求および使用する方法を学習します。
  • 対象データがシステム内の複数のコンピュータに保存されている場合は、分散処理を行う必要があります。
  • 通信インターフェース機能。ユーザー、ローカル DBMS、および他のコンピュータ上の DBMS 間の調整。
  • 異機種分散処理環境では、データとプロセスの移行のサポートも必要です。ここでの異質性とは、各サイトのハードウェアとソフトウェアの違いを指します。

IX.まとめ

(1)「分散コンピューティング」という概念は、集中型DBSの枠組みを打ち破ります。データ分散によりシステムは分散 DB へと移行し、機能分散によりシステムは C/S へと移行します。これらは DBS の 2 つの開発です。

(2)C/Sシステムは、通常、ローカルエリアネットワークによって接続されたコンピュータネットワークで構成される。ほとんどの場合、クライアントはマイクロコンピュータです。サーバーはミニコンピュータやメインフレームである場合もありますが、ほとんどの場合、マイクロコンピュータやハイエンドのマイクロコンピュータも使用されます。アプリケーションはクライアント上で処理され、DBMS と OS のデータ管理はサーバー上に置かれます。

(3)C/S構造は2層、3層から多層へと進化した。一般的な傾向としては、クライアントをより薄くし、ブラウザに似たものにすることです。サーバーの種類も増え、システムの構築も容易になりました。

(4)C/Sシステムはアプリケーションをユーザーに近づけ、より優れたパフォーマンスとより複雑なインターフェースをユーザーに提供します。

(5)集中型システムをベースに開発された分散型システム。 DDB は、データベース テクノロジとネットワーク テクノロジを組み合わせた製品です。コンピュータネットワーク技術の急速な発展に伴い、DDBS はデータベース分野の主流になりつつあります。

(6)DDBはデータ分散と論理整合性の特性を持つ。 DDBS は、複数のサイトを含むグローバル アプリケーションをサポートできます。 DDB には、データ シャーディングとデータ分散という 2 つのデータ ストレージ戦略があります。

(7)DDBスキーマ構造はDDBSを理解するための共通の概念構造を提供します。流通の透明性は DDBS が追求する目標です。 DDBMS は、分散環境における論理的に統合されたデータのアクセス、一貫性、有効性、完全性を管理するソフトウェア システムです。

(8)DDBSでは、データはさまざまなサイトに分散されており、システムの最も重要なパフォーマンス目標は、ネットワーク内で情報が送信される回数と送信されるデータの量を最小限に抑えることです。セミ結合ベースの最適化戦略は、分散クエリでよく使用される手法です。

(9)同時実行制御と回復に関しては、集中型DBMS環境では発生しない多くの問題がDDBMS環境で発生します。分散同時実行制御には、プライマリ サイト方式とプライマリ コピー方式が含まれ、バックアップ サイト テクノロジによって補完されます。

<<:  仮想デスクトップ GPU カード: AMD と Nvidia の比較

>>:  NutanixとKylin Softwareが協力し、中国企業のクラウド化を支援

推薦する

Baidu でウェブサイトを復元した私の体験

多くのウェブマスターのトラフィックの大部分は検索エンジンから来ていると思います。もちろん、一部のウェ...

分散タスクキューCeleryの実践

[[432209]]最近の仕事でセロリに出会いました。これは、Github で 18,000 個のス...

ダウンロードサイトの展開とプロモーションに関する簡単な説明

今日、「張家界オンライン」というキーワードを使って、百度における「張家界オンライン」のゲームプロモー...

クモがウェブサイトの橋を架けるようになる

スパイダーは最適化担当者にとっての「マスコット」のようなものであり、スパイダーを引き付けて Web ...

クラウド コンピューティングの後半: 勝者は誰か?

クラウドコンピューティングの前半がインターネット業界の戦いであったとすれば、後半は政府関係などの伝統...

Host1plus - 2019年4月のフルサイトプロモーションクーポンコード(仮想ホストとVPSを含む)

host1plus.com の 4 月の定期プロモーション クーポン コードが公開されました。VPS...

Realhost: 安価な KVM 仮想 VPS を提供するウクライナのホスティング プロバイダー

ウクライナの商人である realhost は、ドメイン名、仮想ホスト、VPS、ビジネス メールボック...

クラウド戦略を再検討し、調整する時期が来ています

私たちの生活は、個人的にも職業的にも、COVID-19パンデミックの影響を受けています。レストランな...

ニュース記事が含まれない理由についての簡単な説明

ニュース記事が含まれない理由についての簡単な説明社内の最適化担当者として、最近多くの編集者から、なぜ...

Baidu のハイパーリンク不正アルゴリズムから見る検索エンジンの価値

情報の検索と取得は、ほとんどのネットユーザーにとって徐々に重要なオンライン行動になってきています。個...

ウェブマスター、Vanclから学んだ運用上の欠点について考えてみましょう

Vancl(別名VANCL)は、Joyo.comの創設者であるChen Nianの傑作です。 Van...

ソフトコピーマーケティング: 強力なマーケティングテンプレート

コダックのチーフ ブロガーであるジェニー シズニー氏は、同社の「1000 ワード ブログ」に投稿した...

人間と機械の戦いの裏側:Google の人工知能はクラウド コンピューティングを売るための単なる仕掛けなのか?

5分36秒後、人類は敗北を認めた。それから3年も経たないうちに、Googleの親会社Alphabet...

Weiboプロモーションとトラフィック生成のためのテクニックと戦略

ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービスWeibo は、Weix...