ターゲットデータ ストレージ リソースは、システムの最も重要なコンポーネントです。特に分散分野では、データがすべてです。主な焦点は次の点にあります。
マイグレーションMySQL は、ACID トランザクションをサポートする OLTP リレーショナル データベースです。これはメインのストレージ システムであり、現在使用されているバージョンは 5.7 です。 MySQL 自体は分散システムではありません。サポートされるデータ レプリケーション テクノロジは、基本的にデータの災害復旧を目的としています。ただし、現在はマスター スレーブ レプリケーションを使用して読み取りと書き込みを分離し、単一のマシンへの読み取り負荷を軽減しています。 MySQL サービスが Alibaba Cloud でホストされている場合は、高可用性バージョン、数秒でのマスター/スレーブ切り替え、クラウド ディスクに基づくディスク拡張テクノロジを使用できます。読み取り専用ノードをすばやくコピーできるため、独自の MySQL を構築するときに発生する多くの問題を軽減できます。さらに、インデックス分析、SQL レビュー、スロー クエリ分析、動的拡張など、多くの追加機能も提供します。 クラウドホスト型 RDS は本質的には MySQL ですが、次のような多くの問題が発生する可能性があります。
クラウドホスト型 RDS は基本的に ECS + クラウド ディスクに基づいて構築されており、データの増加、バックアップ、パフォーマンス、移行、アップグレード、読み取り専用インスタンス、ディスク容量、Binlog の遅延などが依然として影響します。 では将来はどうなるのでしょうか?実際、クラウドベンダーも Alibaba Cloud の PolarDB や PolarDB-X など、クラウドネイティブ データベースやクラウドネイティブ分散データの概念を模索し、提案しています。 クラウドネイティブ データベースは、コスト、パフォーマンス、オンライン ビジネスの拡張、データ セキュリティに重点を置いています。そのコアテクノロジーには、コンピューティングとストレージの分離、物理レプリケーション、Binlog 行レプリケーション モード、共有ストレージ デバイス、RDMA 高速ネットワーク プロトコルによるストレージ間の転送などがあります。同時に、PolarDB-X はパーティショニング モードをサポートしており、ライブラリとテーブルのシャーディングの問題を解決します。 これらの革新により、同期の遅延、バックアップ、コスト、データベースとテーブルのシャーディング、パフォーマンスなど、従来の MySQL の欠点が解決されました。 将来的には、コアデータベースをクラウドネイティブデータベースに移行して、コアビジネスの安定性と拡張性を確保することができます。 OLTP 以外の業務の場合は、他のデータベースを選択して MySQL アプリケーション仕様を策定し、MySQL を使用する業務モデル、正しいインデックス設計、容量計画、SQL 文の使用仕様などを明確にすることができます。 レディスRedis は K/V データベースです。シングルスレッドのメモリ操作に基づいているため、パフォーマンスが非常に高くなります。さらに、文字列、ハッシュ、リスト、コレクションなどの豊富なデータ構造をサポートしており、幅広いアプリケーションシナリオを備えています。 AOF と RDB を通じてデータの永続性を確保し、レプリケーション テクノロジーを通じてデータをバックアップし、センチネルとパーティションを通じて高可用性と容量拡張をサポートし、LUA スクリプトを通じて複数のコマンドのトランザクション操作をサポートします。 Redis はスタンドアロン システムですが、レプリケーションとクラスタリングのテクノロジを通じて分散ストレージ システムと見なすこともできます。現在、West Fifth Street では広く使用されており、主に次の 3 種類のアプリケーションに分かれています。
Alibaba Cloud が管理する Redis コミュニティ バージョン 5.0 サービス クラスター バージョン。 アプリケーション設計にはいくつかの問題があります。
Alibaba Cloud Redis が提供するデプロイメント アーキテクチャにより、アプリケーション シナリオを適切に理解できます。
次に、Redis の使用仕様を決定し、ストレージとキャッシュのシナリオを分割し、統合された Lib パッケージに基づいてほとんどの問題を解決します。 エラスティックサーチElasticseach は、ほぼリアルタイムの分散検索エンジンおよび分析エンジンです。 検索エンジンとしては、現在オープンソース分野でナンバー 1 のデータベースです。転置インデックスに基づいて強力な検索機能を備えているため、アプリケーションでもビッグデータ分野でも非常に汎用的な分析エンジンです。 ほぼリアルタイムとは、Elasticseach のアプリケーション シナリオを理解する必要があることを意味します。 ACID をサポートしていないため、OLTP データベースにすることはできませんが、使用圧力ははるかに小さくなります。ポリシー分析、バックグラウンド アプリケーション、リアルタイム クエリなど、幅広いシナリオに対応します。 分散アプリケーションとして、レプリカ セット メカニズムを通じて高可用性の問題を解決することで、単一マシン障害の問題を解決できますが、データが誤って削除された場合は、Elasticseach のスナップショット メカニズムなどのバックアップ メカニズムが依然として必要です。 レプリカ セットの同期は最終的に一貫性に達します。書き込みパフォーマンスに関しては、プライマリ ノードは書き込みが完了するとすぐにクライアントに書き込みを返すように構成することもできます。 容量のスケーラビリティに関しては、シャーディング メカニズムを使用して、データを異なるノード上の異なるシャードに分割し、水平方向の容量スケーリングの問題を解決できます。シャードを調整する場合は、インデックスを再作成する必要があります。 パフォーマンスの面では、クエリの負荷は複数のレプリカ セット ノードによって共有されます。また、専用のトランスポート ノードを使用して、データ ノードの負荷を共有し、シャード クエリやレプリカ クエリなどのルーティングおよびマージ アクションの結果を集約することもできます。 Elasticseach は ELK ソリューションの一部であり、Filebat、Kibana、Logstash などの多くのサービスも含まれています。ビッグデータの分野でも良い方向性です。 Elasticseach は、ELK 上に構築された 3 ノードのサービスです。スケールの問題により、シャーディング技術はほとんど使用されません。コアとなるのは、記事全体のテーブルとユーザー全体のテーブルです。 検索シナリオと分析シナリオを組み合わせて、複数の MySQL テーブルが Binlog+Canal+Kafka+Go サービスを通じて大きなワイド テーブルに集約されます。大きくて幅の広い表は主に記事情報用です。一方では検索シナリオを満たし、他方では戦略およびアプリケーションのシナリオを満たします。 現在、大きな幅広のテーブルには多くのアプリケーション モードがあります。フリー スキーマ モードに基づいて、クエリ モードは非常に柔軟です。サブスクリプションを通じてデータを同期すると、アプリケーション層の負担も軽減され、データの正確性が大幅に保証されます。 今後、Elasticseach の応用に向けて、一方では不均等なデータのシャーディングやクエリパフォーマンスの最適化といったパフォーマンスチューニングを強化するとともに、一方では再インデックスやエイリアスといった機能の探求など、Elasticseach を十分に理解するといった保守性の向上も必要となります。 国内のクラウドベンダーの中で、Elasticseach に大幅なアップグレードを行ったベンダーはありません。基本的に、Elasticseach サービスをクラウドでホストするだけです。 カクファKakfa は分散型の高スループット メッセージ キューです。サブスクリプション/消費モデルは、ストレージ容量よりも高いパフォーマンスを追求します。ただし、ログ自体は再生機能を持ち、分散ストレージシステムとして捉えることもできます。 Kafka のコア機能には、分離、ピーク除去、キャッシュが含まれます。幅広い応用シナリオがあり、システムに欠かせないコンポーネントです。 分散システムであるため、高可用性と高スループットを確保するためのレプリケーションおよびパーティショニング メカニズムも備えています。セグメントを順次書き込むことで、非常に高い書き込みパフォーマンスが保証され、コンシューマ グループの概念に基づいて、コンシューマのスループット容量も水平に拡張できます。同時に、各ブローカーがクエリを担当できるため、スループットが向上します。 Kafka は、リーダー選出、負荷分散、メタ ストレージなど、Zookeeper に基づく多くの分散管理機能を提供します。 現在、Kafka の 3 ノード クラスターは ECS によって構築されており、ほぼ 1 年間稼働しています。このサービスは比較的安定しており、管理作業をほとんど必要とせずに保守可能です。多くのコア サービスではすでに Kafka キューが使用されており、元の Redis ベースのキューもできるだけ早く移行できます。 モンゴDBMongoDB は、ACID トランザクションをサポートする分散データベースを目指す分散ドキュメント データベースです。ドキュメント指向であるため、モードは非常に柔軟で、構造は緩やかであり、使用シナリオは非常に標準化されています。 MySQL と比較すると、バイナリ ストレージ モードの圧縮率は非常に高く、ストレージ コストが大幅に削減されます。同時に、WiredTiger エンジンに基づいて、さまざまな種類のインデックスを作成でき、サブドキュメントでもインデックスを作成できるため、クエリのパフォーマンスが向上します。 MongoDB は、oplog テクノロジーを通じてレプリカ セットをサポートし、パーティションもサポートします。パーティション キーはカスタマイズできます。パーティションのため、mongos ルーティング サーバーと構成サーバーが追加されます。 mongos ルーティング サーバーは、構成サーバーにクエリを実行して、ノードとパーティションにサービスを送信します。 MongoDB は、一貫性とパフォーマンスの要件をクライアントに任せ、読み取りコンセンサス、書き込みコンセンサス、読み取り優先テクノロジを通じてさまざまな柔軟性を提供します。たとえば、強力な一貫性が必要な場合は、majority を使用します。データが失われないようにする必要がある場合は、ジャーナルを true に設定します。 MongoDB 4.0 と MongoDB 4.2 は、マルチドキュメント トランザクションをサポートし、それぞれレプリカ セットとパーティション ディメンションのトランザクション特性をサポートします。ただし、使用と理解が非常に複雑であり、分散システムで学習するのが最も難しい部分である可能性があります。 これは、トランザクションを意図的に使用する必要がないことを示しています。 MongoDB を適切にモデル化し、OLTP リレーショナル データを補完することで、パフォーマンス、コスト、高可用性、スケーラビリティの面で利点が得られます。実際、MySQL では、テーブル間トランザクションやステートメント間トランザクションはほとんど使用されない為、トランザクションについてあまり迷信的にならず、適切なアプリケーション シナリオを選択してください。 MongoDB はクエリに加えて、さまざまな集計操作もサポートしており、分析分野で幅広い使用シナリオを備えている点が Elasticsearch と非常に似ています。 現在、MongoDB の 3 ノード クラスターは ECS 自体によって構築されており、ストレージ規模が小さく、使用シナリオもほとんどありません。 MySQL や Elasticsearch と比較すると、MongoDB には、分析シナリオ、トランザクション要件が低いシナリオ、比較的データの増加が大きいシナリオ (プライベート メッセージ データなど)、比較的柔軟なビジネス モデルを持つシナリオ (さまざまな条件下でのクエリや集計操作など) など、幅広いアプリケーション シナリオがまだあります。 ただし、Elasticseach と同様に、すべての主要なクラウド ベンダーは、あまり最適化を行わずに、このサービスをクラウドでホストするだけです。 |
<<: クラウドストレージ緊急訓練システムの構築とシナリオ設計
admin5.com が12月5日に報じたところによると、Baidu Webmaster Platf...
infofractal.io は 2009 年に設立され、チリの VPS、チリのサーバー、チリのクラ...
私はSEOを学んでいますが、特別なトレーニングを受けたわけではなく、すべて独学で学んできました。私自...
DevOpsとは過去 10 年間、DevOps はホットな話題となってきました。 10 人の人には ...
アマゾン ウェブ サービスは2022年9月22日、「スマートカー共創アクセラレーションプログラム」が...
急速な発展期を経て、オンライン教育は 2017 年から初期の成熟段階に入りました。市場では依然として...
Tencent Cloud の 818 プロモーションが始まり、注目に値する興味深い VPS モデル...
[概要] ウェブマスターがアプリを作成する場合、配布コストが高く、インストール率や起動率が低いなどの...
Windows RDPサービス(および住宅IP/自宅IP)を提供するdigirdpが、最近、ローエン...
「クラシック:プロメテウス-$3.8/KVM/512mメモリ/15gSSD/2Tトラフィック」は6月...
2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています今は「大衆...
Synergyは、2020年第1四半期の世界のデータセンターインフラ収益データを発表しました。クラウ...
これは、パシフィックラックのVPS事業の最初のプロモーションです。11月のゴールデンウィーク、11....
大学の学期が始まり、春でもあります。Onetechcloud は、すべての VPS を最大 20% ...
GoogleがPRを更新するたびに、多くの中小規模のウェブマスターやオンラインプロモーション担当者の...