電子アーカイブシナリオにおける分散クラスタストレージシステムの応用

電子アーカイブシナリオにおける分散クラスタストレージシステムの応用

デジタルアーカイブ管理システムの構築により、従来の閉鎖的なアーカイブ管理モデルを打破し、アーカイブ業務を手作業による管理からコンピューターによる管理へ、アーカイブ実体の管理からアーカイブ情報の管理へ、アーカイブの保管・保存から活用・サービスへと変革しました。

1. 背景

デジタルアーカイブ管理システムの構築により、従来の閉鎖的なアーカイブ管理モデルを打破し、アーカイブ業務を手作業による管理からコンピューターによる管理へ、アーカイブ実体の管理からアーカイブ情報の管理へ、アーカイブの保管・保存から活用・サービスへと変革しました。デジタル アーカイブ管理システムのオープン システムには、紙のアーカイブ、物理的なアーカイブ、画像アーカイブ、映画やテレビのアーカイブなど、アーカイブ情報の生成、収集、整理、保管、利用のプロセス全体が含まれます。異なるメディアやカテゴリの独立したアーカイブ情報を統一されたリソースライブラリに統合し、それらの相互関係を確定することで、アーカイブ管理業務の科学技術内容を高め、さまざまな企業や機関の生産と運営に安全で高品質かつ効率的な情報サービス手段を提供し、アーカイブ情報の経済的価値と社会的価値を十分に発揮させます。

[[239290]]

2. 電子アーカイブシステムのデータ保存要件の分析

(1)ストレージはグローバルなファイル共有をサポートできる必要があります。アーカイブの収集、整理、管理、利用がシームレスに接続され、すべてのビジネスサーバーが対応するアーカイブファイルへのアクセスをオンデマンドで直接共有でき、管理プロセス内の関連するアーカイブファイルにコピーや転送を必要とせずにシームレスにアクセスして管理できることが保証される必要があります。ワークフロー全体の各段階がスムーズに進行し、全体的な業務運営の効率が向上します。

(2)ストレージはより高いパフォーマンスを提供する必要がある:アーカイブ管理のビジネス開発方向の観点から見ると、アーカイブ管理はコンテンツサービスへと移行しており、アーカイブファイルのストレージプラットフォームはますます多くのアクセスと呼び出しに直面することになる。膨大なアーカイブ ファイルの内容を、より適切かつ迅速に編集、管理、取得し、アーカイブの持つ価値をフルに活用するためには、膨大なコンテンツから必要なデータを迅速に取得できる必要があります。そのためには、ストレージ システムに高いパフォーマンスが求められます。ストレージシステムのデータの読み取りおよび書き込み速度が必要なパフォーマンスを満たせない場合、アーカイブ情報プラットフォームは、サービスプラットフォームとしてより多くの人々や機関にサービスを提供することが困難になります。

(3)オンデマンドで構築され、オンラインで拡張される大容量ストレージシステム:アーカイブコンテンツの鮮明度がますます高くなり、ファイル数が増加し、保存する必要があるアーカイブアイテムの数が増えるにつれて、アーカイブシステム内のデータ量は、特に大規模なアーカイブシステムの場合、毎年徐々に増加しています。膨大な量のアーカイブデータを統一的に適切に保存・管理できず、必要に応じてオンラインで拡張できない場合、データは複数の独立したシステムに分散して保存され、集中的かつ統一的に管理できず、その後の情報プラットフォーム管理プロセスで人的資源と物的資源が大幅に浪費され、アーカイブシステムの正常な業務に影響を与えます。

(4)大量の小さなファイルを効率的にサポートする必要性:アーカイブの情報処理において、大量のアーカイブ画像ファイルはストレージシステムに多大な負担をかけます。ストレージ システムに大小のファイルが混在すると、アクセス パフォーマンスが大幅に低下し、アーカイブ情報プラットフォーム全体の効率が低下し、高速な検索アクセス サービスを提供することが困難になります。

(5)より高いデータセキュリティの必要性:ハードディスクレベルのデータセキュリティ保護では、アーカイブシステムのニーズを満たすことができなくなりました。たとえば、RAID5 では一度に 1 つのハードディスクのみが損傷を受ける可能性があり、RAID6 では同時に 2 つのハードディスクのみが損傷を受ける可能性があります。ただし、データの総量が数十 TB または数百 TB に達すると、RAID データの再構築時間が遅くなり、ハードディスクが連続して故障する可能性が高くなります。さらに、ストレージ デバイス全体が破損し、データが使用できなくなる可能性があります。

(6)法令遵守:電子アーカイブの保管・管理は、長期にわたる安全な保存を実現するとともに、アーカイブファイルの破壊につながるさまざまな事故を防止できるように、関連法令を遵守する必要があります。したがって、ストレージ システム自体には、アーカイブ ファイルの長期保存と管理に適した機能が求められます。

3. 電子アーカイブシナリオにおける分散クラスタストレージのアプリケーション特性

(1)システムは単一のファイルシステム共有ストレージプールを提供し、ファイルスライスストレージ、並列処理、パフォーマンスボトルネックなし、高い同時集約帯域幅を採用し、システム拡張に伴ってパフォーマンスが直線的に向上します。

(2)効率的なメタデータ管理とクラスタリング技術により、大量の小さなファイルに対する優れたサポートと最適化が提供され、アーカイブ画像などの小さなファイルの検索がストレスフリーになります。

(3)ユーザーの実際のニーズに応じて、サーバーを停止することなく、データ移行を必要とせずにオンラインでの水平拡張を行うことができ、すべてのメンテナンス操作はサーバーを停止することなく、業務の正常な動作に影響を与えることなく実行できます。

(4)システム内に単一障害点がなく、デバイスレベルの冗長性を実現できる。破損可能なデバイスの数は、ソリューションのニーズに応じて柔軟に調整できるため、アーカイブ業務の継続性が確保され、失われたデータや破損したデータを迅速に復元および再構築できます。これは、従来のハードディスク レベルの RAID よりも 5 ~ 10 倍高速です。

(5)複数の物理ストレージノードが1つのインターフェースを通じて統一的に管理され、ストレージリソースが均一に割り当てられ、管理インターフェースが直感的で操作しやすい。

(6)データ消去や改ざんを防止するWORM機能を内蔵しています。また、ファイルは断片的に保存されるため、ストレージデバイスを紛失した場合でもデータが漏洩しないことが保証されます。

<<:  Tencent Cloud、データ損失で1100万元の訴訟を起こされる!真実が明らかになる

>>:  仮想化後に他に何ができるでしょうか?

推薦する

ウェブサイト運営における4Pの応用に関する簡単な説明

私はウェブサイトを構築したかったので、まず ASP、MS SQL Server、Access、HTM...

privatealps: 著作権侵害の申し立てを 100% 無視、スイスのデータ センター、VPS、専用サーバーなど。

privatealps は 2009 年に設立され、著作権 (DMCA) を 100% 無視する、苦...

蘇寧がManzuo.comを買収し、Manzuoブランドは独立したままになると報じられている。

新浪科技は10月12日午前、蘇寧が国内の共同購入サイトManzuo.comの株式を取得して支配株主と...

見出しか「盗まれた」見出しか? 今日頭条は集団著作権保護を受ける可能性がある

一夜にして著作権紛争により、情報クライアント「今日頭条」は業界が注目する「見出し」となった。メディア...

ガーンター:クラウドコンピューティングはIT市場全体の25倍の速さで成長している

6月14日、市場調査会社ガートナーのニュースによると、クラウドコンピューティングは全体の成長率が25...

ビンドゥンドゥン産業チェーンの発掘

北京冬季オリンピックのマスコット「ビン・ドゥエンドゥエン」は瞬く間にトップスターとなった。冬季オリン...

Java ヒープメモリオーバーフローの概要分析

Java ベースのエンタープライズ バックエンド アプリケーションを扱ったことがあるソフトウェア開発...

Oracle Database 12c R1でハイブリッドクラウドが簡単に

7月20日、毎年恒例の業界イベント「Oracle Database Cloud Technology...

共同購入は過去のものとなりました。共同購入ウェブサイトの運営の難しさを知っている人はどれくらいいるでしょうか?

共同購入は過去のものなのでしょうか?百連隊作戦を経験し、百連隊勝利の興奮を目にしたにもかかわらず、共...

dedipath - メモリアルデー、Windows を含む VPS が 50% オフ

アメリカ版「墓参りの日」(戦没者追悼記念日)が近づいており、dedipath はすべての VPS 製...

Hyper-V を使用して仮想ラボを構築する方法

Microsoft Hyper-V はどの Windows 10 デスクトップでもすぐに利用可能であ...

51 Toutiao WeChat Moments広告アシスタントは、商店が商品を宣伝するのに役立ちます

ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービス商人はWeChatモーメ...

クラウドコンピューティングの最適化におけるよくある省略

クラウド コンピューティングの最適化という概念は、企業がクラウド コンピューティングの価値を懸念して...