データ流通の鍵となる技術の研究

データ流通の鍵となる技術の研究

データ循環

データ流通とは、一定の流通ルールに従って、データの供給者と需要者の間で行われる、データを対象とした行為を指します。データ循環の技術的実装には、主にデータセキュリティ、品質保証、権利と利益の分配、トレーサビリティ監査、透明性の面で多くの要件があります。

データ循環ブロックチェーンは、データ循環プロセスの安全性と効率性を確保するとともに、データのキャッシュが不要、個人のプライバシーが保護される、データの著作権が保護される、データソースが追跡可能で改ざんされないことが保証される、詐欺が効果的に抑制されるなどの利点があります。分散型コンセンサス アーキテクチャにより、データの交換と流通におけるデータの所有権が不明確になるという問題点を効果的に解決します。安全なデータ流通プラットフォームとして、データの所有権を維持しながら、信頼できる流通とデータ利用権の共有をサポートすることを目指しています。

セーフハウスはデータの循環を可能にする

UCloud Safe Houseは、データの所有権とデータ使用権の分離を真に実現し、データ循環プロセスの安全、制御可能、漏洩の防止を保証し、データの独占を打破し、データ循環を便利かつ安全にし、データの民主化を実現し、所有者の安心とユーザーの満足を実現するデータ循環プラットフォームです。

Safe Houseはブロックチェーン技術を利用して分散型ソリューションを実装し、データプロバイダー、データソース需要者、アルゴリズムプロバイダーなどを正確に接続し、さまざまな種類のアルゴリズムを集約し、データ当事者とアルゴリズム当事者として機能します。信頼できる第三者(政府、第三者組織)を利用してすべてのブロックチェーン記録を保存し、信用保証の役割を果たします。

データ循環の鍵となる技術

準同型暗号

準同型暗号は、暗号コミュニティで広く研究されている重要なトピックです。ロン・リベスト他1978 年に銀行業務を応用背景としてこの概念を提案しました。準同型暗号化とは、暗号化されたデータを処理して出力を取得し、この出力を復号化すると、その結果が、暗号化せずに元のデータを同じ方法で処理して得られた出力と一致することを指します。

データ循環プロセス中の委託コンピューティングのシナリオでは、データ保有者自身のコンピューティング能力には限界があり、大規模なデータ統計分析と計算を第三者に委託する必要がありますが、データは第三者に開示できません。したがって、機密データは暗号化して保護する必要があります。準同型暗号化テクノロジを使用した委任コンピューティング シナリオには、データ保持者とデータ処理者という 2 種類の役割が関係します。技術ソリューションの図を以下に示します。

データ所有者は元のデータを所有し、保護する必要がある機密属性を選択します。ローカルで公開鍵と秘密鍵のペアを生成した後、生成されたユーザー公開鍵を使用して、元のデータ内の機密属性を準同型暗号化し、暗号文ファイルを取得します。その後、データ保有者は暗号文ファイルをデータプロセッサに送信します。データプロセッサは暗号文ファイルに対して準同型演算を実行し、平文データ情報を知らなくても暗号文の統計結果を生成します。この結果は、平文状態を直接暗号化することによって得られた処理結果と一致しています。データプロセッサは暗号文の統計結果を取得した後、それをデータ保有者に返します。データ保有者は、処理された暗号文の統計結果を受け取り、ユーザーの秘密鍵を使用して復号化し、平文の統計結果を取得します。

ゼロ知識証明

分散型台帳では、グループコンセンサス機能が満たされている必要があります。つまり、すべての当事者がコンセンサスメカニズムを通じてデータの正当性を確認し、個人または組織のプライバシーデータを含むすべてのデータがすべての当事者に対して透明で可視であるという前提があるため、コンセンサスデータを処理する必要があります。ゼロ知識証明は、データの正当性に関する暗黙の合意を強化し、検証者がデータの具体的な内容を知らなくても、その内容が有効または合法かどうかを確認できるようにします。アプリケーションには、トランザクションの有効性証明、サプライチェーンファイナンス、データの偽造防止およびトレーサビリティなどが含まれます。

データ循環プロセス中の分散型財務データ共有シナリオでは、各企業の財務データがチェーン上に保存されるため、組織間での標準的な財務記録が可能になり、財務報告が改善され、監査コストが削減されます。分散された財務データ記録に基づいて、特定の標準に従って従来のシステムと相互運用可能であり、財務報告から監査までのすべてのプロセスを改善できます。

技術ソリューションの図は次のとおりです。

分散型台帳では、企業は貸借対照表や税額などの財務データを暗号化してチェーン上に保存し、ゼロ知識証明πを生成する必要があります。 π は次のことを証明できます: 貸借対照表の総資産と負債および所有者資本は、対応する項目の合計に等しい。企業が支払う税額は、企業の総利益に所得税率を乗じた額に等しくなります。検証者はπが成り立つかどうかを計算して検証し、検証プロセス中に企業データが漏洩することはありません。ゼロ知識証明が確立された場合、それは会社の財務データが正確で信頼できることを意味し、検証プロセスでは、データ保有会社だけがこのゼロ知識証明を生成できることを保証する必要があります。

グループ署名

グループ署名テクノロジーは、グループの任意のメンバーがグループ全体を代表して匿名でメッセージに署名し、公開で検証できるメカニズムです。クラウド環境では、ユーザーはデータの保存に CSP に依存しており、データのローカル コピーを保持していないため、データがクラウドに正しく保存されていることを確認することが特に重要です。定期的なチェックによって生じるオンラインの負担を軽減し、コンピューティング リソースを節約するために、ユーザーの代わりにアウトソーシングされたデータの整合性をチェックする TPA が導入されています。 TPA がデータのプライバシーを保護し、ユーザー データが TPA に漏洩しないことを保証できることが期待されます。

図に示すシステム モデルには、ユーザー (クライアント)、クラウド ストレージ サーバー (CS、クラウド サーバー)、クラウド コンビネーション サーバー (CCS、クラウド コンバイナ サーバー)、サード パーティ監査人 (TPA、サード パーティ監査人) の 4 つの主体が含まれます。このソリューションは、正確性、安全で効果的なユーザー失効、ビッグデータのプライバシー保護、アイデンティティのプライバシー保護、マルチユーザーの更新、認証、大規模グループのサポートなどの機能を実現できます。

リング署名

通常、リング署名方式は、キー生成、署名、および署名検証で構成されます。リング署名方式は、無条件の匿名性、正確性、偽造不可能性という特性を満たす必要があります。

クラウド サービス プロバイダーはユーザーをグループで管理します。リング署名では、署名者はユーザー グループに参加しており、これらのユーザー グループ内のユーザーがリングを形成します。リング署名が検証されると、署名者が特定の範囲のグループに属していることが示されます。リング内のユーザーが署名する場合、自分の秘密鍵とリング内の他のエンティティの公開鍵を使用して署名しますが、他のエンティティの参加は必要なく、他のエンティティの許可も必要ありません。

これは、協力に基づく他の署名よりもはるかに柔軟です。たとえば、グループ署名には他のエンティティの協力が必要であり、グループにはマネージャーが存在します。管理者の権限が大きすぎると、ユーザーの身元が漏洩する可能性があります。

差分プライバシー

差分プライバシーの基本的な考え方は、元のデータにノイズを追加したり、元のデータを変換したり、統計結果を変更したりすることでプライバシー保護を実現することです。従来のプライバシー保護モデルと比較して、差分プライバシーには次の 2 つの利点があります。

  • 攻撃者の背景知識を考慮に入れません。
  • 定量化可能なプライバシー保証を提供できる厳密な統計モデルを備えています。

プライバシー保護技術が配置されているさまざまなデータ循環リンクに応じて、差分プライバシー技術は次の 2 つのカテゴリに分類できます。

  • 集中型差分プライバシー技術。
  • ローカライズされた差分プライバシー技術。

データ収集差分保護

モバイル デバイスの性能がますます高まるにつれて、データ収集者はさまざまなユーザーにデータ収集タスクを割り当てることができるようになります。ただし、このタイプのデータ収集は、一般的に個人の行動情報に関連しています。そのため、ユーザーがデータ収集に参加すると、個人の機密情報が漏洩するリスクが必然的に生じます。

図に示すように、各ユーザーはまずデータに対してプライバシー処理を実行し、処理されたデータをデータコレクターに送信します。データ コレクターは、収集されたデータに対して統計を実行し、効果的な分析結果を取得します。データの統計分析を行う際に、個人のプライバシー情報が漏洩しないことを保証します。

データ出力差分プライバシー保護技術ソリューション

データが一般に公開されている場合や、データ自体が非常に機密性が高い場合、データがユーザーに直接出力されると、深刻なプライバシー漏洩の問題につながる可能性があります。そのため、データを出力する際に​​は差分プライバシー技術を使用してデータを保護する必要があります。図に示すように、データ利用者にデータを提供する前に、サーバーは差分技術を使用してデータセットを摂動し、ラプラスノイズまたは指数ノイズを追加して、個人のプライバシー情報が漏洩しないようにしながらデータの可用性を確保する必要があります。

プライバシー保護データ共有

データ共有における重要な問題は、共有中にユーザーデータのプライバシー漏洩をどのように回避するかということです。プライバシーを保護するデータ共有技術が登場し、その目標は、データのプライバシーを保護しながら、マイニング価値のある情報をできるだけ多く保持することです。

プライバシー保護データ共有には、データプロバイダーとデータマイニングプラットフォームの 2 つの役割があります。複数のデータプロバイダーがプライバシー保護のためにデータを処理した後、データをデータマイニングプラットフォームに出力し、そこでデータの融合、分析、マイニングが完了します。

プライバシー保護データ共有は、主にプライバシー保護データ処理と安全な環境に基づくデータ共有の 2 つの方向に分けられます。

プライバシー保護データ処理

目標は、データのプライバシーを保護しながら、できるだけ多くのデータ マイニング情報を保持することです。

安全な環境に基づくデータ共有

データ マイニング プラットフォーム上に、すべての関係者から信頼される安全なコンピューティング環境が構築されます。安全な環境により、計算に関係する機密データは出力されず、外部プロセスによって盗まれることもなくなります。各データ プロバイダーはデータを暗号化してデータ マイニング プラットフォームに送信します。データ マイニング プラットフォームはデータを安全なコンピューティング環境で復号化し、最終的にデータ分析とモデリングを実行します。

要約する

法律や規制ではビッグデータのセキュリティに関して厳しい要件が定められています。ビッグデータビジネスを展開する前に、ビッグデータの不正使用、乱用、漏洩によるリスクを回避するために、収集、送信、保管、分析、公開を含むビッグデータのライフサイクル全体を通じてビッグデータのセキュリティリスク管理を実現するための完全なビッグデータセキュリティ管理および制御システムを確立する必要があります。

準同型性、ゼロ知識証明、グループ署名、リング署名、差分プライバシー保護、プライバシー保護データ共有などは、現在、データセキュリティとデータ循環の分野における研究のホットスポットです。さまざまなテクノロジーが開発され、より多くのシナリオに応用されるようになると、実際のアプリケーション シナリオにおいてデータ循環がより大きな役割を果たすようになります。

UCloud のセーフハウス プラットフォームは、セキュリティ管理、ブロックチェーン、マルチパーティ セキュア コンピューティングに基づいており、データ所有者以外のすべての関係者に対して元のデータを非表示にします。協調コンピューティングを通じてデータを共同分析した後、需要側が求める分析結果を出力し、セキュリティを前提としたデータの流通・共有を実現します。

この記事の内容の一部は、「データ循環のための主要技術に関する白書」から引用したものです。

<<:  もう一つの CDN 革命: サーバーレス + エッジ コンピューティング

>>:  FIT2CLOUDは2018年のガートナー・クールベンダーに選出されました

推薦する

Sogou検索はWeChatの公開アカウントデータにアクセスし、公開アカウントの記事を検索できる

[要約] Sogou 検索のワイヤレス トラフィックは基本的に Tencent から発生し、80 ~...

OneDrive と Dropbox

クラウド ストレージを使用して複数のコンピューター上のファイルを同期することは、非常に基本的な効率化...

県レベルの地域装飾ウェブサイトの運営戦略の分析

多くの県級市が不動産市場に対する規制を緩和し始めたため、不動産販売は明確な回復を見せており、これは不...

ウェブサイト構築における初心者ウェブマスターの「本末転倒」な考え方の簡単な分析

現在、ウェブマスターは少数の人だけが就く職業ではなくなりました。ますます多くの仲間が私たちの陣営に加...

BuyVMはどうですか? 10Gbps帯域幅にアップグレードした後のラスベガスデータセンターVPSの評価

buyvm は、すべてのデータ センターのすべての VPS を、無制限のトラフィックで 10 Gbp...

HP ProLiant G6: パフォーマンスの向上とコスト削減

2009 年 4 月 21 日、北京の中国千年紀記念塔世紀美術館の大スクリーン ホールで、HP は ...

百度のトップ3ドライクリーニング店の長所と短所の簡単な分析

著者は現在、ドライクリーニング店のウェブサイトの最適化に取り組んでいます。初心者としては、上位にラン...

ウェブマスターはブラックハットSEOを正しく理解する必要がある

ブラックハット SEO 担当者の中には、検索エンジンのランキング アルゴリズムを深く理解し、非常に熟...

ウェブサイト分析ツールの徹底解説:訪問元統計(パート3)

関連記事:訪問者統計の「ビジネス背景」と「技術的背景」については、ウェブサイト分析ツールの詳細な説明...

企業はインターネットマーケティング業務の KPI 評価を策定すべきでしょうか?

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています多くの企業...

desivps: 米国/オランダ/インドのデータセンター、VPS は年間 6 回 IP を無料で変更できます (最低 20 ドル/年)

desivps からの最新のプロモーション メール: ロサンゼルス、オランダ、インドの KVM シリ...

BandwagonHostの返金に関する問題の説明とBandwagonHostの返金のスムーズな解決

BandwagonHost VPS は、低価格、高速、使いやすさで常に知られています。ただし、Ban...

SEOサービス見積りのための5つの基準指標と5つのレベル

多くの SEO 担当者は、自分で注文を受けたいが、見積もりの​​出し方がわからないことに気付きました...

特別おすすめ: crissic-VPS 25% オフ/お見逃しなく

Crissic が設立されてから 1 年が経ちました。最初はうまくいかなかったものの、今では評判が高...

0ping: 月額 9 ユーロ、ドイツの VPS、8G RAM/2 コア (Threadripper)/60g NVMe/20Gbps 帯域幅

0ping.eu は 2009 年に設立され、主にドイツのデータ センターで VPS ビジネスを運営...