ビッグデータにおけるプライバシー、失敗、エラーの苦痛

ビッグデータにおけるプライバシー、失敗、エラーの苦痛

この記事は、書籍『ビッグデータの時代』の第 7 章「リスク」の内容に基づいた著者の見解をまとめたものです。ここで、本書の著者である Viktor Mayer-Schönberger 氏と Kenneth Cukier 氏に敬意を表したいと思います。 2012年以降、ビッグデータがもたらす悪影響について多くの議論がなされてきましたので、今回は少し古い内容になりますがご容赦ください。

今日の話題は、わずか 2 週間で全世界で 8 億ドルの興行収入を記録した「ワイルド・スピード ICE BREAK」から始まります。もちろん、ここで話題にしているのは車や美女のことではなく、映画に登場する万能の「スカイ アイ」です。この優れたシステムは、地球上のあらゆるデバイスで生成されたビデオ、画像、音声を呼び出すことができ、検索したい人や物を見つけられるようにします。ビッグデータ時代では、「スカイアイ」が可能になりました。同時に、スカイアイもウイルスに侵入されて意思決定を誤る可能性もあります。

どこにでもある「空の目」

あなたのデータは本当に安全ですか?ここでの安全とは、失われないことと見られないことの 2 つの意味があります。当社では、AWS、Alibaba Cloud、Baidu Cloud などを使用して独自のデータを保存したり、複数のバックアップを使用して独自のデータをバックアップしたりできますが、お客様が生成したデータが検出されないことを保証することはできません。コンピューティング能力の向上とデータ保存コストの低下により、個人データをさらに収集して使用したいという人々の意欲が刺激されています。インターネット時代に私たちのプライバシーが脅かされているとすれば、ビッグデータ時代にはこの脅威はさらに深刻になっています。これはビッグデータの悪影響の一つです。

Google、Amazon、Netflix などの巨大企業はデータの機密性を維持すると主張していますが、これは実際にはすべてを知っていることを示しています。一例を挙げると、2006 年 10 月に Netflix は「Netflix Pruze」というアルゴリズム コンテストを開催しました。著者は著書「Demand」の中で、ユーザーのニーズを探るこの古典的なアプローチを高く評価しています。しかし、Netflix はデータを慎重に匿名化していたにもかかわらず、最終的には米国中西部に住む「Anonymous」という偽名で同性愛者であることを隠しているレズビアンの母親から訴訟を起こされました。現在、このアルゴリズムはさまざまな電子商取引プラットフォームで広く使用されており、「推奨」、「好みを推測」、「何度も見る」などの形で偽装されています。

ビッグデータの時代では、私たちのデータはあらゆる場所で公開されています。すでに多くの人がプライバシーが脅かされていると感じています。ビッグデータがさらに普及すると、状況はさらに想像を絶するものになるでしょう。

データ障害

曹操の軍隊は何人いましたか?諸葛亮は80万人の軍隊がいると主張したが、周瑜は3万人しかいないと主張した。どちらも正しく、どちらも間違っています。これがデータの有効性です。意思決定を行う際、定量化可能なデータを取得したいと望むことがよくありますが、データの妥当性を保証する方法はありません。この問題の原因は、大まかに 2 つにまとめることができます。1 つは、人々が無意識のうちにデータを自分の好みの方向に偏らせることです。これは潜在意識に過ぎませんが、最終的には誤った結果につながります。もう 1 つは、データの計算は複数のステップから成る共同作業です。相互の推論と計算のプロセスでは、因果関係がそれほど明白でなかったり、確実でなかったりすることがよくあります。

「スモールデータ」時代からビッグデータ時代への移行の過程で、私たちは情報のいくつかの制限に細心の注意を払う必要があります。データの品質が低かったり、主観的であったり、分析エラーや誤解を招く内容が含まれていたり、さらに悪いことに、データが定量化の目的を達成していない可能性があります。

間違った意思決定

データが無効であるため、データに基づいて下した決定も無効になります。ビッグデータの悪影響は、データ自体の欠陥ではなく、ビッグデータの予測を乱用した結果です。すべての正確な予測は非現実的です。言い換えれば、ビッグデータ分析では、人が将来行う可能性のある行動を予測することしかできません。たとえば、投獄の理由、初犯の時期、年齢、性別、その他の個人データを含む多数のケース固有の変数を入力することで、保護観察対象者また​​は仮釈放者が早期釈放された場合に再び殺人を犯すかどうかを予測できます。常識的に考えて、この確率が 100% に達することは決してないはずです。したがって、基数が十分に大きい場合、間違いは必ず発生します。

この例の主な問題は、社会がさらなる脅威に直面する必要があるということではなく、実際に犯罪を犯す前に人々を罰することによって、彼らの自由の権利を否定していることです。

一方、数え切れないほどの例が私たちに一つのことを教えてくれます。それは、優れた才能はデータに依存しないということです。アインシュタインはこう言いました。「天才とは 1% のひらめきと 99% の努力である。しかし、この 1% のひらめきは 99% の努力よりも重要である。」ある記者が、iPad を発売する前に Apple がどの程度の市場調査を行ったかと尋ねたとき、ジョブズ氏は「全く行いませんでした!」と答えたという有名な話があります。消費者には自分が何を望んでいるかを知る義務はない。

ビッグデータは私たちの生活に便利さをもたらしましたが、プライバシーを保護する法的手段を無効にしました。ビッグデータの前では、プライバシーを保護するための中核技術はもはや適用できないため、イカロスの過ちを繰り返さないために、データへの過度の依存を排除​​する必要があります。この哀れな男は自分の飛行技術に過信していたため、市当局の見積もりから外れ、最終的に海上で死亡した。私たちはデータの奴隷になるのではなく、データを活用する方法を学ばなければなりません。これはまた別の質問ですので、後ほど機会があれば一緒に議論しましょう。

出典: 寄稿、著者: 程暁偉


原題: ビッグデータにおけるプライバシー、失敗、エラーの苦痛

キーワード:

<<:  オンデマンドで支払わない SaaS と不正な SaaS の違いは何ですか?

>>:  JavaScript ベースの DDOS 攻撃の観点から見たセーフ ブラウジング

推薦する

WeChatサービスアカウントのグループメッセージ頻度が月4回に増加 高度なグループメッセージインターフェースがより柔軟に

WeChatサービスアカウントのグループメッセージ頻度が月4回に増加 高度なグループメソッドインター...

Goで実装された分散トランザクションフレームワーク

[[439474]]この記事はWeChatの公開アカウント「RememberGo」から転載したもので...

電子商取引プラットフォームの618アリーナ

毎年恒例の電子商取引イベント618が今年も開催されます。DouyinやKuaishouなどの新しい電...

海外のクラウドサーバーレンタル業者が推奨、価格が安く、スピードが速く、アフターサービスも充実

自分に合った海外クラウドサーバーを選ぶには?海外のクラウドサーバーベンダーは数多く存在し、その品質も...

Kubernetes Podの排除に関する詳細な説明

Kubernetes Pod が削除されるとはどういう意味ですか?これらは通常、リソース不足のために...

IBMの新しい広告はハイブリッドの新時代を切り開く

2019年、IBMはオープンソース技術のリーダーであるRed Hatを340億ドルで買収し、業界最大...

医療検索促進監視とURL標準化の矛盾

URL 標準化は、すべての SEO 担当者が知っていて簡単に理解できる概念ですが、経験豊富な SEO...

クラウドコンピューティングとエンタープライズソフトウェアが世界のIT支出増加を牽引

デジタルトランスフォーメーションが IT リーダーにとって最優先事項であるかどうか疑問に思う場合は、...

推奨: XenPower-6$/Xen/1g メモリ/120g ハードディスク/2T トラフィック/ダラス/ミラノ

Intel E5 v2 CPU、RAID10 のエンタープライズ ハード ディスク 12 台、データ...

hosteons: カスタマイズされたクーポンコード - 無料の 10Gbps 帯域幅アップグレード、およびロサンゼルスの 10Gbps 帯域幅 VPS の簡単なレビュー

Hosteons は数年の歴史があり、ロサンゼルス、ニューヨーク、ジャクソンビル、ラスベガスの 4 ...

大学における高品質なコースウェブサイト構築の2つのタイプについて

教育省が大学の授業の質に対する要求をさらに厳しくするにつれて、ますます多くのインターネット要素がカリ...

Yitao.com が Qunar.com をターゲットにオンライン旅行検索をテスト

北京ビジネスデイリー(記者 魏魏) 先ほど終結したオンライン旅行業界の「二派閥争い」が再び勃発するか...

budgetvm: 日本製サーバー、$99/e3-1230v3/16g メモリ/120gSSD+2T SATA/1Gbps 帯域幅

おそらくほとんどの人はbudgetvmを知っていると思いますが、これは古いブランドです。アメリカのe...