ビッグデータにおけるプライバシー、失敗、エラーの苦痛

ビッグデータにおけるプライバシー、失敗、エラーの苦痛

この記事は、書籍『ビッグデータの時代』の第 7 章「リスク」の内容に基づいた著者の見解をまとめたものです。ここで、本書の著者である Viktor Mayer-Schönberger 氏と Kenneth Cukier 氏に敬意を表したいと思います。 2012年以降、ビッグデータがもたらす悪影響について多くの議論がなされてきましたので、今回は少し古い内容になりますがご容赦ください。

今日の話題は、わずか 2 週間で全世界で 8 億ドルの興行収入を記録した「ワイルド・スピード ICE BREAK」から始まります。もちろん、ここで話題にしているのは車や美女のことではなく、映画に登場する万能の「スカイ アイ」です。この優れたシステムは、地球上のあらゆるデバイスで生成されたビデオ、画像、音声を呼び出すことができ、検索したい人や物を見つけられるようにします。ビッグデータ時代では、「スカイアイ」が可能になりました。同時に、スカイアイもウイルスに侵入されて意思決定を誤る可能性もあります。

どこにでもある「空の目」

あなたのデータは本当に安全ですか?ここでの安全とは、失われないことと見られないことの 2 つの意味があります。当社では、AWS、Alibaba Cloud、Baidu Cloud などを使用して独自のデータを保存したり、複数のバックアップを使用して独自のデータをバックアップしたりできますが、お客様が生成したデータが検出されないことを保証することはできません。コンピューティング能力の向上とデータ保存コストの低下により、個人データをさらに収集して使用したいという人々の意欲が刺激されています。インターネット時代に私たちのプライバシーが脅かされているとすれば、ビッグデータ時代にはこの脅威はさらに深刻になっています。これはビッグデータの悪影響の一つです。

Google、Amazon、Netflix などの巨大企業はデータの機密性を維持すると主張していますが、これは実際にはすべてを知っていることを示しています。一例を挙げると、2006 年 10 月に Netflix は「Netflix Pruze」というアルゴリズム コンテストを開催しました。著者は著書「Demand」の中で、ユーザーのニーズを探るこの古典的なアプローチを高く評価しています。しかし、Netflix はデータを慎重に匿名化していたにもかかわらず、最終的には米国中西部に住む「Anonymous」という偽名で同性愛者であることを隠しているレズビアンの母親から訴訟を起こされました。現在、このアルゴリズムはさまざまな電子商取引プラットフォームで広く使用されており、「推奨」、「好みを推測」、「何度も見る」などの形で偽装されています。

ビッグデータの時代では、私たちのデータはあらゆる場所で公開されています。すでに多くの人がプライバシーが脅かされていると感じています。ビッグデータがさらに普及すると、状況はさらに想像を絶するものになるでしょう。

データ障害

曹操の軍隊は何人いましたか?諸葛亮は80万人の軍隊がいると主張したが、周瑜は3万人しかいないと主張した。どちらも正しく、どちらも間違っています。これがデータの有効性です。意思決定を行う際、定量化可能なデータを取得したいと望むことがよくありますが、データの妥当性を保証する方法はありません。この問題の原因は、大まかに 2 つにまとめることができます。1 つは、人々が無意識のうちにデータを自分の好みの方向に偏らせることです。これは潜在意識に過ぎませんが、最終的には誤った結果につながります。もう 1 つは、データの計算は複数のステップから成る共同作業です。相互の推論と計算のプロセスでは、因果関係がそれほど明白でなかったり、確実でなかったりすることがよくあります。

「スモールデータ」時代からビッグデータ時代への移行の過程で、私たちは情報のいくつかの制限に細心の注意を払う必要があります。データの品質が低かったり、主観的であったり、分析エラーや誤解を招く内容が含まれていたり、さらに悪いことに、データが定量化の目的を達成していない可能性があります。

間違った意思決定

データが無効であるため、データに基づいて下した決定も無効になります。ビッグデータの悪影響は、データ自体の欠陥ではなく、ビッグデータの予測を乱用した結果です。すべての正確な予測は非現実的です。言い換えれば、ビッグデータ分析では、人が将来行う可能性のある行動を予測することしかできません。たとえば、投獄の理由、初犯の時期、年齢、性別、その他の個人データを含む多数のケース固有の変数を入力することで、保護観察対象者また​​は仮釈放者が早期釈放された場合に再び殺人を犯すかどうかを予測できます。常識的に考えて、この確率が 100% に達することは決してないはずです。したがって、基数が十分に大きい場合、間違いは必ず発生します。

この例の主な問題は、社会がさらなる脅威に直面する必要があるということではなく、実際に犯罪を犯す前に人々を罰することによって、彼らの自由の権利を否定していることです。

一方、数え切れないほどの例が私たちに一つのことを教えてくれます。それは、優れた才能はデータに依存しないということです。アインシュタインはこう言いました。「天才とは 1% のひらめきと 99% の努力である。しかし、この 1% のひらめきは 99% の努力よりも重要である。」ある記者が、iPad を発売する前に Apple がどの程度の市場調査を行ったかと尋ねたとき、ジョブズ氏は「全く行いませんでした!」と答えたという有名な話があります。消費者には自分が何を望んでいるかを知る義務はない。

ビッグデータは私たちの生活に便利さをもたらしましたが、プライバシーを保護する法的手段を無効にしました。ビッグデータの前では、プライバシーを保護するための中核技術はもはや適用できないため、イカロスの過ちを繰り返さないために、データへの過度の依存を排除​​する必要があります。この哀れな男は自分の飛行技術に過信していたため、市当局の見積もりから外れ、最終的に海上で死亡した。私たちはデータの奴隷になるのではなく、データを活用する方法を学ばなければなりません。これはまた別の質問ですので、後ほど機会があれば一緒に議論しましょう。

出典: 寄稿、著者: 程暁偉


原題: ビッグデータにおけるプライバシー、失敗、エラーの苦痛

キーワード:

<<:  オンデマンドで支払わない SaaS と不正な SaaS の違いは何ですか?

>>:  JavaScript ベースの DDOS 攻撃の観点から見たセーフ ブラウジング

推薦する

「イカゲーム」のマーケティングに失敗した人は誰ですか?

「イカゲーム」の人気に伴い、「イカ」マーケティングも開始されました。このマーケティングには失敗と成功...

IPO前に知乎を解体

「招待ありがとうございます。私は今モンゴルにいて、空母から降りたところです。」 「サークルが小さすぎ...

ウェブサイトの重量が 6.28K から 4 レコードに

2012 年 6 月 28 日は、多くのウェブマスターや SEO 実践者に深い印象を残した日でした。...

個人情報が大量に販売され、4万件の情報がわずか1000元でオンラインで購入された

董容疑者は利益を得るため、インターネットを利用して計53万2000件以上の国民の個人情報を入手し、1...

SaaS システムのユーザー権限設計の説明

クラウドコンピューティングの発展に伴い、ますます多くの企業の製品ビジネスがソフトウェア サービス プ...

boltvm-$15/年/超高I/O/512mメモリ/25g SSD/500Gトラフィック/ロサンゼルス

boltvm は、特別価格のプロモーション VPS を 3 つリリースしました。そのうち 2 つは ...

#黑5# raksmart: VPS半額、無制限のCN2サーバー、10Gbpsの帯域幅 Du Fu

Raksmart データセンターは、感謝祭とブラックフライデーに以下のプロモーションを実施しています...

ファンの数が1日で300万人以上も増加するインターネットセレブ経済から、起業家は他にどのような利益を得ることができるのでしょうか?

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています「あなたを...

アリババクラウド神龍アクセラレータエンジンがTPCx-BBで1位を獲得、2位に40%差

このほど、国際標準化試験機関TPCはビッグデータ処理性能TPCx-BB SF3000の最新ランキング...

クラウドディスクアーキテクチャのアップグレードとパフォーマンスの向上の詳細な説明

クラウド ディスクは、クラウド サーバーに可用性と信頼性が高く、永続的なランダム データ ブロック ...

究極のオンサイト最適化 - プラットフォーム検索マーケティングのROI限界を突破

検索エンジンにおける電子商取引プラットフォームのランキング、特にホームページの位置をめぐる競争は最も...

licloud: 香港サーバー、月額 34.99 ドル、e3-1230v2/8g メモリ/1T ハードディスク/30Mbps 帯域幅

licloudは現在、618年半ばのプロモーションを実施しています。香港データセンターの香港物理サー...

トラフィック詐欺は業界の評判を脅かします。広告費用の無駄を防ぐにはどうすればよいでしょうか?

データの改ざんはおそらく業界では公然の秘密だ。蔡旭坤のWeibo投稿が1億回以上転送されて以来、偽ト...

タイ VPS: datatan、タイの無制限トラフィック VPS、月額 33 ドル、4G メモリ/3 コア/60g SSD

タイのサーバー会社である Datatan は、2004 年に設立され、2009 年に正式に登録された...

サークルを抜け出したビリビリの新たなジレンマ

「あなたが興味を持っている動画はすべてビリビリにあります。」この文言を見たことがある人は多いと思いま...