この記事は、書籍『ビッグデータの時代』の第 7 章「リスク」の内容に基づいた著者の見解をまとめたものです。ここで、本書の著者である Viktor Mayer-Schönberger 氏と Kenneth Cukier 氏に敬意を表したいと思います。 2012年以降、ビッグデータがもたらす悪影響について多くの議論がなされてきましたので、今回は少し古い内容になりますがご容赦ください。 今日の話題は、わずか 2 週間で全世界で 8 億ドルの興行収入を記録した「ワイルド・スピード ICE BREAK」から始まります。もちろん、ここで話題にしているのは車や美女のことではなく、映画に登場する万能の「スカイ アイ」です。この優れたシステムは、地球上のあらゆるデバイスで生成されたビデオ、画像、音声を呼び出すことができ、検索したい人や物を見つけられるようにします。ビッグデータ時代では、「スカイアイ」が可能になりました。同時に、スカイアイもウイルスに侵入されて意思決定を誤る可能性もあります。 どこにでもある「空の目」 あなたのデータは本当に安全ですか?ここでの安全とは、失われないことと見られないことの 2 つの意味があります。当社では、AWS、Alibaba Cloud、Baidu Cloud などを使用して独自のデータを保存したり、複数のバックアップを使用して独自のデータをバックアップしたりできますが、お客様が生成したデータが検出されないことを保証することはできません。コンピューティング能力の向上とデータ保存コストの低下により、個人データをさらに収集して使用したいという人々の意欲が刺激されています。インターネット時代に私たちのプライバシーが脅かされているとすれば、ビッグデータ時代にはこの脅威はさらに深刻になっています。これはビッグデータの悪影響の一つです。 Google、Amazon、Netflix などの巨大企業はデータの機密性を維持すると主張していますが、これは実際にはすべてを知っていることを示しています。一例を挙げると、2006 年 10 月に Netflix は「Netflix Pruze」というアルゴリズム コンテストを開催しました。著者は著書「Demand」の中で、ユーザーのニーズを探るこの古典的なアプローチを高く評価しています。しかし、Netflix はデータを慎重に匿名化していたにもかかわらず、最終的には米国中西部に住む「Anonymous」という偽名で同性愛者であることを隠しているレズビアンの母親から訴訟を起こされました。現在、このアルゴリズムはさまざまな電子商取引プラットフォームで広く使用されており、「推奨」、「好みを推測」、「何度も見る」などの形で偽装されています。 ビッグデータの時代では、私たちのデータはあらゆる場所で公開されています。すでに多くの人がプライバシーが脅かされていると感じています。ビッグデータがさらに普及すると、状況はさらに想像を絶するものになるでしょう。 データ障害 曹操の軍隊は何人いましたか?諸葛亮は80万人の軍隊がいると主張したが、周瑜は3万人しかいないと主張した。どちらも正しく、どちらも間違っています。これがデータの有効性です。意思決定を行う際、定量化可能なデータを取得したいと望むことがよくありますが、データの妥当性を保証する方法はありません。この問題の原因は、大まかに 2 つにまとめることができます。1 つは、人々が無意識のうちにデータを自分の好みの方向に偏らせることです。これは潜在意識に過ぎませんが、最終的には誤った結果につながります。もう 1 つは、データの計算は複数のステップから成る共同作業です。相互の推論と計算のプロセスでは、因果関係がそれほど明白でなかったり、確実でなかったりすることがよくあります。 「スモールデータ」時代からビッグデータ時代への移行の過程で、私たちは情報のいくつかの制限に細心の注意を払う必要があります。データの品質が低かったり、主観的であったり、分析エラーや誤解を招く内容が含まれていたり、さらに悪いことに、データが定量化の目的を達成していない可能性があります。 間違った意思決定 データが無効であるため、データに基づいて下した決定も無効になります。ビッグデータの悪影響は、データ自体の欠陥ではなく、ビッグデータの予測を乱用した結果です。すべての正確な予測は非現実的です。言い換えれば、ビッグデータ分析では、人が将来行う可能性のある行動を予測することしかできません。たとえば、投獄の理由、初犯の時期、年齢、性別、その他の個人データを含む多数のケース固有の変数を入力することで、保護観察対象者または仮釈放者が早期釈放された場合に再び殺人を犯すかどうかを予測できます。常識的に考えて、この確率が 100% に達することは決してないはずです。したがって、基数が十分に大きい場合、間違いは必ず発生します。 この例の主な問題は、社会がさらなる脅威に直面する必要があるということではなく、実際に犯罪を犯す前に人々を罰することによって、彼らの自由の権利を否定していることです。 一方、数え切れないほどの例が私たちに一つのことを教えてくれます。それは、優れた才能はデータに依存しないということです。アインシュタインはこう言いました。「天才とは 1% のひらめきと 99% の努力である。しかし、この 1% のひらめきは 99% の努力よりも重要である。」ある記者が、iPad を発売する前に Apple がどの程度の市場調査を行ったかと尋ねたとき、ジョブズ氏は「全く行いませんでした!」と答えたという有名な話があります。消費者には自分が何を望んでいるかを知る義務はない。 ビッグデータは私たちの生活に便利さをもたらしましたが、プライバシーを保護する法的手段を無効にしました。ビッグデータの前では、プライバシーを保護するための中核技術はもはや適用できないため、イカロスの過ちを繰り返さないために、データへの過度の依存を排除する必要があります。この哀れな男は自分の飛行技術に過信していたため、市当局の見積もりから外れ、最終的に海上で死亡した。私たちはデータの奴隷になるのではなく、データを活用する方法を学ばなければなりません。これはまた別の質問ですので、後ほど機会があれば一緒に議論しましょう。 出典: 寄稿、著者: 程暁偉 原題: ビッグデータにおけるプライバシー、失敗、エラーの苦痛 キーワード: |
<<: オンデマンドで支払わない SaaS と不正な SaaS の違いは何ですか?
>>: JavaScript ベースの DDOS 攻撃の観点から見たセーフ ブラウジング
ビリビリは2018年7月、最新の「2018年ブランドマーケティングマニュアル」を発表し、Z世代はイン...
【ニュースの背景】今年に入ってから、いくつかのショッピング割引ウェブサイトが継続的に摘発され、調査さ...
「継続的インテグレーション」に精通している方であれば、「継続的インテグレーションの使用は必須となって...
tは米国とシンガポールに登録された新しいビジネスのようで、主にKVM仮想化に基づくVPSを運営してお...
SEO 技術を勉強すると、誰もがこのような感覚を抱くでしょう。つまり、ウェブサイトのキーワードを上位...
クラウド コンピューティングの評価には、企業による詳細な計画とコスト分析が必要です。利用可能なテクノ...
長い間運営されているウェブサイトの方が、新しいウェブサイトよりも Google で上位にランクされる...
[51CTO.com からのオリジナル記事] インターネット業界の急速な発展に伴い、IT 実務家は多...
背景アフリカ大陸の急速な開拓2018年9月25日に、UCloud Lagos データセンターが設立さ...
今年のサイバーマンデーが到来し、HostCat は VPS プロモーション リストを立ち上げ、国内外...
北京時間6月6日、外国メディアの報道によると、事情に詳しい情報筋は、米国の系図ウェブサイト「Ance...
ルーマニアの著作権フリー VPS プロバイダーである Hostsolutions は、イースター ス...
「ユーザー エクスペリエンス」と「ユーザー インターフェイス」という 2 つの用語の違いがわからない...
dwidc(dwidc.com)は現在、スーパープロモーションを実施しています:(1)湖北省と浙江省...
「田舎から都市を包囲する」、政治史で試されてきたこの真理は、Pinduoduo によって商業戦争に再...