誰もがこんな経験をしたことがあると思います。タオバオで商品を検索すると、さまざまなスタイルが表示され、どれを購入するか選択するのが面倒な問題になります。このとき、製品の販売量が購入を選択する際の参考要素になる場合があります。このような小規模なデータ表示は日常生活で一般的であり、生活にかなりの利便性をもたらしました。想像してみてください。インターネット上の膨大な量のデータを視覚化して画像化し、一目ですべてを見ることができたら、それはなんと素晴らしい視覚の饗宴となるでしょう。 インターネット上の膨大なデータは、バックグラウンド データ ウェアハウスに保存されています。通常、さまざまな戦略を策定する際には、膨大なデータからパターンを見つけ、戦略の有効性と影響を評価する必要があります。しかし、これらのデータには効果的な表示メカニズムが欠けています。それは、豪華なごちそうを用意できるレストランであっても、それを紹介するメニューがなければ、お客様はおいしい料理を味わうことができないようなものです。インターネット上の膨大なデータ・情報の可視化を実現することが、インターネットの発展を促進する鍵の一つであることがわかります。 では、このような膨大な量のデータをどのように視覚化できるのでしょうか。この問題について10年近く研究した結果、インターネットのデータは、Webページライブラリ、リンクライブラリ、さまざまなログ情報などの単純なテキストの形で存在することが多いことがわかりました。人々がデータの相関関係を直感的に見つけることは困難です。同時に、人々の戦略は非常に複雑なルールや機械学習モデルである可能性があり、その効果、影響、および起こり得る悪影響を直感的に見ることは困難です。ここでは、「米国大統領選挙」を例に、データ視覚化の重要性を体験することができます。 米国大統領選挙の国民の有権者は、選挙年の 11 月の第 1 月曜日の翌火曜日、つまり選挙日と呼ばれる日に投票します。アメリカの有権者は全員、指定された場所に投票に行き、2人の大統領候補の中から選びます。米国議会には上院議員 100 名、下院議員 435 名、それにコロンビア特別区からの 3 票があり、合計 538 票の大統領選挙人票を持つ。 2012年の米国大統領選挙の結果が現地時間7日早朝に発表された。オバマ氏は332票を獲得して選挙に勝利したが、対立候補の共和党大統領候補ロムニー氏は206票しか獲得できなかった。最終的にオバマ氏が勝利し、大統領に再選された。膨大な投票数がある選挙の状況や動向をいかに正確に把握するか。データの可視化と分析により、選挙のルールを発見したり、今後の動向の影響や効果を理解したり、データ分布の変化をタイムリーに観察したりすることが容易になり、選挙戦略や動向の理解に大いに役立ちます。 Baiduの技術エンジニアは、「最も重要なインターネット技術問題に関する白書」1の中で「ビジュアル分析技術」についても取り上げ、この問題の重要な技術ポイントを分析・解説しました。 この技術は、視覚情報を使用して膨大な量のデータを分析およびマイニングし、その過程で暗黙のパターン(データ間の相関関係、データの変化、データの異常など)を発見することで、研究コストを削減し、問題をより迅速に発見し、インターネットの発展における変化する傾向をより包括的に理解できるようにします。しかし、視覚分析は現在、いくつかの課題に直面しています。まず、膨大な量です。限られたスペースに膨大な量のデータをどのように表示するかが大きな課題です。次に、高次元です。データは 2D/3D 空間で表現できず、データ間の元の相関関係を維持しながらデータの次元を削減する必要があります。その後、データ間の相関関係を表示および分析することを提案します。データは相互に依存し、影響し合います。データの一部を変更すると、他のデータにも対応する変更が加えられる可能性があります。これらの相関関係の変化を視覚化すると、戦略がシステム全体に与える影響を簡単に理解できます。最後のポイントは、データの表示と分析における変更についてです。インターネット上のデータは静的なものではなく、時間の経過とともに変化します。データの変化を視覚化して分析すると、インターネットの発展と変化を理解するのに役立ちます。 この素晴らしい視覚的な饗宴が完成すれば、パターンや問題を発見する手段が提供されることを想像してみてください。データを視覚化すると、パターンや問題をグラフで直感的に表現できるため、研究コストを大幅に削減し、生活をより便利で快適にすることができます。 ① 注記:百度キャンパスの「最も価値のあるインターネット技術問題」ホワイトペーパーの紹介 「最も価値のあるインターネット技術問題」収集活動は、問題指向であり、最も価値のある研究を導くという本来の意図を持って、Baidu キャンパス ブランド部門によって開始されました。これらの技術的問題は、百度の内部エンジニアが日常業務で遭遇し、緊急に解決する必要がある業界の技術的課題です。これらの独自の問題に基づいて、百度の最も価値のある技術的問題リストがまとめられ、学界と一般に公開されます。最終的には、主要な大学や研究機関とコミュニケーションと協力を行い、これらの技術的問題を共同で研究して解決し、技術の進歩と業界の発展を促進します。 |
<<: 石玉珠は3時間で213万を売り上げ、優美ドットコムは15%を請求し法律違反の疑い
ケースとは何でしょうか? まず、この用語について説明しましょう。ケースとは、人々が生産や生活の中で経...
2.2 関連研究分野ユーザー中心設計 (UCD、ユーザー中心システム設計 UCSD とも呼ばれる) ...
近年、AI、IoT、5GなどのICT技術の急速な発展により、クラウドコンピューティング市場には大きな...
多くの初心者は、VPS を購入した後、環境を構築する方法がわかりません。LNMP または LAMP ...
ほとんどの銀行は現代的な感覚に適応しようと努めてきたが、リテールバンキングに対するアプローチ方法から...
アリはゾウと競争できるのか?大資本と大物流を誇る電子商取引プラットフォームの戦争において、垂直型小カ...
Amazon グループ会社の Amazon Web Services, Inc. (AWS) は本日...
高度防御ビジネスに特化したシャークデータセンターのSharktechでは、現在、クラウドサーバー「パ...
2017年はクラウドコンピューティングの発展が全面的に加速し、特にインフラやプラットフォームレベルで...
このクリップはどこから来たのですか?この問題は、掻くことのできない背中のかゆみのようなものです。ほと...
hostigger の最近のプロモーション メールでは、トルコのイスタンブールにあるトルコ VPS ...
Linodeはどうですか? linode ワシントンDCはどうですか? Linode 社も米国の首都...
Dwidc は夏のプロモーションを実施しました。新しい武漢データセンターが追加され、BGP 回線への...
2003年に、impactvps(バックエンドドメイン名はsubnetlabs.com)を当サイトの...
名誉毀損と騒乱挑発の疑いで注目を集めるネットプロモーターの秦志輝(愛称:秦火火)氏の事件は、本日午前...