インターネットのビッグデータ時代は本当に到来したのでしょうか?それとも、ずっとそこにあったのでしょうか?

インターネットのビッグデータ時代は本当に到来したのでしょうか?それとも、ずっとそこにあったのでしょうか?

(文/ヘブン)最近、WeChatでインターネットビッグデータに関する記事をよく見かけます。ビッグデータは、クラウドコンピューティングやIoTに続き、IT業界におけるもう一つの破壊的な技術革命になっているという人もいます。ヘブンは疑問に思います。インターネットビッグデータ時代は本当に到来したのでしょうか?それとも、ずっと前からあったのでしょうか?実は、データ分析技術の応用はひっそりと始まっています。例えば、タオバオやJD.comなどのショッピングサイトは私たちの買い物習慣を監視し、百度やGoogleなどの検索エンジンは私たちのウェブ閲覧を監視し、新浪微博や騰訊微博は私たちの友人と非常に親しいようで、QQやQQ Spaceはいつでも私たちにそれらの身近な友人を推薦してくれます。しかし、ヘブンは、本当のビッグデータ時代にはまだ程遠いと感じていますが、それはずっとそこにあったのです。なぜそんなことを言うのですか?

1. ハードウェア条件の不完全性:まず、ネットワーク速度の問題があります。ビッグデータの処理には高速な基本ネットワークが必要ですが、ネットワークの混雑は我が国ではよくある現象です。現在のビッグデータ処理の問題を解決するのは難しく、ほぼ不可能です。

2 つ目の理由は、情報を処理するデバイスが少なすぎることです。統計によると、インターネットで 1 日に生成される情報量は約 800EB です。これを DVD に保存する場合は 1 億 6,800 万枚のディスクが必要になり、ハード ドライブに保存する場合は 80 万枚のディスクが必要になります。しかし、このデータを処理するインターネット企業は、デバイスが非常に少ないです。たとえば、百度は北京、山西、内モンゴルに10万台強のデータプロセッサを持ち、70万CPUと4,000台のサーバーを持っています。テンセントのデータプラットフォームには8,400台のデバイスがあり、5,600台が単一クラスターで、総ストレージは100PB以上です。毎日200TB以上の新しいデータが追加され、月間データ増加率は10%、1日平均ジョブ数は100万、1日平均コンピューティング量は5PBです。しかし、テンセントのデータレコードの総数は375兆を超えています。現在の設備では、これらのインターネットデータを完全に正確に処理することは難しいことがわかります。ビッグデータ時代は、現在のデータを完全に処理し、ネットユーザーの動きを正確に特定することができます。したがって、ビッグデータ時代に入るにはまだ時期尚早です。

2. 専門人材が不足:ヘブン氏は、ビッグデータ関連の人材不足がビッグデータ市場の発展に影響を与える重要な要因になると考えている。ビッグデータ処理人材が不足していることは否定できない。国も大手インターネット企業もビッグデータ処理人材の獲得に力を入れている。例えば、2014年5月19日、中国人民大学で、中国人民大学、北京大学、中国科学院大学、中央財経大学、首都経済大学が共同で設立したビッグデータ分析マスターの育成のための共同イノベーションプラットフォームが立ち上げられた。アリババグループは2012年7月10日、「データ共有プラットフォーム」戦略を推進するために最高データ責任者(CDO)を設置すると発表した。これらすべての要因は、ビッグデータ処理の人材が深刻に不足しており、専門的なビッグデータ処理の人材を育成することが急務であることを示しています。

3. データの孤立、それぞれが独自に戦っている:国内インターネットの現状は、3大巨頭BATが互いに戦っている状況です。百度は人と情報を結び、情報の入り口を独占しています。アリババは人と物を結び、取引の入り口を独占しています。テンセントは人と人を結び、ソーシャルの入り口を独占しています。しかし、いずれも自社の入り口を厳しく管理し、データの共有を許可していません。このようにしてビッグデータがどのように実現され、データの一部を使ってネットユーザーの真意を判断できるのか、想像してみてください。そのため、広告を正確に配信できず、ウェブページの関連性が強くなく、インターネットのインテリジェントな開発は困難を極めるしかありません。

ヘブンは、インターネットの本質はユーザーを理解し、インテリジェンスに向かうことであり、ビッグデータの正確な処理はインターネットのインテリジェンスを実現することであり、インテリジェンスを実現するための基礎でもあると考えています。しかし、インターネットビッグデータの処理はまだ初期段階にあります。設備、人材、データリソースの共有など、これらは緊急に解決する必要がある問題です。そのため、真のビッグデータ時代からはまだ遠いです。上記はヘブンの個人的な意見であり、完全なものではありません。皆様のご意見を伺い、一緒に前進していければと思います。



原題: インターネットのビッグデータ時代は本当に来るのか?それとも、ずっとそこにあったのでしょうか?

キーワード:

<<:  ウェブマスターネットワークニュース:タオバオクラウンストアのオーナーがアルパカ飼育に転職し、パフォーマンスで1日数万元を稼ぐ

>>:  百度はモバイルインターネットの利益の優位性を獲得し、オンライン同盟のモバイルウェブページでフローティングテーマ広告の内部テストを実施

推薦する

キング・オブ・グローリーからテンセントゲームの三大運用魔法武器をまとめてみました

最近、2 つのことがありました。1 つ目は、ルームメイトの半数以上がHonor of Kingsをプ...

UBS: アマゾン、マイクロソフト、グーグルはクラウドコンピューティングの人材不足に直面

報道によると、UBSのアナリストが先週金曜日に発表した最新の報告書では、アマゾン、マイクロソフト、グ...

ゲーム業界を例にとると、情報フロー広告のテストコストが6分の1に削減されました

テストは、キャンペーンを開始する上で最初かつ最も重要なステップです。テストによって、顧客がこのチャネ...

ウェブマスターはどの Baidu の重み値を信頼すべきでしょうか?

百度検索の国内市場シェアが急上昇し、中国の検索エンジン運営者の市場シェアの78.6%を占めるようにな...

Box プロモーション: Box.net クラウド ディスクで 50G のストレージを無料で提供

現在、ネットワーク ディスクが多すぎませんか?国内で有名なものには、Baidu Netdisk、Te...

就職活動に役立つK8s面接のよくある質問

少し前に、このビデオでナレッジ リポジトリ https://github.com/bregman-a...

locvps: 40% 割引、月額 22 元から、米国/オランダ/ドイツ/オーストラリア、ハイエンド ライン VPS (CN2/CU2)

locvps は現在、ロサンゼルス、オランダ、ドイツ、オーストラリアの USMC の VPS の超低...

3つの側面からウェブサイトのランキングを向上させる

ウェブサイトの最適化方法は、比較的抽象的な技術です。最初は基礎知​​識がなければ正しく理解することは...

AlibabaのオープンソースK8s環境のローカルテストおよびデバッグツールを使用すると、効率が非常に高くなります。

システムが k8s クラスターにデプロイされると、開発およびテスト モードもある程度変更されます。以...

Kubernetes チェックポイント API を使用してコンテナをバックアップおよび復元する

Kubernetes v1.25 では、コンテナ チェックポイント API がアルファ機能として導入...

オランダのliteserver.nlの高性能AMD VPSの簡単なレビュー

2006年に設立されたオランダのVPSブランドであるLiteserver.nlは、今年のブラックフラ...

Open Policy Agent で Kubernetes を保護する方法

コンテナ化されたアプリケーションを本番環境に移行する組織が増えるにつれて、Kubernetes はプ...

KubeSphere の新世代クラウドネイティブ データ ウェアハウス、Databend を発表

導入Databend は、クラウド オブジェクト ストレージに完全に特化した次世代のクラウド ネイテ...

百度のグリーンラディッシュ2.0アルゴリズムは孤独に耐え、ウェブサイトブランドを構築するための対策

7月の大きな出来事は、百度がGreen Radish 2.0アルゴリズムを発表したことであり、これは...

Krypt データセンター VPS ブランド イオンクラウド: ロサンゼルス データセンター VPS 簡単評価

クリプト電脳室直系のVPSブランドであるイオンクラウドのVPSについて、その速度や効果などについて知...