一見シンプルに見えるウェブサイトを開発するには、なぜトップクラスのエキスパートが必要なのでしょうか?

一見シンプルに見えるウェブサイトを開発するには、なぜトップクラスのエキスパートが必要なのでしょうか?

Zhihu のトピックディスカッションより: 「Facebook や Taobao など、それほど複雑に見えない多くの Web サイトの開発には、なぜ多数のトップ エキスパートが必要なのでしょうか?」

答え:タオバオで雑用をしているプログラマーのZiliu

タオバオを例に、初心者に一般的な知識として伝えてみましょう。

まず、このページで最も重要な点についてお話しします。

[商品検索] - 商品が数千点ある場合は、選択などの操作を使用してこの機能を完了できます。しかし、10億個の製品がある場合、データベースにそれらを保存することはできません。どのように検索しますか? この場合、分散データ ストレージ ソリューションが必要です。さらに、この検索で​​はデータベースからデータを直接取得することはできません。検索エンジンを使用する必要があります (簡単に言えば、検索エンジンの方が高速です)。さて、製品を検索できるようになりました。そろそろ承認する時間でしょうか? 最初のページにどの製品が表示されるかがわかるまでには、まだしばらくかかります。これには非常に複雑なソート アルゴリズムが必要です。もし、あなたの購買行動に基づいてパーソナライズされた推奨事項を作成できれば、優秀なアルゴリズム エンジニアたちが一生をかけて努力しても十分でしょう。

[商品の詳細] - 検索を完了し、興味のあるものを見つけたら、クリックして商品ページを表示します。このページには、商品の属性、詳細な説明、レビュー、販売者情報などが記載されています。このページは、1 日に 30 億回以上表示されます。同様に、Web サイトを構築して 1 日に 10 人の訪問者がいる場合、サーバーに負荷はかかりません。しかし、30 億人の訪問者がいる場合、解決すべき問題がたくさんあります。まず、これらのリクエストはデータベースに直接押し付けることはできません。1日30億のリクエストのプレッシャーに耐えれば、スタンドアロンまたは分散型データベースは崩壊し、幸福感をすべて失います。この場合に使用されるテクノロジは、大規模な分散キャッシュです。すべての販売者情報、評価情報、製品の説明はキャッシュから取得されます。さらに極端なのは、「製品ビュー」情報で、ページを開くたびに更新する必要があります。キャッシュから取得できると思いますか? Taobaoはそれを実現しました。製品全体の詳細はキャッシュにあります。

[商品写真] - 商品には 5 枚の写真があり、商品説明にはさらに多くの写真があります。Taobao にはいくつの写真が保存されていると思いますか? 100 億枚以上です。ハード ドライブにたくさんの写真がある場合、どうやってその 1 つを見つけますか。クラスメートがあなたの写真をコピーしたい場合、何台のハード ドライブを用意する必要がありますか。どのくらいの帯域幅を構成する必要がありますか。ネットワーク カードはそれを処理できますか。彼に写真をコピーするのにどのくらいの時間がかかりますか。残念ながら、この規模に対応する市販のソリューションは市場にありません。結局、ストレージ システムを自分で開発する必要があります。Google の GFS について聞いたことがあるかもしれませんが、私たちのシステムはそれに似ており、TFS と呼ばれています。ちなみに、Tencent にも TFS と呼ばれる同様のシステムがあります。

[広告システム] - タオバオにはたくさんの広告があります。何、知らないの?それは私たちの広告がかなり良いということです。多くの人はそれを広告だとさえ思っていません。売り手はタオバオの広告スペースにどのように入札するのですか?広告はどのように表示されますか?広告の効果をどのように確認しますか?これは洗練されたアルゴリズムを備えた別のシステムです。

[BOSS システム] - タオバオのスタッフは、このような巨大なシステムをどのように管理しているのでしょうか。たとえば、ある作家の作品がすべてタオバオから消えたと突然発表された場合、データベースから検索エンジン、広告システムに至るまで、すべての関連データが数分以内に消えてしまいます。これには、素晴らしいバックエンド サポート システムが必要です。

[運用保守体制] - このような巨大な Web サイトをサポートするには、何台のサーバーが必要だと思いますか? 数千台? それはほんの一部です。多数のサーバーがある場合、どのオペレーティング システムを導入すればよいでしょうか。オペレーティング システム カーネルは最適化できますか。Java 仮想マシンは最適化できますか。通信モジュールのパフォーマンスを改善する余地はありますか。ソフトウェアを導入するにはどうすればよいでしょうか。問題が発生した場合にロールバックするにはどうすればよいでしょうか。オペレーティング システムをインストールして最適化しました。360 に騙されたり、クラッシュしたりしたことはありませんか。さまざまなトリックが関係しています。

これ以上は書きません。上記以外にも、開発が必要な技術はまだまだたくさんあります。もちろん、これらは実現不可能なものではありません。複雑で巨大なものは、小さなものから大きなものまで構築されます。素晴らしいダーベンと好奇心旺盛な新人が必要です。最後の文については、私が下心を持っていると考えていただければ結構です。

答え: 秦超、Facebookエンジニア

機能は複雑ではありませんが、完了すべき詳細が多数あります。たとえば、ニュースフィードの推奨アルゴリズムは非常に重要であり、ユーザーの過去の記録や友人との関係に基づいて生成される必要があります。さらに、最も適切な広告を選択するには、ユーザー情報と行動に基づいた機械学習とデータマイニングが必要です。これも労働集約的な作業です。

さらに、Facebook には信じられないほど多くのユーザーがいます。学校内で内部使用するためのソーシャル ネットワーキング サイトを作成するだけであれば、間違いなく簡単です。しかし、何億人もの人々がそれを使用していることを考えてみましょう。まず、サーバーは分散クラスターである必要があり、大量のトラフィックに耐えられる必要があります。同時に、パフォーマンスを向上させるために、メモリ キャッシュや Web ページ ブロックの読み込みなどの機能を追加する必要があります。もう 1 つは、ユーザーが毎日生成するデータの総量 (ステータス、メッセージ、写真、共有など) が TB オーダーであり、データベースがそれをサポートできるかどうかなどです。

さらに、背の高い木は風を引き寄せるので、攻撃を受けたときにウェブサイトが自らを防御し、スパムや不快な広告やプログラムの拡散を防ぐには、強力なセキュリティ チームが必要です。グローバル化によってもたらされた多言語化の問題もあります。

つまり、ウェブサイトが大きくなると、多くの問題が生じます。キャンパスで学期の課題をこなすほど簡単ではありません。


元のタイトル: 一見シンプルに見える Web サイトでも、開発にはトップクラスのエキスパートが必要なのはなぜでしょうか?

キーワード: トップ、エキスパート、開発、ウェブサイト

<<:  サーバーホスティングとSEOについて知っておくべきこと

>>:  「ダブル11」マーケティング戦争:どの戦術が最も効果的か?

推薦する

Baiduの資産を見てみましょう

百度の香港上場再開に関する重要な情報が公開された。百度は3月12日に世界規模の株式公開を開始し、公開...

SAP: インテリジェントなイノベーション、双方にメリットのある協力、企業のインテリジェントな変革を推進

[51CTO.comよりオリジナル記事] 疫病の影響により、企業はコスト削減と効率向上に対するより高...

外部リンク判定設定の対処方法

百度は以前、「外部リンクの判定について」という記事を発表し、不正行為とみなされる外部リンクを多数詳細...

Kubernetes の Pause コンテナとは何ですか?

導入Kubernetes によって報告されたエラーは次のとおりです。 Failed to creat...

Bilibiliは独自のビジネス哲学を理解したのでしょうか?

サークルを抜け出した後、ビリビリでもう一つの大きな出来事が起こりました。ビリビリが香港株式市場に上場...

ユーザーエクスペリエンスとウェブサイト構造の重要なポイントについて簡単に説明します

インターネットが発展し続けるにつれて、ウェブサイトに対する人々の見方は大きく変化しました。大半のユー...

アリババDAMOアカデミーが中国コミュニティ向けに最大の事前学習済み言語モデルPLUGをリリースし、CLUEカテゴリーリストで新記録を樹立

4月19日、アリババDAMOアカデミーは、中国コミュニティ向け最大規模の事前トレーニング済み言語モデ...

SEO 情報は乱雑でわかりにくいため、初心者は「自分で解決」する必要があります。

10月20日、国平氏は光年フォーラムを閉会した。国平氏自身は、その理由として3つの点を挙げた。第一に...

インターネットの富の半分:広告

1994年、中国は初めてインターネットに接続し、同年に世界初のインターネット広告が公開されました。 ...

BBSの将来(I):適切な垂直位置とローカリゼーションを見つけることが方向性

表面的には、2012 年は BBS にとって輝かしい年ではなかった。BBS は現在、「生きた化石」と...

ウェンタオ:衛星テレビ設置会社の SEO 事例

これは私が最近担当したクライアントです。クライアントが要求するキーワード競争は百度で55万で、それほ...

Ceph による分散システム障害検出

ノード障害検出は分散システムでは避けられない問題です。クラスターはノードの生存を感知し、適切な調整を...

認知能力の限界と平手打ちされた経験について考える

最近、私は個人の認知の内容について考えていましたが、認知の限界は認知の世界を開く最初の扉のように感じ...

prometeus.net 192M メモリ VZ レビュー、15 ユーロ/年

私はプロメテウスから低価格のVPSを15ユーロ(約121元)で購入しました。全体的に見ると、速度は確...

ルーターホスティング カリフォルニア サンノゼ デュアル G ポート KVM (Windows サポート)

RouterHosting は 2008 年に設立された企業です。主なサービスは VPS とサーバー...