一見シンプルに見えるウェブサイトを開発するには、なぜトップクラスのエキスパートが必要なのでしょうか?

一見シンプルに見えるウェブサイトを開発するには、なぜトップクラスのエキスパートが必要なのでしょうか?

Zhihu のトピックディスカッションより: 「Facebook や Taobao など、それほど複雑に見えない多くの Web サイトの開発には、なぜ多数のトップ エキスパートが必要なのでしょうか?」

答え:タオバオで雑用をしているプログラマーのZiliu

タオバオを例に、初心者に一般的な知識として伝えてみましょう。

まず、このページで最も重要な点についてお話しします。

[商品検索] - 商品が数千点ある場合は、選択などの操作を使用してこの機能を完了できます。しかし、10億個の製品がある場合、データベースにそれらを保存することはできません。どのように検索しますか? この場合、分散データ ストレージ ソリューションが必要です。さらに、この検索で​​はデータベースからデータを直接取得することはできません。検索エンジンを使用する必要があります (簡単に言えば、検索エンジンの方が高速です)。さて、製品を検索できるようになりました。そろそろ承認する時間でしょうか? 最初のページにどの製品が表示されるかがわかるまでには、まだしばらくかかります。これには非常に複雑なソート アルゴリズムが必要です。もし、あなたの購買行動に基づいてパーソナライズされた推奨事項を作成できれば、優秀なアルゴリズム エンジニアたちが一生をかけて努力しても十分でしょう。

[商品の詳細] - 検索を完了し、興味のあるものを見つけたら、クリックして商品ページを表示します。このページには、商品の属性、詳細な説明、レビュー、販売者情報などが記載されています。このページは、1 日に 30 億回以上表示されます。同様に、Web サイトを構築して 1 日に 10 人の訪問者がいる場合、サーバーに負荷はかかりません。しかし、30 億人の訪問者がいる場合、解決すべき問題がたくさんあります。まず、これらのリクエストはデータベースに直接押し付けることはできません。1日30億のリクエストのプレッシャーに耐えれば、スタンドアロンまたは分散型データベースは崩壊し、幸福感をすべて失います。この場合に使用されるテクノロジは、大規模な分散キャッシュです。すべての販売者情報、評価情報、製品の説明はキャッシュから取得されます。さらに極端なのは、「製品ビュー」情報で、ページを開くたびに更新する必要があります。キャッシュから取得できると思いますか? Taobaoはそれを実現しました。製品全体の詳細はキャッシュにあります。

[商品写真] - 商品には 5 枚の写真があり、商品説明にはさらに多くの写真があります。Taobao にはいくつの写真が保存されていると思いますか? 100 億枚以上です。ハード ドライブにたくさんの写真がある場合、どうやってその 1 つを見つけますか。クラスメートがあなたの写真をコピーしたい場合、何台のハード ドライブを用意する必要がありますか。どのくらいの帯域幅を構成する必要がありますか。ネットワーク カードはそれを処理できますか。彼に写真をコピーするのにどのくらいの時間がかかりますか。残念ながら、この規模に対応する市販のソリューションは市場にありません。結局、ストレージ システムを自分で開発する必要があります。Google の GFS について聞いたことがあるかもしれませんが、私たちのシステムはそれに似ており、TFS と呼ばれています。ちなみに、Tencent にも TFS と呼ばれる同様のシステムがあります。

[広告システム] - タオバオにはたくさんの広告があります。何、知らないの?それは私たちの広告がかなり良いということです。多くの人はそれを広告だとさえ思っていません。売り手はタオバオの広告スペースにどのように入札するのですか?広告はどのように表示されますか?広告の効果をどのように確認しますか?これは洗練されたアルゴリズムを備えた別のシステムです。

[BOSS システム] - タオバオのスタッフは、このような巨大なシステムをどのように管理しているのでしょうか。たとえば、ある作家の作品がすべてタオバオから消えたと突然発表された場合、データベースから検索エンジン、広告システムに至るまで、すべての関連データが数分以内に消えてしまいます。これには、素晴らしいバックエンド サポート システムが必要です。

[運用保守体制] - このような巨大な Web サイトをサポートするには、何台のサーバーが必要だと思いますか? 数千台? それはほんの一部です。多数のサーバーがある場合、どのオペレーティング システムを導入すればよいでしょうか。オペレーティング システム カーネルは最適化できますか。Java 仮想マシンは最適化できますか。通信モジュールのパフォーマンスを改善する余地はありますか。ソフトウェアを導入するにはどうすればよいでしょうか。問題が発生した場合にロールバックするにはどうすればよいでしょうか。オペレーティング システムをインストールして最適化しました。360 に騙されたり、クラッシュしたりしたことはありませんか。さまざまなトリックが関係しています。

これ以上は書きません。上記以外にも、開発が必要な技術はまだまだたくさんあります。もちろん、これらは実現不可能なものではありません。複雑で巨大なものは、小さなものから大きなものまで構築されます。素晴らしいダーベンと好奇心旺盛な新人が必要です。最後の文については、私が下心を持っていると考えていただければ結構です。

答え: 秦超、Facebookエンジニア

機能は複雑ではありませんが、完了すべき詳細が多数あります。たとえば、ニュースフィードの推奨アルゴリズムは非常に重要であり、ユーザーの過去の記録や友人との関係に基づいて生成される必要があります。さらに、最も適切な広告を選択するには、ユーザー情報と行動に基づいた機械学習とデータマイニングが必要です。これも労働集約的な作業です。

さらに、Facebook には信じられないほど多くのユーザーがいます。学校内で内部使用するためのソーシャル ネットワーキング サイトを作成するだけであれば、間違いなく簡単です。しかし、何億人もの人々がそれを使用していることを考えてみましょう。まず、サーバーは分散クラスターである必要があり、大量のトラフィックに耐えられる必要があります。同時に、パフォーマンスを向上させるために、メモリ キャッシュや Web ページ ブロックの読み込みなどの機能を追加する必要があります。もう 1 つは、ユーザーが毎日生成するデータの総量 (ステータス、メッセージ、写真、共有など) が TB オーダーであり、データベースがそれをサポートできるかどうかなどです。

さらに、背の高い木は風を引き寄せるので、攻撃を受けたときにウェブサイトが自らを防御し、スパムや不快な広告やプログラムの拡散を防ぐには、強力なセキュリティ チームが必要です。グローバル化によってもたらされた多言語化の問題もあります。

つまり、ウェブサイトが大きくなると、多くの問題が生じます。キャンパスで学期の課題をこなすほど簡単ではありません。


元のタイトル: 一見シンプルに見える Web サイトでも、開発にはトップクラスのエキスパートが必要なのはなぜでしょうか?

キーワード: トップ、エキスパート、開発、ウェブサイト

<<:  サーバーホスティングとSEOについて知っておくべきこと

>>:  「ダブル11」マーケティング戦争:どの戦術が最も効果的か?

推薦する

Pacificrack: 新しい VPS を販売中 (Virtualizor パネル)、年間 12 ドル、KVM/1G メモリ/1 コア/20g SSD/2T 帯域幅

8 月 2 日に、私は事前にお知らせしました。「Pacificrack: 新たな転換点がもうすぐやっ...

SEO の世界におけるバランス: コンテンツとユーザー エクスペリエンスのどちらがより重要ですか?

2013年、SEO業界では「ユーザーエクスペリエンスは王様、コンテンツは女王」という格言が流行しまし...

クラウドデータ移行における6つの隠れたボトルネック

ペタバイト単位のデータをクラウドに移動するのは困難な作業です。クラウドでアクセスするとアプリケーショ...

Cloudcone: 6 周年、ロサンゼルス VPS は年間 21 ドルから、メモリ 1G/コア 2 個/SSD 30g/トラフィック 1 個

cloudcone は現在、ロサンゼルスに 1 つのデータセンター (multacom) のみを持っ...

初心者や企業はどのようにして独自の Web サイトを段階的に構築するのでしょうか?

月収10万元の起業の夢を実現するミニプログラム起業支援プランどの会社も独自のウェブサイトを持つ必要が...

Yixun、JD.comの利益ゼロのB2C電子商取引価格戦争に対抗

A5ウェブマスターネットワークニュース:8月14日午前、JD.comのCEOである劉強東氏は、自身の...

SEO 業務における Python の応用 - データ収集

1. このシリーズの紹介私はずっと、PythonとSEOに関する記事をシリーズで書きたいと思っていま...

海外ドメイン名プロモーションまとめ、#BlackFriday#

#ブラックフライデー#: Hostgator - ホストが20%オフ/ドメイン名が2.99米ドル、期...

swiftnode: 米国サーバー (ロサンゼルス/シカゴ)、月額 79 ドル、E3-1230v5/32gDDR4/500GSSD/1Gbps 帯域幅 (無制限)/40G 高防御

Swiftnodeは2009年に設立され、主な事業は独立系サーバーレンタルです。現在、米国シカゴとロ...

量子コンピューティングに注力するBose Quantumは、Dianliang Bernが主導する数千万人民元のエンジェルラウンドの資金調達を完了した。

36Krは、「コヒーレント量子コンピューティング」に焦点を当てた中国初のスタートアップ企業であるBo...

将来はクラウド コンピューティングからフォグ コンピューティングに移行するのでしょうか?

モノのインターネットの発展により、既存のクラウド ネットワークは、特にリアルタイム パフォーマンスの...

クラウド コンピューティングで仮想マシンのセキュリティを確保するにはどうすればよいですか?

クラウド コンピューティングにおける仮想マシンの安全な割り当て戦略の実装とその有効性の実証。クラウド...

テンセントが2012年に買収したインターネット企業のレビュー

7月23日のAdmin5 Webmaster Networkによると、先週、Caixin.comはS...

百度は10日にセキュリティ同盟を設立した。個々のウェブマスターはどうするのだろうか?

百度は9月10日にセキュリティアライアンスの設立を発表したと報じられており、比較的知名度のある国内セ...

機密情報プラットフォームを利用して商品を宣伝するための6つのステップのルールについて簡単に説明します。

インターネットプロモーションは、最終的にはトラフィックのプロモーションです。トラフィックを占有するも...