【WOT】ヤン・シグアン：百度は分散クラスタを通じて兆単位のコンピューティングを実現

[51CTO.com からのオリジナル記事] WOT2016 ビッグデータサミットは、2016 年 11 月 25 日から 26 日まで北京 JW マリオットホテルで開催されます。ビッグデータ分野の第一線の専門家やデータテクノロジーの先駆者数十名が会場に集まり、機械学習、リアルタイムコンピューティング、システムアーキテクチャ、NoSQL テクノロジーの実践など、最先端の技術トピックについて詳細な情報交換や議論を行うとともに、ビッグデータ分野におけるベストプラクティスや最も人気のある業界アプリケーションを共有します。

記者は会議前に、百度のウェブ検索インフラチームの技術リーダーであるヤン・シグアン氏にインタビューした。彼は WOT2016 ビッグデータサミットの講演者の 1 人で、大規模コンピューティングと検索エンジンの最新テクノロジーを私たちと共有しました。

Yan Shiguang は 2011 年に Baidu に入社しました。当初は Spider システムアーキテクチャに関する研究開発に従事し、Baidu の第 3 世代 Spider システムの設計と実装を統括しました。彼の現在の主な研究分野は大規模分散システムです。彼は、Baidu の大規模データベース Tera、Baidu ファイルシステム BFS、およびクラスターオペレーティングシステム Galaxy の主要な作者です。彼はオープンソースに熱心で、Baidu の多くの主要システムのオープンソース化を推進してきました。以下はインタビューの記録です。

1. 中国最大の検索プラットフォームとして、Baidu が直面している最大の課題は何だとお考えですか?現在はどのように解決されていますか?

Baidu は多くの課題に直面しています。私が話せるのは、Web 検索テクノロジーが直面している課題についてだけです。現時点での最大の課題は、報道範囲と適時性です。カバレッジは、Baidu が取得できる Web ページの範囲と考えることができます。範囲が広いほど良いです。
簡単に言えば、適時性とは、インターネット上で新しい Web ページが生成されてから Baidu がそれを取得できるまでの遅延を指します。短ければ短いほど良いです。これら 2 つの課題、つまり、できるだけ多くのデータを処理するという課題と、できるだけ迅速に処理するという課題は、矛盾しているように見えます。現在のソリューションは増分ストリーミング処理です。通常のストリーミング処理技術とは異なり、検索エンジンは各 Web ページを処理します。ウェブページの内容が正しいかどうか、ウェブページの重み（PageRank）の大きさは、ウェブページ自体だけでなく、インターネットのグローバルな情報にも左右されます。

したがって、増分処理の核となるのは、インターネット上のすべてのウェブページやハイパーリンク情報を保存し、リアルタイムで読み書きできるデータベースです。このデータベースの背後には、Baidu ファイルシステムやクラスタースケジューリングシステムなどの一連のインフラストラクチャがあります。

2. 分散技術が登場する前、Baidu Search は計算に何に依存していましたか?

現在の増分処理技術が登場する前は、Baidu はデータ処理に主に MapReduce と Spark に依存していました。どちらもバッチコンピューティングの考え方に基づいているため、レイテンシは比較的高くなります。 Spark は 10 分レベルを達成できますが、処理できるデータの量には制限があります。膨大な量のグローバル情報に依存する計算は MapReduce を使用することでのみ実行でき、レイテンシは数週間に達します。

MapReduce の制限はスケーラビリティにも反映されます。 100 億の Web ページを処理するのに 1,000 台のマシンが必要な場合、1 兆の Web ページを処理するには 100,000 台のマシンが必要となり、これはほとんど負担できないコストになります。

そのため、これまでは、データ処理も処理できるデータ量も大幅に制限されていました。

3. 百度は兆レベルのコンピューティングにおいてどのような経験を私たちと共有できるのでしょうか?

兆レベルのコンピューティングの中心的な課題は、システムのスケーラビリティと負荷分散にあります。データベース、スケジューリングシステム、基盤となる分散ファイルシステムなど、何兆ものデータを運ぶには、数万台のマシンのクラスターに効率的に拡張できる必要があります。ここでの主な考慮事項は、一貫性を保ちながら、デザインに単一のポイントを持たないようにすることです。最終的に、ほとんどのシステムでは、メタデータを管理するために分散マスタークラスターを選択し、ユーザーデータと計算はピアスレーブノードによって実行されます。

負荷分散の問題については、あるエリア内のホットスポットによってコンピューティングタスク全体の速度が低下する可能性があるため、ローカルホットスポットを慎重に処理します。システムの設計、特にデータベースシステムの設計では、高速なホットスポット分割とマシン間の移行が実現されます。

考慮すべき点や妥協点はたくさんありますが、具体的な内容は今回の会議での講演で皆さんにお伝えします。

4.現在人気のオープンソーステクノロジーについてどう思いますか?

Yan Shiguang氏は、Baiduでは主にオープンソースプロジェクトに取り組んでいると語った。現在の仕事の中核は、Baidu が独自に開発したビッグデータ処理プラットフォームであり、Hadoop エコシステムに相当する Baidu のオープンソースインフラストラクチャ (分散ストレージ、クラスター管理、ネットワーク通信フレームワーク) です。

Baidu のファイルシステム BFS は Hadoop の HDFS に、大規模データベース Tera は Hadoop の HBase に、分散調整サービス Nexus は Zookeeper に、クラスタースケジューリングシステム Galaxy は Yarn に、コンピューティングフレームワーク Shuttle は MapReduce にそれぞれ対応します。

51CTOが主催するハイエンドテクノロジーサミット[WOT2016「ビッグデータテクノロジーサミット」]が11月25日から26日まで北京月彩JWマリオットホテルで盛大に開幕します。業界の有力者40名以上が集まり、ビッグデータ技術と業界アプリケーションの実用的な組み合わせを分析します。主催者は「WOT講師インタビュールーム」にさらに多くの講師を招待し、技術的な乾物を深く分析します。

WOT2016のその他のインタビュー