基礎研究への継続的な投資:テンセントクラウドデータベースの3つの論文が業界トップカンファレンスSIGMODに選出

基礎研究への継続的な投資:テンセントクラウドデータベースの3つの論文が業界トップカンファレンスSIGMODに選出

記者は6月13日、テンセントクラウドデータベースの論文3本が再びデータベース業界のトップカンファレンスであるSIGMODに選ばれ、SIGMOD 2022 Research Full Paperに収録されたことを知った。

今回収録された研究成果の中には、新たなデータ構造設計やAIインテリジェントパラメータ最適化など、いずれも業界で初めて提案されたものがあります。 Tencent Cloud Database は SIGMOD に何度も選ばれており、これは Tencent Cloud Database の蓄積とストレージ、インテリジェント管理、制御における最先端のイノベーションが国際的に権威ある評価を獲得していることを示しています。

SIGMOD は、正式名称を Special Interest Group on Management Of Data といい、米国計算機学会 (ACM) の Special Interest Group on Management Of Data (SIGMOD) が主催する国際学術会議であり、データベース分野における最高の学術的地位を誇ります。

最初に選ばれた論文のタイトルは、「HUNTER: パーソナライズされた要件のためのオンライン クラウド データベース ハイブリッド チューニング システム」です。これは、テンセントクラウドデータベースチームと華中科技大学によって完成され、AIインテリジェントパラメータ最適化においてさらなる進歩を遂げました。

一般的に、データベースのパフォーマンスを制御するデータベース パラメータ設定は数百あります。専門的な運用および保守担当者は、さまざまなハードウェア、要件、ビジネス シナリオに合わせて、経験に基づいてデータベース パラメータを調整することに多くの時間を費やします。 AI テクノロジーを活用してデータベース システムのパフォーマンス問題を解決する方法は、ますます重要かつ緊急なものになっています。

本論文では、Tencent Cloud Database TDSQL-C チームがハイブリッドチューニングシステム Hunter を提案しました。これは主に、チューニング効果を確保しながらチューニング時間を大幅に短縮する方法という問題を解決します。実験では、同時実行性が増加すると、チューニング時間は準線形に減少することが示されています。同時実行が 1 つのシナリオでは、チューニング時間はわずか 17 時間で、同時実行が 20 のシナリオでは、チューニング時間は 2 時間に短縮されます。

2番目に選ばれた論文は、中国人民大学とTencent Cloud Databaseチームによって完成されました。タイトルは「CompressDB: さまざまなデータベースで効率的な圧縮データの直接処理を可能にする」です。この論文では、圧縮されたデータを直接操作および処理するための新しいデータベース処理技術である CompressDB を提案しています。

現在、データ量が急激に増加しているため、業界では一般的にデータ圧縮を使用してストレージ容量を削減しています。ビッグデータ管理システムでは、圧縮されたデータを直接操作することで、ストレージスペースを節約し、処理パフォーマンスを向上させることができます。ただし、このタイプの現在のシステムはデータクエリのみに重点を置いていますが、完全なビッグデータ管理システムではデータクエリとデータ操作の両方をサポートする必要があります。

この研究では、文脈自由文法を使用してデータを圧縮し、新しいデータ構造とアルゴリズム設計を通じて文法規則を解析する新しいデータベース技術を提案し、実装しました。 CompressDB は、圧縮されたデータに対する直接のデータクエリと操作をサポートし、さまざまなデータベース システムをサポートします。実験では、CompressDB は平均 40% のスループット向上と 44% のレイテンシ削減を達成し、1.81 倍の圧縮率を達成することが示されています。

3 番目に選ばれた論文は、テンセントと北京大学が共同で完成させたもので、「BlindFL: データを覗き見せずに垂直連合機械学習を行う」と題されています。データのプライバシーとセキュリティの問題に対処するために、この論文では、さまざまな特徴データ タイプをサポートし、半正直なセキュリティ仮定の下でセキュリティを証明できる新しい垂直連合学習パラダイム BlindFL を提案します。実験結果によると、BlindFL は参加者のプライバシーデータを効果的に保護し、運用効率も高いことがわかりました。

テンセントは、データベース分野の研究開発を常に重視してきました。学校と企業の共同実験室の建設、若手学者のためのCCF-テンセント犀鳥基金、テンセント犀鳥科学研究プロジェクトなどを通じて、大学や研究機関との長期的な「産学研」協力関係を確立し、技術研究の成果を応用実装に転換し、学校と企業の協力を通じて最先端の技術革新と実証的な応用を継続的に生み出しています。

これまで、Tencent Cloud Database TDSQL は、3 大データベースカンファレンス SIGMOD、ICDE、VLDB や、データサイエンス分野のトップジャーナル IEEE TKDE に何度も登場しています。テンセントクラウドデータベースTDSQLは、データベースの基礎研究革新とデータベース産学研協力エコシステムの構築への投資を継続的に増やし、先進技術の利益を十分に発揮し、学術人材の育成と国内データベースの技術革新エコシステムの構築に貢献します。

<<:  クラウド導入が進むにつれ、ITチームはビジネスアドバイザーに

>>:  アンダーレイにおけるマルチネットワーク ns の適用 - ヒント

推薦する

ユーザーエクスペリエンスを良くするためには、何を言うべきか

Baidu のアルゴリズムは、ユーザーの検索エクスペリエンスを継続的に向上させるために、常にアップグ...

近年のSEOの急速な発展をもたらした3つの主な要因

最も主流のオンラインプロモーションの方法は何ですか?と聞かれたら、数え切れないほどのウェブマスターの...

Baidu によって降格された 3 つの SEO ブログの簡単な分析

この記事で分析した 3 つのブログはすべて Souwai A5 で有名なライターが書いた SEO ブ...

PRを示す方法とPRを計算するアルゴリズム

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っていますGoogl...

トラフィック詐欺は業界の評判を脅かします。広告費用の無駄を防ぐにはどうすればよいでしょうか?

データの改ざんはおそらく業界では公然の秘密だ。蔡旭坤のWeibo投稿が1億回以上転送されて以来、偽ト...

詳細な説明: SEO コンサルタントと SEO スペシャリストの主な違いは何ですか?

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています多くの人が...

クラウド コンピューティング サービスが ERP を近代化する方法

クラウド コンピューティング テクノロジーは、従来の ERP アプローチと比較して、セキュリティと可...

Kafka の設計原則を読んで忘れてしまい、もう一度読み返したことはありませんか?

メッセージキューとは何ですか?簡単に言えば、メッセージ キューはメッセージを保存するためのコンテナー...

高性能VPS+64Tの大規模トラフィックを提供し、日次課金をサポートするロシアのマーチャントmacloudの簡単な評価

2017年に設立されたロシアの企業であるMacloudは、主にクラウドサーバーサービスを提供していま...

程凌鋒:IMOの新種:テンセントとアリババの間に立つ

通信分野のバックグラウンドを持つ技術オタクが、エンタープライズレベルの AppStore を構築して...

pqhosting モルドバ 1Gbps 帯域幅無制限トラフィック VPS レビュー

pq.hosting はモルドバに登録されており、モルドバのデータセンターに VPS も設置されてい...

ハイアール冷蔵庫破壊事件からイベントマーケティングについて簡単に考察

企業にとって、誠実さと品質は消費者が最も気にかけるものです。企業が誠実さと責任を持って行動すれば、そ...

今後の百度検索「地震」は黒6.28K駅事件を超える

6 月の時点では、良いニュースとしては、Baidu の Web 検索品質に関するホワイト ペーパーが...