Alibaba Cloud データベースの NL2SQL テクノロジーが国際的に権威のある評価で第 1 位を獲得

Alibaba Cloud データベースの NL2SQL テクノロジーが国際的に権威のある評価で第 1 位を獲得

最近、Alibaba Cloud Database は Yale University Spider データセット評価に参加し、78 点のスコアで 1 位を獲得しました。この成果は、Alibaba Cloud Database が NL2SQL テクノロジーにおいて国際的にリーダーシップを発揮していることを示しています。 Spider は、大規模、クロスドメイン、複雑な NL2SQL 変換効果の評価におけるリーダーとして業界で認められていると理解されています。

NL2SQL (Natural Language to SQL) は、ユーザーの自然なステートメントをデータベースで実行可能な SQL ステートメントに変換するテクノロジであり、ユーザーとデータベース間の相互作用を改善する上で非常に重要です。 Spider データセットは、イェール大学が提案した大規模な NL2SQL データセットです。 10,000 を超える自然言語の質問が含まれており、100 を超えるさまざまな分野をカバーしています。実際のシナリオに近いので非常に難しいです。

最近、Alibaba Cloud データベースチームが開発した CatSQL テクノロジが評価に参加し、Spider データセット評価で 1 位を獲得しました。 78点というスコアは、モデルサイズが2位の7分の1に過ぎず、計算速度が10倍以上向上していることなどから、2位を0.4ポイント大きく上回りました。

DAMO アカデミーのインテリジェント データベース ラボのディレクターである Tan Jian 氏は、NL2SQL 変換効果を高めるために、現段階では業界の傾向として、より大規模なモデルを使用するようになっていると紹介しました。しかし、今回の評価では、Alibaba Cloud データベース チームは異なるアプローチを採用し、小規模なモデルを採用しました。これにより、スループットがほぼ 1 桁向上しただけでなく、精度も向上しました。この方法は、NL2SQL に新たなアイデアをもたらしました。つまり、自然言語技術とデータベース ドメイン知識を密接に組み合わせ、SQL セマンティクスの観点から NL2SQL の精度を向上させ、実際の商用シナリオでの有効性をより確実にすることです。

Tan Jian 氏は、「最新の結果は、NL2SQL テクノロジが日々成熟し、精度と実用性の面でいくつかの複雑なシナリオの商用要件を徐々に満たしていることを示しています」と述べました。

Alibaba Cloud データベース チームは、2 年以上にわたって NL2SQL の方向性について自主研究を行っており、これらの最先端技術を関連データベース製品に活用し、ユーザーがデータベースを照会する方法を効果的に簡素化していることが明らかになりました。たとえば、Alibaba Cloud Database のワンストップ データ管理プラットフォーム DMS は、自社開発の CatSQL テクノロジーを使用して、自然言語による対話を通じて顧客がデータ資産をより効率的に管理できるように支援します。

Alibaba Cloud は設立以来、最先端のデータベース技術研究を重視しており、この目的のために特別な研究機関である DAMO Academy データベースおよびストレージ研究所を設立したと理解されています。過去数年間、Alibaba Cloud データベース チームは、トップクラスの国際会議やジャーナルに 50 件以上の論文を掲載し、国内外で 1,000 件近くの特許を取得し、ストレージとコンピューティングの分離、3 層分離、マルチマスター アーキテクチャ、HTAP、サーバーレス、統合分散、完全暗号化、インテリジェンス、自律性などの革新的な機能を備えた独自のデータベースを開発しました。

公開情報によると、Alibaba Cloud は中国で最も広範なクラウド データベース製品群を保有しており、そのクラウド データベース市場シェアは中国で第 1 位です。国際的に権威のある組織であるガートナーによる年次グローバルクラウドデータベースマジッククアドラント評価レポートによると、アリババクラウドは中国のテクノロジー企業を代表する唯一の企業として、2020年と2021年の2年連続でリーダークアドラントにランクインしました。中国のデータベースが世界のトップデータベースのランクに入ったのは、40年ぶりのことです。

<<:  Dapr 入門チュートリアル - ミドルウェア

>>:  避けるべきクラウドネイティブ開発の6つの間違い

推薦する

推奨: m247-4 Euro/Xen/256M メモリ/10G ハードドライブ/G ポート無制限/ルーマニア

m247 は 2001 年に設立され、ISO 9001:2008 品質管理システムと ISO2700...

AWS アカウントを登録して EC2 無料利用枠を作成する詳細なチュートリアル

AWS EC2 (正式名称は Amazon Elastic Compute Cloud) は、クラウ...

魏亜と李佳琦は「ネット最安値」を買う余裕がない

Eコマースのライブストリーミングは、マーケティング手法から標準化された販売チャネルへと進化しました。...

贛州SEO最適化市場分析

贛州市は江西省で2番目に大きな都市であり、1つの区、2つの市、15の県を管轄しています。贛州市の主要...

ウェブサイトは入札と最適化を同時に行うことができますか?

ランクアップできないと頭痛の種ですが、ランクアップしても頭痛の種です。なぜでしょうか? ランキングが...

Teamsun: 業界の変革を促進する優れたクラウド基盤の構築

[51CTO.com からのオリジナル記事] クラウド コンピューティング テクノロジーが成熟するに...

Google でのウェブサイトのランキングに影響を与える上位 10 の問題

1. ホスティング プロバイダーを変更する予定ですが、以前の検索エンジンのランキングに影響はあります...

#CheapVPS# cloudcone - $11/年/KVM/256m メモリ/10g ハードドライブ/1T トラフィック/ロサンゼルス

Cloudcone はブラックフライデー中にプロモーションを行っており、HostCat の小さな掲示...

「百度が方周子を買収」事件の判決:360に侵害賠償金5万元の支払い命令

網易科技は3月25日、北京奇虎と周鴻毅会長を、微博に「方周子は百度に買収された疑いがある」「ある検索...

Pacificrack: 米国向けに最適化された VPS が 50% オフ、さらに 2 つ買うと 1 つ無料、更新にも適用

Pacificrack は、今から旧正月初日 (2 月 1 日) まで、2 つ買うと 1 つ無料にな...

企業のキーワードランキングが安定した後のマーケティング方法

検索エンジン マーケティングは、オンライン マーケティングでは一般的です。検索エンジン マーケティン...

草の根ウェブマスターはブログをどのように位置づけているのでしょうか?

私はしばらくブログを運営していますが、毎日どんなコンテンツを投稿するかでまだ悩んでいます。これはほと...

オンライン採用モデルの代替表現:Qunarの見通しの分析

最近の米国政府閉鎖については皆さんも聞いたことがあると思います。政府が閉鎖されるなんて、このシステム...