Alibaba Cloud データベースの NL2SQL テクノロジーが国際的に権威のある評価で第 1 位を獲得

Alibaba Cloud データベースの NL2SQL テクノロジーが国際的に権威のある評価で第 1 位を獲得

最近、Alibaba Cloud Database は Yale University Spider データセット評価に参加し、78 点のスコアで 1 位を獲得しました。この成果は、Alibaba Cloud Database が NL2SQL テクノロジーにおいて国際的にリーダーシップを発揮していることを示しています。 Spider は、大規模、クロスドメイン、複雑な NL2SQL 変換効果の評価におけるリーダーとして業界で認められていると理解されています。

NL2SQL (Natural Language to SQL) は、ユーザーの自然なステートメントをデータベースで実行可能な SQL ステートメントに変換するテクノロジであり、ユーザーとデータベース間の相互作用を改善する上で非常に重要です。 Spider データセットは、イェール大学が提案した大規模な NL2SQL データセットです。 10,000 を超える自然言語の質問が含まれており、100 を超えるさまざまな分野をカバーしています。実際のシナリオに近いので非常に難しいです。

最近、Alibaba Cloud データベースチームが開発した CatSQL テクノロジが評価に参加し、Spider データセット評価で 1 位を獲得しました。 78点というスコアは、モデルサイズが2位の7分の1に過ぎず、計算速度が10倍以上向上していることなどから、2位を0.4ポイント大きく上回りました。

DAMO アカデミーのインテリジェント データベース ラボのディレクターである Tan Jian 氏は、NL2SQL 変換効果を高めるために、現段階では業界の傾向として、より大規模なモデルを使用するようになっていると紹介しました。しかし、今回の評価では、Alibaba Cloud データベース チームは異なるアプローチを採用し、小規模なモデルを採用しました。これにより、スループットがほぼ 1 桁向上しただけでなく、精度も向上しました。この方法は、NL2SQL に新たなアイデアをもたらしました。つまり、自然言語技術とデータベース ドメイン知識を密接に組み合わせ、SQL セマンティクスの観点から NL2SQL の精度を向上させ、実際の商用シナリオでの有効性をより確実にすることです。

Tan Jian 氏は、「最新の結果は、NL2SQL テクノロジが日々成熟し、精度と実用性の面でいくつかの複雑なシナリオの商用要件を徐々に満たしていることを示しています」と述べました。

Alibaba Cloud データベース チームは、2 年以上にわたって NL2SQL の方向性について自主研究を行っており、これらの最先端技術を関連データベース製品に活用し、ユーザーがデータベースを照会する方法を効果的に簡素化していることが明らかになりました。たとえば、Alibaba Cloud Database のワンストップ データ管理プラットフォーム DMS は、自社開発の CatSQL テクノロジーを使用して、自然言語による対話を通じて顧客がデータ資産をより効率的に管理できるように支援します。

Alibaba Cloud は設立以来、最先端のデータベース技術研究を重視しており、この目的のために特別な研究機関である DAMO Academy データベースおよびストレージ研究所を設立したと理解されています。過去数年間、Alibaba Cloud データベース チームは、トップクラスの国際会議やジャーナルに 50 件以上の論文を掲載し、国内外で 1,000 件近くの特許を取得し、ストレージとコンピューティングの分離、3 層分離、マルチマスター アーキテクチャ、HTAP、サーバーレス、統合分散、完全暗号化、インテリジェンス、自律性などの革新的な機能を備えた独自のデータベースを開発しました。

公開情報によると、Alibaba Cloud は中国で最も広範なクラウド データベース製品群を保有しており、そのクラウド データベース市場シェアは中国で第 1 位です。国際的に権威のある組織であるガートナーによる年次グローバルクラウドデータベースマジッククアドラント評価レポートによると、アリババクラウドは中国のテクノロジー企業を代表する唯一の企業として、2020年と2021年の2年連続でリーダークアドラントにランクインしました。中国のデータベースが世界のトップデータベースのランクに入ったのは、40年ぶりのことです。

<<:  Dapr 入門チュートリアル - ミドルウェア

>>:  避けるべきクラウドネイティブ開発の6つの間違い

推薦する

モバイルインターネットにおけるO2O:ソーシャルメディアがもたらす利点

[編集者注]:この記事の著者は、IDG Investment Points のワイヤレス事業部門のシ...

Baidu外部リンクツールの使用経験 リンク名

Baidu の外部リンク ツールはリリースされてからしばらく経っており、多くのウェブマスターが使用し...

オリジナルコンテンツ、強力なマーケティング、ユーザー重視、より良い結果

今はイノベーションが奨励される時代ですが、独創性を生み出す土壌がありません。彼らの多くは法的意識が弱...

stablehost: cPanel ホスティングが 80% オフ、最低 $10.8/年、米国、シンガポールなどに 8 つのデータセンターあり。

老舗の仮想ホスト販売業者である Stablehost は現在、cpanel パネルを備えた仮想ホスト...

仮想マシンの暗号化: ハイパーコンバージドの世界における暗号化戦略

ハイパーコンバージド インフラストラクチャと仮想化が標準となっている世界では、暗号化の必要性がますま...

Microsoft Intelligent Cloud Matrix は企業のビジネス回復力強化を支援します

[51CTO.comからのオリジナル記事] 2020年の流行は市場に大きな影響を与え、企業も流行がも...

電子商取引の背後にある価格戦争:今年20人以上の業界幹部が辞任

前回の急成長の後、2012年の電子商取引業界は「大魚が小魚を食べ、速い魚が遅い魚を蹴る」という統合の...

ウェブサイトの例の共有:百度は10ヶ月で8位、トラフィックは20万を超える

多くの人は、このタイトルが誇張されている、あるいは信じられないと思うかもしれません。確かに、10か月...

ウェブサイト上でユーザーに「追いつく」3段階の習慣テストは、ユーザーの考えを理解するのに役立ちます

Nir Eyal (TechCrunch) 著過去 25 年間の真に優れた消費者向けテクノロジー企業...

3/N層アーキテクチャ、「フレームワーク+プラグイン」アーキテクチャ、地域分散アーキテクチャ

一般的に使用されるソフトウェア アーキテクチャ モデルは、3/N 層アーキテクチャ、「フレームワーク...

中国のバレンタインデーのプロモーションのためにリンクを集め、ウェブサイトのトラフィックをインポートする方法

諸葛諾は中国のバレンタインデーについていつも腹を立てている。バレンタインデーを祝ったこともないし、ど...

個人ウェブマスター向けの新しいウェブサイトを最適化するためのヒント

インターネットは非常に速いペースで発展しており、個人のウェブサイトの成長率はさらに恐ろしいです。A5...

国内クラウドサービスプロバイダーの恥ずべき点:技術トレンド、最先端のコンピューティングツール、低レベルのモバイルインターネットに対する理解不足

[クラウド コンピューティングは、その独自の利点と巨大なビジネス展望により、近年 IT 業界で最もホ...

Weiboマーケティングに「新しい」顔を与える

Weibo はメディア業界のベテランであり、失敗する運命にあると多くの人が考えています。 WeCha...

草の根ウェブマスターがSEOの旅を開始し、次のステップに備える

前回はドメイン名を決めて、スペースを購入し、ウェブサイトを作ってくれる人を探しました。かなり時間がか...