Alibaba Cloud データベースの NL2SQL テクノロジーが国際的に権威のある評価で第 1 位を獲得

Alibaba Cloud データベースの NL2SQL テクノロジーが国際的に権威のある評価で第 1 位を獲得

最近、Alibaba Cloud Database は Yale University Spider データセット評価に参加し、78 点のスコアで 1 位を獲得しました。この成果は、Alibaba Cloud Database が NL2SQL テクノロジーにおいて国際的にリーダーシップを発揮していることを示しています。 Spider は、大規模、クロスドメイン、複雑な NL2SQL 変換効果の評価におけるリーダーとして業界で認められていると理解されています。

NL2SQL (Natural Language to SQL) は、ユーザーの自然なステートメントをデータベースで実行可能な SQL ステートメントに変換するテクノロジであり、ユーザーとデータベース間の相互作用を改善する上で非常に重要です。 Spider データセットは、イェール大学が提案した大規模な NL2SQL データセットです。 10,000 を超える自然言語の質問が含まれており、100 を超えるさまざまな分野をカバーしています。実際のシナリオに近いので非常に難しいです。

最近、Alibaba Cloud データベースチームが開発した CatSQL テクノロジが評価に参加し、Spider データセット評価で 1 位を獲得しました。 78点というスコアは、モデルサイズが2位の7分の1に過ぎず、計算速度が10倍以上向上していることなどから、2位を0.4ポイント大きく上回りました。

DAMO アカデミーのインテリジェント データベース ラボのディレクターである Tan Jian 氏は、NL2SQL 変換効果を高めるために、現段階では業界の傾向として、より大規模なモデルを使用するようになっていると紹介しました。しかし、今回の評価では、Alibaba Cloud データベース チームは異なるアプローチを採用し、小規模なモデルを採用しました。これにより、スループットがほぼ 1 桁向上しただけでなく、精度も向上しました。この方法は、NL2SQL に新たなアイデアをもたらしました。つまり、自然言語技術とデータベース ドメイン知識を密接に組み合わせ、SQL セマンティクスの観点から NL2SQL の精度を向上させ、実際の商用シナリオでの有効性をより確実にすることです。

Tan Jian 氏は、「最新の結果は、NL2SQL テクノロジが日々成熟し、精度と実用性の面でいくつかの複雑なシナリオの商用要件を徐々に満たしていることを示しています」と述べました。

Alibaba Cloud データベース チームは、2 年以上にわたって NL2SQL の方向性について自主研究を行っており、これらの最先端技術を関連データベース製品に活用し、ユーザーがデータベースを照会する方法を効果的に簡素化していることが明らかになりました。たとえば、Alibaba Cloud Database のワンストップ データ管理プラットフォーム DMS は、自社開発の CatSQL テクノロジーを使用して、自然言語による対話を通じて顧客がデータ資産をより効率的に管理できるように支援します。

Alibaba Cloud は設立以来、最先端のデータベース技術研究を重視しており、この目的のために特別な研究機関である DAMO Academy データベースおよびストレージ研究所を設立したと理解されています。過去数年間、Alibaba Cloud データベース チームは、トップクラスの国際会議やジャーナルに 50 件以上の論文を掲載し、国内外で 1,000 件近くの特許を取得し、ストレージとコンピューティングの分離、3 層分離、マルチマスター アーキテクチャ、HTAP、サーバーレス、統合分散、完全暗号化、インテリジェンス、自律性などの革新的な機能を備えた独自のデータベースを開発しました。

公開情報によると、Alibaba Cloud は中国で最も広範なクラウド データベース製品群を保有しており、そのクラウド データベース市場シェアは中国で第 1 位です。国際的に権威のある組織であるガートナーによる年次グローバルクラウドデータベースマジッククアドラント評価レポートによると、アリババクラウドは中国のテクノロジー企業を代表する唯一の企業として、2020年と2021年の2年連続でリーダークアドラントにランクインしました。中国のデータベースが世界のトップデータベースのランクに入ったのは、40年ぶりのことです。

<<:  Dapr 入門チュートリアル - ミドルウェア

>>:  避けるべきクラウドネイティブ開発の6つの間違い

推薦する

マイクロソフトがMicrosoft Fabricを立ち上げ、クラウドコンピューティング市場競争でアマゾンとグーグルに勝つことを目指す

Microsoft の新しいクラウド コンピューティング データおよび分析プラットフォームである M...

ウェブサイトのランキング最適化レッスン 2: SEO を実行するには? SEO を行うのは人間になるようなものです!

ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービスSEO をするにはどうす...

ウェブマスターネットワークニュース:タオバオローカルライフモバイルシナ文学会社が暴露

1. WeiboとAlipayがWeChat 5.0に対抗するために提携WeChat 5.0は1か月...

これら 4 つのコンテナ展開方法のうちどれが最適ですか?

[[353760]]コンテナは、実現技術として、企業の IT 計画において重要な役割を果たします。そ...

[Google SEO ニュース] Google は 1 対 1 のマッピング 301 リダイレクトのみを認識する

序文「外国人の長所から学び、自らを強化する」という理念に基づき、Google SEOの進歩を理解し、...

モバイルモールシステム構築計画で解決すべき3つの大きな課題

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています情報技術の...

SEOを行うには、4つの基本的なデータ分析を習得する必要があります。

SEO 業界では、データが非常に重要な中核を占めています。私たちは毎日、さまざまな種類のデータに注目...

5G をサポートするにはクラウドネイティブ エッジが本当に必要ですか?

[51CTO.com クイック翻訳] コンバージェンスは、通信ベンダーがスイッチ ネットワークから ...

オンサイト最適化の「地雷原」についてどれくらい知っていますか?

多くのウェブマスターがウェブサイト最適化の誤解に関する情報を閲覧したことがあると思います。ウェブサイ...

SEOは常に検索とともに存在し、衰えることはない

昨今、SEO について語ることは、以前に比べてはるかに人気がなくなったようです。過去 2 年間、多く...

ギャラクシー証券とテンセント、デジタル技術で証券サービスをアップグレードするために戦略的に協力

証券業界はデジタル化の推進を加速させている。 5月22日、2019年テンセントグローバルデジタルエコ...

入札プロモーションのクリエイティブ最適化戦略についての簡単な説明

キーワードによって、広告が表示される対象が決定されます。一方、創造性によって、潜在的な顧客が目にする...

ホームページのフォーカス画像の色合わせについて――黒

電子商取引に携わる人は、装飾の重要性を知っています。私はよくオンラインストアを女性に例えます。店舗の...

kirincomm: 日本サーバー、(直結)ソフトバンク+BBIX回線、1Gbps帯域、最大10Gbps帯域、大規模トラフィック対応

香港で設立されたキリンコムは、APNIC および RIPE のメンバーです。公式には、日本の東京と大...

Hyper-V の基礎知識を深めるための 3 つの FAQ

Hyper-V はさまざまな方法で仮想化を簡素化します。仮想リソースの管理、複数の VM の同時実行...