Amazon re:Invent 2023 で注目すべき 7 つのポイント

アニルバン・ゴシャル

企画 |趙雲

制作 | 51CTO テクノロジースタック (WeChat ID: blog)

AWS が新しいチップや基本モデルを発表したり、生成 AI ベースのアプリケーション構築サービスである Amazon Bedrock のアップデートを発表したり、あるいはベクトルデータベースとゼロ ETL 統合をサポートする Amazon Q と呼ばれる新しい生成 AI アシスタントを発表したりと、"生成 AI" は re:Invent 2023 のスローガンと言えるでしょう。

先週の AWS re:Invent カンファレンスでは、人工知能に焦点が当てられ、新しい生成 AI アシスタントである Amazon Q が初めて主役となりました。しかし、新しい抽出、変換、ロード (ETL) サービス、新しいコスト最適化センター、Amazon CodeCatalyst と呼ばれる AWS のクラウドベース開発ツールのエンタープライズ価格層の改善など、データベースマネージャー、データサイエンティスト、データエンジニア、開発者を興奮させる発表は他にもたくさんありました。会議のハイライトを 7 つ紹介します。

1. 生成AIのための充実したインフラストラクチャの提供

クラウドサービスプロバイダーのAWSは、昨年からエネルギー効率を高めた高性能コンピューティングをサポートするインフラ機能とチップへの投資を増やしており、GravitonおよびTrainiumチップの最新バージョンを発表した。

AWS によれば、Graviton4 プロセッサは、現世代の Graviton3 プロセッサと比較して、コンピューティングパフォーマンスが最大 30%、コア数が最大 50%、メモリ帯域幅が最大 75% 向上します。

一方、Trainium 2 は、第 1 世代の Trainium チップよりも 4 倍高速にトレーニングできます。今年の J re:Invent では、AWS は Nvidia とのパートナーシップを拡大し、DGX Cloud、Ceiba と呼ばれる新しい GPU プロジェクト、生成 AI ワークロードをサポートする新しいインスタンスのサポートも含めました。

Nvidia はまた、ユーザーがチャットボットなどの生成 AI ツールを開発できるように、NeMo Retriever マイクロサービスを AWS に統合する計画も発表しました。 NeMo Retriever は、企業がカスタムの大規模言語モデル (LLM) を企業データに接続し、独自のデータに基づいて適切な AI 応答を生成できるようにする生成 AI マイクロサービスです。

さらに、AWS は、Nvidia の GH200 Grace Hopper スーパーチップをクラウドに導入する最初のクラウドプロバイダーになる予定であると述べました。

2. Amazon Bedrockの新しいベースモデル

Bedrock に追加された新しいモデルには、Anthropic の Claude 2.1 と Meta Llama 2 70B があり、どちらも現在入手可能です。 Amazon は、独自の Titan Text Lite および Titan Text Express ベースモデルも Bedrock に追加しています。さらに、クラウドサービスプロバイダーは、AI アプリケーション構築サービスにプレビューモデルである Amazon Titan Image Builder を追加しました。

AWS はまた、企業がユースケースやビジネスニーズに最適な基盤モデルを評価、比較、選択できるようにする新しい機能を Bedrock にリリースしました。

同社によれば、現在プレビュー段階にある「Amazon Bedrock のモデル評価」という機能は、ベンチマークの決定、評価ツールの設定、評価の実行など、複数のタスクを簡素化するように設計されており、これにより時間とコストが節約されると付け加えた。

3. Amazon SageMaker アップデート: 生成 AI のサポート

企業が大規模な言語モデルを効率的にトレーニングおよび展開できるようにするために、AWS は Amazon SageMaker 人工知能および機械学習サービスに 2 つの新製品、SageMaker HyperPod と SageMaker Inference をリリースしました。

同社によれば、HyperPod は、モデルのトレーニング用の機械学習インフラストラクチャの構築と最適化に伴う重労働を排除し、遅延、不必要な費用、その他の複雑さが生じやすい手動のモデルトレーニングプロセスと比較して、トレーニング時間を 40% 短縮します。

一方、SageMaker 推論は、企業がモデルの導入コストを削減し、モデル応答の遅延を短縮できるように設計されています。これを実現するために、Inference を使用すると、企業は同じクラウドインスタンスに複数のモデルを展開して、基盤となるアクセラレータをより有効に活用できるようになります。

AWS は、ビジネスアナリスト向けのローコード機械学習プラットフォームである SageMaker Canvas もアップデートしました。

AWSデータベース、分析、機械学習サービス担当ディレクターのスワミ・シヴァスブラマニアン氏は、アナリストは自然言語を使用してCanvasでデータを準備し、機械学習モデルを生成できると述べた。ノーコードプラットフォームは、Anthropic、Cohere、AI21 Labs の LLM をサポートしています。

SageMaker には、SageMaker Clarify と呼ばれるモデル評価機能も追加され、SageMaker Studio 内からアクセスできるようになりました。

4. Amazon Q: あらゆるものを生成するAIアシスタント

先週の火曜日、AWSのCEOアダム・セリプスキー氏は、クラウド大手のre:Invent 2023カンファレンスの主役であるAmazon Qを発表しました。これは、MicrosoftのGPT搭載Copilot生成AIアシスタントに対する同社の回答です。 Amazon Q は、アプリケーションの開発、コードの変換、ビジネスインテリジェンスの生成、ビジネスアプリケーションの生成 AI アシスタントとしての機能、Amazon Connect サービスによるカスタマーサービスエージェントの支援など、さまざまな機能のために企業で使用できます。

5. Amazon Braket プロジェクト: 量子コンピューティングの保存

クラウドサービスプロバイダーは、研究者に量子コンピュータへの直接かつプライベートなアクセスを提供する「Amazon Braket Direct」という新しいプログラムを発表した。このプロジェクトは、2020年にAmazon Bracket Directとともに開始された、AWSのマネージド量子コンピューティングサービス「Amazon Braket」の一部です。

アマゾンは、企業の研究者に待ち時間なしでさまざまな量子処理装置（QPU）の全能力へのプライベートアクセスを提供し、またアマゾンの量子コンピューティング専門家チームからワークロードに関する専門的な指導を受けるオプションも提供すると述べた。

現在、Direct プログラムは、IonQ Aria、QuEra Aquila、および Rigetti Aspen-M-3 量子コンピュータの保持をサポートしています。 IonQ は 1 時間あたり 7,000 ドル、QuEra Aquila は 1 時間あたり 2,500 ドルかかります。 Aspen-M-3 の価格は 1 時間あたり 3,000 ドルと若干高めです。

6. コスト最適化センターは企業の経費削減を支援します

re:Invent で発表されたアップデートには、AWS コスト最適化センターと呼ばれる新しい AWS 請求およびコスト管理機能が含まれており、企業は AWS コスト最適化推奨事項からの節約を簡単に特定、フィルタリング、集計、定量化できるようになります。

クラウドサービスプロバイダーによると、新しいハブは、AWS Cost Explorer や AWS Compute Optimizer などの AWS Cloud Financial Management (CFM) サービスからのすべてのコスト最適化推奨アクションを 1 か所に収集します。 AWS は、顧客固有の価格設定と割引をこれらの推奨事項に組み込み、重複した検出と節約を排除して、企業にコスト最適化の機会を包括的に提供すると付け加えました。

この機能により、FinOps またはインフラストラクチャ管理チームはコスト最適化の可能性をさらに高めることができます。

7. ゼロETL、ベクターデータベース、その他のアップデート

AWS は、データウェアハウスサービスのゼロ ETL を実現するための取り組みを継続しており、Amazon Aurora PostgreSQL、Amazon DynamoDB、Amazon RDS for MySQL との新しい Amazon RedShift 統合を発表しました。

企業では、多くの場合、抽出、変換、ロード (ETL) を使用して、複数のソースからのデータを単一の一貫性のあるデータストアに統合し、データウェアハウスにロードして分析します。

しかし、ほとんどのデータエンジニアは、異なるソースからのデータの変換は、生データのクリーニング、フィルタリング、再形成、要約などの手順を伴うため、困難で時間のかかる作業になると主張しています。 AWSによると、もう1つの問題は、分析を実行するためのデータパイプラインを準備するチームのメンテナンスコストが増加することだ。

対照的に、同社によれば、新しいゼロ ETL 統合により、Aurora PostgreSQL、DynamoDB、RDS for MySQL、RedShift 間で ETL を実行する必要がなくなる。これは、これらのデータベース内のトランザクションデータをほぼ瞬時に RedShift にコピーして分析を実行できるためである。

re:Invent のその他の Generative AI 関連の更新には、Amazon の Bedrock ベクターデータベースのサポートの更新が含まれていました。これらのデータベースには、Amazon Aurora や MongoDB が含まれます。サポートされているその他のデータベースには、Pinecone、Redis Enterprise Cloud、Amazon OpenSearch Serverless の Vector Engine などがあります。同社はまた、クラウドベースの開発ツールである Amazon CodeCatalyst に新しいエンタープライズ価格帯を追加しました。

参考リンク: https://www.infoworld.com/article/3711385/aws-reinvent-2023-7-takeaways-from-the-big-annual-event.html

<<: クラウド移行に関する注意事項 | ByteDance のクラウドインフラストラクチャの実践を理解するための図

>>: 言葉が出ません！私は Java の面接に来ましたが、なぜビッグデータ用の Kafka について質問するのですか?