AWS が新しい機械学習サービスを発表、世界初のディープラーニングカメラを開発者に提供

AWS が新しい機械学習サービスを発表、世界初のディープラーニングカメラを開発者に提供

[51CTO.com からのオリジナル記事] 本日開催された AWS Re:Invent カンファレンスにおいて、Amazon Web Services (AWS) は、開発者向けの 5 つの新しい機械学習サービスとディープラーニング ワイヤレス ビデオ カメラを発表しました。 Amazon SageMaker は、開発者やデータサイエンティストが独自の機械学習モデルを迅速に構築、トレーニング、デプロイ、管理するために使用できる、完全に管理されたサービスです。 AWS はまた、リアルタイムのコンピュータビデオモデルを実行して開発者に機械学習の実践的な体験を提供できるディープラーニングベースのワイヤレスビデオカメラである AWS DeepLens もリリースしました。さらに、AWS は、開発者が人間の認知能力をシミュレートするアプリケーションを構築できるようにする 4 つの新しいサービスを発表しました。音声をテキストに変換する Amazon Transcribe などです。異なる言語間でのテキスト翻訳のための Amazon Translate。自然言語を理解するための Amazon Comprehend; Amazon Rekognition Video は、ビデオコンテンツをバッチでリアルタイムに分析できる新しいコンピュータービデオビジョンサービスです。

[[211949]]

AWS ディープレンズ

Amazon SageMaker と AWS DeepLens が一般開発者に機械学習をもたらす

現在、機械学習の実装プロセスは非常に複雑で、多くの試行錯誤を伴い、実装担当者には専門的なスキルが求められます。開発者とデータ サイエンティストは、まずデータを視覚化し、変換し、前処理して、アルゴリズムがモデルをトレーニングするために使用できる正しい形式にする必要があります。最も単純なモデルであっても、トレーニングには大量のコンピューティング リソースと時間が必要であり、企業は多数の GPU 搭載サーバーによって確立されたトレーニング環境を管理するために専任チームを雇う必要がある場合もあります。さらに、モデルトレーニングのプロセス全体は、人間の介入と推測に満ちています(アルゴリズムの選択と最適化から、モデルの精度に影響を与える数百万のパラメータの調整まで)。その後、トレーニング済みのモデルを実際のアプリケーションに導入するために、さまざまな専門スキルを使用してアプリケーション設計を調整し、分散システムに接続する必要があります。データ セットと変数が大きくなるにつれて、モデルは古くなり、再トレーニングが必要になるため、顧客は上記のプロセスを繰り返す必要があります。そうしないと、新しい情報に基づいて学習および開発することができなくなります。これらすべてをサポートするには多くの専門知識が必要であり、必然的に多くのコンピューティング リソース、ストレージ容量、および時間が必要になります。現在、機械学習はほとんどの開発者にとって手の届かないものとなっています。

Amazon SageMaker は、機械学習プロセスの各段階に伴う面倒な作業や推測を排除する、完全に管理された機械学習サービスです。 Amazon SageMaker は、事前に構築された開発ノートブック、PB レベルのデータセットに最適化されたさまざまな一般的な機械学習アルゴリズム、およびモデルの構築とトレーニングの難易度を効果的に軽減できる自動モデルチューニングメカニズムを提供します。 Amazon SageMaker は、トレーニングプロセスを大幅に簡素化および高速化し、インフラストラクチャの構成と管理を自動的に完了し、それを使用してモデルをトレーニングし、推論を実行して予測を完了することもできます。 AWS DeepLens は、物理デバイスと広範なチュートリアル、サンプルソースコード、使い慣れた AWS サービスを組み合わせることで、開発者がモデルの構築、トレーニング、デプロイの実践的な経験を積めるようにゼロから設計されています。

AWS の機械学習担当副社長である Swami Sivasubramanian 氏は、次のように説明しています。「AWS の当初のビジョンは、あらゆるユーザーが世界最大の企業と同じテクノロジー、ツール、規模、コスト構造を利用できるようにすることでした。私たちは、機械学習のスキルに関係なく、すべての開発者が機械学習ツールを幅広く、そして効果的に使用できるようにしたいと考えています。Amazon SageMaker は、機械学習プロセスの多くの課題と複雑さを取り除き、開発者がモデルを簡単に構築、トレーニング、およびデプロイできるようにします。」

Amazon SageMaker を使用すると、開発者は次のことが可能になります。

パフォーマンスが最適化されたアルゴリズムを使用して機械学習モデルを簡単に構築: Amazon SageMaker は、開発者が Amazon S3 に保存されているデータを簡単に探索および視覚化し、さまざまな一般的なライブラリ、フレームワーク、インターフェイスを使用してデータを変換できる、完全に管理された機械学習ノートブック環境です。 Amazon SageMaker には、数十の最先端のディープラーニングアルゴリズム (k-means クラスタリング、因数分解、線形回帰、主成分分析など) が含まれており、AWS に最適化されたアルゴリズムは標準実装よりも 10 倍高速に実行されます。開発者はアルゴリズムを選択してデータソースを指定するだけで、Amazon SageMaker が基盤となるドライバーとフレームワークをインストールして構成します。 Amazon SageMaker にはネイティブの TensorFlow と Apache MXNet の統合も含まれており、将来的にはさらに多くのアーキテクチャ サポート機能が導入される予定です。開発者は、Amazon EC2 コンテナレジストリ内のコンテナにアップロードすることで、使用するフレームワークとアルゴリズムを指定することもできます。

高速で完全に管理されたトレーニング: Amazon SageMaker によりトレーニングが簡単になります。開発者は、Amazon EC2 インスタンスのタイプと数量、およびデータの場所を指定するだけで済みます。 Amazon SageMaker は、分散コンピューティング クラスターをセットアップし、トレーニングを実行し、結果を Amazon S3 に出力し、終了したらクラスターをシャットダウンします。 Amazon SageMaker は、ハイパーパラメータ最適化メカニズムを自動的に使用してモデルを調整し、何千もの異なるアルゴリズムパラメータの組み合わせを同時に調整して、より高い予測精度を実現します。

ワンクリックで本番環境へのモデル展開: Amazon SageMaker は、インスタンスの起動、モデルの展開、安全な HTTPS エンドポイントの設定を行い、アプリケーションの高データスループットと低レイテンシーの予測を保証すると同時に、複数のアベイラビリティーゾーン (AZ) にわたって Amazon EC2 インスタンスを自動的にスケーリングします。また、A/B テストのネイティブ サポートも提供します。実稼働環境では、Amazon SageMaker により、機械学習インフラストラクチャの管理、ヘルスチェックの実行、セキュリティパッチの適用、その他の定期的なメンテナンスタスクの完了といった面倒な作業が不要になります。

AWS DeepLens を使用すると、開発者は次のことが可能になります。

機械学習を実際に体験してみましょう。AWS DeepLens は、すべての開発者がディープラーニング機能を利用できるように設計された、業界初の完全にプログラム可能なディープラーニングカメラです。 AWS DeepLens には、複雑なディープラーニング コンピュータ ビジョン モデルをリアルタイムで実行できるオンボード コンピュータを備えた高解像度カメラが含まれています。カスタム設計されたハードウェアは、1 秒あたり 1,000 億回以上のディープラーニング操作を実行でき、サンプル プロジェクト、サンプル コード、事前トレーニング済みモデルが付属しているため、経験の浅い開発者でも 10 分以内に開始できます。開発者はチュートリアルを拡張し、AWS Lambda 関数を使用して独自のカスタマイズされたディープラーニング プロジェクトを作成できます。たとえば、ユーザーは AWS DeepLens をプログラムして、ナンバープレートの番号を認識し、ホームオートメーションシステムをトリガーしてガレージのドアを開けたり、ペットの犬がソファに登ったことを認識して、飼い主にテキスト警告を送信したりできます。

クラウドでモデルをトレーニングし、AWS DeepLens にデプロイする: AWS DeepLens は Amazon SageMaker と統合できるため、開発者は Amazon SageMaker を使用してクラウドでモデルをトレーニングし、AWS マネジメントコンソールで数回クリックするだけで AWS DeepLens にデプロイできます。カメラは独自のデバイス上でモデルをリアルタイムで実行できます。

「NFL の公式テクノロジープロバイダーとして AWS との関係を深め、Amazon SageMaker を次世代の分析ソリューションとして活用しています」と NFL CIO 兼 SVP の Michelle McKenna-Doyle 氏は説明します。 「Amazon SageMaker をツールセットに導入することで、開発者は機械学習パイプラインで車輪の再発明を心配する必要がなくなり、代わりにファンが喜ぶ視覚化、統計、エクスペリエンスを構築できるようになります。」

高解像度の地球画像、データ、分析サービスの世界有数のプロバイダーである DigitalGlobe は、毎日数え切れないほどのデータを扱っています。 「DigitalGlobe では、AWS クラウドに保存されている 100 PB の画像ライブラリを使用して、衛星画像の検索、アクセス、ディープラーニング分析の実行を容易にすることに取り組んでいます」と、Maxar Technologies の CTO 兼創設者である Walter Scott 博士は述べています。 「私たちは、ホストされた Jupyter ノートブックを使用して、ペタバイト規模の地球観測画像データセットを使用してモデルをトレーニングするために Amazon SageMaker を使用する予定です。これは、DigitalGlobe の地理空間ビッグデータ プラットフォーム (GBDX) のユーザーがボタンを押すだけでモデルを作成し、スケーラブルな分散スケール環境にデプロイできることを意味します。」

Hotels.com は世界有数のホテル ブランドであり、41 の言語で 90 のローカライズされた Web サイトを運営しています。 「Hotels.com では、最新のテクノロジーを活用し、イノベーションで常に最先端を行くために、より迅速に行動することに全力を注いでいます」と、Hotels.com および Expedia Affiliate Network の副社長兼最高データ サイエンス責任者であるマット フライヤー氏は述べています。 「Amazon SageMaker を使用すると、当社のチームは、分散トレーニング、最適化されたアルゴリズム、組み込みのハイパーパラメータを使用して、最大のデータセットでより正確なモデルを迅速に構築し、モデルを本番環境に導入するまでの時間を短縮できます。Amazon SageMaker は、1 回の API 呼び出しで機械学習の複雑さを大幅に軽減し、お客様に優れたエクスペリエンスを迅速に提供できるようにします。」

Intuit は機械学習の大きな価値と威力も認識しており、それを活用して顧客の日常的な意思決定の改善とワークフローの合理化を支援しています。 「Amazon SageMaker を使用すると、プラットフォーム上でアルゴリズムを構築して展開することで、AI プロジェクトの規模を加速できます」と、同社の最高データ責任者である Ashok Srivastava 氏は説明します。 「当社は、新たな大規模な機械学習およびAIアルゴリズムを作成し、それをプラットフォームに導入して、顧客が直面する複雑な問題を解決します。」

ロイターは、ニュースと情報を提供する世界有数の専門リソースプロバイダーです。 「過去25年間、当社はお客様が情報を発掘、接続、強化、整理、提供し、業務を効率化し、より多くの価値を得られるよう支援する高度な機械学習機能を開発してきました」とロイターの人工知能・認知コンピューティングセンター長、ハリド・アルコファヒ氏は述べた。 「Amazon SageMaker を使用することで、質疑応答アプリケーションのコンテキストで自然言語処理機能を設計することができました。私たちのソリューションには、Amazon SageMaker のパワーを活用する複数のディープラーニング構成が必要でした。」

「ディープラーニングは、私たちの学生にとって本当に刺激的なものです。毎週のように、ロボット工学、言語、生物学の分野で新たな進歩が生まれているようです」とカーネギーメロン大学コンピューターサイエンス学部の学部長アンドリュー・ムーア氏は語った。 「AWS DeepLens の素晴らしいところは、機械学習の実験を真に民主化できる可能性があることです。私たちのような大学は、AWS DeepLens を教室や研究室に導入して、学生がディープラーニングを現実世界で理解するまでの過程を加速できることを嬉しく思っています。」

新しい音声、言語、視覚サービスにより、アプリケーション開発者はインテリジェントなアプリケーションをより簡単に構築できるようになります。

機械学習の専門知識はないが、これらのテクノロジーを使用して新しい AI ベースのアプリケーションを構築することに関心のある開発者向けに、Amazon Transcribe、Amazon Translate、Amazon Comprehend、Amazon Rekognition Video は、スケーラブルでコスト効率に優れた、高品質で正確な機械学習サービスを提供します。 「Amazon S3 をスケーラブルで信頼性が高く、安全なデータレイクとして利用するお客様が増えており、これまで以上に大量のデータを保存するようになっています」と、AWS の機械学習担当副社長である Swami Sivasubramanian 氏は述べています。 「これらのお客様は、このデータを自社のビジネスや顧客のために活用したいと考えています。そのため、データ内のインテリジェンスを解き放つための使いやすいツールとテクノロジーが必要です。私たちは、開発者が今日から周囲の世界を見て、聞いて、話し、対話できる次世代のインテリジェント アプリケーションの作成を開始できるように、これら 4 つの新しい機械学習アプリケーション サービスを提供できることを嬉しく思います。」

Amazon Transcribe (現在プレビュー中) を使用すると、音声からテキストへの変換が可能になり、開発者は Amazon S3 に保存されている音声ファイルを句読点付きの正確で完全なテキストに変換できます。 Amazon Transcribe は、コールセンターの録音などの低忠実度の音声を高精度で処理するようにトレーニングされています。 Amazon Transcribe は各単語にタイムスタンプを生成するため、開発者はテキストをソースファイルと正確に一致させることができます。現在、Amazon Transcribe は英語とスペイン語のみをサポートしており、今後サポートされる言語は増える予定です。今後数か月以内に、Amazon Transcribe が音声ファイル内の複数の話者を同時に識別し、開発者がカスタム語彙をアップロードして、それらの語彙を含む音声をより正確に書き起こせるように取り組んでいきます。

Amazon Translate (現在プレビュー中) は、最先端のニューラル機械翻訳テクノロジーを使用して、ある言語から別の言語へのテキストの非常に正確な翻訳を提供します。 Amazon Translate は、さまざまな長さのテキストを翻訳でき、英語とアラビア語、フランス語、ドイツ語、ポルトガル語、簡体字中国語、スペイン語の 6 つの言語間の翻訳をサポートしています。 2018年にはさらに多くの翻訳言語がリリースされる予定です。

Amazon Comprehend (GA) は、ドキュメント、ソーシャル ネットワークの投稿、記事、または AWS に保存されているその他のテキスト データの自然言語コンテンツを理解します。 Amazon Comprehend は、ディープラーニングを使用して、テキスト内のエンティティ (人物、場所、日付、組織など)、テキストで使用されている言語、テキストで表現されている感情、概念や形容詞 (美しい、暖かい、晴れなど) を含むキーフレーズを識別します。 Amazon Comprehend は、Amazon.com の製品説明や顧客レビューなど、幅広いデータセットでトレーニングされており、テキストから重要な洞察を抽出できる最先端の言語モデルを構築しています。また、アプリケーションがドキュメントのコレクションから共通のテーマを抽出するのに役立つトピック モデリング機能も備えています。 Amazon Comprehend は AWS Glue と統合されており、Amazon S3、Amazon Redshift、Amazon RDS、Amazon DynamoDB、またはその他の一般的な Amazon データソースに保存されているテキストデータをエンドツーエンドで分析します。

Amazon Rekognition Video (現在利用可能) は、Amazon S3 に保存されている大規模なビデオ アーカイブ内のオブジェクト、顔、有名人、不適切なコンテンツを追跡できます。また、ライブストリーミングビデオも提供し、何百万もの顔の顔認識を実行することもできます。 Amazon Rekognition Video は、何千ものオブジェクトとそのアクティビティを正確に検出し、Amazon S3 に保存されているライブビデオストリームやビデオコンテンツからコンテキストに基づいたアクティビティを抽出するようにトレーニングされたコンピュータービジョンモデルを搭載した使いやすい API を提供します。 Amazon Rekognition Video は、ビデオの特定の部分 (難破船、太陽、子供など) に自動的にラベルを付けて位置を特定したり、アクティビティ (走る、ジャンプする、泳ぐなど) を検出したり、顔を検出、認識、分析したり、フレーム内で部分的に隠れている場合でも複数の人間のオブジェクトを追跡したりできます。

「Isentia では、メディア インテリジェンス ソフトウェアを 1 つの言語で構築しています。機能を拡張し、顧客の多様な言語ニーズを満たすには、英語以外のメディア コンテンツを生成し、貴重な洞察を提供する翻訳サポートが必要でした」と、Isentia の CIO である Andrea Walsh 氏は述べています。 「Amazon Translate をパイプラインに簡単に統合できることに感銘を受けました。また、拡張性が高いため、あらゆる量の作業に対応でき、より正確で詳細な翻訳を実現して、顧客の厳しい要件を満たすことができます。」

「RingDNA は、営業チーム向けのエンドツーエンドのコミュニケーション プラットフォームです。数百の企業が RingDNA を使用して、生産性を大幅に向上させ、よりスマートな営業会話を実現し、予測的な営業インサイトを獲得し、成約率を改善し、営業担当者をトレーニングしています」と、RingDNA の CEO 兼創設者であるハワード ブラウン氏は述べています。 「RingDNA の会話 AI の重要なコンポーネントは、すべての通話を音声からテキストに統合的に書き起こす機能です。RingDNA は、Amazon Transcribe が大規模な高品質の音声認識を提供し、すべての音声書き起こしタスクをより適切に完了するのに役立つことに期待しています。」

「私たちは約1億人の読者に可能な限り最高の体験を提供するよう努めており、関連性がこの目標を達成する鍵となります」とワシントン・ポストのデータサイエンス責任者サム・ハン博士は語った。 「Amazon Comprehend は、キーワードやトピック API などの継続的にトレーニングされた自然言語処理機能を活用して、コンテンツのパーソナライズ、SEO、広告のターゲティングを改善するのに役立ちます。」

「顧客のビジネス推進に役立つインテリジェントなアプリケーションを構築することが、当社の目的の中核です」と、インフォアのソフトウェア開発担当副社長、マンジュナス・ガニマスティ氏は語る。 「Amazon Comprehend を使用すると、検索、チャット、ドキュメント内の非構造化テキストを分析して、意図や感情を理解できます。この機能により、Coleman AI スキルセットをトレーニングし、真にターゲットを絞ったカスタマイズされた検索エクスペリエンスを顧客に提供できます。」

「自然言語処理は難しい。私たちは、データを分析して理解するために、クローズドソースからオープンソースまであらゆるものを研究したが、俊敏性、拡張性、コスト効率を実現できるものは何も見つけられなかった」と、Elementum のエンジニアリング責任者である Minh Chau 氏は言う。 「Amazon Comprehend は継続的なトレーニング モデルを提供し、当社がビジネスに集中し、サプライ チェーン管理の分野で真の革新を実現できるようにします。」

「オーランド市は、アマゾンと協力し、初めての官民パートナーシップを通じて最新の公共安全ソフトウェアを試験的に導入できることを嬉しく思います」とオーランド警察署長のジョン・ミナ氏は述べた。 「このパイロットを通じて、オーランド市はアマゾンのRekognition VideoとAcuityの技術を既存の市のリソースと合わせて活用し、不審な人物が検知されたときにリアルタイムで群衆を検知して通知することで、オーランドや全国の他の都市の公共安全機能と運用効率をさらに向上させます。」

「Amazon Rekognition Video の分析機能は素晴らしいです」と、モトローラのチーフデータサイエンティスト、ダン・ロー氏は述べています。 「たとえば、従来は手作業で行われていた過去のビデオやリアルタイムのビデオを検索して、効率性と認識性を向上させるのに役立ちます。」

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<:  AWS が新しい IoT サービスを発表。機械学習をエッジに導入

>>:  AWS が AWS PrivateLink を発表

推薦する

5G、エッジコンピューティング、産業用IoT

新しい 5G ネットワークは、今後数年間で多くの産業分野に変革をもたらすでしょう。 5G ネットワー...

分散トランザクションのシナリオとソリューションを徹底的に理解するのに役立つ 12 枚の写真

[[346590]]著者は、正確にスケジュールされたタスクと遅延キュー処理機能を備えた、高同時実行シ...

Android マーケット - OPPO アプリケーション マーケット ASO 詳細説明

本日お話ししたいのは、OPPO App Market が店頭に並ぶ前から店頭に並んだ後までの運用プロ...

会社として商標を作りたいのですが、資金が足りません。初心者として、どうすればいいでしょうか?

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っていますよく、オン...

SharkTech: 10Gbps 無制限トラフィック サーバーが 500 ドル値下げ、40Gbps 防御が無料に

Sharktech、10Gbps 帯域幅サーバー、無制限トラフィックサーバー、スーパープロモーション...

A5 Webmaster Networkの第18回SEOトレーニングコースの申し込み受付を開始しました

トレーニングの目的: 今日のインターネットの急速な発展により、大量の高品質のトラフィックをウェブサイ...

草の根は成長の節目であるSEO戦略計画策定を経なければならない

時間が経つにつれて、あなたのノートは美しい芸術作品になります。すべての戦略がくしゃくしゃに丸められて...

PHPエラーを利用してリンクを取得する方法

1. 検索エンジンを使って問題のあるサイトを見つける少し前に、ウェブサイトで「壊れたリンクの構築」に...

Dapu.com の創設者、王志全氏: 電子商取引の「速くて遅い」やり方

「Da Pu は有名になりたくない。」この言葉は、注目を集めるためにお金を燃やすことに頼っている現在...

オンラインとオフラインのブランドのための 5 つのマーケティング戦略

さまざまなタイプのブランドが、さまざまな形態のストリートファイトを行っています。 01 2012年か...

中国のソーシャルリクルートメントは急速に発展しており、Weiboは新興プラットフォームとなっている

世界中の多くの企業が採用活動にソーシャルメディアを活用する方法を研究しており、中国市場の状況は参考に...

年末レビュー: 2018 年のオープンソース市場の 5 つの主要トレンド

2017 年はコンテナ エコシステムの開発における重要な年でした。今年、Amazon AWS、Mic...

クイズゲームコミュニティのQuizUpがテンセントとセコイアから2200万ドルを調達

QuziUp は数週間前に iOS で開始され、現在 500 万人を超えるユーザーがいるオンラインの...