テンセントクラウドのオーディオとビデオのAI技術は、超高速高解像度ワールドカップライブ放送の「舞台裏のヒーロー」です

テンセントクラウドのオーディオとビデオのAI技術は、超高速高解像度ワールドカップライブ放送の「舞台裏のヒーロー」です

[オリジナル記事は51CTO.comより] あっという間にワールドカップが終わりに近づいています。サッカーを観るかどうか、サッカーを理解しているかどうかに関係なく、これはワールドカップ中に常に話題になる。これまでのワールドカップを振り返ると、ファンがワールドカップの美しさ、情熱、そして汗をよりリアルに感じられるよう、新たなテクノロジーが活用されてきました。今年のワールドカップは、依然としてクラウドコンピューティングや人工知能などの新しいテクノロジーのサポートに依存しています。たとえば、従来のテレビの生放送を、オンライン ライブ放送用の新しいメディア プラットフォームを使用するように変更します。

5月末、中国中央ラジオテレビはワールドカップの新たなメディア著作権を配布することを決定した。鮮明でスムーズなライブ放送効果を実現するために、CCTV は最終的に Tencent Cloud を選択し、超高速の高解像度ライブ放送技術サポートを提供しました。ワールドカップのライブ放送、CCTV.com、CCTVの音声と映像の鮮明さと滑らかさは、多くの人々に深い印象を残したに違いないと思います。では、Tencent Cloud は高解像度のライブ放送の背後でどのような新しいテクノロジーを使用したのでしょうか? CCTV が Tencent Cloud を選んだのはなぜですか?

スポーツ中継の課題:鮮明さと滑らかさ

これまで、視聴者はワールドカップをテレビでしか観ることができず、映像が止まったり不明瞭になったりすることはほとんどなかった。ただし、オンラインライブストリーミングはライブTVストリーミングほど安定していません。ネットワーク帯域幅などの要因により、画像がフリーズしたり、オーディオとビデオのタイムスタンプが非同期になる可能性が高くなります。

通常、スムーズなビデオ視聴を実現するために、ユーザーはビデオのビット レートを下げ、スムーズ品質または標準解像度品質を選択してビデオを視聴する必要があります。しかし、ワールドカップのような重量級のイベントでは、これは明らかに観客や生放送局が望んでいる結果ではない。実際、ビデオはインターネット上で最も帯域幅を消費するコンテンツ形式です。インターネット スポーツ イベントのライブ放送では、ビデオの高周波モーション イメージの鮮明さと滑らかさを実現することが常に最大の課題でした。

では、ライブ放送の品質とユーザーにとっての画像の鮮明さをどのように確保できるのでしょうか? Tencent Cloud はどのようにそれを実現するのでしょうか?

[[236416]]

Li Haiqi、Tencent Cloud シニアプロダクトマネージャー

先日開催されたテンセントクラウドメディアサロンで、テンセントクラウドのシニアプロダクトマネージャーである李海奇氏は次のように述べた。「ビデオ会社にとって、帯域幅の支出は運用コストの大きな部分を占めています。ユーザーに高解像度のビデオ体験を提供したい場合、ビデオストリームのビットレートを上げる必要があり、対応する帯域幅の総コストもさらに増加し​​ます。Tencent Cloud Ultra HDはこの問題を解決し、より低いビットレートでより高解像度のビデオをユーザーに提供できます。」

CCTVのワールドカップ生中継を支える技術 - テンセントクラウドの超高速HD

李海奇氏は記者団に対し、通常のトランスコーディング技術には、トランスコーディングの歪み、低解像度のぼやけ、レンズの揺れ、高ノイズ、低ビットレートのギザギザのブロックなど、多くの品質上の問題があると語った。これらは、トランスコーディングプロセス全体で対処する必要がある基本的な問題の一部である。

Tencent Cloud の超高速 HD テクノロジー (「インテリジェント ダイナミック エンコーディング テクノロジー」とも呼ばれる) は、主に機械学習を使用して、ビデオ シーンのインテリジェント分類、エンコーディング パラメータのマッチング、前処理、ダイナミック エンコーディングの最適化、インテリジェント ビット レート制御、ディテールの削減、ROI 処理などのテクノロジーとプロセスを通じてライブまたはオンデマンドのビデオ ストリームをインテリジェントに処理し、最適なエンコーディング パラメータに一致させることで、より低い帯域幅コストでより高解像度のライブ ビデオ ストリームをユーザーに提供します。

この技術は、ビデオソースのビットレート、フレームレート、解像度、テクスチャ、モーション変化の振幅、および総合的なマシン負荷と画質を組み合わせたシーン分類に基づくリアルタイムの認識結果に基づいて、最適なエンコードパラメータを選択します。同時に、画質処理の面では、さまざまなシーンに応じて画像を分類し、ビデオソース画像のテクスチャとリアルタイムのモーション検出結果を組み合わせて、シャープ化、ソフトブラー、デインターレース、デブロッキング、ノイズ低減、色レベル補正、フレーム削減などの前処理を実行できます。

テンセントクラウドの超高速HDテクノロジーは、主にシーンインテリジェント認識、ビデオダイナミックエンコーディング、ビデオエンハンスメントの3つのモジュールを通じてライブビデオストリームのインテリジェントエンコーディングを実現すると報告されています。

インテリジェントなシーン認識の面では、超高速高解像度技術サービス中に、ライブストリームをリアルタイムで検出および分析し、対応するシーンモデルをマッチングすることができます。ビデオ ストリームに基づいてライブ ビデオ シーンを識別し、それがスポーツ イベントであるかどうか、また、そうである場合は、サッカー、バスケットボール、テニスのいずれであるかを識別します。同時に、個々のシーンに対してインテリジェントな認識も採用されています。例えば、サッカーの試合であれば、クローズアップなのか、ロングショットなのか、シュートなのかなどをリアルタイムで識別する必要があります。そして、シーン分類のリアルタイム認識結果に基づいて、映像を動的にエンコードします。まず現在の基本的なエンコーディング ライブラリを一致させ、次にリアルタイムのモーション シーンに応じて次のより詳細なエンコーディング ライブラリを一致させます。 ***、ビデオ強化を実現します。視聴者の注目の重要な領域は強化され、重要でない領域は弱まります。たとえば、観客エリアや看板エリアが弱まる可能性があります。

CCTV が Tencent Cloud を選んだのはなぜですか?

CCTV は、ビデオ クラウド業界全体が非常に重視する顧客であり、すべてのクラウド ベンダーにとっての戦場です。今回のワールドカップの前に、CCTV がワールドカップ中の試合の鮮明度を向上させるために新しいテクノロジーを導入することを決定した後、さまざまなクラウド サービス プロバイダーが独自のソリューションを提供しました。

Tencent Cloud は、レート制御、ぼかし除去、ブロック解除、インターレース解除、モーション検索、ブロック決定などのモジュールで数十件のサービスアップグレードと最適化を実施しました。数々の競争を経て、CCTV.com は最終的に Tencent Cloud を選択しました。同じ解像度1024*576、フレームレート25で、Tencent Cloudの超高速HDテクノロジーは887kbpsという低いビットレートを実現しますが、他の2つのクラウドサービスプロバイダーのビットレートは963kbpsと941kbpsです。 VMAF モデルはビデオ品質を評価するために使用されます。 Tencent Cloud のビットレートは競合他社よりも約 8% ~ 10% 低くなります。

「ワールドカップ開幕戦中、さまざまな生放送で頻繁に問題が起きたが、CCTV VideoはTencent Cloudの超高速高解像度技術のサポートにより、一挙に評判の逆転を果たした」とTencent Cloudの上級エンジニア、Lu Lin氏は述べた。

[[236417]]

テンセントクラウドのシニアエンジニア、ルー・リン氏

ワールドカップの生中継をサポートした経験について、盧林氏は次のように語った。「実は、今年の春節の頃から、テンセントクラウドはワールドカップの試合シナリオのためのディープラーニングをすでに開始していました。」今年の春節以降、Tencent Cloud の超高速 HD サービスはいくつかの主要なゲームライブ放送プラットフォームに接続し始め、良好なフィードバックを得ています。

これまで、Tencent Cloud の Web クローラーは 500 本以上のサッカー試合のビデオをクロールしていました。私たちは、各ゲームビデオの高速モーションシーンでの視覚効果分析と最適化効果評価、サッカーの追跡モデルのトレーニング、ロングショットの最適化、素晴らしいリプレイのための ROI 領域の拡張、観客の表情のキャプチャなどの詳細を実施し、最先端の動的エンコーディング モデルを実現します。

テンセントクラウドは、ワールドカップ前に、中国スーパーリーグやプレミアリーグの試合で、Longzhu LiveやNew England Sportsに超高速HDサービスを宣伝し、構築したAIモデルのトレーニングを開始していた。彼らは、中国スーパーリーグとプレミアリーグの間には多くの違いがあることを発見した。中国スーパーリーグの試合ペースはプレミアリーグよりも遅いため、さまざまなモデルに合わせてより的を絞った調整が必要になります。

ワールドカップのペースは、中国スーパーリーグとプレミアリーグの中間くらいですが、プレミアリーグの速いペースに近い傾向があります。そのため、ワールドカップ期間中は、ワールドカップのイベントとの一貫性を高めるために、以前の AI モデルを一致させました。

さらに、すでに時間が迫っていたワールドカップ前夜に、テンセントクラウドは新たな民営化計画を打ち出し、CCTV.comに完全なテンセントクラウド超高速高解像度トランスコーディングクラスターを設置し、ワールドカップ期間中のCCTV.comのCCTV5チャンネルの生放送、RTMP/FLVプッシュおよびプルソースストリームをサポートし、トランスコーディング処理後のCCTV RTMP/FLV/HLSプルストリームをサポートしました。

最後に、ワールドカップの開始前に、Tencent Cloud は顧客のハードウェア デバイスとソフトウェア コード モジュールのさまざまな適応要件に対応しました。現在、このプランのすべてのサービス指標は正常であり、流出効果は予想を上回り、放送効果は他のプラットフォームと比較して明らかな優位性を持っています。

AI対応のオーディオとビデオ、非常に高速で柔軟性が高い

記者は、テンセントクラウドの超高速HD技術が、テンセントクラウドのオーディオおよびビデオAIソリューションの最も重要な機能の1つであることを知りました。

少し前、2018年のTencent Cloud「Cloud + Future」サミットで、ゲームライブストリーミング業界が直面しているコストと技術的な問題を解決するために、Tencent CloudはオーディオとビデオのAIソリューションであるMing​​mouをリリースしました。音声・映像技術とAI人工知能の組み合わせでどんな火花が生まれるのか? Tencent Cloud Mingmou の能力が最良の証拠です。

Tencent Mingmou は、ビデオシーンの種類をインテリジェントに判断し、さまざまな種類のビデオの処理を最適化して、より低い帯域幅でより高解像度の視聴体験をユーザーに提供します。 Tencent Video CloudはAIについて十分な理解を持っていると言えます。 Tencent Mingmou は、超高速 HD、インテリジェントなモーション効果、インテリジェントな編集、インテリジェントな字幕という 4 つのコア機能をカバーしています。汎エンターテインメントライブ放送、オンラインビデオ、ショートビデオ、ラジオやテレビの新メディアなど、ビデオ業界チェーン全体をカバーできます。具体的な実装面では、ナローバンドHD、スーパー解像度、ダイナミックコーディング、ボディランゲージ認識、スマートペンダント、スキンビューティー、ポートレート検索、スマートカバー、スマートタグ、音声認識、リアルタイム翻訳、混合ストリーム出力など、複数のアプリケーションシナリオにより、AIテクノロジーが十分に反映されます。

その中で、超高速HDサービスはAI技術を使用して、Mingmouがビデオシーンの種類をインテリジェントに判断できるようにします。同じビデオ内の異なるセグメントに対して、完全に異なる IBP フレーム タイプ、量子化パラメーター QP、解像度、およびその他のエンコード パラメーターを適用し、ビデオ品質を低下させることなくビデオ ビット レートを削減して、CDN 帯域幅を削減します。

Tencent Cloudは、ビデオ分野におけるテンセントの長年のリソースと技術の蓄積に依存し、企業に技術サポートを提供するだけでなく、企業とのリソース協力も実現するビデオクラウドエコシステムを構築し、トップライブブロードキャスト会社の80%の成長を支援しています。 「クラウド+未来」サミットで、テンセントクラウドは新しいオーディオおよびビデオAIソリューションとTencent-RTCを発表し、エコシステムがさらに改善され進化しました。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<:  アリババクラウドは金融グレードの分散アーキテクチャソリューションをアップグレードし、南京銀行のコアシステムのクラウド化を支援

>>:  Ceph オブジェクト ストレージに基づく階層型ハイブリッド クラウド ストレージ ソリューション

推薦する

交流リンクの超詳しい知識まとめ

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています友好的なリ...

ウェブサイトの文字数を増やすための3つのヒント

いわゆる愛占語数とは、Baiduランキングにおけるキーワードの検索結果を指しますが、愛占語数を増やす...

ウェブマスターが見落としがちなコンテンツ: ユーザーデータへのアクティブアクセス

アクティブユーザーとは何ですか?アクティブな訪問ユーザーは、忠実なユーザーまたは独自のユーザーとも呼...

Google の最適化にはパンダ以前とペンギン以降があり、SEO 担当者はどのように対処すればよいのでしょうか。

Google の最適化は、「雨が降れば土砂降りになる」と表現できます。Google のアルゴリズムは...

SeFlow-i7-4770/32g メモリ/2x2T ハードディスク/20T フロー/500mddos 保護/39 ユーロ

2004 年に設立されたイタリアの企業である SeFlow は、2,000 を超える顧客、1,300...

検索エンジンランキングの総合分析

SEO に携わる皆様、長年 SEO に携わってこられ、専門家が書いた記事を数多くお読みになったことで...

藍雲鋒:オンラインマーケティングにおける悪事と悪事の不在の概念について

オンライン マーケティング (OM) は、テクノロジー、知恵、安定性、勤勉さの組み合わせです。 OM...

Shangshangqianの電子署名戦略はOracle NetSuiteと連携し、インテリジェントな管理の進歩に向けて前進します

より多くの専門家に専門的なことを任せることは、企業向けサービス分野で大きなトレンドとなり、近年ではイ...

品質と規模の開発 - コレクションに関する考察

品質と規模の発展:これは今日、大学創立10周年記念会議の報告で学長から聞いた内容です。(あまり重要で...

2013年にインターネット業界を揺るがすトップ10のトレンド:クラウドコンピューティングとO2Oがリストに

新たなインターネットの爆発的な普及が起こるたびに、その成功の理由が何度も分析され、成功体験から学ぼう...

導入(推奨):XenPower - 高コストパフォーマンス/高構成/Xen Vps

Xenpower は新しいブランドです。よく知らないと、おそらく使う勇気がないと思います。でも、その...

ロシアのホスティングプロバイダー:mchostの紹介、VPS+専用サーバー、無制限のトラフィック

mchost は 2004 年に設立され、ロシアの首都モスクワに登録されています。会社の住所、電話番...

甘やかされた子供のように振る舞うことは、生産性を高め、電子商取引サイトでの売上を伸ばす方法でもある。

概要: これは間違いなく、女性を夢中にさせ、男性を嫌わせるインターネットのイノベーションです。また、...

ドメイン名増加数の世界トップ10ドメイン名解決プロバイダー:HiChinaが3位に

IDC Review Network (idcps.com) は3月19日に次のように報じた。海外の...