テンセントクラウドのオーディオとビデオのAI技術は、超高速高解像度ワールドカップライブ放送の「舞台裏のヒーロー」です

テンセントクラウドのオーディオとビデオのAI技術は、超高速高解像度ワールドカップライブ放送の「舞台裏のヒーロー」です

[オリジナル記事は51CTO.comより] あっという間にワールドカップが終わりに近づいています。サッカーを観るかどうか、サッカーを理解しているかどうかに関係なく、これはワールドカップ中に常に話題になる。これまでのワールドカップを振り返ると、ファンがワールドカップの美しさ、情熱、そして汗をよりリアルに感じられるよう、新たなテクノロジーが活用されてきました。今年のワールドカップは、依然としてクラウドコンピューティングや人工知能などの新しいテクノロジーのサポートに依存しています。たとえば、従来のテレビの生放送を、オンライン ライブ放送用の新しいメディア プラットフォームを使用するように変更します。

5月末、中国中央ラジオテレビはワールドカップの新たなメディア著作権を配布することを決定した。鮮明でスムーズなライブ放送効果を実現するために、CCTV は最終的に Tencent Cloud を選択し、超高速の高解像度ライブ放送技術サポートを提供しました。ワールドカップのライブ放送、CCTV.com、CCTVの音声と映像の鮮明さと滑らかさは、多くの人々に深い印象を残したに違いないと思います。では、Tencent Cloud は高解像度のライブ放送の背後でどのような新しいテクノロジーを使用したのでしょうか? CCTV が Tencent Cloud を選んだのはなぜですか?

スポーツ中継の課題:鮮明さと滑らかさ

これまで、視聴者はワールドカップをテレビでしか観ることができず、映像が止まったり不明瞭になったりすることはほとんどなかった。ただし、オンラインライブストリーミングはライブTVストリーミングほど安定していません。ネットワーク帯域幅などの要因により、画像がフリーズしたり、オーディオとビデオのタイムスタンプが非同期になる可能性が高くなります。

通常、スムーズなビデオ視聴を実現するために、ユーザーはビデオのビット レートを下げ、スムーズ品質または標準解像度品質を選択してビデオを視聴する必要があります。しかし、ワールドカップのような重量級のイベントでは、これは明らかに観客や生放送局が望んでいる結果ではない。実際、ビデオはインターネット上で最も帯域幅を消費するコンテンツ形式です。インターネット スポーツ イベントのライブ放送では、ビデオの高周波モーション イメージの鮮明さと滑らかさを実現することが常に最大の課題でした。

では、ライブ放送の品質とユーザーにとっての画像の鮮明さをどのように確保できるのでしょうか? Tencent Cloud はどのようにそれを実現するのでしょうか?

[[236416]]

Li Haiqi、Tencent Cloud シニアプロダクトマネージャー

先日開催されたテンセントクラウドメディアサロンで、テンセントクラウドのシニアプロダクトマネージャーである李海奇氏は次のように述べた。「ビデオ会社にとって、帯域幅の支出は運用コストの大きな部分を占めています。ユーザーに高解像度のビデオ体験を提供したい場合、ビデオストリームのビットレートを上げる必要があり、対応する帯域幅の総コストもさらに増加し​​ます。Tencent Cloud Ultra HDはこの問題を解決し、より低いビットレートでより高解像度のビデオをユーザーに提供できます。」

CCTVのワールドカップ生中継を支える技術 - テンセントクラウドの超高速HD

李海奇氏は記者団に対し、通常のトランスコーディング技術には、トランスコーディングの歪み、低解像度のぼやけ、レンズの揺れ、高ノイズ、低ビットレートのギザギザのブロックなど、多くの品質上の問題があると語った。これらは、トランスコーディングプロセス全体で対処する必要がある基本的な問題の一部である。

Tencent Cloud の超高速 HD テクノロジー (「インテリジェント ダイナミック エンコーディング テクノロジー」とも呼ばれる) は、主に機械学習を使用して、ビデオ シーンのインテリジェント分類、エンコーディング パラメータのマッチング、前処理、ダイナミック エンコーディングの最適化、インテリジェント ビット レート制御、ディテールの削減、ROI 処理などのテクノロジーとプロセスを通じてライブまたはオンデマンドのビデオ ストリームをインテリジェントに処理し、最適なエンコーディング パラメータに一致させることで、より低い帯域幅コストでより高解像度のライブ ビデオ ストリームをユーザーに提供します。

この技術は、ビデオソースのビットレート、フレームレート、解像度、テクスチャ、モーション変化の振幅、および総合的なマシン負荷と画質を組み合わせたシーン分類に基づくリアルタイムの認識結果に基づいて、最適なエンコードパラメータを選択します。同時に、画質処理の面では、さまざまなシーンに応じて画像を分類し、ビデオソース画像のテクスチャとリアルタイムのモーション検出結果を組み合わせて、シャープ化、ソフトブラー、デインターレース、デブロッキング、ノイズ低減、色レベル補正、フレーム削減などの前処理を実行できます。

テンセントクラウドの超高速HDテクノロジーは、主にシーンインテリジェント認識、ビデオダイナミックエンコーディング、ビデオエンハンスメントの3つのモジュールを通じてライブビデオストリームのインテリジェントエンコーディングを実現すると報告されています。

インテリジェントなシーン認識の面では、超高速高解像度技術サービス中に、ライブストリームをリアルタイムで検出および分析し、対応するシーンモデルをマッチングすることができます。ビデオ ストリームに基づいてライブ ビデオ シーンを識別し、それがスポーツ イベントであるかどうか、また、そうである場合は、サッカー、バスケットボール、テニスのいずれであるかを識別します。同時に、個々のシーンに対してインテリジェントな認識も採用されています。例えば、サッカーの試合であれば、クローズアップなのか、ロングショットなのか、シュートなのかなどをリアルタイムで識別する必要があります。そして、シーン分類のリアルタイム認識結果に基づいて、映像を動的にエンコードします。まず現在の基本的なエンコーディング ライブラリを一致させ、次にリアルタイムのモーション シーンに応じて次のより詳細なエンコーディング ライブラリを一致させます。 ***、ビデオ強化を実現します。視聴者の注目の重要な領域は強化され、重要でない領域は弱まります。たとえば、観客エリアや看板エリアが弱まる可能性があります。

CCTV が Tencent Cloud を選んだのはなぜですか?

CCTV は、ビデオ クラウド業界全体が非常に重視する顧客であり、すべてのクラウド ベンダーにとっての戦場です。今回のワールドカップの前に、CCTV がワールドカップ中の試合の鮮明度を向上させるために新しいテクノロジーを導入することを決定した後、さまざまなクラウド サービス プロバイダーが独自のソリューションを提供しました。

Tencent Cloud は、レート制御、ぼかし除去、ブロック解除、インターレース解除、モーション検索、ブロック決定などのモジュールで数十件のサービスアップグレードと最適化を実施しました。数々の競争を経て、CCTV.com は最終的に Tencent Cloud を選択しました。同じ解像度1024*576、フレームレート25で、Tencent Cloudの超高速HDテクノロジーは887kbpsという低いビットレートを実現しますが、他の2つのクラウドサービスプロバイダーのビットレートは963kbpsと941kbpsです。 VMAF モデルはビデオ品質を評価するために使用されます。 Tencent Cloud のビットレートは競合他社よりも約 8% ~ 10% 低くなります。

「ワールドカップ開幕戦中、さまざまな生放送で頻繁に問題が起きたが、CCTV VideoはTencent Cloudの超高速高解像度技術のサポートにより、一挙に評判の逆転を果たした」とTencent Cloudの上級エンジニア、Lu Lin氏は述べた。

[[236417]]

テンセントクラウドのシニアエンジニア、ルー・リン氏

ワールドカップの生中継をサポートした経験について、盧林氏は次のように語った。「実は、今年の春節の頃から、テンセントクラウドはワールドカップの試合シナリオのためのディープラーニングをすでに開始していました。」今年の春節以降、Tencent Cloud の超高速 HD サービスはいくつかの主要なゲームライブ放送プラットフォームに接続し始め、良好なフィードバックを得ています。

これまで、Tencent Cloud の Web クローラーは 500 本以上のサッカー試合のビデオをクロールしていました。私たちは、各ゲームビデオの高速モーションシーンでの視覚効果分析と最適化効果評価、サッカーの追跡モデルのトレーニング、ロングショットの最適化、素晴らしいリプレイのための ROI 領域の拡張、観客の表情のキャプチャなどの詳細を実施し、最先端の動的エンコーディング モデルを実現します。

テンセントクラウドは、ワールドカップ前に、中国スーパーリーグやプレミアリーグの試合で、Longzhu LiveやNew England Sportsに超高速HDサービスを宣伝し、構築したAIモデルのトレーニングを開始していた。彼らは、中国スーパーリーグとプレミアリーグの間には多くの違いがあることを発見した。中国スーパーリーグの試合ペースはプレミアリーグよりも遅いため、さまざまなモデルに合わせてより的を絞った調整が必要になります。

ワールドカップのペースは、中国スーパーリーグとプレミアリーグの中間くらいですが、プレミアリーグの速いペースに近い傾向があります。そのため、ワールドカップ期間中は、ワールドカップのイベントとの一貫性を高めるために、以前の AI モデルを一致させました。

さらに、すでに時間が迫っていたワールドカップ前夜に、テンセントクラウドは新たな民営化計画を打ち出し、CCTV.comに完全なテンセントクラウド超高速高解像度トランスコーディングクラスターを設置し、ワールドカップ期間中のCCTV.comのCCTV5チャンネルの生放送、RTMP/FLVプッシュおよびプルソースストリームをサポートし、トランスコーディング処理後のCCTV RTMP/FLV/HLSプルストリームをサポートしました。

最後に、ワールドカップの開始前に、Tencent Cloud は顧客のハードウェア デバイスとソフトウェア コード モジュールのさまざまな適応要件に対応しました。現在、このプランのすべてのサービス指標は正常であり、流出効果は予想を上回り、放送効果は他のプラットフォームと比較して明らかな優位性を持っています。

AI対応のオーディオとビデオ、非常に高速で柔軟性が高い

記者は、テンセントクラウドの超高速HD技術が、テンセントクラウドのオーディオおよびビデオAIソリューションの最も重要な機能の1つであることを知りました。

少し前、2018年のTencent Cloud「Cloud + Future」サミットで、ゲームライブストリーミング業界が直面しているコストと技術的な問題を解決するために、Tencent CloudはオーディオとビデオのAIソリューションであるMing​​mouをリリースしました。音声・映像技術とAI人工知能の組み合わせでどんな火花が生まれるのか? Tencent Cloud Mingmou の能力が最良の証拠です。

Tencent Mingmou は、ビデオシーンの種類をインテリジェントに判断し、さまざまな種類のビデオの処理を最適化して、より低い帯域幅でより高解像度の視聴体験をユーザーに提供します。 Tencent Video CloudはAIについて十分な理解を持っていると言えます。 Tencent Mingmou は、超高速 HD、インテリジェントなモーション効果、インテリジェントな編集、インテリジェントな字幕という 4 つのコア機能をカバーしています。汎エンターテインメントライブ放送、オンラインビデオ、ショートビデオ、ラジオやテレビの新メディアなど、ビデオ業界チェーン全体をカバーできます。具体的な実装面では、ナローバンドHD、スーパー解像度、ダイナミックコーディング、ボディランゲージ認識、スマートペンダント、スキンビューティー、ポートレート検索、スマートカバー、スマートタグ、音声認識、リアルタイム翻訳、混合ストリーム出力など、複数のアプリケーションシナリオにより、AIテクノロジーが十分に反映されます。

その中で、超高速HDサービスはAI技術を使用して、Mingmouがビデオシーンの種類をインテリジェントに判断できるようにします。同じビデオ内の異なるセグメントに対して、完全に異なる IBP フレーム タイプ、量子化パラメーター QP、解像度、およびその他のエンコード パラメーターを適用し、ビデオ品質を低下させることなくビデオ ビット レートを削減して、CDN 帯域幅を削減します。

Tencent Cloudは、ビデオ分野におけるテンセントの長年のリソースと技術の蓄積に依存し、企業に技術サポートを提供するだけでなく、企業とのリソース協力も実現するビデオクラウドエコシステムを構築し、トップライブブロードキャスト会社の80%の成長を支援しています。 「クラウド+未来」サミットで、テンセントクラウドは新しいオーディオおよびビデオAIソリューションとTencent-RTCを発表し、エコシステムがさらに改善され進化しました。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<:  アリババクラウドは金融グレードの分散アーキテクチャソリューションをアップグレードし、南京銀行のコアシステムのクラウド化を支援

>>:  Ceph オブジェクト ストレージに基づく階層型ハイブリッド クラウド ストレージ ソリューション

推薦する

鎧を身に着けて、Huawei Cloudは公共の安全をより安全にします

データは、企業の発展を推進する重要な生産要素であり、業界の変革と反復を促進する中核資産であり、我が国...

CubeFS - 新世代のクラウドネイティブストレージシステム

CubeFS は、S3、HDFS、POSIX などのアクセス プロトコルをサポートし、マルチレプリカ...

Baidu は多くのサイトを大規模に禁止しました。これが唯一の解決策です。

百度はアルゴリズムの大幅な調整を開始したと言われており、多くのウェブサイトのランキングが変わり、いく...

2017年のクラウドコンピューティング:巨人の影に渦巻く暗流

2017年、クラウドコンピューティング市場の競争はますます激しくなっています。Alibaba Clo...

サイトがそもそも存在しない場合にウェブサイトを復元するプロセス全体を記録し、図示する

以前、ウェブサイトのサイトが1位ではないケースを分析しました。実際には、ウェブサイトのサイトが1位で...

WeChat パブリック プラットフォームは草の根ウェブマスター マーケティングに適していますか?

WeChatパブリックプラットフォームの立ち上げは、草の根起業家に朗報をもたらした。大手メディアが自...

one.com - 無制限ホスティング/年間 13.8 ドル/1 年間 com/Net/Org/CC が無料

one.com ではプロモーションを実施中です: 無料の 15G スペース (PHP、MySQL、F...

desivps: ロサンゼルスの無制限トラフィック VPS、KVM 仮想化、月額 2 ドル、2G メモリ/1 コア/20g SSD

desivps は 年に設立され、検証可能な資格を有し、インドのムンバイに登録され、そこで事業を展開...

Weiboマーケティングのヒント9つ

ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービスWeibo は WeCh...

JD Cloud は着実な進歩で大きな成功を収め続けています!

[51CTO.com からのオリジナル記事] 政府クラウドは、クラウド コンピューティング テクノロ...

SEO最適化には「4段階」の最適化戦略の実装が必要です

歴史を通じて、勝者は王であり、敗者は盗賊である。項羽は皇帝としての気風はあったものの、劉邦のような戦...

2012年の5度の苦難の時期を経て、共同購入は安定: ウェブサイトの数はほぼ半減

業界の偽りの繁栄を経験した後、共同購入は徐々に混乱から抜け出し、昨年は安定した状態になりました。共同...

racknerd: すべての VPS が 30% オフ (最低 $16/年)。さらに「赤い封筒」イベントを利用して、超お得な VPS を安く購入することもできます。

旧正月期間中、Racknerd は 30% オフのプロモーションを実施しています。これは、公式の通常...

売り手のための SEO 統計 21 選

しかし、なぜ販売者はSEO を行うのでしょうか?次の一連のデータが答えを与えてくれるかもしれません↓...

地元の中古品情報ネットワークを半年運営した経験を共有

近年、競争が少なく、運営コストが低く、視聴者が幅広い(都市には少なくとも数十万人が住んでいる)などの...