大型模型で古い香港映画を復元:Volcano EngineとTikTokが共同で「クラシック香港映画復元プロジェクト」を開始

大型模型で古い香港映画を復元:Volcano EngineとTikTokが共同で「クラシック香港映画復元プロジェクト」を開始

8月16日、TikTok、中国電影資料館、Volcano Engineは北京で「継続する時間-香港クラシック映画修復会議」を開催し、香港のクラシック映画100本の4K修復を行い、古い香港映画の比類のない魅力を復活させると発表した。 Volcano Engine はプログラムに技術サポートを提供し、中国電影資料館と協力して映画の「AI + 手動」修復を行っています。完成した4Kリファイン映画の第一弾には、『酔拳伝』、『プロジェクトA』、『蜀山:新蜀山剣客』などがある。

Volcano Engine は、初めて、古い映画の修復現場に大規模な視覚モデルを適用します。強力な生成機能と豊富な事前知識により、透明度、色、滑らかさ、欠陥除去の点で修復効果の総合的な向上を実現します。

映画やテレビの修復に初めて使用された大型模型

公開情報によると、映画の修復作業は複雑かつ面倒で、経験豊富な修復者でも映画の修復を完了するには 1 か月かかります。近年、ディープラーニングなどのAI技術により、古いフィルムの修復の品質と効率を大幅に向上させることが可能になりました。

「実際、私たちは毎日古い映画を修復しています。」 Volcano Engine Video Cloudの技術アーキテクチャ担当ディレクターの王悦氏は、鮮明度が低い、滑らかさが低い、色の歪み、欠陥など、古い映画によくある画質の問題が、Douyinの大量の投稿作品にも広く見られると語った。 Volcano Engine は、TikTok にサービスを提供することで、古い映画の修復のための比較的完全なインテリジェント処理技術ソリューションのセットを開発しました。 Xigua VideoやTikTokと協力し、国内のクラシックアニメ100本とBeyondクラシックコンサートの4K復元を完了しました。

新しく登場した大型模型技術も、古い映画の修復に初めて使用されました。王悦氏は、一方では、大型モデルは生成能力が強く、復元効果は従来のアルゴリズムよりも優れており、画像の細部がより自然であると紹介した。一方、大規模モデルは非常に強力な情報構造化能力を持っています。大量のデータペアを学習した後、そこから多くの知識を抽出し、それをモデルパラメータに「保存」することができます。生成空間が充実しており、より多くの復元シナリオに対応できます。

「例えば、大量の犬の写真を『見る』ことで、大型モデルは犬がどのような外見をしているかを学習して記憶し、より鮮明に犬を『描く』ことができる」と王悦氏は述べた。

しかし、大型モデルの強力な発電能力は諸刃の剣でもあります。いくつかのシナリオではパフォーマンスが安定せず、アーティファクトや誤ったテクスチャが生成される傾向があります。 Stable Diffusion で表現される大規模なビジュアル モデルは、ほとんどが画像または単一フレーム アルゴリズムに基づいており、ビデオなどの複数フレーム シーケンス シナリオではパフォーマンスと安定性に問題があります。

古い映画の復元という特殊なシナリオを考慮して、火山エンジンマルチメディア研究所は、視覚的な大規模モデルのアルゴリズムを3つのレベルで最適化しました。画像生成の面では、モデルの境界条件を制御し、高品質の生成空間を強化することで、大規模モデルの画像出力品質が大幅に向上しました。ビデオシーンでは、時間領域オートエンコーダの設計、オプティカルフロー特徴の調整、時間領域条件制約などの技術的手段を採用することで、大規模モデルは復元プロセス中に前後のフレームの情報を活用し、ビデオタスクをより適切に処理できます。同時に、Volcano Engine は Intel と協力してアルゴリズムとエンジニアリングのさまざまな最適化を実施し、コンピューティング能力のコストを考慮しながら 4K シナリオでの大規模モデルの処理効率を大幅に向上させました。

修復前と修復後の『蘇啓爾伝』の比較

アルゴリズムは古典文化の継承に役立つ

王悦氏によると、火山エンジンマルチメディア研究所のエンジニアにとって、古い香港映画を修復する上での最大の課題はアルゴリズム技術ではなく、映画の本来の芸術的スタイルをいかに保存するかだという。

「中国電影資料館は多くの映画の修復にあたり、あらゆる手段を講じて原作者を修復実験室に招き入れようと努めてきた」と中国電影資料館の張暁光副館長は語った。 『酔拳』の4K修復はゴードン・チャン監督の芸術指導を受けた。

このプロセスの間、Volcano Engineと中国電影資料館は複数回のコミュニケーションと議論を実施しました。継続的なテストと調整を繰り返し、アルゴリズムが芸術に役立つという理想的な効果を実現しました。色かぶりと色処理を例にとると、従来の AI アルゴリズムは一連の客観的な色の問題を完了し、最適化することができましたが、一部の芸術的な色の復元においては逸脱が生じやすい傾向がありました。今回、Volcano Engineは、手動で修復された断片からデータを学習することで、より理想的な配色効果を獲得し、修復プロセスを加速できるAI加速型アート修復ソリューションを模索しました。

「私たちは古い映画に新たな命を吹き込む方法を常に考えています」と王悦氏は語った。 「大規模なモデルアルゴリズムを使用して古い映画の修復品質をさらに向上させることは、技術的な実践と文化遺産の両方の観点から有意義な試みです。」

Douyinの副社長である陳度野氏によると、今後1年間で『花男之明日』や『阿朗伝』を含む100本の香港映画の4K修復版がDouyinと西瓜動画で次々と公開される予定だという。

これら 100 本の香港映画は 1970 年代から 1990 年代にかけて制作されたもので、ゴードン・チャン、ツイ・ハーク、ジャッキー・チェン、スタンリー・クワン、チャウ・シンチーなど多くの監督の作品が含まれています。中国電影資料館の映画キュレーターである沙丹氏は、この時期が香港映画の黄金時代であったと語った。当時、中国本土は徐々に開放されつつあり、香港映画は多くの中国本土の若者にとって世界を理解するための窓口となった。

初期の撮影機材や技術の限界、またフィルムの保管や使用中に生じた損傷のため、私たちの記憶にある昔の香港映画は、ストーリーは鮮明だが、映像はぼやけて薄暗く不明瞭である。高解像度のビデオに慣れている視聴者にとって、従来の映画鑑賞体験を再び体験するのは、あまり心地よいものではありません。

「テクノロジーの力で、現代の若者も過去の名作に夢中になり、年配の観客が過去の思い出を追体験し、数世代にわたる共通の記憶を形成できるようになることを願っています」と王悦氏は語った。

<<:  Web およびクラウド開発、Rust は普及するでしょうか?

>>:  科学者は Google Cloud Platform を使用して心臓病研究用のスーパーコンピュータを複製

推薦する

Hostsolutions: €35/E5-2450L*2/32g メモリ/1gbps、苦情防止、著作権無視

ルーマニアのサーバー販売業者である hostsolutions が、米国 7.4 向けの格安サーバー...

ジ・シサンとの独占インタビュー:ビジネスと趣味の間で悩んだことはない

2012年8月、フェニックステクノロジーの記者がGuokr.comのCEOであるJi Shisan氏...

新年最初の仕事の日に、本番環境の分散ファイルシステムがクラッシュしました!

[[383073]]著者は、正確にスケジュールされたタスクと遅延キュー処理機能を備えた、高同時実行シ...

オンライン薬局の成長痛:資格不足と制御不能な物流

どのオンライン薬局も成長痛を抱えているビジネスデイリーグラフィックス、Xu Qiaowei 著200...

結婚や出会い系サイトは、信頼性のボトルネックに遭遇している:業界のルールの欠如

馬克佳「深セン市人民検察院が発表したデータによると、2012年に130人以上の女性が騙され、その半数...

2019 年に大人気の 9 つのクラウドネイティブ オープンソース プロジェクト

[[276535]]コンテナを使用していますか? Cloud Native Computing Fo...

デジタル技術が広東省の製造業のデジタル化を促進

デジタル経済の時代では、クラウドコンピューティング、ビッグデータ、人工知能などの技術の急速な発展と応...

グループ購入利益モデルをO2Oシステムに統合する方法の簡単な分析

熾烈な競争を経て、残った共同購入サイトも傷を負い、経営難に陥り、崩壊の危機に瀕している。ある日、共同...

50vm: 鎮江/貴州、専用サーバー 299 元/月、デュアルコア L5630/16g メモリ/20M 帯域幅

50vm は独立サーバーを推進しています。鎮江電信と貴州電信から選択できます。デュアルチャネル L5...

ウェブサイトのインタラクションデザイン分析: インタラクティブコンポーネントのマイクロイノベーション

インタラクションデザインの発展の歴史を振り返ると、革新的なインタラクションモードが広く受け入れられて...

2018 年のトップ 10 SDN ソリューション (これまでのところ)

ソフトウェアはネットワークの世界では中心的な存在であり、顧客はよりプログラム可能で柔軟性が高く、低コ...

テンセントYoutuラボ、テクノロジーの普及促進のためAI+公共福祉成果2件を発表

2019年グローバルデジタルエコシステムカンファレンスのAIサブフォーラムで、テンセントYoutuラ...

YY の生き残り哲学: 目立ちすぎないこと。付加価値サービスがブースターになる。

1年前、Duowan YYのCEOであるLi Xueling氏は会議でYY Voiceの成長ストーリ...

Baiduスナップショット苦情の実際の使用は、最新のBaiduスナップショットを復元します

2012 年 2 月 15 日の朝、私は自分のプロジェクトの 1 つを確認するために会社に来ましたが...

spinservers: Alipay/WeChat へのアクセス、超安価、高構成、米国内の独立サーバー、30 分以内の配信

spinserversから最新ニュースを受け取りました:中国市場を拡大するために、「Alipay」と...