WeChatがインテリジェントオープンプラットフォームを立ち上げ、音声と画像認識の応用シナリオを公式に説明

WeChatがインテリジェントオープンプラットフォームを立ち上げ、音声と画像認識の応用シナリオを公式に説明

[要約] WeChat インターフェースの利用範囲は、パブリックアカウントからサードパーティのアプリケーションにまで拡大しています。音声認識と画像認識は、最初のオープンなインテリジェント テクノロジーになりました。

WeChatインテリジェントオープンプラットフォームがリリースされました。公式サイト(pr.weixin.qq.com)

テンセントテクノロジーの王欣が4月8日に報じた。

WeChatは本日、インテリジェントオープンプラットフォームを正式にリリースしました。音声認識と画像認識は、サードパーティのアプリケーション開発者に公開された最初のインテリジェント認識テクノロジになりました。

関連する技術インターフェースを呼び出すことで、サードパーティのアプリケーションは、WeChat の音声テキスト変換や画像スキャンなどの既存の機能も実現できます。

WeChatパターン認識センターチームは、マイクやカメラなどのセンサーデバイスにより、人間と機械のやり取りがより便利になるとテンセントテクノロジーに語った。しかし、音声認識や画像認識の技術的ハードルはまだ比較的高い。WeChatが既存の技術的リソースを開発者に開放できれば、より多くのアプリケーションが技術投資コストを削減するのに役立つだろう。

音声認識技術は主に音声入力に反映され、ユーザーの音声を対応するテキストに直接変換できます。ユーザーはキーボードに頼ることなく、音声でテキスト入力を完了したり、機能操作を実行したりできます。

QQミュージックに音声認識技術が応用される

現在、QQ Musicの音声検索、Tencent Mapsの地理位置情報音声検索、Didi Taxiの音声テキストタクシー配車など、複数の製品がWeChatの音声認識技術を使用しています。 WeChatパターン認識チームによると、スマート玩具、スマート家電、ウェアラブルデバイスもこのインターフェースの応用分野になるという。

画像認識技術は主に表紙のスキャンなどの機能に使われます。 WeChatのパターン認識チームによると、この技術はすでに市場に出回っているほぼすべての本の表紙や映画のポスターを認識できるという。ユーザーは、屋外広告や映画館で映画のポスターを見かけた場合、携帯電話のカメラで写真を撮ったりスキャンしたりするだけで、対応する情報ページにジャンプし、映画の詳細、映画レビュー、映画館情報、オンラインでの有料購入など、一連の拡張コンテンツとサービスを取得できます。

映画のポスターに加えて、認識しやすい画像には、雑誌や本の表紙、製品のパッケージ、看板、写真などがあります。サーバーが対応する画像を一致させることができる場合、対応するウェブサイト、オーディオ、ビデオ、ソーシャルメディア、電子商取引チャネルなどがユーザーの携帯電話に表示されます。従来のメディアや電子商取引アプリケーションは、このテクノロジー インターフェイスの強力なパートナーになる可能性があります。

画像認識を使用して映画のポスターをスキャンする

インテリジェントオープンプラットフォームは、上記2つの技術プラットフォームに加えて、将来的には意味理解や顔認識などの技術も開拓していく予定です。音声認識など、ユーザーのモバイルライフを便利にする技術も研究対象に含まれています。

WeChat関連のインテリジェント技術インターフェースは、これまでWeChatの内部パブリックプラットフォームに提供されていました。このインテリジェントオープンプラットフォームの立ち上げにより、サービス範囲はパブリックアカウントから大規模なサードパーティアプリケーションにまで拡大されます。関連する技術インターフェースにアクセスしたいアプリケーション開発者は、アプリケーションの基本情報を入力してから 3 営業日以内にレビュー結果を取得できるようになります。審査に合格すると正式に利用できるようになります。

インテリジェントオープンプラットフォームの立ち上げ後も、WeChatアプリケーションのインテリジェント分野における探求は継続されます。 WeChatの関係者はテンセント・テクノロジーに対し、「シェイクして曲を検索」や「スキャン」などの機能がユーザーから好評を得ていることを明らかにした。しかし、もっと大きなサプライズはまだこれからだ。WeChatの新バージョンには、新たな「スマートサービス」が追加される。この新機能は再びユーザーの反響を呼ぶ可能性があると同社は考えているが、現時点では具体的な内容を紹介するのは困難だという。


原題:WeChatがインテリジェントオープンプラットフォームを発表、音声・画像認識の応用シナリオを公式に詳細説明

キーワード: WeChat、プラットフォーム

<<:  優れたトラフィックページの4つの主要コンポーネント

>>:  マイクロソフトは本日からXPのサポートを終了:国内ユーザー2億人に影響

推薦する

他の人の記事を再投稿する場合は、ソースアドレスを忘れずに残してください。

なぜ今日この記事を書き始めたいのか?それは、他の人の記事を収集し、彼らの努力を尊重しないウェブマスタ...

#黒5# alphavps: 15 ユーロ/年/KVM/512m メモリ/128g ハード ドライブ/複数のコンピュータ ルーム利用可能

Alphavps のブラック フライデーとサイバー マンデーが一緒にやって来ます: 安価な OVZ ...

北京工商局がオンライン虚偽広告5件を摘発、アマゾンが名指し

「オクスターウサギの毛皮」と称していたが、実際は「アクリル繊維」だった。「三級病院」と称していたが、...

LG、米国に新たなクラウドコールセンターを発表

海外メディアによると、LGは米国に新たなクラウドコールセンターを開設すると発表した。この動きは、アフ...

アリババDAMOアカデミーヤングオレンジ賞「ハードコア10人」受賞者が発表、鍾南山が若手科学者に激励の言葉を送る

9月9日、2020年度アリババDAMOアカデミーヤングオレンジ賞の受賞者が発表され、梁文華氏と他の1...

ウェブサイト運営ディレクターに必要な4つのスキル

Baidu百科事典によると、ウェブサイト運営責任者は、企業の事業戦略の指導の下で市場調査とフィードバ...

私たちが長年行ってきたSEOについてお話ししましょう

このタイトルを書いた主な理由は、2012 年末現在、Baidu の SEO がますます制御不能になっ...

A5 Yuehuai: SEOはユニークであるべきです。SEOの戦術に従うことの欠点

いつから始まったのかは分かりませんが、「競合他社が新しいコンテンツを発見したら、それに従う」「競合他...

ライブストリーミング販売の根底にあるロジック

618 はまさに消費の時期です。この消費ポイントはインターネットの台頭とともに出現し、中国の電子商取...

タイム・ウェルス・ネットワークの周瑜氏:タオバオ・ウィトキーには勝ち目がない

最近、IT茶室のネットユーザーが、タオバオが第三次産業電子商取引プラットフォームの拡大に力を入れ始め...

dacentec-$1/512m メモリ/25g ハードディスク/1T トラフィック/ノースカロライナ/G ポート

今月初め、dacentec は月額 1 ドル、年間支払いわずか 10 ドルの安価な VPS を開始し...

中国電子クラウド飛青プラットフォームは42日間で顧客向けに3つのシステムを開発

高水準プログラミング言語が発展し成熟するにつれて、従来のソフトウェアと SaaS ソフトウェアの市場...

Geek Host: 新年20%オフ、シンガポールCN2 VPS、3つのネットワークへの直接接続、超高速

Geek Hosting (GKE) は、シンガポールとロサンゼルスのデータセンターのすべての VP...

Sina が Oasis を引き継いで新しいソーシャル製品「ADA Community」を発表

10月25日、Sinaは「一緒に社交界の寵児に変身する」ことを目標に、AppStoreでひっそりと新...

今日頭条検索は百度に「勝つ」のか?

まず答えをお伝えします。ひっくり返すことはできません。 7月31日に「WeChatに大きな動きはある...