WeChatがインテリジェントオープンプラットフォームを立ち上げ、音声と画像認識の応用シナリオを公式に説明

WeChatがインテリジェントオープンプラットフォームを立ち上げ、音声と画像認識の応用シナリオを公式に説明

[要約] WeChat インターフェースの利用範囲は、パブリックアカウントからサードパーティのアプリケーションにまで拡大しています。音声認識と画像認識は、最初のオープンなインテリジェント テクノロジーになりました。

WeChatインテリジェントオープンプラットフォームがリリースされました。公式サイト(pr.weixin.qq.com)

テンセントテクノロジーの王欣が4月8日に報じた。

WeChatは本日、インテリジェントオープンプラットフォームを正式にリリースしました。音声認識と画像認識は、サードパーティのアプリケーション開発者に公開された最初のインテリジェント認識テクノロジになりました。

関連する技術インターフェースを呼び出すことで、サードパーティのアプリケーションは、WeChat の音声テキスト変換や画像スキャンなどの既存の機能も実現できます。

WeChatパターン認識センターチームは、マイクやカメラなどのセンサーデバイスにより、人間と機械のやり取りがより便利になるとテンセントテクノロジーに語った。しかし、音声認識や画像認識の技術的ハードルはまだ比較的高い。WeChatが既存の技術的リソースを開発者に開放できれば、より多くのアプリケーションが技術投資コストを削減するのに役立つだろう。

音声認識技術は主に音声入力に反映され、ユーザーの音声を対応するテキストに直接変換できます。ユーザーはキーボードに頼ることなく、音声でテキスト入力を完了したり、機能操作を実行したりできます。

QQミュージックに音声認識技術が応用される

現在、QQ Musicの音声検索、Tencent Mapsの地理位置情報音声検索、Didi Taxiの音声テキストタクシー配車など、複数の製品がWeChatの音声認識技術を使用しています。 WeChatパターン認識チームによると、スマート玩具、スマート家電、ウェアラブルデバイスもこのインターフェースの応用分野になるという。

画像認識技術は主に表紙のスキャンなどの機能に使われます。 WeChatのパターン認識チームによると、この技術はすでに市場に出回っているほぼすべての本の表紙や映画のポスターを認識できるという。ユーザーは、屋外広告や映画館で映画のポスターを見かけた場合、携帯電話のカメラで写真を撮ったりスキャンしたりするだけで、対応する情報ページにジャンプし、映画の詳細、映画レビュー、映画館情報、オンラインでの有料購入など、一連の拡張コンテンツとサービスを取得できます。

映画のポスターに加えて、認識しやすい画像には、雑誌や本の表紙、製品のパッケージ、看板、写真などがあります。サーバーが対応する画像を一致させることができる場合、対応するウェブサイト、オーディオ、ビデオ、ソーシャルメディア、電子商取引チャネルなどがユーザーの携帯電話に表示されます。従来のメディアや電子商取引アプリケーションは、このテクノロジー インターフェイスの強力なパートナーになる可能性があります。

画像認識を使用して映画のポスターをスキャンする

インテリジェントオープンプラットフォームは、上記2つの技術プラットフォームに加えて、将来的には意味理解や顔認識などの技術も開拓していく予定です。音声認識など、ユーザーのモバイルライフを便利にする技術も研究対象に含まれています。

WeChat関連のインテリジェント技術インターフェースは、これまでWeChatの内部パブリックプラットフォームに提供されていました。このインテリジェントオープンプラットフォームの立ち上げにより、サービス範囲はパブリックアカウントから大規模なサードパーティアプリケーションにまで拡大されます。関連する技術インターフェースにアクセスしたいアプリケーション開発者は、アプリケーションの基本情報を入力してから 3 営業日以内にレビュー結果を取得できるようになります。審査に合格すると正式に利用できるようになります。

インテリジェントオープンプラットフォームの立ち上げ後も、WeChatアプリケーションのインテリジェント分野における探求は継続されます。 WeChatの関係者はテンセント・テクノロジーに対し、「シェイクして曲を検索」や「スキャン」などの機能がユーザーから好評を得ていることを明らかにした。しかし、もっと大きなサプライズはまだこれからだ。WeChatの新バージョンには、新たな「スマートサービス」が追加される。この新機能は再びユーザーの反響を呼ぶ可能性があると同社は考えているが、現時点では具体的な内容を紹介するのは困難だという。


原題:WeChatがインテリジェントオープンプラットフォームを発表、音声・画像認識の応用シナリオを公式に詳細説明

キーワード: WeChat、プラットフォーム

<<:  優れたトラフィックページの4つの主要コンポーネント

>>:  マイクロソフトは本日からXPのサポートを終了:国内ユーザー2億人に影響

推薦する

BATクラウドコンピューティング競争は同じ結論に終わりました。国内の一流メーカーと二流メーカーの間には明らかな差があります。

2月22日、百度は初めてクラウドコンピューティングの業績を公開した。2018年第4四半期の収益は11...

CCTVの丑年春節祝賀会は初めて「クラウド」放送を採用

CCTV Newsのクライアントによると、2月1日、「2021年春節祝賀会」の初リハーサルが中国中央...

インテルが新しいプロセッサロゴとパフォーマンス評価システムを発表

海外メディアの報道によると、北京時間4月7日正午、インテルはプロセッサの新しいロゴと5つ星の性能評価...

再入荷: anynode - VPS 最低 $12.5/年: KVM/256 RAM/10gSSD/ロサンゼルス

anynode がようやく在庫を補充しました。前回の補充は今年 2 月でした。ロサンゼルス KVM ...

ウェブサイトの重量を素早く改善し、ランキングを上げる方法

よく話題になるのは、Baidu でのウェブサイトの重みが高ければ高いほど、Baidu はこのウェブサ...

ユーザーや検索エンジンに好まれるドメイン名とサイト名の選び方

ドメイン名の申請は非常に簡単です。関連するオペレーターを探し、ドメイン名を選択し、登録料を支払うだけ...

2009 年に災害復旧業界に予測される 8 つの主要アプリケーションと 4 つの主要テクノロジー

南部の氷雨、汶川地震、北京オリンピック、神舟7号宇宙船の打ち上げ、鉱山災害、三鹿汚染ミルク事件、金融...

実際のウェブサイトはサイト値かBaiduツールインデックス値のどちらに含まれているのか

ウェブサイトのコレクションボリュームがウェブサイトにとって重要であることは自明です。ウェブサイトの重...

2023年のCAD市場の5つの主要トレンド

2023 年、CAD 市場は、独特のマクロ経済動向に対応したメーカーからの需要によって引き続き牽引さ...

マイクロソフトは自社のマーケティングの弱点を浮き彫りにするためにライバルを嘲笑している

Appleは6月からさらに脱Google化を進め、Siri音声アシスタントが提供する検索エンジンサー...

共同購入業界の取引量はマイナス成長を示しており、ウェブサイトは生死の試練に直面している

昨日、本紙は「Lashou.comの地域マネージャー4人が辞任?共同購入サイトが苦境に」と題する記事...

zgovps 日本大阪 EPYC パフォーマンス VPS シリーズのレビュー

zgovpsは、日本の大阪で高性能でソフトバンク回線を備えた日本のVPSを提供しています。Hostc...

losangelesvps: 米国での無制限 VPS、年間 14.99 ドル、KVM/1G メモリ/1 コア/15g SSD/1Gbps 帯域幅

losangelesvps は、ロサンゼルスのデータセンターに 2 つの新しい安価な米国 VPS を...

ビットコインの第三者決済チャネルが閉鎖:中国市場から撤退する可能性

中国ビジネスネットワークの記者、習大偉氏とインターン記者、熊月佳氏中央銀行はビットコイン規制を強化す...

百度、不正競争で奇虎360を再び提訴、65万元の賠償を要求

本紙(黄碩特派員)は、競合他社の競争行為は不公平であり、ビジネス倫理と誠実性の原則に違反していると考...