WeChatがインテリジェントオープンプラットフォームを立ち上げ、音声と画像認識の応用シナリオを公式に説明

WeChatがインテリジェントオープンプラットフォームを立ち上げ、音声と画像認識の応用シナリオを公式に説明

[要約] WeChat インターフェースの利用範囲は、パブリックアカウントからサードパーティのアプリケーションにまで拡大しています。音声認識と画像認識は、最初のオープンなインテリジェント テクノロジーになりました。

WeChatインテリジェントオープンプラットフォームがリリースされました。公式サイト(pr.weixin.qq.com)

テンセントテクノロジーの王欣が4月8日に報じた。

WeChatは本日、インテリジェントオープンプラットフォームを正式にリリースしました。音声認識と画像認識は、サードパーティのアプリケーション開発者に公開された最初のインテリジェント認識テクノロジになりました。

関連する技術インターフェースを呼び出すことで、サードパーティのアプリケーションは、WeChat の音声テキスト変換や画像スキャンなどの既存の機能も実現できます。

WeChatパターン認識センターチームは、マイクやカメラなどのセンサーデバイスにより、人間と機械のやり取りがより便利になるとテンセントテクノロジーに語った。しかし、音声認識や画像認識の技術的ハードルはまだ比較的高い。WeChatが既存の技術的リソースを開発者に開放できれば、より多くのアプリケーションが技術投資コストを削減するのに役立つだろう。

音声認識技術は主に音声入力に反映され、ユーザーの音声を対応するテキストに直接変換できます。ユーザーはキーボードに頼ることなく、音声でテキスト入力を完了したり、機能操作を実行したりできます。

QQミュージックに音声認識技術が応用される

現在、QQ Musicの音声検索、Tencent Mapsの地理位置情報音声検索、Didi Taxiの音声テキストタクシー配車など、複数の製品がWeChatの音声認識技術を使用しています。 WeChatパターン認識チームによると、スマート玩具、スマート家電、ウェアラブルデバイスもこのインターフェースの応用分野になるという。

画像認識技術は主に表紙のスキャンなどの機能に使われます。 WeChatのパターン認識チームによると、この技術はすでに市場に出回っているほぼすべての本の表紙や映画のポスターを認識できるという。ユーザーは、屋外広告や映画館で映画のポスターを見かけた場合、携帯電話のカメラで写真を撮ったりスキャンしたりするだけで、対応する情報ページにジャンプし、映画の詳細、映画レビュー、映画館情報、オンラインでの有料購入など、一連の拡張コンテンツとサービスを取得できます。

映画のポスターに加えて、認識しやすい画像には、雑誌や本の表紙、製品のパッケージ、看板、写真などがあります。サーバーが対応する画像を一致させることができる場合、対応するウェブサイト、オーディオ、ビデオ、ソーシャルメディア、電子商取引チャネルなどがユーザーの携帯電話に表示されます。従来のメディアや電子商取引アプリケーションは、このテクノロジー インターフェイスの強力なパートナーになる可能性があります。

画像認識を使用して映画のポスターをスキャンする

インテリジェントオープンプラットフォームは、上記2つの技術プラットフォームに加えて、将来的には意味理解や顔認識などの技術も開拓していく予定です。音声認識など、ユーザーのモバイルライフを便利にする技術も研究対象に含まれています。

WeChat関連のインテリジェント技術インターフェースは、これまでWeChatの内部パブリックプラットフォームに提供されていました。このインテリジェントオープンプラットフォームの立ち上げにより、サービス範囲はパブリックアカウントから大規模なサードパーティアプリケーションにまで拡大されます。関連する技術インターフェースにアクセスしたいアプリケーション開発者は、アプリケーションの基本情報を入力してから 3 営業日以内にレビュー結果を取得できるようになります。審査に合格すると正式に利用できるようになります。

インテリジェントオープンプラットフォームの立ち上げ後も、WeChatアプリケーションのインテリジェント分野における探求は継続されます。 WeChatの関係者はテンセント・テクノロジーに対し、「シェイクして曲を検索」や「スキャン」などの機能がユーザーから好評を得ていることを明らかにした。しかし、もっと大きなサプライズはまだこれからだ。WeChatの新バージョンには、新たな「スマートサービス」が追加される。この新機能は再びユーザーの反響を呼ぶ可能性があると同社は考えているが、現時点では具体的な内容を紹介するのは困難だという。


原題:WeChatがインテリジェントオープンプラットフォームを発表、音声・画像認識の応用シナリオを公式に詳細説明

キーワード: WeChat、プラットフォーム

<<:  優れたトラフィックページの4つの主要コンポーネント

>>:  マイクロソフトは本日からXPのサポートを終了:国内ユーザー2億人に影響

推薦する

ウェブサイトの収集が不安定になる理由をご存知ですか?

私のように、多くのウェブマスターがGGとBaiduのインデックスを分析したことがあると思います。この...

クラウド コンピューティングとデータ センター: 組織がどちらが適しているかを判断する方法

アマゾンの最高技術責任者であるヴェルナー・フォーゲルス氏は、企業が社内データセンター戦略を採用するか...

ウェブマスターネットワークニュース:音楽ウェブサイトが手数料を請求、アリペイで列車チケット購入を宣伝していると非難される

1. 音楽ウェブサイトは料金徴収に関して何の進展もないため、誇大広告だと非難されている6月6日、連日...

Baidu Statisticsを使用する際に注意すべき2つのポイント

ウェブマスター統計ツールは、ほぼすべてのウェブマスターが知って理解しなければならないツールです。現在...

検索エンジン最適化における投票の原則と運用上のエラーについての簡単な説明

インターネットの急速な発展に伴い、近年SEO業界の競争はますます激しくなっています。Baiduのアル...

比類のない高速高防御 VPS: DMIT、ロサンゼルス CN2 GIA+5Tbps DDoS 高防御 VPS

DMITは米国ロサンゼルスで高防御VPS事業を展開しており、ウェブサイトが破壊されず、常にオンライン...

vmissはどうですか?ロサンゼルスユニコムAS9929ラインのVPSの簡単な評価

vmiss vps は、オリジナルのロサンゼルス cn2 gia、香港 cn2、日本 iij、韓国 ...

一般的な分散ファイルシステムの包括的なレビュー。ビッグデータを理解したいなら、ストレージから始めましょう

[[239139]]ビッグデータの最初の層はストレージです。効率的にアクセスできる分散システムにデー...

キューブクラウド: 年末にすべての VPS が 12% オフ、300M 香港 cn2 gia、1Gbps 米国 cn2 gia、2Gbps ユニコム as4837

今から 1 月 2 日まで、cubecloud VPS 製品はすべて 12% オフです。これには、L...

IDC 市場は急速に成長を続けています。彭博士はどのようにして変革を加速させるのでしょうか?

[51CTO.comからのオリジナル記事] クラウドコンピューティング技術の徹底的な発展と、モノのイ...

サウジアラビアのVPSの推奨、いくつかの人気のある「サウジアラビアのVPSクラウドサーバー」販売業者

サウジアラビアは中東の国です。サウジアラビアの VPS、サウジアラビアのクラウド サーバー、サウジア...

zji: 香港サーバー (CN2 ネットワーク + 高 CPU 周波数)、600 元/月、E3-1270v2 など/32g メモリ/1TSSD/20M 帯域幅/2IP

zji.net は現在、香港のデータセンターで高周波サーバーを提供しており、CPU 周波数はデフォル...

Name.com イベント: com/net に登録して $5 + $0.99 を獲得

name.com の最新プロモーション: .com または .net ドメイン名を 0.99 ドルで...

チャンネル運営戦略、トラフィックを集めるのは難しくない

多くの人が、なぜチャネル運営に多額の費用をかけているのに、結局効果がないのかと疑問に思うでしょう。広...

競合他社の外部リンクを分析する方法

どの業界でも競合相手と遭遇しますが、SEO も同じです。ウェブサイトを上位にランク付けするために一生...