インターネット情報推奨アルゴリズムの簡単な分析

インターネット情報推奨アルゴリズムの簡単な分析

ルペン氏の時代から、彼が扇動と情報発信に長けていることは公然の秘密だった。しかし今日では、ビッグデータに基づく感情主導の思考により、あらゆるものが日常化、標準化され、さらには科学的なものになっています。

1. 急進主義の時代

私たちは、インターネット上や日常生活において暴力が蔓延する、ますます過激な時代に突入しています。

かつて、モバイルインターネットと情報革命が圧倒的な勢いで世界を席巻していた頃、牧歌的でロマンチックな雰囲気がいたるところに漂っていました。人々は、情報ネットワークによって人々の間の情報の非対称性が完全に打破され、地球は平らになり、世界は透明になり、貧富の差は最終的に逆転し、異なる民族や階級の間で対話、コミュニケーション、和解の機会が増えると確信していました。

しかし、現実は容赦なく人々の夢を打ち砕いた。富だけを見ても、インターネット時代の20年間で世界の貧富の差は拡大した。米国を例にとると、ブルームバーグによると、富裕層上位1%の富裕層の富は、エリート上位90%の合計に近い。世界的には、2017年だけでも最も裕福な1%の人々が富の82%を所有していました。

マシュー・ジャクソンは著書『ヒューマン・ネットワーク』の中で、人々の階級や富の傾向を決定する中核となる要素は2つあると指摘した。1つは情報であり、もう1つは機会(リソース)である。

では、情報の透明性とフラット性が高まっている今日、なぜ人類の過激主義や分裂はより深刻化しているのでしょうか?

「情報繭」という言葉があります。

2. 情報コクーン仮説

2001年、アメリカの法学者キャス・サンスティーンは著書『インターネット共和国』の中で、「インターネット時代において、膨大な情報量に直面した人々は、自分の好みに合った情報を選択して吸収する傾向がある。その結果、各人が吸収する内容はますます狭くなり、人々は一歩一歩情報の繭の中に滑り込んでいく」と提唱した。

情報繭よりも過激な主張は「サイバーバルカン化」です。1996年にアメリカの学者エルスタインとブリニョルフソンは、インターネット上の情報はますます増え、人々は好きなものをすべて読むことができなくなっていると提唱しました。したがって、インターネットはよりオープンで啓発的になるのではなく、より閉鎖的で過激になります。

どちらの仮説も、情報の透明性と公開性が必ずしも良いことではないという点を指摘しています。なぜなら、過剰な情報、真の情報、そして区別が難しい偽の情報につながり、人々が追いつけなくなるからです。

情報の透明性や公開性は公平感をもたらすが、人々の「情報処理能力やエネルギー」にはばらつきがあり、新たな不平等をもたらす。

つまり、新たな矛盾が生じているようです。人々は今日頭条や淘宝のような「アルゴリズム推奨」プラットフォームを指摘し、こう言う。「これらのアプリは、特定のアルゴリズムに基づいて人々に対してさまざまなディープラーニングやビッグデータ分析を実行し、人々が興味を持っているコンテンツを推奨します。これは標準的な「情報繭」ではないでしょうか?」

この発言は単純で粗雑に思えますが、大きな問題は「アルゴリズムを過小評価している」ことです。

「アルゴリズムによる推奨とは、ファッション、旅行、ペットに関するコンテンツを見たときに、そこに長く滞在して「いいね!」をクリックすることです。その結果、プラットフォームは将来的にファッション、旅行、ペットを私に推奨するようになります。」彼らはいつもこう言います。

しかし、これは「コンテンツの特性」に基づいた推奨に過ぎず、基本的な表面的なアルゴリズムです。これがこれほど単純かつ粗雑なものであれば、これらの企業は簡単に利害の溝に陥り、2つの大きなジレンマに直面することになります。

人々は豊かで多様であり、それぞれ興味や好みが異なります。誰かに趣味は何かとランダムに尋ねても、自分の興味の構成を正確に表現するのは難しいかもしれません。

人々の興味は移り変わりやすく、いつでも新しい興味が生まれる可能性があります。しかし、興味のあるコンテンツの一部は、過剰消費によって突然「退屈」になり、それ以降は限界便益が減少します。

毎日ネットでかわいいペットを見ていると、ある日突然見たくないと思うようになり、ペットがかわいくなくなるようなものです。

実際、Toutiao や Alibaba、あるいは海外の Facebook や Google であっても、彼らが使用するアルゴリズムの次元はそれほど単純ではありません。

3. アルゴリズムの次元

成熟したアルゴリズム推奨システムでは、少なくとも 5 つの次元を考慮する必要があります。

1 つ目はアルゴリズム モデルです。

一般的な 5 つのモデルは、協調フィルタリング アルゴリズム、教師あり学習アルゴリズム ロジスティック回帰、ディープラーニング、因数分解マシン、GBDT です。

たとえば、協調フィルタリング モデルでは、システムはユーザーがどのような人物であるかを継続的に分析し、さらにユーザーと類似の属性を持つ人物を見つけ、このタイプの人物の興味や趣味に基づいて推奨を行い、同じような考えを持つ人物に類似のコンテンツを推奨します。つまり、おすすめはあなたが今日気に入ったものだけでなく、あなたと似た人が何を好むかによっても決まります。

「群衆」に基づいて大規模かつ継続的な分析を実行し、絶えず反復して最適化を行った場合、私たちは依然として情報の繭に陥ってしまうのでしょうか?

2つ目はコンテンツ分析です。

たとえば、記事の意味的特徴 (キーワード、トピック、エンティティ語)、テキスト類似性特徴、時空間的特徴などです。

3つ目はユーザータグです。

興味、クラスター、性別、年齢、場所などのユーザー ID 特性に加えて、ノイズ フィルタリング、ホット スポット ペナルティ、時間減衰、ペナルティ表示などのユーザー行動に基づいたデータ処理戦略も開発する必要があります。

4番目は結果評価です。

短期指標と長期指標のバランスをとる方法、ユーザー指標とエコ指標のバランスをとる方法、そして ABtest 実験を通じて推奨結果を継続的に最適化する方法は何でしょうか?

5つ目は安全規制です。

たとえば、eコマースプラットフォームにおけるポルノ対策とコンプライアンス、コンテンツプラットフォームにおけるUGCコンテンツのレビュー、危険なコンテンツ識別技術(ポルノ検出、誹謗中傷や猥褻行為の防止)、一般的な低品質コンテンツの識別(フェイクニュース、盗作、クリックベイトなど)などです。

実際のアルゴリズム推奨システムは、「ケーキを見るのが好きな人にケーキを推奨する」よりもはるかに複雑で、詳細かつインテリジェントであることがわかります。

テクノロジーやアルゴリズムのせいにするのは、これまでも簡単で痛みのないアプローチでしたが、これでは人々がより深い反省や変化を拒否するだけです。

ミネソタ大学のコンピュータサイエンス学部は、協調フィルタリング アルゴリズムによって推奨されたプラットフォーム上のコンテンツに 2 つのグループが同時にアクセスするという特別な実験を実施しました。1 つのグループは推奨された結果を「フォロー」し、もう 1 つのグループは推奨された結果を無視しました。

実験結果は一般的な認識とはまったく逆で、21か月のデータに基づくと、アルゴリズムの推奨を無視したグループが得た​​情報はより豊富で多様なものであったのに対し、アルゴリズムの推奨を無視したグループの視野は狭かった。

先日、今日頭条の朱文佳CEOは活力会議で、今日頭条が目指すのは総合情報プラットフォームであり、推薦、注目、検索を通じて、画像、テキスト、動画、音声、質疑応答などさまざまな情報コンテンツを配信することだと述べた。コンテンツと配信方法の多様な組み合わせは、情報の繭につながるだけでなく、「より大きな世界」をもたらすだろう。

彼の言ったことは真実かもしれない。前述のように、Toutiaoが「かわいいペットを見るのが好きなら、かわいいペットをお勧めします」などの表面的な推奨だけを行うと、人々の興味の多様化、興味の移り変わり、興味の満足度の閾値の上昇を解決できないことは間違いないだろう。

君子は危険な壁の下に立つことはない。人々にもっと徹底したアルゴリズムの訓練が与えられなかったら、今日のようなToutiaoは存在しなかっただろう。

4. 興味か態度か?

実際、興味のあるコンテンツをフィルタリングするのが人間の習慣であり、性質であり、本能なのです。

考えてみてください。本や新聞を読んでいるとき、本屋をぶらぶらしているとき、テレビを見ているとき、まずは興味のあるものを探しませんか?初期のウェブサイトでも、フィルタリングできるテーマやセクションがありましたか?

アルゴリズムによる推奨は、このプロセスを高速化するだけで、膨大な量の情報に直面した際に、人々が興味のあるコンテンツをより簡単かつ効率的にフィルタリングできるようになります。

前述のように、情報の爆発的な増加は、情報処理能力やエネルギーが豊富な人が有利になるという新たなマタイ効果をもたらしました。この観点から見ると、アルゴリズムによる推奨は差別化をもたらす鍵ではなく、むしろ効率性を向上させる手段であり、能力やエネルギーで優れていない人々が欠点を補い、効率性を向上させるのを助けるものである。なぜ彼らが非難されるべきなのか?

人間の「過激化」や「選択的認知」について議論するたびに、概念、関心、態度を明確にしなければなりません。

利害関係が人を極端にするわけではありません。ある事柄に対する態度、見解、立場が強まり、閉鎖的かつ極端になって初めて、人は本当に極端になり始めるのです。たとえば、あなたの興味はサッカーかもしれませんし、あなたの態度は中国男子サッカーチームを本当に嫌っているかもしれません。この感情がさらに強まり、憎しみに変わったら、あなたは極端でしょうか?

この観点から見ると、アルゴリズムによる推奨は、ユーザーが「興味を持っている」コンテンツを推奨することしかできず、ユーザーの「態度、意見、立場」を理解して、ユーザーが「好きで支持している」コンテンツを推奨することはできません。

アルゴリズムの推奨は、あなたがスマートフォンに興味があることを知っていて、Hammerに関するコンテンツをあなたに推奨するかもしれませんが、あなたが心の底からLuo Yonghaoを嫌っていることを知らないので、Hammerファン、Hammer嫌い、Hammer中立者からのすべてのコンテンツが一度にあなたに届きます。

アルゴリズムの推奨では、あなたが健康に非常に関心があることを知っていて、医療分野のニュースをあなたに推奨するかもしれませんが、伝統的な中国医学や西洋医学に対するあなたの態度は知らないため、すべてを推奨することになります。

差別化と断片化の原因はアルゴリズムによる推奨ではありません。なぜなら、分裂を実際に引き起こすのは利益ではなく、同じ利益に対する人々の異なる態度や立場が継続的に強化されることだからです。

これはいわゆるオンラインエコーチェンバー原理です。同じ問題に対して、人々は常に自分と似た意見を聞きたがり、反対意見を除外し、聞いたものを自分のエコーとして受け取ります。

オンラインエコーチェンバーの発生原因は何でしょうか?アルゴリズムによる推奨が情報の繭につながらないのであれば、情報の偏りや感情の過激化を引き起こす原因は一体何なのでしょうか?そして、私たちはどのように対応し、解決すべきでしょうか?

5. 本当に警戒すべきこと

一つの答えは「シングル」かもしれません。

情報を取得するための単一のチャネルと単一の情報通信モードが問題の根本的な原因です。

ウェブサイトで編集者がピン留めした投稿だけを読んでいたり、WeChatモーメントで他の人が転送したテキストだけを読んでいたり、ビッグVの共有だけに注目していたり​​、アルゴリズムの推奨だけを聞いていたり...ユーザーが特定の情報取得およびコミュニケーションモードに「パス依存性」を形成している限り、彼の視野は徐々に狭まる可能性があります。

実際、情報配信の方法にはそれぞれ独自の価値があります。編集配信は「知っておくべき情報」をもたらし、検索は「知りたい情報」をもたらし、推奨は「興味がありそうな情報」をもたらし、フォローは「気になる人の動向」をもたらします。

それぞれの配信方法は不可欠であり、検索、注目、アルゴリズム、知人と見知らぬ人を統合した情報取得の豊富で多様な組み合わせによってのみ、情報の偏りを避けることができます。これは、大規模なプラットフォームが「統合」しようとしている理由でもあるかもしれません。

Google と Baidu は検索エンジンであるだけでなく、検索結果以外にもコンテンツの推奨機能を追加しています。Weibo は、単純なフォローアップ ストリームやトレンド検索以外にも、スマートな推奨機能や動画を追加しました。Toutiao は、アルゴリズムによる推奨機能、ホットなニュース、Big V フォローアップ、検索を 1 つに組み合わせています。

十分に豊富な情報配信モデルを統合し、さらには普遍的な情報配信プラットフォームになることによってのみ、情報の繭を根本的に回避し、ユーザーを包括的かつインテリジェントに理解し、ユーザーの情報ニーズを満たすことができます。 Toutiao 氏が「水平 1 つと垂直 1 つ」と呼ぶものは、まさにこの側面を中心に進化してきたものです。

もう一つの答えは孤独かもしれません。

近年、社会的な交流は減少しており、人々は社会的な動物から孤独な生き物へと変化しています。

人々は、現実の社会的な交流に伴うリスク、プレッシャー、不確実性に直面することをますます嫌がるようになり、また、妥協したり他人に合わせたりするのをますます嫌がるようになっています。仮想ネットワークの発達により、人々はゲームやライブ放送などの「独立した」娯楽にますます夢中になっています。さまざまな消費者サービスの向上により、人々の日常生活は他者との社会的協力にますます依存しなくなってきています。

このような社会的繭は次のような結果をもたらしました。人々は見知らぬ人とコミュニケーションを取ることにますます消極的になり、すでに知っている人であっても、同じ見解や意見を持つ人とコミュニケーションを取ることを選択する傾向があります。

「オーケー」はコミュニケーションを拒否する現代人の共通のフレーズとしてますます多く使われるようになり、「黙ってブロックする」は「正面からの対決」に取って代わり、非暴力的な非協力の基準となっている。

3つ目の答えは「感情」です。

微博からパブリックアカウントまで、漫画から短編動画まで、孟美孟から文琳琪まで、コンテンツ制作者やKOLは人々の感情を利用することにますます熟達している。良いニュースは遠くまで広まらないが、悪いニュースは広く広まる。合理主義者は正しいかもしれないが、彼らは白黒の偏見よりも大衆に広め、より多くのトラフィックをもたらす能力がはるかに低い。

『弱いコミュニケーション』という本に書かれているように、ル・ボンの時代から、煽動やコミュニケーションのきっかけ作りが上手であることはすでに公然の秘密でした。しかし今日では、ビッグデータに基づく感情主導の思考により、あらゆるものが日常化、標準化され、さらには科学的なものになっています。

情報取得におけるパス依存性、情報伝達における社会的衰退、情報消化における感情性、おそらくこれら 3 つの問題は、アルゴリズム推奨情報繭の仮説よりも根本的で隠れた問題です。

著者: 張俊

WeChat パブリックアカウント: 討論 (ID: bianlunlove)

原題: インターネット情報推奨アルゴリズムの簡単な分析

キーワード:

<<:  なぜインターネットセレブのブランドは長続きしないのでしょうか?

>>:  ステーションBには天敵はいない

推薦する

生成AIとクラウドの相互利益を探る

近年、生成 AI とクラウドの融合に関心が集まっているのには理由があります。人工知能 (AI) とク...

VPS 初心者向けチュートリアル: Linux VPS の SFTP、「FTP」

この記事では、Linux システム上で SFTP を使用してファイルを転送する方法について説明します...

間違ったキーワードをターゲットにしたSEOは意味がない

今週はキーワードの問題に焦点を当てます。突然、私はこのような重要な問題がこれまで議論されたことがない...

アリババの新しい時系列予測モデルに関する論文がICML2022に選出されました

一定期間の履歴データがあれば、AI は天候の変化、グリッド負荷需要、交通渋滞を正確に予測できるでしょ...

impactvps: $7/KVM/4G メモリ/60g NVMe SSD/4T トラフィック/シアトル + ダラス/10Gbps

Impactvps は 8 月に新しい NVMe シリーズの KVM 仮想 VPS をリリースしまし...

hostsolutions: 遅ればせながらのイースター ()、50% オフセール、著作権なしの VPS + サーバー

イースターからしばらく経ち、ホストソリューションズのボスは今年は少し遅れているようですが、プロモーシ...

南京-アマゾンAWS共同イノベーションセンターが正式に開設

南京市人民政府、江寧区人民政府、アマゾンテクノロジーサービス(北京)有限公司(以下、「AWS」)が共...

SEO担当者にとって、競合他社を追い抜くことよりも自己突破が重要

2012年の端午節の頃にBaiduが大規模なブラックKサイト月間を開始したことを受けて、Fuqing...

クラウド ERP 移行を成功させるための 13 のヒント

[[398570]] [51CTO.com クイック翻訳]多くの企業にとって、オンプレミスのエンター...

小紅書はどうやって十一月を乗り切るのでしょうか?

毎年恒例のダブルイレブンプロモーションが終了に近づいています。 「数秒で数千億を突破」というデジタル...

クラウド移行のセキュリティリスクを評価する3つのステップ

この突然かつ予期せぬリモートワークへの移行により、企業はコラボレーションと情報共有の新しい方法を見つ...

サイトの背景に関する5つの重要なデータ分析についての簡単な説明

ほとんどのウェブマスターはバックグラウンドデータの分析を好まないと思います。大量の冷たいデータを前に...

プログラマーのロールモデル:完全に自動化された生活

ロシアのプログラマーたちは完全に自動化された生活を実現し、妻に残業のテキストメッセージを送ったり、二...

ウェブサイト分析におけるデータの統計的有意性検定

ウェブサイト分析では、ウェブサイト最適化テストを実行して、直帰率、注文購入率、ボタンクリック率など、...