01 最近、ネット界で一番ホットな出来事は、小紅書が店頭から撤去されたことだ。 7月29日夕方、小紅書アプリは主要なAndroidアプリストアで一時的にダウンロードできなくなりました。 国家レベルの草刈りアプリである小紅書の欠点は、C2Cモデルによりノートの内容を自由に公開でき、誰でもどんな方法でもどんなコンテンツも公開できることです。 普通の人でもできるし、中小企業でもできるし、特別な労働者でもできるし、違法産業でもできる。 Xiaohongshu に限らず、すべての C2C ツール プラットフォーム製品では、コンテンツを公開できる限り、コンテンツが制御不能になるリスクが実際に存在します。 これまで、Moments、Soul、さらにはNetEase Cloud Musicでも、コンテンツが制御不能になる問題がありました。トピックプラザ、フォーラム、コメントエリア、ユーザーニックネーム、さらにはプライベートな会話でも、テキスト、画像、音声を記録できる限り、制御を失うリスクがあります。 結局のところ、製品は単純ですが、人間の本質は複雑です。 プラットフォームガバナンスとコンテンツセキュリティもリスク管理の範疇に入ります。リスク管理の実務者として、私はこの分野での実務経験があります。 本稿では、コンテンツリスク管理とプラットフォームガバナンスの観点から、業界の現状と課題について議論したいと思います。 コンテンツに対する制御の喪失は、すべての電子商取引およびコミュニティ製品にとって致命的です。 特にインターネット文明がますます重要になっている今日では。 02 C2CツールプラットフォームであるXiaohongshuでは、ユーザーが自分で写真やメモをアップロードできます。同時に、小紅書は人々に物を推奨するためのトッププラットフォームであり、ユーザーは物を買うために小紅書を訪れます。自由なルールと正確な潜在的消費者の組み合わせは、非常に大きな、非常に素晴らしいトラフィック ケーキになります。 その結果、あらゆる種類の禁止された闇産業、ポルノ取引、違法な医療美容が誕生しました。 小紅書は棚から撤去される前、ピンク色の薬と違法医療美容、ビキニと特別なサービス、身長増加と減量と健康製品の5つの黒いカテゴリ、銀行カード、テレフォンカードとブラックマーケット情報など、いくつかのキーワードインデックスを通じてさまざまな魔法のサービスを提供できました。もちろん、大規模なブロックが始まりました。 これらのメモの特徴は、戦略を共有するという名目で売り手の個人WeChatアカウントに誘導され、レトリックを使用して取引を誘導することです。 この自発的なC2Cコミュニケーションは、Xiaohongshu製品自体の最大の特徴でもあります。 多くの違法ビジネスが小紅書プラットフォームを利用して巨額の利益を上げている。 プラットフォームとしての Xiaohongshu には独自の難しさがあります。 03 私は、Xiaohongshu がプラットフォームとして何らかの責任を負っているかどうかについて議論したいわけではありません。結局のところ、コンテンツはユーザーが生成したもので、私はこの分野で十分な専門家ではありません。 私が議論したいのは、これらのジャンクコンテンツを効果的に管理するためにどのような方法を使用できるかということです。小紅書のリスク管理とプラットフォーム管理もこの問題に悩まされています。 リスク管理に携わる同僚として、私の実務経験に基づいたいくつかの提案をさせていただき、それが彼らと読者の皆様のお役に立てば幸いです。 さて、現在、小紅書が直面している核心的な問題は、Cエンドユーザーがアップロードしたコンテンツが極めて制御不能であり、大量の違法コンテンツや禁止コンテンツが含まれている可能性があることです。これらの人々を効果的に特定し、ターゲットを絞ってアカウントをブロックおよび禁止することで、コンテンツのリスクを軽減しながら、正常なユーザーエクスペリエンスを確保する必要があります。 もちろん、コンテンツのリスクを軽減するにせよ、ユーザーエクスペリエンスを確保するにせよ、その中心となる目的は企業の商業的利益を最大化することです。これが大前提であり、リスク管理はビジネスに役立つものでなければなりません。 したがって、すべての対策は、最終的には誤検出率と ROI のバランスを取る必要があります。 それでは、始めましょう。 04 違法コンテンツのブロックに関しては、業界では現在、主に外部語彙を使用し、内部では動的な語彙のセットを維持しています。 いわゆる外部語彙ライブラリとは、敏感な領域に関係する単語を作成する特別なサプライヤーが存在することを意味します。直接 API 呼び出しをサポートし、ユーザーのニックネーム入力、テキストのアップロード、ユーザーのプライベート メッセージなどのモジュールに埋め込むことができます。テキストがアップロードされている限り、語彙フィルターが実行され、禁止されている単語がいくつか捕捉されます。 メリットは起動が早いことですが、デメリットは語彙がブラックボックス状態(サプライヤー所有)であること、ビジネスクリティカルなデータが漏洩しやすいこと(API呼び出しの入力パラメータがサプライヤーによって商用利用のために簡単に持ち去られること)です。 私は小紅書のサプライヤーが誰であるかを知っており、多くのサプライヤーをテストしてきました。一般的な語彙は、実際のビジネス シナリオに基づいて正確にターゲティングすることはできないとしか言えません。小紅書が独自の語彙を構築することを提案します。既成の設定可能な語彙フレームワークがない場合は、スクリプトを使用して R&D に語彙を維持させることができます。もちろん、設定可能にする方がよいでしょう。結局のところ、スクリプトを使用すると、単語が多すぎるとクラッシュしやすく、長期的な解決策にはなりません。 これら一連のものを用意した後は、センシティブ ワード収集戦略、センシティブ ワード適用戦略、センシティブ ワード廃棄戦略を含む一連の適用戦略が必要になります。 いわゆる感性語収集戦略は、効果的な感性語をどのように獲得するかという問題を解決するものです。 多くの人工知能企業は、機械学習を使用して行われるいわゆる自然な意味認識を宣伝しています。これはここではあまり役に立ちません。Xiaohongshuに、機械学習について迷信を持たないように注意したいと思います。 中国語は奥が深く広範囲にわたるため、同音異義語、異体字、火星語、さまざまな特殊記号とその間のスペースを含むパターンを使用することで、マシンを簡単にバイパスできます。 WeChatという単語だけでも、V信、VX、威、VV、ご存知の通り、威X信などに変換できます。機械学習ではこのような正確な変換は実現できませんが、SQLとPythonコードを組み合わせた人間の認識では実現できます。 ここでは、リアルタイム データベースを使用し、単語の収集に専任のデータ アナリストを割り当てることをお勧めします。 データアナリストは、基本的な違反情報に基づいて、インデックスルールをさらに手動で拡張できます。たとえば、WeChat 12345 から、特定のキーワード(「微」という単語をインデックスとして使用) 、特定の特殊記号、さらには特定の記号 + 数字の特徴を抽出してキャプチャできます。 熟練したリスク管理データアナリストにとって、1 日に何万もの有効な機密語を検出することは問題ではありません。 いわゆるセンシティブ語応用戦略とは、これらのセンシティブ語がどの分野で使用されているかという問題を解決することです。 機密単語ライブラリがある場合は、各単語にラベルを付ける必要がります。たとえば、「殺人」という単語はクラス A のラベルで、「ひどい」という単語はクラス B のラベルです。ビジネス シナリオや電子商取引のカテゴリによって、必要なラベルはまったく異なります。 たとえば、牛乳に関するメモで「牛乳を飲む」という言葉を使用すると、大きな誤解を招く結果が生じます。 ここで必要なのは、各シナリオのビジネスにラベルを付け、そのラベルに基づいて機密語彙の単語カテゴリを使用することです。 たとえば、口紅に関するメモには ABC ラベルの付いた単語を使用し、チャイナドレスに関するメモには CDF ラベルの付いた単語を使用する、といった具合です。 カテゴリーラベルとセンシティブな単語をどのように分類するかについては、記事が長くなるため詳しく説明しません。 いわゆるセンシティブワード処理戦略は、センシティブワードに当たった後のコンテンツをどのように処理するかという問題を解決するものです。 実際には、これには敏感な単語のラベル付け、主に敏感な単語の処理に対する重みの設定も含まれます。 例えば、ポルノ、テロ、暴力などの敏感な言葉については、直接ブロック+アカウント停止、もしくは直接投稿禁止などの対応方法が考えられます。例えば、WeChatアカウントを宣伝していると疑われるラベルの場合、対応する処理措置はブロック+禁止、または投稿禁止である必要があります。たとえば、センシティブな単語や重みの弱い文字が含まれている場合、対応する処理方法としては、公開前に手動レビューに移行する必要があります。 もちろん、これらはほんの一例です。センシティブな言葉を適用する方法は他にもたくさんありますが、この方向性は現時点ではより成熟したモデルです。 小紅書ノートには、敏感な言葉に加えて、大量の画像コンテンツも含まれています。現在、これらの画像コンテンツには主に 2 つの問題があります。
前者の場合、既成の画像認識サービスを直接購入することをお勧めします。AlibabaとTencentはどちらも成熟したサービスを持っています。 後者の場合、OCR を使用して画像をテキストに変換し、機密単語戦略を使用して処理することができます。 上記はコンテンツ自体のリスク管理の考え方です。これには多くのリソース、特に手動レビューリソースが必要であることに注意してください。Toutiaoにはコンテンツレビューに専念する何千人もの人がいます。コンテンツ電子商取引の場合、これを節約することはできません。 さらに、コンテンツの攻防は動的でなければなりません。一度きりの解決策などありません。長期戦に備える必要があります。中国語はとても奥が深いのです。 05 コンテンツリスク管理は重要ですが、実際には表面的なものに過ぎず、網羅的に行うことは常に困難です。本当に全面的に遮断すると、誤って多数の一般ユーザーに損害を与え、ユーザーエクスペリエンスと企業の商業価値の両方に損失を与えることになります。 コンテンツのリスク管理よりも重要なのは、その基盤となるリスク管理です。ユーザー登録から最初のアクション(メモの投稿や、メモへの「いいね!」、コメント、共有など)に至るまで、より綿密なリスク管理が必要です。 他のユーザーが投稿するコンテンツを管理するだけでなく、どの「ユーザー」がこのコンテンツを投稿するかも管理する必要があります。 センシティブワードシステムにより、大量のコンテンツノートにラベルを付け、通常ノート、疑わしいノート、妨害ノート、愚かなノートなどに分類することができ、これらを総称して Y と呼びます。 リスク管理戦略の基本的なロジックは F(x)=Y です。ここで、X は機能、F はアルゴリズムまたは戦略、Y は効果を表します。 Y がわかれば答えがわかります。 次に、これらの異常なメモを投稿したのは誰か、また、投稿したアカウントの特徴 (X) は何かを調べます。 一般的に、共通アカウント機能には、登録時間、年齢、性別、公開時間、共通タグ、IPアドレス、デバイス番号(imac、imei、デバイスID) 、携帯電話番号、性別、出身地、APPソース(Huaweiマーケット、Xiaomiマーケット、APPストア) 、ログインモード(APP、ミニプログラム、H5) 、携帯電話モデル、GPSアドレス、LBSエリア、ユーザー登録ソース(水道水、Aアクティビティプロモーション、市場投入コンバージョン、CPA) 、履歴行動(いいねの数、フォローしている人) 、閲覧行動など、数百の次元があります。この情報の一部はAPP埋め込みポイントから取得され、一部は元の機能に基づいて計算された派生機能から取得されます。 特徴エンジニアリングはリスク管理の中核要素の 1 つであり、戦略の適用と同じくらい重要です。優れたデータはすべての基礎となります。 センシティブな単語を通じて Y を見つけ、次に Y を使用してヒット X を推測し、アプリケーション戦略 F を導き出します。 ケース 1: Xiaohongshu が整形手術に関する異常なメモを発見し、投稿者といいねした人のほとんどが同じ IP アドレスを持っているか、同じ番号セグメントに属している場合、この IP セグメントによるこのタイプのメモの投稿をブロックするポリシーを設定できます。 ケース 2: Xiaohongshu が問題のあるメモがすべて同じ WeChat アカウントを指していることを発見した場合、この WeChat アカウントで投稿したすべてのアカウントがブロックされ、誤って削除されることはありません。 ケース 3: Xiaohongshu が問題のあるメモを発見し、ほとんどの投稿者といいね! 者が 24 時間以内に登録されている場合、登録時間を XXX に設定し、XX フィールドにメモを投稿できないようにすることは完全に可能です。 成熟したプラットフォームガバナンスには同様のルールが数十万個存在し、私はそれらの設計と保守に携わってきました。 これらのルールはすべて動的に設定可能にし、意思決定エンジン モデルにする必要があります。リスク管理では、これらのラベルをドラッグ アンド ドロップし、一致するシンボルとしきい値を書き込み、廃棄措置を設定して有効にするだけで済みます。 たとえば、あるルールでは、24 時間以内に登録した女性ユーザーはビキニノートを投稿できないとしています。 次のように分解します。
これらを「はい」または「いいえ」のラベルにすることで、自由に設定し、すぐにオンラインに公開することができます。 06 センシティブワード戦略と意思決定エンジンの間には、「アカウント」ディメンションに基づくユーザー関係ネットワークと、グラフマイニングを使用して実行されるリアルタイムの監視および介入メカニズムも必要です。 いわゆる関係ネットワークとは、点と線で構成される異なるアカウント間の関係を指します。 例えば、アカウントAがアカウントBのノートに「いいね!」したりコメントしたりすると、関係性が形成されます。ネットワーク上の反映は、ポイント A とポイント B の間に関係線が出現することです(A が B にいいね/コメントする) 。 例えば、アカウント A と C が同時にアカウント B のノートに「いいね!」したりコメントしたりすると、複数の関係線が形成されます。ネット上の反応は、ポイントAからポイントB (連続でいいね!) 、ポイントCからポイントB (連続でいいね!) 、ポイントAからポイントC (両方ともBにいいね!)となっています。 関係ネットワークは、大量の不正アカウントに対する強力な武器です。 実際の業務では、点と線のルールを設定することで、バッチの異常な動作を効果的に阻止できます。 例えば、関連アカウント(同一IP、同一動作周波数、同一GPSなど)が同時に多数出現し、特定のノートやアカウント(一括いいね)との不審なつながりがある場合、傍受される可能性があります。 たとえば、過去 10 分間にトラフィック プール全体で異常な変動(1 分あたりのユーザー「いいね!」数の平均が平均を XX 倍超える)が発生した場合、アラームがトリガーされ、オーバーフロー トラフィックに関連するコンテンツがブロックされるなどの処理が行われます。 リレーションシップ ネットワークは、市場全体の水平的な比較と監視に関するものです。アカウント管理に関しては、水平的な側面だけでなく、垂直的な側面も考慮する必要があります。 いわゆる水平分析とは、アカウントAとアカウントBCDEFが同時に同じ動作または異常な接続を持っているかどうかを指し、それらをすべてまとめて違いを比較します。 いわゆる垂直とは、同じアカウントに対して異なる時間に実行される操作を指します。 たとえば、アカウント A は過去 6 か月間、いくつかの通常のノートに「いいね!」したり、正常に閲覧したり、コメントしたりしていました。しかし、過去 3 日間は、異常なノートを集中的にやり取りしたり共有したりしていました。 これはアカウントに問題があることを意味します。以前の操作とは異なり、アカウントに警告を発行し、機能をブロックするか、実名を要求する必要があります。 水平的には、ユーザーを他のユーザーの特性と比較することであり、垂直的には、ユーザーの過去の特性と現在の行動を比較することです。 戦略の芸術は、違法なアカウントの取得や大規模な不正行為に対抗するためのドラゴン退治のテクニックです。 07 機密ワード戦略と意思決定エンジンに加えて、アカウント アクセスと APP の強化も行う必要があります。 いわゆるアカウントアクセスシステムとは、ユーザー登録段階で大量のブラックマーケットユーザーを傍受することを指します。 ジャンクや禁止された書き込みを大量に投稿するアカウントは、コード受信プラットフォームに大量に登録されることが多いです。数百台の携帯電話で大勢が運営し、マイクロビジネスが非常に儲かると思っている人は多くないので、そのような卑劣な行為はしないでしょう。 つまり、犯罪者が携帯電話番号を取得するには費用がかかり、また、犯罪者がその番号を複数回使用することが多いため、登録された携帯電話番号自体に十分な問題があるということです。 この携帯電話番号は、Xiaohongshuでフーリガンのように行動する前に、他のプラットフォームで教育されていた可能性があります。 一般的に、登録段階では、携帯電話番号のアクセスルールのレイヤーを追加することをお勧めします。従来の方法は、小規模アカウントと仮想アカウントの登録を禁止することです。さらにもう1つの方法は、Alibaba CloudとTencent Tianyuの登録詐欺防止スコアを購入することです。携帯電話番号+登録IPを入力すると、スコアが返されます。スコアがXXXポイントを超えると、ユーザー登録が拒否されるか、実名(顔または銀行カード)が必要になります。 アリババは電子商取引ブラック産業の最も包括的なデータベースを持ち、テンセントはソーシャルブラック産業の最も包括的なデータベースを持ち、ネットイースはゲームブラック産業の最も包括的なデータベースを持っています。それらはすべてT+0ベースでリアルタイムに更新されています。一部の裕福な企業はそれらをすべて使用でき、他の企業は自由に使用できます。 いずれにしても、リスク管理側が異常記録に基づいて登録アカウントの携帯電話番号を把握できれば、これらを利用して各社のデータ精度や誤検知率を測定することは難しくありません。 この操作は、業界にシールドを追加することと呼ばれます。このシールド層により、市場のブラック業界の95%を基本的にブロックできます。ほとんどのブラック業界は、十分な資金がなく、携帯電話カードをすぐに更新できないため、シールドを回避できません。 アカウントアクセスシステムに加えて、APPの強化も必要です。 いわゆるAPP強化とは、APP自身のコードとインターフェースのカプセル化と動的暗号化、インターフェースの傍受によるコンテンツの直接書き込み、コードクラッキング、サンドボックス化、GPSの変更などの一連の攻撃行為を指します。簡単に言えば、不正行為防止と理解できます。 実際、多くのアプリではユーザーが入力できる内容に制限があります。多くのアプリでは、ユーザーがコンテンツを入力できず、特定のタグをいくつか選択することしかできません。 しかし、ブラック業界が違法コンテンツを侵入する際、手動で情報を記入するのではなく、ローカルAPPコードを直接逆コンパイルし、インターフェースの動的情報を傍受してから、インターフェースを呼び出して入力することがよくあります。 たとえば、普通の人は確かにいくつかの特殊な記号を入力することはできませんが、機械と書き込むためのインターフェースを使用することで、何でも書き込むことができます。 小紅書コミュニティに明らかに違法なコンテンツが大量に存在するのは、おそらくインターフェースがハッキングされ、大量の機械書き込みに遭遇したことが原因だ。これはブラック業界の攻防では非常によくあることだ。 業界においては、機械を通じてジャンクコンテンツを大量に流し込み、競合他社に問題を引き起こすことは珍しくありません。 したがって、アカウントへのアクセスに加えて、APP自体も強化する必要があります。 08 敏感な単語フィルタリング、決定エンジン、シールド、APP 強化、これら 4 つのセットが完成すれば(非常に長い時間がかかり、大規模なプロジェクトになります) 、私たちは安心してリラックスできるでしょうか? いいえ、コンテンツ コミュニティとして、Xiaohongshu には、ユーザー コンテンツ レポート メカニズムという、より重要なメカニズムも必要です。 小紅書が自分達だけで運営していると、死ぬほど努力してもジャンクコンテンツをすべてブロックするのは不可能だ。しかも、戦略であれルールであれ、閾値を緩く設定しすぎると、網をすり抜ける魚が必ず出てくる。 閾値が厳しすぎると、誤って殺されてしまうユーザーが必ず出てきます。こうしたユーザーは、さまざまなフォーラムやオンラインメディアで発言し、Xiaohongshu を非難するでしょう。 良いニュースは広まらないが、悪いニュースは広く伝わるこの時代では、このようなネガティブな情報も小紅書にとって有害である。 Xiaohongshu の最大の特徴は、ユーザーの自発的な参加レベルが高いことです。そのため、完全なユーザー報告メカニズムは非常に効率的なプラットフォーム動作です。 このメカニズムは、いわゆるボタンクリックを追加するほど単純ではありません。ユーザーに表示されるのはレポートボタンです。 しかし、小紅書がやらなければならないのは、報告が有効かどうかを判断する方法、さまざまな報告内容の確認基準と処罰基準、報告が有効になる時間、報告ユーザーの熱意を高めるためにどのような報酬とサポートを与えるべきかなど、報告プロセス全体の完全なSOP(標準操作手順)を設計することです。これもまた巨大なプロジェクトです。 しかし、コンテンツ コミュニティにとって、ユーザー主導のレポートは非常に便利なものです。 09 上記の内容は、基本的なプラットフォームガバナンスシステム、具体的な実施計画、実行計画、元の変数と閾値の細分化などのみです。守秘義務契約と私の仕事の関係で、これ以上を語る立場にはありませんが、リスク管理の同僚の参考としては十分です。 さらに、これらの基本システムは、実際の運用において多くの実際的な困難やシナリオマッチングの問題に直面しています。これらの問題の多くは、単純なリスク管理の問題ではなく、会社全体の戦略とポジショニングが追いつく必要があります。 たとえば、特徴エンジニアリングを行う場合、大量のデータにリアルタイムのパフォーマンスが求められます。データ ウェアハウス部門はどのようにしてデータの整合性を確保できるでしょうか? たとえば、戦略を策定する際には、大量の標準データが必要になります。データ製品は、ビジネスニーズに基づいてテーブル構造を設計し、データをクリーンアップするにはどうすればよいでしょうか。 たとえば、戦略の有効性を評価する際に、リスク管理製品をどのように設計すれば、グレースケールをチャンピオン チャレンジャー(AB テスト)として機能させ、利益を最大化できるでしょうか。 こうした問題は数多くあり、その多くは密接に関連しています。会社のリソースは限られており、会社にはリスク管理以上のものがあります。誰もが生計を立てるためにビジネスとマーケティングに頼らなければなりません。 これらの課題に対しては、会社全体がトップからボトムまでリスクを認識し、事業とリスクコントロールのバランスを全体として考慮し、会社の利益の最大化に努めることが求められます。 インターネット文明のこの大きな潮流の下で、コンテンツリスク管理は多くの企業にとって生命線となるでしょう。多くの先駆者たちは、すでに自らの蓄積を通じて、初期の急成長の利益を享受し、同時に極めて強力なリスク管理障壁を確立しています。 これらの障壁は多くの時間とリソースを必要とし、一夜にして構築されるものではなく、また、販売されているものもありません。 これは後から来た人にとっては非常に難しいことです。 しかし、この災害を生き延びることができれば、あなたは天国に昇るでしょう。 著者: 半仏不滅 出典: BanfoSB 原題: リスク管理を活用して、小紅書が棚から撤去されるのを防ぐには? キーワード: |
<<: 4億7千万人の中流階級の交通をめぐり、巨人たちが競争中!
Rackulous は、ABPNI Group [英国会社番号: NI602753、英国 VAT 番...
WeChat 7.0.0 のリリースから 1 か月後、iOS 向け WeChat 7.0.3 が昨夜...
hncloud(ワーナークラウド、香港ユナイテッドコミュニケーションズインターナショナルリミテッドの...
1. キーワードの選択2. タイトルデザインとキーワードの組み合わせ3. 画期的なキーワードを特定す...
春節の期間中、ほとんどのウェブマスターは祭りを祝うのに忙しくなります。明らかに、これは SEO 攻撃...
今日、企業は、特に経済が不安定な時期にクラウド支出を追跡することの重要性を十分に認識しています。しか...
国家新聞出版広電総局が今年6月2日に「ゲーム出版サービスの管理に関する通知」(以下、「通知」という)...
Spartanhost が HostCat に初めて登場したのはその年の 3 月なので、もう 2 年...
[51CTO.com からのオリジナル記事] 「時には、世界を変える原動力となるのは必ずしもアイデア...
2013年に入ってから、百度の毎週木曜日の小さなアップデートは、一部のウェブマスターの気分に影響を与...
[[429810]]詳細については、以下をご覧ください。 51CTOとHuaweiが共同で構築したH...
今年2月に百度が声明を発表し、SEO会社の声明や事例を安易に信じるべきではない、不適切なSEOはサイ...
昨日、百度は6月28日の事件について公式声明を発表し、その中で低品質サイトの基準についての説明も含ま...
Baidu が更新されるたびに、ウェブサイトの一部が崩壊し、多くの古いウェブマスターは Baidu ...
背景主要クラウドベンダーの製品ポートフォリオが拡大するにつれ、基本的なコンピューティング設備、ミドル...