現実的なKubernetesログソリューション

マイクロサービスアプリケーションのログチェーンは通常長く、ログ収集 → ログバッファリング → ログのフィルタリングとクリーニング → ログの保存 → ログの表示というリンクが含まれます。各リンクには、問題を解決するための複数の対応するコンポーネントがあり、その結果、業界ではさまざまな全体的なソリューションが組み合わされています。

以前、マイクロサービスが IDC コンピュータルームの仮想マシンにデプロイされていたとき、マイクロサービスアプリケーションで一般的なログソリューションでもある ELK (Elasticsearch、Logstash、Kibana) ソリューションを使用していました。数年前、アプリケーションの展開全体が Kubernetes に切り替えられた後も、私はこのソリューションを使い続けました。

以下では、Kubernetes シナリオにおける ELK ベースのログソリューションを紹介します。全体的なアイデア: Filebeat -> Kafka -> Logstash -> Elasticsearch -> Kibana。

1. ログデータフロー

ログデータの流れを下図に示します。

2. ログ収集

2.1 コンテナログはどこにありますか?

まず、コンテナは K8S クラスターノード上の単なるプロセスであるという概念を理解する必要があります。 K8S クラスターマシン上でこの Docker プロセスを見つけるには、対応するフォルダーに移動してログファイルを表示します。

通常、コンテナログはホスト上の /var/lib/docker/containers/ ディレクトリに保存されます。

 # 日志在宿主机的这个文件夹下cd /var/lib/docker/containers # 用这个命令可以查找对应的日志文件find /var/lib/docker/containers -name "*-json.log"

/var/lib/docker/containers/ に移動すると、不規則なフォルダーが多数表示されます。

これらの不規則なフォルダー名を見ると少し混乱するかもしれませんが、よく見ると、これらのコードは実際には対応する Docker コンテナーの ID であることがわかります。引き続き、名前でコンテナ ID を表示します。

 # docker命令查看容器docker ps -a

コンテナ ID を見つけると、コンテナ ID の最初の数桁がログフォルダー名の最初の数桁と完全に一致することがわかります。 docker ps によって表示されるコンテナ ID には、ID 全体の最初の数桁のみが表示されます。

ログフォルダに入ると、特定の json ログファイルが表示されます。

これで、ログファイルが保存される場所がわかりました。もちろん、ログレベルを制御し、ログのクリーニングを適切に行う必要があります。そうしないと、ログの数が多くなり、ディスク領域が不足することになります。 Pod が破棄されると、ログファイルも破棄されます。

ファイルが見つかったら、次のステップはログを収集する方法を確認することです。

2.2 ログ収集ツール

ログ収集ツールは多数あります。この記事では、ログ収集ツールとして Filebeat を使用します。

Filebeat は、ログとファイルを転送および集約するための軽量の配送プログラムです。 Filebeat はサーバーにエージェントとしてインストールされ、指定したログファイルまたは場所を監視します。ログイベントは収集され、Elasticsearch、Logstash、または Kafka に転送されます。公式ドキュメントに示されているワークフローは次のとおりです。

Filebeat の主な利点は次のとおりです。

軽量で使いやすい
無料でオープンソース
リソース利用率が低い
良いパフォーマンス

2.3 ログの収集方法

ログ収集ツールを選択したら、次のステップはデータの収集方法です。

K8S デプロイメントシナリオでは、各ノードでコンテナログを収集する場合、自動デプロイメントに Deamonset コントローラーを使用する必要があります。これにより、新しいノードが追加されるたびに、Filebeat Pod が自動的にデプロイされます。 Filebeat が各ノードに自動的にインストールされると、各ノードのログが自動的に収集され、Kafka に出力されます。

Filebeat の一般的な構成 yaml は次のとおりです。

 apiVersion: v1 kind: ConfigMap metadata: name: filebeat-config namespace: ops-monit labels: k8s-app: filebeat data: filebeat.yml: |- filebeat.inputs: - type: container #因为是采集的容器日志，所以这里要用container 不能用log，否则拿不到容器日志enable: true stream: stdout #只取stdout日志paths: - /var/log/containers/*demo*.log #采集了demo环境的所有日志processors: - add_kubernetes_metadata: # 增加kubernetes的属性in_cluster: true host: ${NODE_NAME} matchers: - logs_path: logs_path: "/var/log/containers/" - drop_event: when: contains: message: "INFO" - drop_event: when: contains: message: "DEBUG" # 配置多行显示multiline.type: pattern multiline.pattern: '^[0-9]{4}-[0-9]{2}-[0-9]{2}' multiline.negate: true multiline.match: after fields: logtype: applog output.kafka: hosts: ['172.10.10.10:9092','172.10.10.11:9092','172.10.10.12:9092'] topic: 'topic-bizlog' partition.round_robin: reachable_only: false --- apiVersion: apps/v1 kind: DaemonSet metadata: name: filebeat namespace: ops-monit labels: k8s-app: filebeat spec: selector: matchLabels: k8s-app: filebeat template: metadata: labels: k8s-app: filebeat spec: serviceAccountName: filebeat terminationGracePeriodSeconds: 30 dnsPolicy: ClusterFirstWithHostNet containers: - name: filebeat image: elastic/filebeat:7.12.1 args: [ "-c", "/etc/filebeat.yml", "-e", ] env: - name: ELASTICSEARCH_HOST value: "172.10.20.10" - name: ELASTICSEARCH_PORT value: "9200" - name: ELASTICSEARCH_USERNAME value: - name: ELASTICSEARCH_PASSWORD value: - name: ELASTIC_CLOUD_ID value: - name: ELASTIC_CLOUD_AUTH value: - name: NODE_NAME valueFrom: fieldRef: fieldPath: spec.nodeName securityContext: runAsUser: 0 # If using Red Hat OpenShift uncomment this: # privileged: true resources: limits: cpu: 3000m memory: 2000Mi requests: cpu: 500m memory: 100Mi volumeMounts: - name: timezone mountPath: /etc/localtime - name: config mountPath: /etc/filebeat.yml readOnly: true subPath: filebeat.yml - name: data mountPath: /usr/share/filebeat/data - name: varlibdockercontainers mountPath: /var/lib/docker/containers readOnly: true - name: varlog mountPath: /var/log volumes: - name: timezone hostPath: path: /usr/share/zoneinfo/Asia/Shanghai - name: config configMap: defaultMode: 0640 name: filebeat-config - name: varlibdockercontainers hostPath: path: /var/lib/docker/containers - name: varlog hostPath: path: /var/log - name: data hostPath: path: /var/lib/filebeat-data type: DirectoryOrCreate --- apiVersion: rbac.authorization.k8s.io/v1 kind: ClusterRoleBinding metadata: name: filebeat namespace: ops-monit subjects: - kind: ServiceAccount name: filebeat namespace: ops-monit roleRef: kind: ClusterRole name: filebeat apiGroup: rbac.authorization.k8s.io --- apiVersion: rbac.authorization.k8s.io/v1 kind: ClusterRole metadata: name: filebeat namespace: ops-monit labels: k8s-app: filebeat rules: - apiGroups: [""] # "" indicates the core API group resources: - namespaces - pods - nodes verbs: - get - watch - list --- apiVersion: v1 kind: ServiceAccount metadata: name: filebeat namespace: ops-monit labels: k8s-app: filebeat ---

3. ログのバッファリング、フィルタリング、クリーニング、保存、表示

3.1 バッファ

Kafka はメッセージ処理エンジンであり、ここではログデータのバッファツールとして Kafka が使用されます。 Kafka には 2 つの用途があります。

バッファとして、ダウンストリームが時間内にログデータを大量に消費するのを防ぐために、メッセージバッファレイヤーを追加する必要があります。このレイヤーは必須です。
Kafka メッセージは他のアプリケーションによって監視および消費され、フィルタリングされて WeChat、DingTalk、電子メールなどにアラーム情報として出力されます。

3.2.フィルタリング、クリーニング、転送

Logstash は、さまざまなソースからデータを取り込むためのさまざまなプラグインが付属するログ収集および処理エンジンです。そして、データを変換してから宛先に転送することができます。私は、ログの取り込み、フィルタリング、クリーニング、転送のためのツールとして Logstash を使用しています。

これは大まかな Logstash Conf ファイルです。ファイルの内容は、入力、フィルター、出力の 3 つの部分に分かれています。

 input { kafka { bootstrap_servers=>"172.10.7.79:9092" topics=>["topic-bizlogs"] codec => "json" } } filter{ mutate{ split => ["message", "|"] add_field => { "log_time" => "%{[message][0]}"} add_field => { "level" => "%{[message][1]}"} add_field => { "class" => "%{[message][2]}"} add_field => { "line" => "%{[message][3]}"} add_field => { "thread" => "%{[message][4]}"} add_field => { "log_message" => "%{[message][5]}"} add_field => { "env" => "%{[kubernetes][namespace]}"} add_field => { "podName" => "%{[kubernetes][pod][name]}"} add_field => { "podId" => "%{[kubernetes][pod][uid]}"} add_field => { "image" => "%{[container][image][name]}"} add_field => { "imageId" => "%{[container][id]}"} add_field => { "nodeId" => "%{[kubernetes][node][uid]}"} add_field => { "nodeName" => "%{[kubernetes][node][name]}"} add_field => { "nodeHostName" => "%{[kubernetes][node][hostname]}"} add_field => { "logPath" => "%{[log][file][path]}"} add_field => { "appName" => "%{[kubernetes][labels][app]}"} remove_field => ["agent","fields","input","ecs","host","@version","kubernetes","stream","log","container"] } } output{ elasticsearch{ hosts=>["172.11.4.82:9200"] index => "%{appName}‐%{+YYYY.MM.dd}" } }

3.3 保存と検索

Elasticsearch はスケーラブルな検索エンジンです。ここでは、ログの保存および検索ツールとして Elasticsearch を使用します。

3.4 ディスプレイ

Kibana を使用して、ログの視覚的な UI を構築します。

4. まとめ

この記事では主に、Kubernetes シナリオでより実用的で簡単に実装できる ELK ベースのログソリューションを紹介します。全体的なアイデア: Filebeat -> Kafka -> Logstash -> Elasticsearch -> Kibana。

この記事では、Kafka、Logstash、Elasticsearch、Kibana のインストールについては紹介しません。いくつかの構成ファイルについてのみ言及されています。読者はインストールプロセス中に情報を参照し、自分で構築することができます。

<<: クラウドアプリケーションで最新の倉庫管理を更新する方法

>>: Go言語: 感銘を受けた13の機能

検索エンジンは頻繁にアルゴリズムを更新しており、SEO業界は将来的に圧縮されるだろう

現実的なKubernetesログソリューション

1. ログデータフロー

2. ログ収集

2.1 コンテナログはどこにありますか?

2.2 ログ収集ツール

2.3 ログの収集方法

3. ログのバッファリング、フィルタリング、クリーニング、保存、表示

3.1 バッファ

3.2.フィルタリング、クリーニング、転送

3.3 保存と検索

3.4 ディスプレイ

4. まとめ

検索エンジンは頻繁にアルゴリズムを更新しており、SEO業界は将来的に圧縮されるだろう

mycustomhosting-6 USD KVM/2 GB RAM/50 GB HDD/1 TB トラフィック

実際に自社サイトのランキング変動を分析。Baiduのアルゴリズム調整時に注目すべき要素

ビッグネットワークデータ：国慶節ピーク割引、クラウドサーバーは月額28元から-湖北100G高防御クラウド+香港\韓国\米国CN2クラウド、湖北専用サーバー、100G高防御+50M帯域幅、299元から

オンラインで募集している友人への10の心からの言葉

事例分析：ミニゲーム「皇帝になりたい」はどのようにしてWeChatで爆発的な成長を遂げたのか？

MikroVPS-3.45 ユーロ/Xen/512M メモリ/25G ハードドライブ/1.5T トラフィック/10G ポート

atcloud: 480G 超高防御 VPS 月額 4 ドルから、米国/シンガポールに 6 つのデータセンター、512m メモリ/1 コア/500g ハードディスク/無制限トラフィック

DevOps とクラウドコンピューティングが共に重要な理由

自分の家を掃除できないのに、どうやって世界を掃除できるでしょうか? ウェブサイトを最適化できないのに、どうやってランキングを上げることができるでしょうか?

推薦する

キーワードウェブサイトプロモーションは欠かせないツールです

フォレスターが2023年のクラウドコンピューティングのトップ10トレンドを発表

SEO に関する別の話、ぜひ読んでみてください: ウェブサイトのコンテンツ作成

ビデオクラウド大手の「新たな戦場」

微博ユーザーは企業ユーザーに対してより受容的であり、微博のソーシャルマーケティング価値が強調されている

hostkvm: 50% オフ、ロシア cn2 gia vps (150M 帯域幅) は月額 4 ドルから、香港 50G 高防御 VPS (20M 帯域幅) は月額 17 ドルから

検索エンジン最適化におけるウェブサイトのコンテンツ、構造、キーワードについて

onevps: 大規模トラフィック「日本VPS\シンガポールVPS」、永久25%割引、中国で利用可能なIPアドレス保証、「Alipay」決済に接続

WeChat Moments マーケティングをうまく行いたいなら、次の 7 つのポイントに注意する必要があります。

Baidu が新しいウェブマスタープラットフォームを立ち上げ、ウェブサイト運営コンベンションを開始

Dreamhost-VPS シンプルレビュー (旧バージョン VPS)

SEOを行う際に数千万ページを制作・管理する方法

kvchosting 無料ホスティング

SEO最適化とウェブサイトの立ち上げを統合する方法

Huarui Cloud: 香港 CN2 GIA (双方向) クラウドサーバー、月額 15 元から、年間支払いで 15% オフ、複数の構成をお得に