Linux システム - ファイルシステムと仮想ファイルシステム

[[334629]]

1. ソフトリンクとハードリンクの違い

ファイルにはファイル名とデータが含まれていることはご存じのとおりです。データは、ユーザーデータとメタデータの 2 つの部分に分かれています。ユーザーデータ、つまりファイルデータブロックは、ファイルの実際の内容が記録される場所です。メタデータは、ファイルサイズ、作成時間、所有者、その他の情報など、ファイルの追加属性です。 Linux では、メタデータ内の inode 番号 (inode はファイルメタデータの一部ですが、ファイル名は含まれません。inode 番号はインデックスノード番号です) がファイル名ではなくファイルの一意の識別子になります。ファイル名は、人々の記憶と使用の便宜のためだけに付けられます。システムまたはプログラムは、i ノード番号を通じて正しいファイルデータブロックを見つけます。

ファイル共有の問題を解決するために、Linux システムでは、ハードリンクとソフトリンク (シンボリックリンクとも呼ばれます) の 2 種類のリンクが導入されています。リンクは、Linux システムでのファイル共有の問題を解決するだけでなく、ファイルパスの非表示、権限のセキュリティの強化、ストレージの節約などの利点ももたらします。 1 つの inode 番号が複数のファイル名に対応する場合、これらのファイルはハードリンクと呼ばれます。ハードリンクは複数のエイリアスを持つファイルです。

ハードリンクは、同じ inode 番号を持ちながらファイル名が異なるファイルであるため、次のような特性があります。

ファイルは同じ inode とデータブロックを持ちます。
既存のファイルのみを作成できます。
ファイルシステム間でハードリンクを作成できません。
ディレクトリは作成できません。作成できるのはファイルのみです。
ハードリンクファイルを削除しても、同じ inode 番号を持つ他のファイルには影響しません。

inode 番号は各ファイルシステム内でのみ一意です。 Linux が複数のファイルシステムをマウントする場合、inode 番号が繰り返されます。したがって、ファイルシステム間でハードリンクを作成することはできません。

ソフトリンクはハードリンクとは異なります。ファイルのユーザーデータブロックに格納されているコンテンツが別のファイルのパス名を指している場合、そのファイルはソフトリンクです。ソフトリンクは普通のファイルですが、データブロックの内容は少し特殊です。ソフトリンクには独自の inode 番号とユーザーデータブロックがあります。したがって、ソフトリンクの作成と使用には、ハードリンクのような多くの制限はありません。

ソフトリンクには独自のファイル属性や権限などがあります。
存在しないファイルまたはディレクトリのソフトリンクを作成できます。
ソフトリンクはファイルシステムをまたぐことができます。
ファイルまたはディレクトリに対してソフトリンクを作成できます。
ソフトリンクが作成されると、リンク数 i_nlink は増加しません。

ソフトリンクを削除しても、それが指すファイルには影響しませんが、それが指す元のファイルが削除された場合、関連するソフトリンクはデッドリンク (つまり、ぶら下がったリンク) と呼ばれます。指しているパスファイルを再作成すると、デッドリンクを通常のソフトリンクに復元できます。

一般的に、ファイル名と inode 番号は 1 対 1 で対応しており、各 inode 番号はファイル名に対応します。ただし、Unix/Linux システムでは、複数のファイル名が同じ inode 番号を指すことができます。つまり、異なるファイル名を使用して同じコンテンツにアクセスできるということです。ファイルの内容を変更すると、すべてのファイル名に影響します。ただし、1 つのファイル名を削除しても、別のファイル名へのアクセスには影響しません。この状況は「ハードリンク」と呼ばれます。

2. Linux VFS

Linux には非常に豊富なファイルシステムがあり、大まかに次のカテゴリに分類できます。

nfs、cifs などのネットワークファイルシステム。
ext4、ext3 などのディスクファイルシステム。
proc、sysfs、ramfs、tmpfs などの特殊なファイルシステム。

上記のファイルシステムを実装し、Linux 下で共存させるための基盤となるのが、Linux VFS (Virtual File System、Virtual Filesystem Switch とも呼ばれる)、つまり仮想ファイルシステムです。一般的なファイルシステムとして、VFS はファイル、ディレクトリエントリ (dentry)、インデックスノード (inode)、マウントポイントというファイルシステムの 4 つの基本概念を抽象化します。カーネルのユーザー空間層のファイルシステムに関連するインターフェースを提供します。 VFS は open() や read() などのシステムコールを実装し、cp などのユーザー空間プログラムがファイルシステムをまたぐことを可能にします。 VFS は上記の内容を実際に実現します。Linux では、プロセス以外のすべてがファイルです。

Linux VFS には、スーパーブロックオブジェクト、inode オブジェクト、dentry オブジェクト、ファイルオブジェクトの 4 つの基本オブジェクトがあります。スーパーブロックオブジェクトはインストールされたファイルシステムを表します。インデックスノードオブジェクトはファイルを表します。ディレクトリエントリオブジェクトはディレクトリエントリを表します。たとえば、デバイスファイル event5 はパス /dev/input/event5 にあり、ディレクトリエントリオブジェクトは /、dev/、input/、event5 の 4 つあります。ファイルオブジェクトは、プロセスによって開かれたファイルを表します。ファイルパスを迅速に解決するために、Linux VFS はディレクトリエントリキャッシュ (Directory Entry Cache、dcache) を設計しました。

3. ファイルを開くプロセス

open() システムコールのプロセスは次のとおりです。

ファイルがシステム全体のオープンファイルテーブルに存在するかどうか、つまり、ファイルが他のプロセスによって開かれているかどうかを確認します。
存在する場合、プロセスは、システム全体のオープンファイルテーブル内のファイルを指すエントリをプロセスごとのオープンファイルテーブルに作成します。
存在しない場合は、ファイル名に基づいてディレクトリ内でファイルを検索する必要があります。通常、ディレクトリの一部はキャッシュに保存されるため、検索が高速化されます。
ファイルが見つかると、FCB (ファイル制御ブロック) ファイル制御ブロックがシステム全体のオープンファイルテーブルにコピーされます。このテーブルは、FCB を保存するだけでなく、各ファイルを開いたプロセスの数も記録します。
次に、プロセスごとのオープンファイルテーブルには、プロセスオープンファイルテーブル内の項目を指すエントリが 1 つだけあります。

プロセスがファイルを close() すると、次のようになります。

プロセスのプロセスごとのオープンファイルテーブル内の対応するエントリが削除され、システムオープンテーブル内のファイルカウンタが1減少します。
システムオープンテーブルの計算が0の場合、ファイル項目を削除します

4. inodeの理解

オペレーティングシステムがハードディスクを読み取るとき、セクターごとに読み取るわけではないため、効率が悪すぎます。代わりに、一度に複数のセクターを連続的に読み取ります。つまり、一度に「ブロック」を読み取ります。複数のセクターで構成されるこの「ブロック」は、ファイルアクセスの最小単位です。最も一般的な「ブロック」サイズは 4KB です。つまり、8 つの連続したセクターがブロックを形成します。

ファイルデータは「ブロック」に保存されるため、ファイルの作成者、ファイルの作成日、ファイルのサイズなどのファイルのメタデータを保存する場所も見つける必要があります。ファイルのメタデータを保存するこの領域は inode と呼ばれ、中国語では「インデックスノード」と翻訳されます。

inode には、ファイルのメタ情報、具体的には次のものが含まれます。

* ファイル内のバイト数
* ファイル所有者のユーザーID
* ファイルのグループID
* ファイルの読み取り、書き込み、実行権限
* ファイルには 3 つのタイムスタンプがあります。ctime は inode が最後に変更された時刻、mtime はファイルの内容が最後に変更された時刻、atime はファイルが最後に開かれた時刻を示します。
* リンクの数、つまりこのinodeを指すファイル名の数
* ファイルデータブロックの場所

ファイル名以外のすべてのファイル情報はinodeに保存されます

各 inode には番号があり、オペレーティングシステムは inode 番号を使用してさまざまなファイルを識別します。

表面的には、ユーザーはファイル名でファイルを開きます。実際、システム内のこのプロセスは 3 つのステップに分かれています。まず、システムはファイル名に対応する inode 番号を見つけます。 2 番目に、inode 番号を通じて inode 情報を取得します。最後に、inode 情報に基づいて、ファイルデータが配置されているブロックを見つけてデータを読み取ります。

ディレクトリもファイルの一種です。ディレクトリファイルの構造は非常に単純で、一連のディレクトリエントリ (dirent) のリストです。各ディレクトリエントリは、含まれるファイルのファイル名と、ファイル名に対応する inode 番号の 2 つの部分で構成されます。

ブロックアドレス指定

inode はファイルデータブロックの場所を記録します。アドレッシングモードには 3 つあります。直接ブロックはデータブロックを直接指します。単一間接は、データブロックへのポインターを含むブロックを指します。二重間接、2レベルブロック

5. ファイル記述子

Linux システムでは、すべてをファイルと見なすことができ、ファイルは通常のファイル、ディレクトリファイル、リンクファイル、デバイスファイルに分類できます。ファイル記述子は、開かれたファイルを効率的に管理するためにカーネルによって作成されるインデックスです。これは、開かれたファイルを参照するために使用される負でない整数 (通常は小さな整数) です。 I/O 操作を実行するすべてのシステムコールは、ファイル記述子を通じて行われます。プログラムを起動したばかりのときは、0 が標準入力、1 が標準出力、2 が標準エラーです。この時点で新しいファイルを開くと、そのファイル記述子は 3 になります。POSIX 標準では、ファイル (ソケットを含む) を開くたびに、現在のプロセスで使用可能な最小のファイル記述子番号を使用する必要があります。

ファイル記述子はシステムの重要なリソースです。システムメモリと同じ数のファイル記述子を開くことができますが、実際の実装ではカーネルが対応する処理を実行します。通常、開いているファイルの最大数はシステムメモリの 10% (KB 単位で計算) です (システムレベルの制限と呼ばれます)。

6. ファイル記述子と開いているファイルの関係

各ファイル記述子は開いているファイルに対応し、異なるファイル記述子が同じファイルを指すことができます。同じファイルを異なるプロセスで開くことも、同じプロセスで複数回開くこともできます。システムは各プロセスのファイル記述子テーブルを維持します。テーブルの値は 0 から始まるため、異なるプロセスで同じファイル記述子が表示されます。この場合、同じファイル記述子が同じファイルまたは異なるファイルを指す場合があります。特定の状況には特定の分析が必要です。具体的な概要を理解するには、カーネルによって管理される 3 つのデータ構造を確認する必要があります。

プロセスレベルのファイル記述子テーブル
システム全体のオープンファイル記述子テーブル
ファイルシステムのiノードテーブル

プロセスレベルの記述子テーブルの各エントリには、単一のファイル記述子に関する情報が記録されます。

ファイル記述子の操作を制御するフラグのセット。 (現在、このようなフラグは close-on-exec フラグの 1 つだけが定義されています。)
開いているファイルハンドルへの参照

カーネルは、開いているすべてのファイルに対してシステム全体の記述子テーブル (開いているファイル記述テーブル) を管理します。場合によっては、オープンファイルテーブルとも呼ばれ、テーブル内の各エントリはオープンファイルハンドルと呼ばれます。開いているファイルハンドルには、次のように開いているファイルに関連するすべての情報が格納されます。

現在のファイルオフセット (read() および write() の呼び出し時に更新されるか、lseek() で直接変更されます)
ファイルを開くときに使用されるステータスフラグ (つまり、open() の flags パラメータ)
ファイルアクセスモード (読み取り専用モード、書き込み専用モード、open() 呼び出し時に設定される読み取り/書き込みモードなど)
信号ドライバ関連の設定
ファイルのi-nodeオブジェクトへの参照
ファイルの種類（通常のファイル、ソケット、FIFO など）とアクセス権限
ファイルが保持するロックのリストへのポインタ
ファイルのさまざまなプロパティ（ファイルサイズ、さまざまな種類の操作に関連付けられたタイムスタンプなど）

プロセス A では、ファイル記述子 1 と 30 は両方とも同じオープンファイルハンドル (ラベル 23) を参照します。これは、dup()、dup2()、fcntl() を呼び出したり、同じファイルに対して open() 関数を複数回呼び出したりすることによって発生する可能性があります。

プロセス A のファイル記述子 2 とプロセス B のファイル記述子 2 は、両方とも同じオープンファイルハンドル (ラベル 73) を指します。この状況は、fork() を呼び出した後 (つまり、プロセス A と B が親子プロセスである)、またはプロセスが UNIX ドメインソケットを介して開いているファイル記述子を別のプロセスに渡すときに発生する可能性があります。もう 1 つのケースは、異なるプロセスが独立して open 関数を呼び出して同じファイルを開く場合です。このとき、プロセス内の記述子には、他のプロセスがファイルを開くために使用する記述子と同じ記述子が割り当てられます。

さらに、プロセス A の記述子 0 とプロセス B の記述子 3 は異なるオープンファイルハンドルを指していますが、これらのハンドルはすべて i ノードテーブルの同じエントリ (1976)、つまり同じファイルを指しています。これは、各プロセスが同じファイルに対して独自の open() 呼び出しを行うために発生します。同じプロセスが同じファイルを 2 回開いた場合にも同様の状況が発生します。

7. 結論

プロセスレベルのファイル記述子テーブルが存在するため、同じファイル記述子が異なるプロセスに出現し、同じファイルまたは異なるファイルを指している可能性があります。
同じオープンファイルハンドルを参照する 2 つの異なるファイル記述子は、同じファイルオフセットを共有します。したがって、ファイルオフセットがファイル記述子の 1 つ (read()、write()、または lseek() の呼び出しにより) によって変更された場合、2 つのファイル記述子が異なるプロセスに属しているか同じプロセスに属しているかに関係なく、その変更は他の記述子からも検出されます。
開いているファイルのフラグ (O_APPEND、O_NONBLOCK、O_ASYNC など) を取得および変更するには、前の操作と同様のスコープ制約を持つ fcntl() の F_GETFL および F_SETFL 操作を実行します。
ファイル記述子フラグ (close-on-exec など) は、プロセスとファイル記述子にのみ適用されます。このフラグを変更しても、同じプロセス内または異なるプロセス内の他のファイル記述子には影響しません。

<<: 革新的企業華雲南がLingdong脆弱性管理プラットフォーム製品をリリース

>>: オープンソースのKVMカーネル仮想化技術とその管理方法の詳細な説明

Linux システム - ファイルシステムと仮想ファイルシステム

ソフトコピーライティングの革新はウェブサイトの最適化に不可欠

テンセントのオープンプラットフォームは30億元のパイを持っている：美しく見えるが、現実は非常に暗い

Google Cloud——Tencent Cloud の新たな仲間か?

ウェブサイトの外部リンク構築は一歩先を行くべき

Google DevOps レポート: ハイブリッドクラウドまたはマルチクラウドを使用するとパフォーマンス目標を上回ることができます

大手企業はクラウドコンピューティング業界での競争に力を入れている

IDC レポート: 中国電子クラウドが政府クラウドプラットフォームのトップにランクイン!

raksmart（日本のデータセンター）の簡単なレビュー日本の独立サーバー、実際のテストデータを共有し、raksmartサーバーがいかに優れているかをお伝えします

Facebookのセキュリティ脆弱性：600万人のユーザー情報が漏洩

ウェブサイトはサイト内でのキーワードの競合を避けるべきである

推薦する

digitalocean vps、9 つのデータセンター: ネットワーク + I/O の詳細

#blackfriday# LightCloud·LightCloud- KVM VPS、最低11元/高防御+Jingdun + CN2

SEO最適化が入札プロモーションよりも費用対効果が高い3つの理由

Cloudive 簡単レビュー - [メモリ2g/月額7ドル]

ethelite-$5/Xen/512m メモリ/35g ハードディスク/1.25T トラフィック/フリーモント

クラウドネイティブエコシステムカンファレンス2日目: NetEaseクラウドコンピューティングサービスメッシュとYum Chinaのミッドティアアーキテクチャプラクティス

Crunchyroll の有料ユーザーは 10 万人を超えています。アニメ動画サイトの春は来るのでしょうか?

クラウドコンピューティングにおけるポストモダニズム

トマトスキャンダル：マーケティングの信憑性はわかりにくいが、メリットは明らか

ウェブサイトが降格された後に新しいランキングで良い仕事をする方法

pzea-新しいシンガポールデータセンター VPS レビュー、100M ポート

WeChat マーケティングリテラシーポスト: 習得すべき 28 のスキル

インダストリークラウドのビジネス価値

張青：コンテンツの観点からタオバオのサプライネットワークを分析

InterServer: 75% オフ、年間 25 ドル、無制限の Web ホスティング、22 年の信頼のブランド