Elasticsearch - 分散検索および分析エンジン

Elasticsearch - 分散検索および分析エンジン

Elasticsearch 入門

Elasticsearch (略して ES) は、全文検索、構造化検索、分析、およびデータの保存に使用されるオープンソースの分散検索および分析エンジンです。 Elasticsearch は Apache Lucene をベースにした検索エンジンで、RESTful API を通じて操作される分散型マルチテナント全文検索エンジンを提供します。

Elasticsearch は、ログおよびトランザクション データの分析、全文検索アプリケーション、構造化データの検索と分析、セキュリティ インテリジェンスでよく使用されます。ビッグデータの分野では、Elasticsearch と Hadoop や Spark などのビッグデータ処理ツールを組み合わせることで、より複雑なデータ分析や処理タスクを実現できます。

Elasticsearch には次の機能があります。

  1. 分散型: Elasticsearch は、高可用性と水平スケーラビリティを実現するために複数のノードに簡単に拡張できる分散システムです。
  2. リアルタイム: Elasticsearch はリアルタイムでデータをインデックスして検索できるため、高速なデータ取得と分析をサポートします。
  3. ドキュメント ストレージ: Elasticsearch は、それぞれが JSON オブジェクトであるドキュメントの形式でデータを保存します。
  4. 強力な検索機能: Elasticsearch は、全文検索、集計分析、地理空間検索など、豊富な検索機能を提供します。
  5. 多言語サポート: Elasticsearch は複数のプログラミング言語のクライアントをサポートしているため、さまざまなアプリケーションとの統合が容易になります。
  6. 拡張性: Elasticsearch は、必要に応じてカスタマイズおよび拡張できる豊富なプラグインと API を提供します。
  7. オープンソース: Elasticsearch はオープンソースであり、活発なコミュニティ サポートと継続的な更新と改善が行われています。

Elasticsearch の主な使用シナリオ:

  1. リアルタイム検索エンジン: Elasticsearch を使用すると、高速な全文検索と関連性の並べ替えをサポートするリアルタイム検索エンジンを構築できます。ドキュメント、ログ、製品情報など、さまざまなタイプのデータ検索に適しています。
  2. ログとインジケーターの分析: Elasticsearch は、大量のログ データとインジケーター データを保存および分析するために使用でき、高速なデータ取得と集約分​​析をサポートし、監視システム、ログ分析、パフォーマンス分析などのシナリオに適しています。
  3. 全文検索エンジン: Elasticsearch は、単語の分割、言語分析、関連性スコアリングなどの複雑な全文検索機能をサポートしており、全文検索エンジンやドキュメント検索システムの構築に適しています。
  4. リアルタイム データ分析: Elasticsearch はリアルタイム データ分析と視覚化に使用でき、複雑なデータ集約と視覚化をサポートし、ビジネス データ分析やリアルタイム監視などのシナリオに適しています。

Elasticsearch の使用

  1. Elasticsearch 依存関係を追加します。プロジェクトの pom.xml ファイルに Elasticsearch 依存関係を追加します。
 <dependencies> <!-- Spring Data Elasticsearch --> <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-data-elasticsearch</artifactId> </dependency> <!-- Elasticsearch的REST客户端--> <dependency> <groupId>org.elasticsearch.client</groupId> <artifactId>elasticsearch-rest-high-level-client</artifactId> </dependency> </dependencies>
  1. Elasticsearch 接続を構成する: application.properties または application.yml ファイルで Elasticsearch 接続情報を構成する:
 spring: data: elasticsearch: cluster-nodes: localhost:9200
  1. エンティティ クラスの作成: Elasticsearch インデックスに対応するエンティティ クラスを作成し、@Document アノテーションでマークします。
 @Document(indexName = "product", createIndex = false) public class Product { @Id private String id; @Field(type = FieldType.Text, fielddata = true) private String name; @Field(type = FieldType.Keyword) private String category; @Field(type = FieldType.Float) private float price; public Product() { } public Product(String id, String name, String category, float price) { this.id = id; this.name = name; this.category = category; this.price = price; } // getter和setter方法public String getId() { return id; } public void setId(String id) { this.id = id; } public String getName() { return name; } public void setName(String name) { this.name = name; } public String getCategory() { return category; } public void setCategory(String category) { this.category = category; } public float getPrice() { return price; } public void setPrice(float price) { this.price = price; } }
  1. ElasticsearchRepository を作成する: Elasticsearch の操作を定義するために、ElasticsearchRepository から継承したインターフェースを作成します。
 public interface ProductRepository extends ElasticsearchRepository<Product, String> { // 根据名称查找产品Iterable<Product> findByName(String name); }
  1. ビジネス ロジックを記述する: Elasticsearch データを操作するためにビジネス ロジックで ElasticsearchRepository を使用します。
 @Service public class ProductService { @Autowired private ProductRepository productRepository; public Product saveProduct(Product product) { return productRepository.save(product); } public List<Product> findAllProducts() { return productRepository.findAll(); } public List<Product> findProductByName(String name) { return (List<Product>) productRepository.findByName(name); } public void deleteProduct(String id) { productRepository.deleteById(id); } }
  1. コントローラーでサービスを呼び出します。
 @RestController @RequestMapping("/products") public class ProductController { @Autowired private ProductService productService; @PostMapping public Product saveProduct(@RequestBody Product product) { return productService.saveProduct(product); } @GetMapping public List<Product> getAllProducts() { return productService.findAllProducts(); } @GetMapping("/name/{name}") public List<Product> getProductByName(@PathVariable String name) { return productService.findProductByName(name); } @DeleteMapping("/{id}") public void deleteProduct(@PathVariable String id) { productService.deleteProduct(id); } }

実際の使用では、より複雑なクエリや高度な機能については、ページング、ソート、集計などの Elasticsearch のより高度な機能を活用したり、カスタム クエリ メソッドを記述したり、Elasticsearch のネイティブ クエリ DSL を使用したりする必要があります。

<<:  TraefikをベースにしたKubernetes Ingressネットワークシステムについてお話しましょう

>>:  Kubernetes での AI と機械学習のワークロードの最適化

推薦する

民生健康の程宇氏:中央集権的な考え方は分散型ビジネスの実現を妨げる

7月19日、上海で第3回FEAインターネット保険開発会議が開催され、アント・ファイナンシャル、中国人...

#乾物おすすめ# BandwagonHost: 11.11の特別プロモーション商品、在庫限り

BandwagonHostは、熱狂的なオンラインショッピングフェスティバルでもある中国の独身の日(1...

Baidu入札の実践経験の共有

Baidu 入札アカウントを運営したことがある人なら誰でも、プロモーション期間中にアカウントが異常な...

メタバーストラック: 左にメタ、右にバイト

最近、バイトダンスのソーシャル戦略における「進退」がメディアから広く注目を集めている。一方、Tech...

ライブストリーミングルームに「閉じ込められた」電子商取引企業

ライブストリーミング電子商取引は近年急速に発展しています。一方では、電子商取引ライブストリーミングの...

コンテンツマーケティングとは何ですか?

「コンテンツ マーケティング」という 4 つの単語はそれほど深い意味はありませんが、その意味を明確に...

extravm: 初月 30% オフ/更新 30% オフ、米国 VPS は月額 1.65 ドルから、AMD Ryzen 高性能 VPS、無制限のトラフィック、100G の高防御保護

現在、extravmではアメリカ中部のダラスデータセンターのVPSを対象に初月30%オフ/更新30%...

desivps: 新しいインドの VPS - 100M 帯域幅、年間 36 ドル - 1G メモリ/1 コア/15g SSD/300g トラフィック

desivps は電子メール グループを通じて最新ニュースを送信しました。新しいインドのデータ セン...

hosteons: 安価な米国 VPS、月額 2 ドル、1G メモリ/1 コア/15g SSD/2T トラフィック/10Gbps 帯域幅、ロサンゼルス/ポートランドを含む 6 つのデータセンター

Hosteonsは現在、米国のデータセンターにあるすべてのVPSに対して特別プロモーションを提供して...

予算vm-70USD/E3-1230V2/32GB RAM/2TB HDD/30TB Flow/ロサンゼルス

budgetvm は、最初の 1 か月間 50% 割引の専用サーバーを 3 つ提供しています: T1...

教えるのが下手な教師だけが語る、サスのウェブサイトコンテンツシステム構築

ベッドに横になりながら、蘇貞潔の『尊厳は無価ではない』を楽しく読みました。本を手に取りながら、蘇貞潔...

Kubernetesを本番環境で使用した3年間の経験から学んだこと

[編集者注] Kubernetes の旅から得られた主な教訓。私たちは 2017 年にバージョン 1...

2021年のプライベートクラウド市場の動向

パブリック クラウド サービスは多くのユース ケースに適しており、広く使用されています。しかし、ビジ...

検索エンジン最適化は高度な思考を伴う技術的かつ物理的な活動である

検索エンジン最適化を行う人は、コード農家のようなもの、あるいは給料の安い移民労働者のようなもので、将...