Elasticsearch - 分散検索および分析エンジン

Elasticsearch 入門

Elasticsearch (略して ES) は、全文検索、構造化検索、分析、およびデータの保存に使用されるオープンソースの分散検索および分析エンジンです。 Elasticsearch は Apache Lucene をベースにした検索エンジンで、RESTful API を通じて操作される分散型マルチテナント全文検索エンジンを提供します。

Elasticsearch は、ログおよびトランザクションデータの分析、全文検索アプリケーション、構造化データの検索と分析、セキュリティインテリジェンスでよく使用されます。ビッグデータの分野では、Elasticsearch と Hadoop や Spark などのビッグデータ処理ツールを組み合わせることで、より複雑なデータ分析や処理タスクを実現できます。

Elasticsearch には次の機能があります。

分散型: Elasticsearch は、高可用性と水平スケーラビリティを実現するために複数のノードに簡単に拡張できる分散システムです。
リアルタイム: Elasticsearch はリアルタイムでデータをインデックスして検索できるため、高速なデータ取得と分析をサポートします。
ドキュメントストレージ: Elasticsearch は、それぞれが JSON オブジェクトであるドキュメントの形式でデータを保存します。
強力な検索機能: Elasticsearch は、全文検索、集計分析、地理空間検索など、豊富な検索機能を提供します。
多言語サポート: Elasticsearch は複数のプログラミング言語のクライアントをサポートしているため、さまざまなアプリケーションとの統合が容易になります。
拡張性: Elasticsearch は、必要に応じてカスタマイズおよび拡張できる豊富なプラグインと API を提供します。
オープンソース: Elasticsearch はオープンソースであり、活発なコミュニティサポートと継続的な更新と改善が行われています。

Elasticsearch の主な使用シナリオ:

リアルタイム検索エンジン: Elasticsearch を使用すると、高速な全文検索と関連性の並べ替えをサポートするリアルタイム検索エンジンを構築できます。ドキュメント、ログ、製品情報など、さまざまなタイプのデータ検索に適しています。
ログとインジケーターの分析: Elasticsearch は、大量のログデータとインジケーターデータを保存および分析するために使用でき、高速なデータ取得と集約分析をサポートし、監視システム、ログ分析、パフォーマンス分析などのシナリオに適しています。
全文検索エンジン: Elasticsearch は、単語の分割、言語分析、関連性スコアリングなどの複雑な全文検索機能をサポートしており、全文検索エンジンやドキュメント検索システムの構築に適しています。
リアルタイムデータ分析: Elasticsearch はリアルタイムデータ分析と視覚化に使用でき、複雑なデータ集約と視覚化をサポートし、ビジネスデータ分析やリアルタイム監視などのシナリオに適しています。

Elasticsearch の使用

Elasticsearch 依存関係を追加します。プロジェクトの pom.xml ファイルに Elasticsearch 依存関係を追加します。

 <dependencies> <!-- Spring Data Elasticsearch --> <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-data-elasticsearch</artifactId> </dependency> <!-- Elasticsearch的REST客户端--> <dependency> <groupId>org.elasticsearch.client</groupId> <artifactId>elasticsearch-rest-high-level-client</artifactId> </dependency> </dependencies>

Elasticsearch 接続を構成する: application.properties または application.yml ファイルで Elasticsearch 接続情報を構成する:

 spring: data: elasticsearch: cluster-nodes: localhost:9200

エンティティクラスの作成: Elasticsearch インデックスに対応するエンティティクラスを作成し、@Document アノテーションでマークします。

 @Document(indexName = "product", createIndex = false) public class Product { @Id private String id; @Field(type = FieldType.Text, fielddata = true) private String name; @Field(type = FieldType.Keyword) private String category; @Field(type = FieldType.Float) private float price; public Product() { } public Product(String id, String name, String category, float price) { this.id = id; this.name = name; this.category = category; this.price = price; } // getter和setter方法public String getId() { return id; } public void setId(String id) { this.id = id; } public String getName() { return name; } public void setName(String name) { this.name = name; } public String getCategory() { return category; } public void setCategory(String category) { this.category = category; } public float getPrice() { return price; } public void setPrice(float price) { this.price = price; } }

ElasticsearchRepository を作成する: Elasticsearch の操作を定義するために、ElasticsearchRepository から継承したインターフェースを作成します。

 public interface ProductRepository extends ElasticsearchRepository<Product, String> { // 根据名称查找产品Iterable<Product> findByName(String name); }

ビジネスロジックを記述する: Elasticsearch データを操作するためにビジネスロジックで ElasticsearchRepository を使用します。

 @Service public class ProductService { @Autowired private ProductRepository productRepository; public Product saveProduct(Product product) { return productRepository.save(product); } public List<Product> findAllProducts() { return productRepository.findAll(); } public List<Product> findProductByName(String name) { return (List<Product>) productRepository.findByName(name); } public void deleteProduct(String id) { productRepository.deleteById(id); } }

コントローラーでサービスを呼び出します。

 @RestController @RequestMapping("/products") public class ProductController { @Autowired private ProductService productService; @PostMapping public Product saveProduct(@RequestBody Product product) { return productService.saveProduct(product); } @GetMapping public List<Product> getAllProducts() { return productService.findAllProducts(); } @GetMapping("/name/{name}") public List<Product> getProductByName(@PathVariable String name) { return productService.findProductByName(name); } @DeleteMapping("/{id}") public void deleteProduct(@PathVariable String id) { productService.deleteProduct(id); } }

実際の使用では、より複雑なクエリや高度な機能については、ページング、ソート、集計などの Elasticsearch のより高度な機能を活用したり、カスタムクエリメソッドを記述したり、Elasticsearch のネイティブクエリ DSL を使用したりする必要があります。

<<: TraefikをベースにしたKubernetes Ingressネットワークシステムについてお話しましょう

>>: Kubernetes での AI と機械学習のワークロードの最適化

Elasticsearch - 分散検索および分析エンジン

Elasticsearch 入門

Elasticsearch の使用

コンテンツマーケティングの実践：コラムの役割を担う

李佳奇とシンバの背後にいるPRの立役者

Kubernetes におけるステートフルとステートレスとは?

テンセントクラウドテクノハブテクノロジーツアー武漢駅を一記事で、クラウドネイティブの世界を深く解釈_クラウドコンピューティング隔月刊第109号

ステーションBの商用ソリューション

SEO担当者として、自信も必要です

化粧品の電子商取引事例: WeChat マーケティングはどのようにして注文の 10% を生み出すのか?

Baidu Green Dream 2.0 のアップデート後、どのような記事が気に入らないのか簡単に分析します。

AWS、パートナーとの業界協力を深める新戦略を発表

仮想化と災害復旧の簡単な紹介

推薦する

民生健康の程宇氏：中央集権的な考え方は分散型ビジネスの実現を妨げる

#乾物おすすめ# BandwagonHost: 11.11の特別プロモーション商品、在庫限り

Baidu入札の実践経験の共有

メタバーストラック: 左にメタ、右にバイト

ライブストリーミングルームに「閉じ込められた」電子商取引企業

コンテンツマーケティングとは何ですか?

extravm: 初月 30% オフ/更新 30% オフ、米国 VPS は月額 1.65 ドルから、AMD Ryzen 高性能 VPS、無制限のトラフィック、100G の高防御保護

desivps: 新しいインドの VPS - 100M 帯域幅、年間 36 ドル - 1G メモリ/1 コア/15g SSD/300g トラフィック

クラウドネイティブ業界の初カンファレンスが開幕、クラウドネイティブの本当のチャンスと実践を紹介

hosteons: 安価な米国 VPS、月額 2 ドル、1G メモリ/1 コア/15g SSD/2T トラフィック/10Gbps 帯域幅、ロサンゼルス/ポートランドを含む 6 つのデータセンター

予算vm-70USD/E3-1230V2/32GB RAM/2TB HDD/30TB Flow/ロサンゼルス

教えるのが下手な教師だけが語る、サスのウェブサイトコンテンツシステム構築

Kubernetesを本番環境で使用した3年間の経験から学んだこと

2021年のプライベートクラウド市場の動向

検索エンジン最適化は高度な思考を伴う技術的かつ物理的な活動である