Elasticsearch : maîtriser le moteur recherche big data
A la fois base de données NoSQL et moteur de recherche orienté documents, Elasticsearch tire sa force de sa capacité d'indexation.
Elasticsearch, c'est quoi ?
Lancé en 2010 par Elastic (anciennement Elasticsearch), Elasticsearch est une base de données NoSQL dont la spécificité est de pouvoir indexer un grand nombre de documents. Conçu à partir de la bibliothèque d’indexation Apache Lucene, il permet d'analyser tout type de données, structurées ou non. Les données sont échangées au format de données textuelles JSON. Elasticsearch est l'un des principaux composants de la Suite ELK (pour Elasticsearch, Logstash et Kibana). Editée par Elastic, cette suite comprend un ensemble d'outils gratuits et ouverts pour l'ingestion, le stockage, l'analyse et la visualisation de données.
Pourquoi utiliser Elasticsearch ?
Par sa nature distribuée et sa scalabilité, Elasticsearch est nativement conçu pour supporter de gros volumes de donnée et gérer les montées en charge. Moteur NoSQL orienté documents, il est aussi réputé pour sa rapidité en matière de recherche full text.
C'est quoi un index Elasticsearch ?
Dans un environnement big data, l'approche la plus efficace pour rechercher de l'information passe par l’indexation de contenus. Cette indexation contexte à utiliser des mots-clés pour répondre le plus rapidement possible aux requêtes de l'utilisateur. Elasticsearch repose sur cette approche. Un index Elasticsearch correspond à un ensemble de documents en lien les uns avec les autres. La structure du format JSON permet au moteur d’indexer le contenu de ces documents en mettant en corrélation des clés avec leurs valeurs correspondantes.
Comment se servir de Elasticsearch ?
Intégrée à Elasticsearch, la bibliothèque Apache Lucene permet d'extraire automatiquement les mots clés dans une collection de documents à des fins d'indexation. ElasticSearch dispose d’une API REST permettant d’utiliser le moteur de recherche avec de simples requêtes HTTP/JSON.
Elasticsearch vs OpenSearch
Présenté en 2021 par Amazon, OpenSearch est un "fork" (projet dérivé) communautaire et open source d'Elasticsearch et de Kibana. Cette suite d'outils comprend un moteur de recherche et un tableau de bord de visualisation de données (OpenSearch Dashboards).