Natural language understanding (NLU) : définition, process et modèles
Le natural language understanding (NLU) est un programme qui s'attache approfondir la compréhension des mots et du langage naturel humain. Cette technologie s'adosse de plus en plus au machine learning.
Le NLU, c'est quoi ?
Le natural language understanding (NLU), ou la compréhension du langage naturel, est un sous-domaine du traitement automatique du langage naturel (ou natural language processing ou NLP) et de l’intelligence artificielle faisant l’objet de recherches depuis les années 60.
Dans ses dernières itérations, le NLP s'adosse à des modèles de machine learning visant à développer des solutions capables de saisir le sens d’un texte écrit ou d'un discours oral. Aujourd'hui, elles sont notamment utilisées par les différents types de bot : chatbot, voicebot et callbot. Mais aussi par les assistants intelligents comme Alexa, Google Assistant ou Siri.
Comment fonctionne le NLU ?
Les algorithmes de natural language understanding (NLU) sont historiquement conçus dans chaque langage cible à partir de lexique et parser de règles grammaticales. Le tout révélant les corrélations entre les mots ou groupes de mots. A cela venant s'ajouter une théorie sémantique. Le NLU intervient en amont de la chaîne du traitement du langage naturel.
Ces techniques tendent de plus en plus à être remplacées par des réseaux de neurones artificiels qui apprennent à saisir le sens d'un discours dans son contexte en ingérant de gros volumes d'exemples de texte. Des données d'apprentissage qui leur permettent ensuite de prendre en compte un texte original dans toute sa complexité.
NLU vs NLP : quelle différence ?
Le traitement du langage naturel (NLP) vise à traiter des données linguistiques non structurées et ainsi maitriser la gestion du langage naturel écrit ou vocal. A l'instar du NLG (natural language generation) qui a pour but la génération de discours vocaux ou écrits, le natural language understanding (NLU) est également un sous-domaine du NLP. Comme on l'a vu plus haut, il se concentre sur la compréhension du langage naturel dans son contexte.