Microsoft met à disposition du public une nouvelle technologie appelée GraphRAG, qui permet aux chatbots et aux moteurs de réponse de relier les points sur l’ensemble d’un ensemble de données, surpassant largement la génération augmentée de récupération (RAG) standard.
- GraphRAG est un meilleur RAG et désormais gratuit.
- Microsoft propose GraphRAG, une technologie surpassant le RAG standard.
- GraphRAG crée un graphe de connaissances pour répondre aux questions.
- GraphRAG est disponible publiquement sur GitHub.
Quelle est la différence entre RAG et GraphRAG ?
RAG (Retrieval-Augmented Generation) est une technologie qui permet à un LLM d’accéder à une base de données comme un index de recherche et de l’utiliser comme base pour répondre à une question. Elle peut être utilisée pour relier un modèle linguistique de grande taille et un index de moteur de recherche conventionnel. L’avantage de RAG est qu’il peut utiliser des données fiables et faisant autorité pour répondre aux questions. RAG permet également aux chatbots génératifs d’IA d’utiliser des informations à jour pour répondre aux questions sur des sujets sur lesquels le LLM n’a pas été formé. Il s’agit d’une approche utilisée par les moteurs de recherche IA comme Perplexity. L’avantage de RAG est lié à son utilisation d’intégrations. Les intégrations sont une façon de représenter les relations sémantiques entre les mots, les phrases et les documents. Cette représentation permet à la partie de récupération de RAG de faire correspondre une requête de recherche à du texte dans une base de données (comme un index de recherche). Mais l’inconvénient de l’utilisation des intégrations est qu’elle limite le RAG à la correspondance de texte à un niveau granulaire (par opposition à une portée globale sur les données). Microsoft explique : « Étant donné que le RAG naïf ne prend en compte que les k fragments de texte les plus similaires, il échoue. Pire encore, il comparera la question à des fragments de texte superficiellement similaires à cette question, ce qui entraînera des réponses trompeuses. » L’innovation de GraphRAG est qu’il permet à un LLM de répondre à des questions basées sur l’ensemble des données. GraphRAG crée un graphe de connaissances à partir des documents indexés, également appelés données non structurées. Les pages Web sont un exemple évident de données non structurées. Ainsi, lorsque GraphRAG crée un graphe de connaissances, il crée une représentation « structurée » des relations entre diverses « entités » (comme des personnes, des lieux, des concepts et des objets) qui est ensuite plus facilement comprise par les machines. GraphRAG crée ce que Microsoft appelle des « communautés » de thèmes généraux (de haut niveau) et de sujets plus granulaires (de bas niveau). Un LLM crée ensuite un résumé de chacune de ces communautés, un « résumé hiérarchique des données » qui est ensuite utilisé pour répondre aux questions. C’est une avancée majeure car elle permet à un chatbot de répondre à des questions en se basant davantage sur les connaissances (les résumés) que sur des intégrations. Voici comment Microsoft l’explique : « L’utilisation d’un LLM pour résumer chacune de ces communautés crée un résumé hiérarchique des données, offrant une vue d’ensemble d’un ensemble de données sans avoir besoin de savoir quelles questions poser à l’avance. Chaque communauté sert de base à un résumé communautaire qui décrit ses entités et leurs relations. …Les résumés de communauté aident à répondre à ces questions globales car l’index graphique des descriptions d’entités et de relations a déjà pris en compte tous les textes d’entrée dans sa construction. Par conséquent, nous pouvons utiliser une approche de réduction de carte pour répondre aux questions qui conserve tout le contenu pertinent du contexte de données global…”
Exemples de comparaison entre RAG et GraphRAG
L’article de recherche original de GraphRAG a illustré la supériorité de l’approche GraphRAG dans sa capacité à répondre à des questions pour lesquelles il n’existe pas de données de correspondance exacte dans les documents indexés. L’exemple utilise un ensemble de données limité d’actualités russes et ukrainiennes du mois de juin 2023 (traduites en anglais).
Question de correspondance de texte simple
La première question utilisée comme exemple était « Qu’est-ce que Novorossiya ? » et RAG et GraphRAG ont tous deux répondu à la question, GraphRAG offrant une réponse plus détaillée. En bref, la réponse est que « Novorossiya » se traduit par Nouvelle Russie et fait référence aux terres ukrainiennes qui ont été conquises par la Russie au XVIIIe siècle. Le deuxième exemple de question exigeait que la machine établisse des liens entre les concepts contenus dans les documents indexés, ce que Microsoft appelle une « tâche de résumé axé sur les requêtes (QFS) », différente d’une simple tâche de récupération basée sur du texte. Elle nécessite ce que Microsoft appelle « relier les points ».
La question posée sur les systèmes RAG et GraphRAG
« Qu’a fait Novorossiya ? »
Voici la réponse du RAG
« Le texte ne donne pas d’informations précises sur ce qu’a fait Novorossiya. » GraphRAG a répondu à la question « Qu’a fait Novorossiya ? » avec une réponse de deux paragraphes détaillant les résultats du mouvement politique Novorossiya. Voici un court extrait de la réponse en deux paragraphes : « Novorossiya, un mouvement politique en Ukraine, a été impliqué dans une série d’activités destructrices, ciblant particulièrement diverses entités en Ukraine [Entities (6494, 912)]Le mouvement a été lié à des projets de destruction de propriétés de plusieurs entités ukrainiennes, dont Rosen, l’usine de conserves d’Odessa, le centre de transmission de la radiotélévision régionale d’Odessa et la société de télévision nationale d’Ukraine. [Relationships (15207, 15208, 15209, 15210)]… …Le Bureau du Procureur général d’Ukraine a fait état de la création de Novorossiya, indiquant la connaissance et l’inquiétude potentielle du gouvernement face aux activités de ce mouvement…” Ce qui précède n’est qu’une partie des réponses extraites de l’ensemble de données limité d’un mois, qui illustre comment GraphRAG est capable de relier les points à travers tous les documents.
GraphRAG est désormais disponible au public
Microsoft a annoncé que GraphRAG est disponible publiquement pour être utilisé par tout le monde. « Aujourd’hui, nous sommes heureux d’annoncer que GraphRAG est désormais disponible sur GitHub, offrant une récupération d’informations plus structurée et une génération de réponses plus complète que les approches RAG naïves. Le référentiel de code GraphRAG est complété par un accélérateur de solutions, offrant une expérience API facile à utiliser hébergée sur Azure qui peut être déployée sans code en quelques clics. » Microsoft a publié GraphRAG afin de rendre les solutions basées sur celui-ci plus accessibles au public et d’encourager les commentaires pour des améliorations.
Lire l’annonce
GraphRAG : un nouvel outil pour la découverte de données complexes désormais disponible sur GitHub Image en vedette par Shutterstock/Deemerwha studio
FAQ
Quel est le meilleur logiciel gratuit pour créer des graphiques ?
Le meilleur logiciel gratuit pour créer des graphiques est sans aucun doute le logiciel open-source GIMP. Il offre une large gamme de fonctions graphiques, de nombreux outils de retouche ainsi que des fonctionnalités avancées telles que la manipulation d'images en couches. Ensuite, Inkscape peut également être un bon choix car il permet de créer des images vectorielles et offre une grande précision pour les graphiques.
Pour ceux qui recherchent une solution plus simple et facile à utiliser, Piktochart est un excellent choix avec ses modèles prédéfinis pour créer rapidement des infographies professionnelles.
Existe-t-il des logiciels gratuits pour réaliser des graphiques ?
Oui, il existe plusieurs logiciels gratuits pour réaliser des graphiques tels que Canva, Google Sheets ou encore Infogram. Ces outils sont faciles à utiliser et permettent de créer différents types de graphiques selon les besoins. Il est également possible de trouver des tutoriels en ligne pour apprendre à les utiliser efficacement.
Certains navigateurs web proposent également des extensions gratuites pour créer rapidement des graphiques directement depuis leur interface.
Comment puis-je faire des graphiques gratuitement avec un logiciel ?
Pour créer des graphiques gratuitement avec un logiciel, tu peux utiliser des logiciels en ligne tels que Canva, Visme ou Venngage. Ils te permettent de créer facilement et rapidement des graphiques personnalisés en utilisant des modèles prédéfinis. Tu peux également utiliser un outil tel que Microsoft Excel pour créer et personnaliser tes propres graphiques à partir de données saisies.
N'hésite pas non plus à rechercher des tutoriels en ligne pour apprendre à utiliser ces différents logiciels afin de créer des graphiques professionnels.
Y a-t-il une application en ligne gratuite pour créer des graphiques ?
Oui, il existe plusieurs applications en ligne gratuites pour créer des graphiques tels que Canva, Infogram ou encore Visme. Elles offrent une grande variété de modèles et d'outils pour créer des graphiques professionnels facilement. Ces applications sont souvent intuitives et faciles à utiliser, même pour ceux qui n'ont pas de compétences en conception graphique.
Il suffit de se connecter sur leur site internet et de suivre les instructions pour réaliser un graphique personnalisé.
Quelles sont les meilleures applications gratuites de graphisme ?
Il existe plusieurs applications gratuites de graphisme sur le marché, mais certaines sont plus recommandées que d'autres. Parmi les meilleures, on peut citer Canva qui permet de créer des designs professionnels facilement et rapidement.
Adobe Spark est également très apprécié pour sa simplicité d'utilisation et ses fonctionnalités variées. Pixlr propose un large choix d'outils pour éditer des photos ou créer des montages originaux. Enfin, Inkscape fait partie des logiciels libres les plus complets pour réaliser toutes sortes de projets graphiques.