Créez votre Chatbot Q&R personnalisé avec Llama 2.7

Find AI Tools

No difficulty

No complicated process

Find ai tools

Home AI NEW FR Créez votre Chatbot Q&R personnalisé avec Llama 2.7

Créez votre Chatbot Q&R personnalisé avec Llama 2.7

Table des matières:

Introduction
Les outils et modèles open source
Utilisation de la clé API OpenAI
Le modèle Llama 2.7
Défis rencontrés lors de la création
Conversion des fichiers PDF en texte
Transformation du texte en embeddings
Utilisation du modèle Llama CPP
Gestion de l'entrée utilisateur
Intégration des fonctions dans Streamlit
Conclusion

📝 Introduction

Bonjour à tous ! Aujourd'hui, nous allons parler de notre Chatboard personnalisé Q&A (Questions et Réponses), partie 2. Dans cette partie, nous nous concentrons sur les outils et modèles open source. Dans la partie précédente, nous utilisions des clés API OpenAI. Cependant, nous avons rencontré un problème avec cette approche, car nous devions payer en fonction du nombre de tokens utilisés. Notre objectif principal pour cette partie est donc d'utiliser des outils open source.

Les outils et modèles open source

Après avoir exploré différents modèles, nous avons constaté que le modèle Llama 2.7, qui possède 7 milliards de paramètres, était le meilleur choix. Nous avons donc expérimenté avec plusieurs modèles, mais celui-ci nous a donné les meilleurs résultats. Pour vous montrer une démonstration concrète, nous allons exécuter le code en utilisant Streamlit. Ensuite, nous aurons accès à une interface utilisateur similaire à celle de la partie précédente. Nous allons utiliser une version plus courte d'un document PDF, car le traitement de documents plus longs prend beaucoup de temps. Une fois le chargement terminé, nous pourrons commencer à utiliser notre Chatboard Q&A.

Utilisation de la clé API OpenAI

Dans la dernière soumission que nous avons faite, nous avons utilisé le modèle Llama 2.4 pour un document PDF spécifique. Cependant, nous avons réalisé qu'il s'agissait d'un modèle de 4 Go, tandis que le modèle que nous utilisons maintenant, Llama 2.7, est un modèle de 7 Go et est supposé fonctionner mieux. Nous avons eu des solutions satisfaisantes grâce à cette modification.

Le modèle Llama 2.7

Expliquons maintenant comment nous avons chargé le modèle sur notre machine Ubuntu. Comme notre Chatboard traite des fichiers PDF, nous utilisons la bibliothèque python pPDF2 pour manipuler ces fichiers. Nous bouclons ensuite sur chaque fichier PDF, utilisons PDF reader pour extraire le texte de chaque PDF et stockons le texte dans une chaîne de texte. Cette chaîne de texte est ensuite divisée en plusieurs morceaux à l'Aide de character text splitter. Ensuite, nous convertissons ces morceaux en embeddings à l'aide de hugging phas embeddings et les stockons dans une base de données. Les embeddings sont des représentations compactes du texte qui capturent le sens sémantique. Une fois que les embeddings sont stockés dans la base de données, nous utilisons un modèle basé sur le modèle Llama CPP pour répondre aux questions posées par les utilisateurs. La similarité entre les embeddings des questions et des réponses est utilisée pour fournir les réponses appropriées.

Défis rencontrés lors de la création

La création de ce Chatboard n'a pas été aussi facile que lors de l'utilisation de l'API OpenAI. L'un des principaux défis auxquels nous avons été confrontés était le stockage. Nous avons dû créer une nouvelle instance pour cela. De plus, nous avons rencontré des problèmes lors du chargement du modèle Llama CPP sur des architectures Intel, car la bibliothèque Llama CPP a des problèmes de compatibilité avec cette architecture. Nous avons essayé différentes méthodes pour résoudre ce problème, mais cela s'est avéré difficile sur les architectures Intel. Cependant, nous avons obtenu de bons résultats en utilisant des architectures AMD.

Conversion des fichiers PDF en texte

Pour gérer les fichiers PDF, nous utilisons la bibliothèque Python pPDF2. Nous bouclons sur chaque PDF, utilisons PDF reader pour lire le fichier et extraire le texte. Ce texte est ensuite stocké dans une chaîne de caractères.

Transformation du texte en embeddings

Une fois que nous avons extrait le texte des fichiers PDF, nous devons le diviser en petits morceaux et les convertir en embeddings. Nous utilisons la fonction character text splitter pour diviser le texte en morceaux de taille fixe avec un chevauchement. Ensuite, nous utilisons les embeddings de la bibliothèque hugging phas pour convertir ces morceaux de texte en embeddings. Les embeddings sont des représentations numériques du texte qui capturent son sens sémantique.

Utilisation du modèle Llama CPP

Une fois les embeddings créés, nous chargeons le modèle Llama CPP, qui est un modèle open source avec 7 milliards de paramètres. Ce modèle nous permet d'obtenir des réponses pertinentes aux questions posées par les utilisateurs. Le modèle utilise la similarité entre les embeddings des questions et les embeddings des réponses pour fournir des réponses appropriées.

Gestion de l'entrée utilisateur

Pour gérer l'entrée utilisateur, nous utilisons une interface utilisateur conviviale créée avec Streamlit, un outil open source. L'interface utilisateur comprend une zone de saisie des questions et un bouton de traitement pour charger les fichiers PDF.

Intégration des fonctions dans Streamlit

Pour regrouper toutes les fonctions, nous utilisons Streamlit, qui est un framework open source permettant de créer des interfaces utilisateur en utilisant le langage de programmation Python. Streamlit nous permet de créer une interface utilisateur similaire à celle du Chatboard Q&A, où nous pouvons charger des fichiers PDF, poser des questions et obtenir des réponses.

Conclusion

Dans cet article, nous avons exploré la création de notre Chatboard Q&A en utilisant des outils et modèles open source. Nous avons expliqué comment nous avons utilisé le modèle Llama 2.7 pour obtenir de meilleures performances par rapport à notre soumission précédente. Nous avons également abordé les défis auxquels nous avons été confrontés lors de la mise en place de cette solution. En utilisant des outils tels que pPDF2, hugging phas et Streamlit, nous avons réussi à créer une interface utilisateur conviviale qui permet aux utilisateurs de poser des questions et d'obtenir des réponses pertinentes. Grâce à cette approche, nous avons pu créer notre Chatboard Q&A sans avoir à utiliser les clés API OpenAI.

Maintenant que vous avez une meilleure compréhension de notre processus de création, n'hésitez pas à l'essayer vous-même et à poser vos questions à notre Chatboard Q&A personnalisé. Profitez-en et amusez-vous bien !

FAQ

Q: Quelles sont les différences entre les clés API OpenAI et les outils open source ? R: La principale différence est que l'utilisation des clés API OpenAI nécessite le paiement en fonction du nombre de tokens utilisés, tandis que les outils open source offrent une alternative gratuite.

Q: Quel modèle avons-nous utilisé pour notre Chatboard Q&A ? R: Nous avons utilisé le modèle Llama 2.7, qui possède 7 milliards de paramètres.

Q: Quels sont les avantages d'utiliser des outils open source ? R: Les outils open source offrent une flexibilité et une personnalisation plus grandes, ainsi qu'une possibilité de contribution et d'amélioration continue.

Q: Comment fonctionne la conversion des fichiers PDF en texte ? R: Nous utilisons la bibliothèque Python pPDF2 pour lire les fichiers PDF et extraire le texte. Ce texte est ensuite stocké dans une chaîne de caractères.

Q: Comment le modèle Llama CPP fournit-il les réponses appropriées ? R: Le modèle Llama CPP utilise la similarité entre les embeddings des questions et des réponses pour fournir les réponses appropriées.

Q: Comment pouvons-nous poser des questions à notre Chatboard Q&A ? R: Nous utilisons une interface utilisateur conviviale créée avec Streamlit. Il suffit de saisir la question dans la zone de saisie et de cliquer sur le bouton de traitement.

Q: Quels sont les avantages de Streamlit pour notre Chatboard Q&A ? R: Streamlit est un framework open source qui permet de créer facilement une interface utilisateur conviviale. Il facilite l'intégration des différentes fonctionnalités de notre Chatboard Q&A.

Q: Comment avons-nous géré les défis liés au stockage et à l'architecture Intel ? R: Nous avons créé une nouvelle instance pour résoudre le problème de stockage. En ce qui concerne l'architecture Intel, nous avons rencontré des problèmes de compatibilité avec la bibliothèque Llama CPP. Après des recherches supplémentaires, nous avons constaté que le modèle fonctionnait mieux sur des architectures AMD.

Q: Comment les embeddings capturent-ils le sens sémantique du texte ? R: Les embeddings sont des représentations numériques du texte qui capturent le sens sémantique en utilisant des techniques d'apprentissage automatique avancées.

Q: Comment pouvons-nous obtenir les meilleures performances avec notre Chatboard Q&A ? R: Pour obtenir les meilleures performances, nous vous recommandons d'utiliser le modèle Llama 2.7 et de vous assurer d'avoir un environnement d'exécution compatible, de préférence avec une architecture AMD.

Découvrez une NOUVELLE entreprise IA que PERSONNE ne connaît! (Dépêchez-vous!)

L'IA révolutionne l'enseignement supérieur : Webinaire sur le service client