IA organisation de données

Mon projet est de créer un moteur de recherche avancé en homéopathie, nommé RefernceHomeo. Il doit permettre d’associer les remèdes homéopathiques aux symptômes des patients en s’appuyant sur un fichier de texte brut (data.txt) qui contient des informations issues de plusieurs ouvrages. Ce fichier est très désorganisé, et l’objectif est d’extraire de manière fiable les remèdes et leurs symptômes pour les structurer dans une base de données.

:pushpin: Fonctionnalités attendues :

:one: Indexation intelligente (indexer.py)

• Lire et analyser data.txt, qui est un fichier très désorganisé.

• Identifier correctement les remèdes et leurs symptômes associés, malgré le manque de structure.

• Stocker ces informations dans une base de données SQLite (homeo.db) avec :

:white_check_mark: Une table remedies pour les remèdes

:white_check_mark: Une table symptoms pour les symptômes

:white_check_mark: Une table remedy_symptom pour les liens entre eux

:two: Recherche avancée (search.py)

• Permettre de saisir plusieurs symptômes d’un patient.

• Trouver et classer les remèdes les plus pertinents en fonction du nombre de symptômes correspondants.

• Gérer les fautes d’orthographe et les synonymes grâce à un dictionnaire (synonyms_homeo.json).

• Fournir un résumé intelligent (~200 mots) mettant en évidence les remèdes les plus adaptés.

• Enregistrer les recherches dans un historique (search_history.json) pour accélérer les futures analyses.

:three: Gestion des synonymes (synonyms.py)

• Générer un dictionnaire de synonymes spécifique à l’homéopathie.

• Permettre d’enrichir automatiquement la base de synonymes en analysant data.txt.

Le projet doit fonctionner en local, en ligne de commande, sans dépendances lourdes. Il doit être optimisé pour un fichier volumineux (~40 Mo) et être capable de gérer les incohérences du texte source.

:pushpin: Exemple d’utilisation :

L’utilisateur entre plusieurs symptômes, et le programme lui suggère les remèdes les plus adaptés, avec un résumé intelligent des résultats.

Pourriez-vous m’aider ?