Botanic Mining

Objectifs

L'objectif est de fouiller des données hétérogènes (photo, texte, formule chimique, chromatrogramme…) afin de récupérer des caractéristiques de plantes aromatiques.

Les chimistes de l’Institut de Chimie de Nice (ICN, UMR 7272) valorisent la biodiversité végétale des plantes de la région PACA, en étroite collaboration avec les industriels régionaux, la Communauté d’Agglomération Pôle Azur Provence et le Parc Naturel Régional (PNR) Préalpes d’Azur. Afin d’assurer une pérennité des connaissances et une capitalisation des données sur la biodiversité locale, il est nécessaire de trouver un moyen efficace de conservation de ces données et de recherche de l’information dans ces données. Les résultats des analyses chimiques sont actuellement stockées, sous forme de fiches Excel, avec peu de structuration. En effet, les informations sont majoritairement stockées sous forme textuelle rendant la recherche d’informations possible quasiment uniquement par « mots-clés ». De plus, des informations de natures différentes (photos de la plante, analyses chromatographiques, formules chimiques…) doivent être prises en compte pour fournir aux chercheurs des résultats pertinents lors de l’interrogation de leur base de connaissance botanique.

Ce projet a pour but de développer une plateforme logicielle qui comprendra deux parties distinctes et complémentaires :

  • la conception d’un système de gestion d’une base de données adaptée aux données très hétérogènes et fortement reliées entre elles, associé à un moteur OLAP pour l’interrogation de la base, et
  • un moteur de recherche de plantes à partir du contenu des photos, des formules chimiques, des chromatographes …

Ce projet a été validé par l’université par un financement CSI.

Mots-clés

Plantes aromatiques, base de données, fouille de données, produits naturels, données hétérogènes.

Collaborateurs

Xavier Fernandez, ICN; Gabriel Bouillon, Communauté d'Agglomération.

Contacts

Denis Pallez, Frédéric Precioso