Forums Développement Multimédia

Les formations Mediabox
Les formations Mediabox



Conception de moteur de recherche

Compatible Director MX2004. Cliquer pour en savoir plus sur les compatibilités.Par sebastien.portebois (Sébastien Portebois), le 12 septembre 2007

Cet article - resté à l'état de brouillon depuis 2005 - date un peu, mais les principes de conception (design pattern utilisé, création et utilisation d'une base de données couplée à un corpus de données, en l'occurence une floppée de PDF, …) restent finalement très actuels si bien que je le sors ici pour un petit dépoussièrage.

Objectif

Nous allons construire un moteur de recherche qui cherchera rapidement une chaîne dans une base de PDFs qui auront été indexés, pour afficher une liste de résultat, et permettre d’afficher le résultat sélectionné en chargeant le pdf et en affichant la page pertinente.

Permettre à l’utilisateur ces recherches nécessite plusieurs étapes :

  • créer une base de données,
  • la remplir en analysant les PDFs pour y stocker le contenu (titres, auteurs, mots clé, contenus) qui servira a effectuer les recherches,
  • avoir une interface de recherche, contenant au minimum un champs de saisie du contenu recherché et une liste des résultats trouvés.
  • Afficher le résultat sélectionné, c’est à dire charger dynamiquement un pdf et pouvoir le manipuler

Sans chercher à les respecter scrupuleusement, nous regarderons comment un design pattern nous permettra de créer un code générique pour gérer la base de données, et comme le code spécifique à ce projet sera séparé de ce code générique, facilitant le déboguage et la réutilisation.

Hilights

Tout ceci reste valide pour un moteur de recherche qui utiliserait d'autre données, ainsi que pour concevoir et organiser des scripts avec un manager, meme si on n'utilise pas de base de données… Beaucoup de concepts illustrés dans cet exemple complet.

Aperçu

Voici une idée du résultat obtenu (le plus intéressant étant le code, mais sans image personne ne lira :D

Merci de participer sur le forum si vous avez des questions, commmentaires, …

L'article

L'article ayant été préparé sous Word à l'origine, et faisant 26 pages, il faudra pour l'instant le consulter sous ce format. Si une âme courageuse veut le saisir ici, merci à lui ;)

Pour réagir, vous pouvez utiliser le post dédié sur le forum! Merci de votre feedback!

Bonne lecture !