Mardi 26 août 2008 par dominique
Posté dans Lucene / Solr, Moteur de recherche, Technique
5,707 lecture(s) | 0 commentaire
J’ai lu cette semaine sur le blog de Cédric Champeau un article très intéressant (en anglais) sur Lucene.
Cédric explique tout d’abord comment Lucene est utilisé chez Lingway comme brique de base de leur solution de recherche sémantique. Cédric confirme que Lucene est une bonne librairie Java permettant de mettre en place des outils de recherche puissants, mais il en vient très rapidement à remettre en cause certains aspects de Lucene et se pose la question suivante : Lucene est-il le meilleur choix (open source) pour de futurs développements d’outils de recherche ?
Lire la suite »
Lundi 25 août 2008 par dominique
Posté dans Moteur de recherche, Sites à découvrir, Web
834 lecture(s) | 0 commentaire
Hurisearch est un moteur de recherche multilingue spécialisé sur la thématique des Droits de l’Homme. Il a été mis en place par Huridocs (Human Rigths Information and Documentation System), une association internationale qui cherche à renforcer les capacités des organisations qui utilisent des techniques de documentation, des méthodes de surveillance, des systèmes de gestion de l’information et des technologies dans la défense des droits de l’homme et dans la prévention de leurs violations.
Hurisearch scrute et indexe au quotidien 4500 sites web dédiés aux droits de l’Homme et permet donc à des petites organisations de voir leur site visible dans les résultats de recherche alors qu’ils le sont très difficilement avec un moteur généraliste comme Google.
Lire la suite »
Lundi 11 août 2008 par dominique
Posté dans Moteur de recherche, Technique
2,032 lecture(s) | 1 commentaire
Pour la plupart des internautes, « moteur de recherche » est synonyme de Google ou Yahoo. En fait, je les appellerais plutôt « sites de recherche ». Un moteur de recherche est en fait un outil ou ensemble d’outils permettant de construire par exemple ces « sites de recherche », mais également d’ajouter des fonctionnalités de recherche à divers types d’applications (CRM, messagerie, …).
Avant de pouvoir offrir une page de recherche et des résultats, il est nécessaire de réaliser certaines tâches comme par exemple la création d’un index des données.
Lire la suite »
Mercredi 6 août 2008 par dominique
Posté dans Lucene / Solr, Moteur de recherche, Technique
4,264 lecture(s) | 18 commentaires
Lucene est une librairie open source en Java (mais il existe de nombreux portages) permettant d’ajouter des fonctionnalités de recherche plein-texte à vos applications. Le projet Lucene est chapeauté par « The Apache Software Foundation ». D’autres projets très connus et de grande qualité de la fondation sont : Apache HTTP server, Tomcat, Cocoon, Ant, …
Il s’agit bien d’une librairie avec laquelle il n’est pas fourni d’outils permettant l’indexation de données en quelques clics de souris et quelques paramétrages. Il faut donc en passer par du code Java afin de mettre en place une solution sur mesure de recherche plein-texte.
Lire la suite »
Je suis informaticien indépendant. J'interviens principalement dans les domaines de la gestion documentaire et des moteurs de recherches. Ce blog me permet de partager des informations techniques découvertes au cours de mes différents projets ou lors de mes lectures sur le Web.
Dominique - www.eolya.fr
Crossfeeds est un service Web de mixage et de filtrage de flux RSS. Crossfeeds dispose d'une base de 600.000 flux et offre des fonctionnalités de recherche dans les flux et d'alertes par emails.