Vendredi 28 janvier 2011 par dominique
Posté dans Lucene / Solr
Voici quelques commandes simples et bien utiles utilisant curl afin de manipuler un index Solr.
Lire la suite »
Lundi 24 janvier 2011 par dominique
Posté dans Lucene / Solr
Le temps qui s'écoule entre 2 versions de Solr est plutôt long. Dans l'interval, de nombreux correctifs sont réalisés voir même de nouvelles fonctionnalités implémentées. Il est donc parfois nécessaire d'appliquer un patch à Solr (par exemple avec la version 1.4.1, si on veux que le composant spellchecker fonctionne en recherche distribuée, il faut appliquer le patch SOLR-785).
Voici la méthode pour intégrer le patch suivant : https://issues.apache.org/jira/browse/SOLR-785
cd /tmp/apache-solr-1.4.1
patch -p0 -i SOLR-785.patchant clean
ant distLe war compilé est dans le répertoire dist
Dimanche 23 janvier 2011 par dominique
Posté dans Productivité
Cela fait un certain temps que je veux utiliser une solution de gestion de sources pour mes développements. J'ai longtemps tourné en rond autour d'une solution Subversion intégrée dans Eclipse avec les plugins Subversive ou Subclipse. Après plusieurs tentatives au fils des mois, je ne suis jamais parvenu à utiliser Subversion au quotidien et j'ai abandonné à chaque fois. En fait, j'ai trouvé cette solution trop contraignante pour 4 raisons : ma volonté de l'utiliser depuis Eclipse, l'obligation d'installer un serveur subversion, ne pas travailler en équipe sur des sources communs et le fait de faire un apprentissage de l'outil seul.
Depuis quelques semaines je collabore à un projet qui nécessite un travail en équipe et qui impose donc un outil de gestion de sources. N'ayant pas le choix, j'ai bien du m'y mettre et avec l'assistance de mes partenaires de travail, ça c'est finalement passé vite et plutôt facilement. Cet outil, c'est Mercurial (également appelé Hg).
Lire la suite »
Lundi 3 janvier 2011 par dominique
Posté dans Lucene / Solr, Moteur de recherche
Crawl Anywhere est un crawler web, un pipeline de traitement des documents et un indexer Solr. Il offre une interface Web d'administration qui permet de facilement gérer les différentes sources (sites web) à crawler et indexer.
Après plusieurs mises en production chez des clients et les différents retours d'expériences, un certain nombre de nouvelles fonctionnalités ont été ajoutées à Crawl Anywhere. Une liste des principales nouvelles fonctionnalités est disponible sur le wiki dans la release note.