Archive pour janvier 2011


 

Solr et curl

Vendredi 28 janvier 2011 par dominique
Posté dans Lucene / Solr

solr

 

 

 

 

Voici quelques commandes simples et bien utiles utilisant curl afin de manipuler un index Solr.

  • Supprimer un document à partir de sa valeur de clé unique
  • Supprimer un document à partir d'une requête
  • Vider totalement un index
  • Forcer un commit d'un index
  • Forcer un optimize d'un index

Lire la suite »


Appliquer un patch à Solr

Lundi 24 janvier 2011 par dominique
Posté dans Lucene / Solr

solrLe temps qui s'écoule entre 2 versions de Solr est plutôt long. Dans l'interval, de nombreux correctifs sont réalisés voir même de nouvelles fonctionnalités implémentées. Il est donc parfois nécessaire d'appliquer un patch à Solr (par exemple avec la version 1.4.1, si on veux que le composant spellchecker fonctionne en recherche distribuée, il faut appliquer le patch SOLR-785).

Voici la méthode pour intégrer le patch suivant : https://issues.apache.org/jira/browse/SOLR-785

  • Commencer par récupérer une distribution des sources de Solr (http://www.apache.org/dyn/closer.cgi/lucene/solr/).
  • Décompresser l'archive dans un répertoire. Pour l'exemple on utilise /tmp, ce qui donne un répertoire /tmp/apache-solr-1.4.1
  • Dans /tmp/apache-solr-1.4.1, placer le fichier correspondant au patch (pour le patch SOLR-785, c'est SOLR-785.patch)
  • Patcher
    cd /tmp/apache-solr-1.4.1
    patch -p0 -i SOLR-785.patch
  • Recompiler
    ant clean
    ant dist

Le war compilé est dans le répertoire dist


Mercurial : la gestion de source qui me convient

Dimanche 23 janvier 2011 par dominique
Posté dans Productivité

Cela fait un certain temps que je veux utiliser une solution de gestion de sources pour mes développements. J'ai longtemps tourné en rond autour d'une solution Subversion intégrée dans Eclipse avec les plugins Subversive ou Subclipse. Après plusieurs tentatives au fils des mois, je ne suis jamais parvenu à utiliser Subversion au quotidien et j'ai abandonné à chaque fois. En fait, j'ai trouvé cette solution trop contraignante pour 4 raisons : ma volonté de l'utiliser depuis Eclipse, l'obligation d'installer un serveur subversion, ne pas travailler en équipe sur des sources communs et le fait de faire un apprentissage de l'outil seul.

Depuis quelques semaines je collabore à un projet qui nécessite un travail en équipe et qui impose donc un outil de gestion de sources. N'ayant pas le choix, j'ai bien du m'y mettre et avec l'assistance de mes partenaires de travail, ça c'est finalement passé vite et plutôt facilement. Cet outil, c'est Mercurial (également appelé Hg).

Lire la suite »


Crawl Anywhere version 1.1.0 est disponible

Lundi 3 janvier 2011 par dominique
Posté dans Lucene / Solr, Moteur de recherche

Crawl Anywhere est un crawler web, un pipeline de traitement des documents et un indexer Solr. Il offre une interface Web d'administration qui permet de facilement gérer les différentes sources (sites web) à crawler et indexer.

Après plusieurs mises en production chez des clients et les différents retours d'expériences, un certain nombre de nouvelles fonctionnalités ont été ajoutées à Crawl Anywhere. Une liste des principales nouvelles fonctionnalités est disponible sur le wiki dans la release note.