Introduction à Solr – Installation et configuration (1)

Lundi 8 décembre 2008 par dominique
Posté dans Lucene / Solr, Moteur de recherche

logo_home_solrSuite au premier article Présentation de Lucene Solr, je commence aujourd’hui une série d’articles sur la mise en oeuvre de ce moteur de recherche. Les différents sujets abordés seront :

  • L’installation
  • La configuration
  • L’indexation
  • La recherche

Cette première partie a pour but l’installation et la configuration minimum afin de pouvoir rechercher dans les documents d’exemple fournis dans la distribution de Solr.

Pré-requis

Installation

Décompresser l’archive dans un répertoire de travail. Pour cet article, il s’agit de « d:\solr ». Un sous-répertoire est créé. Selon la version de Solr que vous aurez récupéré, ce répertoire peut s’appeller « apache-solr-nightly » ou « apache-solr-1.3.0″. Je suggère donc pour simplifier de renommer ce répertoire en « apache-solr ».

Configurer Solr pour un fonctionnement avec Jetty

Pour faire fonctionner avec la version de Jetty fournie avec Solr, il n’y a pas vraiment de configuration. Pour démarrer Jetty, il faut ouvrir une console et se placer dans le répertoire « d:\solr\apache-solr\example » et exécuter la commande suivante :

java -jar start.jar

Une fois que vous voyer apparaître la ligne suivante, le serveur est démarré :

INFO: [] Registered new searcher Searcher@d642fd main

On accède alors à l’administration de Solr avec l’url suivante :

http://localhost:8983/solr/admin

Pour une utilisation avec une instance existante de Jetty, la page du wiki qui explique la configuration est ici.

Configurer Solr pour un fonctionnement sous Tomcat 5.5

1. Afin de pouvoir passer en mode HTTP-GET des critères de recherche utilisant des caractères internationaux (code supérieur à 127) il est nécessaire d’éditer le fichier conf/server.xml de Tomcat et d’ajouter l’attribut suivant à l’élément Connector approprié : URIEncoding= »UTF-8″.

Il s’agit à priori du connecteur correspondant au port 8080, ce qui donne quelque chose comme ceci :

<Connector port="8080" maxHttpHeaderSize="8192" maxThreads="150"
    minSpareThreads="25" maxSpareThreads="75" enableLookups="false"
    redirectPort="8443" acceptCount="100" connectionTimeout="20000"
    disableUploadTimeout="true" URIEncoding="UTF-8" />

2. Copier le fichier « d:\solr\apache-solr\example\webapps\solr.war » dans le répertoire webapps de Tomcat.

3. Au moyen de la console Tomcat (dans le system tray), ajouter le paramètre

-Dsolr.solr.home=d:\solr\apache-solr\example\solr

4. Redémarrer Tomcat.

On accède alors à l’administration de Solr avec l’url suivante :

http://localhost:8080/solr/admin

Indexer un jeu de données en exemple

La distribution de Solr inclue un jeu de documents de test pour l’indexation. Il est possible de les indexer au moyen du package java post.jar.

Ouvrir une console et se placer dans le répertoire « d:\solr\apache-solr\example\exampledocs »

Avec Jetty, lancer la commande :

java -jar post.jar *.xml

Avec Tomcat, lancer la commande :

java -Durl=http://localhost:8080/solr/update -jar post.jar *.xml

Pour obtenir la liste de toutes les options de cet utilitaire, la commande est :

java -jar post.jar -help 

Exécuter des recherches

Solr est maintenant fonctionnel et des données sont indexées. Il est donc possible d’exécuter les premières recherches avec le formulaire suivant :

http://localhost:8080/solr/admin/form.jsp

Vous pouvez constater que les résultats sont fournis au format XML. C’est effectivement à l’application appelant Solr de mettre en forme ces résultats.

Conclusion

Dans cet article, nous avons installé et fait fonctionné Solr dans un environnement Tomcat sous Windows. Par la suite j’aborderai plus en détail la configuration, les options de recherche et l’exploitation des résultats.

Partager ...
  • Print
  • Digg
  • Sphinn
  • del.icio.us
  • Facebook
  • Mixx
  • Google Bookmarks
  • Add to favorites
  • email
  • LinkedIn
  • Scoopeo
  • Twitter
  • viadeo FR
  • Wikio FR

Vous pouvez suivre les commentaires à ce message au travers du flux RSS 2.0 . Vous pouvez laisser un commentaire, ou placer un trackback depuis votre propre site.

Une résponse à “Introduction à Solr – Installation et configuration (1)”

  1. Add to that the question of whether or not these free chips are being offered by honest online casinos, and we enter an area worth some study or serious research.

    1. He fully read the casino bonuses and promotions page. This sounds like common sense, but it’s important to read the fine print. Many casinos offer a special terms of Service page for each individual casino bouns. Casinos make their money by « giving » you a promotional bonus and requiring you to gamble for just long enough so that in theory you lose your initial deposit and the bonus amount. This requirement is called the « play through requirement ». Knowing the play through requirement and the odds of the game you are going to play are important. Because if you can find a casino that offers a low play through requirement and high enough bonus you could (in theory) make money for as long as your eligible for the bonus.
    online casino bonuses
    http://www.bodog.com/publish/etc/medialib/bodogcom_media_lib/home-page-logo.Par.68918.Image.gif
    - Knowledge is power: Know the rules and intricacies of the game you preferably choose to play. Watch some games before you lay down any money in an actual game.

    Beginner’s Route to Online Casinos
    The online casinos are a great source of entertainment and fun. That said, there are a number of things you should take into consideration before playing. Choosing the right casino should be your first step in your quest for a great gaming experience online. As such, choosing the right casino will lead you to have a lot of fun and also win at the same time. If you find yourself with a pathetic online casino, you are bound to run into a lot of problems with poor graphics low-wage outs.

    One method to check the reliability of online casinos is to check the software vendor from whom they have leased their games. Currently, the casino software developers in the market who are reputed to produce ethical and quality casino software are Microgaming, Realtime Gaming, Playtech and CryptoLogic Inc.

Ajouter un commentaire

A propos

Je suis informaticien indépendant. J'interviens principalement dans les domaines de la gestion documentaire et des moteurs de recherches. Ce blog me permet de partager des informations techniques découvertes au cours de mes différents projets ou lors de mes lectures sur le Web.

Dominique - www.eolya.fr

Optimisez la lecture de vos blogs et sites d'information préférés

Crossfeeds est un service Web de mixage et de filtrage de flux RSS. Crossfeeds dispose d'une base de 600.000 flux et offre des fonctionnalités de recherche dans les flux et d'alertes par emails.

http://www.crossfeeds.fr/