Obtenir une compilation nocturne de Solr 3.1 ou Solr 4.0

Mercredi 3 novembre 2010 par admin
Posté dans Lucene / Solr, Moteur de recherche, Technique

solrDepuis le début de l'année les sources de Lucene et Solr ont fusionnées. La prochaine version commune aura pour numéro 4.0. Pour ceux qui veulent déjà tester la version en cours de développement, il faut en récupérer les sources et les compiler (java 1.6 requis). En effet, les liens de téléchargement des compilations nocturnes ne fonctionnent pas. En prérequis, il faut disposer de svn client et de ant.

Il existe actuellement 2 versions en cours de développement : Solr 3.1 et Solr 4.0. Ma compréhension est que :

  • Solr 3.1 est une version plutôt stable qui devrait la prochaine version de Solr et embarquent Lucene 3.1. Sortie possible : mars ou avril 2011.
  • Solr 4.0 est la version de développement (trunk) moins stable et dont le disponibilité dervait être pour 2012.

Pour une explication sur ces 2 versions des sources de Solr, lire ce message de Uwe Schindler : Lucene 3.x branch created et cette discussion : Solr 3.1

Lire la suite »


Installation de Munin sur Debian Lenny

Mardi 12 octobre 2010 par dominique
Posté dans Debian, Technique

Cet article décrit l'installation de base du moniteur de ressources Numin, puis fourni un lien sur un article décrivant comment ajouter un plugin pour le monitoring des vhosts apache.

Lire la suite »


Installer Atlassian Jira 4.1 et Confluence 3.3 sur Debian Lenny avec Tomcat 5.5 et MySQL

Lundi 11 octobre 2010 par dominique
Posté dans Debian, Technique

Cet article est un résumé des procédures d'installation de Jira et Confluence telle qu'on peut les trouver sur le site de Atlassian. Il est focalisé sur un environnement Tomcat 5.5 et MySQL.

Lire la suite »


Détection de la langue d’un texte (3)

Vendredi 26 mars 2010 par dominique
Posté dans Lucene / Solr, Technique

javaDans un premier article sur le sujet, je décris une méthode de détection de la langue d’un texte basée sur un calcul statistique de présence de n-gram dans le texte.  Cette distribution statistique est alors comparée à des distributions types pré-calculées sur des corpus de texte dans différentes langues. La langue du texte est alors à priori celle du corpus présentant la distribution la plus proche. Comme je l’ai expliqué dans mon premier article, j’ai utilisé NgramJ, une librairie Java open source. Après différents tests avec d’autres librairies, NgramJ reste pour moi la plus efficace.

Cependant, cette méthode n’est pas fiable à 100% et NgramJ est limitée dans sa version actuelle à 26 langues détectables : Bulgare (bg), Tchèque (cz), Danois (da), Allemand (de), Grec (el), Anglais (en) Espagnol (es), Estonien (et), Finlandais (fi), Français (fr), Hongrois (hu), Islandais (is), Italien (it), Lituanien (lt), Letton (lv), Maltais (mt) , Néerlandais (nl), Norvégien (no), Polonais (pl), Portugais (pt), Roumain (ro), Russe (ru) , Slovaque (sk), Slovène (sl), Suédois (sv) et Thaï (th).

Je voudrais proposer 2 pistes pour améliorer NGramJ : la fiabilité de la détection et le nombre de langues détectables.

Lire la suite »


Tika 0.6 : compilation et dépendances

Jeudi 11 mars 2010 par dominique
Posté dans Lucene / Solr, Technique

tikaTika est une librairie Java qui a pour but l’extraction du texte de toutes sortes de formats de fichiers : PDF, office,  html, … (la liste complète est disponible ici). Afin d’utiliser cette librairie dans vos projets java, il faut en récupérer les sources, les compiler et également récupérer les librairies dont dépend Tika. Voici la procédure à suivre ainsi qu’une astuce pour palier à un problème de compilation.

Lire la suite »


Déconnexions intempestives avec SSH

Lundi 11 janvier 2010 par dominique
Posté dans Debian, Technique

ssh1Avec ma connexion Numéricable (mais pas en ADSL avec Free), j’ai rencontré des problèmes de déconnexions SSH intempestives (aussi bien avec Putty qu’avec WinSCP).

La solutions passe par une paramétrage du coté client pour envoyer des packets vides qui serviront à maintenir la connexion en vie.

Avec Putty : Onglet Connections > Seconds between keepalives : « 60″

Sous Linux : Dans « ~/.ssh/config » > « ServerAliveInterval 60″

Dans les cas ou cela est possible, cette configuration peut être réalisée coté serveur : dans « /etc/ssh/sshd_config » > « ClientAliveInterval 60″



Mac OS X et outils de développement

Dimanche 20 décembre 2009 par dominique
Posté dans Mac OS, Productivité, Technique

icon_xcode_20090824

Le but est de pouvoir développer sous Mac OX (Snow Leopard) des applications AMP (Apache / MySQL / PHP) et des applications Java (dont des servlets dans Tomcat). Dans cet article sont abordées les installations de Apache, PHP, MySQL, Java, Tomcat et Eclipse.

 

 

Xcode

C'est la première étape incontournable pour disposer d'un environnement de développement sous Mac OS. Xcode est disponible sur le DVD de Snow Leopard, mais la dernière version à jour est disponible gratuitement sur le site de Apple (http://developer.apple.com/products/membership.html). Xcode inclut les outils minimums pour créer et debugger des applications pour Mac (ou iPhone).

Lire la suite »


Introduction à Solr – Installation et configuration (2)

Dimanche 10 mai 2009 par dominique
Posté dans Lucene / Solr, Moteur de recherche, Productivité, Technique

Dans les précédents articles consacrés à Solr, j’en décris les principes (Présentation de Lucene Solr) et  comment installer et configurer de façon très basique Solr afin de pouvoir indexer et rechercher dans le jeu de données de test fourni dans la distribution (Introduction à Solr – Installation et configuration (1)).

Dans ce nouvel article, je vais expliquer plus en détail les points suivants :

  • Le contenu de la distribution
  • Les fichiers de configuration
  • Comment gérer plusieurs indexes ?
  • Comment gérer plusieurs applications ?

Lire la suite »


Choisir un Framework Javascript

Lundi 4 mai 2009 par dominique
Posté dans Productivité, Technique, Web 2.0

javascriptJe me suis récemment intéressé aux frameworks Javascript et j’ai chercher à savoir lequel mérite le plus que l’on investise du temps à son apprentissage. J’ai commencé par rechercher des comparatifs techniques et des commentaires sur les blogs. Les 3 candidats qui émergent sont : jQuery, Prototype et le semble-t-il prometteur MooTools.

Lire la suite »


Vmware server 2.0 sur hôte OpenSuse 11.1 64 bits

Dimanche 26 avril 2009 par dominique
Posté dans Productivité, Technique, vmware

 

vmwareDans cet article, j'explique la mise en place d'une configuration puissante afin d'héberger des serveurs virtuels sous Vmware server 2.0. Les points abordés sont :

  • Choix d'un système d'exploitation pour le serveur Vmware
  • Installation de Linux sur le serveur vmware
  • Installation de Vmware server 2.0
  • Installation des Vmware tools dans les machines invités (guest)
  • Sauvegardes des machines virtuelles
  • Réduction de la taille (shrink) des disques virtuels vmdk

Lire la suite »




Page 1 parmi 41234