Archive pour septembre 2008


 

Détection de la langue d’un texte (2)

Lundi 22 septembre 2008 par dominique
Posté dans Technique

Il y a quelques temps j’ai présenté ma solution de détection de la langue d’un texte. Cette solution en Java est basée sur NGramJ.

C’est au tour de Cedric Champeau de présenter sa propre solution : JLangDetect. JLangDetect est également basé sur un calcul statistique des fréquences d’apparition de n-grams dans le texte puis une comparaison de ce résultat aux résultats obtenus sur des référentiels de documents dans différentes langues. Tout comme pour ma solution, les résultats ne sont pas fiables à 100% surtout avec des textes courts (quelques mots).

Lire la suite »


Présentation de Lucene Solr

Jeudi 18 septembre 2008 par dominique
Posté dans Lucene / Solr, Moteur de recherche

La nouvelle version 1.3.0 de Solr est enfin disponible. Elle était très attendue des développeurs car la précédente version officielle datait déjà du 6 juin 2007 soit plus d’un an. Comme beaucoup, je travaillais avec les build nocturnes depuis déjà un certain temps.

Cette sortie est l’occasion de présenter Solr à ceux qui ne le connaissent pas encore.

Solr (on prononce « solar ») est une outil open source permettant de mettre en place des fonctionnalités de recherche dans différents types d’applications et notamment des sites web (mais pas seulement). Solr est basé sur Lucene que j’ai présenté dans un précédent article. Cette nouvelle version bénéficie des dernières évolutions de Lucene 2.3.x.

Lire la suite »


Organiser sa bibliothèque MP3

Samedi 13 septembre 2008 par dominique
Posté dans Technique, iPhone

Depuis quelques années, J’ai pris l’habitude de convertir en MP3 tous mes CD et comme beaucoup de monde j’écoute plus mes disque depuis un ordinateur avec Winamp que sur un lecteur de CD de salon. J’utilisais également un lecteur de MP3 assez basic et tout allait pour le mieux.

Si vous avez lu d’autres articles de ce blog, vous savez que je possède un iPhone et donc un nouveau lecteur MP3. J’ai à cette occasion constaté le bazar dans les tags ID3 de mes fichiers MP3. Lorsqu’un artiste à son nom écrit de plusieurs façons différentes (ALAIN SOUCHON, Alain Souchon ou Souchon Alain), ou que les noms des albums ne respectent pas une certaine normalisation, la navigation n’est pas très agréable.

Je me suis donc lancé dans une réorganisation des tags de mes MP3. Voici quelques outils très efficaces pour mener à bien cette opération.

Lire la suite »


Google Chrome n’aime pas les flux RSS

Mardi 2 septembre 2008 par dominique
Posté dans Flux RSS, Web 2.0

Suite à la sortie très médiatisée ce jour de Google Chrome, je me suis empressé de tester l’affichage et le bon fonctionnement de Zoonix et de Crossfeeds dans ce nouveau navigateur. A priori et même si des tests plus approfondis seront nécessaires, tout semble bien fonctionner. Par contre, les flux RSS sont très mal gérés dans cette première version beta. Tout d’abord, Google Chrome ne détecte pas les flux RSS sur les sites web et les blogs car Il ne gère pas la déclaration suivante :

<link rel= »alternate » type= »application/rss+xml » …

Ensuite, il n’affiche pas les fichiers XML aussi bien que Firefox et Internet Explorer et donc il n’affiche pas bien les flux RSS.

Lire la suite »


L’art du référencement web par Camille Roux

Lundi 1 septembre 2008 par dominique
Posté dans Moteur de recherche, Sites à découvrir, Technique

J’ai regardé avec intérêt une vidéo très didactique de présentation faite par Camille Roux sur « l’art du référencement« .

On y trouve des informations sur le fonctionnement des moteurs de recherche et notamment les différents éléments qui rentrent en ligne de compte dans le positionnement d’un article dans le résultat d’une recherche (pertinence, notoriété).

Les points clés à mettre en pratique pour optimiser son blog sont passés en revu un par un : optimisation des URL (URL rewriting), structure du site, sitemap, robots.txt, page rank, balises html (title, H1, H2, meta), …

L’article où on peut trouver cette vidéo reprend son contenu et est accompagné des slides de la présentation.

A lire et regarder absolument pour bien utiliser un plugin WordPress du type All In One SEO Pack.