<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
		>
<channel>
	<title>Commentaires sur : Introduction à Lucene</title>
	<atom:link href="http://www.zoonix.fr/2008/08/06/introduction-a-lucene/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.zoonix.fr/2008/08/06/introduction-a-lucene/</link>
	<description>Le blog d'un informaticien indépendant</description>
	<lastBuildDate>Wed, 04 Aug 2010 15:15:29 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.2</generator>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
		<item>
		<title>Par : Walibda</title>
		<link>http://www.zoonix.fr/2008/08/06/introduction-a-lucene/comment-page-1/#comment-15199</link>
		<dc:creator>Walibda</dc:creator>
		<pubDate>Wed, 10 Mar 2010 18:04:32 +0000</pubDate>
		<guid isPermaLink="false">http://www.zoonix.fr/?p=50#comment-15199</guid>
		<description>Merci pour tous</description>
		<content:encoded><![CDATA[<p>Merci pour tous</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : admin</title>
		<link>http://www.zoonix.fr/2008/08/06/introduction-a-lucene/comment-page-1/#comment-15198</link>
		<dc:creator>admin</dc:creator>
		<pubDate>Wed, 10 Mar 2010 17:45:28 +0000</pubDate>
		<guid isPermaLink="false">http://www.zoonix.fr/?p=50#comment-15198</guid>
		<description>C&#039;est un peu juste comme information.</description>
		<content:encoded><![CDATA[<p>C&#8217;est un peu juste comme information.</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : Walibda</title>
		<link>http://www.zoonix.fr/2008/08/06/introduction-a-lucene/comment-page-1/#comment-15197</link>
		<dc:creator>Walibda</dc:creator>
		<pubDate>Wed, 10 Mar 2010 17:37:06 +0000</pubDate>
		<guid isPermaLink="false">http://www.zoonix.fr/?p=50#comment-15197</guid>
		<description>Salut 
Quand j&#039;utilise le filtre ISOLatin1AccentFilter,mon débogueur d&#039;ezpublish3.9.2 affiche ça   

Warning:  PHP  	Mar 10 2010 17:15:30

java.lang.Exception: CreateInstance failed: new org.apache.lucene.queryParser.MultiFieldQueryParser((String;)o(String;), (Analyzer)c(ISOLatin1AccentFilter)). Cause: java.lang.IllegalArgumentException: 

Est ce que l&#039;instanciation n&#039;est pas correct ?

Merci</description>
		<content:encoded><![CDATA[<p>Salut<br />
Quand j&#8217;utilise le filtre ISOLatin1AccentFilter,mon débogueur d&#8217;ezpublish3.9.2 affiche ça   </p>
<p>Warning:  PHP  	Mar 10 2010 17:15:30</p>
<p>java.lang.Exception: CreateInstance failed: new org.apache.lucene.queryParser.MultiFieldQueryParser((String;)o(String;), (Analyzer)c(ISOLatin1AccentFilter)). Cause: java.lang.IllegalArgumentException: </p>
<p>Est ce que l&#8217;instanciation n&#8217;est pas correct ?</p>
<p>Merci</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : admin</title>
		<link>http://www.zoonix.fr/2008/08/06/introduction-a-lucene/comment-page-1/#comment-15195</link>
		<dc:creator>admin</dc:creator>
		<pubDate>Wed, 10 Mar 2010 15:34:44 +0000</pubDate>
		<guid isPermaLink="false">http://www.zoonix.fr/?p=50#comment-15195</guid>
		<description>StandardAnalyzer est bien pour l&#039;anglais mais pas pour les langues européennes accentuées. Cet analyser fait :

* découpage en token
* normalisation en minuscule
* suppression des mots vides (paramétrable)

Il faudrait le dériver en un StandardISOLatinAnalyzer.
et surcharger les méthodes : 

  public TokenStream tokenStream(String fieldName, Reader reader)

  public TokenStream reusableTokenStream(String fieldName, Reader reader)</description>
		<content:encoded><![CDATA[<p>StandardAnalyzer est bien pour l&#8217;anglais mais pas pour les langues européennes accentuées. Cet analyser fait :</p>
<p>* découpage en token<br />
* normalisation en minuscule<br />
* suppression des mots vides (paramétrable)</p>
<p>Il faudrait le dériver en un StandardISOLatinAnalyzer.<br />
et surcharger les méthodes : </p>
<p>  public TokenStream tokenStream(String fieldName, Reader reader)</p>
<p>  public TokenStream reusableTokenStream(String fieldName, Reader reader)</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : Walibda</title>
		<link>http://www.zoonix.fr/2008/08/06/introduction-a-lucene/comment-page-1/#comment-15194</link>
		<dc:creator>Walibda</dc:creator>
		<pubDate>Wed, 10 Mar 2010 15:01:20 +0000</pubDate>
		<guid isPermaLink="false">http://www.zoonix.fr/?p=50#comment-15194</guid>
		<description>Bonjour
j&#039;utilise le filter StandardAnalyzer.
Est ce que ne marche pas avec ce filter .


Cordialement</description>
		<content:encoded><![CDATA[<p>Bonjour<br />
j&#8217;utilise le filter StandardAnalyzer.<br />
Est ce que ne marche pas avec ce filter .</p>
<p>Cordialement</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : dominique</title>
		<link>http://www.zoonix.fr/2008/08/06/introduction-a-lucene/comment-page-1/#comment-15193</link>
		<dc:creator>dominique</dc:creator>
		<pubDate>Wed, 10 Mar 2010 14:25:28 +0000</pubDate>
		<guid isPermaLink="false">http://www.zoonix.fr/?p=50#comment-15193</guid>
		<description>@Walibda
Il faut utiliser lors de l&#039;indexation et de la recherche une analyzer qui inclura le filtre ISOLatin1AccentFilter.

Le but est de normaliser tous les caractères accentués dans leur forme non accentuée (éèê -&gt; e, î-&gt;i, ...). Ainsi, &quot;problème&quot; et &quot;probleme&quot; seront considérer comme identiques.</description>
		<content:encoded><![CDATA[<p>@Walibda<br />
Il faut utiliser lors de l&#8217;indexation et de la recherche une analyzer qui inclura le filtre ISOLatin1AccentFilter.</p>
<p>Le but est de normaliser tous les caractères accentués dans leur forme non accentuée (éèê -&gt; e, î-&gt;i, &#8230;). Ainsi, &laquo;&nbsp;problème&nbsp;&raquo; et &laquo;&nbsp;probleme&nbsp;&raquo; seront considérer comme identiques.</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : Walibda</title>
		<link>http://www.zoonix.fr/2008/08/06/introduction-a-lucene/comment-page-1/#comment-15189</link>
		<dc:creator>Walibda</dc:creator>
		<pubDate>Wed, 10 Mar 2010 10:47:25 +0000</pubDate>
		<guid isPermaLink="false">http://www.zoonix.fr/?p=50#comment-15189</guid>
		<description>Bonjour 
Je vous remercie pour cette petit introduction et j&#039;ai question sur l&#039;indexation du mot accentués .Car j&#039;ai un problème lors de la recherche d&#039;un mot sans mettre leur accent.

Exemple si je cherche le mot &quot;problème&quot; le résultat est OK ce qui n&#039;est pas le cas si je lance la recherche du mot &quot;probleme&quot; sans mettre leur accent .

Merci d&#039;avance</description>
		<content:encoded><![CDATA[<p>Bonjour<br />
Je vous remercie pour cette petit introduction et j&#8217;ai question sur l&#8217;indexation du mot accentués .Car j&#8217;ai un problème lors de la recherche d&#8217;un mot sans mettre leur accent.</p>
<p>Exemple si je cherche le mot &laquo;&nbsp;problème&nbsp;&raquo; le résultat est OK ce qui n&#8217;est pas le cas si je lance la recherche du mot &laquo;&nbsp;probleme&nbsp;&raquo; sans mettre leur accent .</p>
<p>Merci d&#8217;avance</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : ahmed</title>
		<link>http://www.zoonix.fr/2008/08/06/introduction-a-lucene/comment-page-1/#comment-1315</link>
		<dc:creator>ahmed</dc:creator>
		<pubDate>Sun, 08 Mar 2009 08:34:44 +0000</pubDate>
		<guid isPermaLink="false">http://www.zoonix.fr/?p=50#comment-1315</guid>
		<description>Salut,

je débute sous Lucene, et j&#039;ai une question concenant le résultat d&#039;une recherche. Je m&#039;explique:

j&#039;ai plusieurs fichiers PDF que j&#039;indexe, et j&#039;index toujours la date de création. Alors je sais pas est ce que il y a un moyen de dire au moteur de recherche de trier les résultats de plus récents en plus anciens.

Merci d&#039;avance</description>
		<content:encoded><![CDATA[<p>Salut,</p>
<p>je débute sous Lucene, et j&#8217;ai une question concenant le résultat d&#8217;une recherche. Je m&#8217;explique:</p>
<p>j&#8217;ai plusieurs fichiers PDF que j&#8217;indexe, et j&#8217;index toujours la date de création. Alors je sais pas est ce que il y a un moyen de dire au moteur de recherche de trier les résultats de plus récents en plus anciens.</p>
<p>Merci d&#8217;avance</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : ahmed</title>
		<link>http://www.zoonix.fr/2008/08/06/introduction-a-lucene/comment-page-1/#comment-725</link>
		<dc:creator>ahmed</dc:creator>
		<pubDate>Sun, 15 Feb 2009 11:01:58 +0000</pubDate>
		<guid isPermaLink="false">http://www.zoonix.fr/?p=50#comment-725</guid>
		<description>comment modifier la base d&#039;indexation de lucene par exemple modifier le champ name qui  contient le nom de document ,ou bien a c que il y a une possibilité   d&#039;ajouter d&#039;autre champs a la basse d&#039;indexation</description>
		<content:encoded><![CDATA[<p>comment modifier la base d&#8217;indexation de lucene par exemple modifier le champ name qui  contient le nom de document ,ou bien a c que il y a une possibilité   d&#8217;ajouter d&#8217;autre champs a la basse d&#8217;indexation</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : admin</title>
		<link>http://www.zoonix.fr/2008/08/06/introduction-a-lucene/comment-page-1/#comment-630</link>
		<dc:creator>admin</dc:creator>
		<pubDate>Tue, 10 Feb 2009 16:18:17 +0000</pubDate>
		<guid isPermaLink="false">http://www.zoonix.fr/?p=50#comment-630</guid>
		<description>Lucene n&#039;offre pas de module d&#039;indexation de base données qui ne nécessiterait que du paramétrage. Il faut développer sa propre solution (interroger la base en jdbc et indexer les données dans lucene).

Le projet Solr qui est basé sur Lucene offre un Database Import Handler très puissant.

J&#039;ai également trouvé ce produit commercial :
http://www.sematext.com/product-db-indexer.html</description>
		<content:encoded><![CDATA[<p>Lucene n&#8217;offre pas de module d&#8217;indexation de base données qui ne nécessiterait que du paramétrage. Il faut développer sa propre solution (interroger la base en jdbc et indexer les données dans lucene).</p>
<p>Le projet Solr qui est basé sur Lucene offre un Database Import Handler très puissant.</p>
<p>J&#8217;ai également trouvé ce produit commercial :<br />
<a href="http://www.sematext.com/product-db-indexer.html" rel="nofollow">http://www.sematext.com/product-db-indexer.html</a></p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : mobilis</title>
		<link>http://www.zoonix.fr/2008/08/06/introduction-a-lucene/comment-page-1/#comment-629</link>
		<dc:creator>mobilis</dc:creator>
		<pubDate>Tue, 10 Feb 2009 15:36:25 +0000</pubDate>
		<guid isPermaLink="false">http://www.zoonix.fr/?p=50#comment-629</guid>
		<description>A ce que il y a une possibilité de indexer une base de donne ave  lucene</description>
		<content:encoded><![CDATA[<p>A ce que il y a une possibilité de indexer une base de donne ave  lucene</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : Introduction à Lucene &#171; Portail Java</title>
		<link>http://www.zoonix.fr/2008/08/06/introduction-a-lucene/comment-page-1/#comment-283</link>
		<dc:creator>Introduction à Lucene &#171; Portail Java</dc:creator>
		<pubDate>Thu, 04 Dec 2008 10:08:26 +0000</pubDate>
		<guid isPermaLink="false">http://www.zoonix.fr/?p=50#comment-283</guid>
		<description>[...] Il s’agit bien d’une librairie avec laquelle il n’est pas fourni d’outils permettant l’indexation de données en quelques clics de souris et quelques paramétrages. Il faut donc en passer par du code Java afin de mettre en place une solution sur mesure de recherche plein-texte. (Lire la suite) [...]</description>
		<content:encoded><![CDATA[<p>[...] Il s’agit bien d’une librairie avec laquelle il n’est pas fourni d’outils permettant l’indexation de données en quelques clics de souris et quelques paramétrages. Il faut donc en passer par du code Java afin de mettre en place une solution sur mesure de recherche plein-texte. (Lire la suite) [...]</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : max</title>
		<link>http://www.zoonix.fr/2008/08/06/introduction-a-lucene/comment-page-1/#comment-107</link>
		<dc:creator>max</dc:creator>
		<pubDate>Thu, 18 Sep 2008 15:14:50 +0000</pubDate>
		<guid isPermaLink="false">http://www.zoonix.fr/?p=50#comment-107</guid>
		<description>merci beaucoup pour ta réponse rapide !

&gt; Il faut considérer chaque ligne du fichier log comme un document lucene.

ok mais, mes fichiers risquent d&#039;être énormes -&gt; plusieurs millions de lignes au total ! :(
je peux quand même indéxer mon fichier comme une table de base de donnée alors ?

merci beaucoup</description>
		<content:encoded><![CDATA[<p>merci beaucoup pour ta réponse rapide !</p>
<p>&gt; Il faut considérer chaque ligne du fichier log comme un document lucene.</p>
<p>ok mais, mes fichiers risquent d&#8217;être énormes -&gt; plusieurs millions de lignes au total ! <img src='http://www.zoonix.fr/wp-includes/images/smilies/icon_sad.gif' alt=':(' class='wp-smiley' /><br />
je peux quand même indéxer mon fichier comme une table de base de donnée alors ?</p>
<p>merci beaucoup</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : dominique</title>
		<link>http://www.zoonix.fr/2008/08/06/introduction-a-lucene/comment-page-1/#comment-106</link>
		<dc:creator>dominique</dc:creator>
		<pubDate>Thu, 18 Sep 2008 09:43:31 +0000</pubDate>
		<guid isPermaLink="false">http://www.zoonix.fr/?p=50#comment-106</guid>
		<description>Ce que vous voulez faire c&#039;est chercher des lignes dans le fichier de log qui contiennent certains mots ou expressions.

Il faut considérer chaque ligne du fichier log comme un document lucene. D&#039;une ligne peut être extraite la date et peut être d&#039;autres informations. Le document Lucene contiendra un Field pour le texte de la ligne de log et d&#039;autres Fields pour les autres informations interessantes  (par exemple pour un log apache : la date, le code d&#039;erreur, l&#039;ip du client, ...)

Oui, je pense que Lucene peut répondre au besoin.</description>
		<content:encoded><![CDATA[<p>Ce que vous voulez faire c&#8217;est chercher des lignes dans le fichier de log qui contiennent certains mots ou expressions.</p>
<p>Il faut considérer chaque ligne du fichier log comme un document lucene. D&#8217;une ligne peut être extraite la date et peut être d&#8217;autres informations. Le document Lucene contiendra un Field pour le texte de la ligne de log et d&#8217;autres Fields pour les autres informations interessantes  (par exemple pour un log apache : la date, le code d&#8217;erreur, l&#8217;ip du client, &#8230;)</p>
<p>Oui, je pense que Lucene peut répondre au besoin.</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : max</title>
		<link>http://www.zoonix.fr/2008/08/06/introduction-a-lucene/comment-page-1/#comment-105</link>
		<dc:creator>max</dc:creator>
		<pubDate>Thu, 18 Sep 2008 09:16:53 +0000</pubDate>
		<guid isPermaLink="false">http://www.zoonix.fr/?p=50#comment-105</guid>
		<description>Bonjour !

merci pour cet excellent article.
une demande cependant : je veux réaliser un client lourd en java permettant la recherche de chaine de caractères dans de gros fichiers de logs (texte) et afficher les résultat à l&#039;aide d&#039;un interface graphique (SWING?).

Lucene est t il adapté à mon projet ? je veux principalement rechercher des chaines dans de gros fichiers textes et filtrer l&#039;affichage.

merci beaucoup</description>
		<content:encoded><![CDATA[<p>Bonjour !</p>
<p>merci pour cet excellent article.<br />
une demande cependant : je veux réaliser un client lourd en java permettant la recherche de chaine de caractères dans de gros fichiers de logs (texte) et afficher les résultat à l&#8217;aide d&#8217;un interface graphique (SWING?).</p>
<p>Lucene est t il adapté à mon projet ? je veux principalement rechercher des chaines dans de gros fichiers textes et filtrer l&#8217;affichage.</p>
<p>merci beaucoup</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : admin</title>
		<link>http://www.zoonix.fr/2008/08/06/introduction-a-lucene/comment-page-1/#comment-64</link>
		<dc:creator>admin</dc:creator>
		<pubDate>Wed, 27 Aug 2008 15:26:52 +0000</pubDate>
		<guid isPermaLink="false">http://www.zoonix.fr/?p=50#comment-64</guid>
		<description>@Marco

Exact. Merci !</description>
		<content:encoded><![CDATA[<p>@Marco</p>
<p>Exact. Merci !</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : Marco</title>
		<link>http://www.zoonix.fr/2008/08/06/introduction-a-lucene/comment-page-1/#comment-63</link>
		<dc:creator>Marco</dc:creator>
		<pubDate>Wed, 27 Aug 2008 14:23:10 +0000</pubDate>
		<guid isPermaLink="false">http://www.zoonix.fr/?p=50#comment-63</guid>
		<description>Bonjour et merci pour cette présentation !

Je pense qu&#039;il y a une erreur ici :

Field.Store.YES (non stocké) ou Field.Store.NO (stocké)

C&#039;est le contraire non ?</description>
		<content:encoded><![CDATA[<p>Bonjour et merci pour cette présentation !</p>
<p>Je pense qu&#8217;il y a une erreur ici :</p>
<p>Field.Store.YES (non stocké) ou Field.Store.NO (stocké)</p>
<p>C&#8217;est le contraire non ?</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : Pierre</title>
		<link>http://www.zoonix.fr/2008/08/06/introduction-a-lucene/comment-page-1/#comment-59</link>
		<dc:creator>Pierre</dc:creator>
		<pubDate>Thu, 21 Aug 2008 22:45:48 +0000</pubDate>
		<guid isPermaLink="false">http://www.zoonix.fr/?p=50#comment-59</guid>
		<description>Bonjour,

Belle présentation de Lucène. Pour information, le portail open source Lutece utilise Lucène depuis l&#039;origine du projet. On pourra y trouver plusieurs exemples de mise en oeuvre.

Bonne continuation.

Pierre</description>
		<content:encoded><![CDATA[<p>Bonjour,</p>
<p>Belle présentation de Lucène. Pour information, le portail open source Lutece utilise Lucène depuis l&#8217;origine du projet. On pourra y trouver plusieurs exemples de mise en oeuvre.</p>
<p>Bonne continuation.</p>
<p>Pierre</p>
]]></content:encoded>
	</item>
</channel>
</rss>
