dictionary - Solr : Autolink on body from words dictionnary -


i'm looking generate auto link in body result in solr. words on link must in dictionnary.

for example :

a doc :

<doc>      [...]      <str name="title">il faut, quand on gouverne, voir les hommes tels qu’ils sont, et les choses telles qu’elles devraient être.</str>     <str name="path">citation/faut-gouverne-voir-hommes-tels-choses-telles-devraient-etre-15.php</str>     <str name="ss_field_citation_keywords">#faut#gouverne#voir#hommes#tels#choses#telles#devraient#etre#</str>      [...] </doc> 

body title display :

il faut, quand on gouverne, voir les hommes tels qu’ils sont, et les choses telles qu’elles devraient être. 

links ss_field_citation_keywords :

#faut#gouverne#voir#hommes#tels#choses#telles#devraient#etre# 

body must display :

il <a href="foo/faut">faut</a>, quand on <a href="foo/gouverne">gouverne</a>, <a href="foo/voir">voir</a> les <a href="foo/hommes">hommes</a> <a href="foo/tels">tels</a> qu’ils sont, et les <a href="foo/choses">choses</a> <a href="foo/telles">telles</a> qu’elles <a href="foo/devraient">devraient</a> <a href="foo/etre">être</a>. 

il faut, quand on gouverne, voir les hommes tels qu’ils sont, et les choses telles qu’elles devraient être

do have idea?

you have 2 phases here:

  1. identify keywords. want build analyzer chain properly. whitespace tokenizer, lowercase filter , - that's key part - keepwordfilterfactory . make solr keep keywords offsets in text.
  2. get offsets. there might several ways, 1 of them reuse field analyzer can experiment in admin webui of latest (4+) solr. make sure check verbose box. uses /analysis/field end point , can use (with verbose flag). result verbose enough start. can better implementation or copy/reduce 1 done.

Comments

Popular posts from this blog

How to mention the localhost in android -

php - Calling a template part from a post -

c# - String.format() DateTime With Arabic culture -