dictionary - Solr : Autolink on body from words dictionnary -
i'm looking generate auto link in body result in solr. words on link must in dictionnary.
for example :
a doc :
<doc> [...] <str name="title">il faut, quand on gouverne, voir les hommes tels qu’ils sont, et les choses telles qu’elles devraient être.</str> <str name="path">citation/faut-gouverne-voir-hommes-tels-choses-telles-devraient-etre-15.php</str> <str name="ss_field_citation_keywords">#faut#gouverne#voir#hommes#tels#choses#telles#devraient#etre#</str> [...] </doc> body title display :
il faut, quand on gouverne, voir les hommes tels qu’ils sont, et les choses telles qu’elles devraient être. links ss_field_citation_keywords :
#faut#gouverne#voir#hommes#tels#choses#telles#devraient#etre# body must display :
il <a href="foo/faut">faut</a>, quand on <a href="foo/gouverne">gouverne</a>, <a href="foo/voir">voir</a> les <a href="foo/hommes">hommes</a> <a href="foo/tels">tels</a> qu’ils sont, et les <a href="foo/choses">choses</a> <a href="foo/telles">telles</a> qu’elles <a href="foo/devraient">devraient</a> <a href="foo/etre">être</a>. il faut, quand on gouverne, voir les hommes tels qu’ils sont, et les choses telles qu’elles devraient être
do have idea?
you have 2 phases here:
- identify keywords. want build analyzer chain properly. whitespace tokenizer, lowercase filter , - that's key part - keepwordfilterfactory . make solr keep keywords offsets in text.
- get offsets. there might several ways, 1 of them reuse field analyzer can experiment in admin webui of latest (4+) solr. make sure check verbose box. uses /analysis/field end point , can use (with verbose flag). result verbose enough start. can better implementation or copy/reduce 1 done.
Comments
Post a Comment