search - Résultats Lucene Score

Translate

Dans Lucene si vous aviez plusieurs index qui ne couvraient qu'une seule partition chacun. Pourquoi la même recherche sur différents index renvoie-t-elle des résultats avec des scores différents? Les résultats de différents serveurs correspondent exactement.

c'est à dire si je cherchais:

  • Nom - John Smith
  • Né le 11/11/1934

Partition 0renverrait un score de 0,345

Partition 1renverrait un score de 0,337

Les deux correspondent exactement au nom et à la date de naissance.

This question and all comments follow the "Attribution Required."

Toutes les réponses

Translate

lenotationcontient la fréquence inverse des documents (IDF). Si le terme «John Smith» est dans une partition, 0, 100 fois et dans la partition 1, une fois. Le score pour la recherche de John Smith serait plus élevé dans la partition 1 car le terme est plus rare.

Pour contourner ce problème, vous devez avoir votre index sur toutes les partitions, ou vous devrez remplacer l'IDF.

La source
Translate

Parce que le score est déterminé sur l'index si je ne me trompe pas complètement.

Si vous avez différents index (plus / moins ou des données différentes qui ont été indexées), le score sera différent:

http://lucene.apache.org/core/3_6_0/scoring.html

(Attention: contient des mathématiques :-))

La source
Translate

Vous pourriez également être intéressé par la sortie duexplain()méthode, et le résultatExplanationobjet, qui vous donnera une idée de la façon dont les choses sont notées telles qu'elles sont.

La source