search - Lucene Score Ergebnisse

Translate

In Lucene, wenn Sie mehrere Indizes hatten, die jeweils nur eine Partition abdeckten. Warum liefert dieselbe Suche in verschiedenen Indizes Ergebnisse mit unterschiedlichen Bewertungen? Die Ergebnisse von verschiedenen Servern stimmen genau überein.

dh wenn ich gesucht habe nach:

  • Name - John Smith
  • Geburtsdatum - 11.11.1934

Partition 0würde eine Punktzahl von 0,345 zurückgeben

Partition 1würde eine Punktzahl von 0,337 zurückgeben

Beide stimmen genau mit Name und Geburtsdatum überein.

This question and all comments follow the "Attribution Required."

Alle Antworten

Translate

DasWertungenthält die Inverse Document Frequency (IDF). Wenn der Begriff "John Smith" in einer Partition 0, 100 Mal und in Partition 1 einmal vorkommt. Die Punktzahl für die Suche nach John Smith wäre eine höhere Suche in Partition 1, da der Begriff seltener ist.

Um dies zu umgehen, müsste Ihr Index über allen Partitionen liegen, oder Sie müssten die IDF überschreiben.

Quelle
Translate

Weil die Punktzahl im Index ermittelt wird, wenn ich mich nicht völlig irre.

Wenn Sie unterschiedliche Indizes haben (mehr / weniger oder unterschiedliche indizierte Daten), unterscheidet sich die Bewertung:

http://lucene.apache.org/core/3_6_0/scoring.html

(Warnung: Enthält Mathematik :-))

Quelle
Translate

Sie könnten auch an der Ausgabe des interessiert seinexplain()Methodeund das ErgebnisExplanationObjekt, die Ihnen eine Vorstellung davon geben, wie die Dinge so bewertet werden, wie sie sind.

Quelle