Abfragen eines Vektorsuchindex

Auf dieser Seite wird beschrieben, wie Sie einen Vektorsuchindex abfragen, einschließlich Paginierung, Filter und Reranking.

Beispielnotizbücher, die veranschaulichen, wie Sie Endpunkte und Indizes für die Vektorsuche erstellen und abfragen, finden Sie unter Notizbücher für die Vektorsuche. Referenzinformationen finden Sie in der Python SDK-Referenz.

Installation

Um das Vektorsuch-SDK zu verwenden, müssen Sie es in Ihrem Notizbuch installieren. Verwenden Sie den folgenden Code, um das Paket zu installieren:

%pip install databricks-vectorsearch
dbutils.library.restartPython()

Verwenden Sie dann den folgenden Befehl, um VectorSearchClientzu importieren:

from databricks.vector_search.client import VectorSearchClient

Informationen zur Authentifizierung finden Sie unter Datenschutz und Authentifizierung.

Wie man einen Vektorsuchindex abfragt

Sie können den Vektorsuchindex nur mithilfe des Python SDK, der REST-API oder der SQL-vector_search() AI-Funktion abfragen.

Hinweis

Wenn der Benutzer, der den Index abfragt, nicht der Besitzer des Vektorsuchindex ist, muss der Benutzer über die folgenden UC-Berechtigungen verfügen:

USE CATALOG im Katalog, der den Vektorsuchindex enthält.
USE SCHEMA für das Schema, das den Vektorsuchindex enthält.
SELECT im Vektorsuchindex.

Der Standardabfragetyp ist ann (ungefährer Nachbar). Ausführliche Informationen zu den verschiedenen Abrufalgorithmen finden Sie unter "Abrufalgorithmen".

Legen Sie den Parameter query_type auf hybridfest, um eine Hybrid-Schlüsselwort-Ähnlichkeitssuche auszuführen. Bei der Hybridsuche werden alle Textmetadatenspalten eingeschlossen, und maximal 200 Ergebnisse werden zurückgegeben.
Informationen zum Verwenden des Rerankers in einer Abfrage finden Sie unter Verwenden des Rerankers in einer Abfrage.

Von Bedeutung

Die Volltextsuche ist als Beta-Feature verfügbar. Um eine Volltextsuche auszuführen, legen Sie den Parameter query_type auf FULL_TEXT. Bei der Volltextsuche können Sie bis zu 200 Ergebnisse basierend auf dem Stichwortabgleich abrufen, ohne Vektoreinbettungen zu verwenden. Volltextabfragen werden sowohl für standard- als auch für speicheroptimierte Endpunkte unterstützt. Auf speicheroptimierten Endpunkten können Sie auch einen dedizierten Volltext-Suchindex ohne Einbettungen erstellen. Siehe Erstellen eines Volltextsuchindex (Beta)

Python SDK-Standardendpunkt

Ausführliche Informationen finden Sie in der SDK-Referenz Python.

# Delta Sync Index with embeddings computed by Databricks
results = index.similarity_search(
    query_text="Greek myths",
    columns=["id", "field2"],
    num_results=2
    )

# Delta Sync Index using hybrid search, with embeddings computed by Databricks
results3 = index.similarity_search(
    query_text="Greek myths",
    columns=["id", "field2"],
    num_results=2,
    query_type="hybrid"
    )

# Delta Sync Index using full-text search (Beta)
results4 = index.similarity_search(
    query_text="Greek myths",
    columns=["id", "field2"],
    num_results=2,
    query_type="FULL_TEXT"
    )

# Delta Sync Index with pre-calculated embeddings
results2 = index.similarity_search(
    query_vector=[0.9] * 1024,
    columns=["id", "text"],
    num_results=2
    )

Python SDK-speicheroptimierter Endpunkt

Ausführliche Informationen finden Sie in der SDK-Referenz Python.

Die vorhandene Filterschnittstelle wurde für speicheroptimierte Vektorsuchindizes neu entwickelt, um eine SQL-ähnliche Filterzeichenfolge anstelle des Filterwörterbuchs zu übernehmen, das in Standardvektorsuchendpunkten verwendet wird.

client = VectorSearchClient()
index = client.get_index(index_name="vector_search_demo.vector_search.en_wiki_index")

# similarity search with query vector
results = index.similarity_search(
    query_vector=[0.2, 0.33, 0.19, 0.52],
    columns=["id", "text"],
    num_results=2
)

# similarity search with query vector and filter string
results = index.similarity_search(
    query_vector=[0.2, 0.33, 0.19, 0.52],
    columns=["id", "text"],
    # this is a single filter string similar to SQL WHERE clause syntax
    filters="language = 'en' AND country = 'us'",
    num_results=2
)

REST API

Weitere Informationen finden Sie in der REST-API-Referenzdokumentation: POST /api/2.0/vector-search/indexes/{index_name}/query.

Für Produktionsanwendungen empfiehlt Databricks die Verwendung von Dienstprinzipalen anstelle von persönlichen Zugriffstoken. Zusätzlich zur verbesserten Sicherheits- und Zugriffsverwaltung kann die Verwendung von Dienstprinzipalen die Leistung um bis zu 100 msec pro Abfrage verbessern.

Das folgende Codebeispiel veranschaulicht, wie ein Index mithilfe eines Serviceprinzips abgefragt wird.

export SP_CLIENT_ID=...
export SP_CLIENT_SECRET=...
export INDEX_NAME=...
export WORKSPACE_URL=https://...
export WORKSPACE_ID=...

# Set authorization details to generate OAuth token
export AUTHORIZATION_DETAILS='{"type":"unity_catalog_permission","securable_type":"table","securable_object_name":"'"$INDEX_NAME"'","operation": "ReadVectorIndex"}'
# If you are using an route_optimized embedding model endpoint, then you need to have additional authorization details to invoke the serving endpoint
# export EMBEDDING_MODEL_SERVING_ENDPOINT_ID=...
# export AUTHORIZATION_DETAILS="$AUTHORIZATION_DETAILS"',{"type":"workspace_permission","object_type":"serving-endpoints","object_path":"/serving-endpoints/'"$EMBEDDING_MODEL_SERVING_ENDPOINT_ID"'","actions": ["query_inference_endpoint"]}'

# Generate OAuth token
export TOKEN=$(curl -X POST  --url $WORKSPACE_URL/oidc/v1/token -u "$SP_CLIENT_ID:$SP_CLIENT_SECRET" --data 'grant_type=client_credentials' --data 'scope=all-apis' --data-urlencode 'authorization_details=['"$AUTHORIZATION_DETAILS"']' | jq .access_token | tr -d '"')

# Get index URL
export INDEX_URL=$(curl -X GET -H 'Content-Type: application/json' -H "Authorization: Bearer $TOKEN" --url $WORKSPACE_URL/api/2.0/vector-search/indexes/$INDEX_NAME | jq -r '.status.index_url' | tr -d '"')

# Query vector search index.
curl -X GET -H 'Content-Type: application/json' -H "Authorization: Bearer $TOKEN" --url https://$INDEX_URL/query --data '{"num_results": 3, "query_vector": [...], "columns": [...], "debug_level": 1}'

# Query vector search index.
curl -X GET -H 'Content-Type: application/json' -H "Authorization: Bearer $TOKEN" --url https://$INDEX_URL/query --data '{"num_results": 3, "query_text": "...", "columns": [...], "debug_level": 1}'

Im folgenden Codebeispiel wird veranschaulicht, wie sie einen Index mithilfe eines persönlichen Zugriffstokens (PERSONAL Access Token, PAT) abfragen.

export TOKEN=...
export INDEX_NAME=...
export WORKSPACE_URL=https://...

# Query vector search index with `query_vector`
curl -X GET -H 'Content-Type: application/json' -H "Authorization: Bearer $TOKEN" --url $WORKSPACE_URL/api/2.0/vector-search/indexes/$INDEX_NAME/query --data '{"num_results": 3, "query_vector": [...], "columns": [...], "debug_level": 1}'

# Query vector search index with `query_text`
curl -X GET -H 'Content-Type: application/json' -H "Authorization: Bearer $TOKEN" --url $WORKSPACE_URL/api/2.0/vector-search/indexes/$INDEX_NAME/query --data '{"num_results": 3, "query_text": "...", "columns": [...], "debug_level": 1}'

SQL

Von Bedeutung

Die KI-Funktion vector_search() befindet sich in der öffentlichen Vorschau.

Informationen zur Verwendung dieser KI-Funktionfinden Sie unter vector_search-Funktion.

Paginierung

Wenn eine Abfrage mehr als 1.000 Ergebnisse anfordert, werden die Ergebnisse automatisch auf Seiten von bis zu 1.000 zurückgegeben. Die maximale Anzahl der Ergebnisse, die eine einzelne Abfrage auf allen Seiten zurückgeben kann, beträgt 10.000. Sowohl standard- als auch speicheroptimierte Endpunkte unterstützen die Paginierung.

Die Paginierung funktioniert mit allen Abfragetypen.

Python SDK

Das Python SDK behandelt die Paginierung transparent. Wenn Sie num_results auf einen Wert festlegen, der größer als 1.000 ist, ruft das SDK automatisch alle Seiten ab und gibt das vollständige Result-Set zurück. Es ist kein zusätzlicher Code erforderlich.

# The SDK automatically paginates and returns all 5000 results
results = index.similarity_search(
    query_text="Greek myths",
    columns=["id", "text"],
    num_results=5000
)

REST API

Wenn Sie die REST-API direkt verwenden, müssen Sie die Paginierung manuell behandeln. Wenn weitere Ergebnisse verfügbar sind, enthält die Antwort ein next_page_token Feld. Um die nächste Seite der Ergebnisse abzurufen, übergeben Sie dieses Token an den Endpunkt der nächsten Seite der Abfrage.

Weitere Informationen finden Sie in der REST-API-Referenzdokumentation: POST /api/2.0/vector-search/indexes/{index_name}/query-next-page.

export TOKEN=...
export INDEX_NAME=...
export WORKSPACE_URL=https://...

# Initial query - if num_results exceeds 1000, the response includes next_page_token
curl -X GET -H 'Content-Type: application/json' -H "Authorization: Bearer $TOKEN" \
  --url $WORKSPACE_URL/api/2.0/vector-search/indexes/$INDEX_NAME/query \
  --data '{"num_results": 5000, "query_text": "...", "columns": ["id", "text"]}'

# Use next_page_token from the response to get the next page
curl -X GET -H 'Content-Type: application/json' -H "Authorization: Bearer $TOKEN" \
  --url $WORKSPACE_URL/api/2.0/vector-search/indexes/$INDEX_NAME/query-next-page \
  --data '{"page_token": "<next_page_token from previous response>"}'

Rufen Sie den Endpunkt der nächsten Seite der Abfrage mit der next_page_token von jeder Antwort aus, bis das Token leer oder nicht vorhanden ist, was angibt, dass alle Ergebnisse zurückgegeben wurden.

Verwenden von Filtern für Abfragen

Eine Abfrage kann Filter basierend auf einer beliebigen Spalte in der Delta-Tabelle definieren. similarity_search gibt nur Zeilen zurück, die den angegebenen Filtern entsprechen.

In der folgenden Tabelle sind die unterstützten Filter aufgeführt.

Hinweis

Für speicheroptimierte Endpunkte werden die Ergebnisse überabgerufen. Wenn Sie num_results auf k festlegen, werden mehr als k Ergebnisse abgerufen, und der Filter wird auf die abgerufenen Ergebnisse angewendet. Es ist möglich, dass keine Ergebnisse zurückgegeben werden, auch wenn es Ergebnisse im Dataset gibt, die der Filterbedingung entsprechen, wenn sich die Bewertung dieser Dokumente nicht am oberen Rand befindet.

Filteroperator	Verhalten	Examples
`NOT`	Standard: Hebt den Filter ab. Der Schlüssel muss mit "NOT" enden. Beispielsweise stimmt "color NOT" mit dem Wert "red" mit Dokumenten überein, bei denen die Farbe nicht rot ist. Speicher-optimiert: Siehe `!=` (bangeq sign)-Operator.	Standard: `{"id NOT": 2}{“color NOT”: “red”}` Speicheroptimierte: `"id != 2" "color != 'red'"`
`<`	Standard: Überprüft, ob der Feldwert kleiner als der Filterwert ist. Der Schlüssel muss mit " <" enden. Beispielsweise entspricht "Price <" mit dem Wert 200 Dokumenten, bei denen der Preis kleiner als 200 ist. Speicher-optimiert: Siehe `<` (lt sign)-Operator.	Standard: `{"id <": 200}` Speicheroptimierte: `"id < 200"`
`<=`	Standard: Überprüft, ob der Feldwert kleiner oder gleich dem Filterwert ist. Der Schlüssel muss mit " <=" enden. Beispielsweise entspricht "Price <=" mit dem Wert 200 Dokumenten, bei denen der Preis kleiner oder gleich 200 ist. Speicher-optimiert: Siehe `<=` (lt eq sign)-Operator.	Standard: `{"id <=": 200}` Speicheroptimierte: `"id <= 200"`
`>`	Standard: Überprüft, ob der Feldwert größer als der Filterwert ist. Der Schlüssel muss mit " >" enden. Beispielsweise entspricht "Preis >" mit dem Wert 200 Dokumenten, bei denen der Preis größer als 200 ist. Speicher-optimiert: Siehe `>` (gt sign)-Operator.	Standard: `{"id >": 200}` Speicheroptimierte: `"id > 200"`
`>=`	Standard: Überprüft, ob der Feldwert größer oder gleich dem Filterwert ist. Der Schlüssel muss mit " >=" enden. Beispielsweise stimmt "Price >=" mit dem Wert 200 mit Dokumenten überein, bei denen der Preis größer oder gleich 200 ist. Speicher-optimiert: Siehe `>=` (gt eq sign)-Operator.	Standard: `{"id >=": 200}` Speicheroptimierte: `"id >= 200"`
`OR`	Standard: Überprüft, ob der Feldwert mit einem der Filterwerte übereinstimmt. Der Schlüssel muss `OR` enthalten, um mehrere Unterschlüssel zu trennen. Beispielsweise entspricht `color1 OR color2` mit wert `["red", "blue"]` Dokumenten, bei denen entweder `color1red` oder `color2blue`ist. Speicheroptimiert: Siehe `or` Operator.	Standard: `{"color1 OR color2": ["red", "blue"]}` Speicheroptimierte: `"color1 = 'red' OR color2 = 'blue'"`
`LIKE`	Standard: Entspricht leerzeichentrennten Token in einer Zeichenfolge. Speicheroptimiert: Siehe `like` Operator.	Siehe Hinweise zur Verwendung von `LIKE`.
Kein Filteroperator angegeben	Standard: Filterüberprüfungen auf eine genaue Übereinstimmung. Wenn mehrere Werte angegeben werden, stimmt sie mit einem der Werte überein. Speicher-optimiert: Siehe `=` (eq sign)-Operator und `in` prädizieren.	Standard: `{"id": 200}{"id": [200, 300]}` Speicheroptimiert: `"id = 200""id IN (200, 300)"`
`to_timestamp` (nur speicheroptimierte Endpunkte)	Speicheroptimiert: Filtern nach einem Zeitstempel. Siehe `to_timestamp` Funktion	Speicheroptimierte: `"date > TO_TIMESTAMP('1995-01-01')"`

Hinweise zur Nutzung von `LIKE`

LIKE Beispiele für Standardendpunkte

{"column LIKE": "apple"}: entspricht den Zeichenfolgen "Apfel" und "Apfelbirne", stimmt aber nicht mit "Ananas" überein. Beachten Sie, dass sie nicht mit "Ananas" übereinstimmt, obwohl sie eine Teilzeichenfolge "Apfel" enthält – es sucht nach einer genauen Übereinstimmung über Leerzeichen getrennte Token wie in "Apfelbirne".

{"column NOT LIKE": "apple"} tut das Gegenteil. Sie entspricht „pineapple” und „pear”, aber nicht „apple” oder „apple pear”.

LIKE Beispiele für speicheroptimierte Endpunkte

Format	Treffer
`"column LIKE 'apple'"`	Entspricht dem `=` Operator. Gibt nur genaue Übereinstimmungen zurück.
`"column LIKE 'apple%'"`	Gibt Zeilen zurück, bei denen ein Präfix übereinstimmt `apple`, z. B `applepie`. .
`"column LIKE '%apple'"`	Gibt Zeilen zurück, bei denen ein Suffix wie `apple` übereinstimmt, z. B. `pineapple`.
`"column LIKE '%apple%'"`	Gibt Zeilen zurück, die eine Teilzeichenfolge aufweisen, die mit `apple` übereinstimmt, z. B. `pineapplecake`.

Code-Beispiele

Python SDK-Standardendpunkt

# Match rows where `title` exactly matches `Athena` or `Ares`
results = index.similarity_search(
    query_text="Greek myths",
    columns=["id", "text"],
    filters={"title": ["Ares", "Athena"]},
    num_results=2
    )

# Match rows where `title` or `id` exactly matches `Athena` or `Ares`
results = index.similarity_search(
    query_text="Greek myths",
    columns=["id", "text"],
    filters={"title OR id": ["Ares", "Athena"]},
    num_results=2
    )

# Match only rows where `title` is not `Hercules`
results = index.similarity_search(
    query_text="Greek myths",
    columns=["id", "text"],
    filters={"title NOT": "Hercules"},
    num_results=2
    )

Python SDK-speicheroptimierter Endpunkt

# Match rows where `title` exactly matches `Athena` or `Ares`
results = index.similarity_search(
    query_text="Greek myths",
    columns=["id", "text"],
    filters='title IN ("Ares", "Athena")',
    num_results=2
    )

# Match rows where `title` or `id` exactly matches `Athena` or `Ares`
results = index.similarity_search(
    query_text="Greek myths",
    columns=["id", "text"],
    filters='title = "Ares" OR id = "Athena"',
    num_results=2
    )

# Match only rows where `title` is not `Hercules`
results = index.similarity_search(
    query_text="Greek myths",
    columns=["id", "text"],
    filters='title != "Hercules"',
    num_results=2
    )

REST API

Weitere Informationen unter POST /api/2.0/vector-search/indexes/{index_name}/query.

Verwenden Sie den Reranker in einer Abfrage

Die Agentleistung hängt vom Abrufen der relevantesten Informationen für eine Abfrage ab. Das Reranking ist eine Technik, die die Abrufqualität verbessert, indem die abgerufenen Dokumente ausgewertet werden, um diejenigen zu identifizieren, die semantisch relevant sind. Databricks hat ein forschungsbasiertes Verbund-KI-System entwickelt, um diese Dokumente zu identifizieren. Sie können auch Spalten mit Metadaten angeben, die der Reranker für zusätzlichen Kontext verwenden soll, da es die Relevanz jedes Dokuments bewertet.

Das Reranking verursacht eine geringe Latenzverzögerung, kann jedoch die Abrufqualität und die Agentleistung erheblich verbessern. Databricks empfiehlt, die Neusortierung für jeden Anwendungsfall eines RAG-Agents auszuprobieren.

Der Vektorsuche-Reranker ist ein Databricks Designated Service, der Databricks Geos zur Verwaltung der Datenresidenz verwendet. Kunden außerhalb der USA und der EU müssen möglicherweise die regionsübergreifende Verarbeitung aktivieren, um den Reranker zu verwenden.

Die Beispiele in diesem Abschnitt zeigen, wie der Vektorsuche-Reranker verwendet wird. Wenn Sie den Reranker verwenden, legen Sie fest, dass die Spalten zurückgegeben werden sollen (columns) und dass die Metadatenspalten separat zur Nutzung für die Neurankung verwendet werden sollen (columns_to_rerank). num_results ist die endgültige Anzahl der zurückzugebenden Ergebnisse. Dies wirkt sich nicht auf die Anzahl der Ergebnisse aus, die für die Reranking verwendet werden.

Die Abfragedebugmeldung enthält Informationen dazu, wie lange der Reranking-Schritt ausgeführt wurde. Beispiel:

'debug_info': {'response_time': 1647.0, 'ann_time': 29.0, 'reranker_time': 1573.0}

Wenn der Reranker-Aufruf fehlschlägt, werden diese Informationen in der Debugmeldung enthalten:

'debug_info': {'response_time': 587.0, 'ann_time': 331.0, 'reranker_time': 246.0, 'warnings': [{'status_code': 'RERANKER_TEMPORARILY_UNAVAILABLE', 'message': 'The reranker is temporarily unavailable. Results returned have not been processed by the reranker. Please try again later for reranked results.'}]}

Hinweis

Die Reihenfolge, in der die Spalten in columns_to_rerank aufgelistet sind, ist wichtig. Die Reranking-Berechnung übernimmt die Spalten in der Reihenfolge, in der sie aufgelistet sind, und berücksichtigt nur die ersten 2000 Zeichen, die sie findet.

Python SDK

# Install the most recent version.
# Databricks SDK version 0.57 or above is required to use the reranker.
%pip install databricks-vectorsearch --force-reinstall
dbutils.library.restartPython()

from databricks.vector_search.reranker import DatabricksReranker

results = index.similarity_search(
    query_text = "How to create a Vector Search index",
    columns = ["id", "text", "parent_doc_summary", "date"],
    num_results = 10,
    query_type = "hybrid",
    reranker=DatabricksReranker(columns_to_rerank=["text", "parent_doc_summary", "other_column"])
    )

REST API

Um sicherzustellen, dass Sie Latenzinformationen erhalten, legen Sie diese auf mindestens 1 fest debug_level .

export TOKEN=...
export INDEX_NAME=...
export WORKSPACE_URL=https://...

curl -X GET -H 'Content-Type: application/json' -H "Authorization: Bearer $TOKEN" --url $WORKSPACE_URL/api/2.0/vector-search/indexes/$INDEX_NAME/query --data '{"num_results": 10, "query_text": "How to create a Vector Search index", "columns": ["id", "text", "parent_doc_summary", "date"], "reranker": {"model": "databricks_reranker",
             "parameters": {
               "columns_to_rerank":
                 ["text", "parent_doc_summary"]
              }
             },
"debug_level": 1}'

Punkt-Nachschlagevorgänge

Verwenden Sie zum Nachschlagen eines Punkts einen Filter für eine beliebige Primärschlüsselspalte.

Abrufalgorithmen

In diesem Abschnitt werden die verschiedenen Abrufalgorithmen oder Abfragetypen und die verwendungsweise beschrieben. Verwenden Sie den query_type Parameter, um den zu verwendenden Abrufalgorithmus anzugeben. Informationen zum automatischen Vergleichen der Leistung verschiedener Algorithmen für Ihren Index finden Sie unter Auswerten der Vektorsuchabrufqualität.

Strategie	So funktioniert es	Am besten geeignet für:
ANN (ungefährer Nachbar)	Sucht mithilfe von Vektoreinbettungen nach semantisch ähnlichen Dokumenten.	Konzeptionelle und semantische Abfragen, bei denen die Bedeutung wichtiger ist als exakte Formulierungen.
Full-text	Stichwortsuche, die mit genauen Begriffen übereinstimmt.	Abfragen mit bestimmten Begriffen, richtigen Substantiven, Produkt-IDs oder technischem Jargon.
Hybrid	Kombiniert ANN- und Volltextergebnisse mit reziprokischer Rangfusion (RRF).	Generalzweck-Abruf. Der empfohlene Ausgangspunkt für die meisten Anwendungsfälle.
Hybrid + Neurangordnung	Führt eine Hybridsuche durch und bewertet dann die Ergebnisse mit einem Cross-Encoder Reranker-Modell neu.	Höhere Genauigkeit, wenn die Latenz (~1,5s zusätzliche pro Abfrage) zulässt.

ANN (Vektorsuche)

DIE ANN-Suche konvertiert eine Abfrage in einen Vektoreinbettung und findet Dokumente, deren Einbettungen am ähnlichsten sind. Dies ist effektiv für das Verständnis der Bedeutung. Beispielsweise stimmt eine Abfrage wie "wie man ein gebrochenes Rohr repariert" mit Dokumenten über Klempnerarbeiten überein, auch wenn sie diese genauen Wörter nicht enthalten.

Wenn ANN gut funktioniert: Abfragen sind konzeptionell, konversationell oder nutzen eine andere Wortwahl als die Dokumente.
Wann ANN möglicherweise nicht optimal funktioniert: Abfragen basieren auf exakten Schlüsselwörtern, Eigennamen oder domänenspezifischer Terminologie, die von Einbettungen nicht genau erfasst werden können.

Volltext (Stichwortsuche)

Die Volltextsuche stimmt mit Dokumenten überein, die die Abfragebegriffe enthalten. Die Volltextsuche hat hohe Genauigkeit. Wenn Benutzer nach bestimmten Namen, Codes oder technischen Begriffen suchen, findet der Stichwortabgleich genaue Treffer, die bei der Vektorsuche möglicherweise fehlen.

Wenn Volltext gut funktioniert: Abfragen enthalten bestimmte Bezeichner, Produktnamen, Fehlercodes oder domänenspezifische Terminologie.
Wenn Volltext möglicherweise nicht optimal funktioniert: Abfragen unterscheiden sich von den Dokumenten oder verwenden Synonyme und Umschreibungen.

Hybridsuche

Die Hybridsuche führt sowohl ANN- als auch Volltextsuchen parallel aus und kombiniert dann die Ergebnisse mithilfe von Reciprocal Rank Fusion (RRF). Dies kombiniert das semantische Verständnis der Vektorsuche mit der Genauigkeit des Stichwortabgleichs.

Wenn die Hybridsuche gut funktioniert: Die Abfrageworkload ist eine Mischung aus konzeptionellen und schlüsselwortintensiven Abfragen. Hybrid ist die robusteste allgemeine Strategie.

Reranker

Der Reranker ist ein optionaler zweiter Pass, der auf jede Strategie angewendet wird. Nach dem anfänglichen Abruf wertet ein Cross-Encoder-Modell jedes Ergebnis im Kontext der Abfrage neu aus, wodurch eine genauere Relevanzordnung erzeugt wird.

Der Reranker verbessert in der Regel die Qualität um ca. 10%, fügt aber Latenz hinzu. Es eignet sich für Anwendungen, bei denen Qualität am wichtigsten ist wie RAG-Chatbots, aber potenziell weniger geeignet für Anwendungen mit hohem Durchsatz und Suchanwendungen mit geringer Latenz.

Feedback

War diese Seite hilfreich?

Last updated on 2026-05-11

Abfragen eines Vektorsuchindex

Installation

Wie man einen Vektorsuchindex abfragt

Python SDK-Standardendpunkt

Python SDK-speicheroptimierter Endpunkt

REST API

SQL

Paginierung

Python SDK

REST API

Verwenden von Filtern für Abfragen

Hinweise zur Nutzung von LIKE

Code-Beispiele

Python SDK-Standardendpunkt

Python SDK-speicheroptimierter Endpunkt

REST API

Verwenden Sie den Reranker in einer Abfrage

Python SDK

REST API

Punkt-Nachschlagevorgänge

Abrufalgorithmen

ANN (Vektorsuche)

Volltext (Stichwortsuche)

Hybridsuche

Reranker

Feedback

Zusätzliche Ressourcen

Hinweise zur Nutzung von `LIKE`