Indexes - Get
Hämtar en indexdefinition.
GET {endpoint}/indexes('{indexName}')?api-version=2026-04-01
URI-parametrar
| Name | I | Obligatorisk | Typ | Description |
|---|---|---|---|---|
|
endpoint
|
path | True |
string (uri) |
Slutpunkts-URL:en för söktjänsten. |
|
index
|
path | True |
string |
Namnet på indexet. |
|
api-version
|
query | True |
string minLength: 1 |
Den API-version som ska användas för den här åtgärden. |
Begärandehuvud
| Name | Obligatorisk | Typ | Description |
|---|---|---|---|
| Accept |
Acceptera-rubriken. |
||
| x-ms-client-request-id |
string (uuid) |
En ogenomskinlig, globalt unik, klientgenererad strängidentifierare för begäran. |
Svar
| Name | Typ | Description |
|---|---|---|
| 200 OK |
Begäran har slutförts. |
|
| Other Status Codes |
Ett oväntat felsvar. |
Säkerhet
api-key
Typ:
apiKey
I:
header
OAuth2Auth
Typ:
oauth2
Flow:
implicit
Auktoriseringswebbadress:
https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Omfattningar
| Name | Description |
|---|---|
| https://search.azure.com/.default |
Exempel
SearchServiceGetIndex
Exempelbegäran
GET https://exampleservice.search.windows.net/indexes('example-index')?api-version=2026-04-01
Exempelsvar
{
"@odata.etag": "0x1234568AE7E58A1",
"name": "example-index",
"description": "description",
"defaultScoringProfile": "stringFieldBoost",
"fields": [
{
"name": "id",
"type": "Edm.String",
"searchable": true,
"filterable": true,
"retrievable": true,
"stored": true,
"sortable": true,
"facetable": true,
"key": true,
"synonymMaps": []
},
{
"name": "vector1",
"type": "Collection(Edm.Single)",
"searchable": true,
"filterable": false,
"retrievable": true,
"stored": true,
"sortable": false,
"facetable": false,
"key": false,
"dimensions": 20,
"vectorSearchProfile": "config1",
"synonymMaps": []
},
{
"name": "vector1b",
"type": "Collection(Edm.Single)",
"searchable": true,
"filterable": false,
"retrievable": true,
"stored": true,
"sortable": false,
"facetable": false,
"key": false,
"dimensions": 10,
"vectorSearchProfile": "config2",
"synonymMaps": []
},
{
"name": "vector2",
"type": "Collection(Edm.Single)",
"searchable": true,
"filterable": false,
"retrievable": true,
"stored": true,
"sortable": false,
"facetable": false,
"key": false,
"dimensions": 5,
"vectorSearchProfile": "config3",
"synonymMaps": []
},
{
"name": "vector3",
"type": "Collection(Edm.Single)",
"searchable": true,
"filterable": false,
"retrievable": true,
"stored": true,
"sortable": false,
"facetable": false,
"key": false,
"dimensions": 5,
"vectorSearchProfile": "config3",
"synonymMaps": []
},
{
"name": "vector22",
"type": "Collection(Edm.Single)",
"searchable": true,
"filterable": false,
"retrievable": true,
"stored": true,
"sortable": false,
"facetable": false,
"key": false,
"dimensions": 10,
"vectorSearchProfile": "config2",
"synonymMaps": []
},
{
"name": "vector4",
"type": "Collection(Edm.Single)",
"searchable": true,
"filterable": false,
"retrievable": true,
"stored": true,
"sortable": false,
"facetable": false,
"key": false,
"dimensions": 32,
"vectorSearchProfile": "config4",
"synonymMaps": []
},
{
"name": "name",
"type": "Edm.String",
"searchable": true,
"filterable": true,
"retrievable": true,
"stored": true,
"sortable": true,
"facetable": true,
"key": false,
"analyzer": "en.lucene",
"synonymMaps": []
},
{
"name": "description",
"type": "Edm.String",
"searchable": true,
"filterable": true,
"retrievable": true,
"stored": true,
"sortable": true,
"facetable": true,
"key": false,
"analyzer": "standard.lucene",
"synonymMaps": []
},
{
"name": "category",
"type": "Edm.String",
"searchable": true,
"filterable": true,
"retrievable": true,
"stored": true,
"sortable": true,
"facetable": true,
"key": false,
"analyzer": "en.lucene",
"synonymMaps": []
},
{
"name": "ownerId",
"type": "Edm.String",
"searchable": true,
"filterable": true,
"retrievable": true,
"stored": true,
"sortable": true,
"facetable": true,
"key": false,
"analyzer": "en.lucene",
"synonymMaps": []
},
{
"name": "price",
"type": "Edm.Double",
"searchable": false,
"filterable": true,
"retrievable": true,
"stored": true,
"sortable": true,
"facetable": true,
"key": false,
"synonymMaps": []
}
],
"scoringProfiles": [
{
"name": "stringFieldBoost",
"functionAggregation": "sum",
"text": {
"weights": {
"name": 3,
"description": 1,
"category": 2,
"ownerId": 1
}
},
"functions": [
{
"fieldName": "category",
"interpolation": "linear",
"type": "tag",
"boost": 2,
"tag": {
"tagsParameter": "categoryTag"
}
}
]
}
],
"corsOptions": {
"allowedOrigins": [
"https://www.example.com/foo"
],
"maxAgeInSeconds": 10
},
"suggesters": [
{
"name": "sg",
"searchMode": "analyzingInfixMatching",
"sourceFields": [
"category",
"ownerId"
]
}
],
"analyzers": [
{
"@odata.type": "#Microsoft.Azure.Search.CustomAnalyzer",
"name": "tagsAnalyzer",
"tokenizer": "standard_v2",
"tokenFilters": [
"common_grams"
],
"charFilters": [
"html_strip"
]
}
],
"normalizers": [
{
"@odata.type": "#Microsoft.Azure.Search.CustomNormalizer",
"name": "my_normalizer",
"tokenFilters": [
"my_tokenFilter"
],
"charFilters": [
"my_mapping"
]
}
],
"tokenizers": [
{
"@odata.type": "#Microsoft.Azure.Search.StandardTokenizerV2",
"name": "my_tokenizer",
"maxTokenLength": 100
}
],
"tokenFilters": [
{
"@odata.type": "#Microsoft.Azure.Search.AsciiFoldingTokenFilter",
"name": "my_tokenFilter",
"preserveOriginal": false
}
],
"charFilters": [
{
"@odata.type": "#Microsoft.Azure.Search.MappingCharFilter",
"name": "my_mapping",
"mappings": [
".=>,",
"_=>-"
]
}
],
"similarity": {
"@odata.type": "#Microsoft.Azure.Search.BM25Similarity",
"k1": 10,
"b": 0.1
},
"semantic": {
"defaultConfiguration": "testconfig",
"configurations": [
{
"name": "testconfig",
"rankingOrder": "BoostedRerankerScore",
"prioritizedFields": {
"titleField": {
"fieldName": "category"
},
"prioritizedContentFields": [
{
"fieldName": "description"
}
],
"prioritizedKeywordsFields": [
{
"fieldName": "ownerId"
}
]
}
}
]
},
"vectorSearch": {
"algorithms": [
{
"name": "cosine",
"kind": "hnsw",
"hnswParameters": {
"metric": "cosine",
"m": 4,
"efConstruction": 400,
"efSearch": 500
}
},
{
"name": "euclidean",
"kind": "hnsw",
"hnswParameters": {
"metric": "euclidean",
"m": 4,
"efConstruction": 400,
"efSearch": 500
}
},
{
"name": "dotProduct",
"kind": "hnsw",
"hnswParameters": {
"metric": "dotProduct",
"m": 4,
"efConstruction": 400,
"efSearch": 500
}
}
],
"profiles": [
{
"name": "config1",
"algorithm": "cosine",
"vectorizer": "openai",
"compression": "mySQ8"
},
{
"name": "config2",
"algorithm": "euclidean",
"vectorizer": "custom-web-api",
"compression": "mySQ8"
},
{
"name": "config3",
"algorithm": "dotProduct",
"vectorizer": "custom-web-api",
"compression": "myBQC"
},
{
"name": "config4",
"algorithm": "dotProduct",
"vectorizer": "custom-web-api",
"compression": "myBQWithoutOriginals"
}
],
"vectorizers": [
{
"name": "openai",
"kind": "azureOpenAI",
"azureOpenAIParameters": {
"resourceUri": "https://test-sample.openai.azure.com",
"deploymentId": "model",
"apiKey": "<redacted>",
"modelName": "text-embedding-3-large"
}
},
{
"name": "custom-web-api",
"kind": "customWebApi",
"customWebApiParameters": {
"httpMethod": "POST",
"uri": "https://my-custom-endpoint.org/",
"timeout": "PT1M",
"authResourceId": "api://f89d1c93-58a7-4b07-9a5b-5f89048b927b",
"httpHeaders": {
"header1": "value1",
"header2": "value2"
},
"authIdentity": {
"@odata.type": "#Microsoft.Azure.Search.DataNoneIdentity"
}
}
},
{
"name": "aml",
"kind": "aml",
"amlParameters": {
"resourceId": "aml resource id",
"region": "aml region",
"uri": "https://my-custom-endpoint.org/",
"timeout": "PT1M",
"modelName": "OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch32"
}
},
{
"name": "aml-cohere",
"kind": "aml",
"amlParameters": {
"resourceId": "aml resource id",
"region": "aml region",
"uri": "https://my-custom-endpoint.org/",
"timeout": "PT1M",
"modelName": "Cohere-embed-v4"
}
}
],
"compressions": [
{
"name": "mySQ8",
"kind": "scalarQuantization",
"truncationDimension": 2,
"scalarQuantizationParameters": {
"quantizedDataType": "int8"
},
"rescoringOptions": {
"enableRescoring": true,
"defaultOversampling": 10,
"rescoreStorageMethod": "preserveOriginals"
}
},
{
"name": "myBQC",
"kind": "binaryQuantization",
"truncationDimension": 2,
"rescoringOptions": {
"enableRescoring": true,
"defaultOversampling": 10,
"rescoreStorageMethod": "preserveOriginals"
}
},
{
"name": "myBQWithoutOriginals",
"kind": "binaryQuantization",
"truncationDimension": 2,
"rescoringOptions": {
"enableRescoring": true,
"defaultOversampling": 10,
"rescoreStorageMethod": "discardOriginals"
}
}
]
}
}
Definitioner
| Name | Description |
|---|---|
| Accept |
Acceptera-rubriken. |
|
AIFoundry |
Namnet på den inbäddningsmodell som kommer att kallas från Azure AI Foundry Catalog. |
| AMLParameters |
Anger egenskaperna för att ansluta till en AML-vektoriserare. |
| AMLVectorizer |
Specificerar en Azure Machine Learning-endpoint som distribueras via Azure AI Foundry Model Catalog för att generera vektorinbäddning av en frågesträng. |
|
Ascii |
Konverterar alfabetiska, numeriska och symboliska Unicode-tecken som inte finns i de första 127 ASCII-tecknen (unicode-blocket basic latin) till deras ASCII-motsvarigheter, om sådana motsvarigheter finns. Det här tokenfiltret implementeras med Apache Lucene. |
|
Azure |
Namnet på Azure Open AI-modellen som ska anropas. |
|
Azure |
Anger den Azure OpenAI-resurs som används för att vektorisera en frågesträng. |
|
Azure |
Anger parametrarna för att ansluta till Azure OpenAI-resursen. |
|
Binary |
Innehåller konfigurationsalternativ som är specifika för den binära kvantiseringskomprimeringsmetod som används vid indexering och frågor. |
|
BM25Similarity |
Rankningsfunktion baserat på Okapi BM25-likhetsalgoritmen. BM25 är en TF-IDF-liknande algoritm som innehåller längdnormalisering (styrs av parametern "b" samt termfrekvensmättnad (styrs av parametern k1). |
|
Char |
Definierar namnen på alla teckenfilter som stöds av sökmotorn. |
|
Cjk |
Bildar bigrams av CJK-termer som genereras från standardtokeniseraren. Det här tokenfiltret implementeras med Apache Lucene. |
|
Cjk |
Skript som kan ignoreras av CjkBigramTokenFilter. |
|
Classic |
Äldre likhetsalgoritm som använder Lucene TFIDFSimilarity-implementeringen av TF-IDF. Den här varianten av TF-IDF introducerar normalisering av statisk dokumentlängd samt koordineringsfaktorer som straffar dokument som endast delvis matchar de sökta frågorna. |
|
Classic |
Grammatikbaserad tokenizer som är lämplig för bearbetning av de flesta europeiska dokument. Den här tokenizern implementeras med Apache Lucene. |
|
Common |
Skapa bigrams för ofta förekommande termer vid indexering. Enkla termer indexeras också, med bigrams överlagrade. Det här tokenfiltret implementeras med Apache Lucene. |
|
Cors |
Definierar alternativ för att styra resursdelning mellan ursprung (CORS) för ett index. |
|
Custom |
Gör att du kan ta kontroll över processen att konvertera text till indexerbara/sökbara token. Det är en användardefinierad konfiguration som består av en enda fördefinierad tokenizer och ett eller flera filter. Tokenizern ansvarar för att dela upp text i token och filter för att ändra token som genereras av tokenizern. |
|
Custom |
Gör att du kan konfigurera normalisering för filterbara, sorterbara och fasettbara fält, som som standard fungerar med strikt matchning. Det här är en användardefinierad konfiguration som består av minst ett eller flera filter som ändrar den token som lagras. |
|
Dictionary |
Sönderdelar sammansatta ord som finns i många germanska språk. Det här tokenfiltret implementeras med Apache Lucene. |
|
Distance |
Definierar en funktion som ökar poängen baserat på avståndet från en geografisk plats. |
|
Distance |
Ger parametervärden till en funktion för avståndsbedömning. |
|
Edge |
Genererar n-gram av de angivna storlekarna med början framifrån eller på baksidan av en indatatoken. Det här tokenfiltret implementeras med Apache Lucene. |
|
Edge |
Anger vilken sida av indata ett n-gram ska genereras från. |
|
Edge |
Genererar n-gram av de angivna storlekarna med början framifrån eller på baksidan av en indatatoken. Det här tokenfiltret implementeras med Apache Lucene. |
|
Edge |
Tokeniserar indata från en kant till n-gram av de angivna storlekarna. Den här tokenizern implementeras med Apache Lucene. |
|
Elision |
Tar bort elisions. Till exempel konverteras "l'avion" (planet) till "avion" (plan). Det här tokenfiltret implementeras med Apache Lucene. |
|
Error |
Ytterligare information om resurshanteringsfelet. |
|
Error |
Felinformationen. |
|
Error |
Vanligt felsvar för alla Azure Resource Manager-API:er för att returnera felinformation för misslyckade åtgärder. (Detta följer även formatet för OData-felsvar.). |
|
Exhaustive |
Innehåller konfigurationsalternativ som är specifika för den fullständiga KNN-algoritmen som används vid frågor, som utför brute-force-sökning i hela vektorindexet. |
|
Exhaustive |
Innehåller parametrarna som är specifika för en fullständig KNN-algoritm. |
|
Freshness |
Definierar en funktion som ökar poängen baserat på värdet för ett datum-tid-fält. |
|
Freshness |
Ger parametervärden till en funktion för färskhetsbedömning. |
|
Hnsw |
Innehåller konfigurationsalternativ som är specifika för algoritmen HNSW för ungefärliga närmaste grannar som används vid indexering och frågor. HNSW-algoritmen erbjuder en justerbar avvägning mellan sökhastighet och noggrannhet. |
|
Hnsw |
Innehåller de parametrar som är specifika för HNSW-algoritmen. |
|
Keep |
Ett tokenfilter som bara behåller token med text i en angiven lista med ord. Det här tokenfiltret implementeras med Apache Lucene. |
|
Keyword |
Markerar termer som nyckelord. Det här tokenfiltret implementeras med Apache Lucene. |
|
Keyword |
Genererar hela indata som en enda token. Den här tokenizern implementeras med Apache Lucene. |
|
Keyword |
Genererar hela indata som en enda token. Den här tokenizern implementeras med Apache Lucene. |
|
Length |
Tar bort ord som är för långa eller för korta. Det här tokenfiltret implementeras med Apache Lucene. |
|
Lexical |
Definierar namnen på alla textanalysverktyg som stöds av sökmotorn. |
|
Lexical |
Definierar namnen på alla textnormaliserare som stöds av sökmotorn. |
|
Lexical |
Definierar namnen på alla tokeniserare som stöds av sökmotorn. |
|
Limit |
Begränsar antalet token vid indexering. Det här tokenfiltret implementeras med Apache Lucene. |
|
Lucene |
Apache Lucene-analysverktyg av standardstandard; Består av standardtokeniseraren, gemener och stoppfilter. |
|
Lucene |
Bryter text efter Unicode-reglerna för textsegmentering. Den här tokenizern implementeras med Apache Lucene. |
|
Lucene |
Bryter text efter Unicode-reglerna för textsegmentering. Den här tokenizern implementeras med Apache Lucene. |
|
Magnitude |
Definierar en funktion som ökar poängen baserat på storleken på ett numeriskt fält. |
|
Magnitude |
Ger parametervärden till en bedömningsfunktion för magnituden. |
|
Mapping |
Ett teckenfilter som tillämpar mappningar som definierats med alternativet mappningar. Matchningen är girig (längst mönstermatchning vid en given poäng vinner). Ersättning tillåts vara den tomma strängen. Det här teckenfiltret implementeras med Apache Lucene. |
|
Microsoft |
Delar upp text med hjälp av språkspecifika regler och reducerar ord till deras basformulär. |
|
Microsoft |
Delar upp text med hjälp av språkspecifika regler. |
|
Microsoft |
Listar de språk som stöds av Microsoft language stemming tokenizer. |
|
Microsoft |
Listar de språk som stöds av Microsoft språktokenizer. |
|
NGram |
Genererar n-gram av de angivna storlekarna. Det här tokenfiltret implementeras med Apache Lucene. |
|
NGram |
Genererar n-gram av de angivna storlekarna. Det här tokenfiltret implementeras med Apache Lucene. |
|
NGram |
Tokeniserar indata till n-gram av de angivna storlekarna. Den här tokenizern implementeras med Apache Lucene. |
|
Path |
Tokenizer för sökvägsliknande hierarkier. Den här tokenizern implementeras med Apache Lucene. |
|
Pattern |
Flexibelt delar upp texten i termer med hjälp av ett reguljärt uttrycksmönster. Den här analysatorn implementeras med Apache Lucene. |
|
Pattern |
Använder Java-regexer för att generera flera token – en för varje insamlingsgrupp i ett eller flera mönster. Det här tokenfiltret implementeras med Apache Lucene. |
|
Pattern |
Ett teckenfilter som ersätter tecken i indatasträngen. Det använder ett reguljärt uttryck för att identifiera teckensekvenser som ska bevaras och ett ersättningsmönster för att identifiera tecken som ska ersättas. Om du till exempel får indatatexten "aa bb aa bb", mönstret "(aa)\s+(bb)" och ersättningen "$1#$2" blir resultatet "aa#bb aa#bb". Det här teckenfiltret implementeras med Apache Lucene. |
|
Pattern |
Ett teckenfilter som ersätter tecken i indatasträngen. Det använder ett reguljärt uttryck för att identifiera teckensekvenser som ska bevaras och ett ersättningsmönster för att identifiera tecken som ska ersättas. Om du till exempel får indatatexten "aa bb aa bb", mönstret "(aa)\s+(bb)" och ersättningen "$1#$2" blir resultatet "aa#bb aa#bb". Det här tokenfiltret implementeras med Apache Lucene. |
|
Pattern |
Tokenizer som använder regex-mönstermatchning för att konstruera distinkta token. Den här tokenizern implementeras med Apache Lucene. |
|
Phonetic |
Identifierar vilken typ av fonetisk kodare som ska användas med en PhoneticTokenFilter. |
|
Phonetic |
Skapa token för fonetiska matchningar. Det här tokenfiltret implementeras med Apache Lucene. |
|
Ranking |
Representerar poäng som ska användas för sorteringsordning för dokument. |
|
Rescoring |
Innehåller alternativ för omskolning. |
|
Scalar |
Innehåller konfigurationsalternativ som är specifika för den skalära kvantiseringskomprimeringsmetod som används vid indexering och frågor. |
|
Scalar |
Innehåller de parametrar som är specifika för Scalar Quantization. |
|
Scoring |
Definierar den aggregeringsfunktion som används för att kombinera resultaten av alla bedömningsfunktioner i en bedömningsprofil. |
|
Scoring |
Definierar den funktion som används för att interpolera poängökning i en rad dokument. |
|
Scoring |
Definierar parametrar för ett sökindex som påverkar bedömning i sökfrågor. |
|
Search |
Representerar ett fält i en indexdefinition som beskriver namn, datatyp och sökbeteende för ett fält. |
|
Search |
Definierar datatypen för ett fält i ett sökindex. |
|
Search |
Representerar en sökindexdefinition som beskriver fälten och sökbeteendet för ett index. |
|
Search |
Rensar identitetsegenskapen för en datakälla. |
|
Search |
Anger identiteten för en datakälla som ska användas. |
|
Search |
En kundhanterad krypteringsnyckel i Azure Key Vault. Nycklar som du skapar och hanterar kan användas för att kryptera eller dekryptera vilande data, till exempel index och synonymmappningar. |
|
Search |
Definierar hur Api för förslag ska tillämpas på en grupp fält i indexet. |
|
Semantic |
Definierar en specifik konfiguration som ska användas i samband med semantiska funktioner. |
|
Semantic |
Ett fält som används som en del av den semantiska konfigurationen. |
|
Semantic |
Beskriver fälten rubrik, innehåll och nyckelord som ska användas för semantisk rangordning, undertexter, markeringar och svar. |
|
Semantic |
Definierar parametrar för ett sökindex som påverkar semantiska funktioner. |
|
Shingle |
Skapar kombinationer av tokens till en enda token. Det här tokenfiltret implementeras med Apache Lucene. |
|
Snowball |
Ett filter som stjälkar ord med hjälp av en Snowball-genererad stemmer. Det här tokenfiltret implementeras med Apache Lucene. |
|
Snowball |
Det språk som ska användas för ett Snowball-tokenfilter. |
|
Stemmer |
Ger möjlighet att åsidosätta andra härdningsfilter med anpassad ordlistebaserad härdning. Ordlisteskaftade termer markeras som nyckelord så att de inte kommer att stoppas med stemmers längre ned i kedjan. Måste placeras före eventuella härdningsfilter. Det här tokenfiltret implementeras med Apache Lucene. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/StemmerOverrideFilter.html |
|
Stemmer |
Språkspecifikt härdningsfilter. Det här tokenfiltret implementeras med Apache Lucene. Se https://dotnet.territoriali.olinfo.it/rest/api/searchservice/Custom-analyzers-in-Azure-Search#TokenFilters |
|
Stemmer |
Det språk som ska användas för ett stemmer-tokenfilter. |
|
Stop |
Delar upp text med icke-bokstäver; Tillämpar filter för gemener och stoppordstoken. Den här analysatorn implementeras med Apache Lucene. |
|
Stopwords |
Identifierar en fördefinierad lista med språkspecifika stoppord. |
|
Stopwords |
Tar bort stoppord från en tokenström. Det här tokenfiltret implementeras med Apache Lucene. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopFilter.html |
|
Synonym |
Matchar synonymer med en eller flera ord i en tokenström. Det här tokenfiltret implementeras med Apache Lucene. |
|
Tag |
Definierar en funktion som ökar antalet dokument med strängvärden som matchar en viss lista med taggar. |
|
Tag |
Ger parametervärden till en taggbedömningsfunktion. |
|
Text |
Definierar vikter för indexfält för vilka matchningar ska öka poängsättningen i sökfrågor. |
|
Token |
Representerar klasser av tecken som ett tokenfilter kan användas på. |
|
Token |
Definierar namnen på alla tokenfilter som stöds av sökmotorn. |
|
Truncate |
Trunkerar termerna till en viss längd. Det här tokenfiltret implementeras med Apache Lucene. |
|
Uax |
Tokeniserar URL:er och e-postmeddelanden som en token. Den här tokenizern implementeras med Apache Lucene. |
|
Unique |
Filtrerar bort token med samma text som föregående token. Det här tokenfiltret implementeras med Apache Lucene. |
|
Vector |
Kodningsformatet för tolkning av vektorfältinnehåll. |
|
Vector |
Innehåller konfigurationsalternativ som rör vektorsökning. |
|
Vector |
Algoritmen som används för indexering och frågor. |
|
Vector |
Likhetsmåttet som ska användas för vektorjämförelser. Vi rekommenderar att du väljer samma likhetsmått som inbäddningsmodellen tränades på. |
|
Vector |
Den komprimeringsmetod som används för indexering och frågor. |
|
Vector |
Den kvantiserade datatypen för komprimerade vektorvärden. |
|
Vector |
Definierar en kombination av konfigurationer som ska användas med vektorsökning. |
|
Vector |
Den vektoriseringsmetod som ska användas under frågetiden. |
|
Web |
Anger en användardefinierad vektoriserare för att generera vektorbäddning av en frågesträng. Integrering av en extern vektoriserare uppnås med hjälp av det anpassade webb-API-gränssnittet för en kompetensuppsättning. |
|
Web |
Anger egenskaperna för att ansluta till en användardefinierad vektoriserare. |
|
Word |
Delar upp ord i underord och utför valfria transformeringar i underordsgrupper. Det här tokenfiltret implementeras med Apache Lucene. |
Accept
Acceptera-rubriken.
| Värde | Description |
|---|---|
| application/json;odata.metadata=minimal |
AIFoundryModelCatalogName
Namnet på den inbäddningsmodell som kommer att kallas från Azure AI Foundry Catalog.
| Värde | Description |
|---|---|
| OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch32 |
OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch32 |
| OpenAI-CLIP-Image-Text-Embeddings-ViT-Large-Patch14-336 |
OpenAI-CLIP-Image-Text-Embeddings-ViT-Large-Patch14-336 |
| Facebook-DinoV2-Image-Embeddings-ViT-Base |
Facebook-DinoV2-bildinbäddningar-ViT-Base |
| Facebook-DinoV2-Image-Embeddings-ViT-Giant |
Facebook-DinoV2-Bildinbäddningar-ViT-Giant |
| Cohere-embed-v3-english |
Cohere-embed-v3-english |
| Cohere-embed-v3-multilingual |
Cohere-embed-v3-multilingual |
| Cohere-embed-v4 |
Cohere embed v4-modell för att generera inbäddningar från både text och bilder. |
AMLParameters
Anger egenskaperna för att ansluta till en AML-vektoriserare.
| Name | Typ | Description |
|---|---|---|
| key |
string |
(Krävs för nyckelautentisering) Nyckeln för AML-tjänsten. |
| modelName |
Namnet på inbäddningsmodellen från Azure AI Foundry Catalog som distribueras vid den tillhandahållna slutpunkten. |
|
| region |
string |
(Valfritt för tokenautentisering). Den region som AML-tjänsten distribueras i. |
| resourceId |
string |
(Krävs för tokenautentisering). Azure Resource Manager-resurs-ID för AML-tjänsten. Det borde vara i formatet subscriptions/{guid}/resourceGroups/{resource-group-name}/Microsoft. MachineLearningServices/workspaces/{workspace-name}/services/{service_name}. |
| timeout |
string (duration) |
(Valfritt) När det anges anger du tidsgränsen för http-klienten som gör API-anropet. |
| uri |
string (uri) |
(Krävs för ingen autentisering eller nyckelautentisering) Bedömnings-URI för AML-tjänsten som JSON-nyttolasten ska skickas till. Endast https-URI-schemat tillåts. |
AMLVectorizer
Specificerar en Azure Machine Learning-endpoint som distribueras via Azure AI Foundry Model Catalog för att generera vektorinbäddning av en frågesträng.
| Name | Typ | Description |
|---|---|---|
| amlParameters |
Anger egenskaperna för AML-vektoriseraren. |
|
| kind |
string:
aml |
Typ av VectorSearchVectorizer. |
| name |
string |
Namnet som ska associeras med den här specifika vektoriseringsmetoden. |
AsciiFoldingTokenFilter
Konverterar alfabetiska, numeriska och symboliska Unicode-tecken som inte finns i de första 127 ASCII-tecknen (unicode-blocket basic latin) till deras ASCII-motsvarigheter, om sådana motsvarigheter finns. Det här tokenfiltret implementeras med Apache Lucene.
| Name | Typ | Standardvärde | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
|
| name |
string |
Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
|
| preserveOriginal |
boolean |
False |
Ett värde som anger om den ursprungliga token ska behållas. Standardvärdet är false. |
AzureOpenAIModelName
Namnet på Azure Open AI-modellen som ska anropas.
| Värde | Description |
|---|---|
| text-embedding-ada-002 |
TextEmbeddingAda002-modellen. |
| text-embedding-3-large |
TextEmbedding3Stor modell. |
| text-embedding-3-small |
TextEmbedding3Small-modellen. |
| gpt-5-mini |
Gpt5Mini-modell. |
| gpt-5-nano |
Gpt5Nano-modellen. |
| gpt-5.4-mini |
Gpt54Mini-modell. |
| gpt-5.4-nano |
Gpt54Nano-modellen. |
AzureOpenAIVectorizer
Anger den Azure OpenAI-resurs som används för att vektorisera en frågesträng.
| Name | Typ | Description |
|---|---|---|
| azureOpenAIParameters |
Innehåller de parametrar som är specifika för Azure OpenAI-inbäddningsvektorisering. |
|
| kind |
string:
azure |
Typ av VectorSearchVectorizer. |
| name |
string |
Namnet som ska associeras med den här specifika vektoriseringsmetoden. |
AzureOpenAIVectorizerParameters
Anger parametrarna för att ansluta till Azure OpenAI-resursen.
| Name | Typ | Description |
|---|---|---|
| apiKey |
string |
API-nyckeln för den avsedda Azure OpenAI-resursen. |
| authIdentity | SearchIndexerDataIdentity: |
Den användartilldelade hanterade identiteten som används för utgående anslutningar. |
| deploymentId |
string |
ID för Azure OpenAI-modelldistributionen på den avsedda resursen. |
| modelName |
Namnet på den inbäddningsmodell som distribueras på den angivna deploymentId-sökvägen. |
|
| resourceUri |
string (uri) |
Resurs-URI för Azure OpenAI-resursen. |
BinaryQuantizationCompression
Innehåller konfigurationsalternativ som är specifika för den binära kvantiseringskomprimeringsmetod som används vid indexering och frågor.
| Name | Typ | Description |
|---|---|---|
| kind |
string:
binary |
Typ av VectorSearchKompression. |
| name |
string |
Namnet som ska associeras med den här konfigurationen. |
| rescoringOptions |
Innehåller alternativ för omskolning. |
|
| truncationDimension |
integer (int32) |
Antalet dimensioner som vektorerna ska trunkeras till. Om du trunkerar vektorerna minskar storleken på vektorerna och mängden data som måste överföras under sökningen. Detta kan spara lagringskostnader och förbättra sökprestanda på bekostnad av återkallande. Den bör endast användas för inbäddningar som tränats med Matryoshka Representation Learning (MRL) som OpenAI textinbäddning-3-large (liten). Standardvärdet är null, vilket innebär ingen trunkering. |
BM25SimilarityAlgorithm
Rankningsfunktion baserat på Okapi BM25-likhetsalgoritmen. BM25 är en TF-IDF-liknande algoritm som innehåller längdnormalisering (styrs av parametern "b" samt termfrekvensmättnad (styrs av parametern k1).
| Name | Typ | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
| b |
number (double) |
Den här egenskapen styr hur längden på ett dokument påverkar relevanspoängen. Som standard används värdet 0,75. Värdet 0,0 innebär att ingen längdnormalisering tillämpas, medan värdet 1,0 innebär att poängen normaliseras helt av dokumentets längd. |
| k1 |
number (double) |
Den här egenskapen styr skalningsfunktionen mellan termfrekvensen för varje matchande termer och den slutliga relevanspoängen för ett dokumentfrågepar. Som standard används värdet 1.2. Värdet 0,0 innebär att poängen inte skalas med en ökning av termfrekvensen. |
CharFilterName
Definierar namnen på alla teckenfilter som stöds av sökmotorn.
| Värde | Description |
|---|---|
| html_strip |
Ett teckenfilter som försöker ta bort HTML-konstruktioner. Se https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/charfilter/HTMLStripCharFilter.html |
CjkBigramTokenFilter
Bildar bigrams av CJK-termer som genereras från standardtokeniseraren. Det här tokenfiltret implementeras med Apache Lucene.
| Name | Typ | Standardvärde | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
|
| ignoreScripts |
Skripten som ska ignoreras. |
||
| name |
string |
Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
|
| outputUnigrams |
boolean |
False |
Ett värde som anger om både unigram och bigrams ska matas ut (om de är sanna) eller bara bigrams (om de är falska). Standardvärdet är false. |
CjkBigramTokenFilterScripts
Skript som kan ignoreras av CjkBigramTokenFilter.
| Värde | Description |
|---|---|
| han |
Ignorera Han-skript när du skapar bigram av CJK-termer. |
| hiragana |
Ignorera hiragana-skrift när du bildar bigram av CJK-termer. |
| katakana |
Ignorera Katakana-skrift när du skapar bigram av CJK-termer. |
| hangul |
Ignorera Hangul-skrift när du bildar bigram av CJK-termer. |
ClassicSimilarityAlgorithm
Äldre likhetsalgoritm som använder Lucene TFIDFSimilarity-implementeringen av TF-IDF. Den här varianten av TF-IDF introducerar normalisering av statisk dokumentlängd samt koordineringsfaktorer som straffar dokument som endast delvis matchar de sökta frågorna.
| Name | Typ | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
ClassicTokenizer
Grammatikbaserad tokenizer som är lämplig för bearbetning av de flesta europeiska dokument. Den här tokenizern implementeras med Apache Lucene.
| Name | Typ | Standardvärde | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
|
| maxTokenLength |
integer (int32) maximum: 300 |
255 |
Maximal tokenlängd. Standardvärdet är 255. Token som är längre än den maximala längden delas upp. Den maximala tokenlängden som kan användas är 300 tecken. |
| name |
string |
Namnet på tokenizern. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
CommonGramTokenFilter
Skapa bigrams för ofta förekommande termer vid indexering. Enkla termer indexeras också, med bigrams överlagrade. Det här tokenfiltret implementeras med Apache Lucene.
| Name | Typ | Standardvärde | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
|
| commonWords |
string[] |
Uppsättningen vanliga ord. |
|
| ignoreCase |
boolean |
False |
Ett värde som anger om vanliga ord som matchar är skiftlägesokänsliga. Standardvärdet är false. |
| name |
string |
Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
|
| queryMode |
boolean |
False |
Ett värde som anger om tokenfiltret är i frågeläge. I frågeläge genererar tokenfiltret bigrams och tar sedan bort vanliga ord och enkla termer följt av ett vanligt ord. Standardvärdet är false. |
CorsOptions
Definierar alternativ för att styra resursdelning mellan ursprung (CORS) för ett index.
| Name | Typ | Description |
|---|---|---|
| allowedOrigins |
string[] |
Listan över ursprung som JavaScript-koden ska beviljas åtkomst till ditt index från. Kan innehålla en lista över värdar i formatet {protocol}://{fully-qualified-domain-name}[:{port#}], eller en enda "*" för att tillåta alla ursprung (rekommenderas inte). |
| maxAgeInSeconds |
integer (int64) |
Den varaktighet under vilken webbläsare ska cachelagra CORS-preflight-svar. Standardvärdet är 5 minuter. |
CustomAnalyzer
Gör att du kan ta kontroll över processen att konvertera text till indexerbara/sökbara token. Det är en användardefinierad konfiguration som består av en enda fördefinierad tokenizer och ett eller flera filter. Tokenizern ansvarar för att dela upp text i token och filter för att ändra token som genereras av tokenizern.
| Name | Typ | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
| charFilters |
En lista över teckenfilter som används för att förbereda indatatext innan den bearbetas av tokeniseraren. De kan till exempel ersätta vissa tecken eller symboler. Filtren körs i den ordning de visas. |
|
| name |
string |
Namnet på analysatorn. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
| tokenFilters |
En lista över tokenfilter som används för att filtrera bort eller ändra de token som genereras av en tokeniserare. Du kan till exempel ange ett filter för gemener som konverterar alla tecken till gemener. Filtren körs i den ordning de visas. |
|
| tokenizer |
Namnet på tokeniseraren som ska användas för att dela upp kontinuerlig text i en sekvens med token, till exempel att dela upp en mening i ord. |
CustomNormalizer
Gör att du kan konfigurera normalisering för filterbara, sorterbara och fasettbara fält, som som standard fungerar med strikt matchning. Det här är en användardefinierad konfiguration som består av minst ett eller flera filter som ändrar den token som lagras.
| Name | Typ | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
| charFilters |
En lista över teckenfilter som används för att förbereda indatatext innan den bearbetas. De kan till exempel ersätta vissa tecken eller symboler. Filtren körs i den ordning de visas. |
|
| name |
string |
Namnet på teckenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
| tokenFilters |
En lista över tokenfilter som används för att filtrera bort eller ändra indatatoken. Du kan till exempel ange ett filter för gemener som konverterar alla tecken till gemener. Filtren körs i den ordning de visas. |
DictionaryDecompounderTokenFilter
Sönderdelar sammansatta ord som finns i många germanska språk. Det här tokenfiltret implementeras med Apache Lucene.
| Name | Typ | Standardvärde | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
|
| maxSubwordSize |
integer (int32) maximum: 300 |
15 |
Den maximala underordsstorleken. Endast underord som är kortare än detta matas ut. Standardvärdet är 15. Maxvärdet är 300. |
| minSubwordSize |
integer (int32) maximum: 300 |
2 |
Minsta underordsstorlek. Endast underord som är längre än detta matas ut. Standardvärdet är 2. Maxvärdet är 300. |
| minWordSize |
integer (int32) maximum: 300 |
5 |
Minsta ordstorlek. Endast ord som är längre än detta bearbetas. Standardvärdet är 5. Maxvärdet är 300. |
| name |
string |
Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
|
| onlyLongestMatch |
boolean |
False |
Ett värde som anger om du bara vill lägga till det längsta matchande underordet i utdata. Standardvärdet är false. |
| wordList |
string[] |
Listan med ord som ska matchas mot. |
DistanceScoringFunction
Definierar en funktion som ökar poängen baserat på avståndet från en geografisk plats.
| Name | Typ | Description |
|---|---|---|
| boost |
number (double) |
En multiplikator för råpoängen. Måste vara ett positivt tal som inte är lika med 1,0. |
| distance |
Parametervärden för funktionen för avståndsbedömning. |
|
| fieldName |
string |
Namnet på fältet som används som indata till bedömningsfunktionen. |
| interpolation |
Ett värde som anger hur ökning kommer att interpoleras mellan dokumentpoäng. standardvärdet "Linjär". |
|
| type |
string:
distance |
Typ av poängfunktion. |
DistanceScoringParameters
Ger parametervärden till en funktion för avståndsbedömning.
| Name | Typ | Description |
|---|---|---|
| boostingDistance |
number (double) |
Avståndet i kilometer från referensplatsen där förstärkningsområdet slutar. |
| referencePointParameter |
string |
Namnet på parametern som skickas i sökfrågor för att ange referensplatsen. |
EdgeNGramTokenFilter
Genererar n-gram av de angivna storlekarna med början framifrån eller på baksidan av en indatatoken. Det här tokenfiltret implementeras med Apache Lucene.
| Name | Typ | Standardvärde | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
|
| maxGram |
integer (int32) |
2 |
Den maximala n-gramlängden. Standardvärdet är 2. |
| minGram |
integer (int32) |
1 |
Minsta n-gramlängd. Standard är 1. Måste vara mindre än värdet för maxGram. |
| name |
string |
Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
|
| side | front |
Anger vilken sida av indata n-grammet ska genereras från. Standard är "front". |
EdgeNGramTokenFilterSide
Anger vilken sida av indata ett n-gram ska genereras från.
| Värde | Description |
|---|---|
| front |
Anger att n-grammet ska genereras från indatans framsida. |
| back |
Anger att n-grammet ska genereras från baksidan av indata. |
EdgeNGramTokenFilterV2
Genererar n-gram av de angivna storlekarna med början framifrån eller på baksidan av en indatatoken. Det här tokenfiltret implementeras med Apache Lucene.
| Name | Typ | Standardvärde | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
|
| maxGram |
integer (int32) maximum: 300 |
2 |
Den maximala n-gramlängden. Standardvärdet är 2. Maxvärdet är 300. |
| minGram |
integer (int32) maximum: 300 |
1 |
Minsta n-gramlängd. Standard är 1. Maxvärdet är 300. Måste vara mindre än värdet för maxGram. |
| name |
string |
Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
|
| side | front |
Anger vilken sida av indata n-grammet ska genereras från. Standard är "front". |
EdgeNGramTokenizer
Tokeniserar indata från en kant till n-gram av de angivna storlekarna. Den här tokenizern implementeras med Apache Lucene.
| Name | Typ | Standardvärde | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
|
| maxGram |
integer (int32) maximum: 300 |
2 |
Den maximala n-gramlängden. Standardvärdet är 2. Maxvärdet är 300. |
| minGram |
integer (int32) maximum: 300 |
1 |
Minsta n-gramlängd. Standard är 1. Maxvärdet är 300. Måste vara mindre än värdet för maxGram. |
| name |
string |
Namnet på tokenizern. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
|
| tokenChars |
Teckenklasser som ska behållas i token. |
ElisionTokenFilter
Tar bort elisions. Till exempel konverteras "l'avion" (planet) till "avion" (plan). Det här tokenfiltret implementeras med Apache Lucene.
| Name | Typ | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
| articles |
string[] |
Den uppsättning artiklar som ska tas bort. |
| name |
string |
Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
ErrorAdditionalInfo
Ytterligare information om resurshanteringsfelet.
| Name | Typ | Description |
|---|---|---|
| info |
Den ytterligare informationen. |
|
| type |
string |
Typen av ytterligare information. |
ErrorDetail
Felinformationen.
| Name | Typ | Description |
|---|---|---|
| additionalInfo |
Felet ytterligare information. |
|
| code |
string |
Felkoden. |
| details |
Felinformationen. |
|
| message |
string |
Felmeddelandet. |
| target |
string |
Felmålet. |
ErrorResponse
Vanligt felsvar för alla Azure Resource Manager-API:er för att returnera felinformation för misslyckade åtgärder. (Detta följer även formatet för OData-felsvar.).
| Name | Typ | Description |
|---|---|---|
| error |
Felet objektet. |
ExhaustiveKnnAlgorithmConfiguration
Innehåller konfigurationsalternativ som är specifika för den fullständiga KNN-algoritmen som används vid frågor, som utför brute-force-sökning i hela vektorindexet.
| Name | Typ | Description |
|---|---|---|
| exhaustiveKnnParameters |
Innehåller parametrarna som är specifika för en fullständig KNN-algoritm. |
|
| kind |
string:
exhaustive |
Typ av VectorSearchAlgorithmConfiguration. |
| name |
string |
Namnet som ska associeras med den här konfigurationen. |
ExhaustiveKnnParameters
Innehåller parametrarna som är specifika för en fullständig KNN-algoritm.
| Name | Typ | Description |
|---|---|---|
| metric |
Likhetsmåttet som ska användas för vektorjämförelser. |
FreshnessScoringFunction
Definierar en funktion som ökar poängen baserat på värdet för ett datum-tid-fält.
| Name | Typ | Description |
|---|---|---|
| boost |
number (double) |
En multiplikator för råpoängen. Måste vara ett positivt tal som inte är lika med 1,0. |
| fieldName |
string |
Namnet på fältet som används som indata till bedömningsfunktionen. |
| freshness |
Parametervärden för funktionen för färskhetsbedömning. |
|
| interpolation |
Ett värde som anger hur ökning kommer att interpoleras mellan dokumentpoäng. standardvärdet "Linjär". |
|
| type |
string:
freshness |
Typ av poängfunktion. |
FreshnessScoringParameters
Ger parametervärden till en funktion för färskhetsbedömning.
| Name | Typ | Description |
|---|---|---|
| boostingDuration |
string (duration) |
Förfalloperioden efter vilken förstärkningen stoppas för ett visst dokument. |
HnswAlgorithmConfiguration
Innehåller konfigurationsalternativ som är specifika för algoritmen HNSW för ungefärliga närmaste grannar som används vid indexering och frågor. HNSW-algoritmen erbjuder en justerbar avvägning mellan sökhastighet och noggrannhet.
| Name | Typ | Description |
|---|---|---|
| hnswParameters |
Innehåller de parametrar som är specifika för HNSW-algoritmen. |
|
| kind |
string:
hnsw |
Typ av VectorSearchAlgorithmConfiguration. |
| name |
string |
Namnet som ska associeras med den här konfigurationen. |
HnswParameters
Innehåller de parametrar som är specifika för HNSW-algoritmen.
| Name | Typ | Standardvärde | Description |
|---|---|---|---|
| efConstruction |
integer (int32) minimum: 100maximum: 1000 |
400 |
Storleken på den dynamiska listan som innehåller de närmaste grannarna, som används under indexeringstiden. Om du ökar den här parametern kan indexkvaliteten förbättras på bekostnad av ökad indexeringstid. Vid en viss punkt leder en ökning av denna parameter till minskande avkastning. |
| efSearch |
integer (int32) minimum: 100maximum: 1000 |
500 |
Storleken på den dynamiska listan som innehåller de närmaste grannarna, som används under söktiden. Om du ökar den här parametern kan sökresultaten förbättras på bekostnad av långsammare sökning. Vid en viss punkt leder en ökning av denna parameter till minskande avkastning. |
| m |
integer (int32) minimum: 4maximum: 10 |
4 |
Antalet dubbelriktade länkar som skapas för varje nytt element under konstruktionen. Att öka det här parametervärdet kan förbättra träffsäkerheten och minska hämtningstiderna för datauppsättningar med hög inneboende dimensionalitet på bekostnad av ökad minnesförbrukning och längre indexeringstid. |
| metric |
Likhetsmåttet som ska användas för vektorjämförelser. |
KeepTokenFilter
Ett tokenfilter som bara behåller token med text i en angiven lista med ord. Det här tokenfiltret implementeras med Apache Lucene.
| Name | Typ | Standardvärde | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
|
| keepWords |
string[] |
Listan med ord att behålla. |
|
| keepWordsCase |
boolean |
False |
Ett värde som anger om alla ord ska sänkas först. Standardvärdet är false. |
| name |
string |
Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
KeywordMarkerTokenFilter
Markerar termer som nyckelord. Det här tokenfiltret implementeras med Apache Lucene.
| Name | Typ | Standardvärde | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
|
| ignoreCase |
boolean |
False |
Ett värde som anger om skiftläge ska ignoreras. Om sant konverteras alla ord till gemener först. Standardvärdet är false. |
| keywords |
string[] |
En lista med ord som ska markeras som nyckelord. |
|
| name |
string |
Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
KeywordTokenizer
Genererar hela indata som en enda token. Den här tokenizern implementeras med Apache Lucene.
| Name | Typ | Standardvärde | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
|
| bufferSize |
integer (int32) |
256 |
Storleken på läsbufferten i byte. Standardvärdet är 256. |
| name |
string |
Namnet på tokenizern. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
KeywordTokenizerV2
Genererar hela indata som en enda token. Den här tokenizern implementeras med Apache Lucene.
| Name | Typ | Standardvärde | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
|
| maxTokenLength |
integer (int32) maximum: 300 |
256 |
Maximal tokenlängd. Standardvärdet är 256. Token som är längre än den maximala längden delas upp. Den maximala tokenlängden som kan användas är 300 tecken. |
| name |
string |
Namnet på tokenizern. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
LengthTokenFilter
Tar bort ord som är för långa eller för korta. Det här tokenfiltret implementeras med Apache Lucene.
| Name | Typ | Standardvärde | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
|
| max |
integer (int32) maximum: 300 |
300 |
Maximal längd på tecken. Standard och max är 300. |
| min |
integer (int32) maximum: 300 |
0 |
Minsta längd i tecken. Standardvärdet är 0. Maxvärdet är 300. Måste vara mindre än värdet för max. |
| name |
string |
Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
LexicalAnalyzerName
Definierar namnen på alla textanalysverktyg som stöds av sökmotorn.
| Värde | Description |
|---|---|
| ar.microsoft |
Microsoft-analysator för arabiska. |
| ar.lucene |
Lucene-analysator för arabiska. |
| hy.lucene |
Lucene-analysator för armeniska. |
| bn.microsoft |
Microsoft-analysator för bangla. |
| eu.lucene |
Lucene analysator för baskiska. |
| bg.microsoft |
Microsoft analyzer för bulgariska. |
| bg.lucene |
Lucene-analysator för bulgariska. |
| ca.microsoft |
Microsoft-analysator för katalanska. |
| ca.lucene |
Lucene-analysator för katalanska. |
| zh-Hans.microsoft |
Microsoft-analysator för kinesiska (förenklad). |
| zh-Hans.lucene |
Lucene-analysator för kinesiska (förenklad). |
| zh-Hant.microsoft |
Microsoft-analysator för kinesiska (traditionella). |
| zh-Hant.lucene |
Lucene-analysator för kinesiska (traditionell). |
| hr.microsoft |
Microsoft analyzer för kroatiska. |
| cs.microsoft |
Microsoft-analysator för tjeckiska. |
| cs.lucene |
Lucene-analysator för tjeckiska. |
| da.microsoft |
Microsoft-analysator för danska. |
| da.lucene |
Lucene-analysator för danska. |
| nl.microsoft |
Microsoft-analysator för nederländska. |
| nl.lucene |
Lucene-analysator för nederländska. |
| en.microsoft |
Microsoft-analysator för engelska. |
| en.lucene |
Lucene-analysator för engelska. |
| et.microsoft |
Microsoft analyzer för estniska. |
| fi.microsoft |
Microsoft-analysator för finska. |
| fi.lucene |
Lucene-analysator för finska. |
| fr.microsoft |
Microsoft-analysator för franska. |
| fr.lucene |
Lucene-analysator för franska. |
| gl.lucene |
Lucene-analysator för galiciska. |
| de.microsoft |
Microsoft-analysator för tyska. |
| de.lucene |
Lucene-analysator för tyska. |
| el.microsoft |
Microsoft-analysator för Grekiska. |
| el.lucene |
Lucene-analysator för grekiska. |
| gu.microsoft |
Microsoft-analysator för gujarati. |
| he.microsoft |
Microsoft-analysator för hebreiska. |
| hi.microsoft |
Microsoft-analysator för hindi. |
| hi.lucene |
Lucene-analysator för hindi. |
| hu.microsoft |
Microsoft-analysator för ungerska. |
| hu.lucene |
Lucene-analysator för ungerska. |
| is.microsoft |
Microsoft-analysator för isländska. |
| id.microsoft |
Microsoft-analysator för indonesiska (Bahasa). |
| id.lucene |
Lucene-analysator för indonesiska. |
| ga.lucene |
Lucene-analysator för irländska. |
| it.microsoft |
Microsoft analyzer för italienska. |
| it.lucene |
Lucene-analysator för italienska. |
| ja.microsoft |
Microsoft-analysator för japanska. |
| ja.lucene |
Lucene-analysator för japanska. |
| kn.microsoft |
Microsoft analyzer för kannada. |
| ko.microsoft |
Microsoft-analysator för koreanska. |
| ko.lucene |
Lucene-analysator för koreanska. |
| lv.microsoft |
Microsoft-analysator för lettiska. |
| lv.lucene |
Lucene-analysator för lettiska. |
| lt.microsoft |
Microsoft analyzer för litauiska. |
| ml.microsoft |
Microsoft-analysator för malayalam. |
| ms.microsoft |
Microsoft-analysator för malajiska (latin). |
| mr.microsoft |
Microsoft-analysator för marathi. |
| nb.microsoft |
Microsoft analyzer for Norwegian (Bokmül). |
| no.lucene |
Lucene-analysator för norska. |
| fa.lucene |
Lucene-analysator för persiska. |
| pl.microsoft |
Microsoft-analysator för polska. |
| pl.lucene |
Lucene-analysator för polska. |
| pt-BR.microsoft |
Microsoft analyzer för portugisiska (Brasilien). |
| pt-BR.lucene |
Lucene-analysator för portugisiska (Brasilien). |
| pt-PT.microsoft |
Microsoft analyzer for Portuguese (Portugal). |
| pt-PT.lucene |
Lucene-analysator för portugisiska (Portugal). |
| pa.microsoft |
Microsoft-analysator för punjabi. |
| ro.microsoft |
Microsoft-analysator för rumänska. |
| ro.lucene |
Lucene-analysator för rumänska. |
| ru.microsoft |
Microsoft-analysator för ryska. |
| ru.lucene |
Lucene-analysator för ryska. |
| sr-cyrillic.microsoft |
Microsoft analyzer för serbiska (kyrilliska). |
| sr-latin.microsoft |
Microsoft analyzer för serbiska (latin). |
| sk.microsoft |
Microsoft-analysator för slovakiska. |
| sl.microsoft |
Microsoft analyzer for Slovenian. |
| es.microsoft |
Microsoft-analysator för spanska. |
| es.lucene |
Lucene-analysator för spanska. |
| sv.microsoft |
Microsoft-analysator för svenska. |
| sv.lucene |
Lucene analysator för svenska. |
| ta.microsoft |
Microsoft-analysator för tamil. |
| te.microsoft |
Microsoft analyzer för telugu. |
| th.microsoft |
Microsoft-analysator för thailändska. |
| th.lucene |
Lucene-analysator för thailändska. |
| tr.microsoft |
Microsoft-analysator för turkiskt. |
| tr.lucene |
Lucene-analysator för turkiska. |
| uk.microsoft |
Microsoft-analysator för ukrainska. |
| ur.microsoft |
Microsoft-analysator för urdu. |
| vi.microsoft |
Microsoft-analysator för vietnamesiska. |
| standard.lucene |
Lucene-analysator som standard. |
| standardasciifolding.lucene |
Standard ASCII vikning Lucene-analysator. Se https://dotnet.territoriali.olinfo.it/rest/api/searchservice/Custom-analyzers-in-Azure-Search#Analyzers |
| keyword |
Behandlar hela innehållet i ett fält som en enda token. Detta är användbart för data som postnummer, ID och vissa produktnamn. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordAnalyzer.html |
| pattern |
Flexibelt delar upp texten i termer med hjälp av ett reguljärt uttrycksmönster. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/PatternAnalyzer.html |
| simple |
Delar upp text med icke-bokstäver och konverterar dem till gemener. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/SimpleAnalyzer.html |
| stop |
Delar upp text med icke-bokstäver; Tillämpar filter för gemener och stoppordstoken. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopAnalyzer.html |
| whitespace |
En analysator som använder mellanslagstokeniseraren. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceAnalyzer.html |
LexicalNormalizerName
Definierar namnen på alla textnormaliserare som stöds av sökmotorn.
LexicalTokenizerName
Definierar namnen på alla tokeniserare som stöds av sökmotorn.
LimitTokenFilter
Begränsar antalet token vid indexering. Det här tokenfiltret implementeras med Apache Lucene.
| Name | Typ | Standardvärde | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
|
| consumeAllTokens |
boolean |
False |
Ett värde som anger om alla token från indata måste förbrukas även om maxTokenCount har nåtts. Standardvärdet är false. |
| maxTokenCount |
integer (int32) |
1 |
Det maximala antalet token som ska skapas. Standard är 1. |
| name |
string |
Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
LuceneStandardAnalyzer
Apache Lucene-analysverktyg av standardstandard; Består av standardtokeniseraren, gemener och stoppfilter.
| Name | Typ | Standardvärde | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
|
| maxTokenLength |
integer (int32) maximum: 300 |
255 |
Maximal tokenlängd. Standardvärdet är 255. Token som är längre än den maximala längden delas upp. Den maximala tokenlängden som kan användas är 300 tecken. |
| name |
string |
Namnet på analysatorn. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
|
| stopwords |
string[] |
En lista över stoppord. |
LuceneStandardTokenizer
Bryter text efter Unicode-reglerna för textsegmentering. Den här tokenizern implementeras med Apache Lucene.
| Name | Typ | Standardvärde | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
|
| maxTokenLength |
integer (int32) |
255 |
Maximal tokenlängd. Standardvärdet är 255. Token som är längre än den maximala längden delas upp. |
| name |
string |
Namnet på tokenizern. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
LuceneStandardTokenizerV2
Bryter text efter Unicode-reglerna för textsegmentering. Den här tokenizern implementeras med Apache Lucene.
| Name | Typ | Standardvärde | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
|
| maxTokenLength |
integer (int32) maximum: 300 |
255 |
Maximal tokenlängd. Standardvärdet är 255. Token som är längre än den maximala längden delas upp. Den maximala tokenlängden som kan användas är 300 tecken. |
| name |
string |
Namnet på tokenizern. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
MagnitudeScoringFunction
Definierar en funktion som ökar poängen baserat på storleken på ett numeriskt fält.
| Name | Typ | Description |
|---|---|---|
| boost |
number (double) |
En multiplikator för råpoängen. Måste vara ett positivt tal som inte är lika med 1,0. |
| fieldName |
string |
Namnet på fältet som används som indata till bedömningsfunktionen. |
| interpolation |
Ett värde som anger hur ökning kommer att interpoleras mellan dokumentpoäng. standardvärdet "Linjär". |
|
| magnitude |
Parametervärden för funktionen för storleksbedömning. |
|
| type |
string:
magnitude |
Typ av poängfunktion. |
MagnitudeScoringParameters
Ger parametervärden till en bedömningsfunktion för magnituden.
| Name | Typ | Description |
|---|---|---|
| boostingRangeEnd |
number (double) |
Fältvärdet där förstärkningen slutar. |
| boostingRangeStart |
number (double) |
Fältvärdet som boostingen startar vid. |
| constantBoostBeyondRange |
boolean |
Ett värde som anger om en konstant ökning av fältvärden ska tillämpas utöver intervallets slutvärde. Standardvärdet är false. |
MappingCharFilter
Ett teckenfilter som tillämpar mappningar som definierats med alternativet mappningar. Matchningen är girig (längst mönstermatchning vid en given poäng vinner). Ersättning tillåts vara den tomma strängen. Det här teckenfiltret implementeras med Apache Lucene.
| Name | Typ | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
| mappings |
string[] |
En lista över mappningar i följande format: "a=>b" (alla förekomster av tecknet "a" ersätts med tecknet "b"). |
| name |
string |
Namnet på teckenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
MicrosoftLanguageStemmingTokenizer
Delar upp text med hjälp av språkspecifika regler och reducerar ord till deras basformulär.
| Name | Typ | Standardvärde | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
|
| isSearchTokenizer |
boolean |
False |
Ett värde som anger hur tokenizern används. Ställ in på sant om det används som söktokeniserare och ange till false om det används som indexeringstokeniserare. Standardvärdet är false. |
| language |
Språket som ska användas. Standardvärdet är engelska. |
||
| maxTokenLength |
integer (int32) maximum: 300 |
255 |
Maximal tokenlängd. Token som är längre än den maximala längden delas upp. Maximal tokenlängd som kan användas är 300 tecken. Token som är längre än 300 tecken delas först upp i token med längd 300 och sedan delas var och en av dessa token upp baserat på den maximala tokenlängdsuppsättningen. Standardvärdet är 255. |
| name |
string |
Namnet på tokenizern. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
MicrosoftLanguageTokenizer
Delar upp text med hjälp av språkspecifika regler.
| Name | Typ | Standardvärde | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
|
| isSearchTokenizer |
boolean |
False |
Ett värde som anger hur tokenizern används. Ställ in på sant om det används som söktokeniserare och ange till false om det används som indexeringstokeniserare. Standardvärdet är false. |
| language |
Språket som ska användas. Standardvärdet är engelska. |
||
| maxTokenLength |
integer (int32) maximum: 300 |
255 |
Maximal tokenlängd. Token som är längre än den maximala längden delas upp. Maximal tokenlängd som kan användas är 300 tecken. Token som är längre än 300 tecken delas först upp i token med längd 300 och sedan delas var och en av dessa token upp baserat på den maximala tokenlängdsuppsättningen. Standardvärdet är 255. |
| name |
string |
Namnet på tokenizern. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
MicrosoftStemmingTokenizerLanguage
Listar de språk som stöds av Microsoft language stemming tokenizer.
| Värde | Description |
|---|---|
| arabic |
Väljer Microsoft Stemming tokenizer för arabiska. |
| bangla |
Väljer Microsoft stemming-tokenizer för bengali. |
| bulgarian |
Väljer Microsoft stemming-tokenizer för bulgariska. |
| catalan |
Väljer Microsoft stemming-tokenizer för katalanska. |
| croatian |
Väljer Microsoft stemming-tokenizer för kroatiska. |
| czech |
Väljer Microsoft stemming-tokenizer för tjeckiska. |
| danish |
Väljer Microsoft stemming-tokenizer för dansk. |
| dutch |
Väljer Microsoft stemming-tokenizer för nederländska. |
| english |
Väljer Microsoft Stemming Tokenizer för engelska. |
| estonian |
Väljer Microsoft stemming tokenizer för estniska. |
| finnish |
Väljer Microsoft stemming-tokenizer för finska. |
| french |
Väljer Microsoft stemming-tokenizer för franska. |
| german |
Väljer Microsoft stemming-tokenizer för tyska. |
| greek |
Väljer Microsoft stemming-tokenizer för Greek. |
| gujarati |
Väljer Microsoft Stemming Tokenizer för Gujarati. |
| hebrew |
Väljer Microsoft stemming-tokenizer för hebreiska. |
| hindi |
Väljer Microsoft stemming tokenizer för hindi. |
| hungarian |
Väljer Microsoft stemming-tokenizer för ungerska. |
| icelandic |
Väljer Microsoft stemming-tokenizer för isländska. |
| indonesian |
Väljer Microsoft stemming tokenizer för indonesiska. |
| italian |
Väljer Microsoft stemming tokenizer för italienska. |
| kannada |
Väljer Microsoft stemming tokenizer för kannada. |
| latvian |
Väljer Microsoft stemming-tokenizer för lettiska. |
| lithuanian |
Väljer Microsoft stemming-tokenizer för litauiska. |
| malay |
Väljer Microsoft stemming-tokenizer för malajiska. |
| malayalam |
Väljer Microsoft stemming-tokenizer för malayalam. |
| marathi |
Väljer Microsoft stemming-tokenizer för marathi. |
| norwegianBokmaal |
Väljer Microsoft stemming tokenizer för norska (Bokmül). |
| polish |
Väljer Microsoft stemming tokenizer för polska. |
| portuguese |
Väljer Microsoft Stemming tokenizer för portugisiska. |
| portugueseBrazilian |
Väljer Microsoft stemming-tokenizer för portugisiska (Brasilien). |
| punjabi |
Väljer Microsoft stemming tokenizer för punjabi. |
| romanian |
Väljer Microsoft stemming-tokenizer för rumänska. |
| russian |
Väljer Microsoft stemming-tokenizer för ryska. |
| serbianCyrillic |
Väljer Microsoft stemming tokenizer för serbiska (kyrilliska). |
| serbianLatin |
Väljer Microsoft stemming tokenizer för serbiska (latin). |
| slovak |
Väljer Microsoft stemming-tokenizer för Slovakiska. |
| slovenian |
Väljer Microsoft stemming tokenizer för slovenska. |
| spanish |
Väljer Microsoft stemming-tokenizer för spanska. |
| swedish |
Väljer Microsoft stemming-tokenizer för svenska. |
| tamil |
Väljer Microsoft stemming tokenizer för tamil. |
| telugu |
Väljer Microsoft stemming-tokenizer för telugu. |
| turkish |
Väljer Microsoft stemming-tokenizer för turkiska. |
| ukrainian |
Väljer Microsoft stemming-tokenizer för ukrainska. |
| urdu |
Väljer Microsoft stemming-tokenizer för urdu. |
MicrosoftTokenizerLanguage
Listar de språk som stöds av Microsoft språktokenizer.
| Värde | Description |
|---|---|
| bangla |
Väljer Microsoft-tokenizern för bengali. |
| bulgarian |
Väljer Microsoft tokenizer för bulgariska. |
| catalan |
Väljer Microsoft-tokenizern för katalanska. |
| chineseSimplified |
Väljer Microsoft-tokenizern för kinesiska (förenklad). |
| chineseTraditional |
Väljer Microsoft-tokenizern för kinesisk (traditionell). |
| croatian |
Väljer Microsoft-tokenizern för kroatiska. |
| czech |
Väljer Microsoft-tokenizern för tjeckiska. |
| danish |
Väljer Microsoft-tokenizern för dansk. |
| dutch |
Väljer Microsoft-tokenizern för nederländska. |
| english |
Väljer Microsoft-tokenizern för engelska. |
| french |
Väljer Microsoft-tokenizern för franska. |
| german |
Väljer Microsoft-tokenizern för tyska. |
| greek |
Väljer Microsoft-tokenizern för Greke. |
| gujarati |
Väljer Microsoft-tokenizern för gujarati. |
| hindi |
Väljer Microsoft-tokenizern för hindi. |
| icelandic |
Väljer Microsoft-tokenizern för isländska. |
| indonesian |
Väljer Microsoft-tokenizern för indonesiska. |
| italian |
Väljer Microsoft-tokenizern för italienska. |
| japanese |
Väljer Microsoft-tokenizern för japanska. |
| kannada |
Väljer Microsoft-tokenizern för kannada. |
| korean |
Väljer Microsoft-tokenizern för koreanska. |
| malay |
Väljer Microsoft-tokenizern för malaj. |
| malayalam |
Väljer Microsoft-tokenizern för malayalam. |
| marathi |
Väljer Microsoft-tokenizern för marathi. |
| norwegianBokmaal |
Väljer Microsoft-tokenizern för norska (Bokmül). |
| polish |
Väljer Microsoft-tokenizern för polska. |
| portuguese |
Väljer Microsoft-tokenizern för portugisiska. |
| portugueseBrazilian |
Väljer Microsoft tokenizer för portugisiska (Brasilien). |
| punjabi |
Väljer Microsoft-tokenizern för punjabi. |
| romanian |
Väljer Microsoft-tokenizern för rumänska. |
| russian |
Väljer Microsoft-tokenizern för ryska. |
| serbianCyrillic |
Väljer Microsoft-tokenizern för serbiska (kyrilliska). |
| serbianLatin |
Väljer Microsoft-tokenizern för serbiska (latin). |
| slovenian |
Väljer Microsoft-tokenizern för slovenska. |
| spanish |
Väljer Microsoft-tokenizern för spanska. |
| swedish |
Väljer Microsoft-tokenizern för svenska. |
| tamil |
Väljer Microsoft-tokenizern för tamil. |
| telugu |
Väljer Microsoft-tokenizern för telugu. |
| thai |
Väljer Microsoft-tokenizern för thailändska. |
| ukrainian |
Väljer Microsoft-tokenizern för ukrainska. |
| urdu |
Väljer Microsoft tokenizer för urdu. |
| vietnamese |
Väljer Microsoft-tokenizern för vietnamesiska. |
NGramTokenFilter
Genererar n-gram av de angivna storlekarna. Det här tokenfiltret implementeras med Apache Lucene.
| Name | Typ | Standardvärde | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
|
| maxGram |
integer (int32) |
2 |
Den maximala n-gramlängden. Standardvärdet är 2. |
| minGram |
integer (int32) |
1 |
Minsta n-gramlängd. Standard är 1. Måste vara mindre än värdet för maxGram. |
| name |
string |
Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
NGramTokenFilterV2
Genererar n-gram av de angivna storlekarna. Det här tokenfiltret implementeras med Apache Lucene.
| Name | Typ | Standardvärde | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
|
| maxGram |
integer (int32) maximum: 300 |
2 |
Den maximala n-gramlängden. Standardvärdet är 2. Maxvärdet är 300. |
| minGram |
integer (int32) maximum: 300 |
1 |
Minsta n-gramlängd. Standard är 1. Maxvärdet är 300. Måste vara mindre än värdet för maxGram. |
| name |
string |
Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
NGramTokenizer
Tokeniserar indata till n-gram av de angivna storlekarna. Den här tokenizern implementeras med Apache Lucene.
| Name | Typ | Standardvärde | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
|
| maxGram |
integer (int32) maximum: 300 |
2 |
Den maximala n-gramlängden. Standardvärdet är 2. Maxvärdet är 300. |
| minGram |
integer (int32) maximum: 300 |
1 |
Minsta n-gramlängd. Standard är 1. Maxvärdet är 300. Måste vara mindre än värdet för maxGram. |
| name |
string |
Namnet på tokenizern. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
|
| tokenChars |
Teckenklasser som ska behållas i token. |
PathHierarchyTokenizerV2
Tokenizer för sökvägsliknande hierarkier. Den här tokenizern implementeras med Apache Lucene.
| Name | Typ | Standardvärde | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
|
| delimiter |
string maxLength: 1 |
/ |
Avgränsartecknet som ska användas. Standardvärdet är "/". |
| maxTokenLength |
integer (int32) maximum: 300 |
300 |
Maximal tokenlängd. Standard och max är 300. |
| name |
string |
Namnet på tokenizern. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
|
| replacement |
string maxLength: 1 |
/ |
Ett värde som, om det anges, ersätter avgränsartecknet. Standardvärdet är "/". |
| reverse |
boolean |
False |
Ett värde som anger om token ska genereras i omvänd ordning. Standardvärdet är false. |
| skip |
integer (int32) |
0 |
Antalet inledande token som ska hoppa över. Standardvärdet är 0. |
PatternAnalyzer
Flexibelt delar upp texten i termer med hjälp av ett reguljärt uttrycksmönster. Den här analysatorn implementeras med Apache Lucene.
| Name | Typ | Standardvärde | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
|
| flags |
string |
Reguljära uttrycksflaggor, specificerade som en '|' separerad sträng av RegexFlags-värden. |
|
| lowercase |
boolean |
True |
Ett värde som anger om termer ska vara gemener. Standardvärdet är sant. |
| name |
string |
Namnet på analysatorn. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
|
| pattern |
string |
\W+ |
Ett mönster för reguljära uttryck som matchar tokenavgränsare. Standard är ett uttryck som matchar ett eller flera tecken som inte är ord. |
| stopwords |
string[] |
En lista över stoppord. |
PatternCaptureTokenFilter
Använder Java-regexer för att generera flera token – en för varje insamlingsgrupp i ett eller flera mönster. Det här tokenfiltret implementeras med Apache Lucene.
| Name | Typ | Standardvärde | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
|
| name |
string |
Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
|
| patterns |
string[] |
En lista över mönster som ska matchas mot varje token. |
|
| preserveOriginal |
boolean |
True |
Ett värde som anger om den ursprungliga token ska returneras även om något av mönstren matchar. Standardvärdet är sant. |
PatternReplaceCharFilter
Ett teckenfilter som ersätter tecken i indatasträngen. Det använder ett reguljärt uttryck för att identifiera teckensekvenser som ska bevaras och ett ersättningsmönster för att identifiera tecken som ska ersättas. Om du till exempel får indatatexten "aa bb aa bb", mönstret "(aa)\s+(bb)" och ersättningen "$1#$2" blir resultatet "aa#bb aa#bb". Det här teckenfiltret implementeras med Apache Lucene.
| Name | Typ | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
| name |
string |
Namnet på teckenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
| pattern |
string |
Ett mönster för reguljära uttryck. |
| replacement |
string |
Ersättningstexten. |
PatternReplaceTokenFilter
Ett teckenfilter som ersätter tecken i indatasträngen. Det använder ett reguljärt uttryck för att identifiera teckensekvenser som ska bevaras och ett ersättningsmönster för att identifiera tecken som ska ersättas. Om du till exempel får indatatexten "aa bb aa bb", mönstret "(aa)\s+(bb)" och ersättningen "$1#$2" blir resultatet "aa#bb aa#bb". Det här tokenfiltret implementeras med Apache Lucene.
| Name | Typ | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
| name |
string |
Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
| pattern |
string |
Ett mönster för reguljära uttryck. |
| replacement |
string |
Ersättningstexten. |
PatternTokenizer
Tokenizer som använder regex-mönstermatchning för att konstruera distinkta token. Den här tokenizern implementeras med Apache Lucene.
| Name | Typ | Standardvärde | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
|
| flags |
string |
Reguljära uttrycksflaggor, specificerade som en '|' separerad sträng av RegexFlags-värden. |
|
| group |
integer (int32) |
-1 |
Den nollbaserade ordningstalet för den matchande gruppen i mönstret för reguljära uttryck som ska extraheras till token. Använd -1 om du vill använda hela mönstret för att dela upp indata i token, oavsett matchande grupper. Standardvärdet är -1. |
| name |
string |
Namnet på tokenizern. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
|
| pattern |
string |
\W+ |
Ett mönster för reguljära uttryck som matchar tokenavgränsare. Standard är ett uttryck som matchar ett eller flera tecken som inte är ord. |
PhoneticEncoder
Identifierar vilken typ av fonetisk kodare som ska användas med en PhoneticTokenFilter.
| Värde | Description |
|---|---|
| metaphone |
Kodar en token till ett metafonvärde. |
| doubleMetaphone |
Kodar en token till ett dubbelt metafonvärde. |
| soundex |
Kodar en token till ett Soundex-värde. |
| refinedSoundex |
Kodar en token till ett Refined Soundex-värde. |
| caverphone1 |
Kodar en token till ett Caverphone 1.0-värde. |
| caverphone2 |
Kodar en token till ett Caverphone 2.0-värde. |
| cologne |
Kodar en token till ett fonetiskt värde i Köln. |
| nysiis |
Kodar en token till ett NYSIIS-värde. |
| koelnerPhonetik |
Kodar en token med hjälp av Kölner Phonetik-algoritmen. |
| haasePhonetik |
Kodar en token med hjälp av Haase-förfiningen av Kölner Phonetik-algoritmen. |
| beiderMorse |
Kodar en token till ett Beider-Morse värde. |
PhoneticTokenFilter
Skapa token för fonetiska matchningar. Det här tokenfiltret implementeras med Apache Lucene.
| Name | Typ | Standardvärde | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
|
| encoder | metaphone |
Den fonetiska kodare som ska användas. Standardvärdet är "metafon". |
|
| name |
string |
Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
|
| replace |
boolean |
True |
Ett värde som anger om kodade token ska ersätta ursprungliga token. Om det är falskt läggs kodade token till som synonymer. Standardvärdet är sant. |
RankingOrder
Representerar poäng som ska användas för sorteringsordning för dokument.
| Värde | Description |
|---|---|
| BoostedRerankerScore |
Ställer in sorteringsordningen som BoostedRerankerScore |
| RerankerScore |
Ställer in sorteringsordning som ReRankerScore |
RescoringOptions
Innehåller alternativ för omskolning.
| Name | Typ | Standardvärde | Description |
|---|---|---|---|
| defaultOversampling |
number (double) |
Standardöversamplingsfaktor. Översampling hämtar en större uppsättning potentiella dokument för att kompensera för upplösningsförlusten på grund av kvantisering. Detta ökar uppsättningen resultat som ska poängsättas på nytt på vektorer med full precision. Minimivärdet är 1, vilket innebär att ingen översampling (1x). Den här parametern kan bara anges när "enableRescoring" är sant. Högre värden förbättrar återkallandet på bekostnad av svarstiden. |
|
| enableRescoring |
boolean |
True |
Om värdet är true, efter den första sökningen på de komprimerade vektorerna, beräknas likhetspoängen om med hjälp av vektorerna med full precision. Detta förbättrar återkallandet på bekostnad av svarstiden. |
| rescoreStorageMethod |
enum:
|
preserveOriginals |
Styr lagringsmetoden för ursprungliga vektorer. Den här inställningen är oföränderlig. |
ScalarQuantizationCompression
Innehåller konfigurationsalternativ som är specifika för den skalära kvantiseringskomprimeringsmetod som används vid indexering och frågor.
| Name | Typ | Description |
|---|---|---|
| kind |
string:
scalar |
Typ av VectorSearchKompression. |
| name |
string |
Namnet som ska associeras med den här konfigurationen. |
| rescoringOptions |
Innehåller alternativ för omskolning. |
|
| scalarQuantizationParameters |
Innehåller de parametrar som är specifika för Scalar Quantization. |
|
| truncationDimension |
integer (int32) |
Antalet dimensioner som vektorerna ska trunkeras till. Om du trunkerar vektorerna minskar storleken på vektorerna och mängden data som måste överföras under sökningen. Detta kan spara lagringskostnader och förbättra sökprestanda på bekostnad av återkallande. Den bör endast användas för inbäddningar som tränats med Matryoshka Representation Learning (MRL) som OpenAI textinbäddning-3-large (liten). Standardvärdet är null, vilket innebär ingen trunkering. |
ScalarQuantizationParameters
Innehåller de parametrar som är specifika för Scalar Quantization.
| Name | Typ | Description |
|---|---|---|
| quantizedDataType |
Den kvantiserade datatypen för komprimerade vektorvärden. |
ScoringFunctionAggregation
Definierar den aggregeringsfunktion som används för att kombinera resultaten av alla bedömningsfunktioner i en bedömningsprofil.
| Värde | Description |
|---|---|
| sum |
Öka poängen med summan av alla resultat från bedömningsfunktionen. |
| average |
Öka poängen med medelvärdet av alla poängsättningsfunktionsresultat. |
| minimum |
Öka poängen med ett minimum av alla poängsättningsfunktionsresultat. |
| maximum |
Öka poängen med det maximala av alla poängsättningsfunktionsresultat. |
| firstMatching |
Öka poängen med hjälp av den första tillämpliga poängsättningsfunktionen i bedömningsprofilen. |
| product |
Öka poängen med produkten av alla poängsättningsfunktionsresultat. |
ScoringFunctionInterpolation
Definierar den funktion som används för att interpolera poängökning i en rad dokument.
| Värde | Description |
|---|---|
| linear |
Ökar poängen med ett linjärt minskande belopp. Det här är standardinterpolationen för bedömningsfunktioner. |
| constant |
Ökar poängen med en konstant faktor. |
| quadratic |
Ökar poängen med ett belopp som minskar kvadratiskt. Boostar minskar långsamt för högre poäng och snabbare när poängen minskar. Det här interpolationsalternativet är inte tillåtet i taggbedömningsfunktioner. |
| logarithmic |
Ökar poängen med ett belopp som minskar logaritmiskt. Boostar minskar snabbt för högre poäng och långsammare när poängen minskar. Det här interpolationsalternativet är inte tillåtet i taggbedömningsfunktioner. |
ScoringProfile
Definierar parametrar för ett sökindex som påverkar bedömning i sökfrågor.
| Name | Typ | Description |
|---|---|---|
| functionAggregation |
Ett värde som anger hur resultaten av enskilda poängsättningsfunktioner ska kombineras. Standardvärdet är "Summa". Ignoreras om det inte finns några poängsättningsfunktioner. |
|
| functions | ScoringFunction[]: |
Samlingen av funktioner som påverkar poängsättningen av dokument. |
| name |
string |
Namnet på bedömningsprofilen. |
| text |
Parametrar som ökar poängsättningen baserat på textmatchningar i vissa indexfält. |
SearchField
Representerar ett fält i en indexdefinition som beskriver namn, datatyp och sökbeteende för ett fält.
| Name | Typ | Description |
|---|---|---|
| analyzer |
Namnet på analysatorn som ska användas för fältet. Det här alternativet kan endast användas med sökbara fält och det kan inte ställas in tillsammans med antingen searchAnalyzer eller indexAnalyzer. När analysatorn har valts kan den inte ändras för fältet. Måste vara null för komplexa fält. |
|
| dimensions |
integer (int32) minimum: 2maximum: 4096 |
Vektorfältets dimensionalitet. |
| facetable |
boolean |
Ett värde som anger om fältet ska refereras till i fasetterade frågor. Används vanligtvis i en presentation av sökresultat som inkluderar antal träffar per kategori (till exempel söka efter digitalkameror och se träffar efter varumärke, megapixlar, pris och så vidare). Den här egenskapen måste vara null för komplexa fält. Fält av typen Edm.GeographyPoint eller Collection(Edm.GeographyPoint) kan inte vara fasettbara. Standardvärdet är true för alla andra enkla fält. |
| fields |
En lista med underfält om det här är ett fält av typen Edm.ComplexType eller Collection(Edm.ComplexType). Måste vara null eller tomt för enkla fält. |
|
| filterable |
boolean |
Ett värde som anger om fältet ska refereras i $filter frågor. filterable skiljer sig från sökbara i hur strängar hanteras. Fält av typen Edm.String eller Collection(Edm.String) som är filterbara genomgår inte ordbrytning, så jämförelser är endast för exakta matchningar. Om du till exempel anger ett sådant fält f till "solig dag" hittar $filter=f eq "sunny" inga matchningar, men $filter=f eq "solig dag" kommer att göra det. Den här egenskapen måste vara null för komplexa fält. Standardvärdet är true för enkla fält och null för komplexa fält. |
| indexAnalyzer |
Namnet på analysatorn som användes vid indexeringstiden för fältet. Det här alternativet kan endast användas med sökbara fält. Den måste anges tillsammans med searchAnalyzer och den kan inte ställas in tillsammans med analysalternativet. Den här egenskapen kan inte anges till namnet på en språkanalysator. använd egenskapen analyzer i stället om du behöver en språkanalysator. När analysatorn har valts kan den inte ändras för fältet. Måste vara null för komplexa fält. |
|
| key |
boolean |
Ett värde som anger om fältet unikt identifierar dokument i indexet. Exakt ett fält på den översta nivån i varje index måste väljas som nyckelfält och det måste vara av typen Edm.String. Nyckelfält kan användas för att söka efter dokument direkt och uppdatera eller ta bort specifika dokument. Standardvärdet är false för enkla fält och null för komplexa fält. |
| name |
string |
Namnet på fältet, som måste vara unikt i fältsamlingen för indexet eller det överordnade fältet. |
| normalizer |
Namnet på den normaliserare som ska användas för fältet. Det här alternativet kan endast användas med fält som är filtrerbara, sorterbara eller fasettbara aktiverade. När normaliseraren har valts kan den inte ändras för fältet. Måste vara null för komplexa fält. |
|
| retrievable |
boolean |
Ett värde som anger om fältet kan returneras i ett sökresultat. Du kan inaktivera det här alternativet om du vill använda ett fält (till exempel marginal) som filter, sortering eller bedömningsmekanism men inte vill att fältet ska vara synligt för slutanvändaren. Den här egenskapen måste vara true för nyckelfält och den måste vara null för komplexa fält. Den här egenskapen kan ändras i befintliga fält. Om du aktiverar den här egenskapen ökar inte kraven på indexlagring. Standardvärdet är true för enkla fält, false för vektorfält och null för komplexa fält. |
| searchAnalyzer |
Namnet på analysatorn som användes vid söktillfället för fältet. Det här alternativet kan endast användas med sökbara fält. Den måste anges tillsammans med indexAnalyzer och den kan inte anges tillsammans med analyzer-alternativet. Den här egenskapen kan inte anges till namnet på en språkanalysator. använd egenskapen analyzer i stället om du behöver en språkanalysator. Den här analysatorn kan uppdateras i ett befintligt fält. Måste vara null för komplexa fält. |
|
| searchable |
boolean |
Ett värde som anger om fältet kan sökas i fulltext. Det innebär att den kommer att genomgå en analys, till exempel ordbrytning under indexeringen. Om du anger ett sökbart fält till ett värde som "solig dag" delas det internt upp i de enskilda tokensna "sunny" och "day". Detta möjliggör fulltextsökningar för dessa termer. Fält av typen Edm.String eller Collection(Edm.String) kan sökas som standard. Den här egenskapen måste vara false för enkla fält av andra datatyper som inte är strängar, och den måste vara null för komplexa fält. Obs! Sökbara fält förbrukar extra utrymme i indexet för att hantera ytterligare tokeniserade versioner av fältvärdet för fulltextsökningar. Om du vill spara utrymme i indexet och du inte behöver ett fält som ska inkluderas i sökningar anger du sökbart till false. |
| sortable |
boolean |
Ett värde som anger om fältet ska refereras till i $orderby uttryck. Som standard sorterar sökmotorn resultat efter poäng, men i många upplevelser vill användarna sortera efter fält i dokumenten. Ett enkelt fält kan bara sorteras om det är envärdesvärde (det har ett enda värde i omfånget för det överordnade dokumentet). Enkla samlingsfält kan inte sorteras eftersom de är flervärdesfält. Enkla underfält i komplexa samlingar är också flervärdesfält och kan därför inte sorteras. Detta gäller oavsett om det är ett omedelbart överordnat fält eller ett förfader fält, som är den komplexa kollektionen. Komplexa fält kan inte sorteras och egenskapen sortable måste vara null för sådana fält. Standardvärdet för sorterbar är true för enkla fält med ett värde, false för enkla fält med flera värden och null för komplexa fält. |
| stored |
boolean |
Ett oföränderligt värde som anger om fältet ska sparas separat på disken som ska returneras i ett sökresultat. Du kan inaktivera det här alternativet om du inte planerar att returnera fältinnehållet i ett söksvar för att spara på lagringskostnaderna. Detta kan bara anges när index skapas och endast för vektorfält. Det går inte att ändra den här egenskapen för befintliga fält eller anges som false för nya fält. Om den här egenskapen är inställd på false måste egenskapen "retrievable" också anges till false. Den här egenskapen måste vara true eller unset för nyckelfält, för nya fält och för icke-vektorfält, och den måste vara null för komplexa fält. Om du inaktiverar den här egenskapen minskar kraven på indexlagring. Standardvärdet gäller för vektorfält. |
| synonymMaps |
string[] |
En lista över namnen på synonymkartor som ska associeras med det här fältet. Det här alternativet kan endast användas med sökbara fält. För närvarande stöds endast en synonymkarta per fält. Om du tilldelar en synonymkarta till ett fält ser du till att frågetermer som riktar sig mot det fältet expanderas vid frågetillfället med hjälp av reglerna i synonymkartan. Det här attributet kan ändras i befintliga fält. Måste vara null eller en tom samling för komplexa fält. |
| type |
Datatypen för fältet. |
|
| vectorEncoding |
Kodningsformatet för att tolka fältinnehållet. |
|
| vectorSearchProfile |
string |
Namnet på vektorsökningsprofilen som anger algoritmen och vektoriseraren som ska användas vid sökning i vektorfältet. |
SearchFieldDataType
Definierar datatypen för ett fält i ett sökindex.
| Värde | Description |
|---|---|
| Edm.String |
Anger att ett fält innehåller en sträng. |
| Edm.Int32 |
Anger att ett fält innehåller ett 32-bitars signerat heltal. |
| Edm.Int64 |
Anger att ett fält innehåller ett 64-bitars signerat heltal. |
| Edm.Double |
Anger att ett fält innehåller ett IEEE-flyttal med dubbel precision. |
| Edm.Boolean |
Anger att ett fält innehåller ett booleskt värde (sant eller falskt). |
| Edm.DateTimeOffset |
Anger att ett fält innehåller ett datum-/tidsvärde, inklusive tidszonsinformation. |
| Edm.GeographyPoint |
Anger att ett fält innehåller en geo-plats när det gäller longitud och latitud. |
| Edm.ComplexType |
Anger att ett fält innehåller ett eller flera komplexa objekt som i sin tur har underfält av andra typer. |
| Edm.Single |
Anger att ett fält innehåller ett flyttal med enkel precision. Detta är endast giltigt när det används med Collection(Edm.Single). |
| Edm.Half |
Anger att ett fält innehåller ett flyttal med halv precision. Detta är endast giltigt när det används med Collection(Edm.Half). |
| Edm.Int16 |
Anger att ett fält innehåller ett 16-bitars signerat heltal. Detta är endast giltigt när det används med Collection(Edm.Int16). |
| Edm.SByte |
Anger att ett fält innehåller ett 8-bitars signerat heltal. Detta är endast giltigt när det används med Collection(Edm.SByte). |
| Edm.Byte |
Anger att ett fält innehåller ett 8-bitars osignerat heltal. Detta är endast giltigt när det används med Collection(Edm.Byte). |
SearchIndex
Representerar en sökindexdefinition som beskriver fälten och sökbeteendet för ett index.
| Name | Typ | Description |
|---|---|---|
| @odata.etag |
string |
Indexets ETag. |
| analyzers | LexicalAnalyzer[]: |
Analysverktygen för indexet. |
| charFilters | CharFilter[]: |
Tecknet filtrerar för indexet. |
| corsOptions |
Alternativ för att styra CORS (Cross-Origin Resource Sharing) för indexet. |
|
| defaultScoringProfile |
string |
Namnet på bedömningsprofilen som ska användas om ingen anges i frågan. Om den här egenskapen inte har angetts och ingen bedömningsprofil har angetts i frågan används standardbedömning (tf-idf). |
| description |
string |
En beskrivning av indexet. |
| encryptionKey |
En beskrivning av en krypteringsnyckel som du skapar i Azure Key Vault. Denna nyckel används för att ge en extra nivå av kryptering i vila för dina data när du vill ha full säkerhet att ingen, inte ens Microsoft, kan dekryptera dina data. När du har krypterat dina data förblir de alltid krypterade. Söktjänsten ignorerar försök att ange den här egenskapen till null. Du kan ändra den här egenskapen efter behov om du vill rotera krypteringsnyckeln. Dina data påverkas inte. Kryptering med kundhanterade nycklar är inte tillgängligt för kostnadsfria söktjänster och är endast tillgängligt för betaltjänster som skapats den 1 januari 2019 eller senare. |
|
| fields |
Fälten i indexet. |
|
| name |
string |
Namnet på indexet. |
| normalizers | LexicalNormalizer[]: |
Normaliserare för indexet. |
| scoringProfiles |
Bedömningsprofilerna för indexet. |
|
| semantic |
Definierar parametrar för ett sökindex som påverkar semantiska funktioner. |
|
| similarity | SimilarityAlgorithm: |
Typen av likhetsalgoritm som ska användas vid bedömning och rangordning av dokument som matchar en sökfråga. Likhetsalgoritmen kan bara definieras när index skapas och kan inte ändras på befintliga index. Om värdet är null används ClassicSimilarity-algoritmen. |
| suggesters |
Förslagsgivare för indexet. |
|
| tokenFilters |
TokenFilter[]:
|
Tokenfiltren för indexet. |
| tokenizers | LexicalTokenizer[]: |
Tokenizers för indexet. |
| vectorSearch |
Innehåller konfigurationsalternativ som rör vektorsökning. |
SearchIndexerDataNoneIdentity
Rensar identitetsegenskapen för en datakälla.
| Name | Typ | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Ett URI-fragment som anger typen av identitet. |
SearchIndexerDataUserAssignedIdentity
Anger identiteten för en datakälla som ska användas.
| Name | Typ | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Ett URI-fragment som anger typen av identitet. |
| userAssignedIdentity |
string |
Det fullständigt kvalificerade Azure-resurs-ID:t för en användartilldelad hanterad identitet, vanligtvis i formuläret "/subscriptions/12345678-1234-1234-1234567890ab/resourceGroups/rg/providers/Microsoft.ManagedIdentity/userAssignedIdentities/myId" som borde ha tilldelats söktjänsten. |
SearchResourceEncryptionKey
En kundhanterad krypteringsnyckel i Azure Key Vault. Nycklar som du skapar och hanterar kan användas för att kryptera eller dekryptera vilande data, till exempel index och synonymmappningar.
| Name | Typ | Description |
|---|---|---|
| accessCredentials.applicationId |
string |
Ett AAD-program-ID som har beviljats nödvändiga åtkomstbehörigheter till Azure Key Vault som ska användas när du krypterar dina data i vila. Program-ID:t bör inte förväxlas med objekt-ID:t för ditt AAD-program. |
| accessCredentials.applicationSecret |
string |
Autentiseringsnyckeln för det angivna AAD-programmet. |
| identity | SearchIndexerDataIdentity: |
En explicit hanterad identitet som ska användas för den här krypteringsnyckeln. Om det inte anges och egenskapen för åtkomstautentiseringsuppgifter är null används den systemtilldelade hanterade identiteten. Om den explicita identiteten är ospecificerad vid uppdatering av resursen förblir den oförändrad. Om "ingen" anges rensas värdet för den här egenskapen. |
| keyVaultKeyName |
string |
Namnet på din Azure Key Vault-nyckel som ska användas för att kryptera dina vilande data. |
| keyVaultKeyVersion |
string |
Den version av Azure Key Vault-nyckeln som ska användas för att kryptera dina vilande data. |
| keyVaultUri |
string |
URI:n för ditt Azure Key Vault, även kallat DNS-namn, som innehåller nyckeln som ska användas för att kryptera dina data i vila. Ett exempel på en URI kan vara |
SearchSuggester
Definierar hur Api för förslag ska tillämpas på en grupp fält i indexet.
| Name | Typ | Description |
|---|---|---|
| name |
string |
Namnet på förslagsställaren. |
| searchMode |
enum:
analyzing |
Ett värde som anger förslagsställarens funktioner. |
| sourceFields |
string[] |
Listan över fältnamn som förslagsställaren gäller för. Varje fält måste vara sökbart. |
SemanticConfiguration
Definierar en specifik konfiguration som ska användas i samband med semantiska funktioner.
| Name | Typ | Description |
|---|---|---|
| name |
string |
Namnet på den semantiska konfigurationen. |
| prioritizedFields |
Beskriver de rubrik-, innehålls- och nyckelordsfält som ska användas för semantisk rangordning, undertexter, markeringar och svar. Minst en av de tre underegenskaperna (titleField, prioritizedKeywordsFields och prioritizedContentFields) måste anges. |
|
| rankingOrder |
Anger vilken poängtyp som ska användas för sökresultatens sorteringsordning. |
SemanticField
Ett fält som används som en del av den semantiska konfigurationen.
| Name | Typ | Description |
|---|---|---|
| fieldName |
string |
Filnamn |
SemanticPrioritizedFields
Beskriver fälten rubrik, innehåll och nyckelord som ska användas för semantisk rangordning, undertexter, markeringar och svar.
| Name | Typ | Description |
|---|---|---|
| prioritizedContentFields |
Definierar de innehållsfält som ska användas för semantisk rangordning, undertexter, höjdpunkter och svar. För bästa resultat bör de markerade fälten innehålla text i naturlig språkform. Ordningen på fälten i matrisen representerar deras prioritet. Fält med lägre prioritet kan trunkeras om innehållet är långt. |
|
| prioritizedKeywordsFields |
Definierar de nyckelordsfält som ska användas för semantisk rangordning, bildtexter, höjdpunkter och svar. För bästa resultat bör de markerade fälten innehålla en lista med nyckelord. Ordningen på fälten i matrisen representerar deras prioritet. Fält med lägre prioritet kan trunkeras om innehållet är långt. |
|
| titleField |
Definierar titelfältet som ska användas för semantisk rangordning, bildtexter, markeringar och svar. Om du inte har något titelfält i indexet lämnar du det tomt. |
SemanticSearch
Definierar parametrar för ett sökindex som påverkar semantiska funktioner.
| Name | Typ | Description |
|---|---|---|
| configurations |
De semantiska konfigurationerna för indexet. |
|
| defaultConfiguration |
string |
Gör att du kan ange namnet på en semantisk standardkonfiguration i ditt index, vilket gör det valfritt att skicka den vidare som en frågeparameter varje gång. |
ShingleTokenFilter
Skapar kombinationer av tokens till en enda token. Det här tokenfiltret implementeras med Apache Lucene.
| Name | Typ | Standardvärde | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
|
| filterToken |
string |
_ |
Strängen som ska infogas för varje position där det inte finns någon token. Standardvärdet är ett understreck ("_"). |
| maxShingleSize |
integer (int32) minimum: 2 |
2 |
Den maximala bältrosstorleken. Standardvärdet och minimivärdet är 2. |
| minShingleSize |
integer (int32) minimum: 2 |
2 |
Minsta bältrosstorlek. Standardvärdet och minimivärdet är 2. Måste vara mindre än värdet för maxShingleSize. |
| name |
string |
Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
|
| outputUnigrams |
boolean |
True |
Ett värde som anger om utdataströmmen ska innehålla indatatoken (unigram) samt bältros. Standardvärdet är sant. |
| outputUnigramsIfNoShingles |
boolean |
False |
Ett värde som anger om unigram ska matas ut för de tider då inga bältros är tillgängliga. Den här egenskapen har företräde när outputUnigrams är inställt på false. Standardvärdet är false. |
| tokenSeparator |
string |
Strängen som ska användas när du ansluter intilliggande token för att bilda en bältros. Standardvärdet är ett enda blanksteg (" "). |
SnowballTokenFilter
Ett filter som stjälkar ord med hjälp av en Snowball-genererad stemmer. Det här tokenfiltret implementeras med Apache Lucene.
| Name | Typ | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
| language |
Språket som ska användas. |
|
| name |
string |
Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
SnowballTokenFilterLanguage
Det språk som ska användas för ett Snowball-tokenfilter.
| Värde | Description |
|---|---|
| armenian |
Väljer Lucene Snowball stemming tokenizer för armeniska. |
| basque |
Väljer Lucene Snowball stemming tokenizer för baskiska. |
| catalan |
Väljer Lucene Snowball stemming tokenizer för katalanska. |
| danish |
Väljer Lucene Snowball stemming tokenizer för danska. |
| dutch |
Väljer Lucene Snowball stemming tokenizer för nederländska. |
| english |
Väljer Lucene Snowball stemming tokenizer för engelska. |
| finnish |
Väljer Lucene Snowball stemming tokenizer för finska. |
| french |
Väljer Lucene Snowball stemming tokenizer för franska. |
| german |
Väljer Lucene Snowball stemming tokenizer för tyska. |
| german2 |
Väljer den Lucene Snowball-tokeniserare som använder den tyska variantalgoritmen. |
| hungarian |
Väljer Lucene Snowball stemming tokenizer för ungerska. |
| italian |
Väljer Lucene Snowball stemming tokenizer för italienska. |
| kp |
Väljer Lucene Snowball-tokeniseraren för nederländare som använder algoritmen för Kraaij-Pohlmann härstamning. |
| lovins |
Väljer Lucene Snowball-tokeniseraren för engelsk stamning som använder Lovins algoritm för ordstamning. |
| norwegian |
Väljer Lucene Snowball-tokeniseraren för att härstamma från Norwegian. |
| porter |
Väljer Lucene Snowball stemming tokenizer för engelska som använder Porter stemming-algoritmen. |
| portuguese |
Väljer Lucene Snowball stemming tokenizer för portugisiska. |
| romanian |
Väljer Lucene Snowball stemming tokenizer för rumänska. |
| russian |
Väljer Lucene Snowball stemming tokenizer för ryska. |
| spanish |
Väljer Lucene Snowball stemming tokenizer för spanska. |
| swedish |
Väljer Lucene Snowball stemming tokenizer för svenska. |
| turkish |
Väljer Lucene Snowball-stammens tokenizer för turkiska. |
StemmerOverrideTokenFilter
Ger möjlighet att åsidosätta andra härdningsfilter med anpassad ordlistebaserad härdning. Ordlisteskaftade termer markeras som nyckelord så att de inte kommer att stoppas med stemmers längre ned i kedjan. Måste placeras före eventuella härdningsfilter. Det här tokenfiltret implementeras med Apache Lucene. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/StemmerOverrideFilter.html
| Name | Typ | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
| name |
string |
Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
| rules |
string[] |
En lista över härstamningsregler i följande format: "word => stem", till exempel: "ran => run". |
StemmerTokenFilter
Språkspecifikt härdningsfilter. Det här tokenfiltret implementeras med Apache Lucene. Se https://dotnet.territoriali.olinfo.it/rest/api/searchservice/Custom-analyzers-in-Azure-Search#TokenFilters
| Name | Typ | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
| language |
Språket som ska användas. |
|
| name |
string |
Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
StemmerTokenFilterLanguage
Det språk som ska användas för ett stemmer-tokenfilter.
| Värde | Description |
|---|---|
| arabic |
Väljer Lucene-tokeniseraren för avstamning för arabiska. |
| armenian |
Väljer Lucene-stammens tokenizer för armeniska. |
| basque |
Väljer Lucene-tokeniseraren för avstamning för baskiska. |
| brazilian |
Väljer Lucene-tokeniseraren för avstamning för portugisiska (Brasilien). |
| bulgarian |
Väljer Lucene-stammens tokenizer för bulgariska. |
| catalan |
Väljer Lucene-tokeniseraren för härstamning för katalanska. |
| czech |
Väljer Lucene-tokeniseraren för avstamning för tjeckiska. |
| danish |
Väljer Lucene-tokeniseraren för avstamning för danska. |
| dutch |
Väljer Lucene-tokeniseraren för avstamning för nederländska. |
| dutchKp |
Väljer Lucene-tokeniseraren för ordstamsigenkänning för nederländska som använder algoritmen för Kraaij-Pohlmann härstamning. |
| english |
Väljer Lucene-tokeniseraren för avstamning på engelska. |
| lightEnglish |
Väljer Lucene-tokeniseraren för härstamning för engelska som gör lätt stamning. |
| minimalEnglish |
Väljer Lucene stemming-tokeniserare för engelska som gör minimal stemming. |
| possessiveEnglish |
Väljer Lucene-stammens tokenizer för engelska som tar bort avslutande possessiv från ord. |
| porter2 |
Väljer Lucene-tokeniseraren för ordstamsigenkänning för engelska som använder algoritmen för ordstamsigenkänning Porter2. |
| lovins |
Väljer Lucene-tokeniseraren för ordstamsigenkänning för engelska som använder algoritmen för Lovins härstamning. |
| finnish |
Väljer Lucene-tokeniseraren för härstamning för finska. |
| lightFinnish |
Väljer Lucene-tokeniseraren för ordstamsigenkänning för finska som gör lätt stamning. |
| french |
Väljer Lucene-tokeniseraren för avstamning för franska. |
| lightFrench |
Väljer Lucene-tokeniseraren för härstamning för franska som gör lätt stamning. |
| minimalFrench |
Väljer Lucene-tokeniseraren för avstamning för franska som utför minimal härstamning. |
| galician |
Väljer Lucene-stammens tokenizer för galiciska. |
| minimalGalician |
Väljer Lucene-tokeniseraren för härstamning för galiciska som gör minimal härstamning. |
| german |
Väljer Lucene-tokeniseraren för avstamning för tyska. |
| german2 |
Väljer den Lucene-stammande tokeniserare som använder den tyska variantalgoritmen. |
| lightGerman |
Väljer Lucene-tokeniseraren för ordstamsigenkänning för tyska som gör lätt stamning. |
| minimalGerman |
Väljer Lucene-tokeniseraren för härstamning för tyska som gör minimal härstamning. |
| greek |
Väljer Lucene-stammens tokenizer för grekiska. |
| hindi |
Väljer Lucene-tokeniseraren för avstamning för hindi. |
| hungarian |
Väljer Lucene-stammens tokenizer för ungerska. |
| lightHungarian |
Väljer Lucene-tokeniseraren för stamning för ungerska som gör lätt stamning. |
| indonesian |
Väljer Lucene-stammens tokenizer för indonesiska. |
| irish |
Väljer Lucene-tokeniseraren för härstamning för irländska. |
| italian |
Väljer Lucene-tokeniseraren för härstamning för italienska. |
| lightItalian |
Väljer Lucene-tokeniseraren för härstamning för italienska som gör lätt stamning. |
| sorani |
Väljer Lucene-tokeniseraren för avstamning för Sorani. |
| latvian |
Väljer Lucene-tokeniseraren för avstamning för lettiska. |
| norwegian |
Väljer Lucene stemming-tokenizern för norska (Bokmül). |
| lightNorwegian |
Väljer Lucene stemming-tokenizern för Norwegian (Bokmál) som gör lätt stemming. |
| minimalNorwegian |
Väljer Lucene stemming-tokenizern för Norwegian (Bokmül) som gör minimal stemming. |
| lightNynorsk |
Väljer Lucene-tokeniseraren för härstamning för norska (nynorsk) som gör lätt stamning. |
| minimalNynorsk |
Väljer Lucene-tokeniseraren för härstamning för norska (nynorsk) som gör minimal härstamning. |
| portuguese |
Väljer Lucene-tokeniseraren för avstamning för portugisiska. |
| lightPortuguese |
Väljer Lucene-tokeniseraren för ordstamsigenkänning för portugisiska som gör lätt stamning. |
| minimalPortuguese |
Väljer Lucene stemming-tokenizer för portugisiska som gör minimal stamning. |
| portugueseRslp |
Väljer Lucene-tokeniseraren för ordstamsigenkänning för portugisiska som använder RSLP-algoritmen för härstamning. |
| romanian |
Väljer Lucene-stammens tokenizer för rumänska. |
| russian |
Väljer Lucene-stammens tokenizer för ryska. |
| lightRussian |
Väljer Lucene-stammens tokenizer för ryska som gör lätt stamning. |
| spanish |
Väljer Lucene-tokeniseraren för avstamning för spanska. |
| lightSpanish |
Väljer Lucene-tokeniseraren för stamning för spanska som gör lätt stamning. |
| swedish |
Väljer Lucene-stammens tokenizer för svenska. |
| lightSwedish |
Väljer Lucene stemming tokenizer för svenska som gör light stemming. |
| turkish |
Väljer Lucene-stammens tokenizer för turkiska. |
StopAnalyzer
Delar upp text med icke-bokstäver; Tillämpar filter för gemener och stoppordstoken. Den här analysatorn implementeras med Apache Lucene.
| Name | Typ | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
| name |
string |
Namnet på analysatorn. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
| stopwords |
string[] |
En lista över stoppord. |
StopwordsList
Identifierar en fördefinierad lista med språkspecifika stoppord.
| Värde | Description |
|---|---|
| arabic |
Markerar stoppordslistan för arabiska. |
| armenian |
Markerar stoppordslistan för armeniska. |
| basque |
Markerar stoppordslistan för baskiska. |
| brazilian |
Markerar stoppordslistan för portugisiska (Brasilien). |
| bulgarian |
Markerar stoppordslistan för bulgariska. |
| catalan |
Markerar stoppordslistan för katalanska. |
| czech |
Markerar stoppordslistan för tjeckiska. |
| danish |
Markerar stoppordslistan för danska. |
| dutch |
Markerar stoppordslistan för nederländska. |
| english |
Väljer stoppordslista för engelska. |
| finnish |
Markerar stoppordslistan för finska. |
| french |
Väljer stoppordslistan för franska. |
| galician |
Markerar stoppordslistan för galiciska. |
| german |
Väljer stoppordslistan för tyska. |
| greek |
Markerar stoppordslistan för grekiska. |
| hindi |
Markerar stoppordslistan för hindi. |
| hungarian |
Markerar stoppordslistan för ungerska. |
| indonesian |
Väljer stoppordslista för indonesiska. |
| irish |
Väljer stoppordslistan för iriska. |
| italian |
Markerar stoppordslistan för italienska. |
| latvian |
Markerar stoppordslistan för lettiska. |
| norwegian |
Markerar stoppordslistan för norska. |
| persian |
Markerar stoppordslistan för persiska. |
| portuguese |
Markerar stoppordslistan för portugisiska. |
| romanian |
Markerar stoppordslistan för rumänska. |
| russian |
Väljer stoppordslistan för ryska. |
| sorani |
Markerar stoppordslistan för Sorani. |
| spanish |
Väljer stoppordslistan för spanska. |
| swedish |
Markerar stoppordslistan för svenskan. |
| thai |
Markerar stoppordslistan för thailändska. |
| turkish |
Markerar stoppordslistan för turkiska. |
StopwordsTokenFilter
Tar bort stoppord från en tokenström. Det här tokenfiltret implementeras med Apache Lucene. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopFilter.html
| Name | Typ | Standardvärde | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
|
| ignoreCase |
boolean |
False |
Ett värde som anger om skiftläge ska ignoreras. Om sant konverteras alla ord till gemener först. Standardvärdet är false. |
| name |
string |
Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
|
| removeTrailing |
boolean |
True |
Ett värde som anger om den sista söktermen ska ignoreras om det är ett stoppord. Standardvärdet är sant. |
| stopwords |
string[] |
Listan över stoppord. Både den här egenskapen och stopwords-listegenskapen kan inte anges. |
|
| stopwordsList | english |
En fördefinierad lista över stoppord som ska användas. Både den här egenskapen och stopwords-egenskapen kan inte anges. Standardvärdet är engelska. |
SynonymTokenFilter
Matchar synonymer med en eller flera ord i en tokenström. Det här tokenfiltret implementeras med Apache Lucene.
| Name | Typ | Standardvärde | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
|
| expand |
boolean |
True |
Ett värde som anger om alla ord i listan med synonymer (om => notation inte används) mappas till varandra. Om sant mappas alla ord i listan med synonymer (om => notation inte används) till varandra. Följande lista: otroligt, otroligt, fantastiskt, fantastiskt motsvarar: otroligt, otroligt, fantastiskt, fantastiskt => otroligt, otroligt, fantastiskt, fantastiskt. Om det är falskt, kommer följande lista: otrolig, otrolig, fantastisk, fantastisk att motsvara: otrolig, otrolig, fantastisk, fantastisk => otrolig. Standardvärdet är sant. |
| ignoreCase |
boolean |
False |
Ett värde som anger om indata för skiftläge ska vikas för matchning. Standardvärdet är false. |
| name |
string |
Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
|
| synonyms |
string[] |
En lista över synonymer i följande två format: 1. otroligt, otroligt, fantastiskt => fantastiskt - alla termer på vänster sida av => symbolen kommer att ersättas med alla termer på höger sida; 2. otroligt, otroligt, fantastiskt, fantastiskt - kommaavgränsad lista över motsvarande ord. Ange alternativet expandera för att ändra hur den här listan tolkas. |
TagScoringFunction
Definierar en funktion som ökar antalet dokument med strängvärden som matchar en viss lista med taggar.
| Name | Typ | Description |
|---|---|---|
| boost |
number (double) |
En multiplikator för råpoängen. Måste vara ett positivt tal som inte är lika med 1,0. |
| fieldName |
string |
Namnet på fältet som används som indata till bedömningsfunktionen. |
| interpolation |
Ett värde som anger hur ökning kommer att interpoleras mellan dokumentpoäng. standardvärdet "Linjär". |
|
| tag |
Parametervärden för taggbedömningsfunktionen. |
|
| type |
string:
tag |
Typ av poängfunktion. |
TagScoringParameters
Ger parametervärden till en taggbedömningsfunktion.
| Name | Typ | Description |
|---|---|---|
| tagsParameter |
string |
Namnet på parametern som skickas i sökfrågor för att ange listan med taggar som ska jämföras med målfältet. |
TextWeights
Definierar vikter för indexfält för vilka matchningar ska öka poängsättningen i sökfrågor.
| Name | Typ | Description |
|---|---|---|
| weights |
object |
Ordlistan med vikter per fält för att öka dokumentpoängsättningen. Nycklarna är fältnamn och värdena är vikterna för varje fält. |
TokenCharacterKind
Representerar klasser av tecken som ett tokenfilter kan användas på.
| Värde | Description |
|---|---|
| letter |
Behåller bokstäver i tokens. |
| digit |
Behåller siffror i tokens. |
| whitespace |
Behåller blanksteg i tokens. |
| punctuation |
Behåller skiljetecken i token. |
| symbol |
Behåller symboler i tokens. |
TokenFilterName
Definierar namnen på alla tokenfilter som stöds av sökmotorn.
TruncateTokenFilter
Trunkerar termerna till en viss längd. Det här tokenfiltret implementeras med Apache Lucene.
| Name | Typ | Standardvärde | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
|
| length |
integer (int32) maximum: 300 |
300 |
Längden som termerna ska trunkeras med. Standard och max är 300. |
| name |
string |
Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
UaxUrlEmailTokenizer
Tokeniserar URL:er och e-postmeddelanden som en token. Den här tokenizern implementeras med Apache Lucene.
| Name | Typ | Standardvärde | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
|
| maxTokenLength |
integer (int32) maximum: 300 |
255 |
Maximal tokenlängd. Standardvärdet är 255. Token som är längre än den maximala längden delas upp. Den maximala tokenlängden som kan användas är 300 tecken. |
| name |
string |
Namnet på tokenizern. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
UniqueTokenFilter
Filtrerar bort token med samma text som föregående token. Det här tokenfiltret implementeras med Apache Lucene.
| Name | Typ | Standardvärde | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
|
| name |
string |
Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
|
| onlyOnSamePosition |
boolean |
False |
Ett värde som anger om du bara vill ta bort dubbletter på samma position. Standardvärdet är false. |
VectorEncodingFormat
Kodningsformatet för tolkning av vektorfältinnehåll.
| Värde | Description |
|---|---|
| packedBit |
Kodningsformat som representerar bitar som är packade i en bredare datatyp. |
VectorSearch
Innehåller konfigurationsalternativ som rör vektorsökning.
| Name | Typ | Description |
|---|---|---|
| algorithms | VectorSearchAlgorithmConfiguration[]: |
Innehåller konfigurationsalternativ som är specifika för den algoritm som används under indexering eller frågor. |
| compressions | VectorSearchCompression[]: |
Innehåller konfigurationsalternativ som är specifika för komprimeringsmetoden som används vid indexering eller frågor. |
| profiles |
Definierar kombinationer av konfigurationer som ska användas med vektorsökning. |
|
| vectorizers | VectorSearchVectorizer[]: |
Innehåller konfigurationsalternativ för hur du vektoriserar textvektorfrågor. |
VectorSearchAlgorithmKind
Algoritmen som används för indexering och frågor.
| Värde | Description |
|---|---|
| hnsw |
HNSW (Hierarchical Navigable Small World), en typ av ungefärlig närmaste grannalgoritm. |
| exhaustiveKnn |
Fullständig KNN-algoritm som utför brute-force-sökning. |
VectorSearchAlgorithmMetric
Likhetsmåttet som ska användas för vektorjämförelser. Vi rekommenderar att du väljer samma likhetsmått som inbäddningsmodellen tränades på.
| Värde | Description |
|---|---|
| cosine |
Mäter vinkeln mellan vektorer för att kvantifiera deras likhet och bortse från omfattningen. Ju mindre vinkel, desto närmare likhet. |
| euclidean |
Beräknar det raka avståndet mellan vektorer i ett flerdimensionellt utrymme. Ju mindre avstånd, desto närmare likhet. |
| dotProduct |
Beräknar summan av elementbaserade produkter för att mäta justering och storlekslikhet. Ju större och mer positiv, desto närmare likhet. |
| hamming |
Gäller endast för bitpackade binära datatyper. Avgör olikhet genom att räkna olika positioner i binära vektorer. Ju färre skillnader, desto närmare likhet. |
VectorSearchCompressionKind
Den komprimeringsmetod som används för indexering och frågor.
| Värde | Description |
|---|---|
| scalarQuantization |
Scalar Quantization, en typ av komprimeringsmetod. I skalär kvantisering komprimeras de ursprungliga vektorvärdena till en smalare typ genom att diskretisera och representera varje komponent i en vektor med hjälp av en reducerad uppsättning kvantiserade värden, vilket minskar den totala datastorleken. |
| binaryQuantization |
Binär kvantisering, en typ av komprimeringsmetod. I binär kvantisering komprimeras de ursprungliga vektorvärdena till den smalare binära typen genom att diskretisera och representera varje komponent i en vektor med binära värden, vilket minskar den totala datastorleken. |
VectorSearchCompressionTarget
Den kvantiserade datatypen för komprimerade vektorvärden.
| Värde | Description |
|---|---|
| int8 |
8-bitars signerat heltal. |
VectorSearchProfile
Definierar en kombination av konfigurationer som ska användas med vektorsökning.
| Name | Typ | Description |
|---|---|---|
| algorithm |
string |
Namnet på konfigurationen av vektorsökningsalgoritmen som anger algoritmen och valfria parametrar. |
| compression |
string |
Namnet på konfigurationen av komprimeringsmetoden som anger komprimeringsmetoden och valfria parametrar. |
| name |
string |
Namnet som ska associeras med den här vektorsökningsprofilen. |
| vectorizer |
string |
Namnet på vektoriseringen som konfigureras för användning med vektorsökning. |
VectorSearchVectorizerKind
Den vektoriseringsmetod som ska användas under frågetiden.
| Värde | Description |
|---|---|
| azureOpenAI |
Generera inbäddningar med hjälp av en Azure OpenAI-resurs vid frågetillfället. |
| customWebApi |
Generera inbäddningar med hjälp av en anpassad webbslutpunkt vid frågetillfället. |
| aiServicesVision |
Generera inbäddningar för en bild eller textinmatning vid frågetillfället med hjälp av Azure AI Services Vision Vectorize-API:et. |
| aml |
Generera inbäddningar med hjälp av en Azure Machine Learning-slutpunkt som distribueras via Azure AI Foundry Model Catalog vid frågetillfället. |
WebApiVectorizer
Anger en användardefinierad vektoriserare för att generera vektorbäddning av en frågesträng. Integrering av en extern vektoriserare uppnås med hjälp av det anpassade webb-API-gränssnittet för en kompetensuppsättning.
| Name | Typ | Description |
|---|---|---|
| customWebApiParameters |
Anger egenskaperna för den användardefinierade vektoriseraren. |
|
| kind |
string:
custom |
Typ av VectorSearchVectorizer. |
| name |
string |
Namnet som ska associeras med den här specifika vektoriseringsmetoden. |
WebApiVectorizerParameters
Anger egenskaperna för att ansluta till en användardefinierad vektoriserare.
| Name | Typ | Description |
|---|---|---|
| authIdentity | SearchIndexerDataIdentity: |
Den användartilldelade hanterade identiteten som används för utgående anslutningar. Om ett authResourceId har angetts och det inte har angetts används den systemtilldelade hanterade identiteten. Vid uppdateringar av indexeraren, om identiteten är ospecificerad, förblir värdet oförändrat. Om värdet är "none" rensas värdet för den här egenskapen. |
| authResourceId |
string |
Gäller anpassade endpoints som ansluter till extern kod i en Azure-funktion eller någon annan applikation som tillhandahåller transformationerna. Det här värdet ska vara det program-ID som skapades för funktionen eller appen när den registrerades med Azure Active Directory. När det anges ansluter vektoriseringen till funktionen eller appen med hjälp av ett hanterat ID (antingen system eller användartilldelat) för söktjänsten och åtkomsttoken för funktionen eller appen, med hjälp av det här värdet som resurs-ID för att skapa omfånget för åtkomsttoken. |
| httpHeaders |
object |
De huvuden som krävs för att göra HTTP-begäran. |
| httpMethod |
string |
Metoden för HTTP-begäran. |
| timeout |
string (duration) |
Önskad timeout för begäran. Standardvärdet är 30 sekunder. |
| uri |
string (uri) |
URI:n för webb-API:et som tillhandahåller vektoriseraren. |
WordDelimiterTokenFilter
Delar upp ord i underord och utför valfria transformeringar i underordsgrupper. Det här tokenfiltret implementeras med Apache Lucene.
| Name | Typ | Standardvärde | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Diskrimineringen för härledda typer. |
|
| catenateAll |
boolean |
False |
Ett värde som anger om alla underordsdelar ska kategoriseras. Om detta till exempel är inställt på sant blir "Azure-Search-1" "AzureSearch1". Standardvärdet är false. |
| catenateNumbers |
boolean |
False |
Ett värde som anger om maximala körningar av antal delar ska kategoriseras. Om detta till exempel är inställt på sant blir "1–2" "12". Standardvärdet är false. |
| catenateWords |
boolean |
False |
Ett värde som anger om maximala körningar av orddelar ska kategoriseras. Om detta till exempel är inställt på sant blir "Azure-Search" "AzureSearch". Standardvärdet är false. |
| generateNumberParts |
boolean |
True |
Ett värde som anger om nummerunderord ska genereras. Standardvärdet är sant. |
| generateWordParts |
boolean |
True |
Ett värde som anger om delord ska genereras. Om det anges genereras delar av ord. till exempel "AzureSearch" blir "Azure" "Search". Standardvärdet är sant. |
| name |
string |
Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken. |
|
| preserveOriginal |
boolean |
False |
Ett värde som anger om ursprungliga ord ska bevaras och läggas till i underordslistan. Standardvärdet är false. |
| protectedWords |
string[] |
En lista över token som ska skyddas från att avgränsas. |
|
| splitOnCaseChange |
boolean |
True |
Ett värde som anger om ord ska delas i caseChange. Om detta till exempel är inställt på sant blir "AzureSearch" "Azure" "Search". Standardvärdet är sant. |
| splitOnNumerics |
boolean |
True |
Ett värde som anger om du vill dela på tal. Om detta till exempel är inställt på sant blir "Azure1Search" "Azure" "1" "Search". Standardvärdet är sant. |
| stemEnglishPossessive |
boolean |
True |
Ett värde som anger om du vill ta bort avslutande "'s" för varje underord. Standardvärdet är sant. |