Indexes - Analyze

Laat zien hoe een analyseprogramma tekst opsplitst in tokens.

POST {endpoint}/indexes('{indexName}')/search.analyze?api-version=2026-04-01

URI-parameters

Name In Vereist Type Description
endpoint
path True

string (uri)

De eindpunt-URL van de zoekservice.

indexName
path True

string

De naam van de index.

api-version
query True

string

minLength: 1

De API-versie die voor deze bewerking moet worden gebruikt.

Aanvraagkoptekst

Name Vereist Type Description
Accept

Accept

De Accepteer kop.

x-ms-client-request-id

string (uuid)

Een ondoorzichtige, wereldwijd unieke, door de client gegenereerde tekenreeks-id voor de aanvraag.

Aanvraagbody

Name Vereist Type Description
text True

string

De tekst die moet worden opgesplitst in tokens.

analyzer

LexicalAnalyzerName

De naam van de analyse die moet worden gebruikt om de opgegeven tekst te verbreken. Als deze parameter niet is opgegeven, moet u in plaats daarvan een tokenizer opgeven. De tokenizer- en analyseparameters sluiten elkaar wederzijds uit.

charFilters

CharFilterName[]

Een optionele lijst met tekenfilters die moeten worden gebruikt bij het verbreken van de opgegeven tekst. Deze parameter kan alleen worden ingesteld wanneer u de tokenizer-parameter gebruikt.

normalizer

LexicalNormalizerName

De naam van de normalisator die moet worden gebruikt om de gegeven tekst te normaliseren.

tokenFilters

TokenFilterName[]

Een optionele lijst met tokenfilters die moeten worden gebruikt bij het verbreken van de opgegeven tekst. Deze parameter kan alleen worden ingesteld wanneer u de tokenizer-parameter gebruikt.

tokenizer

LexicalTokenizerName

De naam van de tokenizer die moet worden gebruikt om de opgegeven tekst te verbreken. Als deze parameter niet is opgegeven, moet u in plaats daarvan een analyse opgeven. De tokenizer- en analyseparameters sluiten elkaar wederzijds uit.

Antwoorden

Name Type Description
200 OK

AnalyzeResult

De aanvraag is voltooid.

Other Status Codes

ErrorResponse

Een onverwachte foutreactie.

Beveiliging

api-key

Type: apiKey
In: header

OAuth2Auth

Type: oauth2
Stroom: implicit
Autorisatie-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize

Bereiken

Name Description
https://search.azure.com/.default

Voorbeelden

SearchServiceIndexAnalyze

Voorbeeldaanvraag

POST https://exampleservice.search.windows.net/indexes('example-index')/search.analyze?api-version=2026-04-01


{
  "text": "Text to analyze",
  "analyzer": "ar.lucene"
}

Voorbeeldrespons

{
  "tokens": [
    {
      "token": "text",
      "startOffset": 0,
      "endOffset": 4,
      "position": 0
    },
    {
      "token": "to",
      "startOffset": 5,
      "endOffset": 7,
      "position": 1
    },
    {
      "token": "analyze",
      "startOffset": 8,
      "endOffset": 15,
      "position": 2
    }
  ]
}

Definities

Name Description
Accept

De Accepteer kop.

AnalyzedTokenInfo

Informatie over een token dat wordt geretourneerd door een analyse.

AnalyzeRequest

Hiermee geeft u enkele tekst- en analyseonderdelen op die worden gebruikt om die tekst op te splitsen in tokens.

AnalyzeResult

Het resultaat van het testen van een analyse op tekst.

CharFilterName

Definieert de namen van alle tekenfilters die door de zoekmachine worden ondersteund.

ErrorAdditionalInfo

Aanvullende informatie over de resourcebeheerfout.

ErrorDetail

De foutdetails.

ErrorResponse

Veelvoorkomende foutrespons voor alle Azure Resource Manager API's om foutdetails terug te geven bij mislukte bewerkingen. (Dit volgt ook de OData-foutreactieindeling.)

LexicalAnalyzerName

Definieert de namen van alle tekstanalysatoren die door de zoekmachine worden ondersteund.

LexicalNormalizerName

Definieert de namen van alle tekstnormalizers die door de zoekmachine worden ondersteund.

LexicalTokenizerName

Definieert de namen van alle tokenizers die door de zoekmachine worden ondersteund.

TokenFilterName

Definieert de namen van alle tokenfilters die door de zoekmachine worden ondersteund.

Accept

De Accepteer kop.

Waarde Description
application/json;odata.metadata=minimal

AnalyzedTokenInfo

Informatie over een token dat wordt geretourneerd door een analyse.

Name Type Description
endOffset

integer (int32)

De index van het laatste teken van het token in de invoertekst.

position

integer (int32)

De positie van het token in de invoertekst ten opzichte van andere tokens. Het eerste token in de invoertekst heeft positie 0, de volgende heeft positie 1, enzovoort. Afhankelijk van de gebruikte analyse hebben sommige tokens mogelijk dezelfde positie, bijvoorbeeld als ze synoniemen van elkaar zijn.

startOffset

integer (int32)

De index van het eerste teken van het token in de invoertekst.

token

string

Het token dat door de analyse wordt geretourneerd.

AnalyzeRequest

Hiermee geeft u enkele tekst- en analyseonderdelen op die worden gebruikt om die tekst op te splitsen in tokens.

Name Type Description
analyzer

LexicalAnalyzerName

De naam van de analyse die moet worden gebruikt om de opgegeven tekst te verbreken. Als deze parameter niet is opgegeven, moet u in plaats daarvan een tokenizer opgeven. De tokenizer- en analyseparameters sluiten elkaar wederzijds uit.

charFilters

CharFilterName[]

Een optionele lijst met tekenfilters die moeten worden gebruikt bij het verbreken van de opgegeven tekst. Deze parameter kan alleen worden ingesteld wanneer u de tokenizer-parameter gebruikt.

normalizer

LexicalNormalizerName

De naam van de normalisator die moet worden gebruikt om de gegeven tekst te normaliseren.

text

string

De tekst die moet worden opgesplitst in tokens.

tokenFilters

TokenFilterName[]

Een optionele lijst met tokenfilters die moeten worden gebruikt bij het verbreken van de opgegeven tekst. Deze parameter kan alleen worden ingesteld wanneer u de tokenizer-parameter gebruikt.

tokenizer

LexicalTokenizerName

De naam van de tokenizer die moet worden gebruikt om de opgegeven tekst te verbreken. Als deze parameter niet is opgegeven, moet u in plaats daarvan een analyse opgeven. De tokenizer- en analyseparameters sluiten elkaar wederzijds uit.

AnalyzeResult

Het resultaat van het testen van een analyse op tekst.

Name Type Description
tokens

AnalyzedTokenInfo[]

De lijst met tokens die worden geretourneerd door de analysator die in de aanvraag is opgegeven.

CharFilterName

Definieert de namen van alle tekenfilters die door de zoekmachine worden ondersteund.

Waarde Description
html_strip

Een tekenfilter waarmee HTML-constructies worden verwijderd. Zie https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/charfilter/HTMLStripCharFilter.html

ErrorAdditionalInfo

Aanvullende informatie over de resourcebeheerfout.

Name Type Description
info

De aanvullende informatie.

type

string

Het extra informatietype.

ErrorDetail

De foutdetails.

Name Type Description
additionalInfo

ErrorAdditionalInfo[]

De fout bevat aanvullende informatie.

code

string

De foutcode.

details

ErrorDetail[]

De foutdetails.

message

string

Het foutbericht.

target

string

Het foutdoelwit.

ErrorResponse

Veelvoorkomende foutrespons voor alle Azure Resource Manager API's om foutdetails terug te geven bij mislukte bewerkingen. (Dit volgt ook de OData-foutreactieindeling.)

Name Type Description
error

ErrorDetail

Het foutobject.

LexicalAnalyzerName

Definieert de namen van alle tekstanalysatoren die door de zoekmachine worden ondersteund.

Waarde Description
ar.microsoft

Microsoft-analyzer voor Arabisch.

ar.lucene

Lucene analyzer voor Arabisch.

hy.lucene

Lucene analyzer voor Armeens.

bn.microsoft

Microsoft-analyzer voor Bengaals.

eu.lucene

Lucene-analysator voor Baskisch.

bg.microsoft

Microsoft-analyzer voor Bulgaars.

bg.lucene

Lucene analyzer voor Bulgaars.

ca.microsoft

Microsoft-analyzer voor Catalaans.

ca.lucene

Lucene analyzer voor Catalaans.

zh-Hans.microsoft

Microsoft-analyzer voor Chinees (vereenvoudigd).

zh-Hans.lucene

Lucene analyzer voor Chinees (Vereenvoudigd).

zh-Hant.microsoft

Microsoft analyzer voor Chinees (traditioneel).

zh-Hant.lucene

Lucene analyzer voor Chinees (traditioneel).

hr.microsoft

Microsoft analyzer voor Kroatisch.

cs.microsoft

Microsoft-analyzer voor Tsjechisch.

cs.lucene

Lucene analyzer voor Tsjechisch.

da.microsoft

Microsoft-analyzer voor Deens.

da.lucene

Lucene analyzer voor Deens.

nl.microsoft

Microsoft analyzer voor Nederlands.

nl.lucene

Lucene analyzer voor Nederlands.

en.microsoft

Microsoft analyzer voor Engels.

en.lucene

Lucene analyzer voor Engels.

et.microsoft

Microsoft analyzer voor Ests.

fi.microsoft

Microsoft-analyzer voor Fins.

fi.lucene

Lucene analyzer voor Fins.

fr.microsoft

Microsoft-analyzer voor Frans.

fr.lucene

Lucene analyzer voor Frans.

gl.lucene

Lucene analyzer voor Galicisch.

de.microsoft

Microsoft-analyzer voor Duits.

de.lucene

Lucene analyzer voor Duits.

el.microsoft

Microsoft-analyzer voor Grieks.

el.lucene

Lucene analyzer voor Grieks.

gu.microsoft

Microsoft analyzer voor Gujarati.

he.microsoft

Microsoft-analyzer voor Hebreeuws.

hi.microsoft

Microsoft-analyzer voor Hindi.

hi.lucene

Lucene analyzer voor Hindi.

hu.microsoft

Microsoft-analyzer voor Hongaars.

hu.lucene

Lucene analyzer voor Hongaars.

is.microsoft

Microsoft-analyzer voor IJslands.

id.microsoft

Microsoft analyzer voor Indonesisch (Bahasa).

id.lucene

Lucene analyzer voor Indonesisch.

ga.lucene

Lucene analyzer voor Iers.

it.microsoft

Microsoft analyzer voor Italiaans.

it.lucene

Lucene analyzer voor Italiaans.

ja.microsoft

Microsoft analyzer voor Japans.

ja.lucene

Lucene analyzer voor Japans.

kn.microsoft

Microsoft analyzer voor Kannada.

ko.microsoft

Microsoft-analyzer voor Koreaans.

ko.lucene

Lucene analyzer voor Koreaans.

lv.microsoft

Microsoft analyzer voor Lets.

lv.lucene

Lucene analyzer voor Lets.

lt.microsoft

Microsoft analyzer voor Litouws.

ml.microsoft

Microsoft-analyzer voor Malayalam.

ms.microsoft

Microsoft-analyzer voor Maleis (Latijn).

mr.microsoft

Microsoft analyzer voor Marathi.

nb.microsoft

Microsoft analyzer for Norwegian (Bokmül).

no.lucene

Lucene analyzer voor Noors.

fa.lucene

Lucene analyzer voor Perzisch.

pl.microsoft

Microsoft analyzer voor Pools.

pl.lucene

Lucene analyzer voor Pools.

pt-BR.microsoft

Microsoft analyzer voor Portugees (Brazilië).

pt-BR.lucene

Lucene analyzer voor Portugees (Brazilië).

pt-PT.microsoft

Microsoft analyzer for Portuguese (Portugal).

pt-PT.lucene

Lucene analyzer voor Portugees (Portugal).

pa.microsoft

Microsoft analyzer voor Punjabi.

ro.microsoft

Microsoft analyzer voor Roemeens.

ro.lucene

Lucene analyzer voor Roemeens.

ru.microsoft

Microsoft-analyzer voor Russisch.

ru.lucene

Lucene analyzer voor Russisch.

sr-cyrillic.microsoft

Microsoft analyzer voor Servisch (Cyrillisch).

sr-latin.microsoft

Microsoft analyzer voor Servisch (Latijn).

sk.microsoft

Microsoft-analyzer voor Slowaaks.

sl.microsoft

Microsoft analyzer voor Sloveens.

es.microsoft

Microsoft analyzer voor Spaans.

es.lucene

Lucene analyzer voor Spaans.

sv.microsoft

Microsoft-analyzer voor Zweeds.

sv.lucene

Lucene analyzer voor Zweeds.

ta.microsoft

Microsoft-analyzer voor Tamil.

te.microsoft

Microsoft analyzer voor Telugu.

th.microsoft

Microsoft-analyzer voor Thais.

th.lucene

Lucene analyzer voor Thais.

tr.microsoft

Microsoft-analyzer voor Turks.

tr.lucene

Lucene analyzer voor Turks.

uk.microsoft

Microsoft-analyzer voor Oekraïens.

ur.microsoft

Microsoft analyzer voor Urdu.

vi.microsoft

Microsoft-analyzer voor Vietnamees.

standard.lucene

Standaard Lucene-analysator.

standardasciifolding.lucene

Standaard ASCII opvouwbare lucene-analysator. Zie https://dotnet.territoriali.olinfo.it/rest/api/searchservice/Custom-analyzers-in-Azure-Search#Analyzers

keyword

Behandelt de volledige inhoud van een veld als één token. Dit is handig voor gegevens zoals postcodes, id's en sommige productnamen. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordAnalyzer.html

pattern

Scheidt tekst flexibel in termen via een normaal expressiepatroon. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/PatternAnalyzer.html

simple

Verdeelt tekst bij niet-alfabetische tekens en zet deze om naar kleine letters. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/SimpleAnalyzer.html

stop

Verdeelt tekst bij niet-letters; Hiermee past u de tokenfilters voor kleine letters en stopworden toe. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopAnalyzer.html

whitespace

Een analyse die gebruikmaakt van de whitespace-tokenizer. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceAnalyzer.html

LexicalNormalizerName

Definieert de namen van alle tekstnormalizers die door de zoekmachine worden ondersteund.

Waarde Description
asciifolding

Converteert alfabetische, numerieke en symbolische Unicode-tekens die zich niet in de eerste 127 ASCII-tekens (het Unicode-blok Basis latijns) bevinden in hun ASCII-equivalenten, als dergelijke equivalenten bestaan. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ASCIIFoldingFilter.html

elision

Verwijdert elisies. "l'avion" (het vliegtuig) wordt bijvoorbeeld geconverteerd naar "avion" (vliegtuig). Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/util/ElisionFilter.html

lowercase

Normaliseert tokentekst naar kleine letters. Zie https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/LowerCaseFilter.html

standard

Standaard normalisator, die bestaat uit kleine letters en asciifolding. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/reverse/ReverseStringFilter.html

uppercase

Normaliseert tokentekst naar hoofdletters. Zie https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/UpperCaseFilter.html

LexicalTokenizerName

Definieert de namen van alle tokenizers die door de zoekmachine worden ondersteund.

Waarde Description
classic

Op grammatica gebaseerde tokenizer die geschikt is voor het verwerken van de meeste Europese documenten. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicTokenizer.html

edgeNGram

Hiermee wordt de invoer van een rand omgezet in n-grammen van de opgegeven grootte(en). Zie https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenizer.html

keyword_v2

Hiermee wordt de volledige invoer als één token verzonden. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordTokenizer.html

letter

Verdeelt tekst bij niet-lettertekens. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LetterTokenizer.html

lowercase

Verdeelt tekst bij niet-alfabetische tekens en zet deze om naar kleine letters. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LowerCaseTokenizer.html

microsoft_language_tokenizer

Verdeelt tekst met taalspecifieke regels.

microsoft_language_stemming_tokenizer

Verdeelt tekst met taalspecifieke regels en vermindert woorden tot de basisformulieren.

nGram

Hiermee wordt de invoer in n-grammen van de opgegeven grootte(n) tokenizes. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenizer.html

path_hierarchy_v2

Tokenizer voor pad-achtige hiërarchieën. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/path/PathHierarchyTokenizer.html

pattern

Tokenizer die gebruikmaakt van regex-patroon dat overeenkomt met het samenstellen van afzonderlijke tokens. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/pattern/PatternTokenizer.html

standard_v2

Standaard Lucene Analyzer; Samengesteld uit de standaardtokenizer, het filter in kleine letters en het stopfilter. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/StandardTokenizer.html

uax_url_email

Hiermee worden URL's en e-mailadressen als één token getokeniseerd. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/UAX29URLEmailTokenizer.html

whitespace

Verdeelt tekst op witruimte. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceTokenizer.html

TokenFilterName

Definieert de namen van alle tokenfilters die door de zoekmachine worden ondersteund.

Waarde Description
arabic_normalization

Een tokenfilter waarmee de Arabische normalisatiefunctie wordt toegepast om de orthografie te normaliseren. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ar/ArabicNormalizationFilter.html

apostrophe

Verwijdert alle tekens na een apostrof, inclusief de apostrof zelf. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/tr/ApostropheFilter.html

asciifolding

Converteert alfabetische, numerieke en symbolische Unicode-tekens die zich niet in de eerste 127 ASCII-tekens (het Unicode-blok Basis latijns) bevinden in hun ASCII-equivalenten, als dergelijke equivalenten bestaan. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ASCIIFoldingFilter.html

cjk_bigram

Vormt bigrams van CJK-termen die worden gegenereerd op basis van de standaardtokenizer. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKBigramFilter.html

cjk_width

Normaliseert CJK-breedteverschillen. Vouwt volledige breedte ASCII-varianten in het equivalente basis-Latijn, en halve breedte Katakana-varianten in de equivalente Kana. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKWidthFilter.html

classic

Verwijdert Engelse bezitwoorden en stippen uit acroniemen. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicFilter.html

common_grams

Bouw bigrams voor veelgebruikte termen tijdens het indexeren. Ook enkele termen worden nog steeds geïndexeerd, waarbij bigrams over elkaar heen worden weergegeven. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/commongrams/CommonGramsFilter.html

edgeNGram_v2

Hiermee genereert u n-grammen van de opgegeven grootte(s) vanaf de voor- of achterkant van een invoertoken. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenFilter.html

elision

Verwijdert elisies. "l'avion" (het vliegtuig) wordt bijvoorbeeld geconverteerd naar "avion" (vliegtuig). Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/util/ElisionFilter.html

german_normalization

Normaliseert Duitse tekens volgens de heuristiek van het Duitse 2-sneeuwbalalgoritme. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/de/GermanNormalizationFilter.html

hindi_normalization

Normaliseert tekst in Hindi om enkele verschillen in spellingvariaties te verwijderen. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/hi/HindiNormalizationFilter.html

indic_normalization

Normaliseert de Unicode-weergave van tekst in Indiase talen. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/in/IndicNormalizationFilter.html

keyword_repeat

Elke binnenkomende token wordt twee keer verzonden, één keer als trefwoord en eenmaal als niet-trefwoord. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/KeywordRepeatFilter.html

kstem

Een kstemfilter met hoge prestaties voor Engels. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/en/KStemFilter.html

length

Hiermee verwijdert u woorden die te lang of te kort zijn. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LengthFilter.html

limit

Beperkt het aantal tokens tijdens het indexeren. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LimitTokenCountFilter.html

lowercase

Hiermee normaliseert u tokentekst naar kleine letters. Zie https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/LowerCaseFilter.html

nGram_v2

Hiermee worden n-grammen van de opgegeven grootte(n) gegenereerd. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenFilter.html

persian_normalization

Past normalisatie toe voor Perzisch. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/fa/PersianNormalizationFilter.html

phonetic

Tokens maken voor fonetische overeenkomsten. Zie https://lucene.apache.org/core/4_10_3/analyzers-phonetic/org/apache/lucene/analysis/phonetic/package-tree.html

porter_stem

Maakt gebruik van het portier-stemmingsalgoritmen om de tokenstroom te transformeren. Zie http://tartarus.org/~martin/PorterStemmer

reverse

Hiermee wordt de tokentekenreeks omgekeerd. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/reverse/ReverseStringFilter.html

scandinavian_normalization

Normaliseert het gebruik van de uitwisselbare Scandinavische personages. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianNormalizationFilter.html

scandinavian_folding

Vouwt Scandinavische personages Ã¥á... äæÃ"Æ->a en ööà ̧à ̃-o.> Het discrimineert ook het gebruik van dubbele klinkers aa, ae, ao, oe en oo, die alleen de eerste verlaten. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianFoldingFilter.html

shingle

Hiermee maakt u combinaties van tokens als één token. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/shingle/ShingleFilter.html

snowball

Een filter dat woorden stamt met behulp van een door Snowball gegenereerde stemmer. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/snowball/SnowballFilter.html

sorani_normalization

Normaliseert de Unicode-weergave van Sorani-tekst. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ckb/SoraniNormalizationFilter.html

stemmer

Taalspecifiek stemmingsfilter. Zie https://dotnet.territoriali.olinfo.it/rest/api/searchservice/Custom-analyzers-in-Azure-Search#TokenFilters

stopwords

Hiermee verwijdert u stopwoorden uit een tokenstroom. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopFilter.html

trim

Verwijdert voorloop- en volgspaties van tokens. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TrimFilter.html

truncate

Kapt de voorwaarden af tot een specifieke lengte. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TruncateTokenFilter.html

unique

Filtert tokens met dezelfde tekst als het vorige token eruit. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/RemoveDuplicatesTokenFilter.html

uppercase

Normaliseert tokentekst in hoofdletters. Zie https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/UpperCaseFilter.html

word_delimiter

Splitst woorden in subwoorden en voert optionele transformaties uit voor subwoordgroepen.