Indexes - Analyze

Service:: Search Service

API-versie:: 2026-04-01

Laat zien hoe een analyseprogramma tekst opsplitst in tokens.

POST {endpoint}/indexes('{indexName}')/search.analyze?api-version=2026-04-01

URI-parameters

Name	In	Vereist	Type	Description
endpoint	path	True	string (uri)	De eindpunt-URL van de zoekservice.
indexName	path	True	string	De naam van de index.
api-version	query	True	string minLength: 1	De API-versie die voor deze bewerking moet worden gebruikt.

Aanvraagkoptekst

Name	Vereist	Type	Description
Accept		Accept	De Accepteer kop.
x-ms-client-request-id		string (uuid)	Een ondoorzichtige, wereldwijd unieke, door de client gegenereerde tekenreeks-id voor de aanvraag.

Aanvraagbody

Name	Vereist	Type	Description
text	True	string	De tekst die moet worden opgesplitst in tokens.
analyzer		LexicalAnalyzerName	De naam van de analyse die moet worden gebruikt om de opgegeven tekst te verbreken. Als deze parameter niet is opgegeven, moet u in plaats daarvan een tokenizer opgeven. De tokenizer- en analyseparameters sluiten elkaar wederzijds uit.
charFilters		CharFilterName[]	Een optionele lijst met tekenfilters die moeten worden gebruikt bij het verbreken van de opgegeven tekst. Deze parameter kan alleen worden ingesteld wanneer u de tokenizer-parameter gebruikt.
normalizer		LexicalNormalizerName	De naam van de normalisator die moet worden gebruikt om de gegeven tekst te normaliseren.
tokenFilters		TokenFilterName[]	Een optionele lijst met tokenfilters die moeten worden gebruikt bij het verbreken van de opgegeven tekst. Deze parameter kan alleen worden ingesteld wanneer u de tokenizer-parameter gebruikt.
tokenizer		LexicalTokenizerName	De naam van de tokenizer die moet worden gebruikt om de opgegeven tekst te verbreken. Als deze parameter niet is opgegeven, moet u in plaats daarvan een analyse opgeven. De tokenizer- en analyseparameters sluiten elkaar wederzijds uit.

Antwoorden

Name	Type	Description
200 OK	AnalyzeResult	De aanvraag is voltooid.
Other Status Codes	ErrorResponse	Een onverwachte foutreactie.

Beveiliging

api-key

Type: apiKey
In: header

OAuth2Auth

Type: oauth2
Stroom: implicit
Autorisatie-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize

Bereiken

Name	Description
https://search.azure.com/.default

Voorbeelden

SearchServiceIndexAnalyze

Voorbeeldaanvraag

HTTP

POST https://exampleservice.search.windows.net/indexes('example-index')/search.analyze?api-version=2026-04-01


{
  "text": "Text to analyze",
  "analyzer": "ar.lucene"
}

Voorbeeldrespons

Statuscode:: 200

{
  "tokens": [
    {
      "token": "text",
      "startOffset": 0,
      "endOffset": 4,
      "position": 0
    },
    {
      "token": "to",
      "startOffset": 5,
      "endOffset": 7,
      "position": 1
    },
    {
      "token": "analyze",
      "startOffset": 8,
      "endOffset": 15,
      "position": 2
    }
  ]
}

Definities

Name	Description
Accept	De Accepteer kop.
AnalyzedTokenInfo	Informatie over een token dat wordt geretourneerd door een analyse.
AnalyzeRequest	Hiermee geeft u enkele tekst- en analyseonderdelen op die worden gebruikt om die tekst op te splitsen in tokens.
AnalyzeResult	Het resultaat van het testen van een analyse op tekst.
CharFilterName	Definieert de namen van alle tekenfilters die door de zoekmachine worden ondersteund.
ErrorAdditionalInfo	Aanvullende informatie over de resourcebeheerfout.
ErrorDetail	De foutdetails.
ErrorResponse	Veelvoorkomende foutrespons voor alle Azure Resource Manager API's om foutdetails terug te geven bij mislukte bewerkingen. (Dit volgt ook de OData-foutreactieindeling.)
LexicalAnalyzerName	Definieert de namen van alle tekstanalysatoren die door de zoekmachine worden ondersteund.
LexicalNormalizerName	Definieert de namen van alle tekstnormalizers die door de zoekmachine worden ondersteund.
LexicalTokenizerName	Definieert de namen van alle tokenizers die door de zoekmachine worden ondersteund.
TokenFilterName	Definieert de namen van alle tokenfilters die door de zoekmachine worden ondersteund.

Accept

Opsomming

De Accepteer kop.

Waarde	Description
application/json;odata.metadata=minimal

AnalyzedTokenInfo

Object

Informatie over een token dat wordt geretourneerd door een analyse.

Name	Type	Description
endOffset	integer (int32)	De index van het laatste teken van het token in de invoertekst.
position	integer (int32)	De positie van het token in de invoertekst ten opzichte van andere tokens. Het eerste token in de invoertekst heeft positie 0, de volgende heeft positie 1, enzovoort. Afhankelijk van de gebruikte analyse hebben sommige tokens mogelijk dezelfde positie, bijvoorbeeld als ze synoniemen van elkaar zijn.
startOffset	integer (int32)	De index van het eerste teken van het token in de invoertekst.
token	string	Het token dat door de analyse wordt geretourneerd.

AnalyzeRequest

Object

Hiermee geeft u enkele tekst- en analyseonderdelen op die worden gebruikt om die tekst op te splitsen in tokens.

Name	Type	Description
analyzer	LexicalAnalyzerName	De naam van de analyse die moet worden gebruikt om de opgegeven tekst te verbreken. Als deze parameter niet is opgegeven, moet u in plaats daarvan een tokenizer opgeven. De tokenizer- en analyseparameters sluiten elkaar wederzijds uit.
charFilters	CharFilterName[]	Een optionele lijst met tekenfilters die moeten worden gebruikt bij het verbreken van de opgegeven tekst. Deze parameter kan alleen worden ingesteld wanneer u de tokenizer-parameter gebruikt.
normalizer	LexicalNormalizerName	De naam van de normalisator die moet worden gebruikt om de gegeven tekst te normaliseren.
text	string	De tekst die moet worden opgesplitst in tokens.
tokenFilters	TokenFilterName[]	Een optionele lijst met tokenfilters die moeten worden gebruikt bij het verbreken van de opgegeven tekst. Deze parameter kan alleen worden ingesteld wanneer u de tokenizer-parameter gebruikt.
tokenizer	LexicalTokenizerName	De naam van de tokenizer die moet worden gebruikt om de opgegeven tekst te verbreken. Als deze parameter niet is opgegeven, moet u in plaats daarvan een analyse opgeven. De tokenizer- en analyseparameters sluiten elkaar wederzijds uit.

AnalyzeResult

Object

Het resultaat van het testen van een analyse op tekst.

Name	Type	Description
tokens	AnalyzedTokenInfo[]	De lijst met tokens die worden geretourneerd door de analysator die in de aanvraag is opgegeven.

CharFilterName

Opsomming

Definieert de namen van alle tekenfilters die door de zoekmachine worden ondersteund.

Waarde	Description
html_strip	Een tekenfilter waarmee HTML-constructies worden verwijderd. Zie https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/charfilter/HTMLStripCharFilter.html

ErrorAdditionalInfo

Object

Aanvullende informatie over de resourcebeheerfout.

Name	Type	Description
info		De aanvullende informatie.
type	string	Het extra informatietype.

ErrorDetail

Object

De foutdetails.

Name	Type	Description
additionalInfo	ErrorAdditionalInfo[]	De fout bevat aanvullende informatie.
code	string	De foutcode.
details	ErrorDetail[]	De foutdetails.
message	string	Het foutbericht.
target	string	Het foutdoelwit.

ErrorResponse

Object

Veelvoorkomende foutrespons voor alle Azure Resource Manager API's om foutdetails terug te geven bij mislukte bewerkingen. (Dit volgt ook de OData-foutreactieindeling.)

Name	Type	Description
error	ErrorDetail	Het foutobject.

LexicalAnalyzerName

Opsomming

Definieert de namen van alle tekstanalysatoren die door de zoekmachine worden ondersteund.

Waarde	Description
ar.microsoft	Microsoft-analyzer voor Arabisch.
ar.lucene	Lucene analyzer voor Arabisch.
hy.lucene	Lucene analyzer voor Armeens.
bn.microsoft	Microsoft-analyzer voor Bengaals.
eu.lucene	Lucene-analysator voor Baskisch.
bg.microsoft	Microsoft-analyzer voor Bulgaars.
bg.lucene	Lucene analyzer voor Bulgaars.
ca.microsoft	Microsoft-analyzer voor Catalaans.
ca.lucene	Lucene analyzer voor Catalaans.
zh-Hans.microsoft	Microsoft-analyzer voor Chinees (vereenvoudigd).
zh-Hans.lucene	Lucene analyzer voor Chinees (Vereenvoudigd).
zh-Hant.microsoft	Microsoft analyzer voor Chinees (traditioneel).
zh-Hant.lucene	Lucene analyzer voor Chinees (traditioneel).
hr.microsoft	Microsoft analyzer voor Kroatisch.
cs.microsoft	Microsoft-analyzer voor Tsjechisch.
cs.lucene	Lucene analyzer voor Tsjechisch.
da.microsoft	Microsoft-analyzer voor Deens.
da.lucene	Lucene analyzer voor Deens.
nl.microsoft	Microsoft analyzer voor Nederlands.
nl.lucene	Lucene analyzer voor Nederlands.
en.microsoft	Microsoft analyzer voor Engels.
en.lucene	Lucene analyzer voor Engels.
et.microsoft	Microsoft analyzer voor Ests.
fi.microsoft	Microsoft-analyzer voor Fins.
fi.lucene	Lucene analyzer voor Fins.
fr.microsoft	Microsoft-analyzer voor Frans.
fr.lucene	Lucene analyzer voor Frans.
gl.lucene	Lucene analyzer voor Galicisch.
de.microsoft	Microsoft-analyzer voor Duits.
de.lucene	Lucene analyzer voor Duits.
el.microsoft	Microsoft-analyzer voor Grieks.
el.lucene	Lucene analyzer voor Grieks.
gu.microsoft	Microsoft analyzer voor Gujarati.
he.microsoft	Microsoft-analyzer voor Hebreeuws.
hi.microsoft	Microsoft-analyzer voor Hindi.
hi.lucene	Lucene analyzer voor Hindi.
hu.microsoft	Microsoft-analyzer voor Hongaars.
hu.lucene	Lucene analyzer voor Hongaars.
is.microsoft	Microsoft-analyzer voor IJslands.
id.microsoft	Microsoft analyzer voor Indonesisch (Bahasa).
id.lucene	Lucene analyzer voor Indonesisch.
ga.lucene	Lucene analyzer voor Iers.
it.microsoft	Microsoft analyzer voor Italiaans.
it.lucene	Lucene analyzer voor Italiaans.
ja.microsoft	Microsoft analyzer voor Japans.
ja.lucene	Lucene analyzer voor Japans.
kn.microsoft	Microsoft analyzer voor Kannada.
ko.microsoft	Microsoft-analyzer voor Koreaans.
ko.lucene	Lucene analyzer voor Koreaans.
lv.microsoft	Microsoft analyzer voor Lets.
lv.lucene	Lucene analyzer voor Lets.
lt.microsoft	Microsoft analyzer voor Litouws.
ml.microsoft	Microsoft-analyzer voor Malayalam.
ms.microsoft	Microsoft-analyzer voor Maleis (Latijn).
mr.microsoft	Microsoft analyzer voor Marathi.
nb.microsoft	Microsoft analyzer for Norwegian (Bokmül).
no.lucene	Lucene analyzer voor Noors.
fa.lucene	Lucene analyzer voor Perzisch.
pl.microsoft	Microsoft analyzer voor Pools.
pl.lucene	Lucene analyzer voor Pools.
pt-BR.microsoft	Microsoft analyzer voor Portugees (Brazilië).
pt-BR.lucene	Lucene analyzer voor Portugees (Brazilië).
pt-PT.microsoft	Microsoft analyzer for Portuguese (Portugal).
pt-PT.lucene	Lucene analyzer voor Portugees (Portugal).
pa.microsoft	Microsoft analyzer voor Punjabi.
ro.microsoft	Microsoft analyzer voor Roemeens.
ro.lucene	Lucene analyzer voor Roemeens.
ru.microsoft	Microsoft-analyzer voor Russisch.
ru.lucene	Lucene analyzer voor Russisch.
sr-cyrillic.microsoft	Microsoft analyzer voor Servisch (Cyrillisch).
sr-latin.microsoft	Microsoft analyzer voor Servisch (Latijn).
sk.microsoft	Microsoft-analyzer voor Slowaaks.
sl.microsoft	Microsoft analyzer voor Sloveens.
es.microsoft	Microsoft analyzer voor Spaans.
es.lucene	Lucene analyzer voor Spaans.
sv.microsoft	Microsoft-analyzer voor Zweeds.
sv.lucene	Lucene analyzer voor Zweeds.
ta.microsoft	Microsoft-analyzer voor Tamil.
te.microsoft	Microsoft analyzer voor Telugu.
th.microsoft	Microsoft-analyzer voor Thais.
th.lucene	Lucene analyzer voor Thais.
tr.microsoft	Microsoft-analyzer voor Turks.
tr.lucene	Lucene analyzer voor Turks.
uk.microsoft	Microsoft-analyzer voor Oekraïens.
ur.microsoft	Microsoft analyzer voor Urdu.
vi.microsoft	Microsoft-analyzer voor Vietnamees.
standard.lucene	Standaard Lucene-analysator.
standardasciifolding.lucene	Standaard ASCII opvouwbare lucene-analysator. Zie https://dotnet.territoriali.olinfo.it/rest/api/searchservice/Custom-analyzers-in-Azure-Search#Analyzers
keyword	Behandelt de volledige inhoud van een veld als één token. Dit is handig voor gegevens zoals postcodes, id's en sommige productnamen. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordAnalyzer.html
pattern	Scheidt tekst flexibel in termen via een normaal expressiepatroon. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/PatternAnalyzer.html
simple	Verdeelt tekst bij niet-alfabetische tekens en zet deze om naar kleine letters. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/SimpleAnalyzer.html
stop	Verdeelt tekst bij niet-letters; Hiermee past u de tokenfilters voor kleine letters en stopworden toe. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopAnalyzer.html
whitespace	Een analyse die gebruikmaakt van de whitespace-tokenizer. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceAnalyzer.html

LexicalNormalizerName

Opsomming

Definieert de namen van alle tekstnormalizers die door de zoekmachine worden ondersteund.

Waarde	Description
asciifolding	Converteert alfabetische, numerieke en symbolische Unicode-tekens die zich niet in de eerste 127 ASCII-tekens (het Unicode-blok Basis latijns) bevinden in hun ASCII-equivalenten, als dergelijke equivalenten bestaan. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ASCIIFoldingFilter.html
elision	Verwijdert elisies. "l'avion" (het vliegtuig) wordt bijvoorbeeld geconverteerd naar "avion" (vliegtuig). Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/util/ElisionFilter.html
lowercase	Normaliseert tokentekst naar kleine letters. Zie https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/LowerCaseFilter.html
standard	Standaard normalisator, die bestaat uit kleine letters en asciifolding. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/reverse/ReverseStringFilter.html
uppercase	Normaliseert tokentekst naar hoofdletters. Zie https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/UpperCaseFilter.html

LexicalTokenizerName

Opsomming

Definieert de namen van alle tokenizers die door de zoekmachine worden ondersteund.

Waarde	Description
classic	Op grammatica gebaseerde tokenizer die geschikt is voor het verwerken van de meeste Europese documenten. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicTokenizer.html
edgeNGram	Hiermee wordt de invoer van een rand omgezet in n-grammen van de opgegeven grootte(en). Zie https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenizer.html
keyword_v2	Hiermee wordt de volledige invoer als één token verzonden. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordTokenizer.html
letter	Verdeelt tekst bij niet-lettertekens. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LetterTokenizer.html
lowercase	Verdeelt tekst bij niet-alfabetische tekens en zet deze om naar kleine letters. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LowerCaseTokenizer.html
microsoft_language_tokenizer	Verdeelt tekst met taalspecifieke regels.
microsoft_language_stemming_tokenizer	Verdeelt tekst met taalspecifieke regels en vermindert woorden tot de basisformulieren.
nGram	Hiermee wordt de invoer in n-grammen van de opgegeven grootte(n) tokenizes. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenizer.html
path_hierarchy_v2	Tokenizer voor pad-achtige hiërarchieën. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/path/PathHierarchyTokenizer.html
pattern	Tokenizer die gebruikmaakt van regex-patroon dat overeenkomt met het samenstellen van afzonderlijke tokens. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/pattern/PatternTokenizer.html
standard_v2	Standaard Lucene Analyzer; Samengesteld uit de standaardtokenizer, het filter in kleine letters en het stopfilter. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/StandardTokenizer.html
uax_url_email	Hiermee worden URL's en e-mailadressen als één token getokeniseerd. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/UAX29URLEmailTokenizer.html
whitespace	Verdeelt tekst op witruimte. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceTokenizer.html

TokenFilterName

Opsomming

Definieert de namen van alle tokenfilters die door de zoekmachine worden ondersteund.

Waarde	Description
arabic_normalization	Een tokenfilter waarmee de Arabische normalisatiefunctie wordt toegepast om de orthografie te normaliseren. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ar/ArabicNormalizationFilter.html
apostrophe	Verwijdert alle tekens na een apostrof, inclusief de apostrof zelf. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/tr/ApostropheFilter.html
asciifolding	Converteert alfabetische, numerieke en symbolische Unicode-tekens die zich niet in de eerste 127 ASCII-tekens (het Unicode-blok Basis latijns) bevinden in hun ASCII-equivalenten, als dergelijke equivalenten bestaan. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ASCIIFoldingFilter.html
cjk_bigram	Vormt bigrams van CJK-termen die worden gegenereerd op basis van de standaardtokenizer. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKBigramFilter.html
cjk_width	Normaliseert CJK-breedteverschillen. Vouwt volledige breedte ASCII-varianten in het equivalente basis-Latijn, en halve breedte Katakana-varianten in de equivalente Kana. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKWidthFilter.html
classic	Verwijdert Engelse bezitwoorden en stippen uit acroniemen. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicFilter.html
common_grams	Bouw bigrams voor veelgebruikte termen tijdens het indexeren. Ook enkele termen worden nog steeds geïndexeerd, waarbij bigrams over elkaar heen worden weergegeven. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/commongrams/CommonGramsFilter.html
edgeNGram_v2	Hiermee genereert u n-grammen van de opgegeven grootte(s) vanaf de voor- of achterkant van een invoertoken. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenFilter.html
elision	Verwijdert elisies. "l'avion" (het vliegtuig) wordt bijvoorbeeld geconverteerd naar "avion" (vliegtuig). Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/util/ElisionFilter.html
german_normalization	Normaliseert Duitse tekens volgens de heuristiek van het Duitse 2-sneeuwbalalgoritme. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/de/GermanNormalizationFilter.html
hindi_normalization	Normaliseert tekst in Hindi om enkele verschillen in spellingvariaties te verwijderen. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/hi/HindiNormalizationFilter.html
indic_normalization	Normaliseert de Unicode-weergave van tekst in Indiase talen. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/in/IndicNormalizationFilter.html
keyword_repeat	Elke binnenkomende token wordt twee keer verzonden, één keer als trefwoord en eenmaal als niet-trefwoord. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/KeywordRepeatFilter.html
kstem	Een kstemfilter met hoge prestaties voor Engels. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/en/KStemFilter.html
length	Hiermee verwijdert u woorden die te lang of te kort zijn. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LengthFilter.html
limit	Beperkt het aantal tokens tijdens het indexeren. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LimitTokenCountFilter.html
lowercase	Hiermee normaliseert u tokentekst naar kleine letters. Zie https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/LowerCaseFilter.html
nGram_v2	Hiermee worden n-grammen van de opgegeven grootte(n) gegenereerd. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenFilter.html
persian_normalization	Past normalisatie toe voor Perzisch. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/fa/PersianNormalizationFilter.html
phonetic	Tokens maken voor fonetische overeenkomsten. Zie https://lucene.apache.org/core/4_10_3/analyzers-phonetic/org/apache/lucene/analysis/phonetic/package-tree.html
porter_stem	Maakt gebruik van het portier-stemmingsalgoritmen om de tokenstroom te transformeren. Zie http://tartarus.org/~martin/PorterStemmer
reverse	Hiermee wordt de tokentekenreeks omgekeerd. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/reverse/ReverseStringFilter.html
scandinavian_normalization	Normaliseert het gebruik van de uitwisselbare Scandinavische personages. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianNormalizationFilter.html
scandinavian_folding	Vouwt Scandinavische personages Ã¥á... Ã¤Ã¦Ã"Ã†->a en Ã¶Ã¶Ã ̧Ã ̃-o.> Het discrimineert ook het gebruik van dubbele klinkers aa, ae, ao, oe en oo, die alleen de eerste verlaten. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianFoldingFilter.html
shingle	Hiermee maakt u combinaties van tokens als één token. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/shingle/ShingleFilter.html
snowball	Een filter dat woorden stamt met behulp van een door Snowball gegenereerde stemmer. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/snowball/SnowballFilter.html
sorani_normalization	Normaliseert de Unicode-weergave van Sorani-tekst. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ckb/SoraniNormalizationFilter.html
stemmer	Taalspecifiek stemmingsfilter. Zie https://dotnet.territoriali.olinfo.it/rest/api/searchservice/Custom-analyzers-in-Azure-Search#TokenFilters
stopwords	Hiermee verwijdert u stopwoorden uit een tokenstroom. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopFilter.html
trim	Verwijdert voorloop- en volgspaties van tokens. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TrimFilter.html
truncate	Kapt de voorwaarden af tot een specifieke lengte. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TruncateTokenFilter.html
unique	Filtert tokens met dezelfde tekst als het vorige token eruit. Zie http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/RemoveDuplicatesTokenFilter.html
uppercase	Normaliseert tokentekst in hoofdletters. Zie https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/UpperCaseFilter.html
word_delimiter	Splitst woorden in subwoorden en voert optionele transformaties uit voor subwoordgroepen.