NGramTokenizer interface

입력을 지정된 크기의 n-gram으로 토큰화합니다. 이 토크나이저는 Apache Lucene을 사용하여 구현됩니다.

Extends

속성

maxGram

최대 n-그램 길이입니다. 기본값은 2입니다. 최대값은 300입니다.

minGram

최소 n-그램 길이입니다. 기본값은 1입니다. 최대값은 300입니다. maxGram 값보다 작아야 합니다.

odatatype

토크나이저 유형을 지정하는 URI 조각입니다.

tokenChars

토큰에 유지할 문자 클래스입니다.

상속된 속성

name

tokenizer의 이름입니다. 문자, 숫자, 공백, 대시 또는 밑줄만 포함해야 하며 영숫자 문자로만 시작하고 끝낼 수 있으며 128자로 제한됩니다.

속성 세부 정보

maxGram

최대 n-그램 길이입니다. 기본값은 2입니다. 최대값은 300입니다.

maxGram?: number

속성 값

number

minGram

최소 n-그램 길이입니다. 기본값은 1입니다. 최대값은 300입니다. maxGram 값보다 작아야 합니다.

minGram?: number

속성 값

number

odatatype

토크나이저 유형을 지정하는 URI 조각입니다.

odatatype: "#Microsoft.Azure.Search.NGramTokenizer"

속성 값

"#Microsoft.Azure.Search.NGramTokenizer"

tokenChars

토큰에 유지할 문자 클래스입니다.

tokenChars?: TokenCharacterKind[]

속성 값

상속된 속성 세부 정보

name

tokenizer의 이름입니다. 문자, 숫자, 공백, 대시 또는 밑줄만 포함해야 하며 영숫자 문자로만 시작하고 끝낼 수 있으며 128자로 제한됩니다.

name: string

속성 값

string

LexicalTokenizer.name 에서 상속됨