이 글은 Azure OpenAI용 추론 REST API 엔드포인트에 대한 자세한 내용을 제공합니다.
API specs
Azure OpenAI 모델과 자원을 관리하고 상호작용하는 것은 세 가지 주요 API 표면으로 나뉩니다:
- Control plane
- 데이터 평면 - 저작
- 데이터 평면 - 추론
각 API 서피스/명세는 서로 다른 Azure OpenAI 기능 집합을 캡슐화합니다. 각 API는 고유한 미리보기와 안정적/일반 제공(GA) API 릴리스 세트를 가지고 있습니다. 현재 미리보기 릴리스는 보통 월간 일정을 따르는 경향이 있습니다.
Important
이제 새로운 미리보기 추론 API가 추가되었습니다. 자세한 내용은 API 수명주기 가이드에서 확인하세요.
| API | 최신 미리보기 발표 | 최신 GA 릴리스 | Specifications | Description |
|---|---|---|---|---|
| Control plane | 2025-07-01-preview |
2025-06-01 |
Spec files | 제어 평면 API는 자원 생성, 모델 배포, 기타 상위 자원 관리 작업과 같은 작업에 사용됩니다. 제어 플레인은 또한 Azure Resource Manager, Bicep, Terraform, Azure CLI 같은 기능을 수행할 수 있는 것을 관리합니다. |
| Data plane | v1 preview |
v1 |
Spec files | 데이터 플레인 API는 추론 및 저작 작업을 제어합니다. |
Authentication
Azure OpenAI는 두 가지 인증 방법을 제공합니다. API 키나 Microsoft Entra ID 중 하나를 사용할 수 있습니다.
API 키 인증: 이 유형의 인증에서는 모든 API 요청이 HTTP 헤더에
api-keyAPI 키를 포함해야 합니다. 퀵스타트는 이러한 인증 방식으로 전화를 걸는 방법에 대한 안내를 제공합니다.Microsoft Entra ID 인증: Microsoft Entra 토큰을 사용해 API 호출을 인증할 수 있습니다. 인증 토큰은 요청 시 헤더로
Authorization포함됩니다. 제공된 토큰은 앞에Bearer, 예를Bearer YOUR_AUTH_TOKEN들어 로 로 붙어야 한다. Microsoft Entra ID로인증하는 방법에 관한 저희 사용 가이드를 읽어보실 수 있습니다.
REST API 버전 관리
서비스 API는 쿼리 매개변수를 사용하여 api-version 버전이 지정됩니다. 모든 버전은 YYYY-MM-DD 날짜 구조를 따릅니다. For example:
POST https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/chat/completions?api-version=2024-06-01
데이터 평면 추론
나머지 글은 Azure OpenAI 데이터 평면 추론 명세서인 2024-10-21의 GA 릴리스를 다룹니다.
최신 프리뷰 API 릴리스에 대한 문서를 찾고 있다면, 최신 미리보기 데이터 플레인 추론 API를 참고하세요
Completions
POST https://{endpoint}/openai/deployments/{deployment-id}/completions?api-version=2024-10-21
제공된 프롬프트, 매개변수, 선택한 모델에 대한 완성 과정을 생성합니다.
URI Parameters
| Name | In | Required | Type | Description |
|---|---|---|---|---|
| endpoint | path | Yes | string url |
OpenAI 엔드포인트Azure 지원(프로토콜 및 호스트명, 예: https://aoairesource.openai.azure.com. "aoairesource"를 Azure OpenAI 리소스 이름으로 대체하세요. https://{your-resource-name}.openai.azure.com |
| deployment-id | path | Yes | string | 배포된 모델의 배포 ID. |
| api-version | query | Yes | string | API version |
Request Header
| Name | Required | Type | Description |
|---|---|---|---|
| api-key | True | string | Provide Azure OpenAI API key here |
Request Body
Content-Type: application/json
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| prompt | 문자열 또는 배열 | 완료를 생성하는 프롬프트는 문자열, 문자열 배열, 토큰 배열, 또는 토큰 배열 등으로 인코딩됩니다. <|endoftext|>는 모델이 학습 중에 인식하는 문서 구분자이므로, 프롬프트가 지정되어 있지 않으면 모델은 새 문서의 처음부터 생성됩니다. |
Yes | |
| best_of | integer | 서버 측에서 완료를 생성 best_of 하며, 토큰당 로그 확률이 가장 높은 "최고"를 반환합니다. 결과는 스트리밍할 수 없습니다.와 함께 nbest_of 사용할 때, 는 후보 완성 횟수를 제어하고 n 반환할 수 있는 수를 지정합니다 â€" best_of 는 보다 커n야 합니다.참고: 이 매개변수는 많은 완료를 생성하기 때문에 토큰 할당량을 빠르게 소모할 수 있습니다. 신중하게 사용하고 와 stop에 max_tokens 대해 합리적인 설정을 반드시 확인하세요. |
No | 1 |
| echo | boolean | 완성 과정과 함께 프롬프트를 되돌려 주세요 |
No | False |
| frequency_penalty | number | 수치는 -2.0에서 2.0 사이입니다. 양수(positive)는 지금까지 텍스트 내 기존 빈도에 따라 새로운 토큰에 페널티를 적용하여, 같은 줄을 그대로 반복할 가능성을 줄입니다. |
No | 0 |
| logit_bias | object | 완료 과정에서 지정된 토큰이 등장할 확률을 수정하세요. GPT 토크나이저에서 토큰 ID로 지정된 토큰을 -100에서 100까지의 편향 값에 매핑하는 JSON 객체를 수락합니다. 수학적으로, 이 편향은 샘플링 전에 모델이 생성한 로그에 더해집니다. 정확한 효과는 모델마다 다르지만, -1에서 1 사이의 수치는 선택 가능성을 낮추거나 증가시킬 수 있습니다; -100 또는 100과 같은 값은 해당 토큰을 차단하거나 독점적으로 선택해야 합니다. 예를 들어, |endoftext|> 토큰이 생성되지 않도록 패스 {"50256": -100} 할 <수 있습니다. |
No | None |
| logprobs | integer | 가장 가능성이 높은 출력 토큰과 선택한 토큰에 대한 logprobs 로그 확률을 포함하세요. 예를 들어, 5가 logprobs 되면 API는 가장 가능성 높은 다섯 토큰 목록을 반환합니다. API는 항상 샘플링된 토큰의 를 logprob 반환하므로 응답에는 최대 요소가 logprobs+1 포함될 수 있습니다.최대 값 logprobs 은 5입니다. |
No | None |
| max_tokens | integer | 완료 과정에서 생성할 수 있는 최대 토큰 수. 프롬프트 플러스 max_tokens 의 토큰 수는 모델의 컨텍스트 길이를 초과할 수 없습니다. |
No | 16 |
| n | integer | 각 프롬프트마다 몇 개의 완료를 생성해야 하는지. 참고: 이 매개변수는 많은 완료를 생성하기 때문에 토큰 할당량을 빠르게 소모할 수 있습니다. 신중하게 사용하고 와 stop에 max_tokens 대해 합리적인 설정을 반드시 확인하세요. |
No | 1 |
| presence_penalty | number | 수치는 -2.0에서 2.0 사이입니다. 양의 값은 지금까지 텍스트에 등장했는지 여부에 따라 새로운 토큰에 페널티를 적용하여, 모델이 새로운 주제를 다룰 가능성을 높입니다. |
No | 0 |
| seed | integer | 명시가 명시되어 있을 경우, 우리 시스템은 동일한 seed 매개변수로 반복 요청이 같은 결과를 반환하도록 결정론적으로 샘플링하려 최선을 다합니다.결정론이 보장되는 것은 아니므로, 백엔드 변경 사항을 모니터링하려면 응답 매개변수를 참고 system_fingerprint 해야 합니다. |
No | |
| stop | 문자열 또는 배열 | 최대 네 개의 시퀀스에서 API가 더 이상 토큰 생성을 멈춥니다. 반환된 텍스트에는 정지 시퀀스가 포함되어 있지 않습니다. |
No | |
| stream | boolean | 부분 진행 상황을 스트리밍으로 되돌릴지 여부. 설정이 설정되면, 토큰은 데이터 전용 서버 전송 이벤트 로 전송되며, 스트림은 메시지로 data: [DONE] 종료됩니다. |
No | False |
| suffix | string | 삽입된 텍스트를 완성한 뒤에 오는 접미사입니다. 이 매개변수는 오직 에 대해 gpt-3.5-turbo-instruct서만 지원됩니다. |
No | None |
| temperature | number | 샘플링 온도는 0에서 2 사이로 사용해야 합니다. 0.8처럼 높은 값은 출력이 더 무작위적이고, 0.2처럼 낮은 값은 더 집중되고 결정론적으로 만듭니다. 일반적으로 이 부분을 변경하거나 top_p 둘 다 바꾸는 것을 권장하지 않습니다. |
No | 1 |
| top_p | number | 온도에 따른 샘플링의 대안인 핵 샘플링으로, 모델이 확률 질량을 가진 토큰의 결과를 고려하는 경우top_p. 따라서 0.1은 상위 10개의% 확률 질량을 구성하는 토큰만 고려된다는 뜻입니다. 일반적으로 이 부분을 변경하거나 temperature 둘 다 바꾸는 것을 권장하지 않습니다. |
No | 1 |
| user | string | 최종 사용자를 대표하는 고유 식별자로, 남용을 모니터링하고 탐지하는 데 도움이 됩니다. |
No |
Responses
상태 코드: 200
Description: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | createCompletionResponse | API의 완료 응답을 나타냅니다. 참고: 스트림된 응답 객체와 비스트리밍된 응답 객체는 모두 동일한 형태를 공유합니다(채팅 엔드포인트와 다릅니다). |
상태 코드: 기본 상태
설명: 서비스 불가
| Content-Type | Type | Description |
|---|---|---|
| application/json | errorResponse |
Examples
Example
제공된 프롬프트, 매개변수, 선택한 모델에 대한 완성 과정을 생성합니다.
POST https://{endpoint}/openai/deployments/{deployment-id}/completions?api-version=2024-10-21
{
"prompt": [
"tell me a joke about mango"
],
"max_tokens": 32,
"temperature": 1.0,
"n": 1
}
응답: 상태 코드: 200
{
"body": {
"id": "cmpl-7QmVI15qgYVllxK0FtxVGG6ywfzaq",
"created": 1686617332,
"choices": [
{
"text": "es\n\nWhat do you call a mango who's in charge?\n\nThe head mango.",
"index": 0,
"finish_reason": "stop",
"logprobs": null
}
],
"usage": {
"completion_tokens": 20,
"prompt_tokens": 6,
"total_tokens": 26
}
}
}
Embeddings
POST https://{endpoint}/openai/deployments/{deployment-id}/embeddings?api-version=2024-10-21
기계 학습 모델과 알고리즘이 쉽게 사용할 수 있는 주어진 입력의 벡터 표현을 얻으세요.
URI Parameters
| Name | In | Required | Type | Description |
|---|---|---|---|---|
| endpoint | path | Yes | string url |
OpenAI 엔드포인트Azure 지원(프로토콜 및 호스트명, 예: https://aoairesource.openai.azure.com. "aoairesource"를 Azure OpenAI 리소스 이름으로 대체하세요. https://{your-resource-name}.openai.azure.com |
| deployment-id | path | Yes | string | |
| api-version | query | Yes | string | API version |
Request Header
| Name | Required | Type | Description |
|---|---|---|---|
| api-key | True | string | Provide Azure OpenAI API key here |
Request Body
Content-Type: application/json
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| input | 문자열 또는 배열 | 입력 텍스트를 입력하여 입력하여 토큰 배열이나 문자열로 인코딩합니다. 단일 요청에 여러 입력을 삽입하려면 문자열 배열이나 토큰 배열 배열을 전달합니다. 입력은 모델의 최대 입력 토큰(8,192 토큰 text-embedding-ada-002)을 초과해서는 안 되며, 빈 문자열일 수 없으며, 배열은 2,048 차원 이하여야 합니다. |
Yes | |
| user | string | 최종 사용자를 나타내는 고유 식별자로, 이를 통해 남용 모니터링과 탐지를 돕습니다. | No | |
| input_type | string | 사용할 임베딩 탐색의 입력 유형 | No | |
| encoding_format | string | 임베딩을 반환하는 포맷. 또는 중 하나 floatbase64일 수 있습니다. 기본값은 float입니다. |
No | |
| dimensions | integer | 결과 출력 임베딩이 가져야 할 차원 수. 이후 모델에서만 text-embedding-3 지원됩니다. |
No |
Responses
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| object | string | Yes | ||
| model | string | Yes | ||
| data | array | Yes | ||
| usage | object | Yes |
사용 특성
prompt_tokens
| Name | Type | Description | Default |
|---|---|---|---|
| prompt_tokens | integer |
total_tokens
| Name | Type | Description | Default |
|---|---|---|---|
| total_tokens | integer |
상태 코드: 200
Description: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | object |
Examples
Example
주어진 프롬프트에 임베딩을 반환하세요.
POST https://{endpoint}/openai/deployments/{deployment-id}/embeddings?api-version=2024-10-21
{
"input": [
"this is a test"
]
}
응답: 상태 코드: 200
{
"body": {
"data": [
{
"index": 0,
"embedding": [
-0.012838088,
-0.007421397,
-0.017617522,
-0.028278312,
-0.018666342,
0.01737855,
-0.01821495,
-0.006950092,
-0.009937238,
-0.038580645,
0.010674067,
0.02412286,
-0.013647936,
0.013189907,
0.0021125758,
0.012406612,
0.020790534,
0.00074595667,
0.008397198,
-0.00535031,
0.008968075,
0.014351576,
-0.014086051,
0.015055214,
-0.022211088,
-0.025198232,
0.0065186154,
-0.036350243,
0.009180495,
-0.009698266,
0.009446018,
-0.008463579,
-0.0040426035,
-0.03443847,
-0.00091273896,
-0.0019217303,
0.002349888,
-0.021560553,
0.016515596,
-0.015572986,
0.0038666942,
-8.432463e-05
]
}
],
"usage": {
"prompt_tokens": 4,
"total_tokens": 4
}
}
}
Chat completions
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-10-21
채팅 메시지의 완료 생성
URI Parameters
| Name | In | Required | Type | Description |
|---|---|---|---|---|
| endpoint | path | Yes | string url |
OpenAI 엔드포인트Azure 지원(프로토콜 및 호스트명, 예: https://aoairesource.openai.azure.com. "aoairesource"를 Azure OpenAI 리소스 이름으로 대체하세요. https://{your-resource-name}.openai.azure.com |
| deployment-id | path | Yes | string | 배포된 모델의 배포 ID. |
| api-version | query | Yes | string | API version |
Request Header
| Name | Required | Type | Description |
|---|---|---|---|
| api-key | True | string | Provide Azure OpenAI API key here |
Request Body
Content-Type: application/json
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| temperature | number | 샘플링 온도는 0에서 2 사이로 사용해야 합니다. 0.8처럼 높은 값은 출력이 더 무작위적이고, 0.2처럼 낮은 값은 더 집중되고 결정론적으로 만듭니다. 일반적으로 이 부분을 변경하거나 top_p 둘 다 바꾸는 것을 권장하지 않습니다. |
No | 1 |
| top_p | number | 온도에 따른 샘플링의 대안인 핵 샘플링으로, 모델이 확률 질량을 가진 토큰의 결과를 고려하는 경우top_p. 따라서 0.1은 상위 10개의% 확률 질량을 구성하는 토큰만 고려된다는 뜻입니다. 일반적으로 이 부분을 변경하거나 temperature 둘 다 바꾸는 것을 권장하지 않습니다. |
No | 1 |
| stream | boolean | 설정이 완료되면 ChatGPT처럼 부분적인 메시지 델타가 전송됩니다. 토큰은 데이터 전용 서버에서 전송되는 이벤트 로 전송되며, 스트림은 메시지로 data: [DONE] 종료됩니다. |
No | False |
| stop | 문자열 또는 배열 | 최대 네 개의 시퀀스에서 API가 더 이상 토큰 생성을 멈춥니다. |
No | |
| max_tokens | integer | 채팅 완료에서 생성할 수 있는 최대 토큰 수. 입력 토큰과 생성된 토큰의 총 길이는 모델의 컨텍스트 길이에 의해 제한됩니다. |
No | |
| max_completion_tokens | integer | 완성을 위해 생성할 수 있는 토큰 수의 상한선으로, 가시적 출력 토큰과 추론 토큰을 포함합니다. | No | |
| presence_penalty | number | 수치는 -2.0에서 2.0 사이입니다. 양의 값은 지금까지 텍스트에 등장했는지 여부에 따라 새로운 토큰에 페널티를 적용하여, 모델이 새로운 주제를 다룰 가능성을 높입니다. |
No | 0 |
| frequency_penalty | number | 수치는 -2.0에서 2.0 사이입니다. 양수(positive)는 지금까지 텍스트 내 기존 빈도에 따라 새로운 토큰에 페널티를 적용하여, 같은 줄을 그대로 반복할 가능성을 줄입니다. |
No | 0 |
| logit_bias | object | 완료 과정에서 지정된 토큰이 등장할 확률을 수정하세요. 토큰 ID로 지정된 토큰을 -100에서 100까지의 편향 값에 매핑하는 JSON 객체를 받습니다. 수학적으로, 이 편향은 샘플링 전에 모델이 생성한 로그에 더해집니다. 정확한 효과는 모델마다 다르지만, -1에서 1 사이의 수치는 선택 가능성을 낮추거나 증가시킬 수 있습니다; -100 또는 100과 같은 값은 해당 토큰을 차단하거나 독점적으로 선택해야 합니다. |
No | None |
| user | string | 최종 사용자를 대표하는 고유 식별자로, 남용을 모니터링하고 탐지하는 데 도움이 됩니다. |
No | |
| messages | array | 지금까지 대화를 구성한 메시지 목록입니다. | Yes | |
| data_sources | array | Azure OpenAI 채팅 확장 프로그램의 설정 항목들입니다. 이 추가 사양은 Azure OpenAI와만 호환됩니다. |
No | |
| logprobs | boolean | 출력 토큰의 로그 확률을 반환할지 여부에 관한 문제입니다. 참이라면, 는 의 message각 출력 토큰에 반환 content 되는 로그 확률을 반환합니다. |
No | False |
| top_logprobs | integer | 0에서 20 사이의 정수로, 각 토큰 위치에서 반환될 가능성이 높은 토큰의 수를 나타내며, 각 토큰은 로그 확률을 가지고 있습니다.
logprobs 이 매개변수를 사용하면 반드시 로 true 설정해야 합니다. |
No | |
| n | integer | 입력 메시지마다 몇 개의 채팅 완료 선택지를 생성해야 할까요? 모든 선택지에서 생성된 토큰 수에 따라 요금이 부과된다는 점에 유의하세요. 비용을 최소화하기 위해 계속 관리 n1 하세요. |
No | 1 |
| parallel_tool_calls | ParallelToolCalls | 도구 사용 중 병렬 함수 호출을 활성화할지 여부. | No | True |
| response_format | ResponseFormatText 또는 ResponseFormatJsonObject 또는 ResponseFormatJsonSchema | 모델이 출력해야 할 형식을 지정하는 객체입니다.
GPT-4o, GPT-4o mini, GPT-4 Turbo 및 최신 모든 GPT-3.5 Turbo 모델gpt-3.5-turbo-1106과 호환됩니다.{ "type": "json_schema", "json_schema": {...} } 모델이 제공된 JSON 스키마와 일치하도록 보장하는 구조화 출력 활성화 설정.JSON 모드를 활성화하는 { "type": "json_object" } 설정은 모델이 생성하는 메시지가 유효한 JSON 임을 보장합니다.중요: JSON 모드를 사용할 때는 시스템이나 사용자 메시지를 통해 모델이 직접 JSON을 생성하도록 지시해야 합니다. 이 방법이 없으면 모델은 생성 제한에 도달할 때까지 끝없는 공백 흐름을 생성할 수 있으며, 이는 장시간 지속되고 '멈춘' 것처럼 보이는 요청을 초래할 수 있습니다. 또한 메시지 내용이 부분적으로 잘릴 finish_reason="length"수 있으니, 생성 시간이나 대화가 최대 맥락 길이를 초과 max_tokens 했음을 나타냅니다. |
No | |
| seed | integer | 이 기능은 베타 버전입니다. 명시가 명시되어 있을 경우, 우리 시스템은 동일한 seed 매개변수로 반복 요청이 같은 결과를 반환하도록 결정론적으로 샘플링하려 최선을 다합니다.결정론이 보장되는 것은 아니므로, 백엔드 변경 사항을 모니터링하려면 응답 매개변수를 참고 system_fingerprint 해야 합니다. |
No | |
| tools | array | 모델이 호출할 수 있는 도구 목록입니다. 현재는 함수만 지원되고 있습니다. 이를 사용해 모델이 JSON 입력을 생성할 수 있는 함수 목록을 제공하세요. 최대 128개의 기능을 지원합니다. |
No | |
| tool_choice | chatCompletionToolChoiceOption | 모델이 호출하는 도구가 어떤 것인지(있다면) 제어합니다.
none 즉, 모델은 어떤 도구를 호출하지 않고 메시지를 생성합니다.
auto 즉, 모델은 메시지를 생성하거나 하나 이상의 도구를 호출할 수 있습니다.
required 즉, 모델이 하나 이상의 도구를 호출해야 한다는 뜻입니다. 특정 도구를 지정 {"type": "function", "function": {"name": "my_function"}} 하면 모델이 그 도구를 호출하도록 강제합니다.
none 도구가 없을 때 기본값입니다.
auto 도구가 있으면 기본값입니다. |
No | |
| function_call | STRING 또는 chatCompletionFunctionCallOption |
tool_choice.모델이 호출하는 함수를 제어합니다. none 즉, 모델이 함수를 호출하지 않고 메시지를 생성합니다.auto 즉, 모델은 메시지를 생성할지 함수를 호출할지 선택할 수 있습니다.특정 함수 {"name": "my_function"} 를 지정하면 모델이 그 함수를 호출하도록 강제합니다.none 함수가 없을 때 기본값입니다.
auto 함수가 존재할 때 기본값입니다. |
No | |
| functions | array |
tools.모델이 생성할 수 있는 JSON 입력 함수들의 목록입니다. |
No |
Responses
상태 코드: 200
Description: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | createChatCompletionResponse 또는 createChatCompletionStreamResponse |
상태 코드: 기본 상태
설명: 서비스 불가
| Content-Type | Type | Description |
|---|---|---|
| application/json | errorResponse |
Examples
Example
제공된 프롬프트, 매개변수, 선택한 모델에 대한 완성 과정을 생성합니다.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-10-21
{
"messages": [
{
"role": "system",
"content": "you are a helpful assistant that talks like a pirate"
},
{
"role": "user",
"content": "can you tell me how to care for a parrot?"
}
]
}
응답: 상태 코드: 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Ahoy matey! So ye be wantin' to care for a fine squawkin' parrot, eh? Well, shiver me timbers, let ol' Cap'n Assistant share some wisdom with ye! Here be the steps to keepin' yer parrot happy 'n healthy:\n\n1. Secure a sturdy cage: Yer parrot be needin' a comfortable place to lay anchor! Be sure ye get a sturdy cage, at least double the size of the bird's wingspan, with enough space to spread their wings, yarrrr!\n\n2. Perches 'n toys: Aye, parrots need perches of different sizes, shapes, 'n textures to keep their feet healthy. Also, a few toys be helpin' to keep them entertained 'n their minds stimulated, arrrh!\n\n3. Proper grub: Feed yer feathered friend a balanced diet of high-quality pellets, fruits, 'n veggies to keep 'em strong 'n healthy. Give 'em fresh water every day, or ye\u00e2\u20ac\u2122ll have a scurvy bird on yer hands!\n\n4. Cleanliness: Swab their cage deck! Clean their cage on a regular basis: fresh water 'n food daily, the floor every couple of days, 'n a thorough scrubbing ev'ry few weeks, so the bird be livin' in a tidy haven, arrhh!\n\n5. Socialize 'n train: Parrots be a sociable lot, arrr! Exercise 'n interact with 'em daily to create a bond 'n maintain their mental 'n physical health. Train 'em with positive reinforcement, treat 'em kindly, yarrr!\n\n6. Proper rest: Yer parrot be needin' \u00e2\u20ac\u2122bout 10-12 hours o' sleep each night. Cover their cage 'n let them slumber in a dim, quiet quarter for a proper night's rest, ye scallywag!\n\n7. Keep a weather eye open for illness: Birds be hidin' their ailments, arrr! Be watchful for signs of sickness, such as lethargy, loss of appetite, puffin' up, or change in droppings, and make haste to a vet if need be.\n\n8. Provide fresh air 'n avoid toxins: Parrots be sensitive to draft and pollutants. Keep yer quarters well ventilated, but no drafts, arrr! Be mindful of toxins like Teflon fumes, candles, or air fresheners.\n\nSo there ye have it, me hearty! With proper care 'n commitment, yer parrot will be squawkin' \"Yo-ho-ho\" for many years to come! Good luck, sailor, and may the wind be at yer back!"
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
Example
Azure 검색 데이터와 시스템 할당 관리 신원을 기반으로 완료 파일을 생성합니다.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-10-21
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a dog?"
}
],
"data_sources": [
{
"type": "azure_search",
"parameters": {
"endpoint": "https://your-search-endpoint.search.windows.net/",
"index_name": "{index name}",
"authentication": {
"type": "system_assigned_managed_identity"
}
}
}
]
}
응답: 상태 코드: 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"citations": [
{
"content": "Citation content.",
"title": "Citation Title",
"filepath": "contoso.txt",
"url": "https://contoso.blob.windows.net/container/contoso.txt",
"chunk_id": "0"
}
],
"intent": "dog care"
}
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
Example
Azure Search 벡터 데이터, 이전 어시스턴트 메시지, 사용자 지정 관리 신원을 기반으로 완료 파일을 생성합니다.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-10-21
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a cat?"
},
{
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"intent": "cat care"
}
},
{
"role": "user",
"content": "how about dog?"
}
],
"data_sources": [
{
"type": "azure_search",
"parameters": {
"endpoint": "https://your-search-endpoint.search.windows.net/",
"authentication": {
"type": "user_assigned_managed_identity",
"managed_identity_resource_id": "/subscriptions/{subscription-id}/resourceGroups/{resource-group}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{resource-name}"
},
"index_name": "{index name}",
"query_type": "vector",
"embedding_dependency": {
"type": "deployment_name",
"deployment_name": "{embedding deployment name}"
},
"in_scope": true,
"top_n_documents": 5,
"strictness": 3,
"role_information": "You are an AI assistant that helps people find information.",
"fields_mapping": {
"content_fields_separator": "\\n",
"content_fields": [
"content"
],
"filepath_field": "filepath",
"title_field": "title",
"url_field": "url",
"vector_fields": [
"contentvector"
]
}
}
}
]
}
응답: 상태 코드: 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"citations": [
{
"content": "Citation content 2.",
"title": "Citation Title 2",
"filepath": "contoso2.txt",
"url": "https://contoso.blob.windows.net/container/contoso2.txt",
"chunk_id": "0"
}
],
"intent": "dog care"
}
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
Example
제공된 Azure Cosmos DB에 대한 완성 파일을 생성합니다.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-10-21
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a dog?"
}
],
"data_sources": [
{
"type": "azure_cosmos_db",
"parameters": {
"authentication": {
"type": "connection_string",
"connection_string": "mongodb+srv://rawantest:{password}$@{cluster-name}.mongocluster.cosmos.azure.com/?tls=true&authMechanism=SCRAM-SHA-256&retrywrites=false&maxIdleTimeMS=120000"
},
"database_name": "vectordb",
"container_name": "azuredocs",
"index_name": "azuredocindex",
"embedding_dependency": {
"type": "deployment_name",
"deployment_name": "{embedding deployment name}"
},
"fields_mapping": {
"content_fields": [
"content"
],
"vector_fields": [
"contentvector"
]
}
}
}
]
}
응답: 상태 코드: 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"citations": [
{
"content": "Citation content.",
"title": "Citation Title",
"filepath": "contoso.txt",
"url": "https://contoso.blob.windows.net/container/contoso.txt",
"chunk_id": "0"
}
],
"intent": "dog care"
}
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
전사 - 만들기
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2024-10-21
오디오를 입력 언어로 전사합니다.
URI Parameters
| Name | In | Required | Type | Description |
|---|---|---|---|---|
| endpoint | path | Yes | string url |
OpenAI 엔드포인트Azure 지원(프로토콜 및 호스트명, 예: https://aoairesource.openai.azure.com. "aoairesource"를 Azure OpenAI 리소스 이름으로 대체하세요. https://{your-resource-name}.openai.azure.com |
| deployment-id | path | Yes | string | 음성 변환 모델의 배포 ID. 지원되는 모델에 대한 정보는 [/azure/ai-foundry/openai/concepts/models#audio-models]를 참조하세요. |
| api-version | query | Yes | string | API version |
Request Header
| Name | Required | Type | Description |
|---|---|---|---|
| api-key | True | string | Provide Azure OpenAI API key here |
Request Body
Content-Type: multipart/form-data
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| file | string | 전사할 오디오 파일 객체. | Yes | |
| prompt | string | 모델의 스타일을 안내하거나 이전 오디오 세그먼트를 이어가는 선택적 텍스트. 프롬프트는 오디오 언어와 일치해야 합니다. | No | |
| response_format | audioResponseFormat | 출력 형식을 정의합니다. | No | |
| temperature | number | 샘플링 온도는 0에서 1 사이입니다. 0.8처럼 높은 값은 출력이 더 무작위적이고, 0.2처럼 낮은 값은 더 집중되고 결정론적으로 만듭니다. 0으로 설정하면 모델은 로그 확률을 사용해 특정 임계값에 도달할 때까지 자동으로 온도를 올립니다. | No | 0 |
| language | string | 입력 오디오의 언어. 입력 언어를 ISO-639-1 형식으로 제공하면 정확도와 지연 시간이 향상됩니다. | No |
Responses
상태 코드: 200
Description: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | audioResponse 또는 audioVerboseResponse | |
| text/plain | string | 텍스트 형식(텍스트, vtt 또는 srt 중 하나일 때)response_format 전사한 텍스트. |
Examples
Example
제공된 음성 데이터로부터 텍스트와 관련 메타데이터를 받아냅니다.
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2024-10-21
응답: 상태 코드: 200
{
"body": {
"text": "A structured object when requesting json or verbose_json"
}
}
Example
제공된 음성 데이터로부터 텍스트와 관련 메타데이터를 받아냅니다.
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2024-10-21
"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"
응답: 상태 코드: 200
{
"type": "string",
"example": "plain text when requesting text, srt, or vtt"
}
번역 - 창조
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2024-10-21
입력된 오디오를 영어 텍스트로 전사하고 번역합니다.
URI Parameters
| Name | In | Required | Type | Description |
|---|---|---|---|---|
| endpoint | path | Yes | string url |
OpenAI 엔드포인트Azure 지원(프로토콜 및 호스트명, 예: https://aoairesource.openai.azure.com. "aoairesource"를 Azure OpenAI 리소스 이름으로 대체하세요. https://{your-resource-name}.openai.azure.com |
| deployment-id | path | Yes | string | 배포된 위스퍼 모델의 배포 ID. 지원되는 모델에 대한 정보는 [/azure/ai-foundry/openai/concepts/models#audio-models]를 참조하세요. |
| api-version | query | Yes | string | API version |
Request Header
| Name | Required | Type | Description |
|---|---|---|---|
| api-key | True | string | Provide Azure OpenAI API key here |
Request Body
Content-Type: multipart/form-data
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| file | string | 번역할 오디오 파일. | Yes | |
| prompt | string | 모델의 스타일을 안내하거나 이전 오디오 세그먼트를 이어가는 선택적 텍스트. 프롬프트는 영어로 작성되어야 합니다. | No | |
| response_format | audioResponseFormat | 출력 형식을 정의합니다. | No | |
| temperature | number | 샘플링 온도는 0에서 1 사이입니다. 0.8처럼 높은 값은 출력이 더 무작위적이고, 0.2처럼 낮은 값은 더 집중되고 결정론적으로 만듭니다. 0으로 설정하면 모델은 로그 확률을 사용해 특정 임계값에 도달할 때까지 자동으로 온도를 올립니다. | No | 0 |
Responses
상태 코드: 200
Description: OK
| Content-Type | Type | Description |
|---|---|---|
| application/json | audioResponse 또는 audioVerboseResponse | |
| text/plain | string | 텍스트 형식(텍스트, vtt 또는 srt 중 하나일 때)response_format 전사한 텍스트. |
Examples
Example
제공된 음성 데이터로부터 영어 전사된 텍스트와 관련 메타데이터를 제공합니다.
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2024-10-21
"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"
응답: 상태 코드: 200
{
"body": {
"text": "A structured object when requesting json or verbose_json"
}
}
Example
제공된 음성 데이터로부터 영어 전사된 텍스트와 관련 메타데이터를 제공합니다.
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2024-10-21
"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"
응답: 상태 코드: 200
{
"type": "string",
"example": "plain text when requesting text, srt, or vtt"
}
Image generation
POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2024-10-21
주어진 dall-e 모델 배포에서 텍스트 캡션으로부터 이미지 배치를 생성합니다
URI Parameters
| Name | In | Required | Type | Description |
|---|---|---|---|---|
| endpoint | path | Yes | string url |
OpenAI 엔드포인트Azure 지원(프로토콜 및 호스트명, 예: https://aoairesource.openai.azure.com. "aoairesource"를 Azure OpenAI 리소스 이름으로 대체하세요. https://{your-resource-name}.openai.azure.com |
| deployment-id | path | Yes | string | 배치된 dall-e 모델의 배치 ID. |
| api-version | query | Yes | string | API version |
Request Header
| Name | Required | Type | Description |
|---|---|---|---|
| api-key | True | string | Provide Azure OpenAI API key here |
Request Body
Content-Type: application/json
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| prompt | string | 원하는 이미지에 대한 텍스트 설명. 최대 길이는 4,000자입니다. | Yes | |
| n | integer | 생성해야 할 이미지 수. | No | 1 |
| size | imageSize | 생성된 이미지의 크기. | No | 1024x1024 |
| response_format | imagesResponseFormat | 생성된 이미지가 반환되는 형식입니다. | No | url |
| user | string | 최종 사용자를 대표하는 고유 식별자로, 남용을 모니터링하고 탐지하는 데 도움이 됩니다. | No | |
| quality | imageQuality | 생성될 이미지의 품질입니다. | No | standard |
| style | imageStyle | 생성된 이미지의 스타일. | No | vivid |
Responses
상태 코드: 200
Description: Ok
| Content-Type | Type | Description |
|---|---|---|
| application/json | generateImagesResponse |
상태 코드: 기본 상태
설명: 오류가 발생했습니다.
| Content-Type | Type | Description |
|---|---|---|
| application/json | dalleErrorResponse |
Examples
Example
프롬프트가 주어진 이미지를 생성합니다.
POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2024-10-21
{
"prompt": "In the style of WordArt, Microsoft Clippy wearing a cowboy hat.",
"n": 1,
"style": "natural",
"quality": "standard"
}
응답: 상태 코드: 200
{
"body": {
"created": 1698342300,
"data": [
{
"revised_prompt": "A vivid, natural representation of Microsoft Clippy wearing a cowboy hat.",
"prompt_filter_results": {
"sexual": {
"severity": "safe",
"filtered": false
},
"violence": {
"severity": "safe",
"filtered": false
},
"hate": {
"severity": "safe",
"filtered": false
},
"self_harm": {
"severity": "safe",
"filtered": false
},
"profanity": {
"detected": false,
"filtered": false
}
},
"url": "https://dalletipusw2.blob.core.windows.net/private/images/e5451cc6-b1ad-4747-bd46-b89a3a3b8bc3/generated_00.png?se=2023-10-27T17%3A45%3A09Z&...",
"content_filter_results": {
"sexual": {
"severity": "safe",
"filtered": false
},
"violence": {
"severity": "safe",
"filtered": false
},
"hate": {
"severity": "safe",
"filtered": false
},
"self_harm": {
"severity": "safe",
"filtered": false
}
}
}
]
}
}
Components
errorResponse
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| error | error | No |
errorBase
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| code | string | No | ||
| message | string | No |
error
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| param | string | No | ||
| type | string | No | ||
| inner_error | innerError | 내부 오류가 추가된 세부사항입니다. | No |
innerError
내부 오류가 추가된 세부사항입니다.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| code | innerErrorCode | 내부 오류 객체에 대한 오류 코드. | No | |
| content_filter_results | contentFilterPromptResults | 콘텐츠 필터링 카테고리(증오, 성적, 폭력, self_harm), 감지 여부, 심각도 수준(very_low, 낮음, 중간, 고수준, 해로운 콘텐츠의 강도와 위험 수준을 결정함), 필터링 여부에 관한 정보입니다. 탈옥 내용과 욕설에 관한 정보, 감지되었는지, 필터링되었는지 여부. 그리고 고객 차단 목록이 필터링되었는지 여부와 그 ID에 관한 정보도 알려줍니다. | No |
innerErrorCode
내부 오류 객체에 대한 오류 코드.
설명: 내부 오류 객체의 오류 코드.
Type: string
Default:
열거 이름: InnerErrorCode
Enum Values:
| Value | Description |
|---|---|
| ResponsibleAIPolicyViolation | 이 프롬프트는 또 다른 콘텐츠 필터 규칙 중 하나를 위반했습니다. |
dalleErrorResponse
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| error | dalleError | No |
dalleError
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| param | string | No | ||
| type | string | No | ||
| inner_error | dalleInnerError | 내부 오류가 추가된 세부사항입니다. | No |
dalleInnerError
내부 오류가 추가된 세부사항입니다.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| code | innerErrorCode | 내부 오류 객체에 대한 오류 코드. | No | |
| content_filter_results | dalleFilterResults | 콘텐츠 필터링 카테고리(증오, 성적, 폭력, self_harm), 감지 여부, 심각도 수준(very_low, 낮음, 중간, 고수준, 해로운 콘텐츠의 강도와 위험 수준을 결정함), 필터링 여부에 관한 정보입니다. 탈옥 내용과 욕설에 관한 정보, 감지되었는지, 필터링되었는지 여부. 그리고 고객 차단 목록이 필터링되었는지 여부와 그 ID에 관한 정보도 알려줍니다. | No | |
| revised_prompt | string | 이미지를 생성하는 데 사용된 프롬프트, 혹은 프롬프트에 수정된 부분이 있다면 말이죠. | No |
contentFilterResultBase
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| filtered | boolean | Yes |
contentFilterSeverityResult
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| filtered | boolean | Yes | ||
| severity | string | No |
contentFilterDetectedResult
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| filtered | boolean | Yes | ||
| detected | boolean | No |
contentFilterDetectedWithCitationResult
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| citation | object | No |
인용을 위한 특성
URL
| Name | Type | Description | Default |
|---|---|---|---|
| URL | string |
license
| Name | Type | Description | Default |
|---|---|---|---|
| license | string |
contentFilterResultsBase
콘텐츠 필터링 결과에 대한 정보.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| sexual | contentFilterSeverityResult | No | ||
| violence | contentFilterSeverityResult | No | ||
| hate | contentFilterSeverityResult | No | ||
| self_harm | contentFilterSeverityResult | No | ||
| profanity | contentFilterDetectedResult | No | ||
| error | errorBase | No |
contentFilterPromptResults
콘텐츠 필터링 카테고리(증오, 성적, 폭력, self_harm), 감지 여부, 심각도 수준(very_low, 낮음, 중간, 고수준, 해로운 콘텐츠의 강도와 위험 수준을 결정함), 필터링 여부에 관한 정보입니다. 탈옥 내용과 욕설에 관한 정보, 감지되었는지, 필터링되었는지 여부. 그리고 고객 차단 목록이 필터링되었는지 여부와 그 ID에 관한 정보도 알려줍니다.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| sexual | contentFilterSeverityResult | No | ||
| violence | contentFilterSeverityResult | No | ||
| hate | contentFilterSeverityResult | No | ||
| self_harm | contentFilterSeverityResult | No | ||
| profanity | contentFilterDetectedResult | No | ||
| error | errorBase | No | ||
| jailbreak | contentFilterDetectedResult | No |
contentFilterChoiceResults
콘텐츠 필터링 카테고리(증오, 성적, 폭력, self_harm), 감지 여부, 심각도 수준(very_low, 낮음, 중간, 고수준, 해로운 콘텐츠의 강도와 위험 수준을 결정함), 필터링 여부에 관한 정보입니다. 제3자 텍스트와 욕설에 관한 정보, 감지되었는지, 필터링되었는지 여부. 그리고 고객 차단 목록이 필터링되었는지 여부와 그 ID에 관한 정보도 알려줍니다.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| sexual | contentFilterSeverityResult | No | ||
| violence | contentFilterSeverityResult | No | ||
| hate | contentFilterSeverityResult | No | ||
| self_harm | contentFilterSeverityResult | No | ||
| profanity | contentFilterDetectedResult | No | ||
| error | errorBase | No | ||
| protected_material_text | contentFilterDetectedResult | No | ||
| protected_material_code | contentFilterDetectedWithCitationResult | No |
promptFilterResult
요청 내 단일 프롬프트에 대한 콘텐츠 필터링 결과가 나옵니다.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| prompt_index | integer | No | ||
| content_filter_results | contentFilterPromptResults | 콘텐츠 필터링 카테고리(증오, 성적, 폭력, self_harm), 감지 여부, 심각도 수준(very_low, 낮음, 중간, 고수준, 해로운 콘텐츠의 강도와 위험 수준을 결정함), 필터링 여부에 관한 정보입니다. 탈옥 내용과 욕설에 관한 정보, 감지되었는지, 필터링되었는지 여부. 그리고 고객 차단 목록이 필터링되었는지 여부와 그 ID에 관한 정보도 알려줍니다. | No |
promptFilterResults
요청 내 0개 이상의 프롬프트에 대한 콘텐츠 필터링 결과. 스트리밍 요청에서는 서로 다른 프롬프트에 대한 결과가 서로 다른 시간이나 순서로 도착할 수 있습니다.
이 컴포넌트에 대한 속성이 정의되어 있지 않습니다.
dalleContentFilterResults
콘텐츠 필터링 결과에 대한 정보.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| sexual | contentFilterSeverityResult | No | ||
| violence | contentFilterSeverityResult | No | ||
| hate | contentFilterSeverityResult | No | ||
| self_harm | contentFilterSeverityResult | No |
dalleFilterResults
콘텐츠 필터링 카테고리(증오, 성적, 폭력, self_harm), 감지 여부, 심각도 수준(very_low, 낮음, 중간, 고수준, 해로운 콘텐츠의 강도와 위험 수준을 결정함), 필터링 여부에 관한 정보입니다. 탈옥 내용과 욕설에 관한 정보, 감지되었는지, 필터링되었는지 여부. 그리고 고객 차단 목록이 필터링되었는지 여부와 그 ID에 관한 정보도 알려줍니다.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| sexual | contentFilterSeverityResult | No | ||
| violence | contentFilterSeverityResult | No | ||
| hate | contentFilterSeverityResult | No | ||
| self_harm | contentFilterSeverityResult | No | ||
| profanity | contentFilterDetectedResult | No | ||
| jailbreak | contentFilterDetectedResult | No |
chatCompletionsRequestCommon
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| temperature | number | 샘플링 온도는 0에서 2 사이로 사용해야 합니다. 0.8처럼 높은 값은 출력이 더 무작위적이고, 0.2처럼 낮은 값은 더 집중되고 결정론적으로 만듭니다. 일반적으로 이 부분을 변경하거나 top_p 둘 다 바꾸는 것을 권장하지 않습니다. |
No | 1 |
| top_p | number | 온도에 따른 샘플링의 대안인 핵 샘플링으로, 모델이 확률 질량을 가진 토큰의 결과를 고려하는 경우top_p. 따라서 0.1은 상위 10개의% 확률 질량을 구성하는 토큰만 고려된다는 뜻입니다. 일반적으로 이 부분을 변경하거나 temperature 둘 다 바꾸는 것을 권장하지 않습니다. |
No | 1 |
| stream | boolean | 설정이 완료되면 ChatGPT처럼 부분적인 메시지 델타가 전송됩니다. 토큰은 데이터 전용 서버에서 전송되는 이벤트로 전송되며, 스트림은 메시지로 data: [DONE] 종료됩니다. |
No | False |
| stop | 문자열 또는 배열 | 최대 네 개의 시퀀스에서 API가 더 이상 토큰 생성을 멈춥니다. | No | |
| max_tokens | integer | 생성된 답안이 허용되는 최대 토큰 수. 기본적으로 모델이 반환할 수 있는 토큰 수는 (4096 - 프롬프트 토큰)입니다. 이 값은 현재 더 이상 지원되지 max_completion_tokens않고, 대신 o1 시리즈 모델과 호환되지 않습니다. |
No | 4096 |
| max_completion_tokens | integer | 완성을 위해 생성할 수 있는 토큰 수의 상한선으로, 가시적 출력 토큰과 추론 토큰을 포함합니다. | No | |
| presence_penalty | number | 수치는 -2.0에서 2.0 사이입니다. 양의 값은 지금까지 텍스트에 등장했는지 여부에 따라 새로운 토큰에 페널티를 적용하여, 모델이 새로운 주제를 다룰 가능성을 높입니다. | No | 0 |
| frequency_penalty | number | 수치는 -2.0에서 2.0 사이입니다. 양수(positive)는 지금까지 텍스트 내 기존 빈도에 따라 새로운 토큰에 페널티를 적용하여, 같은 줄을 그대로 반복할 가능성을 줄입니다. | No | 0 |
| logit_bias | object | 완료 과정에서 지정된 토큰이 등장할 확률을 수정하세요. 토큰 ID로 지정된 토큰을 -100에서 100까지의 편향 값에 매핑하는 json 객체를 받습니다. 수학적으로, 이 편향은 샘플링 전에 모델이 생성한 로그에 더해집니다. 정확한 효과는 모델마다 다르지만, -1에서 1 사이의 수치는 선택 가능성을 낮추거나 증가시킬 수 있습니다; -100 또는 100과 같은 값은 해당 토큰을 차단하거나 독점적으로 선택해야 합니다. | No | |
| user | string | 최종 사용자를 나타내는 고유 식별자로, Azure OpenAI가 남용을 모니터링하고 탐지하는 데 도움을 줍니다. | No |
createCompletionRequest
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| prompt | 문자열 또는 배열 | 완료를 생성하는 프롬프트는 문자열, 문자열 배열, 토큰 배열, 또는 토큰 배열 등으로 인코딩됩니다. <|endoftext|>는 모델이 학습 중에 인식하는 문서 구분자이므로, 프롬프트가 지정되어 있지 않으면 모델은 새 문서의 처음부터 생성됩니다. |
Yes | |
| best_of | integer | 서버 측에서 완료를 생성 best_of 하며, 토큰당 로그 확률이 가장 높은 "최고"를 반환합니다. 결과는 스트리밍할 수 없습니다.와 함께 nbest_of 사용할 때, 는 후보 완성 횟수를 제어하고 n 반환할 수 있는 수를 지정합니다 â€" best_of 는 보다 커n야 합니다.참고: 이 매개변수는 많은 완료를 생성하기 때문에 토큰 할당량을 빠르게 소모할 수 있습니다. 신중하게 사용하고 와 stop에 max_tokens 대해 합리적인 설정을 반드시 확인하세요. |
No | 1 |
| echo | boolean | 완성 과정과 함께 프롬프트를 되돌려 주세요 |
No | False |
| frequency_penalty | number | 수치는 -2.0에서 2.0 사이입니다. 양수(positive)는 지금까지 텍스트 내 기존 빈도에 따라 새로운 토큰에 페널티를 적용하여, 같은 줄을 그대로 반복할 가능성을 줄입니다. |
No | 0 |
| logit_bias | object | 완료 과정에서 지정된 토큰이 등장할 확률을 수정하세요. GPT 토크나이저에서 토큰 ID로 지정된 토큰을 -100에서 100까지의 편향 값에 매핑하는 JSON 객체를 수락합니다. 수학적으로, 이 편향은 샘플링 전에 모델이 생성한 로그에 더해집니다. 정확한 효과는 모델마다 다르지만, -1에서 1 사이의 수치는 선택 가능성을 낮추거나 증가시킬 수 있습니다; -100 또는 100과 같은 값은 해당 토큰을 차단하거나 독점적으로 선택해야 합니다. 예를 들어, |endoftext|> 토큰이 생성되지 않도록 패스 {"50256": -100} 할 <수 있습니다. |
No | None |
| logprobs | integer | 가장 가능성이 높은 출력 토큰과 선택한 토큰에 대한 logprobs 로그 확률을 포함하세요. 예를 들어, 5가 logprobs 되면 API는 가장 가능성 높은 다섯 토큰 목록을 반환합니다. API는 항상 샘플링된 토큰의 를 logprob 반환하므로 응답에는 최대 요소가 logprobs+1 포함될 수 있습니다.최대 값 logprobs 은 5입니다. |
No | None |
| max_tokens | integer | 완료 과정에서 생성할 수 있는 최대 토큰 수. 프롬프트 플러스 max_tokens 의 토큰 수는 모델의 컨텍스트 길이를 초과할 수 없습니다. |
No | 16 |
| n | integer | 각 프롬프트마다 몇 개의 완료를 생성해야 하는지. 참고: 이 매개변수는 많은 완료를 생성하기 때문에 토큰 할당량을 빠르게 소모할 수 있습니다. 신중하게 사용하고 와 stop에 max_tokens 대해 합리적인 설정을 반드시 확인하세요. |
No | 1 |
| presence_penalty | number | 수치는 -2.0에서 2.0 사이입니다. 양의 값은 지금까지 텍스트에 등장했는지 여부에 따라 새로운 토큰에 페널티를 적용하여, 모델이 새로운 주제를 다룰 가능성을 높입니다. |
No | 0 |
| seed | integer | 명시가 명시되어 있을 경우, 우리 시스템은 동일한 seed 매개변수로 반복 요청이 같은 결과를 반환하도록 결정론적으로 샘플링하려 최선을 다합니다.결정론이 보장되는 것은 아니므로, 백엔드 변경 사항을 모니터링하려면 응답 매개변수를 참고 system_fingerprint 해야 합니다. |
No | |
| stop | 문자열 또는 배열 | 최대 네 개의 시퀀스에서 API가 더 이상 토큰 생성을 멈춥니다. 반환된 텍스트에는 정지 시퀀스가 포함되어 있지 않습니다. |
No | |
| stream | boolean | 부분 진행 상황을 스트리밍으로 되돌릴지 여부. 설정이 설정되면, 토큰은 데이터 전용 서버 전송 이벤트 로 전송되며, 스트림은 메시지로 data: [DONE] 종료됩니다. |
No | False |
| suffix | string | 삽입된 텍스트를 완성한 뒤에 오는 접미사입니다. 이 매개변수는 오직 에 대해 gpt-3.5-turbo-instruct서만 지원됩니다. |
No | None |
| temperature | number | 샘플링 온도는 0에서 2 사이로 사용해야 합니다. 0.8처럼 높은 값은 출력이 더 무작위적이고, 0.2처럼 낮은 값은 더 집중되고 결정론적으로 만듭니다. 일반적으로 이 부분을 변경하거나 top_p 둘 다 바꾸는 것을 권장하지 않습니다. |
No | 1 |
| top_p | number | 온도에 따른 샘플링의 대안인 핵 샘플링으로, 모델이 확률 질량을 가진 토큰의 결과를 고려하는 경우top_p. 따라서 0.1은 상위 10개의% 확률 질량을 구성하는 토큰만 고려된다는 뜻입니다. 일반적으로 이 부분을 변경하거나 temperature 둘 다 바꾸는 것을 권장하지 않습니다. |
No | 1 |
| user | string | 최종 사용자를 대표하는 고유 식별자로, 남용을 모니터링하고 탐지하는 데 도움이 됩니다. |
No |
createCompletionResponse
API의 완료 응답을 나타냅니다. 참고: 스트림된 응답 객체와 비스트리밍된 응답 객체는 모두 동일한 형태를 공유합니다(채팅 엔드포인트와 다릅니다).
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| id | string | 완성을 위한 고유 식별자입니다. | Yes | |
| choices | array | 입력 프롬프트에 대해 모델이 생성한 완성 선택 목록입니다. | Yes | |
| created | integer | 완성이 생성된 시점의 유닉스 타임스탬프(초 단위)입니다. | Yes | |
| model | string | 완성에 사용된 모델. | Yes | |
| prompt_filter_results | promptFilterResults | 요청 내 0개 이상의 프롬프트에 대한 콘텐츠 필터링 결과. 스트리밍 요청에서는 서로 다른 프롬프트에 대한 결과가 서로 다른 시간이나 순서로 도착할 수 있습니다. | No | |
| system_fingerprint | string | 이 지문은 모델이 실행하는 백엔드 구성을 나타냅니다. 요청 매개변수와 seed 함께 사용하여 백엔드 변경이 이루어져 결정론에 영향을 줄 수 있음을 이해할 수 있습니다. |
No | |
| object | enum | 객체 유형은 항상 "text_completion" 가능한 값: text_completion |
Yes | |
| usage | completionUsage | 완료 요청의 사용 통계. | No |
createChatCompletionRequest
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| temperature | number | 샘플링 온도는 0에서 2 사이로 사용해야 합니다. 0.8처럼 높은 값은 출력이 더 무작위적이고, 0.2처럼 낮은 값은 더 집중되고 결정론적으로 만듭니다. 일반적으로 이 부분을 변경하거나 top_p 둘 다 바꾸는 것을 권장하지 않습니다. |
No | 1 |
| top_p | number | 온도에 따른 샘플링의 대안인 핵 샘플링으로, 모델이 확률 질량을 가진 토큰의 결과를 고려하는 경우top_p. 따라서 0.1은 상위 10개의% 확률 질량을 구성하는 토큰만 고려된다는 뜻입니다. 일반적으로 이 부분을 변경하거나 temperature 둘 다 바꾸는 것을 권장하지 않습니다. |
No | 1 |
| stream | boolean | 설정이 완료되면 ChatGPT처럼 부분적인 메시지 델타가 전송됩니다. 토큰은 데이터 전용 서버에서 전송되는 이벤트 로 전송되며, 스트림은 메시지로 data: [DONE] 종료됩니다. |
No | False |
| stop | 문자열 또는 배열 | 최대 네 개의 시퀀스에서 API가 더 이상 토큰 생성을 멈춥니다. |
No | |
| max_tokens | integer | 채팅 완료에서 생성할 수 있는 최대 토큰 수. 입력 토큰과 생성된 토큰의 총 길이는 모델의 컨텍스트 길이에 의해 제한됩니다. |
No | |
| max_completion_tokens | integer | 완성을 위해 생성할 수 있는 토큰 수의 상한선으로, 가시적 출력 토큰과 추론 토큰을 포함합니다. | No | |
| presence_penalty | number | 수치는 -2.0에서 2.0 사이입니다. 양의 값은 지금까지 텍스트에 등장했는지 여부에 따라 새로운 토큰에 페널티를 적용하여, 모델이 새로운 주제를 다룰 가능성을 높입니다. |
No | 0 |
| frequency_penalty | number | 수치는 -2.0에서 2.0 사이입니다. 양수(positive)는 지금까지 텍스트 내 기존 빈도에 따라 새로운 토큰에 페널티를 적용하여, 같은 줄을 그대로 반복할 가능성을 줄입니다. |
No | 0 |
| logit_bias | object | 완료 과정에서 지정된 토큰이 등장할 확률을 수정하세요. 토큰 ID로 지정된 토큰을 -100에서 100까지의 편향 값에 매핑하는 JSON 객체를 받습니다. 수학적으로, 이 편향은 샘플링 전에 모델이 생성한 로그에 더해집니다. 정확한 효과는 모델마다 다르지만, -1에서 1 사이의 수치는 선택 가능성을 낮추거나 증가시킬 수 있습니다; -100 또는 100과 같은 값은 해당 토큰을 차단하거나 독점적으로 선택해야 합니다. |
No | None |
| user | string | 최종 사용자를 대표하는 고유 식별자로, 남용을 모니터링하고 탐지하는 데 도움이 됩니다. |
No | |
| messages | array | 지금까지 대화를 구성한 메시지 목록입니다. | Yes | |
| data_sources | array | Azure OpenAI 채팅 확장 프로그램의 설정 항목들입니다. 이 추가 사양은 Azure OpenAI와만 호환됩니다. |
No | |
| logprobs | boolean | 출력 토큰의 로그 확률을 반환할지 여부에 관한 문제입니다. 참이라면, 는 의 message각 출력 토큰에 반환 content 되는 로그 확률을 반환합니다. |
No | False |
| top_logprobs | integer | 0에서 20 사이의 정수로, 각 토큰 위치에서 반환될 가능성이 높은 토큰의 수를 나타내며, 각 토큰은 로그 확률을 가지고 있습니다.
logprobs 이 매개변수를 사용하면 반드시 로 true 설정해야 합니다. |
No | |
| n | integer | 입력 메시지마다 몇 개의 채팅 완료 선택지를 생성해야 할까요? 모든 선택지에서 생성된 토큰 수에 따라 요금이 부과된다는 점에 유의하세요. 비용을 최소화하기 위해 계속 관리 n1 하세요. |
No | 1 |
| parallel_tool_calls | ParallelToolCalls | 도구 사용 중 병렬 함수 호출을 활성화할지 여부. | No | True |
| response_format | ResponseFormatText 또는 ResponseFormatJsonObject 또는 ResponseFormatJsonSchema | 모델이 출력해야 할 형식을 지정하는 객체입니다.
GPT-4o, GPT-4o mini, GPT-4 Turbo 및 최신 모든 GPT-3.5 Turbo 모델gpt-3.5-turbo-1106과 호환됩니다.{ "type": "json_schema", "json_schema": {...} } 모델이 제공된 JSON 스키마와 일치하도록 보장하는 구조화 출력 활성화 설정.JSON 모드를 활성화하는 { "type": "json_object" } 설정은 모델이 생성하는 메시지가 유효한 JSON 임을 보장합니다.중요: JSON 모드를 사용할 때는 시스템이나 사용자 메시지를 통해 모델이 직접 JSON을 생성하도록 지시해야 합니다. 이 방법이 없으면 모델은 생성 제한에 도달할 때까지 끝없는 공백 흐름을 생성할 수 있으며, 이는 장시간 지속되고 '멈춘' 것처럼 보이는 요청을 초래할 수 있습니다. 또한 메시지 내용이 부분적으로 잘릴 finish_reason="length"수 있으니, 생성 시간이나 대화가 최대 맥락 길이를 초과 max_tokens 했음을 나타냅니다. |
No | |
| seed | integer | 이 기능은 베타 버전입니다. 명시가 명시되어 있을 경우, 우리 시스템은 동일한 seed 매개변수로 반복 요청이 같은 결과를 반환하도록 결정론적으로 샘플링하려 최선을 다합니다.결정론이 보장되는 것은 아니므로, 백엔드 변경 사항을 모니터링하려면 응답 매개변수를 참고 system_fingerprint 해야 합니다. |
No | |
| tools | array | 모델이 호출할 수 있는 도구 목록입니다. 현재는 함수만 지원되고 있습니다. 이를 사용해 모델이 JSON 입력을 생성할 수 있는 함수 목록을 제공하세요. 최대 128개의 기능을 지원합니다. |
No | |
| tool_choice | chatCompletionToolChoiceOption | 모델이 호출하는 도구가 어떤 것인지(있다면) 제어합니다.
none 즉, 모델은 어떤 도구를 호출하지 않고 메시지를 생성합니다.
auto 즉, 모델은 메시지를 생성하거나 하나 이상의 도구를 호출할 수 있습니다.
required 즉, 모델이 하나 이상의 도구를 호출해야 한다는 뜻입니다. 특정 도구를 지정 {"type": "function", "function": {"name": "my_function"}} 하면 모델이 그 도구를 호출하도록 강제합니다.
none 도구가 없을 때 기본값입니다.
auto 도구가 있으면 기본값입니다. |
No | |
| function_call | STRING 또는 chatCompletionFunctionCallOption |
tool_choice.모델이 호출하는 함수를 제어합니다. none 즉, 모델이 함수를 호출하지 않고 메시지를 생성합니다.auto 즉, 모델은 메시지를 생성할지 함수를 호출할지 선택할 수 있습니다.특정 함수 {"name": "my_function"} 를 지정하면 모델이 그 함수를 호출하도록 강제합니다.none 함수가 없을 때 기본값입니다.
auto 함수가 존재할 때 기본값입니다. |
No | |
| functions | array |
tools.모델이 생성할 수 있는 JSON 입력 함수들의 목록입니다. |
No |
chatCompletionFunctions
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| description | string | 함수가 수행하는 기능에 대한 설명으로, 모델이 언제 어떻게 함수를 호출할지 결정하는 데 사용됩니다. | No | |
| name | string | 호출할 함수의 이름입니다. a-z, A-Z, 0-9 또는 밑줄과 대시를 포함해야 하며, 최대 길이는 64개여야 합니다. | Yes | |
| parameters | FunctionParameters | 함수들이 받아들이는 매개변수는 JSON 스키마 객체로 설명됩니다. 예제는 가이드와 JSON 스키마 참고 자료를 참고하세요. 생략 parameters 은 빈 매개변수 리스트를 가진 함수를 정의합니다. |
No |
chatCompletionFunctionCallOption
특정 함수 {"name": "my_function"} 를 지정하면 모델이 그 함수를 호출하도록 강제합니다.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| name | string | 호출할 함수의 이름입니다. | Yes |
chatCompletionRequestMessage
이 구성 요소는 다음 중 하나일 수 있습니다:
chatCompletionRequestSystemMessage
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| content | 문자열 또는 배열 | 시스템 메시지의 내용입니다. | Yes | |
| role | enum | 메시지 작성자의 역할, 이 경우 system.가능한 값: 시스템 |
Yes | |
| name | string | 참가자의 선택 이름입니다. 동일한 역할의 참가자들을 구분할 수 있는 모델 정보를 제공합니다. | No |
chatCompletionRequestUserMessage
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| content | 문자열 또는 배열 | 사용자 메시지의 내용. |
Yes | |
| role | enum | 메시지 작성자의 역할, 이 경우 user.가능한 값: 사용자 |
Yes | |
| name | string | 참가자의 선택 이름입니다. 동일한 역할의 참가자들을 구분할 수 있는 모델 정보를 제공합니다. | No |
chatCompletionRequestAssistantMessage
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| content | 문자열 또는 배열 | 조수 메시지의 내용. 명시된 경우에는 tool_callsfunction_call 필수입니다. |
No | |
| refusal | string | 조수가 보낸 거절 메시지. | No | |
| role | enum | 메시지 작성자의 역할, 이 경우 assistant.가능한 가치: 조수 |
Yes | |
| name | string | 참가자의 선택 이름입니다. 동일한 역할의 참가자들을 구분할 수 있는 모델 정보를 제공합니다. | No | |
| tool_calls | chatCompletionMessageToolCalls | 모델이 생성하는 도구 호출, 예를 들어 함수 호출. | No | |
| function_call | object | 폐기되고 .로 tool_calls대체됨. 모델이 생성한 함수의 이름과 인자. |
No |
function_call 속성
arguments
| Name | Type | Description | Default |
|---|---|---|---|
| arguments | string | 모델이 JSON 형식으로 생성한 함수 호출 인수들. 모델이 항상 유효한 JSON을 생성하는 것은 아니며, 함수 스키마에서 정의되지 않은 매개변수를 생성할 수 있다는 점을 유의하세요. 함수를 호출하기 전에 코드 내 인자를 검증하세요. |
name
| Name | Type | Description | Default |
|---|---|---|---|
| name | string | 호출할 함수의 이름입니다. |
chatCompletionRequestToolMessage
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| role | enum | 메시지 작성자의 역할, 이 경우 tool.가능한 값: 도구 |
Yes | |
| content | 문자열 또는 배열 | 도구 메시지의 내용입니다. | Yes | |
| tool_call_id | string | 이 메시지가 응답하는 툴 콜입니다. | Yes |
chatCompletionRequestFunctionMessage
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| role | enum | 메시지 작성자의 역할, 이 경우 function.가능한 값: 함수 |
Yes | |
| content | string | 함수 메시지의 내용입니다. | Yes | |
| name | string | 호출할 함수의 이름입니다. | Yes |
chatCompletionRequestSystemMessageContentPart
이 구성 요소는 다음 중 하나일 수 있습니다:
chatCompletionRequestUserMessageContentPart
이 구성 요소는 다음 중 하나일 수 있습니다:
chatCompletionRequestAssistantMessageContentPart
이 구성 요소는 다음 중 하나일 수 있습니다:
chatCompletionRequestToolMessageContentPart
이 구성 요소는 다음 중 하나일 수 있습니다:
chatCompletionRequestMessageContentPartText
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| type | enum | 내용의 종류. 가능한 값: 텍스트 |
Yes | |
| text | string | 텍스트 내용. | Yes |
chatCompletionRequestMessageContentPartImage
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| type | enum | 내용의 종류. 가능한 값: image_url |
Yes | |
| image_url | object | Yes |
image_url 속성
url
| Name | Type | Description | Default |
|---|---|---|---|
| url | string | 이미지의 URL이나 base64로 인코딩된 이미지 데이터일 수 있습니다. |
detail
| Name | Type | Description | Default |
|---|---|---|---|
| detail | string | 이미지의 세부 수준을 지정합니다. 비 전 가이드에서 더 알아보세요. | auto |
chatCompletionRequestMessageContentPartRefusal
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| type | enum | 내용의 종류. 가능한 가치: 거부 |
Yes | |
| refusal | string | 모델이 생성하는 거부 메시지입니다. | Yes |
azureChatExtensionConfiguration
단일 Azure OpenAI 채팅 확장 장치의 구성 데이터 표현입니다. 이 기능은 Azure OpenAI 채팅 확장 기능을 사용해 응답 동작을 보완하는 채팅 완료 요청에 사용됩니다. 이 구성의 사용은 Azure OpenAI와만 호환됩니다.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| type | azureChatExtensionType | 단일 Azure OpenAI 채팅 확장 장치의 구성 데이터 표현입니다. 이 기능은 채팅에서 사용할 것입니다 완료 요청은 Azure OpenAI 채팅 확장 기능을 사용해 응답 동작을 보완해야 합니다. 이 구성의 사용은 Azure OpenAI와만 호환됩니다. |
Yes |
azureChatExtensionType
단일 Azure OpenAI 채팅 확장 장치의 구성 데이터 표현입니다. 이 기능은 Azure OpenAI 채팅 확장 기능을 사용해 응답 동작을 보완하는 채팅 완료 요청에 사용됩니다. 이 구성의 사용은 Azure OpenAI와만 호환됩니다.
Description: 단일 Azure OpenAI 채팅 확장 프로그램의 구성 데이터를 표현한 것입니다. 이 기능은 Azure OpenAI 채팅 확장 기능을 사용해 응답 동작을 보완하는 채팅 완료 요청에 사용됩니다. 이 구성의 사용은 Azure OpenAI와만 호환됩니다.
Type: string
Default:
Enum name: AzureChatExtensionType
Enum Values:
| Value | Description |
|---|---|
| azure_search | Azure Search를 Azure OpenAI 채팅 확장 기능으로 사용하는 것을 나타냅니다. |
| azure_cosmos_db | Azure Cosmos DB를 Azure OpenAI 채팅 확장으로 사용하는 것을 나타냅니다. |
azureSearchChatExtensionConfiguration
Azure Search를 Azure OpenAI 채팅 확장으로 사용할 때 설정할 수 있는 옵션의 구체적인 표현입니다.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| type | azureChatExtensionType | 단일 Azure OpenAI 채팅 확장 장치의 구성 데이터 표현입니다. 이 기능은 채팅에서 사용할 것입니다 완료 요청은 Azure OpenAI 채팅 확장 기능을 사용해 응답 동작을 보완해야 합니다. 이 구성의 사용은 Azure OpenAI와만 호환됩니다. |
Yes | |
| parameters | azureSearchChatExtensionParameters | Azure OpenAI 채팅 확장기로 사용할 때 사용하는 Azure 검색의 매개변수. | No |
azureSearchChatExtensionParameters
Azure OpenAI 채팅 확장기로 사용할 때 사용하는 Azure 검색의 매개변수.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| authentication | onYourDataApiKeyAuthenticationOptions 또는 onYourDataSystemAssignedManagedIdentityAuthenticationOptions , onYourDataUserAssignedManagedIdentityAuthenticationOptions에서 | Yes | ||
| top_n_documents | integer | 구성된 쿼리에 대해 기능할 문서 수 상단에 배치됩니다. | No | |
| in_scope | boolean | 쿼리가 인덱스 데이터의 사용으로 제한되어야 하는지 여부. | No | |
| strictness | integer | 검색 관련성 필터링의 설정된 엄격성. 엄격함이 높을수록 답의 정밀도는 높지만 회상력은 낮습니다. | No | |
| role_information | string | 모델에게 어떻게 행동해야 하는지, 응답을 생성할 때 참조해야 할 맥락에 대해 지침을 주세요. 조수의 성격을 설명하고 답변 형식을 어떻게 해야 하는지 알려줄 수 있습니다. 토큰 100 제한이 있고, 전체 토큰 한도에 포함돼요. | No | |
| endpoint | string | Azure Search 리소스가 사용할 절대 엔드포인트 경로입니다. | Yes | |
| index_name | string | 참고된 Azure Search 리소스에서 사용할 인덱스 이름입니다. | Yes | |
| fields_mapping | azureSearchIndexFieldMappingOptions | 구성 Azure Search 리소스를 사용할 때 필드 처리 방식을 제어할 수 있는 선택적 설정입니다. | No | |
| query_type | azureSearchQueryType | Azure OpenAI 채팅 확장 기능으로 사용할 때 실행해야 하는 Azure 검색 쿼리의 유형입니다. | No | |
| semantic_configuration | string | 쿼리의 추가 의미 구성. | No | |
| filter | string | Search filter. | No | |
| embedding_dependency | onYourDataEndpointVectorizationSource 또는 onYourDataDeploymentNameVectorizationSource | No |
azureSearchIndexFieldMappingOptions
구성 Azure Search 리소스를 사용할 때 필드 처리 방식을 제어할 수 있는 선택적 설정입니다.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| title_field | string | 제목으로 사용할 인덱스 필드의 이름입니다. | No | |
| url_field | string | URL로 사용할 인덱스 필드의 이름입니다. | No | |
| filepath_field | string | 파일 경로로 사용할 인덱스 필드의 이름입니다. | No | |
| content_fields | array | 콘텐츠로 간주해야 할 인덱스 필드의 이름들. | No | |
| content_fields_separator | string | 콘텐츠 필드가 사용해야 할 구분 패턴. | No | |
| vector_fields | array | 벡터 데이터를 나타내는 필드의 이름들입니다. | No |
azureSearchQueryType
Azure OpenAI 채팅 확장 기능으로 사용할 때 실행해야 하는 Azure 검색 쿼리의 유형입니다.
Description: Azure OpenAI 채팅 확장기로 사용할 때 실행해야 하는 Azure 검색 쿼리의 유형입니다.
Type: string
Default:
Enum name: AzureSearchQueryType
Enum Values:
| Value | Description |
|---|---|
| simple | 기본 간단한 쿼리 파서를 나타냅니다. |
| semantic | 고급 의미 모델링을 위한 의미 쿼리 파서를 나타냅니다. |
| vector | 계산된 데이터에 대한 벡터 탐색을 나타냅니다. |
| vector_simple_hybrid | 간단한 쿼리 전략과 벡터 데이터의 조합을 나타냅니다. |
| vector_semantic_hybrid | 의미 탐색과 벡터 데이터 쿼리의 조합을 나타냅니다. |
azureCosmosDBChatExtensionConfiguration
Azure OpenAI 채팅 확장으로 사용할 때 Azure Cosmos DB의 구성 가능한 옵션에 대한 구체적인 표현입니다.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| type | azureChatExtensionType | 단일 Azure OpenAI 채팅 확장 장치의 구성 데이터 표현입니다. 이 기능은 채팅에서 사용할 것입니다 완료 요청은 Azure OpenAI 채팅 확장 기능을 사용해 응답 동작을 보완해야 합니다. 이 구성의 사용은 Azure OpenAI와만 호환됩니다. |
Yes | |
| parameters | azureCosmosDBChatExtensionParameters | Azure OpenAI On Your Data 설정 시 사용할 매개변수 Azure Cosmos DB for 사용할 때 채팅 확장 MongoDB vCore. |
No |
azureCosmosDBChatExtensionParameters
Azure OpenAI On Your Data 설정 시 사용할 매개변수 Azure Cosmos DB for MongoDB vCore를 사용할 때 채팅 확장 기능.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| authentication | onYourDataConnectionStringAuthenticationOptions | azure OpenAI On Your Data 인증 옵션, 연결 문자열을 사용할 때의 정보. | Yes | |
| top_n_documents | integer | 구성된 쿼리에 대해 기능할 문서 수 상단에 배치됩니다. | No | |
| in_scope | boolean | 쿼리가 인덱스 데이터의 사용으로 제한되어야 하는지 여부. | No | |
| strictness | integer | 검색 관련성 필터링의 설정된 엄격성. 엄격함이 높을수록 답의 정밀도는 높지만 회상력은 낮습니다. | No | |
| role_information | string | 모델에게 어떻게 행동해야 하는지, 응답을 생성할 때 참조해야 할 맥락에 대해 지침을 주세요. 조수의 성격을 설명하고 답변 형식을 어떻게 해야 하는지 알려줄 수 있습니다. 토큰 100 제한이 있고, 전체 토큰 한도에 포함돼요. | No | |
| database_name | string | Azure Cosmos DB에서 사용하는 MongoDB vCore 데이터베이스 이름입니다. | Yes | |
| container_name | string | Azure Cosmos DB 자원 컨테이너의 이름입니다. | Yes | |
| index_name | string | Azure Cosmos DB에서 사용하는 MongoDB vCore 인덱스 이름입니다. | Yes | |
| fields_mapping | azureCosmosDBFieldMappingOptions | 구성 Azure Cosmos DB 리소스를 사용할 때 필드 처리 방식을 제어하는 선택적 설정입니다. | Yes | |
| embedding_dependency | onYourDataEndpointVectorizationSource 또는 onYourDataDeploymentNameVectorizationSource | Yes |
azureCosmosDBFieldMappingOptions
구성 Azure Cosmos DB 리소스를 사용할 때 필드 처리 방식을 제어하는 선택적 설정입니다.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| title_field | string | 제목으로 사용할 인덱스 필드의 이름입니다. | No | |
| url_field | string | URL로 사용할 인덱스 필드의 이름입니다. | No | |
| filepath_field | string | 파일 경로로 사용할 인덱스 필드의 이름입니다. | No | |
| content_fields | array | 콘텐츠로 간주해야 할 인덱스 필드의 이름들. | Yes | |
| content_fields_separator | string | 콘텐츠 필드가 사용해야 할 구분 패턴. | No | |
| vector_fields | array | 벡터 데이터를 나타내는 필드의 이름들입니다. | Yes |
onYourDataAuthenticationOptions
Azure OpenAI의 데이터 인증 옵션.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| type | onYourDataAuthenticationType | Azure OpenAI On Your Data에서 지원하는 인증 유형들. | Yes |
onYourDataAuthenticationType
Azure OpenAI On Your Data에서 지원하는 인증 유형들.
설명: 귀하의 데이터에 대해 Azure OpenAI가 지원하는 인증 유형.
Type: string
Default:
Enum 이름: OnYourDataAuthenticationType
Enum Values:
| Value | Description |
|---|---|
| api_key | API 키를 통한 인증. |
| connection_string | 연결 문자열을 통한 인증. |
| system_assigned_managed_identity | 시스템 할당 관리 신원을 통한 인증. |
| user_assigned_managed_identity | 사용자 지정 관리 신원을 통한 인증. |
onYourDataApiKeyAuthenticationOptions
API 키를 사용할 때 당신의 데이터에 대해 확인한 Azure OpenAI 인증 옵션.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| type | onYourDataAuthenticationType | Azure OpenAI On Your Data에서 지원하는 인증 유형들. | Yes | |
| key | string | 인증에 사용할 API 키입니다. | No |
onYourDataConnectionStringAuthenticationOptions
azure OpenAI On Your Data 인증 옵션, 연결 문자열을 사용할 때의 정보.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| type | onYourDataAuthenticationType | Azure OpenAI On Your Data에서 지원하는 인증 유형들. | Yes | |
| connection_string | string | 인증에 사용할 연결 문자열입니다. | No |
onYourDataSystemAssignedManagedIdentityAuthenticationOptions
시스템 할당 관리 신원을 사용할 때 당신의 데이터에 대한 Azure OpenAI 인증 옵션.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| type | onYourDataAuthenticationType | Azure OpenAI On Your Data에서 지원하는 인증 유형들. | Yes |
onYourDataUserAssignedManagedIdentityAuthenticationOptions
사용자 지정 관리 신원을 사용할 때 사용하는 Azure OpenAI On Your Data의 인증 옵션들.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| type | onYourDataAuthenticationType | Azure OpenAI On Your Data에서 지원하는 인증 유형들. | Yes | |
| managed_identity_resource_id | string | 인증에 사용할 사용자 할당 관리 식별자의 자원 ID. | No |
onYourDataVectorizationSource
벡터 검색을 이용한 Azure OpenAI On Your Data의 벡터화 소스 추상적 표현입니다.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| type | onYourDataVectorizationSourceType | Azure OpenAI On Your Data가 사용할 수 있는 데이터 벡터화 구성을 위해 사용할 수 있는 사용 가능한 소스를 나타냅니다. vector search. |
Yes |
onYourDataVectorizationSourceType
Azure OpenAI On Your Data가 베터를 검색할 수 있도록 벡터화 설정을 위해 사용할 수 있는 사용 가능한 소스를 나타냅니다.
Description: OpenAI On Your Data가 데이터를 벡터화하는 데 사용할 수 있는 Azure 사용 가능한 소스를 나타냅니다.
vector search.
Type: string
Default:
Enum 이름: OnYourDataVectorizationSourceType
Enum Values:
| Value | Description |
|---|---|
| endpoint | Azure OpenAI 임베딩 모델에 대한 공공 서비스 호출에 의해 수행된 벡터화를 나타냅니다. |
| deployment_name | 사용하는 Ada 모델 배포 이름을 나타냅니다. 이 모델 배포는 반드시 동일한 Azure OpenAI 리소스 내에 있어야 하지만, On Your Data는 공개 호출 대신 내부 호출을 통해 이 모델 배포를 사용하여 벡터를 가능하게 합니다 사설 네트워크에서도 검색하세요. |
onYourDataDeploymentNameVectorizationSource
벡터 검색을 적용할 때 Azure OpenAI On Your Data에서 사용하는 벡터화 소스 세부 정보로, 동일한 Azure OpenAI 리소스 내 내부 임베딩 모델 배포 이름을 기반으로 합니다.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| type | onYourDataVectorizationSourceType | Azure OpenAI On Your Data가 사용할 수 있는 데이터 벡터화 구성을 위해 사용할 수 있는 사용 가능한 소스를 나타냅니다. vector search. |
Yes | |
| deployment_name | string | 벡터화에 사용할 모델 배포 이름을 지정합니다. 이 모델 배포는 반드시 동일한 Azure OpenAI 리소스 내에 있어야 하지만, On Your Data는 공개 호출이 아닌 내부 호출을 통해 이 모델 배포를 사용하여 사설 네트워크에서도 벡터 검색이 가능합니다. | No |
onYourDataEndpointVectorizationSource
벡터 검색을 적용할 때 Azure OpenAI On Your Data에서 사용하는 벡터화 소스의 세부 정보로, 이는 공개된 Azure OpenAI 엔드포인트의 임베딩 호출을 기반으로 합니다.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| type | onYourDataVectorizationSourceType | Azure OpenAI On Your Data가 사용할 수 있는 데이터 벡터화 구성을 위해 사용할 수 있는 사용 가능한 소스를 나타냅니다. vector search. |
Yes | |
| authentication | onYourDataApiKeyAuthenticationOptions | API 키를 사용할 때 당신의 데이터에 대해 확인한 Azure OpenAI 인증 옵션. | No | |
| endpoint | string | 벡터화에 사용할 종점을 지정합니다. 이 엔드포인트는 반드시 동일한 Azure OpenAI 리소스에 있어야 하지만, On Your Data는 공개 호출이 아닌 내부 호출을 통해 이 엔드포인트를 사용하므로 사설 네트워크에서도 벡터 검색이 가능합니다. | No |
azureChatExtensionsMessageContext
Azure OpenAI 채팅 확장 기능이 해당 채팅 완료 응답 생성에 참여할 때 제공되는 추가 맥락 정보를 나타냅니다. 이 컨텍스트 정보는 Azure OpenAI 요청을 매칭 확장 기능을 사용하도록 설정할 때만 채워집니다.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| citations | array | 응답에서 보조 메시지를 생성하는 데 사용되는 데이터 소스 검색 결과입니다. | No | |
| intent | string | 채팅 기록에서 감지된 의도는 다음 턴으로 전달되어 맥락을 전달하는 데 사용되었습니다. | No |
citation
채팅 완료 응답 메시지에 대한 인용 정보.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| content | string | 인용문의 내용. | Yes | |
| title | string | 표창 제목. | No | |
| url | string | 인용문의 URL. | No | |
| filepath | string | 인용문이 있는 파일 경로. | No | |
| chunk_id | string | 인용문의 청크 ID입니다. | No |
chatCompletionMessageToolCall
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| id | string | 툴 호출의 ID입니다. | Yes | |
| type | toolCallType | 툴 호출의 유형, 이 경우 function. |
Yes | |
| function | object | 모델이 호출한 함수입니다. | Yes |
함수의 성질
name
| Name | Type | Description | Default |
|---|---|---|---|
| name | string | 호출할 함수의 이름입니다. |
arguments
| Name | Type | Description | Default |
|---|---|---|---|
| arguments | string | 모델이 JSON 형식으로 생성한 함수 호출 인수들. 모델이 항상 유효한 JSON을 생성하는 것은 아니며, 함수 스키마에서 정의되지 않은 매개변수를 생성할 수 있다는 점을 유의하세요. 함수를 호출하기 전에 코드 내 인자를 검증하세요. |
toolCallType
툴 호출의 유형, 이 경우 function.
설명: 툴 호출의 유형, 이 경우 function.
Type: string
Default:
Enum 이름: ToolCallType
Enum Values:
| Value | Description |
|---|---|
| function | 툴 호출 유형은 함수입니다. |
chatCompletionRequestMessageTool
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| tool_call_id | string | 이 메시지가 응답하는 툴 콜입니다. | No | |
| content | string | 메시지 내용. | No |
chatCompletionRequestMessageFunction
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| role | enum | 메시지 작성자의 역할, 이 경우 function.가능한 값: 함수 |
No | |
| name | string | 메시지 내용. | No | |
| content | string | 메시지 내용. | No |
createChatCompletionResponse
모델은 제공된 입력을 기반으로 하여 채팅 완료 응답을 반환합니다.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| id | string | 채팅 완료를 위한 고유 식별자입니다. | Yes | |
| prompt_filter_results | promptFilterResults | 요청 내 0개 이상의 프롬프트에 대한 콘텐츠 필터링 결과. 스트리밍 요청에서는 서로 다른 프롬프트에 대한 결과가 서로 다른 시간이나 순서로 도착할 수 있습니다. | No | |
| choices | array | 채팅 완료 선택 목록입니다. 가 1보다 크면 n 1 이상일 수 있습니다. |
Yes | |
| created | integer | 채팅 완료 시점의 유닉스 타임스탬프(초 단위)입니다. | Yes | |
| model | string | 채팅 완료에 사용된 모델입니다. | Yes | |
| system_fingerprint | string | 이 지문은 모델이 실행하는 백엔드 구성을 나타냅니다. 요청 매개변수와 seed 함께 사용하여 백엔드 변경이 이루어져 결정론에 영향을 줄 수 있음을 이해할 수 있습니다. |
No | |
| object | enum | 객체 유형은 항상 chat.completion입니다.가능한 값: chat.completion |
Yes | |
| usage | completionUsage | 완료 요청의 사용 통계. | No |
createChatCompletionStreamResponse
제공된 입력을 바탕으로 모델이 반환하는 채팅 완료 응답의 스트림 청크를 나타냅니다.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| id | string | 채팅 완료를 위한 고유 식별자입니다. 각 청크는 동일한 ID를 가지고 있습니다. | Yes | |
| choices | array | 채팅 완료 선택 목록입니다. 가 1보다 크면 n 두 개 이상의 원소를 포함할 수 있다. |
Yes | |
| created | integer | 채팅 완료 시점의 유닉스 타임스탬프(초 단위)입니다. 각 청크는 동일한 타임스탬프를 가지고 있습니다. | Yes | |
| model | string | 완성을 생성하는 모델. | Yes | |
| system_fingerprint | string | 이 지문은 모델이 실행하는 백엔드 구성을 나타냅니다. 요청 매개변수와 seed 함께 사용하여 백엔드 변경이 이루어져 결정론에 영향을 줄 수 있음을 이해할 수 있습니다. |
No | |
| object | enum | 객체 유형은 항상 chat.completion.chunk입니다.가능한 가치: chat.completion.chunk |
Yes |
chatCompletionStreamResponseDelta
스트리밍된 모델 응답에 의해 생성된 채팅 완료 델타입니다.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| content | string | 청크 메시지의 내용입니다. | No | |
| function_call | object | 폐기되고 .로 tool_calls대체됨. 모델이 생성한 함수의 이름과 인자. |
No | |
| tool_calls | array | No | ||
| role | enum | 이 메시지의 작성자의 역할. 가능한 값: 시스템, 사용자, 어시스턴트, 도구 |
No | |
| refusal | string | 모델이 생성하는 거부 메시지입니다. | No |
function_call 속성
arguments
| Name | Type | Description | Default |
|---|---|---|---|
| arguments | string | 모델이 JSON 형식으로 생성한 함수 호출 인수들. 모델이 항상 유효한 JSON을 생성하는 것은 아니며, 함수 스키마에서 정의되지 않은 매개변수를 생성할 수 있다는 점을 유의하세요. 함수를 호출하기 전에 코드 내 인자를 검증하세요. |
name
| Name | Type | Description | Default |
|---|---|---|---|
| name | string | 호출할 함수의 이름입니다. |
chatCompletionMessageToolCallChunk
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| index | integer | Yes | ||
| id | string | 툴 호출의 ID입니다. | No | |
| type | enum | 도구의 종류. 현재는 오직 지원만 function 가능합니다.가능한 값: 함수 |
No | |
| function | object | No |
함수의 성질
name
| Name | Type | Description | Default |
|---|---|---|---|
| name | string | 호출할 함수의 이름입니다. |
arguments
| Name | Type | Description | Default |
|---|---|---|---|
| arguments | string | 모델이 JSON 형식으로 생성한 함수 호출 인수들. 모델이 항상 유효한 JSON을 생성하는 것은 아니며, 함수 스키마에서 정의되지 않은 매개변수를 생성할 수 있다는 점을 유의하세요. 함수를 호출하기 전에 코드 내 인자를 검증하세요. |
chatCompletionStreamOptions
스트리밍 응답 옵션. 이 설정을 할 때 stream: true만 설정합니다.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| include_usage | boolean | 설정이 완료되면 메시지 전에 data: [DONE] 추가 청크가 스트리밍됩니다. 이 청크의 필드는 usage 전체 요청의 토큰 사용 통계를 보여주며, 필드는 choices 항상 빈 배열입니다. 다른 모든 청크도 필드를 포함 usage 하지만, null 값이 있습니다. |
No |
chatCompletionChoiceLogProbs
선택에 대한 확률 정보를 기록하세요.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| content | array | 로그 확률 정보가 포함된 메시지 내용 토큰 목록입니다. | Yes | |
| refusal | array | 로그 확률 정보가 포함된 메시지 거부 토큰 목록입니다. | No |
chatCompletionTokenLogprob
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| token | string | The token. | Yes | |
| logprob | number | 이 토큰의 로그 확률입니다. | Yes | |
| bytes | array | UTF-8 바이트 토큰 표현을 나타내는 정수 목록입니다. 여러 개의 토큰으로 표현되는 문자와 그 바이트 표현을 결합해야 올바른 텍스트 표현을 생성할 때 유용합니다. 토큰에 바이트 표현이 없으면 그 null 럴 수 있습니다. |
Yes | |
| top_logprobs | array | 이 토큰 위치에서 가장 가능성 높은 토큰과 그 로그 확률 목록입니다. 드물게는 요청 top_logprobs 된 반송 수보다 적을 수도 있습니다. |
Yes |
chatCompletionResponseMessage
모델이 생성하는 채팅 완료 메시지입니다.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| role | chatCompletionResponseMessageRole | 응답 메시지의 작성자의 역할. | Yes | |
| refusal | string | 모델이 생성하는 거부 메시지입니다. | Yes | |
| content | string | 메시지 내용. | Yes | |
| tool_calls | array | 모델이 생성하는 도구 호출, 예를 들어 함수 호출. | No | |
| function_call | chatCompletionFunctionCall | 폐기되고 .로 tool_calls대체됨. 모델이 생성한 함수의 이름과 인자. |
No | |
| context | azureChatExtensionsMessageContext | Azure OpenAI 채팅 확장 기능이 관련될 때 이용 가능한 추가 맥락 정보를 나타냅니다 해당 채팅 완료 응답을 생성하는 과정에서. 이 맥락 정보는 필요할 때만 채워집니다 Azure OpenAI 요청을 사용해 매칭 확장 기능을 사용하도록 설정했습니다. |
No |
chatCompletionResponseMessageRole
응답 메시지의 작성자의 역할.
설명: 응답 메시지의 작성자의 역할.
Type: string
Default:
Enum Values:
- assistant
chatCompletionToolChoiceOption
모델이 호출하는 도구가 어떤 것인지(있다면) 제어합니다.
none 즉, 모델은 어떤 도구를 호출하지 않고 메시지를 생성합니다.
auto 즉, 모델은 메시지를 생성하거나 하나 이상의 도구를 호출할 수 있습니다.
required 즉, 모델이 하나 이상의 도구를 호출해야 한다는 뜻입니다. 특정 도구를 지정 {"type": "function", "function": {"name": "my_function"}} 하면 모델이 그 도구를 호출하도록 강제합니다.
none 도구가 없을 때 기본값입니다.
auto 도구가 있으면 기본값입니다.
이 구성 요소는 다음 중 하나일 수 있습니다:
chatCompletionNamedToolChoice
모델이 사용해야 할 도구를 지정합니다. 모델을 특정 함수를 호출하도록 강제하는 데 사용됩니다.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| type | enum | 도구의 종류. 현재는 오직 지원만 function 가능합니다.가능한 값: 함수 |
Yes | |
| function | object | Yes |
함수의 성질
name
| Name | Type | Description | Default |
|---|---|---|---|
| name | string | 호출할 함수의 이름입니다. |
ParallelToolCalls
도구 사용 중 병렬 함수 호출을 활성화할지 여부.
이 컴포넌트에 대한 속성이 정의되어 있지 않습니다.
chatCompletionMessageToolCalls
모델이 생성하는 도구 호출, 예를 들어 함수 호출.
이 컴포넌트에 대한 속성이 정의되어 있지 않습니다.
chatCompletionFunctionCall
폐기되고 .로 tool_calls대체됨. 모델이 생성한 함수의 이름과 인자.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| name | string | 호출할 함수의 이름입니다. | Yes | |
| arguments | string | 모델이 JSON 형식으로 생성한 함수 호출 인수들. 모델이 항상 유효한 JSON을 생성하는 것은 아니며, 함수 스키마에서 정의되지 않은 매개변수를 생성할 수 있다는 점을 유의하세요. 함수를 호출하기 전에 코드 내 인자를 검증하세요. | Yes |
completionUsage
완료 요청의 사용 통계.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| prompt_tokens | integer | 프롬프트에 있는 토큰 수. | Yes | |
| completion_tokens | integer | 생성된 완료 토큰의 수. | Yes | |
| total_tokens | integer | 요청에 사용된 총 토큰 수(프롬프트 + 완료). | Yes | |
| completion_tokens_details | object | 완료에 사용되는 토큰의 내역. | No |
completion_tokens_details 속성
reasoning_tokens
| Name | Type | Description | Default |
|---|---|---|---|
| reasoning_tokens | integer | 추론을 위해 모델이 생성하는 토큰들. |
chatCompletionTool
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| type | enum | 도구의 종류. 현재는 오직 지원만 function 가능합니다.가능한 값: 함수 |
Yes | |
| function | FunctionObject | Yes |
FunctionParameters
함수들이 받아들이는 매개변수는 JSON 스키마 객체로 설명됩니다. 예제는 가이드와 JSON 스키마 참고 자료를 참고하세요.
생략 parameters 은 빈 매개변수 리스트를 가진 함수를 정의합니다.
이 컴포넌트에 대한 속성이 정의되어 있지 않습니다.
FunctionObject
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| description | string | 함수가 수행하는 기능에 대한 설명으로, 모델이 언제 어떻게 함수를 호출할지 결정하는 데 사용됩니다. | No | |
| name | string | 호출할 함수의 이름입니다. a-z, A-Z, 0-9 또는 밑줄과 대시를 포함해야 하며, 최대 길이는 64개여야 합니다. | Yes | |
| parameters | FunctionParameters | 함수들이 받아들이는 매개변수는 JSON 스키마 객체로 설명됩니다. 예제는 가이드와 JSON 스키마 참고 자료를 참고하세요. 생략 parameters 은 빈 매개변수 리스트를 가진 함수를 정의합니다. |
No | |
| strict | boolean | 함수 호출을 생성할 때 엄격한 스키마 준수를 활성화할지 여부. true로 설정하면 모델은 필드에서 parameters 정의된 정확한 스키마를 따릅니다. 가 가 될 true때 strict 는 JSON 스키마의 일부 부분집합만 지원됩니다. |
No | False |
ResponseFormatText
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| type | enum | 정의되는 응답 형식의 유형: text가능한 값: 텍스트 |
Yes |
ResponseFormatJsonObject
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| type | enum | 정의되는 응답 형식의 유형: json_object가능한 가치: json_object |
Yes |
ResponseFormatJsonSchemaSchema
응답 형식의 스키마는 JSON 스키마 객체로 설명됩니다.
이 컴포넌트에 대한 속성이 정의되어 있지 않습니다.
ResponseFormatJsonSchema
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| type | enum | 정의되는 응답 형식의 유형: json_schema가능한 값: json_schema |
Yes | |
| json_schema | object | Yes |
json_schema 속성
description
| Name | Type | Description | Default |
|---|---|---|---|
| description | string | 응답 형식이 무엇을 위한 것인지에 대한 설명으로, 모델이 그 형식에 어떻게 응답할지 결정하는 데 사용됩니다. |
name
| Name | Type | Description | Default |
|---|---|---|---|
| name | string | 응답 형식의 이름입니다. a-z, A-Z, 0-9 또는 밑줄과 대시를 포함해야 하며, 최대 길이는 64개여야 합니다. |
schema
| Name | Type | Description | Default |
|---|---|---|---|
| schema | ResponseFormatJsonSchemaSchema | 응답 형식의 스키마는 JSON 스키마 객체로 설명됩니다. |
strict
| Name | Type | Description | Default |
|---|---|---|---|
| strict | boolean | 출력 생성 시 엄격한 스키마 준수를 활성화할지 여부. true로 설정하면 모델은 필드에서 schema 정의된 정확한 스키마를 항상 따릅니다. 가 가 될 true때 strict 는 JSON 스키마의 일부 부분집합만 지원됩니다. |
False |
chatCompletionChoiceCommon
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| index | integer | No | ||
| finish_reason | string | No |
createTranslationRequest
Translation request.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| file | string | 번역할 오디오 파일. | Yes | |
| prompt | string | 모델의 스타일을 안내하거나 이전 오디오 세그먼트를 이어가는 선택적 텍스트. 프롬프트는 영어로 작성되어야 합니다. | No | |
| response_format | audioResponseFormat | 출력 형식을 정의합니다. | No | |
| temperature | number | 샘플링 온도는 0에서 1 사이입니다. 0.8처럼 높은 값은 출력이 더 무작위적이고, 0.2처럼 낮은 값은 더 집중되고 결정론적으로 만듭니다. 0으로 설정하면 모델은 로그 확률을 사용해 특정 임계값에 도달할 때까지 자동으로 온도를 올립니다. | No | 0 |
audioResponse
json일 때 번역 또는 전사 응답response_format
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| text | string | 번역 또는 필사된 텍스트. | Yes |
audioVerboseResponse
response_format verbose_json 번역 또는 전사 응답
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| text | string | 번역 또는 필사된 텍스트. | Yes | |
| task | string | 오디오 작업 종류. | No | |
| language | string | Language. | No | |
| duration | number | Duration. | No | |
| segments | array | No |
audioResponseFormat
출력 형식을 정의합니다.
설명: 출력 형식을 정의합니다.
Type: string
Default:
Enum Values:
- json
- text
- srt
- verbose_json
- vtt
createTranscriptionRequest
Transcription request.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| file | string | 전사할 오디오 파일 객체. | Yes | |
| prompt | string | 모델의 스타일을 안내하거나 이전 오디오 세그먼트를 이어가는 선택적 텍스트. 프롬프트는 오디오 언어와 일치해야 합니다. | No | |
| response_format | audioResponseFormat | 출력 형식을 정의합니다. | No | |
| temperature | number | 샘플링 온도는 0에서 1 사이입니다. 0.8처럼 높은 값은 출력이 더 무작위적이고, 0.2처럼 낮은 값은 더 집중되고 결정론적으로 만듭니다. 0으로 설정하면 모델은 로그 확률을 사용해 특정 임계값에 도달할 때까지 자동으로 온도를 올립니다. | No | 0 |
| language | string | 입력 오디오의 언어. 입력 언어를 ISO-639-1 형식으로 제공하면 정확도와 지연 시간이 향상됩니다. | No |
audioSegment
전사 또는 번역 부분.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| id | integer | Segment identifier. | No | |
| seek | number | 세그먼트의 오프셋. | No | |
| start | number | 세그먼트 시작 오프셋. | No | |
| end | number | 세그먼트 끝 오프셋. | No | |
| text | string | Segment text. | No | |
| tokens | array | 텍스트의 토큰들. | No | |
| temperature | number | Temperature. | No | |
| avg_logprob | number | 평균 로그 확률. | No | |
| compression_ratio | number | Compression ratio. | No | |
| no_speech_prob | number | 의 no speech확률 . |
No |
imageQuality
생성될 이미지의 품질입니다.
설명: 생성될 이미지의 품질.
Type: string
Default: standard
열구 이름: 품질
Enum Values:
| Value | Description |
|---|---|
| standard | 표준 품질로 이미지를 만듭니다. |
| hd | HD 화질은 더 세밀하고 이미지 전반에 걸쳐 더 일관성을 가진 이미지를 만들어냅니다. |
imagesResponseFormat
생성된 이미지가 반환되는 형식입니다.
설명: 생성된 이미지가 반환되는 형식.
Type: string
Default: url
열거 이름: ImagesResponseFormat
Enum Values:
| Value | Description |
|---|---|
| url | 생성된 이미지를 임시 다운로드할 수 있는 URL입니다. |
| b64_json | 생성된 이미지는 base64 인코딩된 문자열로 반환됩니다. |
imageSize
생성된 이미지의 크기.
설명: 생성된 이미지의 크기.
Type: string
Default: 1024x1024
열구 이름: 크기
Enum Values:
| Value | Description |
|---|---|
| 1792x1024 | 생성된 이미지의 원하는 크기는 1792x1024 픽셀입니다. |
| 1024x1792 | 생성된 이미지의 원하는 크기는 1024x1792 픽셀입니다. |
| 1024x1024 | 생성된 이미지의 원하는 크기는 1024x1024 픽셀입니다. |
imageStyle
생성된 이미지의 스타일.
설명: 생성된 이미지의 스타일.
Type: string
Default: vivid
열거 이름: 스타일
Enum Values:
| Value | Description |
|---|---|
| vivid | Vivid는 초현실적이고 극적인 이미지를 만들어냅니다. |
| natural | 자연은 더 자연스럽고 덜 과장된 이미지를 만듭니다. |
imageGenerationsRequest
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| prompt | string | 원하는 이미지에 대한 텍스트 설명. 최대 길이는 4,000자입니다. | Yes | |
| n | integer | 생성해야 할 이미지 수. | No | 1 |
| size | imageSize | 생성된 이미지의 크기. | No | 1024x1024 |
| response_format | imagesResponseFormat | 생성된 이미지가 반환되는 형식입니다. | No | url |
| user | string | 최종 사용자를 대표하는 고유 식별자로, 남용을 모니터링하고 탐지하는 데 도움이 됩니다. | No | |
| quality | imageQuality | 생성될 이미지의 품질입니다. | No | standard |
| style | imageStyle | 생성된 이미지의 스타일. | No | vivid |
generateImagesResponse
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| created | integer | 유닉스 타임스탬프가 생성된 시점입니다. | Yes | |
| data | array | 성공 시 연산의 결과 데이터입니다 | Yes |
imageResult
성공하면 이미지 URL 또는 인코딩된 이미지, 그렇지 않으면 오류가 발생합니다.
| Name | Type | Description | Required | Default |
|---|---|---|---|---|
| url | string | 이미지 URL. | No | |
| b64_json | string | base64 인코딩 이미지 | No | |
| content_filter_results | dalleContentFilterResults | 콘텐츠 필터링 결과에 대한 정보. | No | |
| revised_prompt | string | 이미지를 생성하는 데 사용된 프롬프트, 혹은 프롬프트에 수정된 부분이 있다면 말이죠. | No | |
| prompt_filter_results | dalleFilterResults | 콘텐츠 필터링 카테고리(증오, 성적, 폭력, self_harm), 감지 여부, 심각도 수준(very_low, 낮음, 중간, 고수준, 해로운 콘텐츠의 강도와 위험 수준을 결정함), 필터링 여부에 관한 정보입니다. 탈옥 내용과 욕설에 관한 정보, 감지되었는지, 필터링되었는지 여부. 그리고 고객 차단 목록이 필터링되었는지 여부와 그 ID에 관한 정보도 알려줍니다. | No |
Completions extensions
완성 확장은 최신 GA 버전의 Azure OpenAI 데이터 플레인 추론 명세에 포함되어 있지 않습니다.
Chatmessage
채팅 메시지 객체는 최신 GA 버전의 Azure OpenAI 데이터 플레인 추론 명세에 포함되어 있지 않습니다.
텍스트 음성 변환 (미리보기)
현재 Azure OpenAI 데이터 평면 추론 명세의 최신 Azure OpenAI GA 버전에는 포함되어 있지 않습니다. 이 기능에 대해서는 최신 preview 버전을 참조하십시오.
Next steps
모델에 대해 배우 고, REST API를 활용한 미세 조정도 알아보세요.
OpenAI를 구동하는