대화 에이전트 성능 향상을 위한 모범 사례

대화형 에이전트의 성능 문제를 피하려면 흔한 실패 지점을 이해하고 모범 사례를 따르세요.

할당량 및 한도

RPM(분당 요청 횟수, 즉 에이전트에게 보내는 메시지)와 24시간 내에 허용되는 Power Platform 요청 수 같은 할당량과 한계를 이해하세요.

할당량은 Microsoft Copilot Studio 계획 함께 제공되는 용량 제약 조건과 함께 에이전트에 적용됩니다.

에이전트의 성능을 최적화하세요

에이전트의 성능을 최적화하기 위해 다음 모범 사례를 고려하세요:

  • API 호출과 커넥터 호출을 대화 흐름에 전략적으로 배치하여 사용자가 여러 번 완료되는 것을 기다리지 않도록 하세요.
  • 해당되는 경우, 캐시는 여러 API 호출이나 플로우 호출 대신 변수를 사용하여 정보를 검색했습니다.
  • Copilot Studio 에이전트에서 호출된 클라우드 흐름은 대기 시간을 도입할 수 있습니다. 대신 직접 커넥터 호출 이나 HTTP 요청 전송 노드를 사용하는 것을 고려해 보세요.
  • Copilot Studio에서 클래식 NLU와 생성 오케스트레이션 사이의 성능과 복잡성의 절충점을 이해합니다. NLU(자연어 이해) 모델은 특정 의도에 대해서는 잘 작동하지만, 복잡한 쿼리에는 어려움을 겪습니다. 생성형 AI 모델은 더 넓은 범위의 입력을 처리하지만 지연 시간을 초래할 수 있습니다.
  • 익스프레스 모드를 켜세요.

클라우드 흐름을 최적화해 성능을 확보하세요

에이전트가 Power Automate 흐름을 호출하는 경우 클라우드 흐름이 최적화되었는지 확인합니다.