Windows 365 for Agents MCP 서버 참조 (미리보기)

Important

  • 미리 보기 기능입니다.
  • 프리뷰 기능은 프로덕션용으로 만들어진 것이 아니므로 기능이 제한될 수 있습니다. 이러한 기능은 추가 사용 약관의 적용을 받으며, 고객이 조기에 액세스하고 피드백을 제공할 수 있도록 공식 릴리스 전에 사용할 수 있습니다.

Windows 365 for Agents는 Windows 365 클라우드 PC의 완전한 운영 제어를 위한 MCP 서버입니다. 이 MCP 서버를 사용해 데스크톱 상호작용(마우스, 키보드, 스크린 캡처, 명령 실행), Microsoft Edge를 통한 브라우저 자동화, Windows UI 자동화를 통한 의미 UI 검사를 통해 실제 Windows 환경을 구동합니다.

Note

  • 기존 Microsoft MCP 서버 버전을 사용하는 기존 연결은 여전히 지원됩니다.
  • 모든 새로운 연결을 위해서는 최신 Windows 365 에이전트 MCP 서버를 사용하세요. 이 서버는 데스크톱, 브라우저, 접근성 기능을 포함한 다양한 도구를 제공합니다.
  • 브라우저 자동화는 Microsoft Edge에서 작동합니다. 엣지는 첫 번째 브라우저 툴 호출 시 자동으로 실행됩니다. focus_browser 크롬이나 파이어폭스도 타겟팅할 수 있지만, DOM 수준의 브라우저 도구는 엣지 인스턴스에서만 작동합니다.

에이전트 Windows 365에 대해 더 알고 싶다면 에이전트 문서<Windows 365>를 참조하세요.

Overview

Server ID Tenant-level URL Display name Description
mcp_W365AServer https://agent365.svc.cloud.microsoft/
agents/tenants/{tenantId}/
servers/mcp_W365AServer
Windows 365 for Agents MCP 서버 Windows 365 클라우드 PC의 완전한 운영 제어권을 제공하며, 데스크톱 상호작용, 브라우저 자동화, UI 검사 등이 포함됩니다.

Available tools

mcp_desktop_move_mouse

커서를 화면 위치로 옮기세요. 목적지를 클릭할 계획이라면 대신 사용 mcp_desktop_click 하세요. Required parameters:

  • x: 화면 픽셀 단위의 X 좌표
  • y: 화면 픽셀 내 Y 좌표

mcp_desktop_click

좌표가 생략된 경우 현재 커서 위치를 클릭하세요. 싱글 클릭, 더블 클릭, 그리고 다섯 개의 마우스 버튼 모두를 지원합니다.

Optional parameters:

  • x: 화면 픽셀 단위의 X 좌표 (현재 위치는 생략)
  • y: 화면 픽셀 단위의 Y 좌표 (현재 위치는 생략)
  • 버튼: 왼쪽, 오른쪽, 가운데, 앞으로, 또는 뒤로 (기본 왼쪽)
  • 클릭 횟수: 1 = 싱글 클릭, 2 = 더블 클릭 (기본 1)

mcp_desktop_get_cursor_position

현재 커서 좌표를 반환하세요. No parameters. {cursorX, cursorY}를 반환합니다.

mcp_desktop_drag_mouse

한 위치에서 다른 자세로 끌고 다니는 것. 객체 이동, 창 크기 조정, 픽셀 단위 정밀한 스크롤에 유용합니다. Required parameters:

  • startX: X 좌표 시작.
  • startY: Y 좌표 시작.
  • endX: 끝 X 좌표.
  • endY: Y 좌표 끝. Optional parameters:
  • 버튼: 왼쪽, 오른쪽, 가운데 (기본값은 왼쪽)

mcp_desktop_scroll

픽셀이 아닌 노치 단위를 사용해 위치에서 스크롤하세요. 세 개의 노치는 대략 한 페이지에 해당합니다.

Required parameters:

  • x: 스크롤 위치 X
  • y: 스크롤 위치 Y

Optional parameters:

  • deltaX: 수평 노치, 양수 = 오른쪽 (기본 0)
  • deltaY: 수직 노치, 양수 = 다운 (기본 0)

Note

값은 [-20, 20] 범위로 고정됩니다.

mcp_desktop_type_text

키보드 시뮬레이션을 통해 텍스트를 입력하세요. 키보드 단축키는 .을 사용 mcp_desktop_press_keys하세요. 웹 폼 필드는 .을 사용하세요 mcp_browser_type.

Required parameters:

  • 텍스트: 타이핑 텍스트

mcp_desktop_press_keys

키 조합을 동시에 누르세요. 수정키, 기능 키, 표준 키를 지원합니다.

Required parameters:

  • 키: 함께 누르는 키 이름 배열(예: ["ctrl","c"], , ["alt","tab"]) ["ctrl","shift","s"]

mcp_desktop_take_screenshot

전체 화면 또는 잘린 영역을 PNG 이미지(base64 인코딩)로 캡처하세요.

Optional parameters:

  • x: 왼쪽 가장자리 자르기 영역
  • y: 크롭 영역 상단 가장자리
  • 너비: 크롭 영역 너비
  • 높이: 작물 지역 높이

Note

네 가지 크롭 매개변수를 모두 함께 제공하거나, 전체 화면 캡처를 위해 네 가지 매개변수를 모두 생략하세요.

mcp_desktop_zoom_region

화면 영역을 기본 해상도로 PNG 이미지(base64 인코딩)로 캡처하세요. 이 기능을 사용해 다운스케일된 전체 화면 스크린샷에서 읽기 어려운 작은 텍스트나 복잡한 UI를 점검할 수 있습니다.

Required parameters:

  • x: 왼쪽 가장자리 X 화면 픽셀 좌표
  • y: 화면 픽셀 단위의 상단 가장자리 Y 좌표
  • width: 픽셀 단위의 영역 너비
  • 높이: 픽셀 단위의 영역 높이

Note

최대 영역 크기는 1920x1080 픽셀입니다.

mcp_desktop_analyze_screen

화면 전체에 OCR을 적용하세요. No parameters. {fullText, averageConfidence, boxes[{text, confidence, x, y, width, height}], width, height}을(를) 반환합니다.

mcp_desktop_get_screen_size

화면 해상도를 반환하세요. No parameters. {width, height}을(를) 반환합니다.

mcp_desktop_list_windows

보이는 모든 창문과 그 제목, 위치, 크기를 나열하세요. No parameters. . 배열 {title, processName, handle, x, y, width, height}을 반환합니다.

mcp_desktop_activate_window

흐릿한 타이틀 매치를 이용해 전경에 창을 띄우세요.

Required parameters:

  • titlePattern: 부분 창 제목 (대소문자 구분 없는 서브스트링)

mcp_desktop_focus_browser

브라우저 창(Edge, Chrome, Firefox)에 집중하세요. 선택적으로 URL이나 제목으로 필터링할 수 있습니다.

Optional parameters:

  • 패턴: URL 또는 제목 서브스트링을 일치시키기 (브라우저 창은 생략)

mcp_desktop_close_window

흐릿한 타이틀 매치로 우아하게 창을 닫으세요. 시스템 중요 프로세스는 보호되며 닫을 수 없습니다.

Required parameters:

  • titlePattern: 부분 창 타이틀 (80% 매치 임계값). {matchedTitle, processName, closed}을(를) 반환합니다.

mcp_desktop_resize_window

퍼지 타이틀 매치를 사용해 창을 크기 조절, 이동, 극대화, 최소화 또는 복원할 수 있습니다.

Required parameters:

  • 제목: 윈도우 타이틀 투 매칭 (대문자 구분 없는 퍼지 매칭)
  • 행동: 행동 — Resize, Move, Maximize, Minimize, 또는 Restore

Optional parameters:

  • x: 왼쪽 가장자리 X 좌표 (크기 조절 또는 이동과 함께 사용)
  • y: 상단 가장자리 Y 좌표 (크기 조절 또는 이동과 함께 사용)
  • width: 픽셀 단위 너비 (Resize와 함께 사용)
  • 높이: 픽셀 단위의 높이 (Resize와 함께 사용)

mcp_desktop_execute_shell_command

샌드박스 환경에서 셸 명령을 실행해 보세요. 명령어는 허용 목록에 대해 검증되며, 위험한 패턴은 차단됩니다.

Required parameters:

  • 명령: 실행 명령

Optional parameters:

  • cwd: 작업 디렉터리. 앞으로의 슬래시(예: C:/Users/me/project)를 사용하세요.
  • 타임아웃Ms: 밀리초 단위 타임아웃 (기본 30000, 최대 30000)

Note

  • 허용 명령어: git, npm, dotnet, python, cargo, node, pip, dir, mkdir, del, copy, move, robocopy, findstr, where, type, notepad.
  • 차단된 패턴에는 셸 메타캐릭터(|, ;, &, <), >환경 변수 확장 (%VAR%), 인터프리터 평가 플래그(python -c 또는 node -e), git config --global, npm -g, 경로 접두사 실행 파일, rm -rf, sudo, 디스크/시스템 명령어가 포함됩니다.
  • stdout stderr 각각 32KB로 절단되었습니다. 임의의 계산에 사용됩니다 mcp_desktop_execute_python_code . {stdout, stderr, exitCode, success, timedOut, resourceLimitsApplied}을(를) 반환합니다.

mcp_desktop_execute_python_code

자원 제한이 있는 샌드박스 환경에서 Python 코드를 실행하세요. 데이터 처리, 계산, 파일 I/O, 그리고 단순한 셸 명령어를 넘어서는 모든 계산에 이상적입니다.

Required parameters:

  • code: Python 코드(최대 262,144자).

Optional parameters:

  • cwd: 작업 디렉터리. 앞으로의 베기를 사용하세요.
  • 타임아웃Ms: 밀리초 단위의 타임아웃(기본값 30000, 최대 30000).

와 동일한 스키마 mcp_desktop_execute_shell_command를 반환합니다.

Note

샌드박스는 512MB 메모리 제한과 30초 타임아웃을 강제합니다.

mcp_desktop_wait_milliseconds

애니메이션이나 전환이 완료될 수 있도록 실행을 일시정지하세요. 폴링 루프에서는 사용하지 마세요—DOM 폴링에 사용 mcp_browser_wait_for 하세요.

Required parameters:

  • ms: 대기 시간 (밀리초 단위) ([0, 5000]로 클램프됨)

mcp_desktop_clipboard_read

시스템 클립보드의 현재 내용을 읽어보세요. No parameters. 클립보드 형식과 페이로드를 설명하는 JSON 객체를 반환합니다 — 텍스트 문자열 또는 base64로 인코딩된 이미지일 수 있습니다.

mcp_desktop_clipboard_write

시스템 클립보드에 텍스트를 작성하여 현재 내용을 교체합니다.

Required parameters:

  • 텍스트: 클립보드에 쓸 텍스트

문자 수가 포함된 확인서를 반환합니다.

mcp_desktop_list_processes

현재 세션에서 실행 중인 프로세스를 나열하세요. 각 항목에는 PID, 프로세스 이름, 메모리 사용량, 창 제목(있는 경우), 그리고 startTimeTicks. 재활용된 PID를 죽이지 않도록 함께 startTimeTicksmcp_desktop_kill_process 사용하세요.

Optional parameters:

  • maxCount: 반환할 최대 프로세스 수 (기본값 200)

프로세스 정보 객체의 JSON 배열을 반환합니다.

mcp_desktop_kill_process

PID로 프로세스를 종료하세요. PID 재활용을 방지하기 위해 값 mcp_desktop_list_processesstartTime 반드시 제공되어야 합니다.

Required parameters:

  • pid: 프로세스 ID가 반환했습니다 mcp_desktop_list_processes
  • startTime: 프로세스 시작 시간 틱이 반환됩니다 mcp_desktop_list_processes

Optional parameters:

  • 포스: 우아한 종료 없이 포스 킬 (기본 false)

결과를 설명하는 JSON 결과를 반환합니다.

mcp_desktop_launch_application

허용된 디렉터리에서 GUI 애플리케이션을 실행하세요. CLI 명령어로 사용 mcp_desktop_execute_shell_command 하세요.

Required parameters:

  • path: 실행 파일로 가는 절대 경로. 앞으로의 슬래시(예: C:/Program Files/app.exe)를 사용하세요.

Optional parameters:

  • args: 명령줄 인수 배열

{path, pid}을(를) 반환합니다.

mcp_desktop_get_system_info

OS 버전, CPU, RAM, 사용 가능한 디스크 공간, 디스플레이 해상도를 반환합니다. No parameters. 시스템 정보를 담은 JSON 객체를 반환합니다.

mcp_browser_navigate

URL로 이동해서 페이지가 로드될 때까지 기다리세요.

Required parameters:

  • URL: 프로토콜을 포함한 전체 URL (예: https://example.com)

mcp_browser_back

브라우저 기록에서 다시 탐색하세요. No parameters.

mcp_browser_forward

브라우저 기록에서 앞으로 이동하세요. No parameters.

mcp_browser_reload

현재 페이지를 다시 불러오세요. No parameters.

mcp_browser_get_url

현재 페이지 URL을 일반 문자열로 반환하세요. No parameters.

mcp_browser_get_title

현재 페이지 제목을 단순한 문자열로 반환하세요. No parameters.

mcp_browser_get_text

보이는 페이지 텍스트 내용을 일반 문자열로 반환하세요. No parameters. 512KB로 축소되었습니다.

mcp_browser_get_html

전체 페이지의 HTML 소스를 일반 문자열로 반환하세요. No parameters. 512KB로 축소되었습니다.

mcp_browser_click

CSS 셀렉터로 DOM 요소를 클릭하세요. 좌표 기반 클릭보다 웹 콘텐츠가 더 신뢰할 만합니다.

Required parameters:

  • 셀렉터: CSS 셀렉터 (예: #submit-btna.nav-link또는 )

mcp_browser_type

CSS 선택기로 폼 요소에 텍스트를 입력하세요.

Required parameters:

  • 셀렉터: 입력 요소의 CSS 셀렉터입니다.
  • 텍스트: 타이핑 텍스트

mcp_browser_query_text

첫 번째 요소의 텍스트 내용을 CSS 셀렉터와 일치하도록 얻으세요.

Required parameters:

  • 셀렉터: CSS 셀렉터

mcp_browser_wait_for

DOM 요소가 나타날 때까지 기다리세요. 비동기적으로 로드되는 동적 콘텐츠에 유용합니다.

Required parameters:

  • 선택기: CSS 선택기를 기다리기 위해

Optional parameters:

  • 타임아웃Ms: 밀리초 단위 타임아웃 (기본 5000, 최대 30000)

mcp_browser_eval_js

페이지 컨텍스트에서 자바스크립트 표현식을 평가하고 결과를 문자열로 반환합니다.

Required parameters:

  • 표현식: 문자열을 반환하는 JavaScript 표현식입니다

Note

만약 표현식에서 객체나 숫자를 반환한다면, 그것을 명시적으로 문자열로 변환하세요(예: JSON.stringify(obj).toString()또는 ).

mcp_browser_list_tabs

열려 있는 모든 탭을 인덱스, 제목, URL과 함께 나열하세요. No parameters. . 배열 {index, title, url}을 반환합니다.

mcp_browser_switch_tab

인덱스 탭으로 전환하세요.

Required parameters:

  • tabIndex: 0 기반 탭 인덱스

mcp_browser_new_tab

새 탭을 열고, 선택적으로 URL로 이동하세요.

Optional parameters:

  • URL: 열기 URL (생략 시 빈 탭)

{index, title, url}을(를) 반환합니다.

mcp_browser_close_tab

인덱스로 탭을 닫으세요.

Required parameters:

  • tabIndex: 0 기반 탭 인덱스

mcp_browser_screenshot

브라우저 뷰포트만 PNG 스크린샷으로 캡처하세요(전체 화면은 찍지 마세요). No parameters. base64로 인코딩된 PNG를 반환합니다.

mcp_browser_select_option

속성에 따라 value 요소 내에서 <select> 하나 이상의 옵션을 선택하세요.

Required parameters:

  • 셀렉터: 요소에 대한 <select> CSS 셀렉터
  • : 선택할 옵션 값 배열입니다

선택된 옵션 수를 확인 응답합니다.

mcp_browser_fill_form

한 번의 통화로 여러 양식 필드를 작성하세요. 각 항목은 쌍 {selector, value} 으로 이루어집니다. 첫 실패 시 정지하고 성공한 필드를 보고합니다.

Required parameters:

  • 필드: 쌍 배열 {selector, value}

채워진 필드 수를 확인해 줍니다.

mcp_browser_drag

소스 요소를 타겟 요소로 드래그합니다. 두 요소 모두 CSS 선택기로 식별됩니다.

Required parameters:

  • sourceSelector: 드래그 소스의 CSS 셀렉터입니다
  • targetSelector: 드롭 타겟의 CSS 셀렉터입니다

mcp_browser_pdf_save

현재 페이지를 PDF 파일로 저장하세요. 목적지 경로는 또는 %TEMP%로 제한 %USERPROFILE% 됩니다.

Required parameters:

  • filePath: 또는 %TEMP%. %USERPROFILE% 아래에 있는 목적지 파일 경로. 앞으로의 베기를 사용하세요.

저장된 파일 경로가 포함된 확인 메시지를 반환합니다.

mcp_browser_handle_dialog

대기 중인 브라우저 대화상자(알림, 확인, 프롬프트, 또는 언로드 전)를 수락하거나 해제하세요. 활성 대화가 없으면 "대기 중인 대화 없음"을 반환합니다.

Required parameters:

  • 행동: accept 또는 dismiss

Optional parameters:

  • promptText: 알림 및 확인 시 무시하는 프롬프트 대화 대화 텍스트

mcp_browser_snapshot

DOM 노드에 매핑되는 안정적인 참조 ID(예: e5)로 페이지의 접근성 트리를 캡처하세요. , , mcp_browser_hover_ref와 함께 참조를 사용하세요.mcp_browser_click_refmcp_browser_type_ref 참조는 페이지가 탐색할 때 만료됩니다 — 탐색 후 다시 스냅샷을 찍으세요.

Optional parameters:

  • maxDepth: 최대 나무 깊이, 1-10 (기본 5)
  • includeIframes: 교차 출처 iframes 포함 (기본 true)

접근성 스냅샷과 참조 ID가 포함된 JSON 객체를 반환합니다.

mcp_browser_click_ref

참조 ID mcp_browser_snapshot로 요소 클릭 . 히트 테스트는 다른 요소가 목표물 위에 겹치지 않는지 확인합니다. 스냅샷이 만료되면 실패합니다 — 그럴 경우 다시 스냅샷을 가져와야 합니다.

Required parameters:

  • snapshotId: 스냅샷 ID 반환 mcp_browser_snapshot
  • ref: 스냅샷 노드의 요소 ref(예: e5)

Optional parameters:

  • 버튼: 왼쪽, 오른쪽, 또는 가운데 (기본 왼쪽)
  • 클릭 횟수: 1 = 싱글 클릭, 2 = 더블 클릭 (기본 1)

클릭하면 좌표가 포함된 확인 메시지를 반환합니다.

mcp_browser_type_ref

참조 ID mcp_browser_snapshot로 요소에 텍스트를 입력하세요. 요소가 먼저 포커스되고, 기존 텍스트는 기본적으로 지워집니다. 스냅샷이 만료되면 실패합니다.

Required parameters:

  • snapshotId: 스냅샷 ID 반환 mcp_browser_snapshot
  • ref: 스냅샷 노드의 요소 ref(예: e5)
  • 텍스트: 타이핑 텍스트

Optional parameters:

  • clear: 기존 텍스트를 먼저 명확히 해야 합니다 (기본 참)

문자 수가 포함된 확인서를 반환합니다.

mcp_browser_hover_ref

참조 ID mcp_browser_snapshot로 요소를 마우스 올리면 됩니다. Returns immediately. 스냅샷이 만료되면 실패합니다 — 그럴 경우 다시 스냅샷을 가져와야 합니다.

Required parameters:

  • snapshotId: 스냅샷 ID 반환 mcp_browser_snapshot
  • ref: 스냅샷 노드의 요소 ref(예: e5)

호버 좌표를 포함한 확인 응답을 반환합니다.

mcp_accessibility_get_accessibility_tree

전경 창의 UI 요소 트리를 불러옵니다. 각 요소에는 역할, 이름, 가치, 화면 좌표가 포함되어 있습니다.

Optional parameters:

  • maxDepth: 최대 나무 횡단 깊이, 1-10 (기본 3)
  • maxElements: 반환할 최대 요소, 1-2000 (기본 500)

{role, name, value, x, y, width, height, children[...]}의 계층 트리를 반환합니다.

mcp_accessibility_find_ui_element

텍스트 내용, 접근성 역할, 또는 이름(대소문자 구분 없는 서브스트링)으로 UI 요소를 검색하세요. 클릭 가능한 화면 좌표와 일치하는 요소를 반환합니다.

Optional parameters:

  • 텍스트: 검색용 텍스트 (이름이 생략되면 이름으로 사용)
  • 역할: UI 역할 필터 — Button, TextBox, CheckBox, MenuItem, ComboBox, 그리고 기타
  • 이름: 접근 가능한 이름(두 이름이 모두 제공될 경우 텍스트보다 우선)
  • windowHandle: 대상 윈도우 핸들 (null = foreground window)

Key features

Desktop interaction

  • 클릭, 더블 클릭, 오른쪽 클릭, 그리고 다섯 버튼 마우스 조작.
  • 픽셀 단위로 정밀하게 드래그 앤 드롭.
  • 노치 기반 스크롤(한 페이지≈ 세 노치 스크롤).
  • 키보드 타이핑과 다중 키 단축키 조합.
  • 커서 위치 추적.
  • 화면 해상도 감지.

화면 캡처 및 분석

  • 전체 화면 또는 잘린 PNG 스크린샷.
  • 전체 화면의 OCR과 지역별 신뢰도 점수, 경계 박스가 포함되어 있습니다.
  • 웹 콘텐츠는 브라우저 뷰포트 전용 스크린샷입니다.

Window management

  • 위치와 치수를 가진 모든 보이는 창을 열거하세요.
  • 퍼지 타이틀 매치로 창을 활성화하세요.
  • Focus: 브라우저 창(Edge, Chrome, Firefox)은 선택적으로 URL이나 제목으로 필터링됩니다.
  • 시스템 중요 프로세스에 대한 보호와 함께 우아하게 닫히는 윈도우.

Command execution

  • 허용 목록(git, npm, dotnet, python, cargo, node, pip, dir, mkdir, del, copy, move, robocopy, findstr, where, type)을 가진 샌드박스 셸 명령어들
  • 샌드박스 Python 최대 262,144자 코드의 실행.
  • 작업 디렉터리 및 통화당 타임아웃 제어(최대 30초).
  • 셸 메타캐릭터, 평가 플래그, 권한 상승, 파괴 작전에 대한 자원 제한과 강화된 차단 목록.

Browser automation

  • 내비게이션, 후진, 전방, 재장전.
  • 페이지URL, 제목, 가시 텍스트(512 KB 제한), 전체 HTML(512 KB 제한)을 읽으세요.
  • CSS 선택기를 통한 DOM 수준의 클릭, 타이핑, 텍스트 쿼리가 가능합니다.
  • 타임아웃 가능한 동적 요소를 기다리세요.
  • 페이지 맥락에서 표현을 평가하세요 JavaScript .
  • 멀티탭 관리: 리스트, 스위치, 열기, 닫기.
  • Microsoft Edge에서 실행되며, 첫 사용 시 자동으로 실행됩니다.

UI accessibility

  • 전경 창의 Windows UI 자동화 tree를 깊이와 요소 수를 설정할 수 있는 상태로 불러옵니다.
  • 텍스트, 역할, 접근 가능한 이름별로 UI 요소를 찾아보세요.
  • 버튼, 텍스트 박스, 체크박스, 메뉴 항목, 콤보 박스를 정밀하게 타겟팅할 수 있도록 클릭 가능한 화면 좌표를 반환합니다.

타이밍과 동기화

  • 짧은 원샷 일시정지 (최대 mcp_desktop_wait_milliseconds 5초).
  • DOM 수준의 폴링(최대 30초)을 통해 mcp_browser_wait_for 진행됩니다.

Notes

  • 모든 좌표는 화면 픽셀 단위이며, 왼쪽 상단에 (0,0)가 있습니다. , mcp_desktop_take_screenshotmcp_desktop_analyze_screen, mcp_accessibility_find_ui_element, 의 mcp_desktop_list_windows 좌표들은 모두 동일한 좌표 공간을 공유한다.
  • 커서 페이슬세이프가 활성화되어 있습니다: 커서가 화면 모서리에서 5픽셀 이내로 이동하면 마우스 조작이 취소됩니다. 화면 가장자리를 노리는 것은 피하세요.
  • 셸 파이프 연산자(|), 세미콜론(;), 앰퍼샌드(&), 출력 리디렉션(>, <)은 차단됩니다. 명령 출력을 변환하려면 캡처하고 로 처리 mcp_desktop_execute_python_code하세요.
  • 인터프리터 평가 플래그가 차단되거나 python -c "..."node -e "..."가 거부될 경우, Python 코드에 mcp_desktop_execute_python_code를 사용하거나 먼저 파일에 코드를 작성할 수 있습니다.
  • 명령어 stdout/stderr 는 각각 32KB로 축소됩니다. 플래그를 사용해 장황한 출력(예: git log --oneline -20)을 제한하거나 파일로 리디렉션하여 별도로 읽으세요.
  • mcp_desktop_execute_shell_commandmcp_desktop_execute_python_code 최대 타임아웃은 30초입니다. 긴 작업은 작은 단계로 나누거나 Python에서 백그라운드 프로세스를 실행하고 폴링하세요.
  • 전용 파일 읽기/쓰기 도구는 없습니다. mcp_desktop_execute_shell_command 파일을 type 명령어로 읽습니다; Python의 내장 파일 I/O를 사용해 mcp_desktop_execute_python_code 파일을 작성할 수 있습니다. 셸 출력 리디렉션(>, >>)이 차단됩니다.
  • mcp_browser_eval_js 항상 문자열을 반환합니다. 객체나 숫자를 명시적으로 변환한 후 반환하세요.
  • 브라우저 DOM 도구들(mcp_browser_click, mcp_browser_type, mcp_browser_eval_js 등)은 Microsoft Edge 인스턴스에서만 작동합니다.  mcp_desktop_focus_browser 크롬이나 파이어폭스 창에 집중할 수는 있지만, DOM 도구는 이들을 대상으로 하지 않습니다.
  • mcp_desktop_take_screenshot 전체 화면 캡처를 위해서는 네 가지 자르기 매개변수(X, Y, 너비, 높이)를 모두 필요하며, 또는 아예 없어야 합니다.
  • mcp_desktop_scroll 픽셀이 아닌 노치 유닛([-20, 20]에 클램프됨)을 사용합니다. 세 개의 노치는 대략 한 페이지에 해당합니다.
  • mcp_accessibility_find_ui_element 텍스트, 역할 또는 이름 중 적어도 하나가 필요합니다. 텍스트와 이름이 모두 제공될 경우, 이름이 우선권을 가집니다.

일반적인 사용 사례

웹 양식을 작성하세요

  • 타겟 페이지를 열기 위해 전화하세요 mcp_browser_navigate .
  • 양식이 로드될 때까지 기다리라고 전화하세요 mcp_browser_wait_for .
  • CSS 셀렉터로 각 필드를 채우기 위해 호출하세요 mcp_browser_type .
  • 신청서를 제출하려면 전화하세요 mcp_browser_click .
  • 확인 요소를 기다리기 위해 전화하세요 mcp_browser_wait_for .
  • 결과를 확인하고 확인하려면 전화하세요 mcp_browser_get_text .

데스크톱 애플리케이션 자동화

  • 신청서를 부각시키기 위해 전화하세요 mcp_desktop_activate_window .
  • 현재 상태를 캡처하기 위해 호출하세요 mcp_desktop_take_screenshot .
  • 이름으로 버튼이나 필드를 찾으려면 전화하세요 mcp_accessibility_find_ui_element .
  • 보고된 요소의 좌표를 호출해 mcp_desktop_click .
  • 데이터를 입력하려면 전화하세요 mcp_desktop_type_text .
  • 단축키(예: ["ctrl", "s"]] 저장 명령)를 호출하세요 mcp_desktop_press_keys .
  • 결과를 확인하려면 전화하세요 mcp_desktop_take_screenshot .

웹페이지에서 데이터 추출하기

  • 페이지를 열기 위해 전화하세요 mcp_browser_navigate .
  • 가시적인 텍스트 내용을 추출하기 위해 호출 mcp_browser_get_text 합니다.
  • 추출된 데이터를 파싱하고 처리하기 위해 호출합니다 mcp_desktop_execute_python_code .
  • mcp_browser_eval_js 텍스트 추출만으로는 부족할 때 JavaScript를 통해 특정 값을 쿼리할 수 있습니다.

개발 작업 실행

  • , , , 에 대해 호출합니다 mcp_desktop_execute_shell_commandgit pullnpm install.dotnet build
  • 빌드 출력을 캡처하기 위해 호출하세요 mcp_desktop_take_screenshot .
  • 로그 분석이나 테스트 결과를 원하시면 전화하세요 mcp_desktop_execute_python_code .
  • 브라우저에서 로컬 개발 서버를 열기 위해 호출 mcp_browser_navigate 하세요.
  • 렌더링된 페이지를 캡처하기 위해 호출하세요 mcp_browser_screenshot .

파일 읽기 및 쓰기

  • 파일을 읽으면서 mcp_desktop_execute_shell_commandtype C:\path\to\file.txt.
  • mcp_desktop_execute_python_code 파일을 Python의 open(...)write(...)로 작성하세요.
  • .을 사용mcp_desktop_execute_shell_commanddir C:\path\to\output.txt 검증하세요.
  • 전체 UI 구조를 이해하려면 전화하세요 mcp_accessibility_get_accessibility_tree .
  • 특정 컨트롤을 찾기 위해 호출하세요 mcp_accessibility_find_ui_element (예: 역할: "MenuItem", 이름: "Settings").
  • 원소의 보고된 좌표를 사용해 호출하세요 mcp_desktop_click .
  • 대화 내에서 다음 컨트롤을 찾기 위해 다시 호출하세요 mcp_accessibility_find_ui_element .
  • 전화 mcp_desktop_type_text 하거나 mcp_desktop_click 상호작용하세요.

장기 세션을 계속 이어가세요

  • MCP 요청을 최소 30분마다 한 번 보내 무단 퇴거를 방지하세요.
  • mcp_desktop_get_screen_size 가볍고 심장 박동처럼 잘 작동합니다.