Important
- 미리 보기 기능입니다.
- 프리뷰 기능은 프로덕션용으로 만들어진 것이 아니므로 기능이 제한될 수 있습니다. 이러한 기능은 추가 사용 약관의 적용을 받으며, 고객이 조기에 액세스하고 피드백을 제공할 수 있도록 공식 릴리스 전에 사용할 수 있습니다.
Windows 365 for Agents는 Windows 365 클라우드 PC의 완전한 운영 제어를 위한 MCP 서버입니다. 이 MCP 서버를 사용해 데스크톱 상호작용(마우스, 키보드, 스크린 캡처, 명령 실행), Microsoft Edge를 통한 브라우저 자동화, Windows UI 자동화를 통한 의미 UI 검사를 통해 실제 Windows 환경을 구동합니다.
Note
- 기존 Microsoft MCP 서버 버전을 사용하는 기존 연결은 여전히 지원됩니다.
- 모든 새로운 연결을 위해서는 최신 Windows 365 에이전트 MCP 서버를 사용하세요. 이 서버는 데스크톱, 브라우저, 접근성 기능을 포함한 다양한 도구를 제공합니다.
- 브라우저 자동화는 Microsoft Edge에서 작동합니다. 엣지는 첫 번째 브라우저 툴 호출 시 자동으로 실행됩니다.
focus_browser크롬이나 파이어폭스도 타겟팅할 수 있지만, DOM 수준의 브라우저 도구는 엣지 인스턴스에서만 작동합니다.
에이전트 Windows 365에 대해 더 알고 싶다면 에이전트 문서<
Overview
| Server ID | Tenant-level URL | Display name | Description |
|---|---|---|---|
mcp_W365AServer |
https://agent365.svc.cloud.microsoft/agents/tenants/{tenantId}/servers/mcp_W365AServer |
Windows 365 for Agents MCP 서버 | Windows 365 클라우드 PC의 완전한 운영 제어권을 제공하며, 데스크톱 상호작용, 브라우저 자동화, UI 검사 등이 포함됩니다. |
Available tools
mcp_desktop_move_mouse
커서를 화면 위치로 옮기세요. 목적지를 클릭할 계획이라면 대신 사용 mcp_desktop_click 하세요. Required parameters:
- x: 화면 픽셀 단위의 X 좌표
- y: 화면 픽셀 내 Y 좌표
mcp_desktop_click
좌표가 생략된 경우 현재 커서 위치를 클릭하세요. 싱글 클릭, 더블 클릭, 그리고 다섯 개의 마우스 버튼 모두를 지원합니다.
Optional parameters:
- x: 화면 픽셀 단위의 X 좌표 (현재 위치는 생략)
- y: 화면 픽셀 단위의 Y 좌표 (현재 위치는 생략)
- 버튼: 왼쪽, 오른쪽, 가운데, 앞으로, 또는 뒤로 (기본 왼쪽)
- 클릭 횟수: 1 = 싱글 클릭, 2 = 더블 클릭 (기본 1)
mcp_desktop_get_cursor_position
현재 커서 좌표를 반환하세요. No parameters. {cursorX, cursorY}를 반환합니다.
mcp_desktop_drag_mouse
한 위치에서 다른 자세로 끌고 다니는 것. 객체 이동, 창 크기 조정, 픽셀 단위 정밀한 스크롤에 유용합니다. Required parameters:
- startX: X 좌표 시작.
- startY: Y 좌표 시작.
- endX: 끝 X 좌표.
- endY: Y 좌표 끝. Optional parameters:
- 버튼: 왼쪽, 오른쪽, 가운데 (기본값은 왼쪽)
mcp_desktop_scroll
픽셀이 아닌 노치 단위를 사용해 위치에서 스크롤하세요. 세 개의 노치는 대략 한 페이지에 해당합니다.
Required parameters:
- x: 스크롤 위치 X
- y: 스크롤 위치 Y
Optional parameters:
- deltaX: 수평 노치, 양수 = 오른쪽 (기본 0)
- deltaY: 수직 노치, 양수 = 다운 (기본 0)
Note
값은 [-20, 20] 범위로 고정됩니다.
mcp_desktop_type_text
키보드 시뮬레이션을 통해 텍스트를 입력하세요. 키보드 단축키는 .을 사용 mcp_desktop_press_keys하세요. 웹 폼 필드는 .을 사용하세요 mcp_browser_type.
Required parameters:
- 텍스트: 타이핑 텍스트
mcp_desktop_press_keys
키 조합을 동시에 누르세요. 수정키, 기능 키, 표준 키를 지원합니다.
Required parameters:
-
키: 함께 누르는 키 이름 배열(예:
["ctrl","c"], ,["alt","tab"])["ctrl","shift","s"]
mcp_desktop_take_screenshot
전체 화면 또는 잘린 영역을 PNG 이미지(base64 인코딩)로 캡처하세요.
Optional parameters:
- x: 왼쪽 가장자리 자르기 영역
- y: 크롭 영역 상단 가장자리
- 너비: 크롭 영역 너비
- 높이: 작물 지역 높이
Note
네 가지 크롭 매개변수를 모두 함께 제공하거나, 전체 화면 캡처를 위해 네 가지 매개변수를 모두 생략하세요.
mcp_desktop_zoom_region
화면 영역을 기본 해상도로 PNG 이미지(base64 인코딩)로 캡처하세요. 이 기능을 사용해 다운스케일된 전체 화면 스크린샷에서 읽기 어려운 작은 텍스트나 복잡한 UI를 점검할 수 있습니다.
Required parameters:
- x: 왼쪽 가장자리 X 화면 픽셀 좌표
- y: 화면 픽셀 단위의 상단 가장자리 Y 좌표
- width: 픽셀 단위의 영역 너비
- 높이: 픽셀 단위의 영역 높이
Note
최대 영역 크기는 1920x1080 픽셀입니다.
mcp_desktop_analyze_screen
화면 전체에 OCR을 적용하세요. No parameters.
{fullText, averageConfidence, boxes[{text, confidence, x, y, width, height}], width, height}을(를) 반환합니다.
mcp_desktop_get_screen_size
화면 해상도를 반환하세요. No parameters.
{width, height}을(를) 반환합니다.
mcp_desktop_list_windows
보이는 모든 창문과 그 제목, 위치, 크기를 나열하세요. No parameters. . 배열 {title, processName, handle, x, y, width, height}을 반환합니다.
mcp_desktop_activate_window
흐릿한 타이틀 매치를 이용해 전경에 창을 띄우세요.
Required parameters:
- titlePattern: 부분 창 제목 (대소문자 구분 없는 서브스트링)
mcp_desktop_focus_browser
브라우저 창(Edge, Chrome, Firefox)에 집중하세요. 선택적으로 URL이나 제목으로 필터링할 수 있습니다.
Optional parameters:
- 패턴: URL 또는 제목 서브스트링을 일치시키기 (브라우저 창은 생략)
mcp_desktop_close_window
흐릿한 타이틀 매치로 우아하게 창을 닫으세요. 시스템 중요 프로세스는 보호되며 닫을 수 없습니다.
Required parameters:
-
titlePattern: 부분 창 타이틀 (80% 매치 임계값).
{matchedTitle, processName, closed}을(를) 반환합니다.
mcp_desktop_resize_window
퍼지 타이틀 매치를 사용해 창을 크기 조절, 이동, 극대화, 최소화 또는 복원할 수 있습니다.
Required parameters:
- 제목: 윈도우 타이틀 투 매칭 (대문자 구분 없는 퍼지 매칭)
-
행동: 행동 —
Resize,Move,Maximize,Minimize, 또는Restore
Optional parameters:
- x: 왼쪽 가장자리 X 좌표 (크기 조절 또는 이동과 함께 사용)
- y: 상단 가장자리 Y 좌표 (크기 조절 또는 이동과 함께 사용)
- width: 픽셀 단위 너비 (Resize와 함께 사용)
- 높이: 픽셀 단위의 높이 (Resize와 함께 사용)
mcp_desktop_execute_shell_command
샌드박스 환경에서 셸 명령을 실행해 보세요. 명령어는 허용 목록에 대해 검증되며, 위험한 패턴은 차단됩니다.
Required parameters:
- 명령: 실행 명령
Optional parameters:
-
cwd: 작업 디렉터리. 앞으로의 슬래시(예:
C:/Users/me/project)를 사용하세요. - 타임아웃Ms: 밀리초 단위 타임아웃 (기본 30000, 최대 30000)
Note
- 허용 명령어: git, npm, dotnet, python, cargo, node, pip, dir, mkdir, del, copy, move, robocopy, findstr, where, type, notepad.
- 차단된 패턴에는 셸 메타캐릭터(|, ;, &, <), >환경 변수 확장
(%VAR%), 인터프리터 평가 플래그(python -c또는node -e),git config --global,npm -g, 경로 접두사 실행 파일,rm -rf,sudo, 디스크/시스템 명령어가 포함됩니다. -
stdoutstderr각각 32KB로 절단되었습니다. 임의의 계산에 사용됩니다mcp_desktop_execute_python_code.{stdout, stderr, exitCode, success, timedOut, resourceLimitsApplied}을(를) 반환합니다.
mcp_desktop_execute_python_code
자원 제한이 있는 샌드박스 환경에서 Python 코드를 실행하세요. 데이터 처리, 계산, 파일 I/O, 그리고 단순한 셸 명령어를 넘어서는 모든 계산에 이상적입니다.
Required parameters:
- code: Python 코드(최대 262,144자).
Optional parameters:
- cwd: 작업 디렉터리. 앞으로의 베기를 사용하세요.
- 타임아웃Ms: 밀리초 단위의 타임아웃(기본값 30000, 최대 30000).
와 동일한 스키마 mcp_desktop_execute_shell_command를 반환합니다.
Note
샌드박스는 512MB 메모리 제한과 30초 타임아웃을 강제합니다.
mcp_desktop_wait_milliseconds
애니메이션이나 전환이 완료될 수 있도록 실행을 일시정지하세요. 폴링 루프에서는 사용하지 마세요—DOM 폴링에 사용 mcp_browser_wait_for 하세요.
Required parameters:
- ms: 대기 시간 (밀리초 단위) ([0, 5000]로 클램프됨)
mcp_desktop_clipboard_read
시스템 클립보드의 현재 내용을 읽어보세요. No parameters. 클립보드 형식과 페이로드를 설명하는 JSON 객체를 반환합니다 — 텍스트 문자열 또는 base64로 인코딩된 이미지일 수 있습니다.
mcp_desktop_clipboard_write
시스템 클립보드에 텍스트를 작성하여 현재 내용을 교체합니다.
Required parameters:
- 텍스트: 클립보드에 쓸 텍스트
문자 수가 포함된 확인서를 반환합니다.
mcp_desktop_list_processes
현재 세션에서 실행 중인 프로세스를 나열하세요. 각 항목에는 PID, 프로세스 이름, 메모리 사용량, 창 제목(있는 경우), 그리고 startTimeTicks. 재활용된 PID를 죽이지 않도록 함께 startTimeTicksmcp_desktop_kill_process 사용하세요.
Optional parameters:
- maxCount: 반환할 최대 프로세스 수 (기본값 200)
프로세스 정보 객체의 JSON 배열을 반환합니다.
mcp_desktop_kill_process
PID로 프로세스를 종료하세요. PID 재활용을 방지하기 위해 값 mcp_desktop_list_processes 은 startTime 반드시 제공되어야 합니다.
Required parameters:
-
pid: 프로세스 ID가 반환했습니다
mcp_desktop_list_processes -
startTime: 프로세스 시작 시간 틱이 반환됩니다
mcp_desktop_list_processes
Optional parameters:
- 포스: 우아한 종료 없이 포스 킬 (기본 false)
결과를 설명하는 JSON 결과를 반환합니다.
mcp_desktop_launch_application
허용된 디렉터리에서 GUI 애플리케이션을 실행하세요. CLI 명령어로 사용 mcp_desktop_execute_shell_command 하세요.
Required parameters:
-
path: 실행 파일로 가는 절대 경로. 앞으로의 슬래시(예:
C:/Program Files/app.exe)를 사용하세요.
Optional parameters:
- args: 명령줄 인수 배열
{path, pid}을(를) 반환합니다.
mcp_desktop_get_system_info
OS 버전, CPU, RAM, 사용 가능한 디스크 공간, 디스플레이 해상도를 반환합니다. No parameters. 시스템 정보를 담은 JSON 객체를 반환합니다.
mcp_browser_navigate
URL로 이동해서 페이지가 로드될 때까지 기다리세요.
Required parameters:
-
URL: 프로토콜을 포함한 전체 URL (예:
https://example.com)
mcp_browser_back
브라우저 기록에서 다시 탐색하세요. No parameters.
mcp_browser_forward
브라우저 기록에서 앞으로 이동하세요. No parameters.
mcp_browser_reload
현재 페이지를 다시 불러오세요. No parameters.
mcp_browser_get_url
현재 페이지 URL을 일반 문자열로 반환하세요. No parameters.
mcp_browser_get_title
현재 페이지 제목을 단순한 문자열로 반환하세요. No parameters.
mcp_browser_get_text
보이는 페이지 텍스트 내용을 일반 문자열로 반환하세요. No parameters. 512KB로 축소되었습니다.
mcp_browser_get_html
전체 페이지의 HTML 소스를 일반 문자열로 반환하세요. No parameters. 512KB로 축소되었습니다.
mcp_browser_click
CSS 셀렉터로 DOM 요소를 클릭하세요. 좌표 기반 클릭보다 웹 콘텐츠가 더 신뢰할 만합니다.
Required parameters:
-
셀렉터: CSS 셀렉터 (예:
#submit-btna.nav-link또는 )
mcp_browser_type
CSS 선택기로 폼 요소에 텍스트를 입력하세요.
Required parameters:
- 셀렉터: 입력 요소의 CSS 셀렉터입니다.
- 텍스트: 타이핑 텍스트
mcp_browser_query_text
첫 번째 요소의 텍스트 내용을 CSS 셀렉터와 일치하도록 얻으세요.
Required parameters:
- 셀렉터: CSS 셀렉터
mcp_browser_wait_for
DOM 요소가 나타날 때까지 기다리세요. 비동기적으로 로드되는 동적 콘텐츠에 유용합니다.
Required parameters:
- 선택기: CSS 선택기를 기다리기 위해
Optional parameters:
- 타임아웃Ms: 밀리초 단위 타임아웃 (기본 5000, 최대 30000)
mcp_browser_eval_js
페이지 컨텍스트에서 자바스크립트 표현식을 평가하고 결과를 문자열로 반환합니다.
Required parameters:
- 표현식: 문자열을 반환하는 JavaScript 표현식입니다
Note
만약 표현식에서 객체나 숫자를 반환한다면, 그것을 명시적으로 문자열로 변환하세요(예: JSON.stringify(obj).toString()또는 ).
mcp_browser_list_tabs
열려 있는 모든 탭을 인덱스, 제목, URL과 함께 나열하세요. No parameters. . 배열 {index, title, url}을 반환합니다.
mcp_browser_switch_tab
인덱스 탭으로 전환하세요.
Required parameters:
- tabIndex: 0 기반 탭 인덱스
mcp_browser_new_tab
새 탭을 열고, 선택적으로 URL로 이동하세요.
Optional parameters:
- URL: 열기 URL (생략 시 빈 탭)
{index, title, url}을(를) 반환합니다.
mcp_browser_close_tab
인덱스로 탭을 닫으세요.
Required parameters:
- tabIndex: 0 기반 탭 인덱스
mcp_browser_screenshot
브라우저 뷰포트만 PNG 스크린샷으로 캡처하세요(전체 화면은 찍지 마세요). No parameters. base64로 인코딩된 PNG를 반환합니다.
mcp_browser_select_option
속성에 따라 value 요소 내에서 <select> 하나 이상의 옵션을 선택하세요.
Required parameters:
-
셀렉터: 요소에 대한
<select>CSS 셀렉터 - 값: 선택할 옵션 값 배열입니다
선택된 옵션 수를 확인 응답합니다.
mcp_browser_fill_form
한 번의 통화로 여러 양식 필드를 작성하세요. 각 항목은 쌍 {selector, value} 으로 이루어집니다. 첫 실패 시 정지하고 성공한 필드를 보고합니다.
Required parameters:
-
필드: 쌍 배열
{selector, value}
채워진 필드 수를 확인해 줍니다.
mcp_browser_drag
소스 요소를 타겟 요소로 드래그합니다. 두 요소 모두 CSS 선택기로 식별됩니다.
Required parameters:
- sourceSelector: 드래그 소스의 CSS 셀렉터입니다
- targetSelector: 드롭 타겟의 CSS 셀렉터입니다
mcp_browser_pdf_save
현재 페이지를 PDF 파일로 저장하세요. 목적지 경로는 또는 %TEMP%로 제한 %USERPROFILE% 됩니다.
Required parameters:
-
filePath: 또는
%TEMP%.%USERPROFILE%아래에 있는 목적지 파일 경로. 앞으로의 베기를 사용하세요.
저장된 파일 경로가 포함된 확인 메시지를 반환합니다.
mcp_browser_handle_dialog
대기 중인 브라우저 대화상자(알림, 확인, 프롬프트, 또는 언로드 전)를 수락하거나 해제하세요. 활성 대화가 없으면 "대기 중인 대화 없음"을 반환합니다.
Required parameters:
-
행동:
accept또는dismiss
Optional parameters:
- promptText: 알림 및 확인 시 무시하는 프롬프트 대화 대화 텍스트
mcp_browser_snapshot
DOM 노드에 매핑되는 안정적인 참조 ID(예: e5)로 페이지의 접근성 트리를 캡처하세요. , , mcp_browser_hover_ref와 함께 참조를 사용하세요.mcp_browser_click_refmcp_browser_type_ref 참조는 페이지가 탐색할 때 만료됩니다 — 탐색 후 다시 스냅샷을 찍으세요.
Optional parameters:
- maxDepth: 최대 나무 깊이, 1-10 (기본 5)
- includeIframes: 교차 출처 iframes 포함 (기본 true)
접근성 스냅샷과 참조 ID가 포함된 JSON 객체를 반환합니다.
mcp_browser_click_ref
참조 ID mcp_browser_snapshot로 요소 클릭 . 히트 테스트는 다른 요소가 목표물 위에 겹치지 않는지 확인합니다. 스냅샷이 만료되면 실패합니다 — 그럴 경우 다시 스냅샷을 가져와야 합니다.
Required parameters:
-
snapshotId: 스냅샷 ID 반환
mcp_browser_snapshot -
ref: 스냅샷 노드의 요소 ref(예:
e5)
Optional parameters:
- 버튼: 왼쪽, 오른쪽, 또는 가운데 (기본 왼쪽)
- 클릭 횟수: 1 = 싱글 클릭, 2 = 더블 클릭 (기본 1)
클릭하면 좌표가 포함된 확인 메시지를 반환합니다.
mcp_browser_type_ref
참조 ID mcp_browser_snapshot로 요소에 텍스트를 입력하세요. 요소가 먼저 포커스되고, 기존 텍스트는 기본적으로 지워집니다. 스냅샷이 만료되면 실패합니다.
Required parameters:
-
snapshotId: 스냅샷 ID 반환
mcp_browser_snapshot -
ref: 스냅샷 노드의 요소 ref(예:
e5) - 텍스트: 타이핑 텍스트
Optional parameters:
- clear: 기존 텍스트를 먼저 명확히 해야 합니다 (기본 참)
문자 수가 포함된 확인서를 반환합니다.
mcp_browser_hover_ref
참조 ID mcp_browser_snapshot로 요소를 마우스 올리면 됩니다. Returns immediately. 스냅샷이 만료되면 실패합니다 — 그럴 경우 다시 스냅샷을 가져와야 합니다.
Required parameters:
-
snapshotId: 스냅샷 ID 반환
mcp_browser_snapshot -
ref: 스냅샷 노드의 요소 ref(예:
e5)
호버 좌표를 포함한 확인 응답을 반환합니다.
mcp_accessibility_get_accessibility_tree
전경 창의 UI 요소 트리를 불러옵니다. 각 요소에는 역할, 이름, 가치, 화면 좌표가 포함되어 있습니다.
Optional parameters:
- maxDepth: 최대 나무 횡단 깊이, 1-10 (기본 3)
- maxElements: 반환할 최대 요소, 1-2000 (기본 500)
{role, name, value, x, y, width, height, children[...]}의 계층 트리를 반환합니다.
mcp_accessibility_find_ui_element
텍스트 내용, 접근성 역할, 또는 이름(대소문자 구분 없는 서브스트링)으로 UI 요소를 검색하세요. 클릭 가능한 화면 좌표와 일치하는 요소를 반환합니다.
Optional parameters:
- 텍스트: 검색용 텍스트 (이름이 생략되면 이름으로 사용)
-
역할: UI 역할 필터 —
Button,TextBox,CheckBox,MenuItem,ComboBox, 그리고 기타 - 이름: 접근 가능한 이름(두 이름이 모두 제공될 경우 텍스트보다 우선)
- windowHandle: 대상 윈도우 핸들 (null = foreground window)
Key features
Desktop interaction
- 클릭, 더블 클릭, 오른쪽 클릭, 그리고 다섯 버튼 마우스 조작.
- 픽셀 단위로 정밀하게 드래그 앤 드롭.
- 노치 기반 스크롤(한 페이지≈ 세 노치 스크롤).
- 키보드 타이핑과 다중 키 단축키 조합.
- 커서 위치 추적.
- 화면 해상도 감지.
화면 캡처 및 분석
- 전체 화면 또는 잘린 PNG 스크린샷.
- 전체 화면의 OCR과 지역별 신뢰도 점수, 경계 박스가 포함되어 있습니다.
- 웹 콘텐츠는 브라우저 뷰포트 전용 스크린샷입니다.
Window management
- 위치와 치수를 가진 모든 보이는 창을 열거하세요.
- 퍼지 타이틀 매치로 창을 활성화하세요.
- Focus: 브라우저 창(Edge, Chrome, Firefox)은 선택적으로 URL이나 제목으로 필터링됩니다.
- 시스템 중요 프로세스에 대한 보호와 함께 우아하게 닫히는 윈도우.
Command execution
- 허용 목록(git, npm, dotnet, python, cargo, node, pip, dir, mkdir, del, copy, move, robocopy, findstr, where, type)을 가진 샌드박스 셸 명령어들
- 샌드박스 Python 최대 262,144자 코드의 실행.
- 작업 디렉터리 및 통화당 타임아웃 제어(최대 30초).
- 셸 메타캐릭터, 평가 플래그, 권한 상승, 파괴 작전에 대한 자원 제한과 강화된 차단 목록.
Browser automation
- 내비게이션, 후진, 전방, 재장전.
- 페이지URL, 제목, 가시 텍스트(512 KB 제한), 전체 HTML(512 KB 제한)을 읽으세요.
- CSS 선택기를 통한 DOM 수준의 클릭, 타이핑, 텍스트 쿼리가 가능합니다.
- 타임아웃 가능한 동적 요소를 기다리세요.
- 페이지 맥락에서 표현을 평가하세요 JavaScript .
- 멀티탭 관리: 리스트, 스위치, 열기, 닫기.
- Microsoft Edge에서 실행되며, 첫 사용 시 자동으로 실행됩니다.
UI accessibility
- 전경 창의 Windows UI 자동화 tree를 깊이와 요소 수를 설정할 수 있는 상태로 불러옵니다.
- 텍스트, 역할, 접근 가능한 이름별로 UI 요소를 찾아보세요.
- 버튼, 텍스트 박스, 체크박스, 메뉴 항목, 콤보 박스를 정밀하게 타겟팅할 수 있도록 클릭 가능한 화면 좌표를 반환합니다.
타이밍과 동기화
- 짧은 원샷 일시정지 (최대
mcp_desktop_wait_milliseconds5초). - DOM 수준의 폴링(최대 30초)을 통해
mcp_browser_wait_for진행됩니다.
Notes
- 모든 좌표는 화면 픽셀 단위이며, 왼쪽 상단에 (0,0)가 있습니다. ,
mcp_desktop_take_screenshotmcp_desktop_analyze_screen,mcp_accessibility_find_ui_element, 의mcp_desktop_list_windows좌표들은 모두 동일한 좌표 공간을 공유한다. - 커서 페이슬세이프가 활성화되어 있습니다: 커서가 화면 모서리에서 5픽셀 이내로 이동하면 마우스 조작이 취소됩니다. 화면 가장자리를 노리는 것은 피하세요.
- 셸 파이프 연산자(|), 세미콜론(;), 앰퍼샌드(&), 출력 리디렉션(>, <)은 차단됩니다. 명령 출력을 변환하려면 캡처하고 로 처리
mcp_desktop_execute_python_code하세요. - 인터프리터 평가 플래그가 차단되거나
python -c "..."와node -e "..."가 거부될 경우, Python 코드에mcp_desktop_execute_python_code를 사용하거나 먼저 파일에 코드를 작성할 수 있습니다. - 명령어
stdout/stderr는 각각 32KB로 축소됩니다. 플래그를 사용해 장황한 출력(예:git log --oneline -20)을 제한하거나 파일로 리디렉션하여 별도로 읽으세요. - 와
mcp_desktop_execute_shell_command의mcp_desktop_execute_python_code최대 타임아웃은 30초입니다. 긴 작업은 작은 단계로 나누거나 Python에서 백그라운드 프로세스를 실행하고 폴링하세요. - 전용 파일 읽기/쓰기 도구는 없습니다.
mcp_desktop_execute_shell_command파일을type명령어로 읽습니다; Python의 내장 파일 I/O를 사용해mcp_desktop_execute_python_code파일을 작성할 수 있습니다. 셸 출력 리디렉션(>, >>)이 차단됩니다. -
mcp_browser_eval_js항상 문자열을 반환합니다. 객체나 숫자를 명시적으로 변환한 후 반환하세요. - 브라우저 DOM 도구들(
mcp_browser_click,mcp_browser_type,mcp_browser_eval_js등)은 Microsoft Edge 인스턴스에서만 작동합니다.mcp_desktop_focus_browser크롬이나 파이어폭스 창에 집중할 수는 있지만, DOM 도구는 이들을 대상으로 하지 않습니다. -
mcp_desktop_take_screenshot전체 화면 캡처를 위해서는 네 가지 자르기 매개변수(X, Y, 너비, 높이)를 모두 필요하며, 또는 아예 없어야 합니다. -
mcp_desktop_scroll픽셀이 아닌 노치 유닛([-20, 20]에 클램프됨)을 사용합니다. 세 개의 노치는 대략 한 페이지에 해당합니다. -
mcp_accessibility_find_ui_element텍스트, 역할 또는 이름 중 적어도 하나가 필요합니다. 텍스트와 이름이 모두 제공될 경우, 이름이 우선권을 가집니다.
일반적인 사용 사례
웹 양식을 작성하세요
- 타겟 페이지를 열기 위해 전화하세요
mcp_browser_navigate. - 양식이 로드될 때까지 기다리라고 전화하세요
mcp_browser_wait_for. - CSS 셀렉터로 각 필드를 채우기 위해 호출하세요
mcp_browser_type. - 신청서를 제출하려면 전화하세요
mcp_browser_click. - 확인 요소를 기다리기 위해 전화하세요
mcp_browser_wait_for. - 결과를 확인하고 확인하려면 전화하세요
mcp_browser_get_text.
데스크톱 애플리케이션 자동화
- 신청서를 부각시키기 위해 전화하세요
mcp_desktop_activate_window. - 현재 상태를 캡처하기 위해 호출하세요
mcp_desktop_take_screenshot. - 이름으로 버튼이나 필드를 찾으려면 전화하세요
mcp_accessibility_find_ui_element. - 보고된 요소의 좌표를 호출해
mcp_desktop_click. - 데이터를 입력하려면 전화하세요
mcp_desktop_type_text. - 단축키(예: ["ctrl", "s"]] 저장 명령)를 호출하세요
mcp_desktop_press_keys. - 결과를 확인하려면 전화하세요
mcp_desktop_take_screenshot.
웹페이지에서 데이터 추출하기
- 페이지를 열기 위해 전화하세요
mcp_browser_navigate. - 가시적인 텍스트 내용을 추출하기 위해 호출
mcp_browser_get_text합니다. - 추출된 데이터를 파싱하고 처리하기 위해 호출합니다
mcp_desktop_execute_python_code. -
mcp_browser_eval_js텍스트 추출만으로는 부족할 때 JavaScript를 통해 특정 값을 쿼리할 수 있습니다.
개발 작업 실행
- , , , 에 대해 호출합니다
mcp_desktop_execute_shell_commandgit pullnpm install.dotnet build - 빌드 출력을 캡처하기 위해 호출하세요
mcp_desktop_take_screenshot. - 로그 분석이나 테스트 결과를 원하시면 전화하세요
mcp_desktop_execute_python_code. - 브라우저에서 로컬 개발 서버를 열기 위해 호출
mcp_browser_navigate하세요. - 렌더링된 페이지를 캡처하기 위해 호출하세요
mcp_browser_screenshot.
파일 읽기 및 쓰기
- 파일을 읽으면서
mcp_desktop_execute_shell_commandtype C:\path\to\file.txt. -
mcp_desktop_execute_python_code파일을 Python의open(...)와write(...)로 작성하세요. - .을 사용
mcp_desktop_execute_shell_command해dir C:\path\to\output.txt검증하세요.
접근성과 함께 복잡한 UI를 탐색하세요
- 전체 UI 구조를 이해하려면 전화하세요
mcp_accessibility_get_accessibility_tree. - 특정 컨트롤을 찾기 위해 호출하세요
mcp_accessibility_find_ui_element(예: 역할: "MenuItem", 이름: "Settings"). - 원소의 보고된 좌표를 사용해 호출하세요
mcp_desktop_click. - 대화 내에서 다음 컨트롤을 찾기 위해 다시 호출하세요
mcp_accessibility_find_ui_element. - 전화
mcp_desktop_type_text하거나mcp_desktop_click상호작용하세요.
장기 세션을 계속 이어가세요
- MCP 요청을 최소 30분마다 한 번 보내 무단 퇴거를 방지하세요.
-
mcp_desktop_get_screen_size가볍고 심장 박동처럼 잘 작동합니다.