Windows 365 for Agents MCP 서버 참조 (미리보기)

Important

미리 보기 기능입니다.
프리뷰 기능은 프로덕션용으로 만들어진 것이 아니므로 기능이 제한될 수 있습니다. 이러한 기능은 추가 사용 약관의 적용을 받으며, 고객이 조기에 액세스하고 피드백을 제공할 수 있도록 공식 릴리스 전에 사용할 수 있습니다.

Windows 365 for Agents는 Windows 365 클라우드 PC의 완전한 운영 제어를 위한 MCP 서버입니다. 이 MCP 서버를 사용해 데스크톱 상호작용(마우스, 키보드, 스크린 캡처, 명령 실행), Microsoft Edge를 통한 브라우저 자동화, Windows UI 자동화를 통한 의미 UI 검사를 통해 실제 Windows 환경을 구동합니다.

Note

기존 Microsoft MCP 서버 버전을 사용하는 기존 연결은 여전히 지원됩니다.
모든 새로운 연결을 위해서는 최신 Windows 365 에이전트 MCP 서버를 사용하세요. 이 서버는 데스크톱, 브라우저, 접근성 기능을 포함한 다양한 도구를 제공합니다.
브라우저 자동화는 Microsoft Edge에서 작동합니다. 엣지는 첫 번째 브라우저 툴 호출 시 자동으로 실행됩니다. focus_browser 크롬이나 파이어폭스도 타겟팅할 수 있지만, DOM 수준의 브라우저 도구는 엣지 인스턴스에서만 작동합니다.

에이전트 Windows 365에 대해 더 알고 싶다면 에이전트 문서<Windows 365>를 참조하세요.

Overview

Server ID	Tenant-level URL	Display name	Description
`mcp_W365AServer`	`https://agent365.svc.cloud.microsoft/` `agents/tenants/{tenantId}/` `servers/mcp_W365AServer`	Windows 365 for Agents MCP 서버	Windows 365 클라우드 PC의 완전한 운영 제어권을 제공하며, 데스크톱 상호작용, 브라우저 자동화, UI 검사 등이 포함됩니다.

Available tools

mcp_desktop_move_mouse

커서를 화면 위치로 옮기세요. 목적지를 클릭할 계획이라면 대신 사용 mcp_desktop_click 하세요. Required parameters:

x: 화면 픽셀 단위의 X 좌표
y: 화면 픽셀 내 Y 좌표

mcp_desktop_click

좌표가 생략된 경우 현재 커서 위치를 클릭하세요. 싱글 클릭, 더블 클릭, 그리고 다섯 개의 마우스 버튼 모두를 지원합니다.

Optional parameters:

x: 화면 픽셀 단위의 X 좌표 (현재 위치는 생략)
y: 화면 픽셀 단위의 Y 좌표 (현재 위치는 생략)
버튼: 왼쪽, 오른쪽, 가운데, 앞으로, 또는 뒤로 (기본 왼쪽)
클릭 횟수: 1 = 싱글 클릭, 2 = 더블 클릭 (기본 1)

mcp_desktop_get_cursor_position

현재 커서 좌표를 반환하세요. No parameters. {cursorX, cursorY}를 반환합니다.

mcp_desktop_drag_mouse

한 위치에서 다른 자세로 끌고 다니는 것. 객체 이동, 창 크기 조정, 픽셀 단위 정밀한 스크롤에 유용합니다. Required parameters:

startX: X 좌표 시작.
startY: Y 좌표 시작.
endX: 끝 X 좌표.
endY: Y 좌표 끝. Optional parameters:
버튼: 왼쪽, 오른쪽, 가운데 (기본값은 왼쪽)

mcp_desktop_scroll

픽셀이 아닌 노치 단위를 사용해 위치에서 스크롤하세요. 세 개의 노치는 대략 한 페이지에 해당합니다.

Required parameters:

x: 스크롤 위치 X
y: 스크롤 위치 Y

Optional parameters:

deltaX: 수평 노치, 양수 = 오른쪽 (기본 0)
deltaY: 수직 노치, 양수 = 다운 (기본 0)

Note

값은 [-20, 20] 범위로 고정됩니다.

mcp_desktop_type_text

키보드 시뮬레이션을 통해 텍스트를 입력하세요. 키보드 단축키는 .을 사용 mcp_desktop_press_keys하세요. 웹 폼 필드는 .을 사용하세요 mcp_browser_type.

Required parameters:

텍스트: 타이핑 텍스트

mcp_desktop_press_keys

키 조합을 동시에 누르세요. 수정키, 기능 키, 표준 키를 지원합니다.

Required parameters:

키: 함께 누르는 키 이름 배열(예: ["ctrl","c"], , ["alt","tab"]) ["ctrl","shift","s"]

mcp_desktop_take_screenshot

전체 화면 또는 잘린 영역을 PNG 이미지(base64 인코딩)로 캡처하세요.

Optional parameters:

x: 왼쪽 가장자리 자르기 영역
y: 크롭 영역 상단 가장자리
너비: 크롭 영역 너비
높이: 작물 지역 높이

Note

네 가지 크롭 매개변수를 모두 함께 제공하거나, 전체 화면 캡처를 위해 네 가지 매개변수를 모두 생략하세요.

mcp_desktop_zoom_region

화면 영역을 기본 해상도로 PNG 이미지(base64 인코딩)로 캡처하세요. 이 기능을 사용해 다운스케일된 전체 화면 스크린샷에서 읽기 어려운 작은 텍스트나 복잡한 UI를 점검할 수 있습니다.

Required parameters:

x: 왼쪽 가장자리 X 화면 픽셀 좌표
y: 화면 픽셀 단위의 상단 가장자리 Y 좌표
width: 픽셀 단위의 영역 너비
높이: 픽셀 단위의 영역 높이

Note

최대 영역 크기는 1920x1080 픽셀입니다.

mcp_desktop_analyze_screen

화면 전체에 OCR을 적용하세요. No parameters. {fullText, averageConfidence, boxes[{text, confidence, x, y, width, height}], width, height}을(를) 반환합니다.

mcp_desktop_get_screen_size

화면 해상도를 반환하세요. No parameters. {width, height}을(를) 반환합니다.

mcp_desktop_list_windows

보이는 모든 창문과 그 제목, 위치, 크기를 나열하세요. No parameters. . 배열 {title, processName, handle, x, y, width, height}을 반환합니다.

mcp_desktop_activate_window

흐릿한 타이틀 매치를 이용해 전경에 창을 띄우세요.

Required parameters:

titlePattern: 부분 창 제목 (대소문자 구분 없는 서브스트링)

mcp_desktop_focus_browser

브라우저 창(Edge, Chrome, Firefox)에 집중하세요. 선택적으로 URL이나 제목으로 필터링할 수 있습니다.

Optional parameters:

패턴: URL 또는 제목 서브스트링을 일치시키기 (브라우저 창은 생략)

mcp_desktop_close_window

흐릿한 타이틀 매치로 우아하게 창을 닫으세요. 시스템 중요 프로세스는 보호되며 닫을 수 없습니다.

Required parameters:

titlePattern: 부분 창 타이틀 (80% 매치 임계값). {matchedTitle, processName, closed}을(를) 반환합니다.

mcp_desktop_resize_window

퍼지 타이틀 매치를 사용해 창을 크기 조절, 이동, 극대화, 최소화 또는 복원할 수 있습니다.

Required parameters:

제목: 윈도우 타이틀 투 매칭 (대문자 구분 없는 퍼지 매칭)
행동: 행동 — Resize, Move, Maximize, Minimize, 또는 Restore

Optional parameters:

x: 왼쪽 가장자리 X 좌표 (크기 조절 또는 이동과 함께 사용)
y: 상단 가장자리 Y 좌표 (크기 조절 또는 이동과 함께 사용)
width: 픽셀 단위 너비 (Resize와 함께 사용)
높이: 픽셀 단위의 높이 (Resize와 함께 사용)

mcp_desktop_execute_shell_command

샌드박스 환경에서 셸 명령을 실행해 보세요. 명령어는 허용 목록에 대해 검증되며, 위험한 패턴은 차단됩니다.

Required parameters:

명령: 실행 명령

Optional parameters:

cwd: 작업 디렉터리. 앞으로의 슬래시(예: C:/Users/me/project)를 사용하세요.
타임아웃Ms: 밀리초 단위 타임아웃 (기본 30000, 최대 30000)

Note

허용 명령어: git, npm, dotnet, python, cargo, node, pip, dir, mkdir, del, copy, move, robocopy, findstr, where, type, notepad.
차단된 패턴에는 셸 메타캐릭터(|, ;, &, <), >환경 변수 확장 (%VAR%), 인터프리터 평가 플래그(python -c 또는 node -e), git config --global, npm -g, 경로 접두사 실행 파일, rm -rf, sudo, 디스크/시스템 명령어가 포함됩니다.
stdout stderr 각각 32KB로 절단되었습니다. 임의의 계산에 사용됩니다 mcp_desktop_execute_python_code . {stdout, stderr, exitCode, success, timedOut, resourceLimitsApplied}을(를) 반환합니다.

mcp_desktop_execute_python_code

자원 제한이 있는 샌드박스 환경에서 Python 코드를 실행하세요. 데이터 처리, 계산, 파일 I/O, 그리고 단순한 셸 명령어를 넘어서는 모든 계산에 이상적입니다.

Required parameters:

code: Python 코드(최대 262,144자).

Optional parameters:

cwd: 작업 디렉터리. 앞으로의 베기를 사용하세요.
타임아웃Ms: 밀리초 단위의 타임아웃(기본값 30000, 최대 30000).

와 동일한 스키마 mcp_desktop_execute_shell_command를 반환합니다.

Note

샌드박스는 512MB 메모리 제한과 30초 타임아웃을 강제합니다.

mcp_desktop_wait_milliseconds

애니메이션이나 전환이 완료될 수 있도록 실행을 일시정지하세요. 폴링 루프에서는 사용하지 마세요—DOM 폴링에 사용 mcp_browser_wait_for 하세요.

Required parameters:

ms: 대기 시간 (밀리초 단위) ([0, 5000]로 클램프됨)

mcp_desktop_clipboard_read

시스템 클립보드의 현재 내용을 읽어보세요. No parameters. 클립보드 형식과 페이로드를 설명하는 JSON 객체를 반환합니다 — 텍스트 문자열 또는 base64로 인코딩된 이미지일 수 있습니다.

mcp_desktop_clipboard_write

시스템 클립보드에 텍스트를 작성하여 현재 내용을 교체합니다.

Required parameters:

텍스트: 클립보드에 쓸 텍스트

문자 수가 포함된 확인서를 반환합니다.

mcp_desktop_list_processes

현재 세션에서 실행 중인 프로세스를 나열하세요. 각 항목에는 PID, 프로세스 이름, 메모리 사용량, 창 제목(있는 경우), 그리고 startTimeTicks. 재활용된 PID를 죽이지 않도록 함께 startTimeTicksmcp_desktop_kill_process 사용하세요.

Optional parameters:

maxCount: 반환할 최대 프로세스 수 (기본값 200)

프로세스 정보 객체의 JSON 배열을 반환합니다.

mcp_desktop_kill_process

PID로 프로세스를 종료하세요. PID 재활용을 방지하기 위해 값 mcp_desktop_list_processes 은 startTime 반드시 제공되어야 합니다.

Required parameters:

pid: 프로세스 ID가 반환했습니다 mcp_desktop_list_processes
startTime: 프로세스 시작 시간 틱이 반환됩니다 mcp_desktop_list_processes

Optional parameters:

포스: 우아한 종료 없이 포스 킬 (기본 false)

결과를 설명하는 JSON 결과를 반환합니다.

mcp_desktop_launch_application

허용된 디렉터리에서 GUI 애플리케이션을 실행하세요. CLI 명령어로 사용 mcp_desktop_execute_shell_command 하세요.

Required parameters:

path: 실행 파일로 가는 절대 경로. 앞으로의 슬래시(예: C:/Program Files/app.exe)를 사용하세요.

Optional parameters:

args: 명령줄 인수 배열

{path, pid}을(를) 반환합니다.

mcp_desktop_get_system_info

OS 버전, CPU, RAM, 사용 가능한 디스크 공간, 디스플레이 해상도를 반환합니다. No parameters. 시스템 정보를 담은 JSON 객체를 반환합니다.

mcp_browser_navigate

URL로 이동해서 페이지가 로드될 때까지 기다리세요.

Required parameters:

URL: 프로토콜을 포함한 전체 URL (예: https://example.com)

mcp_browser_back

브라우저 기록에서 다시 탐색하세요. No parameters.

mcp_browser_forward

브라우저 기록에서 앞으로 이동하세요. No parameters.

mcp_browser_reload

현재 페이지를 다시 불러오세요. No parameters.

mcp_browser_get_url

현재 페이지 URL을 일반 문자열로 반환하세요. No parameters.

mcp_browser_get_title

현재 페이지 제목을 단순한 문자열로 반환하세요. No parameters.

mcp_browser_get_text

보이는 페이지 텍스트 내용을 일반 문자열로 반환하세요. No parameters. 512KB로 축소되었습니다.

mcp_browser_get_html

전체 페이지의 HTML 소스를 일반 문자열로 반환하세요. No parameters. 512KB로 축소되었습니다.

mcp_browser_click

CSS 셀렉터로 DOM 요소를 클릭하세요. 좌표 기반 클릭보다 웹 콘텐츠가 더 신뢰할 만합니다.

Required parameters:

셀렉터: CSS 셀렉터 (예: #submit-btna.nav-link또는 )

mcp_browser_type

CSS 선택기로 폼 요소에 텍스트를 입력하세요.

Required parameters:

셀렉터: 입력 요소의 CSS 셀렉터입니다.
텍스트: 타이핑 텍스트

mcp_browser_query_text

첫 번째 요소의 텍스트 내용을 CSS 셀렉터와 일치하도록 얻으세요.

Required parameters:

셀렉터: CSS 셀렉터

mcp_browser_wait_for

DOM 요소가 나타날 때까지 기다리세요. 비동기적으로 로드되는 동적 콘텐츠에 유용합니다.

Required parameters:

선택기: CSS 선택기를 기다리기 위해

Optional parameters:

타임아웃Ms: 밀리초 단위 타임아웃 (기본 5000, 최대 30000)

mcp_browser_eval_js

페이지 컨텍스트에서 자바스크립트 표현식을 평가하고 결과를 문자열로 반환합니다.

Required parameters:

표현식: 문자열을 반환하는 JavaScript 표현식입니다

Note

만약 표현식에서 객체나 숫자를 반환한다면, 그것을 명시적으로 문자열로 변환하세요(예: JSON.stringify(obj).toString()또는 ).

mcp_browser_list_tabs

열려 있는 모든 탭을 인덱스, 제목, URL과 함께 나열하세요. No parameters. . 배열 {index, title, url}을 반환합니다.

mcp_browser_switch_tab

인덱스 탭으로 전환하세요.

Required parameters:

tabIndex: 0 기반 탭 인덱스

mcp_browser_new_tab

새 탭을 열고, 선택적으로 URL로 이동하세요.

Optional parameters:

URL: 열기 URL (생략 시 빈 탭)

{index, title, url}을(를) 반환합니다.

mcp_browser_close_tab

인덱스로 탭을 닫으세요.

Required parameters:

tabIndex: 0 기반 탭 인덱스

mcp_browser_screenshot

브라우저 뷰포트만 PNG 스크린샷으로 캡처하세요(전체 화면은 찍지 마세요). No parameters. base64로 인코딩된 PNG를 반환합니다.

mcp_browser_select_option

속성에 따라 value 요소 내에서 <select> 하나 이상의 옵션을 선택하세요.

Required parameters:

셀렉터: 요소에 대한 <select> CSS 셀렉터
값: 선택할 옵션 값 배열입니다

선택된 옵션 수를 확인 응답합니다.

mcp_browser_fill_form

한 번의 통화로 여러 양식 필드를 작성하세요. 각 항목은 쌍 {selector, value} 으로 이루어집니다. 첫 실패 시 정지하고 성공한 필드를 보고합니다.

Required parameters:

필드: 쌍 배열 {selector, value}

채워진 필드 수를 확인해 줍니다.

mcp_browser_drag

소스 요소를 타겟 요소로 드래그합니다. 두 요소 모두 CSS 선택기로 식별됩니다.

Required parameters:

sourceSelector: 드래그 소스의 CSS 셀렉터입니다
targetSelector: 드롭 타겟의 CSS 셀렉터입니다

mcp_browser_pdf_save

현재 페이지를 PDF 파일로 저장하세요. 목적지 경로는 또는 %TEMP%로 제한 %USERPROFILE% 됩니다.

Required parameters:

filePath: 또는 %TEMP%. %USERPROFILE% 아래에 있는 목적지 파일 경로. 앞으로의 베기를 사용하세요.

저장된 파일 경로가 포함된 확인 메시지를 반환합니다.

mcp_browser_handle_dialog

대기 중인 브라우저 대화상자(알림, 확인, 프롬프트, 또는 언로드 전)를 수락하거나 해제하세요. 활성 대화가 없으면 "대기 중인 대화 없음"을 반환합니다.

Required parameters:

행동: accept 또는 dismiss

Optional parameters:

promptText: 알림 및 확인 시 무시하는 프롬프트 대화 대화 텍스트

mcp_browser_snapshot

DOM 노드에 매핑되는 안정적인 참조 ID(예: e5)로 페이지의 접근성 트리를 캡처하세요. , , mcp_browser_hover_ref와 함께 참조를 사용하세요.mcp_browser_click_refmcp_browser_type_ref 참조는 페이지가 탐색할 때 만료됩니다 — 탐색 후 다시 스냅샷을 찍으세요.

Optional parameters:

maxDepth: 최대 나무 깊이, 1-10 (기본 5)
includeIframes: 교차 출처 iframes 포함 (기본 true)

접근성 스냅샷과 참조 ID가 포함된 JSON 객체를 반환합니다.

mcp_browser_click_ref

참조 ID mcp_browser_snapshot로 요소 클릭 . 히트 테스트는 다른 요소가 목표물 위에 겹치지 않는지 확인합니다. 스냅샷이 만료되면 실패합니다 — 그럴 경우 다시 스냅샷을 가져와야 합니다.

Required parameters:

snapshotId: 스냅샷 ID 반환 mcp_browser_snapshot
ref: 스냅샷 노드의 요소 ref(예: e5)

Optional parameters:

버튼: 왼쪽, 오른쪽, 또는 가운데 (기본 왼쪽)
클릭 횟수: 1 = 싱글 클릭, 2 = 더블 클릭 (기본 1)

클릭하면 좌표가 포함된 확인 메시지를 반환합니다.

mcp_browser_type_ref

참조 ID mcp_browser_snapshot로 요소에 텍스트를 입력하세요. 요소가 먼저 포커스되고, 기존 텍스트는 기본적으로 지워집니다. 스냅샷이 만료되면 실패합니다.

Required parameters:

snapshotId: 스냅샷 ID 반환 mcp_browser_snapshot
ref: 스냅샷 노드의 요소 ref(예: e5)
텍스트: 타이핑 텍스트

Optional parameters:

clear: 기존 텍스트를 먼저 명확히 해야 합니다 (기본 참)

문자 수가 포함된 확인서를 반환합니다.

mcp_browser_hover_ref

참조 ID mcp_browser_snapshot로 요소를 마우스 올리면 됩니다. Returns immediately. 스냅샷이 만료되면 실패합니다 — 그럴 경우 다시 스냅샷을 가져와야 합니다.

Required parameters:

snapshotId: 스냅샷 ID 반환 mcp_browser_snapshot
ref: 스냅샷 노드의 요소 ref(예: e5)

호버 좌표를 포함한 확인 응답을 반환합니다.

mcp_accessibility_get_accessibility_tree

전경 창의 UI 요소 트리를 불러옵니다. 각 요소에는 역할, 이름, 가치, 화면 좌표가 포함되어 있습니다.

Optional parameters:

maxDepth: 최대 나무 횡단 깊이, 1-10 (기본 3)
maxElements: 반환할 최대 요소, 1-2000 (기본 500)

{role, name, value, x, y, width, height, children[...]}의 계층 트리를 반환합니다.

mcp_accessibility_find_ui_element

텍스트 내용, 접근성 역할, 또는 이름(대소문자 구분 없는 서브스트링)으로 UI 요소를 검색하세요. 클릭 가능한 화면 좌표와 일치하는 요소를 반환합니다.

Optional parameters:

텍스트: 검색용 텍스트 (이름이 생략되면 이름으로 사용)
역할: UI 역할 필터 — Button, TextBox, CheckBox, MenuItem, ComboBox, 그리고 기타
이름: 접근 가능한 이름(두 이름이 모두 제공될 경우 텍스트보다 우선)
windowHandle: 대상 윈도우 핸들 (null = foreground window)

Key features

Desktop interaction

클릭, 더블 클릭, 오른쪽 클릭, 그리고 다섯 버튼 마우스 조작.
픽셀 단위로 정밀하게 드래그 앤 드롭.
노치 기반 스크롤(한 페이지≈ 세 노치 스크롤).
키보드 타이핑과 다중 키 단축키 조합.
커서 위치 추적.
화면 해상도 감지.

화면 캡처 및 분석

전체 화면 또는 잘린 PNG 스크린샷.
전체 화면의 OCR과 지역별 신뢰도 점수, 경계 박스가 포함되어 있습니다.
웹 콘텐츠는 브라우저 뷰포트 전용 스크린샷입니다.

Window management

위치와 치수를 가진 모든 보이는 창을 열거하세요.
퍼지 타이틀 매치로 창을 활성화하세요.
Focus: 브라우저 창(Edge, Chrome, Firefox)은 선택적으로 URL이나 제목으로 필터링됩니다.
시스템 중요 프로세스에 대한 보호와 함께 우아하게 닫히는 윈도우.

Command execution

허용 목록(git, npm, dotnet, python, cargo, node, pip, dir, mkdir, del, copy, move, robocopy, findstr, where, type)을 가진 샌드박스 셸 명령어들
샌드박스 Python 최대 262,144자 코드의 실행.
작업 디렉터리 및 통화당 타임아웃 제어(최대 30초).
셸 메타캐릭터, 평가 플래그, 권한 상승, 파괴 작전에 대한 자원 제한과 강화된 차단 목록.

Browser automation

내비게이션, 후진, 전방, 재장전.
페이지URL, 제목, 가시 텍스트(512 KB 제한), 전체 HTML(512 KB 제한)을 읽으세요.
CSS 선택기를 통한 DOM 수준의 클릭, 타이핑, 텍스트 쿼리가 가능합니다.
타임아웃 가능한 동적 요소를 기다리세요.
페이지 맥락에서 표현을 평가하세요 JavaScript .
멀티탭 관리: 리스트, 스위치, 열기, 닫기.
Microsoft Edge에서 실행되며, 첫 사용 시 자동으로 실행됩니다.

UI accessibility

전경 창의 Windows UI 자동화 tree를 깊이와 요소 수를 설정할 수 있는 상태로 불러옵니다.
텍스트, 역할, 접근 가능한 이름별로 UI 요소를 찾아보세요.
버튼, 텍스트 박스, 체크박스, 메뉴 항목, 콤보 박스를 정밀하게 타겟팅할 수 있도록 클릭 가능한 화면 좌표를 반환합니다.

타이밍과 동기화

짧은 원샷 일시정지 (최대 mcp_desktop_wait_milliseconds 5초).
DOM 수준의 폴링(최대 30초)을 통해 mcp_browser_wait_for 진행됩니다.

Notes

모든 좌표는 화면 픽셀 단위이며, 왼쪽 상단에 (0,0)가 있습니다. , mcp_desktop_take_screenshotmcp_desktop_analyze_screen, mcp_accessibility_find_ui_element, 의 mcp_desktop_list_windows 좌표들은 모두 동일한 좌표 공간을 공유한다.
커서 페이슬세이프가 활성화되어 있습니다: 커서가 화면 모서리에서 5픽셀 이내로 이동하면 마우스 조작이 취소됩니다. 화면 가장자리를 노리는 것은 피하세요.
셸 파이프 연산자(|), 세미콜론(;), 앰퍼샌드(&), 출력 리디렉션(>, <)은 차단됩니다. 명령 출력을 변환하려면 캡처하고 로 처리 mcp_desktop_execute_python_code하세요.
인터프리터 평가 플래그가 차단되거나 python -c "..."와 node -e "..."가 거부될 경우, Python 코드에 mcp_desktop_execute_python_code를 사용하거나 먼저 파일에 코드를 작성할 수 있습니다.
명령어 stdout/stderr 는 각각 32KB로 축소됩니다. 플래그를 사용해 장황한 출력(예: git log --oneline -20)을 제한하거나 파일로 리디렉션하여 별도로 읽으세요.
와 mcp_desktop_execute_shell_command 의 mcp_desktop_execute_python_code 최대 타임아웃은 30초입니다. 긴 작업은 작은 단계로 나누거나 Python에서 백그라운드 프로세스를 실행하고 폴링하세요.
전용 파일 읽기/쓰기 도구는 없습니다. mcp_desktop_execute_shell_command 파일을 type 명령어로 읽습니다; Python의 내장 파일 I/O를 사용해 mcp_desktop_execute_python_code 파일을 작성할 수 있습니다. 셸 출력 리디렉션(>, >>)이 차단됩니다.
mcp_browser_eval_js 항상 문자열을 반환합니다. 객체나 숫자를 명시적으로 변환한 후 반환하세요.
브라우저 DOM 도구들(mcp_browser_click, mcp_browser_type, mcp_browser_eval_js 등)은 Microsoft Edge 인스턴스에서만 작동합니다.  mcp_desktop_focus_browser 크롬이나 파이어폭스 창에 집중할 수는 있지만, DOM 도구는 이들을 대상으로 하지 않습니다.
mcp_desktop_take_screenshot 전체 화면 캡처를 위해서는 네 가지 자르기 매개변수(X, Y, 너비, 높이)를 모두 필요하며, 또는 아예 없어야 합니다.
mcp_desktop_scroll 픽셀이 아닌 노치 유닛([-20, 20]에 클램프됨)을 사용합니다. 세 개의 노치는 대략 한 페이지에 해당합니다.
mcp_accessibility_find_ui_element 텍스트, 역할 또는 이름 중 적어도 하나가 필요합니다. 텍스트와 이름이 모두 제공될 경우, 이름이 우선권을 가집니다.

일반적인 사용 사례

웹 양식을 작성하세요

타겟 페이지를 열기 위해 전화하세요 mcp_browser_navigate .
양식이 로드될 때까지 기다리라고 전화하세요 mcp_browser_wait_for .
CSS 셀렉터로 각 필드를 채우기 위해 호출하세요 mcp_browser_type .
신청서를 제출하려면 전화하세요 mcp_browser_click .
확인 요소를 기다리기 위해 전화하세요 mcp_browser_wait_for .
결과를 확인하고 확인하려면 전화하세요 mcp_browser_get_text .

데스크톱 애플리케이션 자동화

신청서를 부각시키기 위해 전화하세요 mcp_desktop_activate_window .
현재 상태를 캡처하기 위해 호출하세요 mcp_desktop_take_screenshot .
이름으로 버튼이나 필드를 찾으려면 전화하세요 mcp_accessibility_find_ui_element .
보고된 요소의 좌표를 호출해 mcp_desktop_click .
데이터를 입력하려면 전화하세요 mcp_desktop_type_text .
단축키(예: ["ctrl", "s"]] 저장 명령)를 호출하세요 mcp_desktop_press_keys .
결과를 확인하려면 전화하세요 mcp_desktop_take_screenshot .

웹페이지에서 데이터 추출하기

페이지를 열기 위해 전화하세요 mcp_browser_navigate .
가시적인 텍스트 내용을 추출하기 위해 호출 mcp_browser_get_text 합니다.
추출된 데이터를 파싱하고 처리하기 위해 호출합니다 mcp_desktop_execute_python_code .
mcp_browser_eval_js 텍스트 추출만으로는 부족할 때 JavaScript를 통해 특정 값을 쿼리할 수 있습니다.

개발 작업 실행

, , , 에 대해 호출합니다 mcp_desktop_execute_shell_commandgit pullnpm install.dotnet build
빌드 출력을 캡처하기 위해 호출하세요 mcp_desktop_take_screenshot .
로그 분석이나 테스트 결과를 원하시면 전화하세요 mcp_desktop_execute_python_code .
브라우저에서 로컬 개발 서버를 열기 위해 호출 mcp_browser_navigate 하세요.
렌더링된 페이지를 캡처하기 위해 호출하세요 mcp_browser_screenshot .

파일 읽기 및 쓰기

파일을 읽으면서 mcp_desktop_execute_shell_commandtype C:\path\to\file.txt.
mcp_desktop_execute_python_code 파일을 Python의 open(...)와 write(...)로 작성하세요.
.을 사용mcp_desktop_execute_shell_command해 dir C:\path\to\output.txt 검증하세요.

접근성과 함께 복잡한 UI를 탐색하세요

전체 UI 구조를 이해하려면 전화하세요 mcp_accessibility_get_accessibility_tree .
특정 컨트롤을 찾기 위해 호출하세요 mcp_accessibility_find_ui_element (예: 역할: "MenuItem", 이름: "Settings").
원소의 보고된 좌표를 사용해 호출하세요 mcp_desktop_click .
대화 내에서 다음 컨트롤을 찾기 위해 다시 호출하세요 mcp_accessibility_find_ui_element .
전화 mcp_desktop_type_text 하거나 mcp_desktop_click 상호작용하세요.

장기 세션을 계속 이어가세요

MCP 요청을 최소 30분마다 한 번 보내 무단 퇴거를 방지하세요.
mcp_desktop_get_screen_size 가볍고 심장 박동처럼 잘 작동합니다.

피드백

이 페이지가 도움이 되었나요?

Last updated on 2026-05-26

Windows 365 for Agents MCP 서버 참조 (미리보기)

Overview

Available tools

mcp_desktop_move_mouse

mcp_desktop_click

mcp_desktop_get_cursor_position

mcp_desktop_drag_mouse

mcp_desktop_scroll

mcp_desktop_type_text

mcp_desktop_press_keys

mcp_desktop_take_screenshot

mcp_desktop_zoom_region

mcp_desktop_analyze_screen

mcp_desktop_get_screen_size

mcp_desktop_list_windows

mcp_desktop_activate_window

mcp_desktop_focus_browser

mcp_desktop_close_window

mcp_desktop_resize_window

mcp_desktop_execute_shell_command

mcp_desktop_execute_python_code

mcp_desktop_wait_milliseconds

mcp_desktop_clipboard_read

mcp_desktop_clipboard_write

mcp_desktop_list_processes

mcp_desktop_kill_process

mcp_desktop_launch_application

mcp_desktop_get_system_info

mcp_browser_navigate

mcp_browser_back

mcp_browser_forward

mcp_browser_reload

mcp_browser_get_url

mcp_browser_get_title

mcp_browser_get_text

mcp_browser_get_html

mcp_browser_click

mcp_browser_type

mcp_browser_query_text

mcp_browser_wait_for

mcp_browser_eval_js

mcp_browser_list_tabs

mcp_browser_switch_tab

mcp_browser_new_tab

mcp_browser_close_tab

mcp_browser_screenshot

mcp_browser_select_option

mcp_browser_fill_form

mcp_browser_drag

mcp_browser_pdf_save

mcp_browser_handle_dialog

mcp_browser_snapshot

mcp_browser_click_ref

mcp_browser_type_ref

mcp_browser_hover_ref

mcp_accessibility_get_accessibility_tree

mcp_accessibility_find_ui_element

Key features

Desktop interaction

화면 캡처 및 분석

Window management

Command execution

Browser automation

UI accessibility

타이밍과 동기화

Notes

일반적인 사용 사례

웹 양식을 작성하세요

데스크톱 애플리케이션 자동화

웹페이지에서 데이터 추출하기

개발 작업 실행

파일 읽기 및 쓰기

접근성과 함께 복잡한 UI를 탐색하세요

장기 세션을 계속 이어가세요

피드백

추가 리소스