Referencia del servidor MCP de Windows 365 para Agentes (vista previa)

Important

Se trata de una característica en versión preliminar.
Las características en versión preliminar no se han diseñado para un uso de producción y pueden tener una funcionalidad restringida. Estas características están sujetas a condiciones de uso adicionales y están disponibles antes del lanzamiento oficial para que los clientes puedan tener un acceso anticipado y proporcionar comentarios.

Windows 365 para Agentes es un servidor MCP para el control operativo total de un PC en la nube con Windows 365. Utiliza este servidor MCP para manejar un entorno Windows real mediante interacción de escritorio (ratón, teclado, captura de pantalla, ejecución de comandos), automatización del navegador mediante Microsoft Edge y inspección semántica de la interfaz mediante Windows Automatización de la interfaz de usuario.

Note

Las conexiones existentes que utilizan versiones anteriores de servidores MCP de Microsoft siguen siendo compatibles.
Para todas las nuevas conexiones, utiliza el último servidor MCP de Windows 365 Agents, que expone herramientas en escritorio, navegador y capacidades de accesibilidad.
La automatización del navegador funciona en Microsoft Edge. Edge se inicia automáticamente en la primera llamada a la herramienta del navegador. focus_browser también puede dirigirse a Chrome o Firefox, pero las herramientas de navegador a nivel DOM solo funcionan en la instancia de Edge.

Para saber más sobre Windows 365 para agentes, consulta Windows 365 para la documentación de agentes.

Overview

Server ID	Tenant-level URL	Display name	Description
`mcp_W365AServer`	`https://agent365.svc.cloud.microsoft/` `agents/tenants/{tenantId}/` `servers/mcp_W365AServer`	Windows 365 para agentes servidor MCP	Control operativo completo de un PC en la nube con Windows 365, incluyendo interacción de escritorio, automatización del navegador e inspección de la interfaz de usuario.

Available tools

mcp_desktop_move_mouse

Mueve el cursor a una posición de pantalla. Úsalo mcp_desktop_click en su lugar si tienes intención de hacer clic en el destino. Required parameters:

x: Coordenada X en píxeles de pantalla
y: Coordenada Y en los píxeles de pantalla

mcp_desktop_click

Haz clic en una posición, o en la ubicación actual del cursor si se omiten coordenadas. Soporta clic simple, doble clic y los cinco botones del ratón.

Optional parameters:

x: coordenada X en píxeles de pantalla (omitir la posición actual)
y: Coordenada Y en los píxeles de pantalla (omitir la posición actual)
botón: Izquierda, Derecha, Medio, Adelante o Atrás (por defecto Izquierda)
RecuentoClick: 1 = clic simple, 2 = doble clic (por defecto 1)

mcp_desktop_get_cursor_position

Devuelve las coordenadas actuales del cursor. No parameters. Devuelve {cursorX, cursorY}.

mcp_desktop_drag_mouse

Arrastra de una posición a otra. Útil para mover objetos, redimensionar ventanas o desplazamiento con precisión de píxeles. Required parameters:

startX: Coordenada Start X.
startY: Coordenada Start Y.
endX: Coordenada final X.
endY: Coordenada end Y. Optional parameters:
botón: Izquierda, Derecha o Medio (por defecto es Izquierda)

mcp_desktop_scroll

Desplaza en una posición usando unidades de muesca (no píxeles). Tres muescas equivalen aproximadamente a una página.

Required parameters:

x: Posición de desplazamiento X
y: Posición de desplazamiento Y

Optional parameters:

deltaX: Muescas horizontales, positivo = derecho (por defecto 0)
deltaY: Muescas verticales, positivo = abajo (por defecto 0)

Note

Los valores se ajustan al rango [-20, 20].

mcp_desktop_type_text

Escribe texto mediante simulación de teclado. Para atajos de teclado, usa mcp_desktop_press_keys. Para los campos de formulario web, utiliza mcp_browser_type.

Required parameters:

texto: Texto para escribir

mcp_desktop_press_keys

Pulsa una combinación de teclas simultáneamente. Soporta teclas modificadoras, teclas de función y teclas estándar.

Required parameters:

teclas: Matriz de nombres de claves para pulsar juntos (por ejemplo, ["ctrl","c"], ["alt","tab"], ["ctrl","shift","s"])

mcp_desktop_take_screenshot

Captura la pantalla completa o una región recortada como una imagen PNG (codificada en base64).

Optional parameters:

x: Borde izquierdo de la región de cultivo
y: Borde superior de la región de cultivo
Ancho: Ancho de la región de cultivo
altura: Altura de la región de cultivo

Note

Proporciona los cuatro parámetros de recorte juntos, o omite los cuatro para una captura de pantalla completa.

mcp_desktop_zoom_region

Captura una región de pantalla a resolución nativa como una imagen PNG (codificada en base64). Usa esto para inspeccionar texto pequeño o una interfaz densa que es difícil de leer en una captura de pantalla a pantalla completa reducida.

Required parameters:

x: Coordenada X del borde izquierdo en los píxeles de pantalla
y: Coordenada Y en el borde superior de los píxeles de pantalla
ancho: Ancho de región en píxeles
altura: Altura de la región en píxeles

Note

El tamaño máximo de la región es de 1920x1080 píxeles.

mcp_desktop_analyze_screen

Realiza OCR en toda la pantalla. No parameters. Devuelve {fullText, averageConfidence, boxes[{text, confidence, x, y, width, height}], width, height}.

mcp_desktop_get_screen_size

Devuelvo la resolución de la pantalla. No parameters. Devuelve {width, height}.

mcp_desktop_list_windows

Enumera todas las ventanas visibles con sus títulos, posiciones y dimensiones. No parameters. Devuelve un array de {title, processName, handle, x, y, width, height}.

mcp_desktop_activate_window

Pone una ventana en primer plano usando un combate difuso por el título.

Required parameters:

TítuloPatron: Título parcial de ventana (subcadena insensible a mayúsculas y minúsculas)

mcp_desktop_focus_browser

Enfoca una ventana del navegador (Edge, Chrome o Firefox), opcionalmente filtrada por URL o título.

Optional parameters:

Patrón: URL o subcadena de título para que coincida (omitir en cualquier ventana del navegador)

mcp_desktop_close_window

Cierra con gracia una ventana con un combate difuso por el título. Los procesos críticos para el sistema están protegidos y no pueden cerrarse.

Required parameters:

TitlePattern: Título parcial de ventana (80% umbral de coincidencia). Devuelve {matchedTitle, processName, closed}.

mcp_desktop_resize_window

Redimensiona, mueve, maximiza, minimiza o restaura una ventana usando una partida por el título difusa.

Required parameters:

título: Título de ventana para coincidir (coincidencia difusa insensible a mayúsculas y minúsculas)
acción: Acción para realizar — Resize, Move, Maximize, Minimize, o Restore

Optional parameters:

x: Coordenada X del borde izquierdo (usada con Redimensionar o Mover)
y: Coordenada Y del borde superior (usada con Redimensionar o Mover)
ancho: Ancho en píxeles (usado con Redimensionar)
altura: Altura en píxeles (usado con Redimensionar)

mcp_desktop_execute_shell_command

Ejecuta un comando shell en un entorno sandbox. Los comandos se validan contra una lista de permisos y se bloquean los patrones peligrosos.

Required parameters:

comando: Orden de ejecutar

Optional parameters:

cwd: Directorio de trabajo. Usa cortes hacia adelante (por ejemplo, C:/Users/me/project).
timeoutMs: Tiempo límite en milisegundos (por defecto 30000, máximo 30000)

Note

Comandos permitidos: git, npm, dotnet, python, cargo, node, pip, dir, mkdir, del, copy, move, robocopy, findstr, where, type y notepad.
Los patrones bloqueados incluyen metacaracteres de shell (|, ;, y, <, ), >expansión (%VAR%)de variables de entorno, flags de evaluación de intérpretes (python -c o node -e), git config --global, npm -g, ejecutables con prefijo de camino, rm -rf, sudo, y comandos de disco/sistema.
stdout y stderr cada uno se trunca a 32 KB. Úsalo mcp_desktop_execute_python_code para cálculos arbitrarios. Devuelve {stdout, stderr, exitCode, success, timedOut, resourceLimitsApplied}.

mcp_desktop_execute_python_code

Ejecuta código Python en un entorno sandbox con límites de recursos. Ideal para procesamiento de datos, cálculos, E/S de archivos y cualquier cálculo que vaya más allá de simples comandos de shell.

Required parameters:

código: código Python (máximo 262.144 caracteres).

Optional parameters:

cwd: Directorio de trabajo. Usa tajos hacia delante.
timeoutMs: Timeout en milisegundos (por defecto 30000, máximo 30000).

Devuelve el mismo esquema que mcp_desktop_execute_shell_command.

Note

El sandbox impone un límite de memoria de 512 MB y un tiempo de espera de 30 segundos.

mcp_desktop_wait_milliseconds

Pausa la ejecución para permitir que se completen animaciones o transiciones. No se utilicen en bucles de encuestas—úsalo mcp_browser_wait_for para sondeos del DOM.

Required parameters:

ms: Duración de espera en milisegundos (sujeto a [0, 5000])

mcp_desktop_clipboard_read

Lee el contenido actual del portapapeles del sistema. No parameters. Devuelve un objeto JSON que describe el formato del portapapeles y la carga útil — ya sea una cadena de texto o una imagen codificada en base64.

mcp_desktop_clipboard_write

Escribe texto en la carpeta del sistema, reemplazando el contenido actual.

Required parameters:

texto: Texto para escribir en la carpeta

Devuelve una confirmación que incluye el recuento de caracteres.

mcp_desktop_list_processes

Lista los procesos en ejecución en la sesión actual. Cada entrada incluye el PID, nombre del proceso, uso de memoria, título de ventana (si lo hay), y startTimeTicks. Combina startTimeTicks con mcp_desktop_kill_process para evitar matar un PID reciclado.

Optional parameters:

maxCount: Número máximo de procesos que devolver (por defecto 200)

Devuelve un array JSON de objetos info de proceso.

mcp_desktop_kill_process

Terminar un proceso por PID. El startTime valor de mcp_desktop_list_processes debe proporcionarse para proteger contra el reciclaje de PID.

Required parameters:

pid: ID de proceso devuelto por mcp_desktop_list_processes
Tiempode inicio: Ticks de tiempo de inicio de proceso devueltos por mcp_desktop_list_processes

Optional parameters:

fuerza: Fuerza de muerte sin un apagado elegante (por defecto falso)

Devuelve un resultado JSON que describe el resultado.

mcp_desktop_launch_application

Lanza una aplicación GUI desde un directorio permitido. Úsalo mcp_desktop_execute_shell_command para comandos de CLI en su lugar.

Required parameters:

ruta: Ruta absoluta hacia el ejecutable. Usa cortes hacia adelante (por ejemplo, C:/Program Files/app.exe).

Optional parameters:

args: Matriz de argumentos de línea de comandos

Devuelve {path, pid}.

mcp_desktop_get_system_info

Devuelve la versión del sistema operativo, CPU, RAM, espacio disponible en disco y resolución de pantalla. No parameters. Devuelve un objeto JSON que contiene la información del sistema.

mcp_browser_navigate

Navega hasta una URL y espera a que cargue la página.

Required parameters:

URL: URL completa incluyendo protocolo (por ejemplo, https://example.com)

mcp_browser_back

Navega hacia atrás en el historial del navegador. No parameters.

mcp_browser_forward

Navega hacia adelante en el historial del navegador. No parameters.

mcp_browser_reload

Recarga la página actual. No parameters.

mcp_browser_get_url

Devuelve la URL actual de la página como una cadena de caracteres simples. No parameters.

mcp_browser_get_title

Devuelve el título de la página actual como una cadena simple. No parameters.

mcp_browser_get_text

Devuelve el contenido visible del texto de la página como una cadena plana. No parameters. Truncado a 512 KB.

mcp_browser_get_html

Devuelve el código fuente HTML de página completa como una cadena simple. No parameters. Truncado a 512 KB.

mcp_browser_click

Haz clic en un elemento DOM junto al selector CSS. Más fiable que el clic basado en coordenadas para contenido web.

Required parameters:

selector: selector CSS (por ejemplo, #submit-btn o )a.nav-link

mcp_browser_type

Escribe texto en un elemento de formulario mediante un selector CSS.

Required parameters:

selector: selector CSS del elemento de entrada.
texto: Texto para escribir

mcp_browser_query_text

Haz que el contenido de texto del primer elemento coincida con un selector CSS.

Required parameters:

Selector: Selector CSS

mcp_browser_wait_for

Espera a que aparezca un elemento DOM. Útil para contenido dinámico que carga de forma asincrónica.

Required parameters:

selector: selector CSS para esperar

Optional parameters:

TimeoutMs: Timeout en milisegundos (por defecto 5000, máximo 30000)

mcp_browser_eval_js

Evalúa una expresión JavaScript en el contexto de la página y devuelve el resultado como una cadena.

Required parameters:

expresión: expresión JavaScript que devuelve una cadena

Note

Si tu expresión devuelve un objeto o número, conviértelo explícitamente a una cadena (por ejemplo, JSON.stringify(obj) o .toString()).

mcp_browser_list_tabs

Lista todas las pestañas abiertas con su índice, título y URL. No parameters. Devuelve un array de {index, title, url}.

mcp_browser_switch_tab

Cambia a una pestaña por index.

Required parameters:

tabIndex: índice de tabulación basado en 0

mcp_browser_new_tab

Abre una nueva pestaña, opcionalmente navegando hasta una URL.

Optional parameters:

URL: URL para abrir (pestaña vacía si se omite)

Devuelve {index, title, url}.

mcp_browser_close_tab

Cierra una pestaña por índice.

Required parameters:

tabIndex: índice de tabulación basado en 0

mcp_browser_screenshot

Captura una captura de pantalla PNG solo del viewport del navegador (no de la pantalla completa). No parameters. Devuelve un PNG codificado en base64.

mcp_browser_select_option

Selecciona una o más opciones en un <select> elemento según su value atributo.

Required parameters:

selector: selector CSS para el <select> elemento
valores: Array de valor(es) de opción a seleccionar

Devuelve una confirmación con el conteo de opciones seleccionadas.

mcp_browser_fill_form

Rellena varios campos de formulario en una sola llamada. Cada entrada es un {selector, value} par. Se detiene en el primer fallo e informa qué campos tuvieron éxito.

Required parameters:

campos: Matriz de {selector, value} pares

Devuelve una confirmación con el conteo de campos rellenados.

mcp_browser_drag

Arrastra un elemento fuente a un elemento objetivo. Ambos elementos se identifican mediante el selector CSS.

Required parameters:

sourceSelector: selector CSS de la fuente de arrastre
Selector de objetivos: Selector CSS del objetivo de caída

mcp_browser_pdf_save

Guarda la página actual como archivo PDF. Las rutas de destino están restringidas a %USERPROFILE% o %TEMP%.

Required parameters:

Ruta de archivo: Ruta de archivo de destino bajo %USERPROFILE% o %TEMP%. Usa tajos hacia delante.

Devuelve una confirmación que incluye la ruta del archivo guardado.

mcp_browser_handle_dialog

Acepta o descarta un diálogo pendiente del navegador (alerta, confirmación, aviso o antes de descargar). Devuelve "No hay diálogo pendiente" si no hay ningún diálogo activo.

Required parameters:

acción: accept o dismiss

Optional parameters:

promptText: Texto para enviar a un diálogo de prompt (ignorado para alertar y confirmar)

mcp_browser_snapshot

Captura el árbol de accesibilidad de la página con identificadores de referencia estables (por ejemplo, e5) que se asignen a nodos DOM. Usa las referencias con mcp_browser_click_ref, mcp_browser_type_ref, y mcp_browser_hover_ref. Las referencias caducan cuando la página navega — vuelve a hacer una instantánea después de navegar.

Optional parameters:

maxDepth: Profundidad máxima del árbol, 1-10 (por defecto 5)
incluyeIframes: Incluye iframes de origen cruzado (por defecto verdadero)

Devuelve un objeto JSON que contiene la instantánea de accesibilidad y los IDs de referencia.

mcp_browser_click_ref

Haz clic en un elemento por el ID de referencia de mcp_browser_snapshot. Una prueba de acierto verifica que ningún otro elemento superpone el objetivo. Si falla si la instantánea ha caducado — vuelve a hacerla en ese caso.

Required parameters:

snapshotId: ID de instantánea devuelto por mcp_browser_snapshot
ref: Ref de elemento (por ejemplo, e5) de los nodos de instantánea

Optional parameters:

botón: Izquierda, Derecha o Medio (por defecto Izquierda)
RecuentoClick: 1 = clic simple, 2 = doble clic (por defecto 1)

Devuelve una confirmación que incluye las coordenadas pulsadas.

mcp_browser_type_ref

Escribe texto en un elemento mediante el ID de referencia de mcp_browser_snapshot. El elemento se enfoca primero y el texto existente se borra por defecto. Falla si la instantánea ha caducado.

Required parameters:

snapshotId: ID de instantánea devuelto por mcp_browser_snapshot
ref: Ref de elemento (por ejemplo, e5) de los nodos de instantánea
texto: Texto para escribir

Optional parameters:

Clear: Borrar primero el texto existente (por defecto verdadero)

Devuelve una confirmación que incluye el recuento de caracteres.

mcp_browser_hover_ref

Coloca el cursor sobre un elemento por el ID de referencia de mcp_browser_snapshot. Returns immediately. Si falla si la instantánea ha caducado — vuelve a hacerla en ese caso.

Required parameters:

snapshotId: ID de instantánea devuelto por mcp_browser_snapshot
ref: Ref de elemento (por ejemplo, e5) de los nodos de instantánea

Devuelve una confirmación que incluye las coordenadas de flotación.

mcp_accessibility_get_accessibility_tree

Recupera el árbol de elementos de la interfaz para la ventana de primer plano. Cada elemento incluye su función, nombre, valor y coordenadas de pantalla.

Optional parameters:

maxDepth: Profundidad máxima de travesía del árbol, 1-10 (por defecto 3)
maxElements: Máximo de elementos que deben regresar, 1-2000 (por defecto 500)

Devuelve un árbol jerárquico de {rol, nombre, valor, x, y, ancho, altura, hijos[...]}.

mcp_accessibility_find_ui_element

Busca elementos de la interfaz por contenido de texto, rol de accesibilidad o nombre (subcadena insensible a mayúsculas). Devuelve elementos coincidentes con sus coordenadas de pantalla clicables.

Optional parameters:

texto: Texto para buscar (usado como nombre si se omite el nombre)
role: filtro de rol de la interfaz — Button, TextBox, CheckBox, MenuItem, ComboBoxy más
nombre: Nombre accesible (tiene prioridad sobre el texto si ambos se proporcionan)
AsaVentana: Manija de ventana objetivo (nulo = ventana en primer plano)

Key features

Desktop interaction

Clic doble, clic derecho, control de ratón con cinco botones.
Arrastrar y soltar con precisión píxel.
Desplazamiento basado en muescas (tres muescas ≈ una página).
Teclado y atajos combinados de teclado múltiple.
Seguimiento de posición del cursor.
Detección de resolución de pantalla.

Captura de pantalla y análisis

Capturas de pantalla completa o recortadas en PNG.
OCR de pantalla completa con puntuaciones de confianza por región y cajas delimitadoras.
Capturas de pantalla solo en el viewport del navegador para contenido web.

Window management

Enumera todas las ventanas visibles con posiciones y dimensiones.
Activa Windows mediante una coincidencia de título difusa.
Enfoca las ventanas del navegador (Edge, Chrome, Firefox) filtradas opcionalmente por URL o título.
Cierre de ventana elegante con protección para procesos críticos para el sistema.

Command execution

Comandos de shell en formato sandbox con una lista de permisos (git, npm, dotnet, python, cargo, node, pip, dir, mkdir, del, copy, move, robocopy, findstr, where, type).
En formato sandboxeado Python ejecución hasta 262.144 caracteres de código.
Directorio de trabajo y control de tiempo de espera por llamada (máximo 30 segundos).
Límites de recursos y lista de bloqueos reforzada contra metacaracteres de shell, flags de evaluación, escalada de privilegios y operaciones destructivas.

Browser automation

Navegar, retroceder, avanzar, recargar.
Lee la página URL, título, texto visible (límite de 512 KB) y HTML completo (límite de 512 KB).
Consulta de clic, escritura y texto a nivel DOM mediante selector CSS.
Espera a los elementos dinámicos con un tiempo de espera configurable.
Evalúa JavaScript las expresiones en el contexto de la página.
Gestión de varias pestañas: lista, cambio, abrir, cerrar.
Funciona en Microsoft Edge y se lanza automáticamente al primer uso.

UI accessibility

Recuperar el Windows Automatización de la interfaz de usuario tree para la ventana de primer plano con profundidad y conteo de elementos configurables.
Busca elementos de la interfaz por texto, rol o nombre accesible.
Devuelve coordenadas de pantalla clicables para apuntar con precisión a botones, cuadros de texto, casillas de selección, elementos de menú y combos.

Sincronización y sincronización

Pausas cortas de un solo disparo ( mcp_desktop_wait_milliseconds máximo cinco segundos).
Encuesta a nivel DOM vía mcp_browser_wait_for (máximo 30 segundos).

Notes

Todas las coordenadas están en píxeles de pantalla con (0,0) en la esquina superior izquierda. Las coordenadas de mcp_desktop_take_screenshot, mcp_desktop_analyze_screen, mcp_accessibility_find_ui_element, y mcp_desktop_list_windows todas comparten el mismo espacio de coordenadas.
Está activo un sistema de seguridad del cursor: Si el cursor se mueve a menos de cinco píxeles de cualquier esquina de la pantalla, las operaciones con el ratón se cancelan. Evita apuntar a los bordes extremos de la pantalla.
Los operadores de tubos de shell (|), puntos y coma (;), ampersands (&) y redirección de salida (>, <) están bloqueados. Para transformar la salida de comandos, capturarla y procesarla con mcp_desktop_execute_python_code.
Si las banderas de evaluación del intérprete están bloqueadas o si python -c "..." y node -e "..." son rechazadas, puedes usar mcp_desktop_execute_python_code para Python código, o escribir código en un archivo primero.
El comando stdout/stderr se reduce a 32 KB cada uno. Usa flags para limitar la salida verbosa (por ejemplo, git log --oneline -20) o redirige a un archivo y léelo por separado.
El tiempo máximo de espera para mcp_desktop_execute_shell_command y mcp_desktop_execute_python_code es de 30 segundos. Para trabajos más largos, divídelo en pasos más pequeños o lanza un proceso en segundo plano desde Python y haz encuestas.
No existe una herramienta dedicada para la lectura/escritura de archivos. Lee archivos con mcp_desktop_execute_shell_command usando el comando type; escribe archivos con mcp_desktop_execute_python_code usando la E/S de archivos integrada de Python. La redirección de salida de la shell (>, >>) está bloqueada.
mcp_browser_eval_js siempre devuelve una cuerda. Convierte objetos o números explícitamente antes de devolverlos.
Las herramientas DOM del navegador (mcp_browser_click, mcp_browser_type, mcp_browser_eval_js, etc.) funcionan solo en la instancia Microsoft Edge.  mcp_desktop_focus_browser pueden enfocar ventanas de Chrome o Firefox, pero las herramientas DOM no las apuntan.
mcp_desktop_take_screenshot requiere los cuatro parámetros de recorte (x, y, ancho, altura) juntos, o ninguno para una captura de pantalla completa.
mcp_desktop_scroll Utiliza unidades de muesca (sujetas a [-20, 20]), no píxeles. Tres muescas equivalen aproximadamente a una página.
mcp_accessibility_find_ui_element Requiere al menos uno de texto, rol o nombre. Cuando se proporcionan tanto texto como nombre, el nombre tiene prioridad.

Casos de uso comunes

Rellena un formulario web

Llama mcp_browser_navigate para abrir la página objetivo.
Llama mcp_browser_wait_for para esperar a que cargue el formulario.
Llama mcp_browser_type para rellenar cada campo mediante el selector CSS.
Llama mcp_browser_click para enviar el formulario.
Llama mcp_browser_wait_for para esperar el elemento de confirmación.
Llama mcp_browser_get_text para leer y verificar el resultado.

Automatizar una aplicación de escritorio

Llama mcp_desktop_activate_window para poner la solicitud en primer plano.
Llama mcp_desktop_take_screenshot para capturar el estado actual.
Llama mcp_accessibility_find_ui_element para localizar un botón o campo por nombre.
Solicita mcp_desktop_click las coordenadas reportadas del elemento.
Llama mcp_desktop_type_text para introducir datos.
Llama mcp_desktop_press_keys a atajos (por ejemplo, ["ctrl","s"] para guardar).
Llama mcp_desktop_take_screenshot para verificar el resultado.

Extraer datos de una página web

Llama mcp_browser_navigate para abrir la página.
Llama mcp_browser_get_text para extraer contenido de texto visible.
Llama mcp_desktop_execute_python_code para analizar y procesar los datos extraídos.
Llamar mcp_browser_eval_js a consultar valores específicos mediante JavaScript cuando la extracción de texto no es suficiente.

Ejecutar tareas de desarrollo

Llama mcp_desktop_execute_shell_command a git pull, npm install, y dotnet build.
Llama mcp_desktop_take_screenshot para capturar la salida de la compilación.
Llama mcp_desktop_execute_python_code para analizar registros o resultados de pruebas.
Llamar mcp_browser_navigate para abrir un servidor de desarrollo local en el navegador.
Llama mcp_browser_screenshot para capturar la página renderizada.

Lee y escribe archivos

Lee un archivo usando mcp_desktop_execute_shell_commandtype C:\path\to\file.txt.
Escribe un archivo con mcp_desktop_execute_python_code usando los Python open(...) y write(...).
Verifica usando mcp_desktop_execute_shell_commanddir C:\path\to\output.txt.

Navega por interfaces complejas con accesibilidad

Llama mcp_accessibility_get_accessibility_tree para entender toda la estructura de la interfaz.
Llama mcp_accessibility_find_ui_element para encontrar un control específico (por ejemplo, rol: "MenuItem", nombre: "Configuración").
Llama mcp_desktop_click usando las coordenadas reportadas del elemento.
Llama mcp_accessibility_find_ui_element de nuevo para encontrar el siguiente control en el diálogo.
Llama mcp_desktop_type_text o mcp_desktop_click para interactuar con él.

Mantén viva una sesión de larga duración

Envía cualquier solicitud de MCP al menos una vez cada 30 minutos para evitar el desahucio inactivo.
mcp_desktop_get_screen_size es ligera y funciona bien como latido.

Comentarios

¿Le ha resultado útil esta página?

Last updated on 2026-05-26

Referencia del servidor MCP de Windows 365 para Agentes (vista previa)

Overview

Available tools

mcp_desktop_move_mouse

mcp_desktop_click

mcp_desktop_get_cursor_position

mcp_desktop_drag_mouse

mcp_desktop_scroll

mcp_desktop_type_text

mcp_desktop_press_keys

mcp_desktop_take_screenshot

mcp_desktop_zoom_region

mcp_desktop_analyze_screen

mcp_desktop_get_screen_size

mcp_desktop_list_windows

mcp_desktop_activate_window

mcp_desktop_focus_browser

mcp_desktop_close_window

mcp_desktop_resize_window

mcp_desktop_execute_shell_command

mcp_desktop_execute_python_code

mcp_desktop_wait_milliseconds

mcp_desktop_clipboard_read

mcp_desktop_clipboard_write

mcp_desktop_list_processes

mcp_desktop_kill_process

mcp_desktop_launch_application

mcp_desktop_get_system_info

mcp_browser_navigate

mcp_browser_back

mcp_browser_forward

mcp_browser_reload

mcp_browser_get_url

mcp_browser_get_title

mcp_browser_get_text

mcp_browser_get_html

mcp_browser_click

mcp_browser_type

mcp_browser_query_text

mcp_browser_wait_for

mcp_browser_eval_js

mcp_browser_list_tabs

mcp_browser_switch_tab

mcp_browser_new_tab

mcp_browser_close_tab

mcp_browser_screenshot

mcp_browser_select_option

mcp_browser_fill_form

mcp_browser_drag

mcp_browser_pdf_save

mcp_browser_handle_dialog

mcp_browser_snapshot

mcp_browser_click_ref

mcp_browser_type_ref

mcp_browser_hover_ref

mcp_accessibility_get_accessibility_tree

mcp_accessibility_find_ui_element

Key features

Desktop interaction

Captura de pantalla y análisis

Window management

Command execution

Browser automation

UI accessibility

Sincronización y sincronización

Notes

Casos de uso comunes

Rellena un formulario web

Automatizar una aplicación de escritorio

Extraer datos de una página web

Ejecutar tareas de desarrollo

Lee y escribe archivos

Navega por interfaces complejas con accesibilidad

Mantén viva una sesión de larga duración

Comentarios

Recursos adicionales