Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Important
- Se trata de una característica en versión preliminar.
- Las características en versión preliminar no se han diseñado para un uso de producción y pueden tener una funcionalidad restringida. Estas características están sujetas a condiciones de uso adicionales y están disponibles antes del lanzamiento oficial para que los clientes puedan tener un acceso anticipado y proporcionar comentarios.
Windows 365 para Agentes es un servidor MCP para el control operativo total de un PC en la nube con Windows 365. Utiliza este servidor MCP para manejar un entorno Windows real mediante interacción de escritorio (ratón, teclado, captura de pantalla, ejecución de comandos), automatización del navegador mediante Microsoft Edge y inspección semántica de la interfaz mediante Windows Automatización de la interfaz de usuario.
Note
- Las conexiones existentes que utilizan versiones anteriores de servidores MCP de Microsoft siguen siendo compatibles.
- Para todas las nuevas conexiones, utiliza el último servidor MCP de Windows 365 Agents, que expone herramientas en escritorio, navegador y capacidades de accesibilidad.
- La automatización del navegador funciona en Microsoft Edge. Edge se inicia automáticamente en la primera llamada a la herramienta del navegador.
focus_browsertambién puede dirigirse a Chrome o Firefox, pero las herramientas de navegador a nivel DOM solo funcionan en la instancia de Edge.
Para saber más sobre Windows 365 para agentes, consulta Windows 365 para la documentación de agentes.
Overview
| Server ID | Tenant-level URL | Display name | Description |
|---|---|---|---|
mcp_W365AServer |
https://agent365.svc.cloud.microsoft/agents/tenants/{tenantId}/servers/mcp_W365AServer |
Windows 365 para agentes servidor MCP | Control operativo completo de un PC en la nube con Windows 365, incluyendo interacción de escritorio, automatización del navegador e inspección de la interfaz de usuario. |
Available tools
mcp_desktop_move_mouse
Mueve el cursor a una posición de pantalla. Úsalo mcp_desktop_click en su lugar si tienes intención de hacer clic en el destino. Required parameters:
- x: Coordenada X en píxeles de pantalla
- y: Coordenada Y en los píxeles de pantalla
mcp_desktop_click
Haz clic en una posición, o en la ubicación actual del cursor si se omiten coordenadas. Soporta clic simple, doble clic y los cinco botones del ratón.
Optional parameters:
- x: coordenada X en píxeles de pantalla (omitir la posición actual)
- y: Coordenada Y en los píxeles de pantalla (omitir la posición actual)
- botón: Izquierda, Derecha, Medio, Adelante o Atrás (por defecto Izquierda)
- RecuentoClick: 1 = clic simple, 2 = doble clic (por defecto 1)
mcp_desktop_get_cursor_position
Devuelve las coordenadas actuales del cursor. No parameters. Devuelve {cursorX, cursorY}.
mcp_desktop_drag_mouse
Arrastra de una posición a otra. Útil para mover objetos, redimensionar ventanas o desplazamiento con precisión de píxeles. Required parameters:
- startX: Coordenada Start X.
- startY: Coordenada Start Y.
- endX: Coordenada final X.
- endY: Coordenada end Y. Optional parameters:
- botón: Izquierda, Derecha o Medio (por defecto es Izquierda)
mcp_desktop_scroll
Desplaza en una posición usando unidades de muesca (no píxeles). Tres muescas equivalen aproximadamente a una página.
Required parameters:
- x: Posición de desplazamiento X
- y: Posición de desplazamiento Y
Optional parameters:
- deltaX: Muescas horizontales, positivo = derecho (por defecto 0)
- deltaY: Muescas verticales, positivo = abajo (por defecto 0)
Note
Los valores se ajustan al rango [-20, 20].
mcp_desktop_type_text
Escribe texto mediante simulación de teclado. Para atajos de teclado, usa mcp_desktop_press_keys. Para los campos de formulario web, utiliza mcp_browser_type.
Required parameters:
- texto: Texto para escribir
mcp_desktop_press_keys
Pulsa una combinación de teclas simultáneamente. Soporta teclas modificadoras, teclas de función y teclas estándar.
Required parameters:
-
teclas: Matriz de nombres de claves para pulsar juntos (por ejemplo,
["ctrl","c"],["alt","tab"],["ctrl","shift","s"])
mcp_desktop_take_screenshot
Captura la pantalla completa o una región recortada como una imagen PNG (codificada en base64).
Optional parameters:
- x: Borde izquierdo de la región de cultivo
- y: Borde superior de la región de cultivo
- Ancho: Ancho de la región de cultivo
- altura: Altura de la región de cultivo
Note
Proporciona los cuatro parámetros de recorte juntos, o omite los cuatro para una captura de pantalla completa.
mcp_desktop_zoom_region
Captura una región de pantalla a resolución nativa como una imagen PNG (codificada en base64). Usa esto para inspeccionar texto pequeño o una interfaz densa que es difícil de leer en una captura de pantalla a pantalla completa reducida.
Required parameters:
- x: Coordenada X del borde izquierdo en los píxeles de pantalla
- y: Coordenada Y en el borde superior de los píxeles de pantalla
- ancho: Ancho de región en píxeles
- altura: Altura de la región en píxeles
Note
El tamaño máximo de la región es de 1920x1080 píxeles.
mcp_desktop_analyze_screen
Realiza OCR en toda la pantalla. No parameters. Devuelve {fullText, averageConfidence, boxes[{text, confidence, x, y, width, height}], width, height}.
mcp_desktop_get_screen_size
Devuelvo la resolución de la pantalla. No parameters. Devuelve {width, height}.
mcp_desktop_list_windows
Enumera todas las ventanas visibles con sus títulos, posiciones y dimensiones. No parameters. Devuelve un array de {title, processName, handle, x, y, width, height}.
mcp_desktop_activate_window
Pone una ventana en primer plano usando un combate difuso por el título.
Required parameters:
- TítuloPatron: Título parcial de ventana (subcadena insensible a mayúsculas y minúsculas)
mcp_desktop_focus_browser
Enfoca una ventana del navegador (Edge, Chrome o Firefox), opcionalmente filtrada por URL o título.
Optional parameters:
- Patrón: URL o subcadena de título para que coincida (omitir en cualquier ventana del navegador)
mcp_desktop_close_window
Cierra con gracia una ventana con un combate difuso por el título. Los procesos críticos para el sistema están protegidos y no pueden cerrarse.
Required parameters:
-
TitlePattern: Título parcial de ventana (80% umbral de coincidencia). Devuelve
{matchedTitle, processName, closed}.
mcp_desktop_resize_window
Redimensiona, mueve, maximiza, minimiza o restaura una ventana usando una partida por el título difusa.
Required parameters:
- título: Título de ventana para coincidir (coincidencia difusa insensible a mayúsculas y minúsculas)
-
acción: Acción para realizar —
Resize,Move,Maximize,Minimize, oRestore
Optional parameters:
- x: Coordenada X del borde izquierdo (usada con Redimensionar o Mover)
- y: Coordenada Y del borde superior (usada con Redimensionar o Mover)
- ancho: Ancho en píxeles (usado con Redimensionar)
- altura: Altura en píxeles (usado con Redimensionar)
mcp_desktop_execute_shell_command
Ejecuta un comando shell en un entorno sandbox. Los comandos se validan contra una lista de permisos y se bloquean los patrones peligrosos.
Required parameters:
- comando: Orden de ejecutar
Optional parameters:
-
cwd: Directorio de trabajo. Usa cortes hacia adelante (por ejemplo,
C:/Users/me/project). - timeoutMs: Tiempo límite en milisegundos (por defecto 30000, máximo 30000)
Note
- Comandos permitidos: git, npm, dotnet, python, cargo, node, pip, dir, mkdir, del, copy, move, robocopy, findstr, where, type y notepad.
- Los patrones bloqueados incluyen metacaracteres de shell (|, ;, y, <, ), >expansión
(%VAR%)de variables de entorno, flags de evaluación de intérpretes (python -conode -e),git config --global,npm -g, ejecutables con prefijo de camino,rm -rf,sudo, y comandos de disco/sistema. -
stdoutystderrcada uno se trunca a 32 KB. Úsalomcp_desktop_execute_python_codepara cálculos arbitrarios. Devuelve{stdout, stderr, exitCode, success, timedOut, resourceLimitsApplied}.
mcp_desktop_execute_python_code
Ejecuta código Python en un entorno sandbox con límites de recursos. Ideal para procesamiento de datos, cálculos, E/S de archivos y cualquier cálculo que vaya más allá de simples comandos de shell.
Required parameters:
- código: código Python (máximo 262.144 caracteres).
Optional parameters:
- cwd: Directorio de trabajo. Usa tajos hacia delante.
- timeoutMs: Timeout en milisegundos (por defecto 30000, máximo 30000).
Devuelve el mismo esquema que mcp_desktop_execute_shell_command.
Note
El sandbox impone un límite de memoria de 512 MB y un tiempo de espera de 30 segundos.
mcp_desktop_wait_milliseconds
Pausa la ejecución para permitir que se completen animaciones o transiciones. No se utilicen en bucles de encuestas—úsalo mcp_browser_wait_for para sondeos del DOM.
Required parameters:
- ms: Duración de espera en milisegundos (sujeto a [0, 5000])
mcp_desktop_clipboard_read
Lee el contenido actual del portapapeles del sistema. No parameters. Devuelve un objeto JSON que describe el formato del portapapeles y la carga útil — ya sea una cadena de texto o una imagen codificada en base64.
mcp_desktop_clipboard_write
Escribe texto en la carpeta del sistema, reemplazando el contenido actual.
Required parameters:
- texto: Texto para escribir en la carpeta
Devuelve una confirmación que incluye el recuento de caracteres.
mcp_desktop_list_processes
Lista los procesos en ejecución en la sesión actual. Cada entrada incluye el PID, nombre del proceso, uso de memoria, título de ventana (si lo hay), y startTimeTicks. Combina startTimeTicks con mcp_desktop_kill_process para evitar matar un PID reciclado.
Optional parameters:
- maxCount: Número máximo de procesos que devolver (por defecto 200)
Devuelve un array JSON de objetos info de proceso.
mcp_desktop_kill_process
Terminar un proceso por PID. El startTime valor de mcp_desktop_list_processes debe proporcionarse para proteger contra el reciclaje de PID.
Required parameters:
-
pid: ID de proceso devuelto por
mcp_desktop_list_processes -
Tiempode inicio: Ticks de tiempo de inicio de proceso devueltos por
mcp_desktop_list_processes
Optional parameters:
- fuerza: Fuerza de muerte sin un apagado elegante (por defecto falso)
Devuelve un resultado JSON que describe el resultado.
mcp_desktop_launch_application
Lanza una aplicación GUI desde un directorio permitido. Úsalo mcp_desktop_execute_shell_command para comandos de CLI en su lugar.
Required parameters:
-
ruta: Ruta absoluta hacia el ejecutable. Usa cortes hacia adelante (por ejemplo,
C:/Program Files/app.exe).
Optional parameters:
- args: Matriz de argumentos de línea de comandos
Devuelve {path, pid}.
mcp_desktop_get_system_info
Devuelve la versión del sistema operativo, CPU, RAM, espacio disponible en disco y resolución de pantalla. No parameters. Devuelve un objeto JSON que contiene la información del sistema.
mcp_browser_navigate
Navega hasta una URL y espera a que cargue la página.
Required parameters:
-
URL: URL completa incluyendo protocolo (por ejemplo,
https://example.com)
mcp_browser_back
Navega hacia atrás en el historial del navegador. No parameters.
mcp_browser_forward
Navega hacia adelante en el historial del navegador. No parameters.
mcp_browser_reload
Recarga la página actual. No parameters.
mcp_browser_get_url
Devuelve la URL actual de la página como una cadena de caracteres simples. No parameters.
mcp_browser_get_title
Devuelve el título de la página actual como una cadena simple. No parameters.
mcp_browser_get_text
Devuelve el contenido visible del texto de la página como una cadena plana. No parameters. Truncado a 512 KB.
mcp_browser_get_html
Devuelve el código fuente HTML de página completa como una cadena simple. No parameters. Truncado a 512 KB.
mcp_browser_click
Haz clic en un elemento DOM junto al selector CSS. Más fiable que el clic basado en coordenadas para contenido web.
Required parameters:
-
selector: selector CSS (por ejemplo,
#submit-btno )a.nav-link
mcp_browser_type
Escribe texto en un elemento de formulario mediante un selector CSS.
Required parameters:
- selector: selector CSS del elemento de entrada.
- texto: Texto para escribir
mcp_browser_query_text
Haz que el contenido de texto del primer elemento coincida con un selector CSS.
Required parameters:
- Selector: Selector CSS
mcp_browser_wait_for
Espera a que aparezca un elemento DOM. Útil para contenido dinámico que carga de forma asincrónica.
Required parameters:
- selector: selector CSS para esperar
Optional parameters:
- TimeoutMs: Timeout en milisegundos (por defecto 5000, máximo 30000)
mcp_browser_eval_js
Evalúa una expresión JavaScript en el contexto de la página y devuelve el resultado como una cadena.
Required parameters:
- expresión: expresión JavaScript que devuelve una cadena
Note
Si tu expresión devuelve un objeto o número, conviértelo explícitamente a una cadena (por ejemplo, JSON.stringify(obj) o .toString()).
mcp_browser_list_tabs
Lista todas las pestañas abiertas con su índice, título y URL. No parameters. Devuelve un array de {index, title, url}.
mcp_browser_switch_tab
Cambia a una pestaña por index.
Required parameters:
- tabIndex: índice de tabulación basado en 0
mcp_browser_new_tab
Abre una nueva pestaña, opcionalmente navegando hasta una URL.
Optional parameters:
- URL: URL para abrir (pestaña vacía si se omite)
Devuelve {index, title, url}.
mcp_browser_close_tab
Cierra una pestaña por índice.
Required parameters:
- tabIndex: índice de tabulación basado en 0
mcp_browser_screenshot
Captura una captura de pantalla PNG solo del viewport del navegador (no de la pantalla completa). No parameters. Devuelve un PNG codificado en base64.
mcp_browser_select_option
Selecciona una o más opciones en un <select> elemento según su value atributo.
Required parameters:
-
selector: selector CSS para el
<select>elemento - valores: Array de valor(es) de opción a seleccionar
Devuelve una confirmación con el conteo de opciones seleccionadas.
mcp_browser_fill_form
Rellena varios campos de formulario en una sola llamada. Cada entrada es un {selector, value} par. Se detiene en el primer fallo e informa qué campos tuvieron éxito.
Required parameters:
-
campos: Matriz de
{selector, value}pares
Devuelve una confirmación con el conteo de campos rellenados.
mcp_browser_drag
Arrastra un elemento fuente a un elemento objetivo. Ambos elementos se identifican mediante el selector CSS.
Required parameters:
- sourceSelector: selector CSS de la fuente de arrastre
- Selector de objetivos: Selector CSS del objetivo de caída
mcp_browser_pdf_save
Guarda la página actual como archivo PDF. Las rutas de destino están restringidas a %USERPROFILE% o %TEMP%.
Required parameters:
-
Ruta de archivo: Ruta de archivo de destino bajo
%USERPROFILE%o%TEMP%. Usa tajos hacia delante.
Devuelve una confirmación que incluye la ruta del archivo guardado.
mcp_browser_handle_dialog
Acepta o descarta un diálogo pendiente del navegador (alerta, confirmación, aviso o antes de descargar). Devuelve "No hay diálogo pendiente" si no hay ningún diálogo activo.
Required parameters:
-
acción:
acceptodismiss
Optional parameters:
- promptText: Texto para enviar a un diálogo de prompt (ignorado para alertar y confirmar)
mcp_browser_snapshot
Captura el árbol de accesibilidad de la página con identificadores de referencia estables (por ejemplo, e5) que se asignen a nodos DOM. Usa las referencias con mcp_browser_click_ref, mcp_browser_type_ref, y mcp_browser_hover_ref. Las referencias caducan cuando la página navega — vuelve a hacer una instantánea después de navegar.
Optional parameters:
- maxDepth: Profundidad máxima del árbol, 1-10 (por defecto 5)
- incluyeIframes: Incluye iframes de origen cruzado (por defecto verdadero)
Devuelve un objeto JSON que contiene la instantánea de accesibilidad y los IDs de referencia.
mcp_browser_click_ref
Haz clic en un elemento por el ID de referencia de mcp_browser_snapshot. Una prueba de acierto verifica que ningún otro elemento superpone el objetivo. Si falla si la instantánea ha caducado — vuelve a hacerla en ese caso.
Required parameters:
-
snapshotId: ID de instantánea devuelto por
mcp_browser_snapshot -
ref: Ref de elemento (por ejemplo,
e5) de los nodos de instantánea
Optional parameters:
- botón: Izquierda, Derecha o Medio (por defecto Izquierda)
- RecuentoClick: 1 = clic simple, 2 = doble clic (por defecto 1)
Devuelve una confirmación que incluye las coordenadas pulsadas.
mcp_browser_type_ref
Escribe texto en un elemento mediante el ID de referencia de mcp_browser_snapshot. El elemento se enfoca primero y el texto existente se borra por defecto. Falla si la instantánea ha caducado.
Required parameters:
-
snapshotId: ID de instantánea devuelto por
mcp_browser_snapshot -
ref: Ref de elemento (por ejemplo,
e5) de los nodos de instantánea - texto: Texto para escribir
Optional parameters:
- Clear: Borrar primero el texto existente (por defecto verdadero)
Devuelve una confirmación que incluye el recuento de caracteres.
mcp_browser_hover_ref
Coloca el cursor sobre un elemento por el ID de referencia de mcp_browser_snapshot. Returns immediately. Si falla si la instantánea ha caducado — vuelve a hacerla en ese caso.
Required parameters:
-
snapshotId: ID de instantánea devuelto por
mcp_browser_snapshot -
ref: Ref de elemento (por ejemplo,
e5) de los nodos de instantánea
Devuelve una confirmación que incluye las coordenadas de flotación.
mcp_accessibility_get_accessibility_tree
Recupera el árbol de elementos de la interfaz para la ventana de primer plano. Cada elemento incluye su función, nombre, valor y coordenadas de pantalla.
Optional parameters:
- maxDepth: Profundidad máxima de travesía del árbol, 1-10 (por defecto 3)
- maxElements: Máximo de elementos que deben regresar, 1-2000 (por defecto 500)
Devuelve un árbol jerárquico de {rol, nombre, valor, x, y, ancho, altura, hijos[...]}.
mcp_accessibility_find_ui_element
Busca elementos de la interfaz por contenido de texto, rol de accesibilidad o nombre (subcadena insensible a mayúsculas). Devuelve elementos coincidentes con sus coordenadas de pantalla clicables.
Optional parameters:
- texto: Texto para buscar (usado como nombre si se omite el nombre)
-
role: filtro de rol de la interfaz —
Button,TextBox,CheckBox,MenuItem,ComboBoxy más - nombre: Nombre accesible (tiene prioridad sobre el texto si ambos se proporcionan)
- AsaVentana: Manija de ventana objetivo (nulo = ventana en primer plano)
Key features
Desktop interaction
- Clic doble, clic derecho, control de ratón con cinco botones.
- Arrastrar y soltar con precisión píxel.
- Desplazamiento basado en muescas (tres muescas ≈ una página).
- Teclado y atajos combinados de teclado múltiple.
- Seguimiento de posición del cursor.
- Detección de resolución de pantalla.
Captura de pantalla y análisis
- Capturas de pantalla completa o recortadas en PNG.
- OCR de pantalla completa con puntuaciones de confianza por región y cajas delimitadoras.
- Capturas de pantalla solo en el viewport del navegador para contenido web.
Window management
- Enumera todas las ventanas visibles con posiciones y dimensiones.
- Activa Windows mediante una coincidencia de título difusa.
- Enfoca las ventanas del navegador (Edge, Chrome, Firefox) filtradas opcionalmente por URL o título.
- Cierre de ventana elegante con protección para procesos críticos para el sistema.
Command execution
- Comandos de shell en formato sandbox con una lista de permisos (git, npm, dotnet, python, cargo, node, pip, dir, mkdir, del, copy, move, robocopy, findstr, where, type).
- En formato sandboxeado Python ejecución hasta 262.144 caracteres de código.
- Directorio de trabajo y control de tiempo de espera por llamada (máximo 30 segundos).
- Límites de recursos y lista de bloqueos reforzada contra metacaracteres de shell, flags de evaluación, escalada de privilegios y operaciones destructivas.
Browser automation
- Navegar, retroceder, avanzar, recargar.
- Lee la página URL, título, texto visible (límite de 512 KB) y HTML completo (límite de 512 KB).
- Consulta de clic, escritura y texto a nivel DOM mediante selector CSS.
- Espera a los elementos dinámicos con un tiempo de espera configurable.
- Evalúa JavaScript las expresiones en el contexto de la página.
- Gestión de varias pestañas: lista, cambio, abrir, cerrar.
- Funciona en Microsoft Edge y se lanza automáticamente al primer uso.
UI accessibility
- Recuperar el Windows Automatización de la interfaz de usuario tree para la ventana de primer plano con profundidad y conteo de elementos configurables.
- Busca elementos de la interfaz por texto, rol o nombre accesible.
- Devuelve coordenadas de pantalla clicables para apuntar con precisión a botones, cuadros de texto, casillas de selección, elementos de menú y combos.
Sincronización y sincronización
- Pausas cortas de un solo disparo (
mcp_desktop_wait_millisecondsmáximo cinco segundos). - Encuesta a nivel DOM vía
mcp_browser_wait_for(máximo 30 segundos).
Notes
- Todas las coordenadas están en píxeles de pantalla con (0,0) en la esquina superior izquierda. Las coordenadas de
mcp_desktop_take_screenshot,mcp_desktop_analyze_screen,mcp_accessibility_find_ui_element, ymcp_desktop_list_windowstodas comparten el mismo espacio de coordenadas. - Está activo un sistema de seguridad del cursor: Si el cursor se mueve a menos de cinco píxeles de cualquier esquina de la pantalla, las operaciones con el ratón se cancelan. Evita apuntar a los bordes extremos de la pantalla.
- Los operadores de tubos de shell (|), puntos y coma (;), ampersands (&) y redirección de salida (>, <) están bloqueados. Para transformar la salida de comandos, capturarla y procesarla con
mcp_desktop_execute_python_code. - Si las banderas de evaluación del intérprete están bloqueadas o si
python -c "..."ynode -e "..."son rechazadas, puedes usarmcp_desktop_execute_python_codepara Python código, o escribir código en un archivo primero. - El comando
stdout/stderrse reduce a 32 KB cada uno. Usa flags para limitar la salida verbosa (por ejemplo,git log --oneline -20) o redirige a un archivo y léelo por separado. - El tiempo máximo de espera para
mcp_desktop_execute_shell_commandymcp_desktop_execute_python_codees de 30 segundos. Para trabajos más largos, divídelo en pasos más pequeños o lanza un proceso en segundo plano desde Python y haz encuestas. - No existe una herramienta dedicada para la lectura/escritura de archivos. Lee archivos con
mcp_desktop_execute_shell_commandusando el comandotype; escribe archivos conmcp_desktop_execute_python_codeusando la E/S de archivos integrada de Python. La redirección de salida de la shell (>, >>) está bloqueada. -
mcp_browser_eval_jssiempre devuelve una cuerda. Convierte objetos o números explícitamente antes de devolverlos. - Las herramientas DOM del navegador (
mcp_browser_click,mcp_browser_type,mcp_browser_eval_js, etc.) funcionan solo en la instancia Microsoft Edge.mcp_desktop_focus_browserpueden enfocar ventanas de Chrome o Firefox, pero las herramientas DOM no las apuntan. -
mcp_desktop_take_screenshotrequiere los cuatro parámetros de recorte (x, y, ancho, altura) juntos, o ninguno para una captura de pantalla completa. -
mcp_desktop_scrollUtiliza unidades de muesca (sujetas a [-20, 20]), no píxeles. Tres muescas equivalen aproximadamente a una página. -
mcp_accessibility_find_ui_elementRequiere al menos uno de texto, rol o nombre. Cuando se proporcionan tanto texto como nombre, el nombre tiene prioridad.
Casos de uso comunes
Rellena un formulario web
- Llama
mcp_browser_navigatepara abrir la página objetivo. - Llama
mcp_browser_wait_forpara esperar a que cargue el formulario. - Llama
mcp_browser_typepara rellenar cada campo mediante el selector CSS. - Llama
mcp_browser_clickpara enviar el formulario. - Llama
mcp_browser_wait_forpara esperar el elemento de confirmación. - Llama
mcp_browser_get_textpara leer y verificar el resultado.
Automatizar una aplicación de escritorio
- Llama
mcp_desktop_activate_windowpara poner la solicitud en primer plano. - Llama
mcp_desktop_take_screenshotpara capturar el estado actual. - Llama
mcp_accessibility_find_ui_elementpara localizar un botón o campo por nombre. - Solicita
mcp_desktop_clicklas coordenadas reportadas del elemento. - Llama
mcp_desktop_type_textpara introducir datos. - Llama
mcp_desktop_press_keysa atajos (por ejemplo, ["ctrl","s"] para guardar). - Llama
mcp_desktop_take_screenshotpara verificar el resultado.
Extraer datos de una página web
- Llama
mcp_browser_navigatepara abrir la página. - Llama
mcp_browser_get_textpara extraer contenido de texto visible. - Llama
mcp_desktop_execute_python_codepara analizar y procesar los datos extraídos. - Llamar
mcp_browser_eval_jsa consultar valores específicos mediante JavaScript cuando la extracción de texto no es suficiente.
Ejecutar tareas de desarrollo
- Llama
mcp_desktop_execute_shell_commandagit pull,npm install, ydotnet build. - Llama
mcp_desktop_take_screenshotpara capturar la salida de la compilación. - Llama
mcp_desktop_execute_python_codepara analizar registros o resultados de pruebas. - Llamar
mcp_browser_navigatepara abrir un servidor de desarrollo local en el navegador. - Llama
mcp_browser_screenshotpara capturar la página renderizada.
Lee y escribe archivos
- Lee un archivo usando
mcp_desktop_execute_shell_commandtype C:\path\to\file.txt. - Escribe un archivo con
mcp_desktop_execute_python_codeusando los Pythonopen(...)ywrite(...). - Verifica usando
mcp_desktop_execute_shell_commanddir C:\path\to\output.txt.
Navega por interfaces complejas con accesibilidad
- Llama
mcp_accessibility_get_accessibility_treepara entender toda la estructura de la interfaz. - Llama
mcp_accessibility_find_ui_elementpara encontrar un control específico (por ejemplo, rol: "MenuItem", nombre: "Configuración"). - Llama
mcp_desktop_clickusando las coordenadas reportadas del elemento. - Llama
mcp_accessibility_find_ui_elementde nuevo para encontrar el siguiente control en el diálogo. - Llama
mcp_desktop_type_textomcp_desktop_clickpara interactuar con él.
Mantén viva una sesión de larga duración
- Envía cualquier solicitud de MCP al menos una vez cada 30 minutos para evitar el desahucio inactivo.
-
mcp_desktop_get_screen_sizees ligera y funciona bien como latido.