Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Use la actividad Notebook para ejecutar notebooks que crea en Microsoft Fabric como parte de las canalizaciones de Data Factory. Los cuadernos permiten ejecutar trabajos de Apache Spark para incorporar, limpiar o transformar los datos como parte de los flujos de trabajo de datos. Es fácil agregar una actividad de cuaderno a las canalizaciones en Fabric, y esta guía le guía a través de cada paso.
Requisitos previos
Para empezar, debe completar los siguientes requisitos previos:
- Debe tener acceso a un tenant de Microsoft Fabric con una capacidad aprovisionada. Puede probar Fabric con una prueba gratuita.
- Un Fabric workspace asignado a esa capacidad.
- Se crea un cuaderno en el área de trabajo. Para crear un cuaderno, consulte Cómo crear cuadernos de Microsoft Fabric.
Creación de una actividad de cuaderno
Crear una nueva canalización en su espacio de trabajo.
Busque "Notebook" en el panel de Actividades de la canalización y selecciónelo para agregarlo al lienzo de la canalización.
Selecciona la nueva actividad de cuaderno en el lienzo si aún no está seleccionada.
Consulte las instruccionesgenerales para configurar la pestaña de parámetros General.
Configuración de las opciones del cuaderno
Seleccione la pestaña Configuración .
En Conexión, seleccione el método de autenticación para la ejecución del cuaderno y proporcione las credenciales necesarias.
Seleccione un cuaderno existente en la lista desplegable Cuaderno y, opcionalmente, especifique los parámetros que se van a pasar al cuaderno.
Uso de la Identidad de Área de Trabajo de Fabric (WI) en la actividad Notebook
Creación de la identidad del área de trabajo
Debe habilitar WI en el área de trabajo (esto puede tardar un momento en cargarse). Cree una identidad de espacio de trabajo en su espacio de trabajo de Fabric. Tenga en cuenta que el WI debe crearse en el mismo espacio de trabajo que su Pipeline.
Consulte los documentos en Identidad del área de trabajo.
Habilitar configuración a nivel de inquilino
Habilite la siguiente configuración de inquilino (está deshabilitada de forma predeterminada): Los principales de servicio pueden llamar a las APIs públicas de Fabric.
Puede habilitar esta configuración en el portal de administración de Fabric. Para obtener más información sobre esta configuración, consulte el artículo Habilitación de la autenticación de entidad de servicio para las API de administración.
Conceder permisos de área de trabajo a la Identidad del Área de Trabajo
Abra el área de trabajo, seleccione Administrar acceso y asigne permisos a la identidad del área de trabajo. El acceso de colaborador es suficiente para la mayoría de los escenarios. Si el Notebook no está en la misma área de trabajo que la Pipeline, deberá asignar el WI que creó en el área de trabajo de la Pipeline con al menos acceso de colaborador al área de trabajo del Notebook.
Consulte los documentos sobre Concesión de acceso a los usuarios a las áreas de trabajo.
Establecimiento de la etiqueta de sesión
Para minimizar la cantidad de tiempo que se tarda en ejecutar el trabajo del cuaderno, puede establecer opcionalmente una etiqueta de sesión. Establecer la etiqueta de sesión indica a Spark que reutilice cualquier sesión de Spark existente, lo que minimiza el tiempo de inicio. Cualquier valor arbitrario de cadena se puede usar para la etiqueta de sesión. Si no existe ninguna sesión, se creará una nueva con el valor de etiqueta .
Nota:
Para poder usar la etiqueta de sesión, se debe activar el modo de simultaneidad alta para la canalización que ejecuta varios cuadernos. Esta opción se puede encontrar en el modo de simultaneidad alta para la configuración de Spark en la configuración del área de trabajo
Guardar y ejecutar o programar la canalización
Cambie a la pestaña Inicio de la parte superior del editor de canalizaciones y seleccione el botón Guardar para guardar la canalización. Seleccione Ejecutar para ejecutarlo directamente o Programar para programar ejecuciones en intervalos o horas específicos. Para más información sobre las ejecuciones de canalización, consulte: ejecuciones de canalización programadas.
Una vez que se haya ejecutado, puede supervisar la ejecución de la canalización y ver el historial de ejecución desde la pestaña Salida debajo del lienzo.
Problemas conocidos
- El uso de un principal de servicio para ejecutar un cuaderno que contiene código de enlace semántico presenta limitaciones funcionales y solo admite un subconjunto de las características de enlace semántico. Consulte las funciones de vínculo semántico compatibles para obtener más información. Para usar otras funcionalidades, se recomienda autenticar manualmente el vínculo semántico con una entidad de servicio.