Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Cette version présente de nouvelles fonctionnalités, résout les problèmes et améliore les performances globales.
Nouvelles fonctionnalités
Azure CycleCloud prend en charge l’envoi de rapports d’intégrité des invités Azure pour les nœuds HPC défectueux depuis l’interface utilisateur et l’CLI. Consultez le guide lié pour activer cette fonctionnalité.
Azure CycleCloud indique un score de placement Spot pour les compartiments des tableaux de nœuds via le champ
spotPlacementScorede l’API REST d’état du cluster, sur la base de l’API Azure Spot Placement Score. Pour activer cette fonctionnalité, définissezcyclecloud.spot_placement_score_enabled=true.Azure CycleCloud prend désormais en charge le format de nom d’hôte
ip-XXXXXXpour les nœuds de cluster sans nécessiter l’infrastructure Chef héritée.Cluster-Init fournit désormais la version du projet à utiliser dans Cluster-Init scripts via la variable d’environnement
CYCLECLOUD_PROJECT_VERSION.Modifications apportées au cluster Slurm Azure CycleCloud :
- Prise en charge de Slurm 25.11, avec la fonctionnalité
TopologyParam=BlockAsNodeRankdansslurm.conf. - Prise en charge des images Azure Linux 3. Le support d’Azure Linux 3 nécessite des images de VM personnalisées avec les packages binaires de Slurm préinstallés.
- Prise en charge des images Rocky Linux 8/9.
- La collecte des métriques de cluster et de travail est disponible à l’aide de l’offre groupée
azslurm-exporter. - Un tableau de bord des métriques Slurm est installé dans l’espace de travail Azure Monitor configuré.
- Lorsque la comptabilité Slurm est activée, un ensemble de certificats par défaut est installé pour une utilisation avec Azure Database pour MySQL - Serveur flexible.
- Les utilisateurs peuvent fournir un certificat personnalisé pour la base de données de comptabilité Slurm directement dans l’interface utilisateur de création du cluster plutôt que de fournir une URL de certificat.
- L’interface en ligne de commande
azslurminclut les commandesrestartetreimagepour faciliter la résolution des problèmes des listes de nœuds.
- Prise en charge de Slurm 25.11, avec la fonctionnalité
modifications de l’interface utilisateur Azure CycleCloud :
- Les actions de redémarrage et de réimagerie sont désormais disponibles dans le menu Actions de nœud.
- Un avertissement s’affiche lors de la modification des paramètres ayant le statut « Aperçu ».
- Le panneau Détails du nœud comporte une nouvelle section Disques, une disposition réactive à plusieurs colonnes, ainsi que des graphiques Sparkline accessibles qui remplacent les anciens graphiques Dojo (toujours disponibles dans un onglet Monitoring distinct).
- Le type de cluster BeeGFS déconseillé et supprimé a été supprimé des types de cluster Azure CycleCloud disponibles.
- Les problèmes d’intégrité des nœuds sont publiés dans l’onglet Activity Log de la page cluster Azure CycleCloud pour faciliter le suivi des temps de démarrage et de résolution des problèmes.
Modifications de la CLI Azure CycleCloud :
- Bundles Astral Python pour une meilleure portabilité de plateforme.
Modifications de l’interface CLI Jetpack :
- Le port du serveur HTTP local Jetpack peut être (re-)configuré via le
cyclecloud.jetpack.http_portparamètre de configuration. -
vm.hostnameetvm.ipv4sont disponibles via lajetpack propscommande.
- Le port du serveur HTTP local Jetpack peut être (re-)configuré via le
cycle_serverModifications de l’interface CLI :-
import_dataaction pour faciliter l’utilisation de la ligne de commande et l’importation scriptée d’enregistrements dans le magasin de données CycleCloud. -
settingsaction pour vous aider à effectuer des modifications en ligne de commande et par script dans les paramètres de CycleCloud.
-
Problèmes résolus
- Dans les clusters configurés pour installer enroot, le script de démarrage d’enroot modifiait incorrectement les autorisations du répertoire racine si
ENROOT_TEMP_PATHétait absent deenroot.conf. - Dans Azure CycleCloud clusters Slurm, le script
start-services.shne s'est pas toujours arrêté avec un code de sortie non nul, ce qui risque de laisser les services dans un état d'échec plutôt que de réessayer comme prévu. - L’onglet Surveillance de la page de cluster n’a pas de barre de défilement verticale lorsque la fenêtre a été redimensionnée, ce qui a provoqué l’affichage de graphiques partiellement masqués.
- L’interface de ligne de commande
cycle_serveréchouait parfois avecNullPointerExceptionen cas d’erreurs lors du démarrage de CycleCloud. - Azure CycleCloud
.jarfichiers produits par Microsoft n’ont pas été signés. - Les actions masquées dans les menus n’étaient pas exécutables.
- La zone de texte détails de la boîte de dialogue Support n’a pas toujours été étendue pour remplir l’espace disponible.
- Le
cyclecloud-slurmprojet a configuré l’authentification JWT (et risque d’échec du démarrage du cluster) dans le cadre de la configurationslurmrestdmême lorsque l’authentification JWT n’a pas été utilisée. - Le css de thème personnalisé ne s’appliquait pas correctement lorsque des thèmes personnalisés étaient activés.
- La fonctionnalité ReturnProxy Azure CycleCloud n'a pas rétabli les connexions aux nœuds proxy qui ont été désalloués et redémarrés ultérieurement.
- Les opérations de redémarrage et de réinitialisation n’ont pas été autorisées sur les nœuds dont
KeepAlivela valeur est définie sur true. - L’interface de ligne de commande (CLI) d’Azure CycleCloud utilisait par défaut le point de terminaison public d’authentification si certains arguments d’authentification Entra n’étaient pas fournis.
- Les nœuds n’ont pas été arrêtés lorsqu’une
SKUNotAvailableerreur s’est produite, car elle a été traitée comme une erreur d’orchestration plutôt qu’une erreur de capacité. - Les nœuds Windows n’ont pas pu terminer la convergence en raison de l’absence du chemin d’accès Cluster-Init.
- Les vérifications d’intégrité du nœud de démarrage n’ont pas retourné de message d’erreur utile en cas d’échec.
- Les échecs de suppression d’un même groupe de machines virtuelles identiques empêchent parfois Azure CycleCloud de traiter d’autres suppressions de groupes de machines virtuelles identiques dans le même cluster.
- CVE-2020-10683 résolu.
- Cve-2023-39017 résolu.
Note
Les clusters Azure CycleCloud Open PBS et Single VM sont désormais par défaut UsePublicNetwork=false. Pour activer la mise en réseau publique, définissez le UsePublicNetwork=true paramètre lors de la création du cluster.
Problèmes connus
- Les paquets Slurm pour Azure CycleCloud sur Azure Linux 3 ne sont pas encore publiés dans les dépôts publics. Les utilisateurs peuvent générer et installer Slurm dans leur image personnalisée en suivant la documentation Slurm.