Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
S’applique à : SQL Server 2016 (13.x) et versions
ultérieures Azure SQL Database
Azure Synapse Analytics
Analytics Platform System (PDW)
Cet article fournit une synthèse des fonctionnalités PolyBase disponibles pour les services et produits SQL Server.
Synthèse des fonctionnalités pour les versions du produit
Ce tableau contient les principales fonctionnalités de PolyBase et les produits dans lesquels elles sont disponibles.
| Fonctionnalité | SQL Server (à compter de 2016) | Base de données SQL Azure | Azure Synapse Analytics | Parallel Data Warehouse |
|---|---|---|---|---|
| Requête des données Hadoop avec Transact-SQL | Oui | Non | Non | Oui |
| Importer des données depuis Hadoop | Oui | Non | Non | Oui |
| Exporter des données vers Hadoop | Oui | Non | Non | Oui |
| Interroger, importer, exporter vers Azure HDInsights | Non | Non | Non | Non |
| Optimiser l'exécution des calculs de requête pour Hadoop | Oui | Non | Non | Oui |
| Importer des données à partir d’Azure Blob Storage | Oui | Oui 1 | Oui | Oui |
| Exporter des données vers le stockage Blob Azure | Oui | Non | Oui | Oui |
| Importer des données depuis Azure Data Lake Store | Non | Non | Oui | Non |
| Exporter des données vers Azure Data Lake Store | Non | Non | Oui | Non |
| Exécuter des requêtes PolyBase à partir des outils décisionnels Microsoft | Oui | Non | Oui | Oui |
1 Introduite dans SQL Server 2017 (14.x), consultez Exemples d’accès en bloc à des données dans le Stockage Blob Azure.
Limitations connues
PolyBase présente les limitations suivantes :
Avant SQL Server 2019 (15.x), la taille de ligne maximale, qui comprend la longueur totale des colonnes à longueur variable, ne peut pas dépasser 32 Ko dans SQL Server ou 1 Mo dans Azure Synapse Analytics. Dans SQL Server 2019 (15.x) et les versions ultérieures, cette limitation est levée. La limite reste de 1 Mo pour les sources de données Hadoop, mais n’est définie que par la limite maximale de SQL Server pour les autres sources de données.
Quand des données sont exportées dans un format de fichier ORC à partir de SQL Server ou Azure Synapse Analytics, les colonnes comportant beaucoup de texte peuvent être limitées. Elles peuvent être limitées à aussi peu que 50 colonnes en raison des messages d'erreur de mémoire insuffisante de Java. Pour contourner ce problème, exportez uniquement une partie des colonnes.
PolyBase ne peut pas se connecter à une instance Hadoop si Knox est activé.
Si vous utilisez des tables Hive avec transactional = true, PolyBase ne peut pas accéder aux données dans le répertoire de la table Hive.
Les services PolyBase demandent que le service SQL Server ait le protocole réseau TCP/IP activé pour fonctionner correctement. En outre, si le paramètre de configuration du protocole TCP/IP Écoute tout est défini sur Non, les configurations TCP/IP suivantes sont requises :
- Saisie du port d'écoute approprié dans soit les ports dynamiques TCP ou les ports TCP sous IPAll. C’est nécessaire en raison de la façon dont les services PolyBase résolvent le port d’écoute du moteur SQL Server.
- Activez les adresses IP souhaitées dans Propriétés TCP/IP > Adresses IP, sinon, le moteur SQL Server n'acceptera aucune connexion TCP/IP et les services PolyBase ne pourront toujours pas se connecter au moteur SQL Server.
PolyBase sur SQL Server sur Linux ne fonctionne pas si IPv6 est désactivé dans le noyau. Pour plus d’informations, consultez SQL Server sur Linux : problèmes connus.
Pour un fonctionnement optimal, les services PolyBase exigent que le protocole Mémoire partagée soit activé.
Si vous disposez d’une instance de SQL Server par défaut qui est configurée pour écouter sur un port TCP autre que le port 1433, vous ne pouvez pas l’utiliser comme nœud principal dans un groupe de scale-out PolyBase. Lors de l’exécution de
sp_polybase_join_group, si vous transmettez « MSSQLSERVER » comme nom d’instance, SQL Server suppose que le port 1433 est le port de l’écouteur de sorte que le service de déplacement des données ne peut pas se connecter au nœud principal au démarrage.L’utilisation de synonymes Oracle avec PolyBase n’est pas prise en charge.
Les classements UTF-8 ne sont pas pris en charge pour les sources de données externes Hadoop.
Hadoop n'est plus pris en charge par SQL Server 2022 (16.x) et versions ultérieures.
La longueur du nom du serveur est liée par une limitation de longueur de nom NetBIOS de 15 caractères. Si vous remplacez le nom du serveur après sa création par 16 caractères ou plus, le service De déplacement des données PolyBase ne démarre pas.
Les groupes PolyBase scale-out ne sont pas pris en charge avec les groupes de disponibilité Always On.
Les bases de données installées avec PolyBase (DWConfiguration, DWDiagnostics, DWQueue) doivent être en mode lecture-écriture pour que PolyBase fonctionne et que les installations de mise à jour cumulative réussissent. Par conséquent, il n’est pas supporté d'avoir ces bases de données dans un groupe de disponibilité.