Wat is een grafiekdatabase?

Een grafiekdatabase is een type database dat informatie vertegenwoordigt als knooppunten (entiteiten) en randen (relaties) in plaats van tabellen en rijen. Deze structuur maakt het eenvoudig om complexe verbindingen en patronen in uw gegevens te verkennen.

Het meest gebruikte type grafiekdatabase implementeert het model van de gelabelde eigenschapsgrafiek (LNG): entiteiten (knooppunten) en relaties (randen) kunnen labels en eigenschappen (sleutel-waardeparen) bevatten. Met dit flexibele model kunt u zowel schema-optionele als schemagestuurde ontwerpen uitvoeren en kunt u complexe relaties uitdrukken. Omdat verbindingen expliciet als randen worden opgeslagen, doorlopen query's relaties door de randen te volgen in plaats van dure joins tijdens het uitvoeren van de query's te berekenen.

Opmerking

Voorbeelden in dit artikel maken gebruik van de grafiekgegevensset voor sociale netwerken.

Basisconcepten voor graph-databases

Een grafiekdatabase ordent gegevens in drie fundamentele bouwstenen:

Knooppunten vertegenwoordigen entiteiten zoals personen, producten of plaatsen. Knooppunten kunnen labels en eigenschappen hebben die hun kenmerken beschrijven. Een knooppunt kan bijvoorbeeld Person eigenschappen hebben zoals firstName, lastNameen age.
Randen geven aan hoe de entiteiten zijn verbonden, bijvoorbeeld FRIENDS_WITH, PURCHASEDof LOCATED_IN. Randen kunnen ook eigenschappen en labels bevatten om metagegevens van relaties vast te leggen.
Eigenschappen voegen details toe aan knooppunten en randen (bijvoorbeeld de naam van een persoon of de datum van een rand).

Hoe relaties opvragen werkt

Grafiekquery's halen verbonden informatie op door van een beginknooppunt naar de buren te gaan, vervolgens naar hun buren, enzovoort. De kosten van een doorkruising zijn afhankelijk van het aantal randen dat wordt aangeraakt (de lokale buurt), niet de totale grootte van de gegevensset. Dit kenmerk maakt vragen over paden, verbindingen en patronen, zoals vrienden van vrienden, kortste paden of afhankelijkheden met meerdere hops, natuurlijk en efficiënt om uit te drukken.

Graph-databases gebruiken querytalen op basis van patronen, zoals Graph Query Language (GQL) om deze doorkruisingen beknopt te beschrijven. Dezelfde internationale werkgroep die toezicht houdt op SQL (ISO/IEC 39075) is het standaardiseren van GQL, waarmee grafiekquery's worden afgestemd op vastgestelde databasestandaarden.

Voorbeeld (patroonkoppeling met GQL):

MATCH (p:Person {firstName: "Annemarie"})-[:knows]->(friend)-[:likes]->(c:Comment)
RETURN c
ORDER BY c.creationDate
LIMIT 100

Dit patroon wordt gelezen als: begin bij het Persoon-knooppunt van Annemarie, volg :knows randen naar elk vriendknooppunt en volg vervolgens :likes randen naar gerelateerde :Comment-knooppunten. Retourneer de 100 nieuwste van deze opmerkingen op basis van de aanmaakdatum.

Redenering voor AI-ondersteunde grafieken (preview)

Grafiekdatabases zijn natuurlijk geschikt voor AI-redenering, omdat ze de relaties coderen die taalmodellen nodig hebben om vragen met meerdere hops nauwkeurig te beantwoorden. In Microsoft Fabric ondersteunt Fabric Data Agent grafiek als gegevensbron, zodat gebruikers vragen in natuurlijke taal kunnen stellen die de agent beantwoordt door een query uit te voeren op de grafiek. Voor meer informatie over hoe NL2GQL natuurlijke taal vertaalt in GQL, raadpleegt u de aankondiging van grafiekgestuurde AI-redenering.

Flexibiliteit van grafiekgegevensmodel en schema

Grafiekgegevensmodellen zijn schema-optioneel: u kunt beginnen met een flexibel model en deze in de loop van de tijd formaliseren. In de grafiek in Microsoft Fabric moeten structurele wijzigingen, zoals het toevoegen van nieuwe eigenschappen, het wijzigen van labels of het wijzigen van relatietypen, momenteel het opnieuw opnemen van gegevens in een nieuw model vereist. Deze aanpak vermindert de noodzaak van gegevensduplicatie en stelt teams in staat om gegevens uit meerdere bronnen samen te voegen zonder dat ze vooraf opnieuw hoeven te worden ontworpen. Voor meer informatie over het gegevensmodel dat in Microsoft Fabric wordt gebruikt, zie Labeled eigenschapsgrafieken.

Algemene toepassingen voor grafiekdatabases

Grafiekdatabases zijn nauw afgestemd op domeinen waarin de waarde van verbindingen wordt aangedreven, zoals:

Sociale netwerken - modelrelaties tussen personen en hun interacties
Kennisgrafieken : verbind concepten, entiteiten en feiten voor semantische zoekopdrachten en redeneringen
Aanbevelingssystemen : door interacties tussen gebruikersitems gaan om persoonlijke suggesties weer te geven
Fraude- en risiconetwerken : verdachte patronen detecteren in accounts, transacties en apparaten
Netwerk- en IT-topologie: afhankelijkheden toewijzen tussen servers, services en infrastructuuronderdelen
Afhankelijkheidsanalyse van de toeleveringsketen : oorsprong en relaties van onderdelen traceren tussen leveranciers
RAG (Graph-based retrieval-augmented generation) - gebruikt grafstructuur als kennisbron voor AI-agenten die redenering met meerdere sprongen nodig hebben met uitlegbare, goed onderbouwde antwoorden.

In deze scenario's gaan de vragen minder over individuele records en meer over het aantal entiteiten die verband houden met en interageren over verschillende tussenstappen.

Wanneer moet u een grafiekdatabase overwegen

Een grafiekdatabase is sterk geschikt wanneer relaties de belangrijkste vragen stimuleren die u moet beantwoorden. Kies een grafiekdatabase wanneer:

Uw belangrijkste vragen zijn paden, buurten en patronen in verbonden gegevens.
Het aantal hops is variabel of niet van tevoren bekend.
U moet relaties combineren en navigeren in verschillende gegevenssets.

Als u dit soort vragen regelmatig stelt, is een grafiekmodel een natuurlijke pasvorm.

Hoe grafiek in Microsoft Fabric zich verhoudt tot zelfstandige grafiekdatabases

Het vertegenwoordigen van uw gegevens als een grafiek en deze opslaan in een afzonderlijke, zelfstandige grafiekdatabase introduceert vaak ETL (extraheren, transformeren, laden) en governance-overhead. Grafiek in Microsoft Fabric werkt daarentegen rechtstreeks op OneLake, waardoor de noodzaak voor afzonderlijke ETL-pijplijnen en gegevensduplicatie wordt verminderd of geëlimineerd. Houd rekening met deze compromissen:

Gegevensverplaatsing en -duplicatie: zelfstandige grafiekdatabases vereisen doorgaans het extraheren, transformeren en laden van gegevens in een afzonderlijk archief, wat de complexiteit verhoogt en kan leiden tot dubbele gegevenssets. Graph werkt op OneLake, zodat u verbonden gegevens kunt modelleren en er query's op kunt uitvoeren zonder deze te verplaatsen.
Operationele kosten: zelfstandige grafiekstacks worden uitgevoerd als afzonderlijke clusters of services en dragen vaak niet-actieve capaciteitskosten met zich mee. In grafieken verbruiken workloads poolcapaciteitseenheden (CA's) met automatische schaalverkleining en gecentraliseerde metriek, waardoor bewerkingen worden vereenvoudigd en de kosten kunnen worden verlaagd.
Schaalbaarheid: sommige zelfstandige grafiekdatabases zijn afhankelijk van omhoog schalen of leverancierspecifieke clustering. Graph is ontworpen voor grootschalige grafieken en maakt gebruik van scale-out sharding voor meerdere werkrollen om big data-workloads efficiënt te verwerken.
Hulpprogramma's en vaardigheden: Leverancierspecifieke grafieksystemen kunnen gespecialiseerde talen en afzonderlijke analyseframeworks vereisen. Graph biedt geïntegreerde modellering, op standaarden gebaseerde query's (GQL), ingebouwde graph analytics-algoritmen, BI- en AI-integratie, waaronder Fabric Data Agent ondersteuning voor naurale taalgrafiekquery's (preview) en verkennende hulpprogramma's met weinig/geen code. Met deze mogelijkheden kan een bredere set gebruikers werken met verbonden gegevens.
Governance en beveiliging: afzonderlijke grafiekimplementaties hebben onafhankelijke governance- en beveiligingsinstellingen nodig. Graph maakt gebruik van OneLake-governance, herkomst en op rollen gebaseerd toegangsbeheer (RBAC) voor werkruimten, zodat naleving, controle en machtigingen consistent blijven met de rest van uw Fabric-omgeving.

Feedback

Is deze pagina nuttig?

Last updated on 2026-06-03