Microsoft.Extensions.AI.Evaluation.Quality Naamruimte

Belangrijk

Bepaalde informatie heeft betrekking op een voorlopige productversie die aanzienlijk kan worden gewijzigd voordat deze wordt uitgebracht. Microsoft biedt geen enkele expliciete of impliciete garanties met betrekking tot de informatie die hier wordt verstrekt.

Bevat evaluatorklassen die de kwaliteit van LLM-antwoorden (Large Language Model) in een app beoordelen op basis van verschillende metrische gegevens.

Klassen

Name	Description
CoherenceEvaluator	Een IEvaluator die de 'Coherentie' evalueert van een antwoord dat is geproduceerd door een AI-model.
CompletenessEvaluator	Een IEvaluator die de volledigheid evalueert van een antwoord dat wordt geproduceerd door een AI-model.
CompletenessEvaluatorContext	Contextuele informatie die wordt CompletenessEvaluator gebruikt om de volledigheid van een antwoord te evalueren.
EquivalenceEvaluator	Een IEvaluator die de 'equivalentie' evalueert van een reactie die door een AI-model wordt geproduceerd met een ander antwoord dat via GroundTruth.
EquivalenceEvaluatorContext	Contextuele informatie die wordt EquivalenceEvaluator gebruikt om de equivalentie van een antwoord te evalueren.
FluencyEvaluator	Een IEvaluator die de 'fluency' evalueert van een reactie die wordt geproduceerd door een AI-model.
GroundednessEvaluator	Een IEvaluator die de 'Groundedness' evalueert van een antwoord dat wordt geproduceerd door een AI-model.
GroundednessEvaluatorContext	Contextuele informatie die wordt GroundednessEvaluator gebruikt om de 'Groundedness' van een antwoord te evalueren.
IntentResolutionEvaluator	Een IEvaluator die de effectiviteit van een AI-systeem evalueert bij het identificeren en oplossen van gebruikersintentie.
IntentResolutionEvaluatorContext	Contextuele informatie die wordt gebruikt om de IntentResolutionEvaluator effectiviteit van een AI-systeem te evalueren bij het identificeren en oplossen van gebruikersintentie.
RelevanceEvaluator	Een IEvaluator die de relevantie evalueert van een antwoord dat wordt geproduceerd door een AI-model.
RelevanceTruthAndCompletenessEvaluator	Een IEvaluator die de 'Relevantie', 'Waarheid' en 'Volledigheid' evalueert van een antwoord dat wordt geproduceerd door een AI-model.
RetrievalEvaluator	Een IEvaluator die de prestaties van een AI-systeem evalueert bij het ophalen van informatie voor aanvullende context als reactie op een gebruikersaanvraag (bijvoorbeeld in een RAG-scenario (Ophalen van Augmented Generation).
RetrievalEvaluatorContext	Contextuele informatie die wordt gebruikt om de RetrievalEvaluator prestaties van een AI-systeem te evalueren bij het ophalen van informatie voor aanvullende context.
TaskAdherenceEvaluator	Een IEvaluator systeem dat de effectiviteit van een AI-systeem evalueert bij het naleven van de taak die eraan is toegewezen.
TaskAdherenceEvaluatorContext	Contextuele informatie die wordt gebruikt om de TaskAdherenceEvaluator effectiviteit van een AI-systeem te evalueren bij het naleven van de taak die eraan is toegewezen.
ToolCallAccuracyEvaluator	Een IEvaluator systeem dat de effectiviteit van een AI-systeem evalueert met behulp van de hulpprogramma's die eraan worden geleverd.
ToolCallAccuracyEvaluatorContext	Contextuele informatie die wordt ToolCallAccuracyEvaluator gebruikt om de effectiviteit van een AI-systeem te evalueren met behulp van de hulpprogramma's die eraan zijn geleverd.

Feedback

Is deze pagina nuttig?