Microsoft.Extensions.AI.Evaluation.Quality Naamruimte
Belangrijk
Bepaalde informatie heeft betrekking op een voorlopige productversie die aanzienlijk kan worden gewijzigd voordat deze wordt uitgebracht. Microsoft biedt geen enkele expliciete of impliciete garanties met betrekking tot de informatie die hier wordt verstrekt.
Bevat evaluatorklassen die de kwaliteit van LLM-antwoorden (Large Language Model) in een app beoordelen op basis van verschillende metrische gegevens.
Klassen
| Name | Description |
|---|---|
| CoherenceEvaluator |
Een IEvaluator die de 'Coherentie' evalueert van een antwoord dat is geproduceerd door een AI-model. |
| CompletenessEvaluator |
Een IEvaluator die de volledigheid evalueert van een antwoord dat wordt geproduceerd door een AI-model. |
| CompletenessEvaluatorContext |
Contextuele informatie die wordt CompletenessEvaluator gebruikt om de volledigheid van een antwoord te evalueren. |
| EquivalenceEvaluator |
Een IEvaluator die de 'equivalentie' evalueert van een reactie die door een AI-model wordt geproduceerd met een ander antwoord dat via GroundTruth. |
| EquivalenceEvaluatorContext |
Contextuele informatie die wordt EquivalenceEvaluator gebruikt om de equivalentie van een antwoord te evalueren. |
| FluencyEvaluator |
Een IEvaluator die de 'fluency' evalueert van een reactie die wordt geproduceerd door een AI-model. |
| GroundednessEvaluator |
Een IEvaluator die de 'Groundedness' evalueert van een antwoord dat wordt geproduceerd door een AI-model. |
| GroundednessEvaluatorContext |
Contextuele informatie die wordt GroundednessEvaluator gebruikt om de 'Groundedness' van een antwoord te evalueren. |
| IntentResolutionEvaluator |
Een IEvaluator die de effectiviteit van een AI-systeem evalueert bij het identificeren en oplossen van gebruikersintentie. |
| IntentResolutionEvaluatorContext |
Contextuele informatie die wordt gebruikt om de IntentResolutionEvaluator effectiviteit van een AI-systeem te evalueren bij het identificeren en oplossen van gebruikersintentie. |
| RelevanceEvaluator |
Een IEvaluator die de relevantie evalueert van een antwoord dat wordt geproduceerd door een AI-model. |
| RelevanceTruthAndCompletenessEvaluator |
Een IEvaluator die de 'Relevantie', 'Waarheid' en 'Volledigheid' evalueert van een antwoord dat wordt geproduceerd door een AI-model. |
| RetrievalEvaluator |
Een IEvaluator die de prestaties van een AI-systeem evalueert bij het ophalen van informatie voor aanvullende context als reactie op een gebruikersaanvraag (bijvoorbeeld in een RAG-scenario (Ophalen van Augmented Generation). |
| RetrievalEvaluatorContext |
Contextuele informatie die wordt gebruikt om de RetrievalEvaluator prestaties van een AI-systeem te evalueren bij het ophalen van informatie voor aanvullende context. |
| TaskAdherenceEvaluator |
Een IEvaluator systeem dat de effectiviteit van een AI-systeem evalueert bij het naleven van de taak die eraan is toegewezen. |
| TaskAdherenceEvaluatorContext |
Contextuele informatie die wordt gebruikt om de TaskAdherenceEvaluator effectiviteit van een AI-systeem te evalueren bij het naleven van de taak die eraan is toegewezen. |
| ToolCallAccuracyEvaluator |
Een IEvaluator systeem dat de effectiviteit van een AI-systeem evalueert met behulp van de hulpprogramma's die eraan worden geleverd. |
| ToolCallAccuracyEvaluatorContext |
Contextuele informatie die wordt ToolCallAccuracyEvaluator gebruikt om de effectiviteit van een AI-systeem te evalueren met behulp van de hulpprogramma's die eraan zijn geleverd. |