Microsoft.Extensions.AI.Evaluation.Quality Espacio de nombres

Contiene clases de evaluador que evalúan la calidad de las respuestas del modelo de lenguaje grande (LLM) en una aplicación según varias métricas.

Clases

Nombre Description
CoherenceEvaluator

que IEvaluator evalúa la "Coherencia" de una respuesta producida por un modelo de IA.

CompletenessEvaluator

que IEvaluator evalúa la "integridad" de una respuesta producida por un modelo de IA.

CompletenessEvaluatorContext

Información contextual que usa CompletenessEvaluator para evaluar la "Integridad" de una respuesta.

EquivalenceEvaluator

que IEvaluator evalúa la "Equivalencia" de una respuesta producida por un modelo de IA con otra respuesta proporcionada a través GroundTruthde .

EquivalenceEvaluatorContext

Información contextual que usa EquivalenceEvaluator para evaluar la "Equivalencia" de una respuesta.

FluencyEvaluator

que IEvaluator evalúa la "Fluency" de una respuesta producida por un modelo de IA.

GroundednessEvaluator

que IEvaluator evalúa la "Solidez" de una respuesta generada por un modelo de IA.

GroundednessEvaluatorContext

Información contextual que usa GroundednessEvaluator para evaluar la "Solidez" de una respuesta.

IntentResolutionEvaluator

que IEvaluator evalúa la eficacia de un sistema de inteligencia artificial para identificar y resolver la intención del usuario.

IntentResolutionEvaluatorContext

Información contextual que usa IntentResolutionEvaluator para evaluar la eficacia de un sistema de inteligencia artificial al identificar y resolver la intención del usuario.

RelevanceEvaluator

que IEvaluator evalúa la "Relevancia" de una respuesta producida por un modelo de IA.

RelevanceTruthAndCompletenessEvaluator

que IEvaluator evalúa la "Relevancia", "Verdad" y "Integridad" de una respuesta generada por un modelo de IA.

RetrievalEvaluator

que IEvaluator evalúa el rendimiento de un sistema de INTELIGENCIA ARTIFICIAL para recuperar información para contexto adicional en respuesta a una solicitud de usuario (por ejemplo, en un escenario de generación aumentada de recuperación (RAG).

RetrievalEvaluatorContext

Información contextual que usa para evaluar el RetrievalEvaluator rendimiento de un sistema de inteligencia artificial al recuperar información para contexto adicional.

TaskAdherenceEvaluator

que IEvaluator evalúa la eficacia de un sistema de inteligencia artificial para cumplir con la tarea asignada.

TaskAdherenceEvaluatorContext

Información contextual que usa TaskAdherenceEvaluator para evaluar la eficacia de un sistema de inteligencia artificial a la hora de cumplir con la tarea asignada.

ToolCallAccuracyEvaluator

que IEvaluator evalúa la eficacia de un sistema de inteligencia artificial en el uso de las herramientas proporcionadas.

ToolCallAccuracyEvaluatorContext

Información contextual que usa ToolCallAccuracyEvaluator para evaluar la eficacia de un sistema de inteligencia artificial con las herramientas proporcionadas.