EquivalenceEvaluator Classe

Definição

Um IEvaluator que avalia a 'Equivalência' de uma resposta produzida por um modelo de IA com outra resposta fornecida por meio GroundTruthde .

public ref class EquivalenceEvaluator sealed : Microsoft::Extensions::AI::Evaluation::IEvaluator
public sealed class EquivalenceEvaluator : Microsoft.Extensions.AI.Evaluation.IEvaluator
type EquivalenceEvaluator = class
    interface IEvaluator
Public NotInheritable Class EquivalenceEvaluator
Implements IEvaluator
Herança
EquivalenceEvaluator
Implementações

Comentários

EquivalenceEvaluator mede o grau em que a resposta que está sendo avaliada é semelhante à resposta fornecida por meio GroundTruthde . Retorna um NumericMetric que contém uma pontuação para a 'Equivalência'. A pontuação é um número entre 1 e 5, com 1 indicando uma pontuação ruim e 5 indicando uma excelente pontuação.

Nota:EquivalenceEvaluator é um avaliador baseado em IA que usa um modelo de IA para executar sua avaliação. Embora o prompt que esse avaliador usa para executar sua avaliação seja projetado para ser independente de modelo, o desempenho desse prompt (e a avaliação resultante) pode variar dependendo do modelo usado e pode ser especialmente ruim quando um modelo menor/local é usado.

O prompt que EquivalenceEvaluator usa foi testado (e ajustado para funcionar bem com) os modelos a seguir. Portanto, usar esse avaliador com um modelo da lista a seguir provavelmente produzirá os melhores resultados. (O modelo a ser usado pode ser configurado por meio de ChatClient.)

GPT-4o

Construtores

Nome Description
EquivalenceEvaluator()

Um IEvaluator que avalia a 'Equivalência' de uma resposta produzida por um modelo de IA com outra resposta fornecida por meio GroundTruthde .

Propriedades

Nome Description
EquivalenceMetricName

Obtém o Name do NumericMetric retornado por EquivalenceEvaluator.

EvaluationMetricNames

Obtém os Names dos EvaluationMetrics produzidos por este IEvaluator.

Métodos

Nome Description
EvaluateAsync(IEnumerable<ChatMessage>, ChatResponse, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Avalia o fornecido modelResponse e retorna um EvaluationResult ou mais EvaluationMetrics contendo.

Métodos de Extensão

Nome Description
EvaluateAsync(IEvaluator, ChatMessage, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Avalia o fornecido modelResponse e retorna um EvaluationResult ou mais EvaluationMetrics contendo.

EvaluateAsync(IEvaluator, ChatMessage, ChatMessage, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Avalia o fornecido modelResponse e retorna um EvaluationResult ou mais EvaluationMetrics contendo.

EvaluateAsync(IEvaluator, ChatMessage, ChatResponse, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Avalia o fornecido modelResponse e retorna um EvaluationResult ou mais EvaluationMetrics contendo.

EvaluateAsync(IEvaluator, ChatResponse, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Avalia o fornecido modelResponse e retorna um EvaluationResult ou mais EvaluationMetrics contendo.

EvaluateAsync(IEvaluator, String, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Avalia o fornecido modelResponse e retorna um EvaluationResult ou mais EvaluationMetrics contendo.

EvaluateAsync(IEvaluator, String, String, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Avalia o fornecido modelResponse e retorna um EvaluationResult ou mais EvaluationMetrics contendo.

Aplica-se a