EquivalenceEvaluator Classe

Definição

An IEvaluator que avalia a 'Equivalência' de uma resposta produzida por um modelo de IA com outra resposta fornecida via GroundTruth.

public ref class EquivalenceEvaluator sealed : Microsoft::Extensions::AI::Evaluation::IEvaluator
public sealed class EquivalenceEvaluator : Microsoft.Extensions.AI.Evaluation.IEvaluator
type EquivalenceEvaluator = class
    interface IEvaluator
Public NotInheritable Class EquivalenceEvaluator
Implements IEvaluator
Herança
EquivalenceEvaluator
Implementações

Observações

EquivalenceEvaluator mede o grau em que a resposta a ser avaliada é semelhante à resposta fornecida via GroundTruth. Devolve a NumericMetric que contém uma pontuação para a 'Equivalência'. A pontuação é um número entre 1 e 5, sendo 1 uma pontuação fraca e 5 uma pontuação excelente.

Nota:EquivalenceEvaluator é um avaliador baseado em IA que utiliza um modelo de IA para realizar a sua avaliação. Embora o prompt que este avaliador utiliza para realizar a sua avaliação seja concebido para ser independente do modelo, o desempenho deste prompt (e da avaliação resultante) pode variar consoante o modelo utilizado, e pode ser especialmente fraco quando se utiliza um modelo mais pequeno ou local.

O prompt que EquivalenceEvaluator utiliza foi testado contra (e ajustado para funcionar bem) com os seguintes modelos. Portanto, usar este avaliador com um modelo da lista seguinte é provável que produza os melhores resultados. (O modelo a ser utilizado pode ser configurado via ChatClient.)

GPT-4o

Construtores

Name Description
EquivalenceEvaluator()

An IEvaluator que avalia a 'Equivalência' de uma resposta produzida por um modelo de IA com outra resposta fornecida via GroundTruth.

Propriedades

Name Description
EquivalenceMetricName

Obtém o Name de devolvido NumericMetric por EquivalenceEvaluator.

EvaluationMetricNames

Obtém o Names do EvaluationMetrics produzido por isto IEvaluator.

Métodos

Name Description
EvaluateAsync(IEnumerable<ChatMessage>, ChatResponse, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Avalia o fornecido modelResponse e devolve um EvaluationResult contendo um ou mais EvaluationMetrics.

Métodos da Extensão

Name Description
EvaluateAsync(IEvaluator, ChatMessage, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Avalia o fornecido modelResponse e devolve um EvaluationResult contendo um ou mais EvaluationMetrics.

EvaluateAsync(IEvaluator, ChatMessage, ChatMessage, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Avalia o fornecido modelResponse e devolve um EvaluationResult contendo um ou mais EvaluationMetrics.

EvaluateAsync(IEvaluator, ChatMessage, ChatResponse, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Avalia o fornecido modelResponse e devolve um EvaluationResult contendo um ou mais EvaluationMetrics.

EvaluateAsync(IEvaluator, ChatResponse, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Avalia o fornecido modelResponse e devolve um EvaluationResult contendo um ou mais EvaluationMetrics.

EvaluateAsync(IEvaluator, String, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Avalia o fornecido modelResponse e devolve um EvaluationResult contendo um ou mais EvaluationMetrics.

EvaluateAsync(IEvaluator, String, String, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Avalia o fornecido modelResponse e devolve um EvaluationResult contendo um ou mais EvaluationMetrics.

Aplica-se a