ToolCallAccuracyEvaluator Clase

Definición

que IEvaluator evalúa la eficacia de un sistema de inteligencia artificial en el uso de las herramientas proporcionadas.

public ref class ToolCallAccuracyEvaluator sealed : Microsoft::Extensions::AI::Evaluation::IEvaluator
[System.Diagnostics.CodeAnalysis.Experimental("AIEVAL001")]
public sealed class ToolCallAccuracyEvaluator : Microsoft.Extensions.AI.Evaluation.IEvaluator
public sealed class ToolCallAccuracyEvaluator : Microsoft.Extensions.AI.Evaluation.IEvaluator
[<System.Diagnostics.CodeAnalysis.Experimental("AIEVAL001")>]
type ToolCallAccuracyEvaluator = class
    interface IEvaluator
type ToolCallAccuracyEvaluator = class
    interface IEvaluator
Public NotInheritable Class ToolCallAccuracyEvaluator
Implements IEvaluator
Herencia
ToolCallAccuracyEvaluator
Atributos
Implementaciones

Comentarios

ToolCallAccuracyEvaluator mide la precisión en que un sistema de inteligencia artificial usa herramientas mediante el examen de las llamadas a herramientas (es decir, FunctionCallContents) presentes en la respuesta proporcionada para evaluar la relevancia de estas llamadas a herramientas a la conversación, la corrección de parámetros para estas llamadas a herramientas con respecto a las definiciones de herramientas proporcionadas a través ToolDefinitionsde y la precisión de la extracción de valores de parámetro de la conversación proporcionada.

Tenga en cuenta que, en este momento, ToolCallAccuracyEvaluator solo admite la evaluación de llamadas a herramientas definidas como AIFunctionDeclarations. Cualquier otra AITool definición que se proporcione a través ToolDefinitions de se omitirá.

ToolCallAccuracyEvaluator devuelve un BooleanMetric valor de tipo que contiene una puntuación para "Precisión de llamada de herramienta". La puntuación es false si la llamada a la herramienta es irrelevante o contiene información no presente en la conversación y true si la llamada a herramienta es relevante con parámetros extraídos correctamente de la conversación.

Nota:ToolCallAccuracyEvaluator es un evaluador basado en inteligencia artificial que usa un modelo de IA para realizar su evaluación. Aunque el aviso que usa este evaluador para realizar su evaluación está diseñado para ser independiente del modelo, el rendimiento de este aviso (y la evaluación resultante) puede variar en función del modelo utilizado y puede ser especialmente deficiente cuando se usa un modelo más pequeño o local.

La solicitud que ToolCallAccuracyEvaluator usa se ha probado con (y se ha ajustado para funcionar bien) con los siguientes modelos. Por lo tanto, es probable que el uso de este evaluador con un modelo de la lista siguiente genere los mejores resultados. (El modelo que se va a usar se puede configurar a través ChatClientde ).

GPT-4o

Constructores

Nombre Description
ToolCallAccuracyEvaluator()

que IEvaluator evalúa la eficacia de un sistema de inteligencia artificial en el uso de las herramientas proporcionadas.

Propiedades

Nombre Description
EvaluationMetricNames

Obtiene los Names de los EvaluationMetricgenerados por este IEvaluatorobjeto .

ToolCallAccuracyMetricName

Obtiene el Name objeto del BooleanMetric devuelto por ToolCallAccuracyEvaluator.

Métodos

Nombre Description
EvaluateAsync(IEnumerable<ChatMessage>, ChatResponse, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Evalúa el proporcionado modelResponse y devuelve un EvaluationResult objeto que contiene uno o varios EvaluationMetrics.

Métodos de extensión

Nombre Description
EvaluateAsync(IEvaluator, ChatMessage, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Evalúa el proporcionado modelResponse y devuelve un EvaluationResult objeto que contiene uno o varios EvaluationMetrics.

EvaluateAsync(IEvaluator, ChatMessage, ChatMessage, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Evalúa el proporcionado modelResponse y devuelve un EvaluationResult objeto que contiene uno o varios EvaluationMetrics.

EvaluateAsync(IEvaluator, ChatMessage, ChatResponse, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Evalúa el proporcionado modelResponse y devuelve un EvaluationResult objeto que contiene uno o varios EvaluationMetrics.

EvaluateAsync(IEvaluator, ChatResponse, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Evalúa el proporcionado modelResponse y devuelve un EvaluationResult objeto que contiene uno o varios EvaluationMetrics.

EvaluateAsync(IEvaluator, String, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Evalúa el proporcionado modelResponse y devuelve un EvaluationResult objeto que contiene uno o varios EvaluationMetrics.

EvaluateAsync(IEvaluator, String, String, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

Evalúa el proporcionado modelResponse y devuelve un EvaluationResult objeto que contiene uno o varios EvaluationMetrics.

Se aplica a