Referenzantworten¶
Lernen Sie, LLM-Antworten gegen bekannte korrekte Antworten für Genauigkeitstests und Qualitätssicherung zu evaluieren
Referenzantworten bieten eine Möglichkeit, generierte Antworten automatisch gegen bekannte korrekte Antworten zu evaluieren. Dies ist besonders nützlich für:
- Genauigkeitstests: Überprüfen, ob LLM-Antworten mit erwarteten Antworten übereinstimmen
- Qualitätssicherung: Gewährleistung einer konstanten Leistung über verschiedene Prompts hinweg
Wichtige Schritte¶
- Erstellen Sie ein Prompt-Template mit Template-Variablen. Stellen Sie sicher, dass
{{reference_answer}}
nicht als Template-Variable in Ihrer Prompt-Template verwendet wird, da sonst die Lösung direkt mitgegeben wird. - Fügen Sie Kriterien hinzu, die die Template-Variable
{{reference_answer}}
verwenden - Erstellen Sie eine Collection mit allen Template-Variablen, die im Prompt-Template verwendet werden, sowie die
{{reference_answer}}
. Template-Variable - Das war's! Sie können nun Ihre Antworten anhand der Referenzantworten bewerten.
Das folgende Beispiel zeigt, wie Sie Referenzantworten mit elluminate verwenden können:
-
Zunächst erstellen wir die Prompt-Template. Beachten Sie, dass wir hier nur die Template-Variable
{{country}}
verwenden. -
Hier fügen wir ein Kriterium zum Prompt-Template hinzu. Beachten Sie, dass das Kriterium die Template-Variable
{{reference_answer}}
verwendet, die mit der Referenzantwort aus den Template-Variablen gefüllt wird. -
Wir definieren die Template-Variablen. Jede Template-Variable enthält einen Wert für
country
und diereference_answer
, welche die korrekte Antwort für das jeweilige Land ist.
Evaluierungskriterien¶
Definieren Sie Kriterien, die die Referenzantworten zur Bewertung von Antworten verwenden. Häufige Muster sind:
- Exakter Vergleich
- Überprüfung der semantischen Ähnlichkeit