Referenzantworten¶
Referenzantworten bieten eine Möglichkeit, generierte Antworten automatisch gegen bekannte korrekte Antworten zu evaluieren. Dies ist besonders nützlich für:
- Genauigkeitstests: Überprüfen, ob LLM-Antworten mit erwarteten Antworten übereinstimmen
- Qualitätssicherung: Gewährleistung einer konstanten Leistung über verschiedene Prompts hinweg
Wichtige Schritte¶
- Erstellen Sie ein Prompt-Template mit Template-Variablen. Stellen Sie sicher, dass
{{reference_answer}}
nicht als Template-Variable in Ihrer Prompt-Template verwendet wird, da sonst die Lösung direkt mitgegeben wird. - Fügen Sie Kriterien hinzu, die die Template-Variable
{{reference_answer}}
verwenden - Erstellen Sie eine Collection mit Spalten für alle Template-Variablen, die im Prompt-Template verwendet werden, sowie zusätzlich die Spalte
reference_answer
. Hier tragen Sie ihre Referenzantworten ein. - Das war's! Sie können nun Ihre Antworten anhand der Referenzantworten bewerten.
Das folgende Beispiel zeigt, wie Sie Referenzantworten mit elluminate verwenden können:
1. Zunächst erstellen wir die Prompt-Template. Beachten Sie, dass wir hier nur die Template-Variable `{{country}}` verwenden.
2. Hier fügen wir ein Kriterium zum Prompt-Template hinzu. Beachten Sie, dass das Kriterium die Template-Variable `{{reference_answer}}` verwendet, die mit der Referenzantwort aus den Template-Variablen gefüllt wird.
3. Wir definieren die Template-Variablen. Jede Template-Variable enthält einen Wert für `country` und die `reference_answer`, welche die korrekte Antwort für das jeweilige Land ist.
Evaluierungskriterien¶
Definieren Sie Kriterien, die die Referenzantworten zur Bewertung von Antworten verwenden. Häufige Muster sind:
- Exakter Vergleich
- Überprüfung der semantischen Ähnlichkeit