Opus-Judge (Auto-Bewertung)
judge-opus-4-7
fertig
- Latenz
- 6.6s
- Kosten
- $0.0755
- Tokens In
- 2855
- Tokens Out
- 435
Opus-Judge hat alle Pipelines bewertet. (2855 in / 435 out)
01. Mai 2026 · MODELL-VERGLEICH
Production wird immer als Referenz übernommen — kein Re-Run.
judge-opus-4-7
mittwald-qwen-3-5-122b
Faktentreue Wiedergabe mit klarer Struktur (Teilnehmer, Inhalte, offene Punkte). Markiert die unklare Stelle bei Ersa korrekt als unvollständig, ohne zu spekulieren.
DEINE BEWERTUNG
ZUSAMMENFASSUNG
mittwald-qwen-3-6-35b
Gute Struktur, aber spekuliert bei 'bielen' (blühen/beeren) und erfindet Rollen wie 'Themenmoderation' und 'Referentin', die im Transkript keine Stütze haben.
DEINE BEWERTUNG
ZUSAMMENFASSUNG
production-aktuell
Knapp, faktentreu und ohne Erfindungen; gibt korrekt wieder, dass Ersas Beitrag abbricht. Etwas weniger detailliert, aber prägnant.
DEINE BEWERTUNG
ZUSAMMENFASSUNG