Оценка Качества on Технический блог об AI

Оценка Качества on Технический блог об AIhttps://aipirlanta.xyz/tags/%D0%BE%D1%86%D0%B5%D0%BD%D0%BA%D0%B0-%D0%BA%D0%B0%D1%87%D0%B5%D1%81%D1%82%D0%B2%D0%B0/Recent content in Оценка Качества on Технический блог об AIHugo -- 0.147.9ru-ruFri, 08 Aug 2025 00:00:00 +0000Human‑eval и LLM‑as‑judge: осторожно #9https://aipirlanta.xyz/posts/eval-notes-09/Fri, 08 Aug 2025 00:00:00 +0000https://aipirlanta.xyz/posts/eval-notes-09/TL;DR: Используйте несколько метрик: автоматические + ручную проверку; избегайте переобучения на тестовую выборку.