Войдите, чтобы отправлять практику и сохранять прогресс.
Шаг 1 из 5/0/5
Рубрика качества
Рубрика качества нужна для одной простой вещи: заменить расплывчатое «ну вроде нормально» на проверяемый разбор ответа. Пока вы оцениваете только общим впечатлением, промпт легко кажется хорошим просто потому, что текст звучит уверенно.
Для начала достаточно четырех критериев. Релевантность отвечает на вопрос «ответил ли текст именно на задачу», полнота — «закрыл ли он все обязательные части», фактическая надежность — «нет ли выдумок и опасных допущений», применимость — «можно ли взять этот результат и использовать без долгой переделки».
Важно оценивать критерии отдельно. Сначала поставьте небольшую оценку каждому пункту и коротко запишите причину, а уже потом смотрите на общую картину. Такой подход защищает от эффекта ореола, когда один красивый абзац заставляет нас простить серьезные пробелы в логике или фактах.
Хорошая рубрика всегда ведет к следующему действию. Если провал по релевантности — нужно уточнять Task. Если провал по полноте — укреплять Output. Если модель придумывает лишнее — стоит ограничить источник данных или добавить явное правило «если не знаешь, так и скажи».
На практике рубрика делает работу спокойнее. Вы уже не угадываете, хороший ли ответ получился, а проверяете его по понятным правилам. А значит, можете вернуться к теории, увидеть слабое место и править не вслепую, а осознанно.