■ ТЕХНИЧЕСКИЙ АУДИТ v1.0

LLM vs Qlik:
Разрыв в точности

Бенчмарк 13 моделей на 31 задаче Qlik Set Analysis. Выявлен критический разрыв между лояльной (77%) и строгой (34%) точностью, где большинство решений кажутся верными лишь случайно.

Изучить методологию
Критический инсайт

"Большинство «правильных» ответов на самом деле содержат ошибки в логике Qlik Set Analysis. Это ловушка случайной корректности."

ВИЗУАЛИЗАЦИЯ [01] ПАРАДОКС ТОЧНОСТИ
Лояльная точность
77%

Числовой ответ совпал с эталоном

Строгая точность
34%

Выражение логически эквивалентно эталону

ВЫБОРКА
31
ЗАДАЧИ
31