45% Казахстанцев отличают Медиану от Среднего и зарабатывают больше чем те, кто этого не делает
Что в исследовании?
Мы проанализировали то, как разные уровни навыков работы с данными влияют на доходы работников, исследовали как отличаются уровни Информационной грамотности по сферам экономической деятельности (Финансы, IT, Гос. управление) и узнали, влияет ли образование в сфере деятельности на уровень доходов.
Откуда данные?
В сотрудничестве с Datanomix Academy мы провели опрос, в котором приняли участие 1414 уникальных респондентов.
Целевая аудитория нашего исследования — профессионалы из различных сфер деятельности. Для повышения репрезентативности данных мы исключили из целевой выборки респондентов, чей профиль не соответствует исследуемым критериям: школьники, студенты и безработные; а также очистили базу от дубликатов и пропусков.
Целевая аудитория нашего исследования — профессионалы из различных сфер деятельности. Для повышения репрезентативности данных мы исключили из целевой выборки респондентов, чей профиль не соответствует исследуемым критериям: школьники, студенты и безработные; а также очистили базу от дубликатов и пропусков.
Итого, мы проанализировали 878 респондентов из 10 индустрий, включая Финансовые институты (банки и Финтех), IT, Государственное управление и другие (Маркетинговые агенства, Консалтинг).
Респонденты были приглашены пройти опрос через каналы коммуникации Astana Hub, лендинги, и профессиональные чаты.
Портрет респондента
Опрос прошли граждане Казахстана уже практикующие и интересующиеся анализом данных.
Средний возраст респондента — 29 лет.
Средний возраст респондента — 29 лет.
Что такое Data Literacy?
Это умение понимать данные, анализировать их, а также правильно их интерпретировать и использовать. Навыки грамотной работы с данными критически важны для решения разных задач — необязательно из профессиональных сфер типа Data Science.
К примеру, оценивая уровень безработицы по областям Казахстана можно получить две разные картины. На карте слева цветом закодировали абсолютные величины, а справа — доля безработных от численности рабочей силы. Абсолютные значения не всегда информативны: для объективного сравнения и достоверной визуализации статистические данные нужно нормировать, например приводить к количеству рабочего населения.
К примеру, оценивая уровень безработицы по областям Казахстана можно получить две разные картины. На карте слева цветом закодировали абсолютные величины, а справа — доля безработных от численности рабочей силы. Абсолютные значения не всегда информативны: для объективного сравнения и достоверной визуализации статистические данные нужно нормировать, например приводить к количеству рабочего населения.

Численность безработного населения в абсолютных величинах по областям Казахстана за 2 квартал 2024 года

Доля безработного населения от численности рабочей силы по областям Казахстана за 2 квартал 2024 года
Чем старше респондент, тем ниже индекс информационной грамотности (уровень навыков работы с данными)
Группа трудоустроенных респондентов с 18 до 23 лет в среднем набирают 27 баллов из всевозможных 50. Очевиден негативный, и статистически значимый тренд: возрастная группа 42−46 в среднем набирает на 5 меньше — 22 балла.
Мы проверили размер эффекта между двумя возрастными группами и обнаружили, что данный разрыв в Информационной грамотности между двумя возрастными группами достаточно заметён и имеет практическое значение (Cohen's D = 0.69).
Мы проверили размер эффекта между двумя возрастными группами и обнаружили, что данный разрыв в Информационной грамотности между двумя возрастными группами достаточно заметён и имеет практическое значение (Cohen's D = 0.69).

Есть ли зависимость между уровнем Информационной грамотности и заработной платой?
Результаты на основе 314 респондентов
С увеличением медианного* уровня навыков работы с данными увеличивается и уровень доходов респондентов. Интересно: можно ли в этом проследить причинно-следственную связь?
* Для расчёта центральной тенденции использовали медиану в силу смещённого распределения значений.
* Для расчёта центральной тенденции использовали медиану в силу смещённого распределения значений.
Прямая корреляция заработной платы с уровнем Информационной грамотности, прослеживается, однако, не во всех индустриях.
Так, сферы «Самозанятые», «Профессиональные услуги», «Производство», и «Образование» отклоняются от подобной тенденции. И наоборот, в «Ритейл», «IT», «Гос.управление» наблюдается наиболее обострённый эффект позитивной корреляции.
Так, сферы «Самозанятые», «Профессиональные услуги», «Производство», и «Образование» отклоняются от подобной тенденции. И наоборот, в «Ритейл», «IT», «Гос.управление» наблюдается наиболее обострённый эффект позитивной корреляции.
Влияет ли наличие образования в сфере деятельности на доход?
Около половины респондентов с доходом до 200,000 тенге не имеют образования в текущей сфере текущей деятельности.
Доля респондентов, не обучавшихся по направлению своей текущей занятости уменьшается с увеличением диапазона доходов: от 37% при доходе в 210,000−400,000 тенге до 19% с доходом более 810,000 тенге.
Доля респондентов, не обучавшихся по направлению своей текущей занятости уменьшается с увеличением диапазона доходов: от 37% при доходе в 210,000−400,000 тенге до 19% с доходом более 810,000 тенге.
Лучше всего отличать среднее от медианы…

Умеют респонденты из сфер Образования, Ритейла, и Телекоммуникаций. Специалисты из этих сфер набрали наивысшее количество баллов в секции по основам статистики.
Секция содержит 12 вопросов и оценивает базовые статистические знания: правильный подбор мер центральной тенденции, методов агрегации данных и аналитики.
Секция содержит 12 вопросов и оценивает базовые статистические знания: правильный подбор мер центральной тенденции, методов агрегации данных и аналитики.
При этом, 45% респондентов имеют знания выше среднего в области базовой статистики.
Для сравнения, исследование Global Data Literacy Benchmark 2023 года обнаружило, что профиль Информационной грамотности в отношении данных по‑прежнему очень схож во всех странах, при этом все регионы демонстрируют в основном схожее распределение по когортам Coaches (Продвинутый уровень), Confident (Средний уровень) и Curious (Начальный уровень). Так, в Америке, 51% респондентов относятся к среднему уровню, в Великобритании — 46%, в Австралии — 47%.
Чем полезны базовые статистические знания?
Представим: маркетинговая команда компании розничной торговли сегментирует свою клиентскую базу, чтобы нацелить людей с высоким уровнем дохода на премиальный продукт. Они используют средний доход покупателей для выявления потенциальных высокодоходных сегментов.
Таким образом команда увидит, что ровно половина покупателей имеют доход выше медианного показателя, и это позволит распределить покупательную способность сегментов верным способом.
Полагаясь на средний доход, маркетологи могут переоценить покупательную способность определённых сегментов клиентов, особенно если небольшое количество клиентов с очень высоким доходом искажает средние показатели.
Это может привести к неправильному выбору маркетинговых стратегий, например, к предложению товаров премиум-класса более широкой аудитории, чем та, которая на самом деле способна их себе позволить, что приведёт к низкой эффективности кампании и напрасной трате маркетингового бюджета.
В этом случае правильным решением было бы выбрать медиану в качестве меры центральной тенденции.
Таким образом команда увидит, что ровно половина покупателей имеют доход выше медианного показателя, и это позволит распределить покупательную способность сегментов верным способом.
Полагаясь на средний доход, маркетологи могут переоценить покупательную способность определённых сегментов клиентов, особенно если небольшое количество клиентов с очень высоким доходом искажает средние показатели.
Это может привести к неправильному выбору маркетинговых стратегий, например, к предложению товаров премиум-класса более широкой аудитории, чем та, которая на самом деле способна их себе позволить, что приведёт к низкой эффективности кампании и напрасной трате маркетингового бюджета.
В этом случае правильным решением было бы выбрать медиану в качестве меры центральной тенденции.
Таким образом команда увидит, что ровно половина покупателей имеют доход выше медианного показателя, и это позволит распределить покупательную способность сегментов верным способом.
Как дела у студентов?
Результаты на основе 450 респондентов
Средний балл тестирования среди студентов — 23 балла из 50. Это значение входит в диапазон среднего уровня развития навыков Информационной грамотности, куда попадают ~37% всех студентов. В целом, на этом уровне компетентности респондент способен самостоятельно решать чётко поставленные задачи и производить простой анализ данных.
При этом, студенты вузов Astana IT, NU, SDU и IITU лидируют по результатам тестирования и набирают в среднем от 38 до 42 баллов.
При этом, студенты вузов Astana IT, NU, SDU и IITU лидируют по результатам тестирования и набирают в среднем от 38 до 42 баллов.