
введение
В рамках анализа данных я выбрала тему «Чемпионат мира по футболу 2022: что предсказывает успех команды». Для исследования были использованы открытые статистические данные по матчам и сборным чемпионата мира 2022 года, приведённые в табличный формат и обработанные в Python с помощью библиотеки Pandas.
Мне было интересно проанализировать именно эти данные, потому что они отражают как контроль игры (владение мячом, передачи), так и эффективность атакующих действий (удары, реализация, точность). Часто считается, что доминирование по владению автоматически ведёт к победе, однако чемпионат мира — хороший пример того, что это не всегда так. Поэтому данные имеют ценность, так как позволяют проверить, какие игровые показатели действительно связаны с успехом команды, а какие — переоценены.
палитра
В работе была использована ограниченная цветовая палитра, вдохновлённая визуальной айдентикой Чемпионата мира по футболу 2022.

Тёмно-бордовый цвет #24000C используется как фон графиков и создаёт глубокую, сосредоточенную атмосферу.

Светлый розово-алый оттенок #A20F39 выступает в роли основного акцента, выделяя ключевые элементы и тренды.

Более тёмный розово-алый цвет #730626 применяется как вторичный акцент для дополнительных визуальных уровней.

Белый цвет #FFFFFF используется для текста и линий, обеспечивая высокую читаемость и контраст.
В качестве шрифта был выбран DejaVu Sans. Это нейтральный гротеск, хорошо подходящий для аналитических визуализаций: он легко читается, не отвлекает от данных и корректно отображает числовые значения и подписи на графиках. Использование DejaVu Sans помогает сохранить визуальную строгость и ясность подачи информации.
этапы работы
На этом этапе была задана единая визуальная идентичность визуализаций: определена цветовая палитра, вдохновлённая айдентикой ЧМ-2022, установлен шрифт DejaVu Sans и настроены параметры отображения графиков (фон, сетка, подписи, цвета осей и текста). Это позволило обеспечить визуальную целостность, высокий контраст и хорошую читаемость всех графиков.
На этом этапе датасет чемпионата мира 2022 был загружен из CSV-файла в среду Python с помощью Pandas. После загрузки была выполнена первичная проверка структуры данных и типов переменных для дальнейшего анализа.
график 01. pearson heat map correlation
Данный график используется для того, чтобы наглядно показать, какие игровые показатели статистически связаны с победой команды. Тепловая карта позволяет быстро сравнить силу и направление корреляций между показателями и результатом матча. Это помогает выявить метрики, которые потенциально сильнее всего предсказывают успех, и отделить действительно значимые факторы от второстепенных.
график 02. boxen plot
Этот график используется для сравнения распределения доли владения мячом у победивших команд и остальных. Boxen plot позволяет увидеть не только средние значения, но и форму распределения, разброс и перекрытие показателей между группами. Это помогает понять, является ли владение мячом устойчивым фактором успеха или его влияние неоднозначно.
график 03. scatter plot with trend
Этот график используется для визуальной проверки связи между количеством ударов в створ и числом забитых голов. Линия тренда позволяет увидеть направление и силу зависимости и понять, насколько качество ударов действительно конвертируется в результат.
график 04. logistic regression
Этот график используется для оценки того, какие статистические показатели сильнее всего влияют на вероятность победы. Он позволяет сравнить вклад разных метрик и понять, какие факторы повышают или, наоборот, снижают вероятность успеха команды.
график 05. multinomial check
Этот график используется для анализа того, какие игровые показатели влияют не только на победу, но и на количество набранных очков (поражение, ничья, победа). Он позволяет сравнить вклад факторов для разных исходов матча и понять, какие метрики повышают вероятность набора максимальных очков.
вывод
Проведённый анализ данных чемпионата мира по футболу 2022 года показал, что успех команды определяется не столько общим контролем игры, сколько качеством и эффективностью действий.
Pearson heatmap correlation и boxen plot продемонстрировали, что владение мячом само по себе слабо связано с победой и может сопровождаться активными атаками соперника. В то же время показатели, отражающие качество атак — удары в створ и их точность — имеют более устойчивую связь с результатом.
Scatter plot с линией тренда подтвердил, что увеличение количества качественных ударов действительно приводит к росту числа забитых голов. logistic regression показала, что наибольший вклад в вероятность победы вносят точность ударов и реализация моментов, тогда как высокий процент владения мячом не гарантирует положительного исхода. multinomial check (0–1–3 очка) дополнительно подтвердила, что эффективность атак и точность передач чаще связаны с набором максимального количества очков, чем доминирование по владению.
Таким образом, результаты анализа позволяют сделать вывод, что на чемпионате мира 2022 ключевым фактором успеха стала не сама по себе активность или контроль мяча, а способность команды превращать игровые моменты в результат.
датасет и код