Исходный размер 1472x1840

Проект по анализу данных: Фильмы и сериалы Netflix

Вводная часть

Я очень люблю смотреть фильмы и сериалы. Netflix для меня — как огромная видеотека, где всегда есть что посмотреть. Мне стало интересно: а что вообще есть в этой библиотеке? Откуда берутся все эти фильмы и сериалы? Какие жанры самые популярные? Из каких стран приходит больше всего контента?

Я решила изучить эти данные, чтобы понять:

  1. Как менялся Netflix за последние годы
  2. Что чаще добавляют — фильмы или сериалы
  3. Из каких стран приходят самые интересные проекты
  4. В какое время года выходит больше всего новинок

Типы графиков:

Типы графиков

  1. Гистограмма — распределение контента по годам добавления
  2. Линейный график — динамика добавления контента по месяцам
  3. Круговая диаграмма — распределение по типам (фильмы/сериалы)
  4. Горизонтальная гистограмма — топ-10 стран производства
  5. Тепловая карта — активность добавления контента по годам и месяцам

Этапы работы:

post

Ключевые технологии: Pandas — работа с таблицами Matplotlib — создание графиков Seaborn — улучшение графиков NumPy — математические операции KaggleHub — загрузка данных, импортируем отдельным кодом с проверкой данных

post

Цветовая схема: Основной: красный Netflix (#E50914) Акценты: синий, мятный, оранжевый Текст: чёрный (#221F1F) Фон: белый и светло-серый

Также сделала удобный формат просмотра, чтобы графики показывались один за другим. После каждого графика нужно нажать Enter для продолжения. Код каждого графика достаточно объёмный, так как я добавляла оформление букв с цифрами в официальном формате Netflix, с приятной визуализацией в виде кода

Исходный размер 2560x1294

Распределение контента Netflix по годам добавления. График построен с 2008 по 2021 год. Гистограмма

Исходный размер 2560x1260

Динамика добавления контента Netflix по месяцам. Линейный график Самый активный: Июль Самый тихий: Февраль Среднее в месяц: 726

Исходный размер 1734x1832

Распределение контента Netflix по типам. Круговая диаграмма Из 8709 записей мы видим, что преобладают фильмы (70,4%), остальные 29,6% — сериалы

Исходный размер 2560x1634

Топ-10 стран по производству контента Netflix. Горизонтальная гистограмма Большее количество вкладывают USA, India и UK

Исходный размер 2532x1562

Активность добавления контента Netflix по годам и месяцам. Тепловая карта Всего 8709, из них пиковый месяц был июль 2021- 257 записей

Для работы использовался ИИ Claude AI. Модель: Claude-3 Opus Платформа: https://claude.ai

Как я применяла ИИ:

  1. Генерация идей по цветовым палитрам — получение рекомендаций по сочетанию цветов, основанных на брендинге Netflix
  2. Оптимизация кода визуализации — помощь в создании более эффективного кода для matplotlib
  3. Советы по композиции графиков — рекомендации по расположению элементов для лучшей читаемости
  4. Статистический анализ — помощь в выборе подходящих статистических методов

Один из промптов, использованных в работе:

«Мне нужно создать визуализацию данных Netflix с фирменной цветовой палитрой. Основной цвет — Netflix red (#E50914). Предложите гармоничную палитру из 5-8 цветов, которая будет хорошо смотреться вместе с основным красным. Также дайте рекомендации по применению этих цветов в разных типах графиков.»

Рекомендованная палитра для Netflix:

  1. #E50914 — основной красный (для акцентов)
  2. #B81D24 — темно-красный (для вторичных элементов)
  3. #221F1F — черный (для текста)
  4. #F5F5F1 — светлый (для фона)
  5. #FF6B6B — кораллово-красный
  6. #118AB2 — синий океана (для контраста)

Применение: — Основной красный: заголовки, важные линии на графиках — Темно-красный: заполнение столбцов гистограмм — Светлый: фон графиков — Синий: для дополнительных линий на графиках

Главные выводы с проекта:

Мы просто взяли данные о фильмах и сериалах Netflix и посмотрели на них под разными углами. Получилась целая история: как платформа росла, что выходит чаще — фильмы или сериалы, из каких стран приходит больше всего контента.

Теперь я могу сделать так же с любыми другими данными. Захочу разобраться с трендами в музыке, игровой индустрии или бизнесе — схема одна и та же. Найти данные, почистить их, построить графики и сделать выводы. Это полезный скилл.

Мы превратили скучные таблицы в понятные графики и истории. И главное — научились этому процессу. Теперь я могу повторить это с любой другой темой, которая меня заинтересует.

Проект по анализу данных: Фильмы и сериалы Netflix
Проект создан 14.01.2026
Загрузка...