Skip to content

Представлены основные работы связанные с анализом данных и машинным обучением

Notifications You must be signed in to change notification settings

Playmen998/Data_Analysis

Repository files navigation

Мои рабочие проекты

В репозитории хранятся работы связанные с анализом данных и машинным обучением. В столбце "Название проекта" присутствует ссылка на проект, выделенная синим цветом. Приятного просмотра!

Описание всех проектов:

Номер работы Название проекта Описание проекта Используемые технологии
1 Исследование тарифов телеком компании Компания федерального оператора связи поручила исследовать поведение абонентов, изучить кто наши клиенты, откуда они, каким тарифом пользуются, сколько звонков и сообщений каждый отправил за 2018 год, для того чтобы понять какой тариф больше принесет прибыли при запуске маркетинговой кампании. pandas, matplotlib, numpy, API Yandex.Геокодер, folium, requests, pymorphy2, scipy, pylab, statsmodels
2 Предсказание выдачи права доступа сотруднику Необходимо создать алгоритм, способный учиться на предоставленных данных, прогнозировать одобрение или отказ в доступе того или иного сотрудника CatBoost, sklearn, phik, pandas, numpy
3 Анализ игровой индустрии Из открытых источников доступны исторические данные о продажах игр, оценки пользователей и экспертов, жанры и платформы. Нужно выявить определяющие успешность игры закономерности. Для данной работы были использованы парсеры Parsing-ratings-ESRB, Parsing-Metacritic. Также был сделан дашборд Tableau по этим данным. CatBoost, seaborn, shap, matplotlib, pandas, numpy
4 Предсказание цены на дома Необходимо предсказать цену домов, которые находятся в США в штате Айова. Датасет имеет 79 независимых переменных, описывающие практически каждую деталь дома. Особенность данного проекта - является заполнение пропущенных данных с помощью ML классификации CatBoost, hyperopt, sklearn, phik, seaborn, matplotlib, pandas, numpy
5 A/B тест дизайна вебсайта На протяжении пару недель протестировали несколько лендингов. Необходимо определить конверсию для каждой из 4 групп. Выявить является ли это изменение статистическим значимым. Дать рекомендации по каждому из лендингов pandas, numpy, seaborn, matplotlib, scipy, scikit_posthocs
6 Анализ продаж Необходимо проанализировать продажи магазина запчастей для мотоциклов и ответить на вопросы:
  • Каков общий объем продаж для каждого способа оплаты? + визуализация
  • Какова средняя цена за единицу каждой линейки продуктов? + визуализация
  • Провести дальнейшее исследование (например, средняя стоимость покупки по типу клиента и т.д.)
  • Подвести итоги
pandas, numpy, seaborn, matplotlib
7 Предсказание психотипов В данном репозитории представлены две прогностические модели для определения психотипа по методике MBTI. Задачей проекта явялется определение оптимальной модели для использования ее в проекте телеграмм бота Psychotype_Bot pandas, numpy, seaborn, matplotlib, sklearn, catboost, hyperopt, hvplot
8 Analysis_Retail_Store Проект представляет собой когортный анализ продуктовый метрик Retention и LTV. В процессе работы был построен RFM анализ и проанализирована его предсказательная мощность. В завершение проекта была создана предсказательная модель LTV pandas, numpy, seaborn, matplotlib, sklearn, plotly, scikitplot, xgboost


About

Представлены основные работы связанные с анализом данных и машинным обучением

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published