В репозитории хранятся работы связанные с анализом данных и машинным обучением. В столбце "Название проекта" присутствует ссылка на проект, выделенная синим цветом. Приятного просмотра!
Номер работы | Название проекта | Описание проекта | Используемые технологии |
1 | Исследование тарифов телеком компании | Компания федерального оператора связи поручила исследовать поведение абонентов, изучить кто наши клиенты, откуда они, каким тарифом пользуются, сколько звонков и сообщений каждый отправил за 2018 год, для того чтобы понять какой тариф больше принесет прибыли при запуске маркетинговой кампании. | pandas, matplotlib, numpy, API Yandex.Геокодер, folium, requests, pymorphy2, scipy, pylab, statsmodels |
2 | Предсказание выдачи права доступа сотруднику | Необходимо создать алгоритм, способный учиться на предоставленных данных, прогнозировать одобрение или отказ в доступе того или иного сотрудника | CatBoost, sklearn, phik, pandas, numpy |
3 | Анализ игровой индустрии | Из открытых источников доступны исторические данные о продажах игр, оценки пользователей и экспертов, жанры и платформы. Нужно выявить определяющие успешность игры закономерности. Для данной работы были использованы парсеры Parsing-ratings-ESRB, Parsing-Metacritic. Также был сделан дашборд Tableau по этим данным. | CatBoost, seaborn, shap, matplotlib, pandas, numpy |
4 | Предсказание цены на дома | Необходимо предсказать цену домов, которые находятся в США в штате Айова. Датасет имеет 79 независимых переменных, описывающие практически каждую деталь дома. Особенность данного проекта - является заполнение пропущенных данных с помощью ML классификации | CatBoost, hyperopt, sklearn, phik, seaborn, matplotlib, pandas, numpy |
5 | A/B тест дизайна вебсайта | На протяжении пару недель протестировали несколько лендингов. Необходимо определить конверсию для каждой из 4 групп. Выявить является ли это изменение статистическим значимым. Дать рекомендации по каждому из лендингов | pandas, numpy, seaborn, matplotlib, scipy, scikit_posthocs |
6 | Анализ продаж | Необходимо проанализировать продажи магазина запчастей для мотоциклов и ответить на вопросы:
|
pandas, numpy, seaborn, matplotlib |
7 | Предсказание психотипов | В данном репозитории представлены две прогностические модели для определения психотипа по методике MBTI. Задачей проекта явялется определение оптимальной модели для использования ее в проекте телеграмм бота Psychotype_Bot | pandas, numpy, seaborn, matplotlib, sklearn, catboost, hyperopt, hvplot |
8 | Analysis_Retail_Store | Проект представляет собой когортный анализ продуктовый метрик Retention и LTV. В процессе работы был построен RFM анализ и проанализирована его предсказательная мощность. В завершение проекта была создана предсказательная модель LTV | pandas, numpy, seaborn, matplotlib, sklearn, plotly, scikitplot, xgboost |