Автор: Stepik
Название: Машинное обучение - Подготовка данных (Модуль 1) (2024)
Описание
Данный курс является первым модулем из серии моих курсов по машинному обучению (ML). В этом курсе в качестве задачи будет рассматриваться прогнозирование в футбольной аналитике. Мы сосредоточимся на сборе данных, которые будут использоваться для прогнозирования в следующих модулях. Помимо сбора данных, мы также применим некоторые техники предобработки данных.
Программа курса
1. Введение
О курсе
Среда разработки
2. Сбор данных с использованием парсинга
Выбор источника данных
Выбор метода парсинга
Определение целевых данных
Разработка скрипта парсинга
Библиотека прасинга датасета
3. Обзор данных
Обзор датасета
Библиотеки для анализа данных
4. Очистка данных
Важность и цель очистки данных.
Устранение дубликатов
Методы заполнения пропущенных данных.
Целевая переменная
Входные параметры
5. Валидация данных
Проверка качества данных после очистки и обработки
Проверка точност на моделях
Анализ важности признаков
6. Кластерный анализ
Понижение размерности
Кластерный анализ
Добавление новых параметров
Оценка качества модели после применения кластеризации
7. Нормализация и стандартизация данных
Приведение данных к единообразному формату.
Преобразование категориальных признаков.
Оценка качества модели после нормализации модели
8. Балансировка данных
Статистический анализ
Балансировка данных
Автор: Алексей Кожакин
Мне очень нравится помогать ученикам, изучающим Python, разбираться в сложных моментах и показывать наилучший путь изучения программирования, чтобы они могли стать успешными разработчиками.
Название: Машинное обучение - Подготовка данных (Модуль 1) (2024)
Описание
Данный курс является первым модулем из серии моих курсов по машинному обучению (ML). В этом курсе в качестве задачи будет рассматриваться прогнозирование в футбольной аналитике. Мы сосредоточимся на сборе данных, которые будут использоваться для прогнозирования в следующих модулях. Помимо сбора данных, мы также применим некоторые техники предобработки данных.
Программа курса
1. Введение
О курсе
Среда разработки
2. Сбор данных с использованием парсинга
Выбор источника данных
Выбор метода парсинга
Определение целевых данных
Разработка скрипта парсинга
Библиотека прасинга датасета
3. Обзор данных
Обзор датасета
Библиотеки для анализа данных
4. Очистка данных
Важность и цель очистки данных.
Устранение дубликатов
Методы заполнения пропущенных данных.
Целевая переменная
Входные параметры
5. Валидация данных
Проверка качества данных после очистки и обработки
Проверка точност на моделях
Анализ важности признаков
6. Кластерный анализ
Понижение размерности
Кластерный анализ
Добавление новых параметров
Оценка качества модели после применения кластеризации
7. Нормализация и стандартизация данных
Приведение данных к единообразному формату.
Преобразование категориальных признаков.
Оценка качества модели после нормализации модели
8. Балансировка данных
Статистический анализ
Балансировка данных
Автор: Алексей Кожакин
Мне очень нравится помогать ученикам, изучающим Python, разбираться в сложных моментах и показывать наилучший путь изучения программирования, чтобы они могли стать успешными разработчиками.
Cкрытый контент, нужно авторизируйся или присоединяйся.
Cкрытый контент, нужно авторизируйся или присоединяйся.
Возможно, Вас ещё заинтересует:
- [Анна Вичугова, Зоя Степчева] Проектирование сложных API - OpenAPI + AsyncAPI
- [Арина Веспер, Vesperfin] VesperfinCode: поддержка (5-й поток) (2025)
- [Stepik] MongoDB для начинающих: от основ до администрирования баз данных (2025)
- [Stepik] Свой веб-сайт и telegram-бот в облаке — настрой и запусти сам (2025)
- [Vesperfin, Арина Веспер] VesperfinCode: поддержка (4й поток) (2025)
- [EC-Council] CEH v13. Этичный хакинг и тестирование на проникновение. Часть 1
- [EC-Council] CEH v13. Этичный хакинг и тестирование на проникновение. Часть 2
- [EC-Council] CEH v13. Этичный хакинг и тестирование на проникновение. Часть 3
- [Stepik] Продвинутый python - заряди свои батарейки
- [Филипп Игнатенко] [merion academy] DevOps-инженер с нуля (2025)
- [Яндекс.Практикум] Python‑разработчик буткемп (2025)
- [Алексей Черемных] Администрирование ViPNet-сетей
- [deworker.pro] Стрим про безопасность web-приложений
- [Дмитрий Чернов] AL-1724VR Установка и управление виртуализацией в ОС Astra Linux Special Edition 1.7
- [HTB Academy] Сертифицированный специалист по тестированию на проникновение Hack The Box (часть 2)
- [Step Up] Разработчик чат-ботов. Уровень Мастер
- [PurpleSchool] Golang - Templ Fiber HTMX (2025)
- [Ильяс Низамутдинов] Программная работа с СКД (2025)
- [Stepik] Запросы в 1С - Углубленное изучение языка запросов
- [Micro courses] Zod - максимально полный курс