Машинное обучение — это область искусственного интеллекта, которая позволяет компьютерам обучаться на основе данных, без явного программирования. Она используется в различных сферах, таких как медицина, финансы, производство и многое другое. В современном мире машинное обучение является одной из наиболее востребованных и перспективных профессий.
На курсах машинного обучения можно научиться различным методам машинного обучения, таким как регрессия, классификация, кластеризация и т.д. Вы познакомитесь с основами Python, которая является одним из наиболее популярных языков программирования для машинного обучения. Также вы научитесь работать с библиотеками машинного обучения, такими как NumPy, Pandas, Scikit-learn и TensorFlow.
Кроме того, на курсах машинного обучения вы сможете попрактиковаться в работе с реальными данными и задачами, научитесь выбирать подходящие модели и оценивать их качество, а также поймете, как применять машинное обучение для решения различных задач.
1 место. Курс «Machine Learning с нуля до Junior от Skillbox»
Цена: 124 199 ₽ или рассрочка – 5 645 ₽ / мес
Ссылка на сайт: https://skillbox.ru/course/paket-machine-learning-0-junior/
За год подготовитесь к работе ML-инженером: получите необходимую математическую подготовку, освоите Python, научитесь работать с данными и создадите свои первые модели машинного обучения.
- Через 6 месяцев можно устроиться на стажировку
- Авторы курса – эксперты из Сбера, ЮMoney, Visa
- 2 итоговых проекта в портфолио
- Обновили курс в 2021 году.
Специалист по Machine Learning, или ML-инженер анализирует большие объёмы информации, создаёт модели для прогнозирования в бизнесе, медицине, промышленности.
Задача ML-инженера — обучать нейросети, проектировать аналитические системы и рекомендательные сервисы на основе алгоритмов машинного обучения.
Кому подойдёт этот курс:
- Новичкам
С нуля освоите Python, SQL, научитесь собирать и анализировать данные, получите необходимый теоретический минимум по математике, теории вероятности и статистике. Решите задачи на основе реальных кейсов и добавите проекты в портфолио. Через год сможете начать работать по профессии. - Программистам
Подтянете математику, статистику, аналитическое и алгоритмическое мышление, научитесь выявлять потребности бизнеса. Получите опыт работы с моделями машинного обучения, будете применять Python для решения задач с данными. Пройдёте процесс от сбора данных до деплоя модели. - Аналитикам, которые хотят перейти в Machine Learning
Изучите Python на более высоком уровне, освоите работу с полезными библиотеками. Будете применять методы машинного обучения в работе. Отшлифуете знания и сможете сменить вектор профессионального развития.
Чему вы научитесь:
- Аналитически мыслить
Научитесь самостоятельно разрабатывать план решения проблемы, выдвигать и проверять гипотезы, интерпретировать результаты и представлять их руководству. - Работать с инструментами анализа данных
Узнаете, как проводить разведочный анализ данных, и освоите Excel для аналитики. Научитесь визуализировать данные в Power BI и программировать на Python и SQL. - Строить ML-модели
Освоите алгоритмы машинного обучения с учителем и без. Научитесь решать задачи регрессии, классификации и кластеризации. Построите свои первые модели. - Извлекать данные из различных источников
Поймёте, как читать данные различных форматов при помощи Python и SQL. Научитесь писать запросы к API, получать, очищать и сохранять данные в разных форматах. - Настраивать инфраструктуру
Познакомитесь с пайплайнами работы модели: от сборки данных до мониторинга результатов. - Работать в Git
Будете создавать репозитории и отслеживать изменения в коде, подготовитесь к командной работе в проекте.
Содержание курсов:
Вас ждут 82 тематических модуля и практика на основе реальных кейсов.
80 практических работ, 2 итоговых проекта
Первый уровень: базовая подготовка
Среднее время прохождения — 6 месяцев.
- Введение в Data Science
Познакомитесь с основными направлениями Data Science, узнаете, какие задачи решают дата-аналитики, дата-инженеры и специалисты по машинному обучению.
Пройдёте все этапы работы с данными. Научитесь выявлять проблемы, собирать бизнес-требования. Будете выгружать данные из различных источников, проводить разведочный анализ и готовить датасет к дальнейшему использованию. Обучите и внедрите готовую ML-модель, попробуете себя в роли продуктового и маркетингового аналитика. Узнаете, как формулировать и проверять гипотезы. Освоите базовые инструменты для работы: Python, SQL, Excel, Power Bi, Airflow. - Основы статистики и теории вероятностей
Поймёте принципы работы со случайными величинами и событиями. Познакомитесь с некоторыми видами распределений и статистическими тестами, которые пригодятся при составлении моделей и проверке гипотез. - Основы математики для Data Science
Получите базовые знания по математике для работы с машинным обучением. Поймёте, что такое аппроксимация, интерполяция, функции, регрессии, матрицы и векторы. Научитесь работать с математическими сущностями в Python-библиотеке SymPy. - Возможность стажировки
Базовых знаний и навыков хватит, чтобы устроиться на стажировку — сможете продолжить учиться на курсе и в компании одновременно.
Второй уровень: погружение в Machine Learning
Среднее время прохождения — 6 месяцев.
- Machine Learning. Junior
Познакомитесь с алгоритмами машинного обучения для решения задач регрессии, классификации и кластеризации. Построите и обучите свою первую нейронную сеть. Научитесь подбирать параметры модели, оценивать качество и улучшать её, а также выводить результат в Production.
Итоговые проекты
После прохождения первого уровня — подготовите вводный проект. В конце курса примете участие в соревновании на платформе Kaggle.
- Введение в Data Science
Закрепите новые знания на индивидуальном проекте — пройдёте путь от загрузки данных до внедрения модели. Решите задачи дата-инженера, ML-инженера и дата-аналитика, чтобы определиться со специализацией. - Machine Learning
Соревнование в Самостоятельно построите модель для решения задачи. Проведёте сбор и разведочный анализ данных, выберете ML-алгоритм и обучите свою модель, оцените её качество и поработаете над улучшениями.
Бонусные курсы
- Карьера разработчика: трудоустройство и развитие
Узнаете, как выбрать подходящую вакансию, подготовиться к собеседованию и вести переговоры с работодателем. Сможете быстрее получить должность, которая соответствует вашим ожиданиям и умениям. - Система контроля версий Git
Научитесь версионировать изменения в коде, создавать и управлять репозиториями, ветками, разрешать конфликты версий. Узнаете полезные правила работы с Git. - Английский для IT-специалистов
Получите языковые навыки, которые помогут пройти собеседование в иностранную компанию и комфортно общаться в смешанных командах.
Спикеры:
Юлдуз Фаттахова
Автор курса Machine Learning. Senior Data Scientist, Team Lead в SberData, Сбер. 5+ лет в профессии
Владимир Ершов
Автор курса Machine Learning, Data Solutions Manager, VISA. В Data Science больше 7 лет
Вячеслав Архипов
Автор курса «Статистика и теория вероятностей». Математик, Banuba development. В Data Science больше 7 лет
Николай Герасименко
Data Scientist в Сбербанке, математик в ВЦ РАН. Блок «Основы математики для Data Science». Опыт преподавания высшей математики более 4 лет
Пётр Емельянов
Спикер курса, R&D Director, UBIC Tech. Более 15 лет опыта в разработке.
Отзывы об обучении в Skillbox доступны на сайте.
2 место. Курс «Machine Learning от SkillFactory»
Цена: 36 900 ₽
Ссылка на сайт: https://skillfactory.ru/machine-learning
- Формат: онлайн.
- Длительность – 12 недель.
Совместно с профи из российских Data Science компаний мы разработали курс Machine Learning, ориентированный на практику.
Вы изучите принципы математических алгоритмов, современные библиотеки, feature engineering и оценку моделей. В конце обучения на курсе примените все изученные методы на финальном проекте и сможете собрать Git-репозиторий с решенными кейсами.
Курс подойдет вам, если вы:
- Новичок
Вы начинающий Data Scientist, уверенно владеете Python, разбираетесь в математике и статистике. Вы сможете систематизировать и углубить полученные самостоятельно или на бесплатных курсах знания, пообщаться с профессионалами, применить модели Machine Learning на практике. - Программист
Вы программируете на Python и столкнулись с задачами машинного обучения в работе. На курсе вы освоите основные алгоритмы машинного обучения, обучите рекомендательную систему и на финальном хакатоне примените все полученные навыки Machine Learning на практике. - Аналитик
Вы аналитик со знанием Python, оперируете большим объемом данных и хотите погрузиться в Machine Learning. На курсе вы узнаете, какие задачи решает машинное обучение, примените основные методы предобработки данных, научитесь валидировать данные и оценивать качество алгоритмов.
Курс включает в себя 10 модулей, более 500 упражнений на закрепление материала, обучение 10 алгоритмов машинного обучения, 2 хакатона на kaggle, чат с сообществом и поддержку менторов.
Преподаватели и авторы:
- Эмиль Магеррамов
COO Data Lab, компания EORA - Антон Киселев
Head of R&D, компания EORA - Веренцов Сергей
CTO, компания EORA - Эмиль Богомолов
Инженер-исследователь в группе ADASE Сколтех.
Программа курса:
- Введение в машинное обучение
— Знакомимся с основными задачами и методами Machine Learning, изучаем практические кейсы и применяем базовый алгоритм работы над ML-проектом
— Решаем 50+ задач на закрепление темы. - Методы предобработки данных
— Изучаем типы данных, учимся очищать и обогащать данные, используем визуализацию для предобработки и осваиваем feature engineering
— Решаем 60+ задач на закрепление темы - Регрессия
— Изучаем типы данных, учимся очищать и обогащать данные, осваиваем линейную и логистическую регрессию, изучаем границы применимости, аналитический вывод и регуляризацию
— Обучаем модели регрессии
— Решаем 40+ задач на закрепление темы. - Кластеризация
— Осваиваем обучение без учителя, практикуемся в его различных методах, работаем с текстами средствами ML
— Решаем 50+ задач на закрепление темы. - Tree-based алгоритмы: введение в деревья
— Знакомимся с решающими деревьями и их свойствами, осваиваем деревья из библиотеки sklearn и используем деревья для решения задачи регрессии
— Решаем 40+ задач на закрепление темы. - Tree-based алгоритмы: ансамбли
— Изучаем особенности ансамблей деревьев, практикуемся в бустинге, используем ансамбль для построения логистической регрессии
— Решаем 40+ задач на закрепление темы
— Участвуем в соревновании на kaggle по обучению tree-based модели - Оценка качества алгоритмов
— Изучаем принципы разбиения выборки, недо- и переобучение, оцениваем модели по различным метрикам качества, учимся визуализировать процесс обучения
— Оцениваем качество нескольких моделей ML
— Решаем 40+ задач на закрепление темы - Временные ряды в машинном обучении
— Знакомимся с анализом временных рядов в ML, осваиваем линейные модели и XGBoost, изучаем принципы кросс-валидации и подбора параметров
— Решаем 50+ задач на закрепление темы. - Рекомендательные системы
— Изучаем методы построения рекомендательных систем, осваиваем SVD-алгоритм, оцениваем качество рекомендаций обученной модели
— Решаем 50+ задач на закрепление темы. - Финальный хакатон
— Применяем все изученные методы для получения максимальной точности предсказаний модели на kaggle.
3 место. Курс «Факультет Искусственного интеллекта от GeekBrains»
Цена: Рассрочка до 36 месяцев – от 4 823 ₽ / мес
Ссылка на сайт: https://gb.ru/geek_university/data-science
Получите одну из самых востребованных IT-профессий. Машинное обучение от профессиональных преподавателей.
- 18 месяцев, 2 занятия в неделю
- Диплом, 14 работ в портфолио
- Трудоустройство после обучения.
За два года спрос на Data Scientist-ов вырос в два раза, по данным HeadHunter. Применяя методы машинного обучения, они строят прогнозы и повышают эффективность бизнес-процессов в любой отрасли. Мы поможем стать таким специалистом с нуля и найдем вам работу.
Вас будут обучать топовые эксперты
- Сергей Ширкин
Data Scientist в Dentsu Aegis Network Russia, декан факультета
Применял технологии машинного обучения и искусственного интеллекта в Сбербанке и Росбанке, компаниях Equifax и Dentsu Aegis Network Russia. - Дмитрий Коробченко
Deep Learning R&D инженер и руководитель направления в NVIDIA
Эксперт в области нейронных сетей и машинного обучения, спикер на образовательных и научно-популярных мероприятиях. Опыт в Deep Learning – с 2012 года. Закончил ВМиК МГУ. Ранее работал в исследовательском центре Samsung. - Алексей Петренко
Python Developer, фрилансер
Разрабатывает IT-решения по автоматизации процессов учёта наличия и движения людей и технических средств для Министерства обороны РФ. За 20 лет в IT писал программы на более чем 30 языках программирования.
И др.
Программа обучения:
380 часов обучающего контента и практики, 14 проектов в портфолио, 2 вебинара в неделю.
- Подготовительный блок
Их необязательно проходить, но они помогут лучше погрузиться в обучение.
- Видеокурс: как учиться эффективно
- Основы математики
- Основы программирования
- Основы языка Python
- Базовый курс.
- Программирование
Научитесь работать в Linux и создавать сервера в облачных сервисах AWS, проводить поиск информации и основные операции с файлами, выполнять мониторинг работы сервера. Научитесь использовать язык запросов SQL, создавать и оптимизировать сложные запросы. Освоите библиотеки языка Python, предназначенные для Data Science: Numpy, Pandas, Matplotlib, SciKit-Learn.
- Встреча декана со студентами
- Основы языка Python
- Рабочая станция
- Основы реляционных баз данных и MySQL
- Библиотеки Python для Data Science: Numpy, Matplotlib, Scikit-learn
- Проект – предсказание цен на недвижимость.
- Сбор данных и статистическое исследование
Познакомитесь с теорией вероятностей и математической статистикой. Изучите методы проведения корреляционного, дисперсионного и регрессионного анализа. Научитесь работать с RESTful/SOAP-сервисами, форматами XML и JSON в Python, а также познакомитесь с особенностями открытых данных (OpenData).
- Библиотеки Python для Data Science: продолжение
- Методы сбора и обработки данных из сети Интернет
- Введение в математический анализ
- Теория вероятностей и математической статистике
- Проект:
– Сбор информации по заданным критериям
– Разведочный анализ данных (EDA) на основе полученной информации.
- Математика для Data Scientist
Рассмотрите математические аспекты алгоритмов, применяемых в Data Science: линейная и логистическая регрессия, градиентный спуск, метод ближайших соседей, кластеризация, деревья решений, случайный лес, градиентный бустинг. Поймете, как устроены алгоритмы на уровне математики.
- Линейная алгебра
- Алгоритмы анализа данных
- Проект – построение модели кредитного скоринга для банка.
- Машинное обучение
Освоите Python: от основ программирования до автоматизации, сбора, обработки, анализа и визуализации данных.
- Машинное обучение в бизнесе
- Рекомендательные системы
- Видеокурс от Мегафон + курсовой проект
- Проекты:
– Рекомендательная система для интернет-магазина
– Прогнозирование оттока абонентов
– Алгоритм для определения вероятности подключения услуги.
- Нейронные сети
Научитесь решать задачи Machne Learning с данными из соцсетей, геоданными, применением графов, а также познакомитесь с нейронными сетями. На практике познакомитесь с фреймворками для разработки нейронных сетей: Tensorflow, Keras, PyTorch.
- Введение в нейронные сети
- Фреймворк PyTorch для разработки искусственных нейронных сетей
- Проекты:
– Распознавание и классификация изображений
– Приложение, которое анализирует объекты на камере.
- Задачи искусственного интеллекта
Изучите продвинутые архитектуры сверточных нейронных сетей, обработку естественного языка и компьютерное зрение.
- Введение в обработку естественного языка
- Глубокое обучение в компьютерном зрении от NVIDIA
- Проекты:
– Чат-бот на основе искусственного интеллекта, который может общаться на любые темы
– 8 мини проектов по компьютерному зрению.
- Предметы с индивидуальным выбором даты старта
Вы можете формировать часть расписания самостоятельно и регулировать интенсивность обучения.
- Подготовка к поиску работы
- История развития искусственного интеллекта
- Алгоритмы и структуры данных на Python
- Введение в высшую математику
- Спортивный анализ данных. Платформа Kaggle
- Язык R для анализа данных
- Визуализация данных в Tableau
- Сверточные нейронные сети в компьютерном зрении
- Проекты – соревнование на площадке Kaggle.
Курс «Machine Learning. Advanced от OTUS»
Цена: нет информации
Ссылка на сайт: https://otus.ru/lessons/advanced-ml/
Продвинутые приемы и кейсы для практикующих Data Scientist-ов, желающих повысить свой профессиональный уровень до Middle/Senior.
- Длительность обучения: 5 месяцев, 4 ак. часа в нед.
Вы освоите продвинутые приемы машинного обучения, которые позволят вам уверенно себя чувствовать на ведущих Middle/ Senior позициях и справляться даже с нестандартными задачами. Вы расширите свой набор доступных для работы инструментов. При этом даже для таких тем, как Байесовские методы и обучение с подкреплением, которые обычно преподаются исключительно в виде теории, мы подобрали реальные рабочие кейсы из наших практик.
Отдельный модуль посвящен работе в production: настройке окружения, оптимизации кода, построению end-to-end пайплайнов и внедрению решений.
Для кого этот курс?
Для аналитиков, программистов и дата сайентистов, практикующих машинное обучение. Курс поможет расширить свои возможности и продвинуться дальше по карьерному пути.
После прохождения курса вы сможете:
- Настраивать окружение и писать production код, готовый к внедрению
- Работать с AutoML подходами и понимать ограничения в их применении
- Понимать и уметь применять Байесовские методы и обучение с подкреплением для соответствующих задач
- Решать нестандартные проблемы, возникающие в рекомендательных системах, временных рядах и графах.
Программа курса:
- Advanced Machine Learning. AutoML
- Production Code проекта на примере задачи классификации/регрессии, Virtual environments, dependency management, pypi/gemfury
- Практическое занятие – Оптимизация кода, parallelization, multiprocessing, ускорение pandas, Modin для Pandas
- Advanced Data Preprocessing. Categorical Encodings
- Встреча с руководителем курса (Дополнительное занятие)
- Featuretools – а вы что, за меня и признаки придумывать будете?
- H2O и TPOT – а вы что, за меня и модели строить будете?
- Поиск нечетких дублей (Дополнительное занятие).
- Production
- Практическое занятие – Построение end-to-end пайплайнов и сериализация моделей
- REST-архитектура: Flask API
- Docker: Структура, применение, деплой
- Kubernetes, контейнерная оркестрация.
- Временные ряды
- Извлечение признаков. Fourier и Wavelet transformation, Automatic Feature generation – tsfresh
- Unsupervised подходы: Кластеризация временных рядов
- Unsupervised подходы: Сегментация временных рядов
- Практическое занятие по работе в проде: деплой докера в AWS.
- Рекомендательные системы. Задача ранжирования
- Рекомендательные системы 1. Explicit feedback
- Рекомендательные системы 2. Implicit feedback
- Задача ранжирования – Learning to rank
- Практическое занятие по рекомендательным системам. Surpsise!
- Q&A.
- Графы
- Введение в графы: основные понятия. NetworkX, Stellar
- Анализ графов и интерпретация. Community Detection
- Link Prediction и Node Classification.
- Bayesian Learning, PyMC
- Введение в вероятностное моделирование, апостериорные оценки, сэмплирование
- Markov Chain Monte-Carlo (MCMC), Metropolis–Hastings
- Практическое занятие: Хейтеры в Twitter
- Байесовское АB тестирование
- Generalized linear model (GLM) – байесовские регрессии, вывод апостериорных оценок коэффициентов
- Практическое занятие по GLM
- Байесовская сеть доверия: практическое занятие
- Практическое занятие по логит-регрессии.
- Reinforcement Learning
- Введение в обучение с подкреплением
- Multi-armed bandits для оптимизации AB тестирования, от теории – сразу в бой
- Практическое занятие: Multi-armed bandits в ecommerce: search оптимизация
- Markov Decision Process, Value function, Bellman equation
- Value iteration, Policy iteration
- Monte Carlo Methods
- Temporal Difference (TD) и Q-learning
- SARSA и Практическое занятие: финансовый кейс TD и Q-learning
- Q&A.
- Проектная работа
- Выбор темы проекта
- Бонус: Поиск Data Science работы
- Предзащита проектных работ №1
- Предзащита проектный работ №2
- Защита проектных работ.
- Дополнительные материалы ML
- Сбор данных
- Анализ текстовых данных. Часть 1: Предобработка и токенизация
- Анализ текстовых данных. Часть 2: Векторные представления слов, работа с предобученными эмбеддингами
- Анализ текстовых данных. Часть 3: Named Entity Recognition
- Анализ текстовых данных. Часть 4: Тематическое моделирование.
- Дополнительные материалы Deep Learning
- Градиентный спуск. Математика
- Градиентный спуск. Вывод
- Распределения и информация
- Взрыв и затухание градиентов
- Логрегрессия на pytorch.
Преподаватели:
- Мария Тихонова
Senior Data Scientist Сбер, преподаватель ВШЭ
Работает специалистом по анализу данных в команде AGI NLP в Сбере. Занимается нейросетевыми языковыми моделями и их применением в реальных задачах. Считает, что работа в области Data Science дает уникальную возможность заниматься безумно крутыми вещами on the edge of science, которые меняют мир здесь и сейчас.
Преподает в Высшей Школе Экономики дисциплины по анализу данных, машинному обучению и data science. - Андрей Дзись
В настоящее время работает аналитиком данных в Инжиниринговом Центре МФТИ по полезным ископаемым. Занимается анализом и обработкой данных с оборудования для нефтедобычи с целью реализации интеллектуальных продуктов для эффективного мониторинга и эксплуатации на основе алгоритмов машинного обучения.
Выпускник совместной программы магистратуры ФРКТ МФТИ и Сколковского Института Науки и Технологии по направлению “Интеллектуальный анализ данных”. - Борис Цейтлин
Выпускник магистратуры “Науки о данных” ФКН ВШЭ.
Работал machine learning инженером в Mindsdb, где разрабатывал auto-ml решения. Имеет опыт работы в аналитике продукта и back-end разработке.
Сфера научных интересов включает в себя computer vision, semi-supervised learning, few-shot learning.
И др.
Отзывы:
Сергей Новожилов
«Учусь в Otus на курсе ML Advanced, доволен очень.
Преподают из всех уголков мира, по Zoom, вроде привык уже к удалёнке, но всё равно поражает.
– По-настоящему классные специалисты.
– Цена курсов разумная. Я когда покупал первый раз, долго и недоверчиво выяснял, как, если что не так, вернуть деньги. На мой взгляд, Отусу было бы выгодно поагрессивнее записывать на курс, потом, после 3-го занятия, скажем, решать вопрос с оплатой, а то на покупку кота в мешке 50к многие не решатся выложить. Сейчас не жалею, буду еще брать курсы у них.
Из пожеланий:
– получше с записью вебинаров разобраться, чтобы технических сбоев было поменьше, корпоративный Zoom это вроде позволяет».
IGOR GARAEV
«Добрый день! курс дал обширные знания и заложил основания в новых областях: байесовского вывода, многоруких бандитов, A/B тестирования, временных рядов (кластеризация, вейвлеты, FFT) и RL.
В постоянно меняющихся условиях бизнеса и новых ограничений (например: GDPR, IOS14 к системе трекинга, новые требования 2022 google к трекингу) – происходит бурное развитие новых инструментов и подходов в маркетинге и продукте, которые требует понимания и применения вышеперечисленных тем.
Данный курс под руководством инструктора – позволил освоить теоретический материал и закрепить его на практике с помощью большого количества показанных примеров и домашних заданий. Это фундамент позволит мне самостоятельно далее развиваться в данной области и применять на практике в бизнесе.»
После обучения вы заберете с собой материалы по всем занятиям (презентации, записи вебинаров, примеры практических задач) и получите сертификат на русском о прохождении курса.
Курс «Машинное обучение от НИУ ВШЭ»
Цена: 72 000 ₽
Ссылка на сайт: https://cs.hse.ru/dpo/ml
Машинное обучение — один из самых востребованных разделов компьютерных наук. Именно с помощью машинного обучения сейчас удаётся строить рекомендательные системы для видео, прогнозировать спрос на тысячи товаров и автоматически обрабатывать огромные потоки писем в службе поддержки.
Мы ожидаем, что слушатели владеют языком Python, который является де-факто стандартным инструментом для анализа данных.
Чему научитесь:
- Узнаете, как работают классические алгоритмы машинного обучения
- Изучите основные виды моделей
- Научитесь обрабатывать данные и проводить их первичный анализ.
Программа:
14 занятий
- Введение в машинное обучение
Основные типы задач, процесс обучения и валидации модели. Градиентные методы обучения - Линейные методы машинного обучения
Линейная регрессия. Линейная классификация и метрики качества классификации. Логистическая регрессия - Продвинутые методы машинного обучения
Работа с категориальными признаками и текстами. Решающие деревья и другие нелинейные алгоритмы. Бэггинг и случайные леса. Градиентный бустинг. Градиентный бустинг: имплементации - Работа с признаками и другие задачи машинного обучения
Отбор признаков и понижение размерности. Кластеризация и визуализация. Статистика в машинном обучении. Соревнования в машинном обучении.
Документ при успешном завершении обучения.
Курс «Data Science. Уровень 2. Применение машинного обучения от Центр компьютерного обучения «Специалист» при МГТУ им.Н.Э.Баумана»
Цена: 43 950 ₽ – 106 000 ₽
Ссылка на сайт: https://www.specialist.ru/course/ds2
На этом курсе вы сможете освоить технологию машинного обучения и научиться применять ее для обработки информации. Вы познакомитесь с популярными алгоритмами машинного обучения и узнаете, где именно стоит их применять. Пройдя курс, вы сможете самостоятельно выбирать наиболее подходящий алгоритм, настраивать его, оценивать результаты и комбинировать с моделями.
- Длительность: 40 ак. ч.
Вы научитесь:
- применять на практике алгоритмы машинного обучения для решения аналитических задач
- выбирать оптимальный алгоритм для анализа.
Программа курса:
- Постановка задачи (6 ак. ч.)
- Принципы машинного обучения
- Алгоритмы машинного обучения
- Деревья решений (6 ак. ч.)
- Классическое дерево решений
- Комбинирование решающих деревьев
- Линейные модели (6 ак. ч.)
- Линейная регрессия
- Кластеризация (5 ак. ч.)
- Алгоритмы кластеризации
- Применение кластеризации
- Временные ряды (6 ак. ч.)
- Нейронные сети (6 ак. ч.)
- Анализ текста (5 ак. ч.).
После успешного окончания курса выдается удостоверение о повышении квалификации, которое подтвердит ваши знания.
Курс «Основы машинного обучения от Luxoft Training»
Цена: 40 000 руб.
Ссылка на сайт: https://www.luxoft-training.ru/kurs/osnovy_mashinnogo_obucheniya_.html
На курсе дается представление об основных группах методов машинного обучения: классификации, предсказании, кластеризации, ансамблях, рекомендационных системах, глубоком обучении.
- 24 ак.ч.
- Онлайн.
На курсе дается представление об основных группах методов машинного обучения:
- классификации,
- предсказании,
- кластеризации,
- ансамблях,
- рекомендационных системах,
- глубоком обучении.
Практическая часть построена на использовании готовых реализаций в Spark ML или Scikit-learn для решения конкретных задач.
После прохождения курса выдается сертификат.
Цели:
- понимать ключевые концепции машинного обучения и его отличия от других методов;
- распознавать виды задач, решаемых методами машинного обучения, и выбирать подходящие методы;
- уметь оценивать построенные модели;
- уметь готовить входные данные и интерпретировать результаты, выдаваемые моделями;
- использовать готовые реализации методов машинного обучения.
Целевая аудитория:
Разработчики, архитекторы, бизнес-аналитики, руководители разработки.
Разбираемые темы:
- Задачи машинного обучения
- Признаки и работа с ними
- Оценка моделей
- Методы классификации
- Байесовские методы.
- Деревья решений.
- Логистическая регрессия.
- Метод опорных векторов.
- Нейронные сети.
- Методы прогнозирования
- Линейная регрессия.
- CART
- Байесовские методы.
- Методы кластеризации
- Иерархические.
- Спектральные.
- Разделение смесей.
- LDA
- Ансамбли
- Бэггинг.
- Случайные леса.
- Бустинг.
- Стэкинг.
- Рекомендационные системы
- Глубокое обучение
- Ограниченные машины Больцмана.
- Конволюционные сети.
- LSTM
Отзывы участников тренинга:
«Фундаментальный курс по машинному обучению. Лично для меня весь материал был новым, интересным и полезным. Больше всего понравилось, что я попрактиковался в подготовке данных и кодировании, которые мы разбирали вместе с тренером. Также он показал нам некоторые практические примеры и проблемы, с которыми мы могли столкнуться, а также обсудил и применил решения этих проблем.»
«Как обзор прикладных практик в области анализа данных, этот тренинг заходит неплохо. Много примеров и заданий, которые мы выполняли под руководством тренера. Отдельно стоит выделить машины Больцмана, с которыми я столкнулся первый раз. Для 24 академических часов этот курс объёмный, возможно, на него стоит выделить больше времени».
Курс «Машинное обучение от Компьютерные науки»
Бесплатно
Ссылка на сайт: https://www.youtube.com/playlist?list=PLJOzdkh8T5krxc4HsHbB8g8f0hu7973fK
Видеоуроки:
- Вводная лекция.
- Линейные методы.
- Метрические методы.
- Метод опорных векторов.
- Многомерная линейная регрессия.
- Нелинейная регрессия.
- Прогнозирование временных рядов.
- Критерии выбора моделей.
- Логические методы классификации.
- Поиск ассоциативных правил.
- Байесовская классификация.
- Кластеризация и частичное обучение.
- Нейронные сети и градиентные методы.
- Нейронные сети глубокого обучения.
- Линейные композиции, бустинг
- Композиции классификаторов, часть 2.
- Обучение ранжированию.
- Рекомендательные системы.
- Тематическое моделирование.
- Обучение с подкреплением.
- Активное обучение.
- Заключительная лекция.
Курс «Основы машинного обучения от Открытое образование»
Цена: нет информации
Ссылка на сайт: https://openedu.ru/course/hse/INTRML/
- Длительность – 11 недель, от 5 до 8 часов в неделю.
Курс посвящён основам анализа данных и машинного обучения.
По результатам слушатели освоят способы предобработки и визуализации данных, изучат основные методы машинного обучения (линейные, метрические, решающие деревья и их композиции), научатся оценивать качество моделей. Курс пригодится всем, кто хочет «с нуля» погрузиться в область машинного обучения, получить первые практические навыки и начать применять их для решения собственных задач по извлечению пользы из данных.
Курс состоит из 11 недель, каждая включает в себя несколько коротких видеолекций (суммарная продолжительность — от 60 до 90 минут), тест на знание теоретического материала (5-15 вопросов), а также тест, включающий в себя выполнение задания по программированию. На некоторых неделях задание по программированию заменено заданием на взаимное оценивание. В конце курса предусмотрен итоговый экзамен, состоящий из тестов.
Программа курса:
- Основные понятия и задачи в машинном обучении
- Метод k ближайших соседей
- Линейная регрессия
- Градиентный спуск
- Линейная классификация
- Логистическая регрессия и метод опорных векторов
- Решающие деревья
- Бэггинг и случайный лес
- Градиентный бустинг
- Обучение без учителя
- Рекомендательные системы.
Курс «Машинное обучение от Amazon Web Services»
Бесплатно
Ссылка на сайт: https://aws.amazon.com/ru/training/learn-about/machine-learning/
Этот комплект курсов по требованию поможет вам развить технические навыки и узнать, как применять машинное обучение (ML), искусственный интеллект (ИИ) и глубокое обучение (DL), чтобы получать новую аналитическую информацию и коммерческую ценность на своей должности. Кроме того, планы обучения могут вам помочь подготовиться к сертификационному экзамену AWS Certified Machine Learning – Specialty.
Курсы:
- Twitch Series: AWS Power Hour Machine Learning
8 часов - Основы машинного обучения для лиц, принимающих решения о направлении развития бизнеса и технологий
1,5 часа - Готовность к экзамену: AWS Certified Machine Learning – Specialty
4,5 часа.
Курс «Машинное обучение от newprolab»
Цена: 28 000 руб.
Ссылка на сайт: https://newprolab.com/ru/ml-module
- Можно проходить в индивидуальном темпе
- Онлайн, видеозаписи занятий.
- 7 занятий, 2 теста.
Для кого этот курс?
- Разработчики
У вас есть опыт программирования, но по работе требуется понимать, что происходит в машинном обучении? В этом курсе вы научитесь строить модели машинного обучения и анализировать данные в Python. - Аналитики
Вы умеете анализировать данные, но требуется знание новых инструментов? Вы научитесь делать не только базовую аналитику, но и строить модели машинного обучения, прогнозирующие различные показатели. - Менеджеры
Вы занимаетесь развитием продукта или подразделения? В этом курсе вы получите погружение в машинное обучение, поймете юзкейсы использования и его ограничения, попробовав многие вещи своими руками.
Чему вы научитесь:
В курсе есть четыре составляющих
- Классический ML
Научитесь решать задачи регрессии и классификации при помощи различных алгоритмов машинного обучения, работая со структурированным типом данных. Узнаете, как правильно предобрабатывать и готовить данные для повышения качества прогноза моделей. - ML на текстах
Научитесь представлять текст в векторном виде и решать задачи машинного обучения в классическом виде. Узнаете, как проводить сентимент-анализ отзывов в интернете, для чего нужен word2vec и bag of words. - Ансамбли моделей
Научитесь создавать ансамбли из моделей, объединяя базовые классификаторы в один большой и повышая качество этой мета-модели. Узнаете, чем стэкинг отличается от блендинга, а также об их достоинствах и недостатках. - Введение в Deep learning
Узнаете о современных достижениях в области Deep Learning и какие виды задач можно решать при помощи глубоких нейронных сетей.
Преподаватели:
Петр Ермаков
Senior Data Scientist, Lamoda
Дмитрий Коробченко
Senior Manager of AI, NVIDIA.
Курс «Машинное обучение и Data Science от BigData Team»
Цена: 35 000 рублей – 65 000 рублей
Ссылка на сайт: https://bigdatateam.org/ru/machine-learning-course
Лучший способ погрузиться в Data Science для IT-специалистов. Получите практические навыки по машинному обучению и реализуйте итоговый проект при поддержке наставников из отрасли.
Кому подойдет этот курс:
- Разработчикам
Вы программируете, но хотите расширить профессиональные возможности и получить практические навыки в машинном обучении? Вы научитесь строить модели машинного обучения и нейронные сети, правильно использовать инструменты для работы с большими данными. - Аналитикам
Хотите освоить машинное обучение, чтобы решать более сложные и интересные аналитические задачи?
Вы научитесь строить модели машинного обучения и использовать инструменты работы с большими данными для решения ваших задач.
Что входит в программу?
- 8 занятий
Погружение в машинное обучение: 32 часа лекций и семинаров, 48 часов на самостоятельную работу. - 7 домашних заданий
На каждом занятии вы будете решать квизы, а каждую неделю вас ждут домашние задания для отработки новых знаний на практике. - Финальный проект
Вы самостоятельно реализуете проект и получите обратную связь от наставников. Финальное испытание – защита проекта.
Содержание:
Часть 1. Классическое машинное обучение
Вы научитесь строить модели машинного обучения, решать задачи регрессии и классификации, создавать ансамбли решающих деревьев, а аббревиатуры RF, GBDT, XGBoost и LightGBM станут родными и понятными.
- Введение в машинное обучение и библиотеки ML для Python
Уже на первом занятии вы научитесь:
- Совершать базовые операции с данными в numpy,
- Cтроить графики функций с matplotlib,
- Оптимизировать функции с scipy,
- Визуализировать данные с seaborn.
- Линейные модели, регуляризация, SVM, метрики качества
Простым и понятным языком расскажем про:
- Применение алгоритмов Scikit-learn к синтетическому набору данных и к данным соревнования Kaggle Inclass (классификация, регрессия),
- Логистическую регрессию и обучение моделей с помощью SGD,
- Метод опорных векторов (Support Vector Machine) и ядра,
- Настройку параметров и кросс-валидацию,
- Предобработку данных (строки, пропуски, категориальные признаки).
- Деревья
На занятии вы научитесь:
- Обучать деревья на наборах данных (MNIST, UCI, кредитный скоринг),
- Визуализировать деревья,
- Работать с признаками и пропущенными значениями в деревьях,
- Оценивать время работы и “стричь” деревья (прунинг).
- Ансамбли решающих деревьев
По итогам этого занятия вы освоите:
- Общие методы построения композиций: усреднение, бустинг, блендинг, стекинг,
- Бустинг и GBM,
- Выбор параметров в ансамблях решающих деревьев, сравним Random Forest и GBDT с демонстрацией,
- Связь между ответами моделей и качеством модели в бэггинге,
- Bias-variance trade-off на примере бэггинга и бустинга. Обсудим преимущества и недостатки RF и GBDT, разберем XGBoost и LightGBM.
Часть 2. Нейронные сети и Deep learning
Вы познакомитесь с нейронными сетям (Deep learning) и Unsupervised learning, а также поработаете с большими данными. На протяжении этой части курса вы будете работать над итоговым проектом при поддержке наставников. Вы сможете реализовать собственный проект или проект, который предложат кураторы курса.
- Нейронные сети и введение в глубокое обучение (Deep learning)
Продолжаем погружаться в машинное обучение и знакомимся с нейронными сетями и Deep learning:
- Нейронные сети и сверточные нейронные сети, общие веса, локальность иерархичность,
- Слои в сверточных сетях, функции потерь для классификации, регуляризация нейросетей,
- Эффективные методы вычисления градиентов, проверка реализации разностным дифференцированием.
- Deep Learning: CNN, RNN, Attention
На этом занятии разберем:
- Рекуррентные нейронные сети в задаче анализа сигналов и естественного языка,
- Генеративные модели на основе RNN,
- Механизм внимания (Attention mechanism) в задаче машинного перевода и других задачах,
- Сверточные нейронные сети в задачах обработки текста, сравнение с рекуррентными нейронными сетями,
- DNN на практике: инициализация, предобработка данных, модельный зоопарк, дообучение, вычисления на видеокартах, визуализация.
- Обучение без учителя (Unsupervised learning)
Самое время для Unsupervised learning:
- Разберемся с определением координат дома и работы по GPS-треку (определение регулярных координат с помощью DBSCAN).
- Освоим метод главных компонент на практике,
- Научимся применять PCA и tSNE для визуализации данных, сжатия данных и предобработки датасета.
- Погружение в большие данные (Big Data)
Изучите основы работы с большими данными: Hadoop, HDFS, MapReduce, Spark и многое другое! - Защита проекта
Финальное испытание – защита проекта, над которым вы работали на протяжении второй части курса.
Преподаватели:
Алексей Драль
Генеральный директор, BigData Team.
Дмитрий Игнатов
Зав. лабораторией моделей и методов вычислительной прагматики, ВШЭ.
Наталья Корепанова
Data Science Tech Lead, IPONWEB
Кирилл Власов
Руководитель курсов по машинному обучению и BigData в МФТИ.
Павел Клеменков
Chief Data Scientist (Data Platform), NVIDIA.
Арсений Ашуха
Исследователь Samsung AI Center Moscow.
Те, кто успешно пройдет курс, получат Удостоверение о повышении квалификации государственного образца. Все слушатели получат электронный сертификат об окончании курса.
Отзывы:
Сергей Паршуков
Руководитель проектов в МегаФон
«В данный курс я погрузился по полной. Для меня Machine Learning не является основным родом деятельности, это был вызов к собственным знаниям. Было тяжело.
Команда, которая обеспечивала обучение и поддержку, действовала очень профессионально. Я тратил ночи на решение домашек и даже после 00:00 коллеги отвечали на наши вопросы — это круто! Я обучался разным вещам и ранее, но такую поддержку и вовлеченность вижу впервые.
Ребята круты, большое спасибо за это.»
Дмитрий Деменков
Менеджер по машинному обучению и анализу больших данных
«Интересный, современный, мощный курс с отличным наполнением и организационной составляющей. Больше всего понравилась свежесть и актуальность материала, содержательная часть домашек, быстрая коммуникация с преподавателями.»
Курс «Машинное обучение от Дмитрий Макаров»
Бесплатно
Ссылка на сайт: https://www.dmitrymakarov.ru/intro/
Содержание:
О курсе
- Первое занятие
- Принцип машинного обучения
Раздел 1. Программирование на Питоне
Модели машинного обучения строятся на Питоне. С него и начнем.
- Необходимое ПО
- Основы программирования
- Списки и словари
- Условия и циклы
- Анализируем данные и строим графики
Раздел 2. Нескучно о математике
Без математики в машинном обучении никуда, но она не обязательно должна быть скучной или недоступной, математика — это весело и, главное, несложно.
- Описательная статистика: данные умеют говорить
- Статистический вывод: от частного к общему
- Взаимосвязь переменных и построение первой модели
- Оптимизация: поиск идеальных весов
- Представим данные математически: векторы и матрицы
- На каких данных обучать модель
Раздел 3. Строим первые модели
Вооружившись навыками программирования и знанием математики, мы готовы строить первые модели.
- Регрессия. Предсказываем цены на жилье
- Классификация. Поможем врачам классифицировать опухоли
- Кластеризация. Попробуем разбить данные на группы
Раздел 4. Переходим на следующий уровень
В этом разделе попробуем поработать с рекомендациями, изображениями, текстом и временными рядами. Даже построим первую нейросеть.
- Как онлайн-кинотеатры подбирают нам кино на вечер
- Распознаем цифры на изображении с помощью компьютерного зрения
- Как компьютер определяет, о чем говорится в тексте
- Проанализируем изменение данных во времени
- Изучим основы нейронных сетей.
Курс «Машинное обучение от ods ai»
Бесплатно
Ссылка на сайт: https://ods.ai/tracks/open-ml-course
Что будем изучать?
Базово ознакомимся с Python, работой с данными на нем и визуализацией. Узнаем про ML и какие задачи он решает, попрактикуемся в ML на python. Познакомимся с разными задачами ML и научимся их решать.
Длительность курса составляет 3-4 месяца. В неделю курс займет минимум 5 часов, но точно сказать нельзя, потому что подготовка у всех разная.
Программа трека:
- Приветствие
- Установка Python и Jupyter
Научимся ставить Python и различные библиотеки на вашу систему - Введение в python
Ох. Это было тяжко. Но вот занятие по питону. - Введение в python (задание)
Вам предстоит решить несколько задачек на Python - Pandas
- Matplotlib
- Машинное обучение на пальцах
- Метрики классификации
- Метрики регрессии
- KNN
- Деревья принятия решения
- Линейная регрессия
- Логистическая регрессия
- Работа с текстом
- Случайный лес
- Градиентный бустинг
- Работа с признаками
- Снижение размерности
- Пайплайны
- Ансамблирование
- Кластеризация
- Многоклассовая классификация
- Работа с временными рядами
- Онлайн обучение.
Курс «Data Science. Уровень 2: Машинное обучение от Московский Государственный Технический Университет им. Н.Э. Баумана»
Цена: 38 090 руб.
Ссылка на сайт: http://edu.bmstu.ru/napravleniya-obucheniya/biznes-analitika/datascience2
Машинное обучение (machine learning) — один из основным методов для дата-сайентиста, специалиста по работе с большими данными.
Основная идея машинного обучения — на основе методов математической статистики и оптимизации создать самообучающийся алгоритм, который будет находить связи и закономерности в больших массивах неструктурированных данных.
- Продолжительность курса – 40 академических часов.
Для кого подойдет этот курс:
- начинающим дата сайентистам
для получения практических знаний и навыков построения математических моделей: от нейронных сетей до кластеризации, от факторного до корреляционного анализов - начинающим ML-специалистам
для получения базовых знаний в сфере обучения искусственного интеллекта.
Чему вы научитесь:
- основам работы машинного обучения
- использовать метод ближайших соседенй (kNN)
- работать по основным метрикам в задачах бинарной классификации
- подготавливать и нормализовать данные для последующей обработки
- работать с атрибутами методом опорных векторов SVM
- работать с методами регрессивного и кластерного анализов
- разрабатывать рекомендательные системы.
Программа:
- Введение в машинное обучение
Понятие «машинное обучение». Обоснованность использования. Подразделы машинного обучения. Обучение с учителем, обучение без учителя, обучение с подкреплением. - Метод ближайших соседей (KNN)
- Описание метода kNN.
- Область решаемых задач.
- Метрики качества.
- Разбор кода с примером реализации алгоритма.
- Метрики и их практическое применение
- Что такое метрики.
- Метрики в задачах бинарной классификации.
- Применение метрик. Разбор основных метрик качества для различных типов задач.
- Подготовка и нормализация данных. Уменьшение размерности данных – метод главных компонент
- Этапы подготовки данных.
- Понятие нормализация.
- Почему данные нужно нормализовывать.
- Уменьшение размерности – методы PCA, t-SNE.
- Разбор кода с примерами реализации метода главных компонент.
- Выбор атрибутов при решении задачи. Метод опорных векторов SVM
- Выбор атрибутов для анализа.
- Метод SVM, предсказание вероятности принадлежности классу.
- Суть алгоритма, линейно разделимые и неразделимые выборки.
- Плюсы и минусы алгоритма. Разбор кода с реализацией алгоритма SVM.
- Регрессия (Прогнозирование конкретного значения)
- Задача регрессии.
- Линейная регрессия, логистическая регрессия.
- Регрессии: разбор кода с реализацией алгоритма.
- DECISION TREES, RANDOM FOREST
- Решающие деревья и случайный лес.
- Суть алгоритмов. Плюсы и минусы.
- Decision trees, random forest: разбор кода с реализацией алгоритма.
- Разбалансированные датасеты и методы их балансировки
- Понятие разбалансировки.
- Причины возникновения.
- Методы балансировки датасетов.
- Разбор кода – работа с разбалансированным датасетом.
- BAGGING, BOOSTING, STACKING – Алгоритмы повышения точности
- Цели и задачи повышения точности.
- Bagging, boosting, stacking.
- Разбор кода с реализацией алгоритмов.
- Кластеризация, метод K-MEAN. Полная и условная вероятность, теорема Байеса
- Понятие кластеризация.
- Алгоритм k-mean, c-mean.
- Полная и условная вероятность, теорема Байеса.
- Алгоритм k-mean, c-mean: разбор кода с алгоритмами кластеризации и байесовскими классификаторами.
- Рекомендательные системы. Персонализированные и неперсонализированные, проблема холодного старта
- Что такое рекомендательная система.
- Типы рекомендательных систем.
- Области применения.
- Понятие холодного старта.
- Рекомендательная система: разбор кода с рекомендательными системами.
- Внедрение моделей в PRODUCTION
- Сохранение моделей машинного обучения.
- Библиотека Flask для веб-приложений.
- Библиотека git для контроля версионности.
- Пошаговый алгоритм действий по выведению модели в Production.
- Учебный хостинг heroku.
- Построение модели и внедрение в PRODUCTION
- Создание веб приложения – анализ сердечно-сосудистых заболеваний.
- Обучение модели и выведение в Production.
- Итоговая аттестация.
Курс «Машинное обучение от Издательский дом «ПостНаука»»
Бесплатно
Ссылка на сайт: https://postnauka.ru/courses/74896
Содержание:
- Список литературы: Машинное обучение
Подборка материалов, которая поможет разобраться в компьютерном зрении, методах вычислительной математики и компьютерном моделировании - Тест: Машинное обучение
- Математическое моделирование и вычислительная математика
Математик Александр Шапеев о методах оптимизации, численном оценивании неопределенностей и быстрых алгоритмах решения - Глубинное обучение и обучение с подкреплением
Специалист по Computer Science Евгений Бурнаев о марковском процессе принятия решений, глубинных нейросетках и построении искусственного интеллекта - Генерация изображений и текстур
Специалист по Computer Science Виктор Лемпицкий о распознающих нейросетях, методах математической статистики и роли теории игр в машинном обучении - Машинное обучение в индустриальной инженерии
Специалист по Computer Science Евгений Бурнаев об уравнении Навье—Стокса, суррогатных моделях и нестандартных задачах машинного обучения - Классическое моделирование и машинное обучение
Математик Александр Шапеев о способах распознавания изображений, проблемах классического моделирования и областях применения классических моделей и машинного обучения - Байесовские методы машинного обучения
Специалист по Computer Science Евгений Бурнаев о точности алгоритмов прогнозирования, колмогоровской сложности и децентрализованном машинном обучении - Тезаурус: Машинное обучение
Базовые понятия, объясняющие задачи машинного обучения и принципы работы искусственных нейронных сетей - Максим Федоров: «В шахматах уже появилось понятие «кентавры» ― так называют команду из человека и машины»
Специалист по суперкомпьютерным вычислениям Максим Федоров об искусственном интеллекте, профессиях будущего и приложениях наук о данных - Как обучить нейронную сеть?
Как искусственная нейронная сеть выиграла турнир по игре в го у действующего чемпиона и чем «умные помощники» могут помочь нам в жизни и работе.
Курс «Машинное обучение на Python от Университет искусственного интеллекта»
Цена: нет информации
Ссылка на сайт: https://neural-university.ru/machine-learning
Вы освоите машинное обучение на Python и сможете решить свой рабочий проект.
- Научиться решать задачи машинного обучения на Python
Вы освоите все основные темы машинного обучения и сможете применять эти методы в своей работе для решения текущего проекта или для трудоустройства в новую компанию и на новое направление. - Реализовать свой рабочий проект
Многие проекты могут потребовать применения методов машинного обучения, если у вас есть подобный проект, вы сможете реализовать его на курсе. - Получить сертификат, рекомендацию и создать портфолио проектов
После завершения курса вы получите весомый сертификат и рекомендацию, также у вас будет портфолио из нескольких решённых вами практических задач. - Решить 10 практических задач по машинному обучению
Каждое занятие будет сопровождаться практикой – решением конкретной задачи из области машинного обучения.
Каждую неделю вы будете получать вебинар длительностью более 3-х часов на тему машинного обучения. После каждого занятия вы получите практическое задание, это будет работа с реальными данными и применение методов машинного обучения к этим данным.
Программа обучения:
- Подготовка данных для построения модели и простейшие алгоритмы машинного обучения
- Первичная обработка исходных данных. Основные недостатки исходных данных: «мусор», пропуски, выбросы
- Метод k-соседей (k- neighbors)
- Обработка исходных данных DataSet Titanic и построение модели бинарной классификации
- Задание: предсказание: заберут или нет животное из питомника. DataSet PetFinder (бинарная классификация).
- Метрики в задачах бинарной классификации, классификаторы Байеса
- Метрики в задачах бинарной классификации. Полнота, точность, accuracy, ROC-AUC кривая, f-мера
- Классификаторы Байес
- Построение модели для DataSet Titanic, анализ качества моделей
- Задание: оценка моделей бинарной классификации на примере DataSet PetFinder.
- Линейные модели, задачи регрессии
- Линейная регрессия, метод наименьших квадратов
- Задача регрессии и нормализация признаков
- Построение модели для DataSet Energy Star Score, анализ качества модели
- Задание: определение цены дома (задача регрессии), Boston house prices dataset.
По итогам обучения вы получаете сертификат о повышении квалификации.
Курс «Машинное обучение и анализ данных от ФПК ННГУ»
Цена: 35 000 ₽
Ссылка на сайт: https://fpk.unn.ru/onlajn-kursy-po-mashinnomu-obucheniyu-i-analizu-dannyh/
- Продолжительность курса – 5 месяцев
- Документ об окончании
Слушателям с высшим или средним специальным образованием выдается Диплом о профессиональной переподготовке. Остальным — Сертификат.
Онлайн-курс по машинному обучению и анализу данных подходит для студентов, специалистов с высшим или средним проф. образованием и всех желающих. Обучение с нуля. Требование к поступающим минимальные – нужно быть уверенным пользователем ПК.
Курс включает 3 блока. В первом, слушатели изучают основы программирования на Питон, во втором математику (линейную алгебру, теорию вероятностей, математический анализ). Во третьем блоке, основы Машинного обучения и анализа данных.
В качестве преподавателей на курсе выступают эксперты из компаний Intellivision, HARMAN, ABBYY.
Что мы изучаем на курсе:
Модуль 1. Python
- Основы синтаксиса
- Структуры данных
- Пользовательские функции
- Файлы
- Работа с модулями
- Объектно-ориентированное программирование
Модуль 2. Математика
- Линейная алгебра (матрицы и вектора, операции над матрицами, виды матриц и их свойства, определитель матрицы; собственные вектора; решение системы линейных уравнений)
- Теория вероятности (понятие вероятности и случайной величины, свойства вероятностей, основные статистики, условная вероятность и формула Байеса, распределения вероятностей)
- Математический анализ (свойства основных функций, производная функции многих переменных, производная сложной функции, пределы)
Модуль 3. Машинное обучение и анализ данных
- Введение. Первичный анализ данных.
- Постановки задач машинного обучения.
- Градиентный спуск. Введение в numpy.
- Логистическая регрессия. Переобучение.
- Переобучение и борьба с ним
- Работа с признаками.
- Метод опорных векторов. Многоклассовая классификация.
- Решающие деревья.
- Композиции.
- Градиентный бустинг. CatBoost и XGBoost.
- Кластеризация.
- Полносвязные нейронные сети.
- Обзор пройденного за курс. Воркшоп по решению “боевой” задачи.
Спикеры:
- Вильданов Вадим Кадирович
Доцент кафедры математического моделирования экономических процессов, кандидат физико-математических наук. Читает курс «Программирование на PHP» - Потапов Андрей Владимирович
Место работы: EPAM, Senior data scientist.
Образование: специалитет ВМК ННГУ, магистратура ВШЭ Бизнес-Информатика,
Школа Анализа Данных Яндекса (ШАД) - Антонов Дмитрий Андреевич
Data Scientist - Хлевнов Олег Алексеевич
компания ABBYY, Software Engineer.
Отзывы:
Гладышева Анна
«Лекции читают непосредственно специалисты, план лекций хорошо составлен. Организовано всё, в целом, тоже хорошо.
Для моего уровня начальной подготовки было сложновато выполнять домашние работы. Связано это, скорее всего, с написанием кода.
Но в целом представление о машинном обучении базовое сформировано на конец курса. Преподаватели все хорошие. У каждого свой стиль изложения материала. Для человека, который никак не связан с IT-сферой, более понятны были объяснения Дмитрия Антонова.
И хотелось бы отметить доброту и готовность помочь каждого из преподавателей. Всем преподавателям спасибо за проведённые лекции!»
Савинов Александр
«Очень интересный курс, сложные темы, но преподаватели хорошо объясняют, отвечают на любые вопросы, дают хорошую обратную связь по домашним заданиям.»
Курс «Машинное обучение от AI-ACADEMY»
Бесплатно
Ссылка на сайт: https://ml.ai-academy.ru/
Курс разработан при участии практикующих data scientist’ов и лидеров рынка онлайн-обучения по направлению Data Science.
2-4 часа занятий в неделю достаточно для того, чтобы завершить курс за 6 месяцев.
Создание собственной рекомендательной системы в конце курса.
В ходе курса ты научишься:
- Программировать на Python и пользоваться встроенными библиотеками для машинного обучения и анализа данных.
- Находить закономерности в данных и визуализировать результаты анализа
- Самостоятельно строить алгоритмы машинного обучения для решения прикладных задач.
Программа курса:
- Вводное занятие
Ты узнаешь о роли машинного обучения в современном мире и чем будешь заниматься на курсе. - Основы Python
Все, что нужно знать для комфортного прохождения курса - Анализ данных
Изучаем основные библиотеки, необходимую математику и визуализацию данных - Машинное обучение
Разбираем базовые алгоритмы МО на практике - Финальный проект.
Курс «Разработка машинного обучения от Школа анализа данных»
Цена: нет информации
Ссылка на сайт: https://academy.yandex.ru/dataschool/course/machine-learning
Создание высокотехнологичных сервисов и приложений на основе машинного обучения.
Это направление подойдёт тем, кому нравится программировать и создавать сервисы и приложения, которыми смогут пользоваться тысячи и миллионы людей.
Чему мы учим – писать эффективный код, строить и оптимизировать промышленно-эффективные data-driven системы.
Где применять эти знания?
В разработке высокотехнологичных продуктов на основе машинного обучения.
Программа:
В течение семестра каждый учащийся должен успешно пройти как минимум три курса. Например, если в основной программе их два, то необходимо выбрать какой-нибудь из спецкурсов.
Знания проверяются в первую очередь с помощью домашних заданий — экзамены и контрольные проводятся только по некоторым предметам.
Первый семестр
- Алгоритмы и структуры данных, часть 1
- Сложность и модели вычислений. Анализ учетных стоимостей (начало)
- Анализ учетных стоимостей (окончание)
- Алгоритмы Merge-Sort и Quick-Sort
- Порядковые статистики. Кучи (начало)
- Кучи (окончание)
- Хеширование
- Деревья поиска (начало)
- Деревья поиска (продолжение)
- Деревья поиска (окончание). Система непересекающихся множеств
- Задачи RMQ и LCA
- Структуры данных для геометрического поиска
- Задача о динамической связности в ненаправленном графе
- Обучение языку C++, часть 1
С++ — мощный язык с богатым наследием. Тем, кто только ступил на путь освоения этого языка, очень просто заблудиться в изобилии техник и приёмов, созданных за последние 30 лет. Курс учит “Modern C++” — современному подмножеству языка (стандарты 11, 14 и 17). Много внимания уделяется инструментам и библиотекам — вещам, которые не являются частью языка, но без которых не получится построить большой и сложный проект.
- Введение в С++.
- Константы. Указатели и ссылки. Передача аргументов в функцию.
- Классы.
- Динамическое управление памятью.
- Переменные, указатели и ссылки.
- Управление памятью, умные указатели, RAII.
- Стандартная библиотека шаблонов.
- Наследование и виртуальные функции.
- Обработка ошибок.
- Паттерны проектирования.
- Пространства имен Move‑семантика Perfect forwarding.
- Представление структур и классов в памяти. Выравнивание данных. Указатели на члены/методы класса. Variadic templates.
- Машинное обучение, часть 1
- Основные понятия и примеры прикладных задач
- Метрические методы классификации
- Логические методы классификации и решающие деревья
- Градиентные линейные методы классификации
- Метод опорных векторов
- Многомерная линейная регрессия
- Нелинейная и непараметрическая регрессия, нестандартные функции потерь
- Прогнозирование временных рядов
- Байесовские методы классификации
- Логистическая регрессия
- Поиск ассоциативных правил.
Второй семестр
- Машинное обучение, часть 2
- Нейросетевые методы классификации и регрессии
- Композиционные методы классификации и регрессии
- Критерии выбора моделей и методы отбора признаков
- Ранжирование
- Обучение с подкреплением
- Обучение без учителя
- Задачи с частичным обучением
- Коллаборативная фильтрация
- Тематическое моделирование.
На выбор:
- Алгоритмы и структуры данных, часть 2
- Обход в ширину. Обход в глубину (начало)
- Обход в глубину (продолжение)
- Обход в глубину (окончание). 2-разрезы
- Поиск кратчайших путей (начало)
- Поиск кратчайших путей (продолжение)
- Минимальные остовные деревья
- Минимальные разрезы. Поиск подстрок (начало)
- Поиск подстрок (продолжение)
- Поиск подстрок (окончание)
- Суффиксные деревья (начало)
- Суффиксные деревья (окончание). Суффиксные массивы (начало)
- Суффиксные массивы (окончание)
- Длиннейшие общие подстроки. Приближенный поиск подстрок.
или
- Язык Python
- Основы языка (часть 1)
- Основы языка (часть 2)
- Объектно-ориентированное программирование
- Обработка ошибок
- Оформление и тестирование кода
- Работа со строками
- Модель памяти
- Функциональное программирование
- Обзор библиотек (часть 1)
- Обзор библиотек (часть 2)
- Параллельные вычисления в Python
- Расширенная работа с объектами.
или
- Обучение языку C++, часть 2
Вторая часть курса по С++, в которой разбираются продвинутые темы и возможности языка.
- Многопоточное программирование. Синхронизация потоков с использованием мьютексов и условных переменных.
- Атомарные переменные. Модель памяти С++. Примеры лок-фри структур данных.
- Продвинутые техники мета-программирования в С++. Метафункции, SFINAE, концепты.
- Конкурентное программирование, взаимодействие с сетью.
- Архитектура llvm. Работа с синтаксическим деревом разбора С++. Разработка инструментов для анализа С++ кода.
Третий семестр
На выбор:
- Natural Language Processing
“NLP (Natural Language Processing) — это подмножество более широкой области AI, которая пытается научить компьютер понимать и обрабатывать сырые данные на естественном языке. Большая часть доступной сегодня информации — это не структурированные тексты. Нам как людям, конечно, не составляет труда их понять (если они на родном языке), но мы не способны обработать такое количество данных, какое могла бы обработать машина. Но как заставить машину понимать эти данные и, более того, извлекать из них какую-то информацию? Несколько лет назад на открытии ACL (одной из основных, если не самой главной NLP-конференции) в своей президентской речи Marti Hearst призналась, что больше не может давать студентам свое любимое упражнение. На примере HAL 9000 (один из примеров искусственного интеллекта в научной фантастике) она спрашивала студентов, что машина может делать, как HAL, а что пока нет. Сейчас это уже не такое хорошее упражнение, так как почти все из этого сейчас под силу компьютеру. Поразительно, насколько быстро развивается область и как многого мы достигли. В курсе мы постараемся дать вам понять и почувствовать, что происходит в мире. Какие задачи решаются, как это происходит; как некоторые статистические подходы (которым почти полностью были посвящены курсы по NLP ещё несколько лет назад) получают новую жизнь и новую интерпретацию в нейросетях, а какие постепенно отмирают. Мы покажем, что NLP это не набор пар (задача, решение), а общие идеи, которые проникают в разные задачи и отражают некоторую общую концепцию. Вы также узнаете, что происходит на практике, когда какие подходы более применимы. Это то, что мы делаем, то, что мы любим, и мы готовы поделиться этим с вами :)”
или
- Компьютерное зрение
“Курс посвящен методам и алгоритмам компьютерного зрения, т.е. извлечения информации из изображений и видео. Рассмотрим основы обработки изображений, классификацию изображений, поиск изображений по содержанию, распознавание лиц, сегментацию изображений. Затем поговорим про алгоритмы обработки и анализа видео. Последняя часть курса посвящена трёхмерной реконструкции. Для большинства задач будем обсуждать существующие нейросетевые модели. В курсе мы стараемся уделять внимание только наиболее современным методам, которые используются в настоящее время при решении практических и исследовательских задач. Курс в большей степени является практическим, а не теоретическим. Поэтому все лекции снабжены лабораторными и домашними работами, которые позволяют попробовать на практике большинство из рассматриваемых методов. Работы выполняются на языке Python, с использованием различных библиотек.”
- Цифровое изображение и тональная коррекция
- Основы обработки изображений
- Совмещение изображений
- Классификация изображений и поиск похожих
- Сверточные нейросети для классификации и поиска похожих изображений
- Детектирование объектов
- Семантическая сегментация
- Перенос стиля и синтез изображений
- Распознавание видео
- Разреженная трёхмерная реконструкция
- Плотная трёхмерная реконструкция
- Реконструкция по одному кадру и облакам точек, параметрические модели.
или
- Байесовские методы в машинном обучении
- Байесовский подход к теории вероятностей
- Аналитический байесовский вывод
- Байесовский способ выбора модели
- Автоматическое определение релевантности
- Метод релевантных векторов для задачи классификации
- Вероятностные модели с латентными переменными
- Вариационный байесовский вывод
- Байесовская модель разделения смеси гауссиан
- Методы Монте-Карло с марковскими цепями
- Латентное размещение Дирихле
- Гауссовские процессы для регрессии и классификации
- Непараметрические байесовские методы.
Четвёртый семестр
- ML Engineering Practice
Курс представляет собой проектную работу по разработке ML-проектов в командах. - ML Research Practice
Курс представляет собой работу над командными исследовательскими проектам в области машинного обучения.
Рекомендуемые спецкурсы:
- Глубинное обучение
- Обучение с подкреплением
- Self Driving Cars
В курсе рассматриваются основные компоненты беспилотных технологий: локализация, перцепция, предсказание, уровень поведения и планирование движения. Для каждой из компонент будут описаны основные подходы. Кроме того, студенты познакомятся с текущим состоянием рынка и технологическими вызовами. - Нейробайесовские методы
Курс посвящен применению байесовских методов в глубинном обучении. На лекциях будет рассказано о применении вероятностного моделирования для построения порождающих моделей данных, использованию состязающихся сетей для приближенного вывода, моделированию неопределенности в параметрах нейронной сети и о некоторых открытых проблемах глубинного обучения.