Сбор взносов

[Otus] Математика для Data Science. Продвинутый курс. 2019 Октябрь (Петр Лукьянченко)

Тема в разделе "Курсы по программированию", создана пользователем enot, 4 янв 2022.

Тема найдена по тегам:
Цена:
44000р.
Взнос:
494р.

Список участников складчины:

1. enot
Тип: Стандартная складчина
  1. 4 янв 2022
    #1
    enot
    enot Организатор
    [Otus] Математика для Data Science. Продвинутый курс. 2019 Октябрь (Петр Лукьянченко)
    [​IMG]
    Начало занятий
    25 октября, 4 месяца.


    Что даст вам этот курс

    Обычно математику в вузах преподают в отрыве от реальных задач, где она в дальнейшем будет применяться. Мы пошли по другому пути. Каждый модуль профессионального курса сбалансирован математической теорией и практическими примерами, которые взяты из реальных кейсов. Вы будете решать задачу регрессии, проводить АБ-тестирование, работать над рекомендательной системой, использовать метод опорных векторов.

    Для кого этот курс?
    Курс подойдет всем, кто хочет развиваться в сфере Data Science. Он поможет вам освоить весь необходимый математический аппарат для решения задач на позиции Middle/Senior Data Scientist.

    Зачем учить математику?
    Профессия Data Scientist становится одной из самых перспективных и востребованных в IT. Средняя зарплата специалистов Data Science в России вдвое выше, чем у специалистов других IT-направлений — 190 тыс. руб. Основная сложность профессии — высокие требования к знаниям высшей математики. Уверенное владение математическим аппаратом позволяет повысить уровень компетенций и вырасти в профессиональном плане.

    Длительность курса: 132 академических часа

    Модуль 1 Линейная алгебра

    1 Введение 1.
    Математика в
    DataScience
    понимание, что быть успешным Datascientist без
    знания математики, а главное без ее понимания,
    невозможно.
    План и структура этого курса.
    Знакомство с преподавателем
    Математика для Data
    Science. Продвинутый
    курс
    Best Practice по изучению математического аппарата,
    необходимого для успешной карьеры в Data Science

    2 Введение 2.
    Основные
    термины и
    определения
    математического
    анализа,
    линейной
    алгебры и
    теории
    вероятностей
    — Базовые термины матанализа (предел,
    непрерывность функции, дифференциал)
    — Базовые термины линейной алгебры (вектор,
    матрица, ее виды, ранг, определитель)
    — Базовые термины теории вероятности
    (определение вероятности, мат.ожидание,
    дисперсия)
    — Установка Python, предоставление рекомендаций
    по интерпретатору
    — Вычисление базовых задач на Python с помощью
    стандартных пакетов
    Домашние задания
    1 Основы линейной алгебры, мат.анализа и
    теории вероятности
    Цель: Цель данной домашней работы - развить
    практические навыки, полученных в ходе
    первого и второго уроков.
    Рекомендуется сначала пройти урок 1 и 2.

    3 Матрицы.
    Основные
    понятия и
    операции
    ключевые определения, операция над матрицами,
    определитель, обратная матрица, вычисления
    собственных значений и собственных векторов,
    квадратичные формы
    Домашние задания
    1 Посчитать собственные числа и
    вектора.

    4 Геометрическая
    интерпретация в
    линейной
    алгебре
    — Геометрическая интерпретация матричных
    преобразований
    — Правило Крамера
    — Знакоопределенность матрицы. Матрица
    Маркова. Жорданова форма

    5 Матричные
    разложения
    — Разложение SVD и ALS
    — Неотрицательные разложения
    — Заполнения пропусков в матрицах
    Домашние задания
    1 Разложить матрицу в SVD.
    Цель: Для матрицы A=[3 7] выполнить
    сингулярное разложение в python с
    использованием библиотеки numpy (функция
    linalg.svd). Записать получившуюся матрицу
    преобразования. [5 2]
    1. Установить набор библиотек Anaconda for
    Python 3.7: https://www.anaconda.com/distribution/
    2. Запустить графическую среду Ipython
    Notebook (написав в терминале ipython
    notebook, либо используя графический
    интерфейс Anaconda)
    3. Отразить код задания в Ipython Notebook
    4. Прислать ссылку на репозиторий, в котором
    будет выложен Ipython Notebook с решением
    задачи

    6 Матричные
    производные
    — Матричные производные
    — Дифференциальные уравнения в матрицах

    7 Применение
    линейной
    алгебры в Data
    Science.
    классификация данных с SVM и Logistic Regression
    Домашние задания
    1 Повторить вычисления с занятия в Python на
    других данных.

    8 Применение
    линейной
    алгебры в
    Machine
    Learning
    обработка изображений и линейная алгебра

    Модуль 2 Математический анализ
    1 Теория множеств — Вероятностные пространства. Дискретное
    пространство элементарных исходов
    — Вероятность на числовой прямой и
    плоскости. Правило сложения и умножения

    2 Метрические
    пространства
    — Понятие метрического пространства.
    — Определение нормированного
    пространства, понятие нормы, отличие от
    метрики, примеры нормированных
    пространств.
    — Норма в оптимизации
    Домашние задания
    1 Свойство метрики. Вычислить простые
    операции над множеством.

    3 Теория пределов — Определение Коши.
    — Определение Пиано.
    — Вычисление пределов функций.
    — Асимптотические функции.
    — Эквивалентные функции.
    — Оценка сложности функции

    4 Дифференцирование — Дифференцируемость функции в точке
    Частные производные и дифференциалы
    высших порядков
    — Градиент. Матрица Гессе
    Домашние задания
    1 Вычисление производных и пределов
    значений функции в бесконечности.

    5 Оптимизация — Экстремумы функций многих переменных
    — Определения точек локального и
    глобального минимума. Необходимое и
    достаточное условие экстремума для
    выпуклых функций.
    — Понятие стационарных точек и отличие в их
    определении от точек экстремума

    6 Минимизация и
    Максимизация в
    Регрессиях
    — МНК
    — ММП
    Домашние задания
    1 Максимизация функции с ограничениями.
    Минимизация квадрата ошибки.

    7 Интегрирование — Неопределенный интеграл. Определенный
    интеграл
    — Приложения определенного интеграла и
    приближенные методы его вычисления
    — Несобственные интегралы. Двойные
    интегралы
    — Приближенные методы интегрирования

    8 Применение
    Мат.анализа в ML
    — Покоординатный спуск
    — Градиентный спуск
    — Адаптивные варианты градиентного спуска
    — Ньютоновские методы, BFGS
    Домашние задания
    1 Поиск экстремума с
    Python.

    9 Применение
    Мат.анализа в ML
    — Линейная регрессия и разные подходы к
    оптимизации (градиентный спуск, bounds, итд.)
    — Нелинейная регрессия (реализация на
    нейронных сетях) и разные подходы к
    оптимизации
    10 MidTerm проверочная работа.
    В ходе занятия будет предоставляться от 2-х
    до 5-ти минут на решение практической
    задачи. По истечению отведенного времени
    преподаватель решает задание на экране

    Модуль 3 Теория вероятностей
    1 Комбинаторика
    и Основы
    теории
    вероятностей
    — Принцип Дирихле. Перестановки. Размещения.
    Сочетания.
    — Опыт и его исходы. Пространство элементарных
    событий. Вероятность события.
    — Независимость событий. Условная вероятность.
    Формулы сложения и умножения.
    — Формулы полной вероятности и Байеса

    2 Случайные
    величины
    — Случайная величина
    — Дискретные и непрерывные случайные величины
    — Закон распределения случайной величины и
    способы его описания
    Дискретные и непрерывные распределения
    — Функция распределения и её свойства
    — Распределение Бернулли
    — Биномиальное распределение
    — Моделирование на Python дискретное
    распределение (для задачи МонтеКарло)
    Домашние задания
    1 Вычислить мат.ожидание, написав программный
    код в Python.

    3 Непрерывные
    случайные
    величины
    — Основные законы распределения и их физический
    смысл: биномиальное, пуассоновское,
    экспоненциальное, равномерное, гауссовское
    — Компьютерное моделирование различных
    распределений

    4 Теоремы — Случайные последовательности и сходимость
    — Теорема Пуассона для схемы Бернулли
    — Закон больших чисел (Чебышева, Бернулли,
    Хинчина)
    — ЦПТ Локальная, ЦПТ Линдеберга, ЦПТ Ляпунова
    — Точечные оценки и их свойства
    Домашние задания
    1 Задачи на предыдущие темы курса:
    максимизировать функцию. Отнормировать
    относительно среднего. Вычислить количество
    возможных повторений.

    5 Точечное и
    интервальное
    оценивание
    — Асимптотическая нормальность оценок
    — Доверительные интервалы. Принцип построения
    доверительных интервалов

    6 Проверка
    гипотез
    — Проверка статистических гипотез. Формулировка
    гипотез.
    — Проверка гипотезы о законе распределения
    выборки. Критерий согласия Пирсона.
    — Проверка гипотезы о независимости двух
    номинальных признаков. Критерий хи-квадрат

    7 Проверка
    гипотез. Часть 2
    — Ошибки I и II рода, уровень значимости.
    Статистический критерий. Построение
    доверительной и критической областей. P-value
    — Проверка гипотезы о вероятности успеха в схеме
    Бернулли. Биномиальный критерий

    8 Виды
    зависимостей
    — Виды зависимостей случайных величин:
    функциональная, причинно-следственная,
    статистическая, корреляционная. Различия и связь
    между ними.
    — Условные распределения

    9 Регресии — Линейные, многомерные, логистические регрессии
    — МНК, ММП, ММ
    Домашние задания
    1 Построить линейную регрессию в
    Python.

    10 Метод главных
    компонент
    — Определение главных компонент, их вычисление
    — Понижение размерности и отбор признаков
    — Применение в задачах регрессионного анализа

    11 Моделирование
    случайных
    величин
    — Random Walks, практические методы
    — Вероятностный классификатор: Logistic
    Regression, Random Forest, Gradient Boosting
    — Вероятностные Нейронные Сети

    12 Моделирование
    случайных
    величин.Часть 2
    — Random Walks, практические методы
    — Вероятностный классификатор: Logistic
    Regression, Random Forest, Gradient Boosting
    — Вероятностные Нейронные Сети
    Домашние задания
    1 Провести Монте-Карло симуляцию для
    вычисления числа Пи.

    Модуль - 4 Проектная работа
    1 Консультация
    по проекту
    обсуждение кейса из практики
    Домашние задания
    1 Проектная
    работа

    2 Консультация
    по проекту
    обсуждение кейса из практики

    3 Защита
    дипломного
    проекта
    обсуждение кейса из практики
    Преподаватели

    Петр Лукьянченко
    Преподаватель ВШЭ по высшей математике

    Имеет более десяти лет опыта преподавания математических дисциплин в НИУ ВШЭ. Готовил студентов к международным олимпиадам по математике, участвовал в подготовке команд для соревнований по программированию.

    Работал в Lamoda на должности Team Lead Analytics, принимал участие в формировании отдела бизнес-аналитики и анализа данных. Руководил проектами в госструктурах, отвечал за прогнозирование ключевых бизнес-KPI и структурирование данных большого объема. Управлял проектом по созданию математического комплекса алгоритмов 3D-картографии.

    Около 3 лет работал Quantitative Research. Занимался анализом и прогнозированием временных рядов, участвовал в создании модели стохастической волатильности.

     
    4 янв 2022