Аналитик данных
МГТУ им. Н. Э. Баумана

мой отзыв по курсу Python-разработчик
Я оставляю отзыв о каждом спринте, который прохожу и группирую полезный материал для одногруппников и будущих студентов.
СОДЕРЖАНИЕ
1
Введение в предмет
Спринт-1 15.09.2022 - 22.09.2022
Во вводном курсе описаны основы применения методов обработки больших данных в компаниях. Разбираются основные термины из профессии.
2
Аспекты информационной безопасности
Спринт-2 24.09.2022 - 29.09.2022
Описаны основные моменты при работе с информацией.
3
Языки программирования, среды исполнения и основные операционные системы, которые используются в задачах Big Data.
Спринт-3 01.10.2022 - 6.10.2022
Описаны основные моменты языка Python.
- Базовые конструкции
- Циклы и условия
- Библиотека NumPy
- Библиотека SciPy
- Библиотека Pandas
- Визуализация в Python. Библиотека Matplotlib, seaborn, plotly
- Работа с командной строкой
4
Основной pipeline машинного обучения и dataflow. Облачные платформы.
Спринт-4 8.10.2022-13.10.2022
- Особенности архитектурных решений
- Библиотека Sklearn
- Ленивые вычисления
5
Парсинг данных, подготовка выборки, препроцессинг и балансировка данных.
Спринт-5 15.10.2022-20.10.2022
- Ключевые задачи в подготовке датасетов
- Нормализация и стандартизация
- Поиск аномалий и выбросов.
- Разбалансированные датасеты и методы балансировки
- Обработка категориальных признаков. LabelEncoder, One Hot encoding
- Доверительные интервалы
- Библиотека Beautifulsoup.
6
Обучение без учителя. Работа с размерностью и структурой данных
Спринт-6 22.10.2022-27.10.2022
- Обучение на размеченных и неразмеченных данных
- Проблема снижения размерности данных
- Алгоритмы кластеризации
7
Теория вероятности и вероятностные классификаторы
Спринт-7 29.10.2022-03.10.2022
- Полная и условная вероятность, теорема Байеса
- Байесовский вероятностный классификатор
8
Классификация. Оценка качества алгоритма
Спринт-8 05.11.2022-10.11.2022
- Задача классификации. Матрица ошибок. Точность классификации. Модель анализа ROC-AUC.
- Методы классификации. Метод ближайших соседей k-NN. Метод опорных векторов (SVM
9
Ансамбли и повышение точности алгоритмов
Спринт-9 13.11.2022-17.11.2022
- Ансамбли решателей. Решающие деревья (Decision tree). Случайный лес (Random forest).
- Ансамбли алгоритмов. Bagging, boosting, stacking. Основы составления сеток обучения.
10
Регрессия
Спринт-10 20.11.2022-24.11.2022
- Линейная регрессия. Логистическая регрессия.
- Метод наименьших квадратов. Средняя квадратичная ошибка, средняя абсолютная ошибка.
- Авторегрессия ARIMA.
11
Нейронный сети
Спринт-11 26.11.2022-30.11.2022
- Введение в искусственные нейронные сети.
- Полносвязные нейронные сети. Методы обучения нейронных сетей.
- Сверточные нейронные сети.
12
Промежуточная аттестация
28.11.2022-02.12.2022
13
Разработка компьютерных программ: написание программного кода и решение практических задач с применением нейронных сетей.
Спринт-12 03.12.2022-08.12.2022
- Нейронные сети в задачах классификации.
- Архитектуры для решения задач регрессии.
- Прогнозирование временных рядов с применением нейронных сетей. Особенности препроцессинга и архитектур.
- Object detection
- Segmentation в компьютерном зрении
- Анализ аудио, особенности препроцессинга
- Классификация текстов
- Метод обратного распространения ошибки
- Генеративные состязательные сети
14
Создание приложений, интеграция в ИТ ландшафт
Спринт-13 04.12.2022-09.12.2022
- Портирование и сохранение моделей
- Работа с предобученными моделями
- Flask приложение. Выведение моделей в production
- Контроль версионности моделей с tensorflow sesrving
- Облачная платформа Kaggle для решения data science задач
15
Промежуточная аттестация по модулю 2
08.12.2022-11.12.2022
16
Итоговая аттестация
03.12.2022-15.12.2022