План на курса
- Machine Learning въведение
- Видове машинно обучение – контролирано срещу неконтролирано обучение
- От статистическо обучение до машинно обучение
- Работният процес Data Mining:
- Business разбиране
- Разбиране на данните
- Подготовка на данни
- Моделиране
- Оценка
- Разгръщане
- Алгоритми за машинно обучение
- Избор на подходящ алгоритъм за проблема
- Свръхнастройка и компромис с отклонение в ML
- ML библиотеки и езици за програмиране
- Защо да използвате език за програмиране
- Избор между R и Python
- Python интензивен курс
- Python ресурси
- Python Библиотеки за машинно обучение
- Преносими компютри Jupyter и интерактивно кодиране
- Тестване на ML алгоритми
- Обобщаване и пренастройване
- Избягване на претоварване
- Метод на задържане
- Кръстосано валидиране
- Bootstrapпинг
- Оценяване на числени прогнози
- Мерки за точност: ME, MSE, RMSE, MAPE
- Параметър и стабилност на прогнозата
- Оценяване на класификационни алгоритми
- Точността и нейните проблеми
- Матрицата на объркването
- Проблем с небалансирани класове
- Визуализиране на производителността на модела
- Крива на печалбата
- ROC крива
- Крива на повдигане
- Избор на модел
- Настройка на модела – стратегии за търсене в мрежа
- Примери в Python
- Подготовка на данни
- Импортиране и съхранение на данни
- Разберете данните – основни изследвания
- Манипулиране на данни с pandas библиотека
- Трансформации на данни – Разбор на данни
- Проучвателен анализ
- Липсващи наблюдения – откриване и решения
- Outliers – откриване и стратегии
- Стандартизация, нормализация, бинаризация
- Качествено записване на данни
- Примери в Python
- Класификация
- Двоична срещу многокласова класификация
- Класификация чрез математически функции
- Линейни дискриминантни функции
- Квадратични дискриминантни функции
- Логистична регресия и вероятностен подход
- k-най-близки съседи
- Наивен Байес
- Дървета на решенията
- КОЛИЧКА
- Пакетиране
- Random Forests
- Подсилване
- Xgboost
- Поддръжка на векторни машини и ядра
- Класификатор за максимален марж
- Поддържаща векторна машина
- Ансамбълно обучение
- Примери в Python
- Регресия и числено прогнозиране
- Оценка на най-малките квадрати
- Техники за избор на променливи
- Регулиране и стабилност- L1, L2
- Нелинейности и обобщени най-малки квадрати
- Полиномиална регресия
- Регресионни сплайнове
- Регресионни дървета
- Примери в Python
- Учене без надзор
- Клъстеризиране
- Групиране на базата на центроид – k-средни, k-medoids, PAM, CLARA
- Йерархично групиране – Диана, Агнес
- Моделно базирано групиране - EM
- Самоорганизиращи се карти
- Оценка и оценка на клъстери
- Намаляване на размерността
- Анализ на главните компоненти и факторен анализ
- Разлагане на сингулярна стойност
- Многомерно мащабиране
- Примери в Python
- Клъстеризиране
- Копаене на текст
- Предварителна обработка на данни
- Моделът на торбата с думи
- Стемиране и лемизация
- Анализиране на честотите на думите
- Анализ на настроението
- Създаване на облаци от думи
- Примери в Python
- Механизми за препоръки и съвместно филтриране
- Данни за препоръки
- Съвместно филтриране, базирано на потребителя
- Съвместно филтриране на базата на елементи
- Примери в Python
- Извличане на модели на асоциации
- Алгоритъм за чести набори от елементи
- Анализ на пазарната кошница
- Примери в Python
- Анализ на извънредни стойности
- Анализ на екстремни стойности
- Откриване на отклонения на базата на разстояние
- Методи, базирани на плътност
- Откриване на извънредни стойности с големи размери
- Примери в Python
- Machine Learning казус
- Business разбиране на проблема
- Предварителна обработка на данни
- Избор и настройка на алгоритъм
- Оценка на констатациите
- Разгръщане
Изисквания
Познаване и осъзнаване на Machine Learning основи
Oтзиви от потребители (3)
Even with having to miss a day due to customer meetings, I feel I have a much clearer understanding of the processes and techniques used in Machine Learning and when I would use one approach over another. Our challenge now is to practice what we have learned and start to apply it to our problem domain
Richard Blewett - Rock Solid Knowledge Ltd
Курс - Machine Learning – Data science
I like that training was focused on examples and coding. I thought that it is impossible to pack so much content into three days of training, but I was wrong. Training covered many topics and everything was done in a very detailed manner (especially tuning of model's parameters - I didn't expected that there will be a time for this and I was gratly surprised).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Курс - Machine Learning – Data science
It is showing many methods with pre prepared scripts- very nicely prepared materials & easy to traceback