План на курса
Statistics и вероятностни Programming в Julia
Основна статистика
- Statistics
- Резюме Statistics със статистическия пакет
- Дистрибуции и пакет StatsBase
- Едновариантни и многовариантни
- Моменти
- Вероятностни функции
- Вземане на проби и RNG
- Хистограми
- Оценка на максималната вероятност
- Продукт, обработка и цензурирано разпространение
- Стабилна статистика
- Корелация и ковариация
DataFrames
(пакет DataFrames)
- Вход/изход на данни
- Създаване на рамки с данни
- Типове данни, включително категорични и липсващи данни
- Сортиране и свързване
- Преоформяне и завъртане на данни
Проверка на хипотези
(Пакет HypothesisTests)
- Принципно описание на проверката на хипотези
- Хи-квадрат тест
- z-тест и t-тест
- F-тест
- Точен тест на Фишер
- ANOVA
- Тестове за нормалност
- Тест на Колмогоров-Смирнов
- T-тест на Hotelling
Регресия и анализ на оцеляването
(пакети GLM и Survival)
- Принципно описание на линейна регресия и експоненциално семейство
- Линейна регресия
- Обобщени линейни модели
- Логистична регресия
- Поасонова регресия
- Гама регресия
- Други модели на GLM
- Анализ на оцеляването
- събития
- Каплан-Майер
- Нелсън-Аален
- Пропорционална опасност на Кокс
Разстояния
(пакет от разстояния)
- Какво е разстояние?
- Евклидов
- Ситиблок
- Косинус
- Корелация
- Махаланобис
- Хеминг
- ЛУД
- RMS
- Средно квадратно отклонение
Многовариантна статистика
(Пакети MultivariateStats, Lasso и Loess)
- Гребенна регресия
- Ласо регресия
- Льос
- Линеен дискриминантен анализ
- Анализ на основните компоненти (PCA)
- Линеен PCA
- PCA на ядрото
- Вероятностна PCA
- Независим CA
- Регресия на главния компонент (PCR)
- Факторен анализ
- Каноничен корелационен анализ
- Многомерно мащабиране
Клъстеризиране
(Пакет за групиране)
- К-означава
- К-медоиди
- DBSCAN
- Йерархично групиране
- Клъстерен алгоритъм на Марков
- Fuzzy C-означава групиране
Bayesian Statistics & Probabilistic Programming
(пакет Turing)
- Верига Марков Модел Карло
- Хамилтонов Монтел Карло
- Гаусови смесени модели
- Байесова линейна регресия
- Байесова експоненциална семейна регресия
- байесовски Neural Networks
- Скрити марковски модели
- Филтриране на частици
- Вариационен извод
Изисквания
Този курс е предназначен за хора, които вече имат опит в науката за данните и статистиката.
Oтзиви от потребители (5)
Вариантът с упражнения и показване.
Ida Sjoberg - Swedish National Debt Office
Курс - Econometrics: Eviews and Risk Simulator
Машинен превод
the trainer had patience, and was eager to make sure we all understood the topics, the classes were fun to attend
Mamonyane Taoana - Road Safety Department
Курс - Statistical Analysis using SPSS
Day 1 and Day 2 were really straight forward for me and really enjoyed that experience.
Mareca Sithole - Africa Health Research Institute
Курс - R Fundamentals
The pace was just right and the relaxed atmosphere made candidates feel at ease to ask questions.
Rhian Hughes - Public Health Wales NHS Trust
Курс - Introduction to Data Visualization with Tidyverse and R
Michael the trainer is very knowledgeable and skillful about the subject of Big Data and R. He is very flexible and quickly customize the training meeting clients' need. He is also very capable to solve technical and subject matter problems on the go. Fantastic and professional training!.