План на курса

I. Въведение и предварителна информация

1. Преглед

  • Правене на R по-приятелски, R и достъпни GUI
  • Rstudio
  • Свързан софтуер и документация
  • R и статистика
  • Използване на R интерактивно
  • Въвеждаща сесия
  • Получаване на помощ за функции и функции
  • R команди, чувствителност към главни и малки букви и др.
  • Припомняне и коригиране на предишни команди
  • Изпълнение на команди от или пренасочване на изход към файл
  • Постоянност на данните и премахване на обекти
  • Good практика на програмиране: Самостоятелни скриптове, добра четливост, напр. структурирани скриптове, документация, маркиране
  • инсталиране на пакети; CRAN и Bioпроводник

2. Четене на данни

  • Txt файлове (read.delim)
  • CSV файлове

3. Прости манипулации; числа и вектори + масиви

  • Вектори и задание
  • Векторна аритметика
  • Генериране на регулярни последователности
  • Логически вектори
  • Липсващи стойности
  • Символни вектори
  • Индексни вектори; избиране и модифициране на подмножества от набор от данни
    • Масиви
  • Индексиране на масиви. Подсекции на масив
  • Индексни матрици
  • Функцията array() + прости операции върху масиви, напр. умножение, транспониране
  • Други видове обекти

4. Списъци и рамки с данни

  • Списъци
  • Конструиране и модифициране на списъци
    • Конкатениране на списъци
  • Рамки за данни
    • Изработване на рамки за данни
    • Работа с рамки от данни
    • Прикачване на произволни списъци
    • Управление на пътя за търсене

5. Манипулиране на данни

  • Избор, подмножество наблюдения и променливи
  • Филтриране, групиране
  • Прекодиране, трансформации
  • Агрегиране, комбиниране на масиви от данни
  • Формиране на разделени матрици, cbind() и rbind()
  • Функцията за конкатенация, (), с масиви
  • Манипулиране на знаци, пакет stringr
  • кратко въведение в grep и regexpr

6. Повече за четене на данни

  • XLS, XLSX файлове
  • readr и readxl пакети
  • SPSS, SAS, Stata,… и други формати на данни
  • Експортиране на данни в txt, csv и други формати

6. Групиране, цикли и условно изпълнение

  • Групирани изрази
  • Контролни отчети
  • Условно изпълнение: оператори if
  • Повтарящо се изпълнение: за цикли, повторение и докато
  • въведение в apply, lapply, sapply, tappply

7. Функции

  • Създаване на функции
  • Незадължителни аргументи и стойности по подразбиране
  • Променлив брой аргументи
  • Обхват и последствията от него

8. Проста графика в R

  • Създаване на графика
  • Графики за плътност
  • Точкови графики
  • Бар Парцели
  • Линейни графики
  • Кръгови диаграми
  • Boxplots
  • Точкови графики
  • Комбиниране на сюжети

II. Статистически анализ в R

1. Вероятностни разпределения

  • R като набор от статистически таблици
  • Изследване на разпространението на набор от данни

2. Тестване на хипотези

  • Тестове за средна стойност на населението
  • Тест за коефициент на вероятност
  • Едно- и двупробни тестове
  • Хи-квадрат Goтест за съгласуваност
  • Едноизвадкова статистика на Колмогоров-Смирнов
  • Тест за знаков ранг на Wilcoxon
  • Тест с две проби
  • Тест за сума на ранг на Уилкоксън
  • Тест на Ман-Уитни
  • Тест на Колмогоров-Смирнов

3. Многократно тестване на хипотези

  • Тип I грешка и FDR
  • ROC криви и AUC
  • Множество процедури за тестване (BH, Bonferroni и др.)

4. Линейни регресионни модели

  • Генерични функции за извличане на информация за модела
  • Актуализиране на вталените модели
  • Обобщени линейни модели
    • Семейства
    • Функцията glm().
  • Класификация
    • Логистична регресия
    • Линеен дискриминантен анализ
  • Учене без надзор
    • Анализ на основните компоненти
    • Методи за групиране (k-средни, йерархично групиране, k-medoids)

5. Анализ на оцеляването (пакет за оцеляване)

  • Обекти за оцеляване в r
  • Оценка на Каплан-Майер, log-rank тест, параметрична регресия
  • Ленти за доверие
  • Анализ на цензурирани (интервално цензурирани) данни
  • Cox PH модели, постоянни ковариати
  • Cox PH модели, зависими от времето ковариати
  • Симулация: Сравнение на модели (Сравняване на регресионни модели)

6. Анализ на дисперсията

  • Еднопосочна ANOVA
  • Двупосочна класификация на ANOVA
  • МАНОВА

III. Работени задачи по биоинформатика

  • Кратко въведение в пакета limma
  • Работен процес за анализ на данни от микрочипове
  • Изтегляне на данни от GEO: https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1397
  • Обработка на данни (QC, нормализация, диференциално изразяване)
  • Сюжет за вулкан
  • Примери за Custering + топлинни карти
 28 Часа

Брой участници


Цена за участник

Oтзиви от потребители (5)

Предстоящи Курсове

Свързани Kатегории