Дорогие друзья и коллеги. Надвигается осень, и я объявляю набор в группу для желающих освоить основы анализа данных и прикладной статистики в R. Язык R — мой рабочий инструмент, которым я пользуюсь уже более десяти лет. С его помощью я анализирую массивы исторических данных в своих исследовательских проектах, ищу цифровые следы фальсификаций в данных с выборов, готовлю отчеты о ходе эпидемии COVID-19.
Ссылка на форму для записи:
https://forms.gle/nCDquxSScWxBoj4K7
Курс рассчитан на 16 занятий (8 недель по два занятия), занятия проходят по понедельникам и четвергам (18:30--20:30 Московского времени, GMT+3) начнутся 19 сентября 2022, в понедельник. Оплата помесячно, 7.5 тыс. р. за четыре недели занятий, 15 тыс. р. за весь курс(*). Занятия проходят в Zoom.
(*) Для слушавших у меня курсы по близким темам ранее предусмотрена скидка (6 + 6 = 12 тыс.)
Что нужно знать и уметь для освоения курса? (1) Знать, где на Вашем компьютере находится папка "Мои документы" и какие примерно файлы и папки в ней лежат. (2) Суметь самостоятельно или с помощью друзей поставить на свой компьютер хотя бы некоторые из программ, которые мы будем изучать (список будет разослан записавшимся).
Два слова о содержании курса. Он состоит из нескольких модулей:
(1) Как выглядят данные, подготвленные для анализа. Основные чеовеко-и-машиночитаемые форматы данных: CSV и TDV, JSON и XML.
(2) Как начать работать в R, если Вы раньше никогда этого не делали (или делали, но все равно боитесь). Как загрузить в R подготовленные данные (чтение CSV, TDV и файлов XLSX). Что такое объекты R и зачем надо ориентироваться в том, как они устроены? Структура данных и ее отражение в объектах R. Классы объектов, обращение к хранящимся в них данным и преобразования.
(3) Грамматика инфографики — основные типы графиков одной и двух переменных и их связь с моделями, используемыми в анализе данных. Печать графики в файлы. Создание массивов однотипных изображений.
(4) Как связаны с моделями взаимодействия переменных и их графическими образами методы формального анализа? Методы формального анализа, направленные на проверку гипотез о случайности наблюдаемых паттернов того или иного рода (t-test, ANOVA, Chi-squared, корреляции, линейная регрессия, основы непараметрических методов).
Для привлечения внимания — динамика эпидемии COVID-19 в Петербурге по эпид. номерам.