Каратеев А. Ю.
Рассматривается популярный среди исследователей язык программирования R и его возможности применительно к решению типичных задач социально-политического анализа и моделирования социально-политических процессов. Издание, прежде всего, ориентировано на тех, кто не имеет опыта программирования, но хотел бы освоить язык R и использовать его возможности для выполнения математических расчетов, создания ветвящихся алгоритмов, организации циклических вычислений, описания данных с помощью описательной статистики, анализа связей между переменными, построения регрессионных моделей, проведения кластерного анализа, визуализации данных и результатов их анализа. Для студентов специальностей «Социология», «Политология», «Политические науки и регионоведение», «Прикладная математика и информатика», «Статистика», а также всех, кто хотел бы применять R при обработке данных и решении задач прикладных исследований.
1. Введение 7
2. Преимущества R 9
3. Установка R 10
4. Запуск R и пользовательский интерфейс 11
5. Дополнительные материалы 15
6. Простые математические действия 17
6.1. Сложение, вычитание 17
6.2. Умножение, деление 17
6.3. Возведение в степень 17
6.4. Логарифмирование 18
6.5. Тригонометрические функции 18
6.6. Обратные тригонометрические функции 19
6.7. Задание приоритета действий 20
6.8. Полезные советы: повторный ввод команд, использование Copy-Paste 20
7. Простые преобразования числовых данных 23
7.1. Модуль 23
7.2. Округление до нужного количества знаков в дробной части 23
7.3. Округление до целых 23
7.4. Целая часть (округление в меньшую сторону) 24
7.5. Целая часть (округление в большую сторону) 24
7.6. Остаток при делении 24
8. Переменные, присвоение значений переменным, действия с переменными и вывод значений переменных 26
8.1. Присвоение значений переменным 28
8.2. Вывод значений переменных 28
8.3. Ввод и вывод значений нескольких переменных 28
8.4. Действия с переменными 29
8.5. Зависимости между переменными и обновление значения переменной 30
8.6. Текстовые переменные 31
8.7. Оператор print 31
8.8. Оператор paste 32
9. Проверка условий 34
9.1. Операторы проверки условий 34
9.2. Сложные условия. Логическое И 36
9.3. Сложные условия. Логическое ИЛИ 36
9.4. Оператор if 37
10. Циклы 41
10.1. Оператор while 41
10.2. Выполнение нескольких действий в операторе while 43
10.3. Счетчик цикла 43
10.4. Полезные советы: R Editor, комментарии и визуальное оформление кода 44
10.5. Совместное использование while и if 48
11. Одномерные массивы (векторы) 56
11.1. Задание одномерного массива (вектора) 56
11.2. Задание отдельных элементов массива и их вывод 58
11.3. Задание и редактирование массива с помощью оператора data.entry 59
11.4. Действия с элементами массива 60
11.5. Задание имен элементам массива 61
11.6. Использование имен элементов массива 62
11.7. Дополнительные способы задания массивов 62
11.8. Действия с массивами 64
11.9. Сложение и перемножение одномерных массивов 65
11.10. Длина массива 66
11.11. Сортировка элементов массива 66
11.12. Максимальное и минимальное значения массива 67
11.13. Сумма элементов массива 67
11.14. Добавление элементов в массив 68
11.15. Удаление элементов из массива 68
11.16. Создание нового массива на основе имеющегося 70
12. Двумерные и многомерные массивы 73
12.1. Задание двумерного массива 73
12.2. Задание отдельных элементов массива и их вывод 76
12.3. Создание нового массива на основе имеющегося 78
12.4. Задание и редактирование массива с помощью оператора data.entry 79
12.5. Данные о массиве 81
12.6. Данные об элементах массива 82
12.7. Действия с массивами 84
12.8. Сортировка 85
12.9. Добавление строк и столбцов в массив, объединение массивов 89
12.10. Импорт массивов в R 93
12.11. Экспорт из R 96
12.12. Многомерный массив 99
13. Статистики одномерного распределения 107
13.1. Минимум и максимум 108
13.2. Среднее арифметическое и медиана 108
13.3. Частота встречаемости оценок 108
13.4. Мода 109
13.5. Амплитуда 109
13.6. Стандартное отклонение, дисперсия, межквартильный диапазон 109
13.7. Получение обобщенных сведений 110
13.8. Квартили, децили и квантили 110
13.9. Доверительный интервал 111
14. Визуализация одномерного распределения 114
14.1. Таблица частоты встречаемости оценок 114
14.2. График 114
14.3. Гистограмма 119
14.4. «Ящик с усами» 122
14.5. Круговая диаграмма 124
15. Анализ связей между переменными 129
15.1. Диаграмма рассеивания 129
15.2. Коэффициент линейной корреляции Пирсона 131
15.3. Проверка коэффициента Пирсона
на статистическую значимость 132
15.4. Коэффициент ранговой корреляции Спирмена 135
15.5. Проверка коэффициента Спирмена на статистическую значимость 138
15.6. Линейная регрессионная модель 140
15.7. Визуализация регрессионной модели 142
15.8. Оценка качества регрессионной модели 144
15.9. Множественная линейная регрессия 147
15.10. Оценка качества множественной линейной регрессионной модели 148
16. Методы классификации 154
16.1. Иерархический кластерный анализ 154
16.2. Кластерный анализ методом K-средних 161
17. Ответы к заданиям 173