<?xml version='1.0' encoding='UTF-8'?><?xml-stylesheet href="http://www.blogger.com/styles/atom.css" type="text/css"?><feed xmlns='http://www.w3.org/2005/Atom' xmlns:openSearch='http://a9.com/-/spec/opensearchrss/1.0/' xmlns:blogger='http://schemas.google.com/blogger/2008' xmlns:georss='http://www.georss.org/georss' xmlns:gd="http://schemas.google.com/g/2005" xmlns:thr='http://purl.org/syndication/thread/1.0'><id>tag:blogger.com,1999:blog-9120847565867616203</id><updated>2018-04-01T14:57:50.013+01:00</updated><category term="R-события"/><category term="R-пакеты"/><category term="R-функции"/><category term="книги"/><category term="визуализация данных"/><category term="машинное обучение"/><category term="базовые графические возможности"/><category term="классические методы статистики"/><category term="общие линейные модели"/><category term="RStudio"/><category term="линейные модели"/><category term="caret"/><category term="ANOVA"/><category term="разведочный анализ данных"/><category term="типы данных"/><category term="ggplot2"/><category term="дисперсионный анализ"/><category term="множественные сравнения"/><category term="учебные пособия"/><category term="рассуждения о статистике"/><category term="CRAN"/><category term="Revolution Analytics"/><category term="критерий хи-квадрат"/><category term="пространственные данные"/><category term="Inside-R"/><category term="shiny"/><category term="twitter"/><category term="анализ временных рядов"/><category term="диаграммы размахов"/><category term="нормальное распределение"/><category term="EARL"/><category term="F-тест"/><category term="R-bloggers"/><category term="coplot"/><category term="googleVis"/><category term="t-тест"/><category term="делимся опытом"/><category term="деревья решений"/><category term="диаграммы рассеяния"/><category term="информационные критерии"/><category term="картограммы"/><category term="категоризованные графики"/><category term="контент-анализ"/><category term="корреляция"/><category term="критерий Стьюдента"/><category term="мощность теста"/><category term="облако слов"/><category term="обобщенные линейные модели"/><category term="однородность групповых дисперсий"/><category term="переобучение"/><category term="распределение вероятностей"/><category term="рейтинг TIOBE"/><category term="статистические модели"/><category term="таблица данных"/><category term="точечные диаграммы Кливленда"/><category term="ARIMA"/><category term="ASA"/><category term="BUGS"/><category term="CART"/><category term="CRISP-DM"/><category term="GGally"/><category term="Google Scholar"/><category term="Google Scholar Citations"/><category term="MuMIn"/><category term="Quick R"/><category term="Random Forest"/><category term="Rcpp"/><category term="STAN"/><category term="apply"/><category term="cdplot"/><category term="dplyr"/><category term="ggmap"/><category term="h2o"/><category term="kNN"/><category term="lattice"/><category term="plotly"/><category term="rpart"/><category term="statistics.com"/><category term="statnet"/><category term="train"/><category term="анализ сетей"/><category term="ансамбль моделей"/><category term="биоинформатика"/><category term="веб-приложения"/><category term="векторизованные вычисления"/><category term="векторы"/><category term="взаимодействие предикторов"/><category term="выбросы"/><category term="генератор случайных чисел"/><category term="гистограммы"/><category term="глубокое обучение"/><category term="график квантилей"/><category term="данные"/><category term="документация"/><category term="импортирование данных"/><category term="карты Google"/><category term="классификация"/><category term="контрасты"/><category term="конференция"/><category term="коэффициент корреляции"/><category term="критерий Кохрана-Мантеля-Хензеля"/><category term="критерий Мак-Немара"/><category term="критерий Тьюки"/><category term="критерий Уилкоксона"/><category term="критерий Фишера"/><category term="критерий согласия Пирсона"/><category term="круговые диаграммы"/><category term="лог-файлы"/><category term="маркеры"/><category term="матрица модели"/><category term="матрицы"/><category term="матричные диаграммы рассеяния"/><category term="многоуровневые модели"/><category term="модели со смешанными эффектами"/><category term="мультиколлинеарность"/><category term="одномерные диаграммы размахов"/><category term="параметры описательной статистики"/><category term="предсказательные модели"/><category term="пропущенные значения"/><category term="регрессия"/><category term="селекция моделей"/><category term="семантический анализ"/><category term="списки"/><category term="статистическое обучение"/><category term="столбиковые диаграммы"/><category term="таблица сопряженности"/><category term="тест Бартлетта"/><category term="тест Левене"/><category term="тест Флигнера"/><category term="тест Шапиро-Уилка"/><category term="точный тест Фишера"/><category term="фактор инфляции дисперсии"/><category term="факторы"/><title type='text'>R: Анализ и визуализация данных</title><subtitle type='html'></subtitle><link rel='http://schemas.google.com/g/2005#feed' type='application/atom+xml' href='http://r-analytics.blogspot.com/feeds/posts/default'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default?redirect=false'/><link rel='alternate' type='text/html' href='http://r-analytics.blogspot.com/'/><link rel='hub' href='http://pubsubhubbub.appspot.com/'/><link rel='next' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default?start-index=26&amp;max-results=25&amp;redirect=false'/><author><name>Sergey Mastitsky</name><uri>https://plus.google.com/100743762419147389233</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='32' height='32' src='//lh3.googleusercontent.com/-S7CBBqIIWg0/AAAAAAAAAAI/AAAAAAAAANI/e7vggjNa3Mo/s512-c/photo.jpg'/></author><generator version='7.00' uri='http://www.blogger.com'>Blogger</generator><openSearch:totalResults>217</openSearch:totalResults><openSearch:startIndex>1</openSearch:startIndex><openSearch:itemsPerPage>25</openSearch:itemsPerPage><entry><id>tag:blogger.com,1999:blog-9120847565867616203.post-4277851432674845147</id><published>2018-03-03T12:44:00.000+00:00</published><updated>2018-03-03T12:45:24.962+00:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="ансамбль моделей"/><title type='text'>Работа с пакетом MuMIn. Часть 2: Объединение моделей для получения коллективного решения</title><content type='html'>&lt;div dir=&quot;ltr&quot; style=&quot;text-align: right;&quot; trbidi=&quot;on&quot;&gt;&lt;i&gt;Автор: Владимир Шитиков&lt;/i&gt;&lt;/div&gt;&lt;div dir=&quot;ltr&quot; trbidi=&quot;on&quot;&gt;&lt;b&gt;&lt;br /&gt;&lt;/b&gt;&lt;/div&gt;&lt;div dir=&quot;ltr&quot; trbidi=&quot;on&quot;&gt;&lt;b&gt;Методы обобщения моделей и прогнозов&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;По аналогии с коллективными методами принятия решений, столь эффективно используемыми в человеческом обществе, принято считать, что суммарная эффективность любой мультимодельной системы распознавания или прогнозирования теоретически будет в среднем выше отдельных ее членов. Поэтому в последние несколько десятилетий активно разрабатывались возможные подходы к тому, как построить на одних и тех же исходных данных некоторый &quot;коллектив&quot; (&lt;i&gt;ensemble&lt;/i&gt;) частных одно- или разнотипных моделей и выполнить их обобщение (&lt;i&gt;averaging&lt;/i&gt;) с целью получить более обоснованное комбинированное решение (&lt;i&gt;forecast combinations&lt;/i&gt;, или &lt;i&gt;multimodel inference&lt;/i&gt;).&lt;br /&gt;&lt;br /&gt;&lt;script async=&quot;&quot; src=&quot;//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js&quot;&gt;&lt;/script&gt;&lt;!-- R Analytics Responsive --&gt;&lt;br /&gt;&lt;ins class=&quot;adsbygoogle&quot; data-ad-client=&quot;ca-pub-6457966355894443&quot; data-ad-format=&quot;auto&quot; data-ad-slot=&quot;8123690788&quot; style=&quot;display: block;&quot;&gt;&lt;/ins&gt;&lt;script&gt;(adsbygoogle = window.adsbygoogle || []).push({}); &lt;/script&gt; &lt;br /&gt;&lt;br /&gt;&lt;a name=&#39;more&#39;&gt;&lt;/a&gt;&lt;/div&gt;&lt;/div&gt;&lt;div dir=&quot;ltr&quot; trbidi=&quot;on&quot;&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;В &lt;a href=&quot;http://r-analytics.blogspot.co.uk/2018/01/mumin-1.html&quot; target=&quot;_blank&quot;&gt;предыдущем сообщении&lt;/a&gt;&amp;nbsp;мы с помощью пакета &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;MuMIn&lt;/span&gt;&lt;span style=&quot;font-family: inherit;&quot;&gt; &lt;/span&gt;выполняли ранжирование построенных моделей по их относительной подтверждающей силе (&lt;i&gt;strength of evidence&lt;/i&gt;), которая количественно оценивалась с использованием информационных критериев. Однако часто существует обоснованное сомнение в том, что та или иная модель, отобранная как оптимальная, сможет в полной мере объяснить все механизмы моделируемых процессов и выполнять устойчивые прогнозы на всей области определения исходных данных. Не исключено, что существенную долю полезной информации несут в себе вторая, третья и последующие модели из рассматриваемого набора. Учет этой информации часто позволяет скомпенсировать стохастические флуктуации прогнозов единственной модели, выбранной в качестве оптимальной. &lt;br /&gt;&lt;br /&gt;Выделяют два возможных подхода к получению коллективного решения (Burnham &amp;amp; Anderson 2002): объединение прогнозов и усреднение параметров моделей. В первом случае рассматриваются расчетные значения \(\hat{y}_1, \hat{y}_2, \dots, \hat{y}_r\) отклика &lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-weight: normal;&quot;&gt;\(Y\)&lt;/span&gt;&lt;/span&gt;, полученные с помощью &lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-weight: normal;&quot;&gt;\(r\) &lt;/span&gt;&lt;/span&gt;различных моделей. Тогда коллективным мультимодельным прогнозом \(\hat{y}_g\) будет расчетное значение анализируемой переменной &lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-weight: normal;&quot;&gt;\(Y\)&lt;/span&gt;&lt;/span&gt;, вычисленное как некоторая функция индивидуальных прогнозов \( \hat{y}_g = f(\hat{y}_1, \hat{y}_2, \dots, \hat{y}_r) \). На практике чаще всего применяют простейшие методы взвешенного усреднения, которые представляют решение в виде линейной комбинации наиболее информативного множества частных прогнозов \[\hat{y}_g =&amp;nbsp; \sum_{k=1}^{r} \hat{y}_k \omega_{k},\] где \(\omega_{k}\) –&amp;nbsp; весовые коэффициенты для каждого&amp;nbsp; \(\hat{y}_k\), значения которых неизменны на всем диапазоне варьирования исходных данных \(\boldsymbol{X}\).&lt;br /&gt;&lt;br /&gt;Второй путь основан на использовании различных способов объединения оценок параметров \(\hat{\beta}_{k}\) для отобранного подмножества регрессионных моделей&amp;nbsp; &lt;span style=&quot;font-size: small;&quot;&gt;\(g_1, g_2, \dots, g_r\)&lt;/span&gt;. В результате этого рассчитываются коэффициенты новой агрегированной модели регрессии \(\hat{\beta}_{g} = f(\hat{\beta}_{k} | g_k, \omega_{k})\), обеспечивающие необходимую точность прогнозирования. Функция &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;model.avg()&lt;/span&gt;&amp;nbsp;из пакета &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;MuMIn&lt;/span&gt; использует при этом два простых механизма усреднения моделей (&lt;i&gt;model averaging&lt;/i&gt;). В обоих случаях для вычисления средневзвешенных коэффициентов&amp;nbsp; \(\hat{\beta}_{g}\) чаще всего применяются веса \(w_k\) (&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;weight&lt;/span&gt;), полученные на основе разностей информационных критериев (см.&amp;nbsp;&lt;a href=&quot;http://r-analytics.blogspot.ru/2018/01/mumin-1.html&quot;&gt;первое сообщение&lt;/a&gt;).&lt;br /&gt;&lt;br /&gt;Агрегированная модель с &quot;полными&quot; коэффициентами (&lt;i&gt;&quot;full&quot;, &lt;/i&gt;или &lt;i&gt;&quot;shrinkage model-averaged coeffcients&quot;&lt;/i&gt;) основана на формуле простого взвешенного среднего, предполагающей, что веса \(\omega_{k}\)  для коэффициентов каждой объединяемой модели одинаковы для всех предикторов:&lt;br /&gt;&lt;br /&gt;\[ \hat{\beta}_{ig} =&amp;nbsp; \sum_{k=1}^{r} \hat{\beta}_{ik}&amp;nbsp; \omega_{k}, \qquad \omega_{k} =&amp;nbsp;&amp;nbsp; w_k&amp;nbsp; / \sum _{k=1}^{r} w_k , \]&lt;br /&gt;&lt;br /&gt;где&amp;nbsp; \(\hat{\beta}_{ik}\) - коэффициент при \(i\)-й переменной в \(k\)-й модели; \(\hat{\beta}_{ik}\) = 0, если переменная \(i\) не включена в модель \(g_k\). Отметим такую важную особенность, что ошибки коэффициентов такой агрегированной регрессионной модели включают дополнительный член (Lukacs et al. 2009): \[ var(\hat{\beta}_{ig}) = \sum_{k=1}^{r} \omega_{k} [var(\hat{\beta}_{ik}) + (\hat{y}_g - \hat{y}_k)^2 ], \] что обычно трактуется как некая особая форма регуляризации (сходная с гребневой регрессией или лассо), а сами коэффициенты называют сжатыми (&lt;i&gt;&quot;coefficients with shrinkage&quot;&lt;/i&gt;).&lt;br /&gt;&lt;br /&gt;Для агрегированной модели с &quot;условными&quot; коэффициентами (&lt;i&gt;&quot;conditional&quot;, &lt;/i&gt;или&amp;nbsp;&lt;i&gt;&quot;subset model-averaged coefficients&quot;&lt;/i&gt;) используется механизм взвешенного усреднения с учетом коэффициентов только тех переменных, которые включены в конкретные частные модели. Для этого составляется матрица индикаторных значений \(\Gamma_{ik}\), принимающих значения 1, если предиктор &lt;i&gt;i&lt;/i&gt; входит в&lt;i&gt; k&lt;/i&gt;-ю модель, и 0 в противном случае. Тогда коэффициенты агрегированной модели рассчитываются как \[ \hat{\beta}_{ig} = \sum_{k=1}^{r} \hat{\beta}_{ik} \omega_{k} \Gamma_{ik} / \sum_{k=1}^{r} \omega_{k}  \Gamma_{ik}.\] Условные коэффициенты по своей величине всегда превышают полные и равны им, если \(i\)-я переменная включена во все&lt;i&gt;&amp;nbsp;&lt;/i&gt;\(r\)&amp;nbsp;моделей.&lt;br /&gt;&lt;br /&gt;Существуют разные мнения относительно того, какие коэффициенты обобщенной модели (&quot;условные&quot; или &quot;полные&quot;) являются более адекватными. Мы полагаем, что эта дискуссия не имеет особого смысла, поскольку оба подхода основаны на двух теоретически корректных способах нахождения средних (т.е. с учетом отсутствующих значений или без). Многое зависит от того, какова структура причинно-следственных связей в конкретном наборе данных: использование &quot;условных&quot; коэффициентов, придающих несколько большее значение относительно &quot;слабым&quot; предикторам, чаще всего оказывается предпочтительным в сложных случаях статистических взаимодействий.&lt;br /&gt;&lt;br /&gt;Для оценки весов&amp;nbsp; \(\omega_{k}\) кроме использования разностей информационных критериев \(\Delta\), можно применять и иные методы, иногда более подходящие для решения конкретной задачи. В пакет &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;MuMIn&lt;/span&gt; включены функции расчета вектора \(\omega\), основанные на создании повторных выборок (бутстреп, кросс-проверка, метод «складного ножа»), алгоритме Бейтса-Гренджера, косинусных функциях, адаптивной регрессии, методах Монте-Карло и т.д.&amp;nbsp;&lt;/div&gt;&lt;br /&gt;&lt;br /&gt;&lt;b&gt; Теплота гидратации цемента&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;В &lt;a href=&quot;http://r-analytics.blogspot.ru/2018/01/mumin-1.html&quot;&gt;предыдущем сообщении&lt;/a&gt;&amp;nbsp;мы рассмотрели набор данных &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;Cement&lt;/span&gt;&amp;nbsp;и построили для него 16 возможных частных моделей, которые были ранжированы по возрастанию информационного критерия AICc. Сформируем подмножество наилучших моделей, покрывающих 95% вычисленных весов, т.е. &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;cumsum(weight) &amp;lt;= .95&lt;/span&gt;. Дополнительно с использованием параметра &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;extra&lt;/span&gt; рассчитаем для каждой модели такие общепринятые показатели, как обычный и скорректированный коэффициенты детерминации, а также F-критерий:&lt;/div&gt;&lt;/div&gt;&lt;div dir=&quot;ltr&quot; trbidi=&quot;on&quot;&gt;&amp;nbsp; &lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;  library(MuMIn)&lt;br /&gt;  options(na.action &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;na.fail&quot;&lt;/span&gt;)&lt;br /&gt;&lt;span style=&quot;color: #406040;&quot;&gt;&lt;br /&gt;  # Пример из Burnham and Anderson (2002), page 100:&lt;/span&gt;&lt;br /&gt;  fm1 &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; lm(y &lt;span style=&quot;color: #2060a0;&quot;&gt;~&lt;/span&gt; X1 &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt; X2 &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt; X3 &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt; X4, data &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; Cement)&lt;br /&gt;  ms1 &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; dredge(fm1, extra &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #a08000;&quot;&gt;list&lt;/span&gt;(&lt;br /&gt;     &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;R^2&quot;&lt;/span&gt;, &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;*&quot;&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;function&lt;/span&gt;(x) {&lt;br /&gt;          s &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; summary(x)&lt;br /&gt;          c(adjRsq &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; s&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;adj.r.squared, F &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; s&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;fstatistic[[&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;]])&lt;br /&gt;                               })&lt;br /&gt;                )&lt;br /&gt;&lt;br /&gt;  ms1[&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt;,&lt;span style=&quot;color: #0080a0;&quot;&gt;6&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;13&lt;/span&gt;]&lt;br /&gt;           R&lt;span style=&quot;color: #2060a0;&quot;&gt;^&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;.adjRsq      &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;.F df    logLik     AICc    delta    weight&lt;br /&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.9786784&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.9744140&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;229.5037&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;28.15620&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;69.31239&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.000000&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.5657106&lt;/span&gt;&lt;br /&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;12&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.9823355&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.9764473&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;166.8317&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;26.93314&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;72.43771&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;3.125321&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.1185603&lt;/span&gt;&lt;br /&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;8&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.9822847&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.9763796&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;166.3449&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;26.95180&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;72.47503&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;3.162633&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.1163690&lt;/span&gt;&lt;br /&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;10&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.9724710&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.9669653&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;176.6270&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;29.81705&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;72.63411&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;3.321714&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.1074715&lt;/span&gt;&lt;br /&gt;&lt;br /&gt;  confset.95p &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; get.models(ms1, subset &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; cumsum(weight) &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; .&lt;span style=&quot;color: #0080a0;&quot;&gt;95&lt;/span&gt;)&lt;/pre&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;Обратим внимание на неоднозначный выбор оптимальной модели с использованием разных критериев адекватности. Выполним построение агрегированной модели, обобщающей 4 наилучшие частные модели:&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/div&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;  avgm &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; model.avg(confset.95p)&lt;br /&gt;  summary(avgm)&lt;br /&gt;&lt;br /&gt;  Component model call&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; &lt;br /&gt;  lm(formula &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; y &lt;span style=&quot;color: #2060a0;&quot;&gt;~&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt; unique rhs&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;gt;&lt;/span&gt;, data &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; Cement)&lt;br /&gt;  Component models&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; &lt;br /&gt;      df logLik  AICc delta weight&lt;br /&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;12&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;28.16&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;69.31&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.00&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.62&lt;/span&gt;&lt;br /&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;124&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;26.93&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;72.44&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;3.13&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.13&lt;/span&gt;&lt;br /&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;123&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;26.95&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;72.48&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;3.16&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.13&lt;/span&gt;&lt;br /&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;14&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;29.82&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;72.63&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;3.32&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.12&lt;/span&gt;&lt;br /&gt;  Term codes&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; &lt;br /&gt;  X1 X2 X3 X4 &lt;br /&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt; &lt;br /&gt;  &lt;br /&gt;  Model&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;averaged coefficients&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; &lt;br /&gt;              Estimate Std. Error Adjusted SE z value Pr(&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;gt;&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;|&lt;/span&gt;z&lt;span style=&quot;color: #2060a0;&quot;&gt;|&lt;/span&gt;)    &lt;br /&gt;  (Intercept)  &lt;span style=&quot;color: #0080a0;&quot;&gt;60.4843&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;17.9260&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;18.2147&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;3.321&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.000898&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;br /&gt;  X1            &lt;span style=&quot;color: #0080a0;&quot;&gt;1.4920&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.1575&lt;/span&gt;      &lt;span style=&quot;color: #0080a0;&quot;&gt;0.1747&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;8.542&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;2e-16&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;br /&gt;  X2            &lt;span style=&quot;color: #0080a0;&quot;&gt;0.6250&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.1203&lt;/span&gt;      &lt;span style=&quot;color: #0080a0;&quot;&gt;0.1292&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;4.839&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1.31e-06&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;br /&gt;  X4           &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.4160&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.2289&lt;/span&gt;      &lt;span style=&quot;color: #0080a0;&quot;&gt;0.2408&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;1.728&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.084009&lt;/span&gt; .  &lt;br /&gt;  X3            &lt;span style=&quot;color: #0080a0;&quot;&gt;0.2500&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.1847&lt;/span&gt;      &lt;span style=&quot;color: #0080a0;&quot;&gt;0.2132&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;1.173&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.240898&lt;/span&gt;    &lt;br /&gt;  &lt;br /&gt;  Full model&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;averaged coefficients (with shrinkage)&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; &lt;br /&gt;              Estimate Std. Error Adjusted SE z value Pr(&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;gt;&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;|&lt;/span&gt;z&lt;span style=&quot;color: #2060a0;&quot;&gt;|&lt;/span&gt;)    &lt;br /&gt;  (Intercept) &lt;span style=&quot;color: #0080a0;&quot;&gt;60.48430&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;17.92604&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;18.21471&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;3.321&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.000898&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;br /&gt;  X1           &lt;span style=&quot;color: #0080a0;&quot;&gt;1.49198&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;0.15745&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.17467&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;8.542&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;2e-16&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;br /&gt;  X2           &lt;span style=&quot;color: #0080a0;&quot;&gt;0.55106&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;0.23133&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.23552&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;2.340&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.019299&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;  &lt;br /&gt;  X4          &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.10354&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;0.21306&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.21628&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.479&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.632129&lt;/span&gt;    &lt;br /&gt;  X3           &lt;span style=&quot;color: #0080a0;&quot;&gt;0.03204&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;0.10656&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.11317&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.283&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.777105&lt;/span&gt;    &lt;br /&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;br /&gt;  Signif. codes&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt; ‘&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.001&lt;/span&gt; ‘&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.01&lt;/span&gt; ‘&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.05&lt;/span&gt; ‘.’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.1&lt;/span&gt; ‘ ’ &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;&lt;br /&gt;  &lt;br /&gt;  Relative variable importance&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; &lt;br /&gt;                       X1   X2   X4   X3  &lt;br /&gt;  Importance&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;          &lt;span style=&quot;color: #0080a0;&quot;&gt;1.00&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.88&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.25&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.13&lt;/span&gt;&lt;br /&gt;  N containing models&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;&lt;/pre&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;Как видим, значения условного (&lt;i&gt;subset&lt;/i&gt;) коэффициента для переменной &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;X1&lt;/span&gt;, включенной во все частные модели, не отличается от полного (&lt;i&gt;full with shrinkage&lt;/i&gt;), тогда как для переменных &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;X3&lt;/span&gt; и &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;X4&lt;/span&gt; разности коэффициентов весьма значительны.&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;br /&gt;Поскольку ошибки условных коэффициентов можно найти как взвешенные суммы ошибок коэффициентов частных моделей &lt;/span&gt;&lt;/span&gt;&lt;/span&gt;\( \hat{\beta}_{ig} =&amp;nbsp; \sum_{k=1}^{r}&amp;nbsp; \omega_{k} var(\hat{\beta}_{ik})&amp;nbsp; \), то легко вычислить соответствующие доверительные интервалы для задаваемых доверительных вероятностей:&lt;br /&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/div&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;   CI &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; cbind(confint(avgm), confint(avgm, level=&lt;span style=&quot;color: #0080a0;&quot;&gt;0.85&lt;/span&gt;))&lt;br /&gt;   CI[ , c(&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;,&lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt;,&lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt;,&lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;)]&lt;br /&gt;                    &lt;span style=&quot;color: #0080a0;&quot;&gt;2.5&lt;/span&gt; %       &lt;span style=&quot;color: #0080a0;&quot;&gt;7.5&lt;/span&gt; %      &lt;span style=&quot;color: #0080a0;&quot;&gt;92.5&lt;/span&gt; %      &lt;span style=&quot;color: #0080a0;&quot;&gt;97.5&lt;/span&gt; %&lt;br /&gt;   (Intercept) &lt;span style=&quot;color: #0080a0;&quot;&gt;24.7841330&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;34.43403292&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;86.53457235&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;96.18447223&lt;/span&gt;&lt;br /&gt;   X1           &lt;span style=&quot;color: #0080a0;&quot;&gt;1.1496363&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;1.25038159&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;1.73357355&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;1.83431889&lt;/span&gt;&lt;br /&gt;   X2           &lt;span style=&quot;color: #0080a0;&quot;&gt;0.3718565&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.44425065&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.80580132&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.87819546&lt;/span&gt;&lt;br /&gt;   X4          &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.8878522&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.75563682&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.07634164&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.05587375&lt;/span&gt;&lt;br /&gt;   X3          &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.1678276&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.04066862&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.54070384&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.66786280&lt;/span&gt;&lt;/pre&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;Как было показано выше, при расчете ошибок полных коэффициентов необходимо учесть дополнительный &quot;штрафной&quot; член (Lukacs et al., 2009). После этого доверительные интервалы можно вычислить обычным способом как \( \hat{\beta_{ig}} \mp&amp;nbsp; t_{f, \alpha / 2} [var(\hat{\beta_{ig}})]^{0.5}&amp;nbsp; \)&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;,&amp;nbsp; где число степеней свободы&amp;nbsp;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;\(f = 35\) можно считать вполне допустимым для практических расчетов.&lt;br /&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/div&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;&lt;span style=&quot;color: #406040;&quot;&gt;  # объект model.averaging включает оценки &quot;сжатых&quot; коэффициентов &lt;/span&gt;&lt;br /&gt;  shrinkage.coef &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; avgm&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;coef.shrinkage &lt;br /&gt;&lt;span style=&quot;color: #406040;&quot;&gt;  # и значения бета-коэффициентов для всех частных моделей&lt;/span&gt;&lt;br /&gt;  &lt;br /&gt;  coef.array &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; avgm&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;coefArray&lt;br /&gt;  coef.array &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; replace(coef.array, is.na(coef.array), &lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt;) &lt;br /&gt;&lt;span style=&quot;color: #406040;&quot;&gt;  &lt;br /&gt;  # создадим пустую таблицу для хранения результатов расчетов&lt;/span&gt;&lt;br /&gt;  shrinkage.estimates &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; &lt;span style=&quot;color: #a08000;&quot;&gt;data.frame&lt;/span&gt;(shrinkage.coef,variance=NA)&lt;br /&gt;&lt;span style=&quot;color: #406040;&quot;&gt;  &lt;br /&gt;  # вычислим shrinkage-скорректированные ошибки &lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;  for&lt;/span&gt;(i &lt;span style=&quot;color: #2060a0;&quot;&gt;in&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;dim(coef.array)[&lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt;]){&lt;br /&gt;   input &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; &lt;span style=&quot;color: #a08000;&quot;&gt;data.frame&lt;/span&gt;(coef.array[,,i], weight = Weights(avgm))&lt;br /&gt;   variance &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; rep(NA, dim(input)[&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;])&lt;br /&gt;    &lt;span style=&quot;color: #2060a0;&quot;&gt;for&lt;/span&gt; (j &lt;span style=&quot;color: #2060a0;&quot;&gt;in&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;dim(input)[&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;]){&lt;br /&gt;     variance[j] &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; input&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;weight[j] &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt; (input&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;Std..Err[j]&lt;span style=&quot;color: #2060a0;&quot;&gt;^&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt; &lt;br /&gt;     (input&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;Estimate[j] &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt; shrinkage.estimates&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;shrinkage.coef[i])&lt;span style=&quot;color: #2060a0;&quot;&gt;^&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;)&lt;br /&gt;  }&lt;br /&gt;  shrinkage.estimates&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;variance[i] &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; sum(variance)  &lt;br /&gt; }&lt;br /&gt;&lt;span style=&quot;color: #406040;&quot;&gt;&lt;br /&gt; # вычислим доверительные интервалы&lt;/span&gt;&lt;br /&gt; shrinkage.estimates&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;lci &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; shrinkage.estimates&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;shrinkage.coef &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;br /&gt;           &lt;span style=&quot;color: #0080a0;&quot;&gt;2.03&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;sqrt(shrinkage.estimates&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;variance)&lt;br /&gt; shrinkage.estimates&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;uci &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; shrinkage.estimates&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;shrinkage.coef &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;&lt;br /&gt;           &lt;span style=&quot;color: #0080a0;&quot;&gt;2.03&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;sqrt(shrinkage.estimates&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;variance)&lt;br /&gt; print(shrinkage.estimates)&lt;br /&gt;             shrinkage.coef     variance         lci        uci&lt;br /&gt; (Intercept)    &lt;span style=&quot;color: #0080a0;&quot;&gt;60.48430263&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;321.34280013&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;24.09444766&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;96.8741576&lt;/span&gt;&lt;br /&gt; X1              &lt;span style=&quot;color: #0080a0;&quot;&gt;1.49197757&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.02479082&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;1.17235203&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;1.8116031&lt;/span&gt;&lt;br /&gt; X2              &lt;span style=&quot;color: #0080a0;&quot;&gt;0.55105655&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.05351159&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.08146534&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;1.0206478&lt;/span&gt;&lt;br /&gt; X4             &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.10354105&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.04539387&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.53604956&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.3289675&lt;/span&gt;&lt;br /&gt; X3              &lt;span style=&quot;color: #0080a0;&quot;&gt;0.03203825&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.01135571&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.18428500&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.2483615&lt;/span&gt;&lt;br /&gt;&lt;/pre&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;Заметим, что как&amp;nbsp;&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;регуляризованные, так и&lt;/span&gt;&lt;/span&gt; условные коэффициенты при &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;Х3&lt;/span&gt; и &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;Х4&lt;/span&gt; оказались статистически незначимыми, поскольку их доверительные интервалы включают значение 0.&lt;br /&gt;&amp;nbsp;&lt;/span&gt;&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;Совокупность расчетных значений &lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;\(\hat{y_g}\) можно оценить обычным образом с помощью функции &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;predict()&lt;/span&gt;&lt;span style=&quot;font-family: inherit;&quot;&gt;,&lt;/span&gt; которая в данном случае имеет специальный параметр &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;full&lt;/span&gt;, принимающий значения &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;TRUE&lt;/span&gt; или &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;FALSE&lt;/span&gt; в зависимости от того, по какому набору коэффициентов следует вести расчет.&amp;nbsp; Оценим точность ансамблей из усредненных моделей, основанных на полных и условных коэффициентах, по трем показателям: среднему абсолютному отклонению (&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;MAE&lt;/span&gt;), корню из среднеквадратичного отклонения (&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;RSME&lt;/span&gt;) и квадрату коэффициента детерминации&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt; Rsq&lt;/span&gt; = 1 - &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;NSME&lt;/span&gt;, где &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;NSME&lt;/span&gt;&amp;nbsp;- относительная ошибка, равная отношению средних квадратов отклонений от регрессии и от общего среднего:&lt;/span&gt;&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;/span&gt;&lt;/div&gt;&lt;div class=&quot;main-section highlighter-parsed-section&quot;&gt;&lt;div class=&quot;code&quot; id=&quot;parsed_code&quot;&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;  &lt;span style=&quot;color: #406040;&quot;&gt;# Функция, выводящая вектор критериев&lt;/span&gt;&lt;br /&gt;  &lt;span style=&quot;color: maroon;&quot;&gt;ModCrit&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;function&lt;/span&gt; (pred, fact) {&lt;br /&gt;    mae &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; mean(abs(pred&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;fact))&lt;br /&gt;    rmse &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; sqrt(mean((pred&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;fact)&lt;span style=&quot;color: #2060a0;&quot;&gt;^&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;))&lt;br /&gt;    Rsq &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;sum((fact&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;pred)&lt;span style=&quot;color: #2060a0;&quot;&gt;^&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;)&lt;span style=&quot;color: #2060a0;&quot;&gt;/&lt;/span&gt;sum((mean(fact)&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;fact)&lt;span style=&quot;color: #2060a0;&quot;&gt;^&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;)&lt;br /&gt;    c(MAE=mae, RSME=rmse,  Rsq &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; Rsq )&lt;br /&gt;  } &lt;br /&gt;  rbind(&lt;br /&gt;     averaged.subset &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; ModCrit(predict(avgm, &lt;br /&gt;                 full &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; FALSE),Cement&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;y),&lt;br /&gt;     averaged.full &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; ModCrit(predict(avgm,  &lt;br /&gt;                 full &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; TRUE),Cement&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;y))&lt;br /&gt;                       MAE     RSME       Rsq&lt;br /&gt;  averaged.subset &lt;span style=&quot;color: #0080a0;&quot;&gt;5.906004&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;7.120158&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.7573218&lt;/span&gt;&lt;br /&gt;  averaged.full   &lt;span style=&quot;color: #0080a0;&quot;&gt;1.709184&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1.958280&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.9816430&lt;/span&gt;&lt;br /&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;Чтобы понять смысл полученных расхождений в оценках качества моделей, отобразим имеющиеся статистические закономерности на графике. Для этого составим новую таблицу, обрабатываемую функцией &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;predict()&lt;/span&gt;, в которой значения&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt; X1&lt;/span&gt;&amp;nbsp;&quot;пробегают&quot; по всему диапазону исходных данных, а остальные три переменные зафиксированы на уровне значений их средних. Покажем на графике прямые, связанные с каждой из четырех частных моделей, и две прямые, соответствующие усредненным моделям (полным -&amp;nbsp;&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&quot;&lt;/span&gt;&lt;/span&gt;full averaged&quot;, и условным -&amp;nbsp;&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&quot;&lt;/span&gt;&lt;/span&gt;subset &lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;averaged&lt;/span&gt;&lt;/span&gt;&quot;).&lt;/span&gt;&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;/span&gt;&lt;/div&gt;&lt;div class=&quot;main-section highlighter-parsed-section&quot;&gt;&lt;div class=&quot;code&quot; id=&quot;parsed_code&quot;&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;  &lt;span style=&quot;color: maroon;&quot;&gt;nseq&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;function&lt;/span&gt;(x, len &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; length(x)) seq(min(x, na.rm &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; TRUE),&lt;br /&gt;  max(x, na.rm=TRUE), length &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; len)&lt;br /&gt;  newdata &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; as.data.frame(lapply(lapply(Cement[, &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;], mean),&lt;br /&gt;       rep, &lt;span style=&quot;color: #0080a0;&quot;&gt;25&lt;/span&gt;))&lt;br /&gt;  newdata&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;X1 &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; nseq(Cement&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;X1, nrow(newdata))&lt;br /&gt;  n &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; length(confset.95p)&lt;br /&gt;  pred &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; &lt;span style=&quot;color: #a08000;&quot;&gt;data.frame&lt;/span&gt;(&lt;br /&gt;      model &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; sapply(confset.95p, predict, newdata &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; newdata),&lt;br /&gt;      averaged.subset &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; predict(avgm, newdata, full &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; FALSE),&lt;br /&gt;      averaged.full &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; predict(avgm, newdata, full &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; TRUE)&lt;br /&gt;  )&lt;br /&gt;  matplot(newdata&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;X1, pred, type &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;l&quot;&lt;/span&gt;,&lt;br /&gt;       lwd &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; c(rep(&lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;,n),&lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt;,&lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt;), lty &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;,&lt;br /&gt;       xlab &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;X1&quot;&lt;/span&gt;, ylab &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;y&quot;&lt;/span&gt;, col=&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;7&lt;/span&gt;)&lt;br /&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;&lt;br /&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; Поскольку функция &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;predict()&lt;/span&gt; с параметром &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;se.fit = TRUE&lt;/span&gt; возвращает стандартную ошибку регрессии, то для полной модели построим также линии доверительных огибающих:&lt;/span&gt;&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;/span&gt;&lt;br /&gt;&lt;div class=&quot;main-section highlighter-parsed-section&quot;&gt;&lt;div class=&quot;code&quot; id=&quot;parsed_code&quot;&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;pred.se &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; predict(avgm, newdata, se.fit &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; TRUE)&lt;br /&gt;y &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; pred.se&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;fit&lt;br /&gt;ci &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; pred.se&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;se.fit &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;&lt;br /&gt;matplot(newdata&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;X1, cbind(y, y &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt; ci, y &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt; ci), &lt;br /&gt;          add &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; TRUE, type=&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;l&quot;&lt;/span&gt;, lty &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;, col=c(&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;,&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;), lwd &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;)&lt;br /&gt;legend(&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;topleft&quot;&lt;/span&gt;, legend=c(lapply(confset.95p, formula),&lt;br /&gt;   paste(c(&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;subset&quot;&lt;/span&gt;, &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;full&quot;&lt;/span&gt;), &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;averaged&quot;&lt;/span&gt;), &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;averaged predictions + CI&quot;&lt;/span&gt;), &lt;br /&gt;   lty &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; c(rep(&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;,&lt;span style=&quot;color: #0080a0;&quot;&gt;6&lt;/span&gt;),&lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;), lwd &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; c(rep(&lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;,n),&lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt;,&lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt;,&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;), cex &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; .&lt;span style=&quot;color: #0080a0;&quot;&gt;75&lt;/span&gt;, col=c(&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;6&lt;/span&gt;,&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;))&lt;br /&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;a href=&quot;https://3.bp.blogspot.com/-IGO_linMQqQ/Wl801QFHtGI/AAAAAAAADfI/tn1Mzydv2sk-algLInxHJ5nTp9yiNhoYgCEwYBhgL/s1600/Fig%2B5.png&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; data-original-height=&quot;570&quot; data-original-width=&quot;635&quot; src=&quot;https://3.bp.blogspot.com/-IGO_linMQqQ/Wl801QFHtGI/AAAAAAAADfI/tn1Mzydv2sk-algLInxHJ5nTp9yiNhoYgCEwYBhgL/s1600/Fig%2B5.png&quot; /&gt;&lt;/a&gt;&lt;/div&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;На графике видно, что модель с условными коэффициентами склонна к очевидному смещению в сторону уменьшения значений теплоты гидратации &lt;i&gt;Y&lt;/i&gt;.&lt;/span&gt;&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;/span&gt;&lt;br /&gt;&lt;div dir=&quot;ltr&quot; trbidi=&quot;on&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;b&gt;Вероятность заболеть диабетом&lt;/b&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;Используем в качестве второго примера набор данных &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;pima&lt;/span&gt;&lt;span style=&quot;font-family: inherit;&quot;&gt;,&lt;/span&gt; обсуждаемый в известной книге Дж. Фаравея (Faraway, 2002) и входящий в пакет &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;faraway&lt;/span&gt;. Взрослых женщин-индианок из племени пима протестировали на наличие признаков диабета (&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;test&lt;/span&gt; = 0 если заболевание отсутствует, и 1 если диагноз положительный). Одновременно учитывали следующие показатели: число беременностей (&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;pregnant&lt;/span&gt;), концентрация глюкозы в плазме (&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;glucose&lt;/span&gt;), диастолическое кровяное давление (&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;diastolic&lt;/span&gt;), толщина кожно-жировой складки трицепса (&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;triceps&lt;/span&gt;), инсулин в сыворотке крови (&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;insulin&lt;/span&gt;), индекс массы тела (&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;bmi&lt;/span&gt;), индекс родственно-генетической предрасположенности к диабету (&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;diabetes&lt;/span&gt;) и возраст пациента (&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;age&lt;/span&gt;).&lt;/span&gt;&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;Следуя рекомендациям Дж. Фаравея, обратим внимание на некоторые недопустимые &quot;небрежности&quot; при формировании набора данных. Ряд медицинских показателей равны 0, что, вероятно, означает пропуск данных, поскольку трудно себе представить живого пациента с нулевым кровяным давлением. Удалим подобные строки из набора данных. Вызывает также сомнение максимум рожденных детей (&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;pregnant&lt;/span&gt; = 17), но сочтем такое значение показателя реально возможным.&lt;/span&gt;&lt;/span&gt;&lt;/div&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt; library(faraway)&lt;br /&gt; data(pima)&lt;br /&gt; str(pima)&lt;br /&gt; pima&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;diastolic [pima&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;diastolic &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt;] &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt;NA&lt;br /&gt; pima&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;glucose [pima&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;glucose &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt;] &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt;NA&lt;br /&gt; pima&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;triceps [pima&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;triceps &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt;] &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt;NA&lt;br /&gt; pima&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;insulin [pima&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;insulin &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt;] &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt;NA&lt;br /&gt; pima&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;bmi [pima&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;bmi &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt;] &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt;NA&lt;br /&gt; pima &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; pima[complete.cases(pima),]&lt;br /&gt; summary(pima&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;test &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; as.factor(pima&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;test))&lt;br /&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt; &lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt; 262&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;130&lt;/span&gt; &lt;/pre&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;Построим &quot;глобальную&quot; модель логистической регрессии, включающую все наблюдаемые переменные:&lt;/span&gt;&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;/span&gt;&lt;/div&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt; fmlr &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; glm(test &lt;span style=&quot;color: #2060a0;&quot;&gt;~&lt;/span&gt; .,data &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; pima, family &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; binomial())&lt;br /&gt; summary(fmlr)&lt;br /&gt; Coefficients&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;br /&gt;               Estimate Std. Error z value Pr(&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;gt;&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;|&lt;/span&gt;z&lt;span style=&quot;color: #2060a0;&quot;&gt;|&lt;/span&gt;)    &lt;br /&gt; (Intercept) &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1.004e+01&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;1.218e+00&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;8.246&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;2e-16&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;br /&gt; pregnant     &lt;span style=&quot;color: #0080a0;&quot;&gt;8.216e-02&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;5.543e-02&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;1.482&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.13825&lt;/span&gt;    &lt;br /&gt; glucose      &lt;span style=&quot;color: #0080a0;&quot;&gt;3.827e-02&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;5.768e-03&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;6.635&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;3.24e-11&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;br /&gt; diastolic   &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1.420e-03&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;1.183e-02&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.120&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.90446&lt;/span&gt;    &lt;br /&gt; triceps      &lt;span style=&quot;color: #0080a0;&quot;&gt;1.122e-02&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;1.708e-02&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.657&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.51128&lt;/span&gt;    &lt;br /&gt; insulin     &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;8.253e-04&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;1.306e-03&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.632&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.52757&lt;/span&gt;    &lt;br /&gt; bmi          &lt;span style=&quot;color: #0080a0;&quot;&gt;7.054e-02&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;2.734e-02&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;2.580&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.00989&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt; &lt;br /&gt; diabetes     &lt;span style=&quot;color: #0080a0;&quot;&gt;1.141e+00&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;4.274e-01&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;2.669&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.00760&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt; &lt;br /&gt; age          &lt;span style=&quot;color: #0080a0;&quot;&gt;3.395e-02&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;1.838e-02&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;1.847&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.06474&lt;/span&gt; .  &lt;br /&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt; -&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;br /&gt; Signif. codes&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt; ‘&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.001&lt;/span&gt; ‘&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.01&lt;/span&gt; ‘&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.05&lt;/span&gt; ‘.’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.1&lt;/span&gt; ‘ ’ &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;&lt;br /&gt;     Null deviance&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;498.10&lt;/span&gt;  on &lt;span style=&quot;color: #0080a0;&quot;&gt;391&lt;/span&gt;  degrees of freedom&lt;br /&gt; Residual deviance&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;344.02&lt;/span&gt;  on &lt;span style=&quot;color: #0080a0;&quot;&gt;383&lt;/span&gt;  degrees of freedom&lt;br /&gt; AIC&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;362.02&lt;/span&gt;&lt;/pre&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;Создадим набор из 256 всех возможных частных моделей и ограничим его условием &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;cumsum(weight) &amp;lt; 0.85&lt;/span&gt;. После этого создадим усредненную модель, объединяющую 17 отобранных частных моделей:&lt;/span&gt;&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;/div&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt; allmod &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; dredge(fmlr)&lt;br /&gt; avgmod &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt;model.avg(allmod,cumsum(weight) &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.85&lt;/span&gt;) &lt;br /&gt; summary(avgmod)&lt;br /&gt; Component model call&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; &lt;br /&gt; glm(formula &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; test &lt;span style=&quot;color: #2060a0;&quot;&gt;~&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;17&lt;/span&gt; unique rhs&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;gt;&lt;/span&gt;, family &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; binomial(), data &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; pima)&lt;br /&gt; Component models&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; &lt;br /&gt;         df  logLik   AICc delta weight&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt; 12357&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;6&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;172.44&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;357.10&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.00&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.17&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt; 1235&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;173.62&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;357.39&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.29&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.14&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt; 123578&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;7&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;172.21&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;358.72&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;1.61&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.07&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt; 123567&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;7&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;172.23&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;358.76&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;1.65&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.07&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt; 2357&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;174.36&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;358.88&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;1.77&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.07&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt; 12356&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;6&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;173.35&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;358.92&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;1.82&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.07&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt; 12358&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;6&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;173.37&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;358.96&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;1.85&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.07&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt; 123457&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;7&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;172.44&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;359.17&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;2.07&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.06&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt; 12345&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;6&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;173.62&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;359.45&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;2.35&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.05&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt; 23578&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;6&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;173.93&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;360.09&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;2.98&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.04&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt; 1235678&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;8&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;172.02&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;360.41&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;3.31&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.03&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt; 123568&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;7&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;173.12&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;360.54&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;3.43&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.03&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt; 23567&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;6&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;174.21&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;360.65&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;3.54&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.03&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt; 1234578&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;8&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;172.21&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;360.79&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;3.69&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.03&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt; 1234567&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;8&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;172.23&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;360.83&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;3.72&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.03&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt; 23457&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;6&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;174.31&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;360.85&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;3.74&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.03&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt; 123456&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;7&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;173.35&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;360.99&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;3.89&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.02&lt;/span&gt;&lt;br /&gt;&lt;br /&gt; Term codes&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; &lt;br /&gt;       age       bmi  diabetes diastolic   glucose   insulin  pregnant   triceps &lt;br /&gt;         &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;         &lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;         &lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt;         &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt;         &lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt;         &lt;span style=&quot;color: #0080a0;&quot;&gt;6&lt;/span&gt;         &lt;span style=&quot;color: #0080a0;&quot;&gt;7&lt;/span&gt;         &lt;span style=&quot;color: #0080a0;&quot;&gt;8&lt;/span&gt; &lt;br /&gt;&lt;br /&gt; Model&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;averaged coefficients&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; &lt;br /&gt;               Estimate Std. Error Adjusted SE z value Pr(&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;gt;&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;|&lt;/span&gt;z&lt;span style=&quot;color: #2060a0;&quot;&gt;|&lt;/span&gt;)    &lt;br /&gt; (Intercept) &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;9.9727948&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;1.1355744&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;1.1389894&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;8.756&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;2e-16&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;br /&gt; age          &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0426278&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0185999&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0186439&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;2.286&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.02223&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;  &lt;br /&gt; bmi          &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0744313&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0230849&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0231533&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;3.215&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.00131&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt; &lt;br /&gt; diabetes     &lt;span style=&quot;color: #0080a0;&quot;&gt;1.1378544&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.4259816&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.4273032&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;2.663&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.00775&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt; &lt;br /&gt; glucose      &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0371798&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0052995&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0053156&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;6.994&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;2e-16&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;br /&gt; pregnant     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.1018981&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0606241&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0607644&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;1.677&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.09355&lt;/span&gt; .  &lt;br /&gt; triceps      &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0122192&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0170973&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0171509&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.712&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.47619&lt;/span&gt;    &lt;br /&gt; insulin     &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.0008761&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0013114&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0013155&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.666&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.50543&lt;/span&gt;    &lt;br /&gt; diastolic   &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.0002998&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0118512&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0118880&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.025&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.97988&lt;/span&gt;    &lt;br /&gt;&lt;br /&gt; Full model&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;averaged coefficients (with shrinkage)&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; &lt;br /&gt;               Estimate Std. Error Adjusted SE z value Pr(&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;gt;&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;|&lt;/span&gt;z&lt;span style=&quot;color: #2060a0;&quot;&gt;|&lt;/span&gt;)    &lt;br /&gt; (Intercept) &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;9.973e+00&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;1.136e+00&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;1.139e+00&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;8.756&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;2e-16&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;br /&gt; age          &lt;span style=&quot;color: #0080a0;&quot;&gt;3.580e-02&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;2.313e-02&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;2.316e-02&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;1.546&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.12214&lt;/span&gt;    &lt;br /&gt; bmi          &lt;span style=&quot;color: #0080a0;&quot;&gt;7.443e-02&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;2.308e-02&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;2.315e-02&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;3.215&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.00131&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt; &lt;br /&gt; diabetes     &lt;span style=&quot;color: #0080a0;&quot;&gt;1.138e+00&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;4.260e-01&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;4.273e-01&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;2.663&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.00775&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt; &lt;br /&gt; glucose      &lt;span style=&quot;color: #0080a0;&quot;&gt;3.718e-02&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;5.300e-03&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;5.316e-03&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;6.994&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;2e-16&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;br /&gt; pregnant     &lt;span style=&quot;color: #0080a0;&quot;&gt;6.291e-02&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;6.872e-02&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;6.879e-02&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.915&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.36045&lt;/span&gt;    &lt;br /&gt; triceps      &lt;span style=&quot;color: #0080a0;&quot;&gt;3.250e-03&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;1.034e-02&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;1.036e-02&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.314&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.75381&lt;/span&gt;    &lt;br /&gt; insulin     &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;2.452e-04&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;7.975e-04&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;7.994e-04&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.307&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.75907&lt;/span&gt;    &lt;br /&gt; diastolic   &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;6.369e-05&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;5.464e-03&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;5.481e-03&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.012&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.99073&lt;/span&gt;    &lt;br /&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt; -&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;br /&gt; Signif. codes&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt; ‘&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.001&lt;/span&gt; ‘&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.01&lt;/span&gt; ‘&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.05&lt;/span&gt; ‘.’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.1&lt;/span&gt; ‘ ’ &lt;span style=&quot;color: #0080a0;&quot;&gt;1 &lt;/span&gt;&lt;br /&gt;&lt;br /&gt; Relative variable importance&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; &lt;br /&gt;                      bmi  diabetes glucose age  pregnant insulin triceps diastolic&lt;br /&gt; Importance&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;          &lt;span style=&quot;color: #0080a0;&quot;&gt;1.00&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1.00&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;1.00&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;0.84&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.62&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.28&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;0.27&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;0.21&lt;/span&gt;     &lt;br /&gt; N containing models&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;17&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;17&lt;/span&gt;       &lt;span style=&quot;color: #0080a0;&quot;&gt;17&lt;/span&gt;      &lt;span style=&quot;color: #0080a0;&quot;&gt;13&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;11&lt;/span&gt;        &lt;span style=&quot;color: #0080a0;&quot;&gt;7&lt;/span&gt;       &lt;span style=&quot;color: #0080a0;&quot;&gt;6&lt;/span&gt;       &lt;span style=&quot;color: #0080a0;&quot;&gt;6&lt;/span&gt;     &lt;/pre&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;Оценим ошибки предсказания модели с использованием обоих наборов коэффициентов&amp;nbsp; (&quot;full&quot; и &quot;subset&quot;). П&lt;/span&gt;&lt;/span&gt;редварительно определим функцию &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;logit2prob()&lt;/span&gt;&amp;nbsp;для преобразования значений логита в соответствующие вероятности:&lt;br /&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;/div&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;&lt;span style=&quot;color: maroon;&quot;&gt; logit2prob&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;function&lt;/span&gt;(logit){&lt;br /&gt;   odds &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; exp(logit);   prob &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; odds &lt;span style=&quot;color: #2060a0;&quot;&gt;/&lt;/span&gt; (&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt; odds)&lt;br /&gt;   &lt;span style=&quot;color: #2060a0;&quot;&gt;return&lt;/span&gt;(prob)&lt;br /&gt; }&lt;br /&gt;&lt;br /&gt; Pred &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; ifelse(logit2prob(predict(avgmod, full=TRUE))&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;gt;&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.5&lt;/span&gt;,&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;,&lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt;)&lt;br /&gt; table(Факт=pima&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;test, Прогноз=Pred)&lt;br /&gt; Acc &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; mean(pima&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;test &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; Pred)&lt;br /&gt; paste(&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;Точность=&quot;&lt;/span&gt;, round(&lt;span style=&quot;color: #0080a0;&quot;&gt;100&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;Acc, &lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;), &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;%&quot;&lt;/span&gt;, sep=&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;&quot;&lt;/span&gt;)&lt;br /&gt;   &lt;span style=&quot;color: #406040;&quot;&gt;# Для модели с «полными» коэффициентами &lt;/span&gt;&lt;br /&gt;     Прогноз&lt;br /&gt; Факт   &lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;&lt;br /&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;233&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;29&lt;/span&gt;&lt;br /&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;55&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;75&lt;/span&gt;&lt;br /&gt; [&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;] &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;Точность=78.57%&quot;&lt;/span&gt;&lt;br /&gt;&lt;br /&gt; Pred &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; ifelse(logit2prob(predict(avgmod, full=FALSE))&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;gt;&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.5&lt;/span&gt;,&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;,&lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt;)&lt;br /&gt; table(Факт=pima&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;test, Прогноз=Pred)&lt;br /&gt; Acc &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; mean(pima&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;test &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; Pred)&lt;br /&gt; paste(&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;Точность=&quot;&lt;/span&gt;, round(&lt;span style=&quot;color: #0080a0;&quot;&gt;100&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;Acc, &lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;), &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;%&quot;&lt;/span&gt;, sep=&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;&quot;&lt;/span&gt;)&lt;br /&gt;   &lt;span style=&quot;color: #406040;&quot;&gt;# Для модели с «условными» коэффициентами &lt;/span&gt;&lt;br /&gt;     Прогноз&lt;br /&gt; Факт   &lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;&lt;br /&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;218&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;44&lt;/span&gt;&lt;br /&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;37&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;93&lt;/span&gt;&lt;br /&gt; [&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;] &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;Точность=79.34%&quot;&lt;/span&gt;&lt;/pre&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;Формально модель с условными коэффициентами оказалась в целом чуть точнее, хотя у нее наблюдается отчетливая тенденция к гипердиагностике, тогда как для модели с полными коэффициентами характерен более частый пропуск анализируемого признака.&lt;/span&gt;&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;Мы выполнили обобщение 17 частных моделей. Возникают правомерные вопросы: численность какого коллектива является оптимальной и не удастся ли получить более эффективный ансамбль из меньшего числа моделей?&amp;nbsp;&lt;/span&gt;&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;Чтобы сделать наш анализ независимым, воспользуемся внешним критерием - точностью предсказания на отдельном проверочном подмножестве, не участвовавшем в построении моделей. Проведем разделение имеющейся выборки на обучающую и проверочную. Использование предсказываемой качественной переменной в качестве аргумента функции &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;createDataPartition()&lt;/span&gt; обеспечивает необходимый баланс уровней этой переменной при разделении исходных данных. Для обучения моделей выделим 75% исходной выборки (295 пациентов), а для независимого тестирования оставим 25% (97 пациентов):&lt;br /&gt;&amp;nbsp;&lt;/span&gt;&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;/div&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt; library(caret)&lt;br /&gt; set.seed(&lt;span style=&quot;color: #0080a0;&quot;&gt;7&lt;/span&gt;)&lt;br /&gt; train &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; unlist(createDataPartition(pima&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;test, p=&lt;span style=&quot;color: #0080a0;&quot;&gt;0.75&lt;/span&gt;))&lt;br /&gt; c(nrow(pima[train,]), nrow(pima[&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;train,]))&lt;br /&gt; [&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;] &lt;span style=&quot;color: #0080a0;&quot;&gt;295&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;97&lt;/span&gt;&lt;/pre&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;С использованием примеров из обучающей выборки построим новую «глобальную» модель и сформируем ансамбль из 20 наилучших моделей при &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;delta &amp;lt;= 5&lt;/span&gt;:&lt;/span&gt;&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;/span&gt;&lt;/div&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt; fmlrt &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; glm(test &lt;span style=&quot;color: #2060a0;&quot;&gt;~&lt;/span&gt; .,data &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; pima[train,], family &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; binomial())&lt;br /&gt; allmodt &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; dredge(fmlrt)&lt;br /&gt; mod20 &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; get.models(allmod, subset &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; delta &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt;)&lt;br /&gt;&lt;br /&gt; &lt;span style=&quot;color: #406040;&quot;&gt;# Последовательность значений delta &lt;/span&gt;&lt;br /&gt; model.avg(mod20)&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;msTable&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;delta&lt;br /&gt;  [&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;] &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0000000&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.2871189&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1.6125558&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1.6531455&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1.7733025&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1.8214838&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1.8543884&lt;/span&gt;&lt;br /&gt;  [&lt;span style=&quot;color: #0080a0;&quot;&gt;8&lt;/span&gt;] &lt;span style=&quot;color: #0080a0;&quot;&gt;2.0688914&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;2.3480942&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;2.9831460&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;3.3082866&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;3.4323749&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;3.5422478&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;3.6909647&lt;/span&gt;&lt;br /&gt; [&lt;span style=&quot;color: #0080a0;&quot;&gt;15&lt;/span&gt;] &lt;span style=&quot;color: #0080a0;&quot;&gt;3.7247098&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;3.7420870&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;3.8874319&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;3.9254308&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;4.7904076&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;4.9851575&lt;/span&gt;&lt;/pre&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;Составим таблицу, включающую сравнительные показатели эффективности коллективов моделей с численностью &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;MCount&lt;/span&gt; от 2 до 20. Столбцы таблицы -&amp;nbsp; точность прогнозирования переменной&amp;nbsp;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;test&lt;/span&gt; различными моделями (с условными и полными коэффициентами) на тестовой выборке (&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;subsetCP&lt;/span&gt; и &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;fullCP&lt;/span&gt;) и обучающей последовательности (&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;subsetCT&lt;/span&gt; и &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;fullCT&lt;/span&gt; соответственно). В первой строке таблицы (&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;MCount&lt;/span&gt; = 1) - логистическая регрессия с оптимальным составом предикторов.&lt;/span&gt;&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;/span&gt;&lt;/div&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt; predtab &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; pima[&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;train,&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;9&lt;/span&gt;]&lt;br /&gt; traintab &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; pima[train,&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;9&lt;/span&gt;]&lt;br /&gt; lmbest &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; glm(test &lt;span style=&quot;color: #2060a0;&quot;&gt;~&lt;/span&gt; bmi&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;diabetes&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;glucose&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;pregnant,&lt;br /&gt;               data &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; pima[train,], family &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; binomial())&lt;br /&gt;&lt;br /&gt; summary(lmbest)&lt;br /&gt; Ptrain &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; ifelse(logit2prob(predict(lmbest))&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;gt;&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.5&lt;/span&gt;,&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;,&lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt;)&lt;br /&gt; Pred &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; ifelse(logit2prob(predict(lmbest,predtab))&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;gt;&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.5&lt;/span&gt;,&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;,&lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt;)&lt;br /&gt; Res &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; &lt;span style=&quot;color: #a08000;&quot;&gt;data.frame&lt;/span&gt;(MCount=&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;, &lt;br /&gt;                   subsetCP &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; mean(pima[&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;train,&lt;span style=&quot;color: #0080a0;&quot;&gt;9&lt;/span&gt;]&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;Pred), &lt;br /&gt;                   fullCP &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; mean(pima[&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;train,&lt;span style=&quot;color: #0080a0;&quot;&gt;9&lt;/span&gt;]&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;Pred),&lt;br /&gt;                   subsetCT &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;  mean(pima[train,&lt;span style=&quot;color: #0080a0;&quot;&gt;9&lt;/span&gt;]&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;Ptrain), &lt;br /&gt;                   fullCT &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; mean(pima[train,&lt;span style=&quot;color: #0080a0;&quot;&gt;9&lt;/span&gt;]&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;Ptrain))&lt;br /&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;&lt;br /&gt; for&lt;/span&gt;(k &lt;span style=&quot;color: #2060a0;&quot;&gt;in&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;length(mod20))  {&lt;br /&gt;    avgmodt &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; model.avg(mod20[&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;k])&lt;br /&gt;    Pred.subset &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; ifelse(logit2prob(predict(avgmodt,predtab, full=FALSE))&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;gt;&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.5&lt;/span&gt;,&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;,&lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt;)&lt;br /&gt;    Pred.full &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; ifelse(logit2prob(predict(avgmodt,predtab, full=TRUE))&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;gt;&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.5&lt;/span&gt;,&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;,&lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt;)&lt;br /&gt;    Ptrain.subset &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; ifelse(logit2prob(predict(avgmodt, traintab, full=FALSE))&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;gt;&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.5&lt;/span&gt;,&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;,&lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt;)&lt;br /&gt;    Ptrain.full &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; ifelse(logit2prob(predict(avgmodt, traintab, full=TRUE))&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;gt;&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.5&lt;/span&gt;,&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;,&lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt;)&lt;br /&gt;    Res &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; rbind(Res, c(k, mean(pima[&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;train,&lt;span style=&quot;color: #0080a0;&quot;&gt;9&lt;/span&gt;]&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;Pred.subset),&lt;br /&gt;                 mean(pima[&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;train,&lt;span style=&quot;color: #0080a0;&quot;&gt;9&lt;/span&gt;]&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;Pred.full),&lt;br /&gt;                 mean(pima[train,&lt;span style=&quot;color: #0080a0;&quot;&gt;9&lt;/span&gt;]&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;Ptrain.subset),&lt;br /&gt;                 mean(pima[train,&lt;span style=&quot;color: #0080a0;&quot;&gt;9&lt;/span&gt;]&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;Ptrain.full)))   &lt;br /&gt; }&lt;/pre&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;Представим данные из полученной таблицы на графике:&lt;/span&gt;&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&amp;nbsp;&amp;nbsp;&lt;/span&gt;&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;/div&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;   plot ( Res&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;MCount,Res&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;subsetCP, type=&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;b&quot;&lt;/span&gt;, lwd=&lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;, pch &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;17&lt;/span&gt;, col=&lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt;, &lt;br /&gt;              xlab=&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;Число моделей&quot;&lt;/span&gt;, ylab=&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;Ошибка предсказания&quot;&lt;/span&gt;, ylim=c(&lt;span style=&quot;color: #0080a0;&quot;&gt;0.76&lt;/span&gt;, &lt;span style=&quot;color: #0080a0;&quot;&gt;0.81&lt;/span&gt;))&lt;br /&gt;   lines ( Res&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;MCount,Res&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;fullCP, type=&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;b&quot;&lt;/span&gt;, lwd=&lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;, pch &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;16&lt;/span&gt;, col=&lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;) &lt;br /&gt;   lines ( Res&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;MCount,Res&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;subsetCT, type=&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;b&quot;&lt;/span&gt;, lwd=&lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;, pch &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;, col=&lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt;) &lt;br /&gt;   lines ( Res&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;MCount,Res&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;fullCT, type=&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;b&quot;&lt;/span&gt;, lwd=&lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;, pch &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;, col=&lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt;) &lt;br /&gt;   legend(&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;bottomright&quot;&lt;/span&gt;, c(&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;Test Subset&quot;&lt;/span&gt;, &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;Test Full&quot;&lt;/span&gt;,&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;Train Subset&quot;&lt;/span&gt;, &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;Train Full&quot;&lt;/span&gt;),&lt;br /&gt;       col= c(&lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt;,&lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;,&lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt;,&lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt;),  pch &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; c(&lt;span style=&quot;color: #0080a0;&quot;&gt;17&lt;/span&gt;,&lt;span style=&quot;color: #0080a0;&quot;&gt;16&lt;/span&gt;,&lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;,&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;))&lt;/pre&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;a href=&quot;https://3.bp.blogspot.com/-GLpBbgS5hhM/Wl801X63P-I/AAAAAAAADfQ/wNhSht--nqM8Pc8IAFcKtaXG5UFiL01uACEwYBhgL/s1600/Fig%2B6.png&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; data-original-height=&quot;575&quot; data-original-width=&quot;638&quot; src=&quot;https://3.bp.blogspot.com/-GLpBbgS5hhM/Wl801X63P-I/AAAAAAAADfQ/wNhSht--nqM8Pc8IAFcKtaXG5UFiL01uACEwYBhgL/s1600/Fig%2B6.png&quot; /&gt;&lt;/a&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;/span&gt;&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;На основе проведенных расчетов можно сделать ряд выводов:&lt;/span&gt;&lt;/span&gt;&lt;br /&gt;&lt;br /&gt;&lt;ol&gt;&lt;li&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;Эффективность коллектива моделей, как правило, выше одной оптимальной модели, поскольку комбинированное решение может быть эффективным инструментом стабилизации дисперсии прогнозных значений. Такое решение значительно более устойчиво к не вполне объяснимым &quot;провалам&quot;, которые свойственны отдельным индивидуальным моделям. Кроме того коллектив может дополнительно учитывать часто весьма полезный вклад &lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&quot;&lt;/span&gt;&lt;/span&gt;слабых&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&quot;&lt;/span&gt;&lt;/span&gt; предикторов, не включенных в оптимальную модель.&amp;nbsp;&amp;nbsp;&lt;/span&gt;&lt;/span&gt;&lt;/li&gt;&lt;li&gt;Сам по себе размер ансамбля не должен быть чрезмерно большим. Согласно известной аксиоме (Розенберг Г. (1987) &quot;Тройка, семерка, туз...&quot;. Знание-Сила, №1, с. 97), этот&amp;nbsp; оптимум обычно находится в диапазоне от трех до семи членов&amp;nbsp; (предпочтительно при &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;delta&lt;/span&gt; &amp;lt; 2).&lt;/li&gt;&lt;li&gt;Необходима разработка модуля для тестирования ансамблей моделей и нахождения оптимальных гиперпараметров агрегированной модели (механизма усреднения коэффициентов и числа членов&lt;i&gt; r&lt;/i&gt;), который был бы подобен функции&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt; train() &lt;/span&gt;из пакета &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;caret&lt;/span&gt;.&lt;/li&gt;&lt;/ol&gt;&lt;/div&gt;&lt;br /&gt;&lt;br /&gt;&lt;b&gt; Сравнение с другими типами моделей&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Используем набор данных &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;pima&lt;/span&gt; для построения моделей бинарной классификации другими различными методами, подробно рассмотренными нами ранее (&lt;a href=&quot;https://ranalytics.github.io/data-mining/&quot; target=&quot;_blank&quot;&gt;Шитиков, Мастицкий 2017&lt;/a&gt;, глава 6). Оптимизацию гиперпараметров и подгонку коэффициентов будем выполнять с применением функции &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;train()&lt;/span&gt;&amp;nbsp;из пакета &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;caret&lt;/span&gt;. В качестве сравниваемых показателей эффективности применим точность прогнозирования исхода &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;test&lt;/span&gt; различными моделями на тестовой выборке (&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;Acc.test&lt;/span&gt;) и обучающей выборке (&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;Acc.train&lt;/span&gt;). Первые две строки итоговой таблицы заполним значениями из ранее сформированной таблицы &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;Res&lt;/span&gt;:&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;/div&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;MethodRes &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; &lt;span style=&quot;color: #a08000;&quot;&gt;data.frame&lt;/span&gt;(Acc.test &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; Res&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;subsetCP[&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;],&lt;/div&gt;&lt;br /&gt;Acc.train &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; Res&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;subsetCT[&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;])&lt;br /&gt; MethodRes &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; rbind(MethodRes, c(max(c(Res&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;subsetCP[&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;],&lt;br /&gt;                   Res&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;fullCP[&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;])), max(c(Res&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;subsetCT[&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;], Res&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;fullCT[&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;]))) )&lt;/pre&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;&lt;span style=&quot;color: #406040;&quot;&gt; # определение схемы тестирования&lt;/span&gt;&lt;br /&gt; control &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; trainControl(method=&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;repeatedcv&quot;&lt;/span&gt;, &lt;br /&gt;                         number=&lt;span style=&quot;color: #0080a0;&quot;&gt;10&lt;/span&gt;, repeats=&lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt;, classProbs &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; TRUE)&lt;/pre&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;&lt;span style=&quot;color: #406040;&quot;&gt; # LDA - линейный дискриминантный анализ&lt;/span&gt;&lt;br /&gt; set.seed(&lt;span style=&quot;color: #0080a0;&quot;&gt;7&lt;/span&gt;)&lt;br /&gt; fit.lda &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; train(pima[train, &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;8&lt;/span&gt;], pima&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;test[train],&lt;br /&gt;                  method=&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;lda&quot;&lt;/span&gt;, trControl=control)&lt;br /&gt; MethodRes &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; rbind(MethodRes,  &lt;br /&gt;                    c(mean(pima[&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;train, &lt;span style=&quot;color: #0080a0;&quot;&gt;9&lt;/span&gt;]&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;predict(fit.lda,  predtab)), &lt;br /&gt;                    mean(pima[train, &lt;span style=&quot;color: #0080a0;&quot;&gt;9&lt;/span&gt;]&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;predict(fit.lda, traintab))))&lt;br /&gt;&lt;br /&gt;&lt;span style=&quot;color: #406040;&quot;&gt; # SVML - метод опорных векторов с линейным ядром&lt;/span&gt;&lt;br /&gt; set.seed(&lt;span style=&quot;color: #0080a0;&quot;&gt;7&lt;/span&gt;)&lt;br /&gt; fit.svL &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; train(pima[train, &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;8&lt;/span&gt;], pima&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;test[train],&lt;br /&gt;                  method=&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;svmLinear&quot;&lt;/span&gt;, trControl=control)&lt;br /&gt; MethodRes &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; rbind(MethodRes,  &lt;br /&gt;                    c(mean(pima[&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;train, &lt;span style=&quot;color: #0080a0;&quot;&gt;9&lt;/span&gt;]&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;predict(fit.svL, predtab)), &lt;br /&gt;                    mean(pima[train, &lt;span style=&quot;color: #0080a0;&quot;&gt;9&lt;/span&gt;]&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;predict(fit.svL, traintab))))&lt;br /&gt;&lt;br /&gt;&lt;span style=&quot;color: #406040;&quot;&gt; # SVMR  - метод опорных векторов с радиальным ядром&lt;/span&gt;&lt;br /&gt; set.seed(&lt;span style=&quot;color: #0080a0;&quot;&gt;7&lt;/span&gt;)&lt;br /&gt; fit.svR &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; train(pima[train, &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;8&lt;/span&gt;], pima&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;test[train],&lt;br /&gt;                  method=&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;svmRadial&quot;&lt;/span&gt;, trControl=control,&lt;br /&gt;                  tuneGrid &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; expand.grid(sigma &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.4&lt;/span&gt;, C &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;))&lt;br /&gt; MethodRes &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; rbind(MethodRes,  &lt;br /&gt;                    c(mean(pima[&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;train, &lt;span style=&quot;color: #0080a0;&quot;&gt;9&lt;/span&gt;]&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;predict(fit.svR, predtab)), &lt;br /&gt;                    mean(pima[train, &lt;span style=&quot;color: #0080a0;&quot;&gt;9&lt;/span&gt;]&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;predict(fit.svR, traintab))))&lt;br /&gt;&lt;br /&gt;&lt;span style=&quot;color: #406040;&quot;&gt; # CART - дерево классификации&lt;/span&gt;&lt;br /&gt; set.seed(&lt;span style=&quot;color: #0080a0;&quot;&gt;7&lt;/span&gt;)&lt;br /&gt; fit.cart &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; train(pima[train, &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;8&lt;/span&gt;], pima&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;test[train],&lt;br /&gt;                   method=&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;rpart&quot;&lt;/span&gt;, trControl=control)&lt;br /&gt; MethodRes &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; rbind(MethodRes,  &lt;br /&gt;                    c(mean(pima[&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;train, &lt;span style=&quot;color: #0080a0;&quot;&gt;9&lt;/span&gt;]&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;predict(fit.cart, predtab)), &lt;br /&gt;                    mean(pima[train, &lt;span style=&quot;color: #0080a0;&quot;&gt;9&lt;/span&gt;]&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;predict(fit.cart, traintab))))&lt;br /&gt;&lt;br /&gt;&lt;span style=&quot;color: #406040;&quot;&gt; # RF - случайный лес&lt;/span&gt;&lt;br /&gt; set.seed(&lt;span style=&quot;color: #0080a0;&quot;&gt;7&lt;/span&gt;)&lt;br /&gt; fit.rf &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; train(pima[train, &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;8&lt;/span&gt;], pima&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;test[train],&lt;br /&gt;                 method=&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;rf&quot;&lt;/span&gt;, trControl=control)&lt;br /&gt; MethodRes &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; rbind(MethodRes,   &lt;br /&gt;                    c(mean(pima[&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;train, &lt;span style=&quot;color: #0080a0;&quot;&gt;9&lt;/span&gt;]&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;predict(fit.rf, predtab)), &lt;br /&gt;                    mean(pima[train, &lt;span style=&quot;color: #0080a0;&quot;&gt;9&lt;/span&gt;]&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;predict(fit.rf, traintab))))&lt;br /&gt; &lt;br /&gt; rownames(MethodRes) &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; c(&lt;br /&gt;&lt;span style=&quot;color: #c03030;&quot;&gt; &quot;Логистическая регрессия&quot;&lt;/span&gt;,&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;Усредненная модель ALR&quot;&lt;/span&gt;,&lt;br /&gt;&lt;span style=&quot;color: #c03030;&quot;&gt; &quot;Дискриминантный анализ LDA&quot;&lt;/span&gt;,&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;Опорные векторы SVM (лин.ядро)&quot;&lt;/span&gt;,&lt;br /&gt;&lt;span style=&quot;color: #c03030;&quot;&gt; &quot;Опорные векторы SVM (рад.ядро)&quot;&lt;/span&gt;,&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;CART - дерево классификации&quot;&lt;/span&gt;,&lt;br /&gt;&lt;span style=&quot;color: #c03030;&quot;&gt; &quot;RF - случайный лес&quot;&lt;/span&gt;)&lt;br /&gt; &lt;br /&gt; MethodRes&lt;br /&gt;                                Acc.test Acc.train&lt;br /&gt; Логистическая регрессия        &lt;span style=&quot;color: #0080a0;&quot;&gt;0.7628866&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.7830508&lt;/span&gt;&lt;br /&gt; Усредненная модель  ALR        &lt;span style=&quot;color: #0080a0;&quot;&gt;0.7938144&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.8033898&lt;/span&gt;&lt;br /&gt; Дискриминантный анализ LDA     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.7938144&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.7898305&lt;/span&gt;&lt;br /&gt; Опорные векторы SVM (лин.ядро) &lt;span style=&quot;color: #0080a0;&quot;&gt;0.7731959&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.7898305&lt;/span&gt;&lt;br /&gt; Опорные векторы SVM (рад.ядро) &lt;span style=&quot;color: #0080a0;&quot;&gt;0.7319588&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.9525424&lt;/span&gt;&lt;br /&gt; CART &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt; дерево классификации    &lt;span style=&quot;color: #0080a0;&quot;&gt;0.7731959&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.8033898&lt;/span&gt;&lt;br /&gt; RF &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt; случайный лес             &lt;span style=&quot;color: #0080a0;&quot;&gt;0.8041237&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1.0000000&lt;/span&gt;&lt;/pre&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;br /&gt;Снова (и это становится уже очевидной тенденцией) вне конкуренции оказалась модель случайного леса (&lt;i&gt;Random Forrest&lt;/i&gt;), также использующая коллектив моделей, основанных на деревьях классификации. Интересны также результаты, показанные моделью опорных векторов с радиальным ядром: найденная этой моделью гиперплоскость почти идеально разделила объекты обучающей выборки, но это привело к многим ошибкам на тестовой выборке (т.е. произошло типичное &quot;переобучение&quot; модели). Обсуждаемая нами агрегированная модель на основе 6 частных моделей логистической регрессии ALR показала вполне достойные результаты на фоне остальных 6 моделей, построенных другими современными методами.&lt;/span&gt;&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;/span&gt;&lt;/div&gt;&lt;h3 style=&quot;text-align: left;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;Рекомендуемая литература&lt;/span&gt;&lt;/span&gt;&lt;/h3&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;ul&gt;&lt;li&gt;&lt;i&gt;Burnham KP, Anderson DR&lt;/i&gt; (2002) Model selection and multimodel inference: a practical information-theoretic approach, 2nd ed. Springer, New York&lt;/li&gt;&lt;li&gt;&lt;i&gt;Faraway JJ&amp;nbsp;&lt;/i&gt;(2002) Practical Regression and Anova using R. Электронная книга, адрес доступа:&amp;nbsp; &lt;a href=&quot;http://www.stat.lsa.umich.edu/~faraway/book&quot;&gt;www.stat.lsa.umich.edu/~faraway/book&lt;/a&gt;&lt;/li&gt;&lt;li&gt;&lt;i&gt;Lukacs PM, Burnham KP, Anderson DR&amp;nbsp;&lt;/i&gt;(2009) Model selection bias and Freedman&#39;s paradox. Annals of the Institute of Statistical Mathematics 62(1): 117-125&lt;/li&gt;&lt;li&gt;&lt;i&gt;Шитиков ВК, Мастицкий СЭ&lt;/i&gt;&amp;nbsp;(2017) Классификация, регрессия и другие алгоритмы Data Mining с использованием R. Электронная книга, адрес доступа: &lt;a href=&quot;https://github.com/ranalytics/data-mining&quot;&gt;https://github.com/ranalytics/data-mining&lt;/a&gt;&lt;/li&gt;&lt;/ul&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;br /&gt;&lt;/div&gt;&lt;/div&gt;</content><link rel='replies' type='text/html' href='http://r-analytics.blogspot.com/2018/03/mumin-2.html#comment-form' title='Комментарии: 1'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/4277851432674845147'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/4277851432674845147'/><link rel='alternate' type='text/html' href='http://r-analytics.blogspot.com/2018/03/mumin-2.html' title='Работа с пакетом MuMIn. Часть 2: Объединение моделей для получения коллективного решения'/><author><name>В.Шитиков</name><uri>http://www.blogger.com/profile/01896460847215383456</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='31' height='32' src='//1.bp.blogspot.com/-5Wttqmz7yaM/WFemBTJup6I/AAAAAAAADUE/VRlomgxu2QsLFzRgbGdGQzmQQ06lRKM7gCK4B/s220/Face2.JPG'/></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://3.bp.blogspot.com/-IGO_linMQqQ/Wl801QFHtGI/AAAAAAAADfI/tn1Mzydv2sk-algLInxHJ5nTp9yiNhoYgCEwYBhgL/s72-c/Fig%2B5.png" height="72" width="72"/><thr:total>1</thr:total></entry><entry><id>tag:blogger.com,1999:blog-9120847565867616203.post-8132245469977807600</id><published>2018-01-14T14:02:00.000+00:00</published><updated>2018-01-14T14:02:12.024+00:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="MuMIn"/><category scheme="http://www.blogger.com/atom/ns#" term="информационные критерии"/><category scheme="http://www.blogger.com/atom/ns#" term="селекция моделей"/><title type='text'>Работа с пакетом MuMIn. Часть 1: Селекция моделей</title><content type='html'>&lt;div dir=&quot;ltr&quot; style=&quot;text-align: left;&quot; trbidi=&quot;on&quot;&gt;&lt;h3&gt;&lt;div style=&quot;text-align: right;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-weight: 400;&quot;&gt;&lt;i&gt;Автор: Владимир Шитиков&lt;/i&gt;&lt;/span&gt;&lt;/span&gt;&lt;/div&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;br /&gt;Введение &lt;br /&gt;&lt;br /&gt;&lt;div style=&quot;font-weight: normal; text-align: justify;&quot;&gt;Современные исследования приобретают все более и более обобщающий и стратегический характер, а глубокая стратегия никогда не ограничивается рассмотрением какой-то одной идеи, гипотезы или модели. Принцип &quot;&lt;i&gt;множественности моделей&lt;/i&gt;&quot;, сформулированный еще в 1890 г. Т. Чемберленом, предполагает формирование набора альтернативных научных гипотез \(H_1, H_2,  \dots, H_r\),  для каждой из которых подбирается адекватная математическая модель. В итоге вместо того, чтобы находить по Фишеру соотношение вероятностей основной и нулевой гипотез \(H_0 | H_1\), оценивается относительная &lt;i&gt;сила обоснованности&lt;/i&gt; (&lt;i&gt;strength of evidence&lt;/i&gt;) каждой из рассматриваемых гипотетических моделей \(g_1, g_2, \dots, g_r\). Эта новая парадигма оформилась в современную методологию &quot;&lt;i&gt;Model selection and Multimodel inference&lt;/i&gt;&quot; (Burnham, Anderson, 2002), которая базируется на основных принципах теории информации Кульбака-Лейблера (Kullback-Leibler, 1951) и включает ранжирование моделей с последующим формированием статистического вывода на основе этих нескольких моделей.&amp;nbsp;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-weight: 400;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;/div&gt;&lt;span style=&quot;font-weight: normal;&quot;&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Пакет &lt;span style=&quot;font-family: Courier New, Courier, monospace;&quot;&gt;MuMIn&lt;/span&gt; (от &quot;&lt;i&gt;Multi-Model Inference&lt;/i&gt;&quot;), разработанный К. Бартоном, содержит набор функций, которые, используя информационные критерии, реализуют ранжирование и отбор статистических моделей различного типа и их последующее обобщение (&lt;i&gt;model averaging&lt;/i&gt;) с целью получения коллективного решения. Ансамбль \(G_r\) моделей, включаемых в анализ, может формироваться либо автоматически (например, как все возможные комбинации подмножеств предикторов заданной &quot;глобальной&quot; модели), либо задается исследователем в виде набора конкретных моделей (т.е. математически выраженных гипотез, нуждающихся в проверке). Для всех анализируемых моделей выполняется подгонка их коэффициентов по эмпирическим наборам данных и рассчитываются основные статистики и информационные критерии \(IC\) качества аппроксимации. Полный список из \(r\) моделей сортируют по уменьшению адекватности на основе заданного \(IC\) и устанавливают порог, согласно которому некоторое количество &quot;оптимальных&quot; моделей далее будет использовано для формирования окончательного коллективного решения. Такие коллективные решения могут быть получены с использованием как традиционных взвешенных средних, так и других специальных алгоритмов (метод Бейтса-Гренджера, бутстреп, метод &quot;складного ножа&quot;, адаптивная регрессия и др.).&amp;nbsp;&lt;/div&gt;&lt;/span&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;span style=&quot;font-weight: normal;&quot;&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;В этой статье мы рассмотрим первую часть описанной процедуры, т.е. построение ранжированного списка моделей на основе информационных критериев с использованием пакета &lt;span style=&quot;font-family: Courier New, Courier, monospace;&quot;&gt;MuMIn&lt;/span&gt;.&lt;/div&gt;&lt;/span&gt;&lt;/span&gt;&lt;/h3&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;script async=&quot;&quot; src=&quot;//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js&quot;&gt;&lt;/script&gt;&lt;!-- R Analytics Responsive --&gt;&lt;br /&gt;&lt;ins class=&quot;adsbygoogle&quot; data-ad-client=&quot;ca-pub-6457966355894443&quot; data-ad-format=&quot;auto&quot; data-ad-slot=&quot;8123690788&quot; style=&quot;display: block;&quot;&gt;&lt;/ins&gt;&lt;script&gt;(adsbygoogle = window.adsbygoogle || []).push({}); &lt;/script&gt; &lt;b&gt;&lt;br /&gt;&lt;/b&gt;&lt;b&gt;&lt;/b&gt;&lt;br /&gt;&lt;a name=&#39;more&#39;&gt;&lt;/a&gt;&lt;b&gt;Информационные критерии&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Энтропийная мера Кульбака-Лейблера (K-L) трактуется как доля потерянной информации при использовании модели \(g_i\)&amp;nbsp;по сравнению с отображаемой этой моделью &quot;полной реальностью&quot; (&lt;i&gt;full reality&lt;/i&gt;). Таким образом, для выбора оптимальной модели из набора \(G_r\) необходимо подобрать такой критерий, который соответствует минимуму информационных потерь. В своей ключевой работе Хиротугу Акаике (Akaike, 1973) объединил понятия информационной и статистической теории и пришел к выводу фундаментальной важности: поиск оптимальной модели можно выполнить путем минимизации величины&lt;br /&gt;\[\log(L(\hat{\theta}|data)) - Const,\] где \(L(\hat{\theta}|data)\) &lt;i&gt;-&amp;nbsp;&lt;/i&gt;максимум функции правдоподобия модели \(g_i\) с коэффициентами \(\hat{\theta}\), подогнанными по выборочным данным \(data\), а \(Const\) - некоторая&amp;nbsp;константа, корректирующая смещение и зависящая от числа степеней свободы. Акаике предложил конкретное определение соответствующего информационного критерия: \[ AIC = -2 \log(L(\hat{\theta}|data))&amp;nbsp;+ 2K, \] где&amp;nbsp;&lt;i&gt;K -&amp;nbsp;&lt;/i&gt;количество параметров модели.&lt;br /&gt;&lt;br /&gt;Далее последовали достаточно многочисленные попытки &quot;подправить&quot; выражение для \(Const\). В частности, для малых выборок при \(n/K &amp;lt; 40\)&amp;nbsp;рекомендуется использовать скорректированный \(AIC\), который имеет вид (Sugiura, 1978): \[ AIC_{c} = AIC&amp;nbsp;+ 2K(K + 1) / (n - K - 1). \] Если объем выборки \(n \gg K\), то \(AIC_{c}\) сводится к \(AIC\).&amp;nbsp; В случае обычной регрессии, решаемой методом наименьших квадратов, \(\log(L(\hat{\theta}|data)) = -(n/2) \log(RSS/n)\)&amp;nbsp; и \[AIC_{c} = n \log(RSS/n)&amp;nbsp;+ 2K&amp;nbsp;+ 2K(K + 1) / (n - K - 1), \] где \(RSS\) - сумма квадратов остатков подогнанной модели.&lt;br /&gt;&lt;br /&gt;Весьма популярен &lt;i&gt;байесовский информационный критерий&lt;/i&gt;, который позволяет выбирать модели на основе принципа &lt;i&gt;максимального апостериорного правдоподобия&lt;/i&gt; (&lt;i&gt;a&amp;nbsp;&lt;/i&gt;&lt;span class=&quot;fontstyle0&quot;&gt;&lt;i&gt;posteriori most likely&lt;/i&gt;)&lt;/span&gt;. При аппроксимации формулы Байеса, выполненной Шварцем (Schwarz, 1978), этот критерий имеет вид: \[BIC = -2 \log(L(\hat{\theta}|data))&amp;nbsp;+ K \log(n).\] В литературе (Claeskens, Hjort, 2008) подробно описаны&amp;nbsp;и&amp;nbsp;другие&amp;nbsp;версии информационных критериев: &lt;i&gt;Takeuchi&#39;s IC&lt;/i&gt;&amp;nbsp;(\(TIC\)), &lt;i&gt;Deviance IC&lt;/i&gt;&amp;nbsp;(\(DIC\)), &lt;i&gt;Hannan and Quinn criterion&lt;/i&gt;&amp;nbsp;(\(HQ\)), &lt;i&gt;Focused IC&lt;/i&gt;&amp;nbsp;(\(FIC\)), информационные критерии для счетных данных с высокой дисперсией (\(QAIC, QAIC_{c}\)), \(CAICF\)&amp;nbsp;(где \(C\) соответствует слову &quot;Consistent&quot;, а \(F\) означает, что используется информационная матрица Фишера), а также близкие по сути статистики \(C_p\)&amp;nbsp;Мэллоуза (&lt;i&gt;Mallows&lt;/i&gt;) и \(ICOMP\) (&lt;i&gt;&lt;u&gt;I&lt;/u&gt;nformational &lt;u&gt;Comp&lt;/u&gt;lexity&lt;/i&gt;).&lt;br /&gt;&lt;br /&gt;Для вычисления перечисленных критериев в пакетах &lt;span style=&quot;font-family: Courier New, Courier, monospace;&quot;&gt;stats&lt;/span&gt;, &lt;span style=&quot;font-family: Courier New, Courier, monospace;&quot;&gt;MuMIn&lt;/span&gt;, &lt;span style=&quot;font-family: Courier New, Courier, monospace;&quot;&gt;arm&lt;/span&gt; и &lt;span style=&quot;font-family: Courier New, Courier, monospace;&quot;&gt;GEE&lt;/span&gt;&amp;nbsp;имеются соответствующие функции. Подлежащий использованию тип критерия выбирается из сложно формализуемых соображений и задается в представленных ниже примерах параметром &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;rank = &lt;/span&gt;&amp;lt;&lt;i&gt;имя IC-функции&lt;/i&gt;&amp;gt;, причем по умолчанию используется \(AIC_{c}\).&lt;br /&gt;&lt;br /&gt;Рассмотрим процесс построения и селекции моделей на трех примерах с разной степенью их детализации.&lt;br /&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;b&gt;Теплота гидратации цемента&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;Сначала обратимся к хрестоматийному примеру,&amp;nbsp;который основан на наборе данных &lt;span style=&quot;font-family: Courier New, Courier, monospace;&quot;&gt;Cement&lt;/span&gt; и подробно комментируется в основной литературе (см. Burnham, Anderson, 2002, стр. 100). Задача заключается в нахождении зависимости теплоты гидратации &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;y&lt;/span&gt;&amp;nbsp;(кал/г), выделяющейся при затвердевании различных марок цемента, от химического состава этих марок. Четыре независимых переменных соответствуют содержанию различных оксидных составляющих:&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt; X1:&lt;/span&gt;&amp;nbsp;\(3 CaO \times Al_2O_3\), &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;X2:&lt;/span&gt;&amp;nbsp;\(3CaO \times SiO_2\), &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;X3:&lt;/span&gt;&amp;nbsp;\(4CaO \times Al_2O_3 \times Fe_2O_3\), и&amp;nbsp;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;X4:&lt;/span&gt;&amp;nbsp;\(2CaO \times SiO_2\). Построим линейную регрессионную модель:&lt;br /&gt;&lt;/div&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;library(MuMIn)&lt;br /&gt;&lt;span style=&quot;color: #406040;&quot;&gt;# можно изменить значение по умолчанию &quot;na.omit&quot;, чтобы&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #406040;&quot;&gt;# не учитывать пропущенные значения&lt;/span&gt;&lt;br /&gt;options(na.action &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;na.fail&quot;&lt;/span&gt;) &lt;br /&gt;&lt;span style=&quot;color: #406040;&quot;&gt;# осуществляем построение глобальной модели&lt;/span&gt;&lt;br /&gt;fm1 &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; lm(y &lt;span style=&quot;color: #2060a0;&quot;&gt;~&lt;/span&gt; ., data &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; Cement)&lt;br /&gt;summary(fm1)&lt;br /&gt;Coefficients&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;br /&gt;            Estimate Std. Error t value Pr(&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;gt;&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;|&lt;/span&gt;t&lt;span style=&quot;color: #2060a0;&quot;&gt;|&lt;/span&gt;)  &lt;br /&gt;(Intercept)  &lt;span style=&quot;color: #0080a0;&quot;&gt;62.4054&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;70.0710&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.891&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.3991&lt;/span&gt;  &lt;br /&gt;X1            &lt;span style=&quot;color: #0080a0;&quot;&gt;1.5511&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.7448&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;2.083&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0708&lt;/span&gt; .&lt;br /&gt;X2            &lt;span style=&quot;color: #0080a0;&quot;&gt;0.5102&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.7238&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.705&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.5009&lt;/span&gt;  &lt;br /&gt;X3            &lt;span style=&quot;color: #0080a0;&quot;&gt;0.1019&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.7547&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.135&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.8959&lt;/span&gt;  &lt;br /&gt;X4           &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.1441&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.7091&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.203&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.8441&lt;/span&gt;  &lt;br /&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;br /&gt;Signif. codes&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt; ‘&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.001&lt;/span&gt; ‘&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.01&lt;/span&gt; ‘&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.05&lt;/span&gt; ‘.’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.1&lt;/span&gt; ‘ ’ &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;&lt;br /&gt;&lt;br /&gt;Residual standard error&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;2.446&lt;/span&gt; on &lt;span style=&quot;color: #0080a0;&quot;&gt;8&lt;/span&gt; degrees of freedom&lt;br /&gt;Multiple R&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;squared&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.9824&lt;/span&gt;,    Adjusted R&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;squared&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.9736&lt;/span&gt; &lt;br /&gt;F&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;statistic&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;111.5&lt;/span&gt; on &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt; and &lt;span style=&quot;color: #0080a0;&quot;&gt;8&lt;/span&gt; DF,  p&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;value&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;4.756e-07&lt;/span&gt;&lt;br /&gt;&lt;/pre&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;Функция &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;dredge()&lt;/span&gt; осуществляет построение всех возможных моделей из различных комбинаций независимых переменных полной линейной модели. В данном примере общее количество таких моделей составляет \(r = 2^K = 16.\)&lt;br /&gt;&lt;/div&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt; (ms1 &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; dredge(fm1))&lt;br /&gt;      Model selection table &lt;br /&gt;          (Intrc)    X1      X2      X3      X4 df  logLik  AICc delta weight&lt;br /&gt;       &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;52.58&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1.468&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.6623&lt;/span&gt;                  &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;28.156&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;69.3&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.00&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.566&lt;/span&gt;&lt;br /&gt;       &lt;span style=&quot;color: #0080a0;&quot;&gt;12&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;71.65&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1.452&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.4161&lt;/span&gt;         &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.2365&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;26.933&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;72.4&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;3.13&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.119&lt;/span&gt;&lt;br /&gt;       &lt;span style=&quot;color: #0080a0;&quot;&gt;8&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;48.19&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1.696&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.6569&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.2500&lt;/span&gt;          &lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;26.952&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;72.5&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;3.16&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.116&lt;/span&gt;&lt;br /&gt;       &lt;span style=&quot;color: #0080a0;&quot;&gt;10&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;103.10&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1.440&lt;/span&gt;                 &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.6140&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;29.817&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;72.6&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;3.32&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.107&lt;/span&gt;&lt;br /&gt;       &lt;span style=&quot;color: #0080a0;&quot;&gt;14&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;111.70&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1.052&lt;/span&gt;         &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.4100&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.6428&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;27.310&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;73.2&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;3.88&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.081&lt;/span&gt;&lt;br /&gt;       &lt;span style=&quot;color: #0080a0;&quot;&gt;15&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;203.60&lt;/span&gt;       &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.9234&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1.4480&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1.5570&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;29.734&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;78.0&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;8.73&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.007&lt;/span&gt;&lt;br /&gt;       &lt;span style=&quot;color: #0080a0;&quot;&gt;16&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;62.41&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1.551&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.5102&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.1019&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.1441&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;6&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;26.918&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;79.8&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;10.52&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.003&lt;/span&gt;&lt;br /&gt;       &lt;span style=&quot;color: #0080a0;&quot;&gt;13&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;131.30&lt;/span&gt;               &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1.2000&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.7246&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;35.372&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;83.7&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;14.43&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.000&lt;/span&gt;&lt;br /&gt;       &lt;span style=&quot;color: #0080a0;&quot;&gt;7&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;72.07&lt;/span&gt;        &lt;span style=&quot;color: #0080a0;&quot;&gt;0.7313&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1.0080&lt;/span&gt;          &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;40.965&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;94.9&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;25.62&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.000&lt;/span&gt;&lt;br /&gt;       &lt;span style=&quot;color: #0080a0;&quot;&gt;9&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;117.60&lt;/span&gt;                       &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.7382&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;45.872&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;100.4&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;31.10&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.000&lt;/span&gt;&lt;br /&gt;       &lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;57.42&lt;/span&gt;        &lt;span style=&quot;color: #0080a0;&quot;&gt;0.7891&lt;/span&gt;                  &lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;46.035&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;100.7&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;31.42&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.000&lt;/span&gt;&lt;br /&gt;       &lt;span style=&quot;color: #0080a0;&quot;&gt;11&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;94.16&lt;/span&gt;        &lt;span style=&quot;color: #0080a0;&quot;&gt;0.3109&lt;/span&gt;         &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.4569&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;45.761&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;104.5&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;35.21&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.000&lt;/span&gt;&lt;br /&gt;       &lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;81.48&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1.869&lt;/span&gt;                          &lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;48.206&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;105.1&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;35.77&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.000&lt;/span&gt;&lt;br /&gt;       &lt;span style=&quot;color: #0080a0;&quot;&gt;6&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;72.35&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;2.312&lt;/span&gt;          &lt;span style=&quot;color: #0080a0;&quot;&gt;0.4945&lt;/span&gt;          &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;48.005&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;109.0&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;39.70&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.000&lt;/span&gt;&lt;br /&gt;       &lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;110.20&lt;/span&gt;               &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1.2560&lt;/span&gt;          &lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;50.980&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;110.6&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;41.31&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.000&lt;/span&gt;&lt;br /&gt;       &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;95.42&lt;/span&gt;                                &lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;53.168&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;111.5&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;42.22&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.000&lt;/span&gt;&lt;br /&gt;      Models ranked by AICc(x)&lt;/pre&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;В полученной таблице представлены коэффициенты каждой из построенных моделей, значения логарифмов максимального правдоподобия и скорректированные значения информационного критерия Акаике, по убыванию которых выполнялась сортировка моделей. Важным показателем является величина \(\Delta_{i} = AIC_{c_i} - AIC_{c_{min}}\), которая соответствует потере информации Кульбака-Лейблера или, эквивалентно, увеличению расстояния от текущей до оптимальной модели. Шкала \(\Delta\) дает возможность исследователю выбрать допустимый порог информационных потерь и ограничить подмножество отбираемых моделей-претендентов по некоторому уровню адекватности.&lt;br /&gt;&lt;br /&gt;Применительно к имеющимся данным, относительное правдоподобие \(l_i\), оцененное для каждой модели \(g_i\), соответствует формализованному уровню ее обоснованности (&lt;i&gt;strength of evidence&lt;/i&gt;) по сравнению с наилучшей моделью и легко вычисляется как \(l_i = \exp(-0.5 \Delta_{i})\). Это выражение позволяет сформировать хорошо интерпретируемые утверждения, такие как &quot;Модель \(g_1\), основанная на &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;X1&lt;/span&gt; и &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;X2&lt;/span&gt;, в 192 раза лучше объясняет результаты эксперимента, чем полная модель \(g_{16}\)&quot; (или &quot;гипотеза \(H_4\)&amp;nbsp;в 192 раза более вероятна, чем \(H_{16}\)&quot;). Нетрудно вычислить, что соотношение обоснованности гипотез для \(\Delta = 2\) равно 2.7, а при \(\Delta = 4\) оно достигает 7.4. Отметим, что в рамках обсуждаемой методологии не рекомендуется использовать термин &quot;статистическая значимость&quot; в том смысле, в каком он используется в рамках классической дихотомической процедуры Фишера.&lt;br /&gt;&lt;br /&gt;Относительная вероятностная мера каждой модели \(g_i\)&amp;nbsp;в &lt;i&gt;ансамбле&lt;/i&gt; из \(G_r\)&amp;nbsp;моделей, или ее вес (&lt;span style=&quot;font-family: Times, Times New Roman, serif;&quot;&gt;&lt;i&gt;weight&lt;/i&gt;&lt;/span&gt;), может быть вычислена как нормированное значение силы обоснованности \[w_i = \exp(-0.5 \Delta_{i}) / \sum \exp(-0.5 \Delta_{i}) .\] Найденные веса позволяют также оценить относительную важность каждой независимой переменной как сумму весов тех моделей, в которых соответствующий предиктор присутствует:&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;/div&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;      &lt;span style=&quot;color: #406040;&quot;&gt;# Вычисляем степень важности отдельных предикторов&lt;/span&gt;&lt;br /&gt;      importance(ms1)&lt;br /&gt;                           X1   X2   X4   X3  &lt;br /&gt;      Importance&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;          &lt;span style=&quot;color: #0080a0;&quot;&gt;0.99&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.81&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.32&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.21&lt;/span&gt;&lt;br /&gt;      N containing models&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;8&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;8&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;8&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;8&lt;/span&gt;&lt;br /&gt;      &lt;span style=&quot;color: #406040;&quot;&gt;# Выводим на экран график таблицы сгенерированных моделей:&lt;/span&gt;&lt;br /&gt;      par(mar &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; c(&lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt;,&lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt;,&lt;span style=&quot;color: #0080a0;&quot;&gt;6&lt;/span&gt;,&lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt;))&lt;br /&gt;      plot(ms1, labAsExpr &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; TRUE) &lt;/pre&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;/div&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;a href=&quot;https://1.bp.blogspot.com/-z1apGaf5ojo/WltSYqlnPhI/AAAAAAAADQ0/mBpfbhQ5gD86-TE7EbQqHwS4DFYCJ81dgCLcBGAs/s1600/model_table.png&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; data-original-height=&quot;600&quot; data-original-width=&quot;600&quot; src=&quot;https://1.bp.blogspot.com/-z1apGaf5ojo/WltSYqlnPhI/AAAAAAAADQ0/mBpfbhQ5gD86-TE7EbQqHwS4DFYCJ81dgCLcBGAs/s1600/model_table.png&quot; /&gt;&lt;/a&gt;&lt;/div&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;&amp;nbsp;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;u&gt;&lt;i&gt;&lt;br /&gt;&lt;/i&gt;&lt;/u&gt;&lt;b&gt;Влияние курения на заболеваемость раком&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;Пакет&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt; MuMIn&lt;/span&gt;, разумеется, не ограничивается построением моделей обычной линейной регрессии. Список поддерживаемых моделей включает более 30 типов функций из различных пакетов (&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;glm&lt;/span&gt;, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;gam&lt;/span&gt;, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;lmer&lt;/span&gt;, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;polr&lt;/span&gt;, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;MCMCglmm&lt;/span&gt;, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;survreg&lt;/span&gt;, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;zeroinfl&lt;/span&gt;, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;betareg&lt;/span&gt; и проч.). Рассмотрим пример селекции моделей логистической регрессии с учетом парных взаимодействий факторов. &lt;br /&gt;&lt;br /&gt;Набор данных &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;esoph&lt;/span&gt; включает результаты обследования различных групп населения одного из департаментов Франции на предмет заболеваемости раком пищевода. Три порядковых переменных определяли интенсивность приема алкоголя (&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;alcgp&lt;/span&gt;) и табакокурения (&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;tobgp&lt;/span&gt;) в баллах от 1 до 4, а также градацию возраста обследуемых (&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;agegp&lt;/span&gt;) от 1 до 6. Переменные &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;ncases&lt;/span&gt;, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;ncontrols&lt;/span&gt; определяли число случаев заболевания раком и объем контрольной группы соответственно.&lt;br /&gt;&lt;br /&gt;Хорошим способом познакомиться со структурой данных является отображение ее в виде &lt;i&gt;мозаичной диаграммы&lt;/i&gt;:&lt;br /&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;/div&gt;&lt;div class=&quot;main-section highlighter-parsed-section&quot;&gt;&lt;div class=&quot;code&quot; id=&quot;parsed_code&quot;&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;   &lt;span style=&quot;color: #406040;&quot;&gt;## Реорганизация данных для мозаичной диаграммы&lt;/span&gt;&lt;br /&gt;   ttt &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; table(esoph&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;agegp, esoph&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;alcgp, esoph&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;tobgp)&lt;br /&gt;   ttt[ttt &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;] &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; esoph&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;ncases&lt;br /&gt;   tt1 &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; table(esoph&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;agegp, esoph&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;alcgp, esoph&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;tobgp)&lt;br /&gt;   tt1[tt1 &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;] &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; esoph&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;ncontrols&lt;br /&gt;   tt &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; &lt;span style=&quot;color: #a08000;&quot;&gt;array&lt;/span&gt;(c(ttt, tt1), c(dim(ttt),&lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;), &lt;br /&gt;      c(dimnames(ttt), &lt;span style=&quot;color: #a08000;&quot;&gt;list&lt;/span&gt;(c(&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;Болен&quot;&lt;/span&gt;, &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;Здоров&quot;&lt;/span&gt;))))&lt;br /&gt;   mosaicplot(tt, main=&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;Заболеваемость раком&quot;&lt;/span&gt;, color &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; TRUE)&lt;br /&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;/div&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;a href=&quot;https://2.bp.blogspot.com/-kpjXd0MPNzY/WltUFRvPYkI/AAAAAAAADRE/VWD20pN2DFoTInSZeju7dEHg117_cDH8ACLcBGAs/s1600/mosaic_plot.png&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; data-original-height=&quot;600&quot; data-original-width=&quot;640&quot; src=&quot;https://2.bp.blogspot.com/-kpjXd0MPNzY/WltUFRvPYkI/AAAAAAAADRE/VWD20pN2DFoTInSZeju7dEHg117_cDH8ACLcBGAs/s1600/mosaic_plot.png&quot; /&gt;&lt;/a&gt;&lt;/div&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;/div&gt;&lt;div style=&quot;text-align: center;&quot;&gt;&lt;br /&gt;&lt;/div&gt;Особенностью этого примера является использование такого достаточно специфического типа данных, как порядковые категориальные переменные:&amp;nbsp; &lt;br /&gt;&lt;br /&gt;&lt;/div&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;   str(esoph)&lt;br /&gt;   &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;data.frame&#39;&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;88&lt;/span&gt; obs. of  &lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt; variables&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;br /&gt;     &lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt; agegp    &lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; Ord.factor w&lt;span style=&quot;color: #2060a0;&quot;&gt;/&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;6&lt;/span&gt; levels &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;25-34&quot;&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt;&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;35-44&quot;&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt;..&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;...&lt;/span&gt;&lt;br /&gt;     &lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt; alcgp    &lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; Ord.factor w&lt;span style=&quot;color: #2060a0;&quot;&gt;/&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt; levels &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;0-39g/day&quot;&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt;&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;40-79&quot;&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt;..&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;...&lt;/span&gt;&lt;br /&gt;     &lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt; tobgp    &lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; Ord.factor w&lt;span style=&quot;color: #2060a0;&quot;&gt;/&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt; levels &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;0-9g/day&quot;&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt;&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;10-19&quot;&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt;..&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;...&lt;/span&gt;&lt;br /&gt;    &lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt; ncases   &lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; num  &lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;...&lt;/span&gt;&lt;br /&gt;    &lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt; ncontrols&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; num  &lt;span style=&quot;color: #0080a0;&quot;&gt;40&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;10&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;6&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;27&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;7&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;7&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;...&lt;/span&gt;&lt;br /&gt;   fm2 &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; glm(cbind(ncases, ncontrols) &lt;span style=&quot;color: #2060a0;&quot;&gt;~&lt;/span&gt; agegp &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt; tobgp &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt; alcgp,&lt;br /&gt;         data &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; esoph, family &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; binomial())&lt;br /&gt;   summary(fm2)&lt;br /&gt;   Coefficients&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;br /&gt;               Estimate Std. Error z value Pr(&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;gt;&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;|&lt;/span&gt;z&lt;span style=&quot;color: #2060a0;&quot;&gt;|&lt;/span&gt;)    &lt;br /&gt;   (Intercept) &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1.77997&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;0.19796&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;8.992&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;2e-16&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;br /&gt;   agegp.L      &lt;span style=&quot;color: #0080a0;&quot;&gt;3.00534&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;0.65215&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;4.608&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;4.06e-06&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;br /&gt;   agegp.Q     &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1.33787&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;0.59111&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;2.263&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.02362&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;  &lt;br /&gt;   agegp.C      &lt;span style=&quot;color: #0080a0;&quot;&gt;0.15307&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;0.44854&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.341&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.73291&lt;/span&gt;    &lt;br /&gt;   agegp&lt;span style=&quot;color: #2060a0;&quot;&gt;^&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt;      &lt;span style=&quot;color: #0080a0;&quot;&gt;0.06410&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;0.30881&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.208&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.83556&lt;/span&gt;    &lt;br /&gt;   agegp&lt;span style=&quot;color: #2060a0;&quot;&gt;^&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt;     &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.19363&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;0.19537&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.991&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.32164&lt;/span&gt;    &lt;br /&gt;   tobgp.L      &lt;span style=&quot;color: #0080a0;&quot;&gt;0.59448&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;0.19422&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;3.061&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.00221&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt; &lt;br /&gt;   tobgp.Q      &lt;span style=&quot;color: #0080a0;&quot;&gt;0.06537&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;0.18811&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.347&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.72823&lt;/span&gt;    &lt;br /&gt;   tobgp.C      &lt;span style=&quot;color: #0080a0;&quot;&gt;0.15679&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;0.18658&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.840&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.40071&lt;/span&gt;    &lt;br /&gt;   alcgp.L      &lt;span style=&quot;color: #0080a0;&quot;&gt;1.49185&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;0.19935&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;7.484&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;7.23e-14&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;br /&gt;   alcgp.Q     &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.22663&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;0.17952&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1.262&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.20680&lt;/span&gt;    &lt;br /&gt;   alcgp.C      &lt;span style=&quot;color: #0080a0;&quot;&gt;0.25463&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;0.15906&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;1.601&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.10942&lt;/span&gt;    &lt;br /&gt;   &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;br /&gt;   Signif. codes&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt; ‘&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.001&lt;/span&gt; ‘&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.01&lt;/span&gt; ‘&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.05&lt;/span&gt; ‘.’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.1&lt;/span&gt; ‘ ’ &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;&lt;br /&gt;       Null deviance&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;227.241&lt;/span&gt;  on &lt;span style=&quot;color: #0080a0;&quot;&gt;87&lt;/span&gt;  degrees of freedom&lt;br /&gt;   Residual deviance&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;53.973&lt;/span&gt;  on &lt;span style=&quot;color: #0080a0;&quot;&gt;76&lt;/span&gt;  degrees of freedom&lt;br /&gt;   AIC&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;225.45&lt;/span&gt;&lt;/pre&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;Модель показывает, насколько возрастает риск заболеть раком при перемещении в следующую по порядку градацию каждого фактора. Построим серию моделей с разными комбинациями состава потенциальных предикторов: &lt;br /&gt;&lt;/div&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;  ms2 &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; dredge(fm2))&lt;br /&gt;  Model selection table &lt;br /&gt;    (Intrc) agegp alcgp tobgp df logLik   AICc  delta  weight&lt;br /&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;8&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1.780&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;     &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;     &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;12&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;100.727&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;229.6&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.00&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.798&lt;/span&gt; &lt;br /&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1.911&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;     &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;            &lt;span style=&quot;color: #0080a0;&quot;&gt;9&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;106.026&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;232.4&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;2.75&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.202&lt;/span&gt; &lt;br /&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;6&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1.951&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;           &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;      &lt;span style=&quot;color: #0080a0;&quot;&gt;9&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;133.754&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;287.8&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;58.20&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.000&lt;/span&gt; &lt;br /&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;7&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1.297&lt;/span&gt;        &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;     &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;      &lt;span style=&quot;color: #0080a0;&quot;&gt;7&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;139.482&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;294.4&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;64.75&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.000&lt;/span&gt; &lt;br /&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1.402&lt;/span&gt;        &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;            &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;143.135&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;294.8&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;65.14&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.000&lt;/span&gt; &lt;br /&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;2.139&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;                  &lt;span style=&quot;color: #0080a0;&quot;&gt;6&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;143.297&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;299.6&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;70.02&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.000&lt;/span&gt; &lt;br /&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1.417&lt;/span&gt;              &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;      &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;178.506&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;365.5&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;135.88&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.000&lt;/span&gt; &lt;br /&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1.584&lt;/span&gt;                     &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;187.361&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;376.8&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;147.15&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.000&lt;/span&gt; &lt;br /&gt;  Models ranked by AICc(x) &lt;/pre&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;Согласно полученной сводной таблице, можно установить, что оптимальной является модель со всеми тремя факторами, которая идентична исходной полной модели (это, впрочем, вполне соответствует медицинским представлениям). Здесь знаки &quot;+&quot;  лишь показывают, какие факторы следует использовать в моделях, а конкретные значения подогнанных коэффициентов для каждой градации фактора скрыты из соображений компактности представления результатов. Полную информацию о коэффициентах моделей можно получить, выполнив команду&amp;nbsp;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;(attr(ms2,&quot;coefTables&quot;)&lt;/span&gt;.&lt;br /&gt;&lt;br /&gt;Проведем небольшой статистический эксперимент, превратив порядковые категориальные переменные&amp;nbsp;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;alcgp&lt;/span&gt; и &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;tobgp&lt;/span&gt; в действительные числа и построив модели, включающие полученные целочисленные переменные, а также их парные взаимодействия:&lt;br /&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;/div&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;  fm3 &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; glm(cbind(ncases, ncontrols) &lt;span style=&quot;color: #2060a0;&quot;&gt;~&lt;/span&gt; agegp &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt; unclass(tobgp) &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;br /&gt;    unclass(alcgp),data &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; esoph, family &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; binomial())&lt;br /&gt;  summary(fm3)&lt;br /&gt;  Coefficients&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;br /&gt;                                Estimate Std. Error z value Pr(&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;gt;&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;|&lt;/span&gt;z&lt;span style=&quot;color: #2060a0;&quot;&gt;|&lt;/span&gt;)    &lt;br /&gt;  (Intercept)                   &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;4.70284&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;0.49575&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;9.486&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;2e-16&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;br /&gt;  agegp.L                        &lt;span style=&quot;color: #0080a0;&quot;&gt;2.92868&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;0.65126&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;4.497&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;6.89e-06&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;br /&gt;  agegp.Q                       &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1.34088&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;0.58964&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;2.274&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.02296&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;  &lt;br /&gt;  agegp.C                        &lt;span style=&quot;color: #0080a0;&quot;&gt;0.12258&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;0.44850&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.273&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.78462&lt;/span&gt;    &lt;br /&gt;  agegp&lt;span style=&quot;color: #2060a0;&quot;&gt;^&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt;                        &lt;span style=&quot;color: #0080a0;&quot;&gt;0.06880&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;0.30787&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.223&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.82317&lt;/span&gt;    &lt;br /&gt;  agegp&lt;span style=&quot;color: #2060a0;&quot;&gt;^&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt;                       &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.22286&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;0.19530&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1.141&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.25382&lt;/span&gt;    &lt;br /&gt;  unclass(tobgp)                 &lt;span style=&quot;color: #0080a0;&quot;&gt;0.60346&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;0.20014&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;3.015&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.00257&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt; &lt;br /&gt;  unclass(alcgp)                 &lt;span style=&quot;color: #0080a0;&quot;&gt;0.94297&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;0.17916&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;5.263&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1.41e-07&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;br /&gt;  unclass(tobgp)&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;unclass(alcgp) &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.14099&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;0.07572&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1.862&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.06262&lt;/span&gt; .  &lt;br /&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;br /&gt;  Signif. codes&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt; ‘&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.001&lt;/span&gt; ‘&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.01&lt;/span&gt; ‘&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.05&lt;/span&gt; ‘.’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.1&lt;/span&gt; ‘ ’ &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;&lt;br /&gt;      Null deviance&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;227.241&lt;/span&gt;  on &lt;span style=&quot;color: #0080a0;&quot;&gt;87&lt;/span&gt;  degrees of freedom&lt;br /&gt;  Residual deviance&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;55.833&lt;/span&gt;  on &lt;span style=&quot;color: #0080a0;&quot;&gt;79&lt;/span&gt;  degrees of freedom&lt;br /&gt;  AIC&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;221.31&lt;/span&gt;&lt;br /&gt;  (ms3 &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; dredge(fm3))&lt;br /&gt;  Model selection table &lt;br /&gt;     (Int)  agg unc(alc) unc(tbg) unc(alc)&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;unc(tbg) df logLik   AICc  delta  weight&lt;br /&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;16&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;4.703&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.9430&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.6035&lt;/span&gt;   &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.1410&lt;/span&gt;           &lt;span style=&quot;color: #0080a0;&quot;&gt;9&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;101.657&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;223.6&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.00&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.612&lt;/span&gt; &lt;br /&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;8&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;4.011&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.6531&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.2616&lt;/span&gt;                     &lt;span style=&quot;color: #0080a0;&quot;&gt;8&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;103.379&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;224.6&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.96&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.379&lt;/span&gt; &lt;br /&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;3.570&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.6824&lt;/span&gt;                              &lt;span style=&quot;color: #0080a0;&quot;&gt;7&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;108.395&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;232.2&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;8.57&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.008&lt;/span&gt; &lt;br /&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;6&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;2.766&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;            &lt;span style=&quot;color: #0080a0;&quot;&gt;0.3293&lt;/span&gt;                     &lt;span style=&quot;color: #0080a0;&quot;&gt;7&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;134.536&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;284.5&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;60.85&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.000&lt;/span&gt; &lt;br /&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;15&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;4.200&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.9903&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.5544&lt;/span&gt;   &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.1445&lt;/span&gt;           &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;139.416&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;287.3&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;63.69&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.000&lt;/span&gt; &lt;br /&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;7&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;3.491&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.6920&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.2048&lt;/span&gt;                     &lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;141.396&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;289.1&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;65.46&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.000&lt;/span&gt; &lt;br /&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;3.165&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.7221&lt;/span&gt;                              &lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;144.846&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;293.8&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;70.21&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.000&lt;/span&gt; &lt;br /&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;2.139&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;                                       &lt;span style=&quot;color: #0080a0;&quot;&gt;6&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;143.297&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;299.6&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;76.01&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.000&lt;/span&gt; &lt;br /&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;2.152&lt;/span&gt;              &lt;span style=&quot;color: #0080a0;&quot;&gt;0.2957&lt;/span&gt;                     &lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;179.350&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;362.8&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;139.22&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.000&lt;/span&gt; &lt;br /&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1.584&lt;/span&gt;                                         &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;187.361&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;376.8&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;153.15&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.000&lt;/span&gt; &lt;br /&gt;  Models ranked by AICc(x) &lt;/pre&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;Приведенные расчеты имеют отношение к обсуждению такой нетривиальной проблемы, как статистическая природа повсеместно используемых балльных показателей, которые следует интерпретировать как порядковые категориальные переменные. В частности, по типологии Стивенса операции суммы или разности к ранговым переменным неприменимы, и поэтому некорректно&amp;nbsp; вычислять средний балл, применяемый, например, в фигурном катании. Тем не менее, в нашем примере модели с &quot;деклассированными&quot; переменными оказались существенно более эффективными по AICc-критерию, чем модели, основанных на исходных данных. Кроме того, добавление парных взаимодействий показывает, что много пьющие и курящие люди имеют более низкую вероятность заболеть раком, нежели это предсказывается моделью, включающей только аддитивные эффекты.&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;b&gt;Содержание озона в атмосферном воздухе&lt;/b&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;Набор данных &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;airquality&lt;/span&gt;, входящий в базовую комплектацию R, содержит результаты ежедневных метеорологических наблюдений с 1 мая по 31 октября в окрестностях Нью-Йорка. Он включает такие показатели, как солнечная радиация&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt; Solar.R&lt;/span&gt;&lt;span style=&quot;font-family: Times, Times New Roman, serif;&quot;&gt;,&lt;/span&gt; средняя скорость ветра &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;Wind&lt;/span&gt;&lt;span style=&quot;font-family: Times, Times New Roman, serif;&quot;&gt;, &lt;/span&gt;температура атмосферного воздуха &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;Temp&lt;/span&gt; и содержание озона&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt; Ozone&lt;/span&gt;, которое интерпретируется как зависимая переменная. Чтобы оценить степень нелинейности связи между переменными, выполним визуализацию основных зависимостей с использованием функций удобного пакета &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;visreg&lt;/span&gt;&lt;span style=&quot;font-family: Times, Times New Roman, serif;&quot;&gt;:&lt;br /&gt;&lt;/span&gt;&lt;/div&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;   data(airquality)&lt;br /&gt;   library(visreg)&lt;br /&gt;   airquality&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;MonthF &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; as.factor(airquality&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;Month)&lt;br /&gt;   fit &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; lm(Ozone &lt;span style=&quot;color: #2060a0;&quot;&gt;~&lt;/span&gt; Solar.R &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt; MonthF, data=airquality)&lt;br /&gt;   visreg(fit, &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;MonthF&quot;&lt;/span&gt;, by=&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;Solar.R&quot;&lt;/span&gt;, &lt;br /&gt;      breaks=&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;, points=&lt;span style=&quot;color: #a08000;&quot;&gt;list&lt;/span&gt;(cex=&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;, pch=&lt;span style=&quot;color: #0080a0;&quot;&gt;16&lt;/span&gt;))&lt;br /&gt;   fit &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; lm(Ozone &lt;span style=&quot;color: #2060a0;&quot;&gt;~&lt;/span&gt; Wind &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt; MonthF, data=airquality)&lt;br /&gt;   visreg(fit, &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;MonthF&quot;&lt;/span&gt;, by=&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;Wind&quot;&lt;/span&gt;, &lt;br /&gt;      breaks=&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;, points=&lt;span style=&quot;color: #a08000;&quot;&gt;list&lt;/span&gt;(cex=&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;, pch=&lt;span style=&quot;color: #0080a0;&quot;&gt;16&lt;/span&gt;))&lt;/pre&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;a href=&quot;https://3.bp.blogspot.com/-Pc9vWOD-978/WlSh8ccQUNI/AAAAAAAADe0/u-HWW1vLVosH8tTLdcxUWNAXx4Tn-ABiwCEwYBhgL/s1600/Fig%2B4.png&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; data-original-height=&quot;467&quot; data-original-width=&quot;991&quot; height=&quot;300&quot; src=&quot;https://3.bp.blogspot.com/-Pc9vWOD-978/WlSh8ccQUNI/AAAAAAAADe0/u-HWW1vLVosH8tTLdcxUWNAXx4Tn-ABiwCEwYBhgL/s640/Fig%2B4.png&quot; width=&quot;640&quot; /&gt;&lt;/a&gt;&lt;/div&gt;&amp;nbsp;&amp;nbsp; &lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;  library(splines)&lt;br /&gt;  fit &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; lm(Ozone &lt;span style=&quot;color: #2060a0;&quot;&gt;~&lt;/span&gt; Solar.R &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;ns(Wind, df=&lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;)&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;ns(Temp, df=&lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;), data=airquality)&lt;br /&gt;  visreg2d(fit, &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;Wind&quot;&lt;/span&gt;, &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;Temp&quot;&lt;/span&gt;, plot.type=&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;persp&quot;&lt;/span&gt;, col &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt;)&lt;/pre&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;a href=&quot;https://4.bp.blogspot.com/-xi_-OtQH_Bk/WlSh7t1fUNI/AAAAAAAADe0/rHDnoX9VpMslpmfY0A1e5hT1n-grAmeEwCEwYBhgL/s1600/Fig%2B1.png&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; data-original-height=&quot;503&quot; data-original-width=&quot;536&quot; src=&quot;https://4.bp.blogspot.com/-xi_-OtQH_Bk/WlSh7t1fUNI/AAAAAAAADe0/rHDnoX9VpMslpmfY0A1e5hT1n-grAmeEwCEwYBhgL/s1600/Fig%2B1.png&quot; /&gt;&lt;/a&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;Нетрудно заметить, что имеющиеся предикторы не являются независимыми: между ними существуют выраженные взаимодействия, имеющие нелинейный характер. Поэтому построим две исходные регрессионные модели для прогнозирования концентрации озона, первая из которых будет учитывать неаддитивность парных взаимодействий предикторов, а вторая - нелинейность их влияния на отклик. Конечно, можно было бы построить и единую модель, включающую сразу все необходимые трансформации базовых переменных, но мы хотим показать, как работает функция &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;merge()&lt;/span&gt;&lt;span style=&quot;font-family: Times, Times New Roman, serif;&quot;&gt;, выполняющая&amp;nbsp;&lt;/span&gt;объединение двух списков частных моделей. &lt;br /&gt;&lt;br /&gt;Перед началом расчетов выполним очистку набора данных от строк, содержащих пропущенные значения:&lt;br /&gt;&lt;/div&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;   airquality &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; airquality[complete.cases(airquality),]&lt;br /&gt;   airquality&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;Month.Day &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; airquality&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;Month &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt; airquality&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;Day&lt;span style=&quot;color: #2060a0;&quot;&gt;/&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;31&lt;/span&gt;&lt;br /&gt;   mod1 &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; lm(Ozone &lt;span style=&quot;color: #2060a0;&quot;&gt;~&lt;/span&gt; Month.Day &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt; (Solar.R &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt; Wind &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt; Temp )&lt;span style=&quot;color: #2060a0;&quot;&gt;^&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;,&lt;br /&gt;       data=airquality)&lt;br /&gt;   summary(mod1)&lt;br /&gt;   Coefficients&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;br /&gt;                  Estimate Std. Error t value Pr(&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;gt;&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;|&lt;/span&gt;t&lt;span style=&quot;color: #2060a0;&quot;&gt;|&lt;/span&gt;)   &lt;br /&gt;   (Intercept)  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1.421e+02&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;6.404e+01&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;2.218&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.02872&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt; &lt;br /&gt;   Month.Day    &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1.690e+00&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;1.368e+00&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1.235&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.21963&lt;/span&gt;   &lt;br /&gt;   Solar.R      &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1.978e-01&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;2.114e-01&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.936&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.35158&lt;/span&gt;   &lt;br /&gt;   Wind          &lt;span style=&quot;color: #0080a0;&quot;&gt;1.056e+01&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;4.280e+00&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;2.467&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.01527&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt; &lt;br /&gt;   Temp          &lt;span style=&quot;color: #0080a0;&quot;&gt;2.527e+00&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;8.472e-01&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;2.982&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.00357&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;br /&gt;   Solar.R&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;Wind &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;7.228e-03&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;6.671e-03&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1.083&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.28113&lt;/span&gt;   &lt;br /&gt;   Solar.R&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;Temp  &lt;span style=&quot;color: #0080a0;&quot;&gt;4.594e-03&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;2.468e-03&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;1.862&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.06549&lt;/span&gt; . &lt;br /&gt;   Wind&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;Temp    &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1.612e-01&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;5.881e-02&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;2.741&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.00723&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;br /&gt;   &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;br /&gt;   Signif. codes&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt; ‘&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.001&lt;/span&gt; ‘&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.01&lt;/span&gt; ‘&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.05&lt;/span&gt; ‘.’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.1&lt;/span&gt; ‘ ’ &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;&lt;br /&gt;   &lt;br /&gt;   Residual standard error&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;19.12&lt;/span&gt; on &lt;span style=&quot;color: #0080a0;&quot;&gt;103&lt;/span&gt; degrees of freedom&lt;br /&gt;   Multiple R&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;squared&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.6909&lt;/span&gt;,    Adjusted R&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;squared&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.6699&lt;/span&gt; &lt;br /&gt;   F&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;statistic&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;32.89&lt;/span&gt; on &lt;span style=&quot;color: #0080a0;&quot;&gt;7&lt;/span&gt; and &lt;span style=&quot;color: #0080a0;&quot;&gt;103&lt;/span&gt; DF,  p&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;value&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;2.2e-16&lt;/span&gt;&lt;/pre&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;На основе этой &quot;полной&quot; модели выполним построение ансамбля моделей с использоваением всех возможных комбинаций сформированных переменных. Поскольку число исходных параметров \(m = 7\), то наш ансамбль будет содержать \(2^7 = 128\)&amp;nbsp;моделей. Отсортируем его по убыванию BIC-критерия и с использованием функции&lt;span style=&quot;font-family: Times, Times New Roman, serif;&quot;&gt; &lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;subset()&lt;/span&gt;&lt;span style=&quot;font-family: Times, Times New Roman, serif;&quot;&gt; &lt;/span&gt;выберем подмножество наиболее адекватных моделей с&lt;span style=&quot;font-family: Times, Times New Roman, serif;&quot;&gt; &lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;delta &amp;lt; 4&lt;/span&gt;&lt;span style=&quot;font-family: Times, Times New Roman, serif;&quot;&gt;:&lt;br /&gt;&lt;/span&gt;&lt;/div&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;   ms1 &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; dredge(mod1, rank=BIC)&lt;br /&gt;   subset(ms1,delta &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt;)&lt;br /&gt;   Global model call&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; lm(formula &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; Ozone &lt;span style=&quot;color: #2060a0;&quot;&gt;~&lt;/span&gt; Month.Day &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt; &lt;br /&gt;            (Solar.R &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt; Wind &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt; Temp)&lt;span style=&quot;color: #2060a0;&quot;&gt;^&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;, data &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; airquality)&lt;br /&gt;   &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;br /&gt;   Model selection table &lt;br /&gt;     (Int) Mnt.Day    Slr.R   Tmp   Wnd Slr.R&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;Tmp Slr.R&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;Wnd Tmp&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;Wnd df   logLik    BIC delta weight&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;95&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;136.8&lt;/span&gt;         &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.35310&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;2.451&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;11.15&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.005717&lt;/span&gt;           &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.1863&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;7&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;482.309&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;997.6&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.00&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.435&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;79&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;245.1&lt;/span&gt;          &lt;span style=&quot;color: #0080a0;&quot;&gt;0.06599&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;3.914&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;14.38&lt;/span&gt;                     &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.2280&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;6&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;485.303&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;998.9&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;1.28&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.230&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;96&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;138.1&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1.690&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.32480&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;2.656&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;11.15&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.005250&lt;/span&gt;           &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.1862&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;8&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;481.502&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1000.7&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;3.10&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.093&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;111&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;232.6&lt;/span&gt;          &lt;span style=&quot;color: #0080a0;&quot;&gt;0.18250&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;3.476&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;12.96&lt;/span&gt;           &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.010670&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.1839&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;7&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;483.930&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1000.8&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;3.24&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.086&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;80&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;235.4&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;2.165&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.05826&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;4.022&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;14.05&lt;/span&gt;                     &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.2235&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;7&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;484.010&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1001.0&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;3.40&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.079&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;127&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;140.8&lt;/span&gt;         &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.22600&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;2.322&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;10.55&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.005061&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.007231&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.1613&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;8&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;481.689&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1001.1&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;3.47&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.077&lt;/span&gt;&lt;br /&gt;Models ranked by BIC(x)&lt;/pre&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;Для построения второй модели сформируем дополнительные переменные как квадраты исходных предикторов, а для отражения сезонности в данных воспользуемся функцией синусоиды для верхнего полупериода.&lt;br /&gt;&lt;/div&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;   airquality&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;Solar.R.2 &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; airquality&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;Solar.R&lt;span style=&quot;color: #2060a0;&quot;&gt;^&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;&lt;br /&gt;   airquality&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;Wind.2 &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; airquality&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;Wind&lt;span style=&quot;color: #2060a0;&quot;&gt;^&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;&lt;br /&gt;   airquality&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;Temp.2 &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; airquality&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;Temp&lt;span style=&quot;color: #2060a0;&quot;&gt;^&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;&lt;br /&gt;   &lt;span style=&quot;color: maroon;&quot;&gt;norm.0_1&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;function&lt;/span&gt;(x) (x&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;min(x))&lt;span style=&quot;color: #2060a0;&quot;&gt;/&lt;/span&gt;(max(x)&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;min(x))&lt;br /&gt;   airquality&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;sin.period &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; sin(pi&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;norm.0_1(airquality&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;Month.Day))&lt;br /&gt;   mod2 &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; lm(Ozone &lt;span style=&quot;color: #2060a0;&quot;&gt;~&lt;/span&gt; Solar.R &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt; Wind &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt; Temp &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;  Solar.R.2 &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt; Wind.2&lt;br /&gt;       &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt; Temp.2 &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt; sin.period, data=airquality)&lt;br /&gt;   summary(mod2)&lt;br /&gt;   Coefficients&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;br /&gt;                 Estimate Std. Error t value Pr(&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;gt;&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;|&lt;/span&gt;t&lt;span style=&quot;color: #2060a0;&quot;&gt;|&lt;/span&gt;)    &lt;br /&gt;   (Intercept)  &lt;span style=&quot;color: #0080a0;&quot;&gt;3.541e+02&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;1.046e+02&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;3.384&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.00101&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt; &lt;br /&gt;   Solar.R      &lt;span style=&quot;color: #0080a0;&quot;&gt;1.810e-01&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;9.041e-02&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;2.001&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.04798&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;  &lt;br /&gt;   Wind        &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1.330e+01&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;2.280e+00&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;5.831&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;6.37e-08&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;br /&gt;   Temp        &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;8.007e+00&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;2.812e+00&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;2.847&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.00532&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt; &lt;br /&gt;   Solar.R.2   &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;3.316e-04&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;2.608e-04&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1.272&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.20637&lt;/span&gt;    &lt;br /&gt;   Wind.2       &lt;span style=&quot;color: #0080a0;&quot;&gt;4.599e-01&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;9.986e-02&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;4.605&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1.18e-05&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;br /&gt;   Temp.2       &lt;span style=&quot;color: #0080a0;&quot;&gt;5.936e-02&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;1.805e-02&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;3.289&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.00137&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt; &lt;br /&gt;   sin.period   &lt;span style=&quot;color: #0080a0;&quot;&gt;1.326e+01&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;7.046e+00&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;1.882&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.06264&lt;/span&gt; .  &lt;br /&gt;   &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;br /&gt;   Signif. codes&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt; ‘&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.001&lt;/span&gt; ‘&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.01&lt;/span&gt; ‘&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.05&lt;/span&gt; ‘.’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.1&lt;/span&gt; ‘ ’ &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;&lt;br /&gt;   &lt;br /&gt;   Residual standard error&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;18.08&lt;/span&gt; on &lt;span style=&quot;color: #0080a0;&quot;&gt;103&lt;/span&gt; degrees of freedom&lt;br /&gt;   Multiple R&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;squared&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.7236&lt;/span&gt;,    Adjusted R&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;squared&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.7048&lt;/span&gt; &lt;br /&gt;   F&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;statistic&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;38.52&lt;/span&gt; on &lt;span style=&quot;color: #0080a0;&quot;&gt;7&lt;/span&gt; and &lt;span style=&quot;color: #0080a0;&quot;&gt;103&lt;/span&gt; DF,  p&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;value&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;2.2e-16&lt;/span&gt;&lt;/pre&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;На основе второй &quot;полной&quot; модели проведем построение еще одного ансамбля, также включающего 128 моделей. С использованием функции&lt;span style=&quot;font-family: Times, Times New Roman, serif;&quot;&gt; &lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;merge()&lt;/span&gt;&lt;span style=&quot;font-family: Times, Times New Roman, serif;&quot;&gt; &lt;/span&gt;объединим оба списка моделей и получим объединенный ансамбль из 164 моделей (в обоих списках модели, состоящие из базовых переменных &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;Solar.R + Wind + Temp&lt;/span&gt;, совпадают и в объединенном списке их дубли исключаются). С помощью функции &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;subset()&lt;/span&gt; выберем подмножество из 17 наиболее адекватных моделей с накопленной суммой весов &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;cumsum(weight) &amp;lt; 0.95&lt;/span&gt; (в следующем сообщении мы покажем, что эта процедура связана с оценкой доверительных интервалов).&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;/div&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;   allmod &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; merge(ms1, dredge(mod2, rank=BIC))&lt;br /&gt;   dim(allmod)&lt;br /&gt;   [&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;] &lt;span style=&quot;color: #0080a0;&quot;&gt;164&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;17&lt;/span&gt;&lt;br /&gt;   ansmod &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; subset(allmod, cumsum(weight) &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.95&lt;/span&gt;)  &lt;br /&gt;   dim(ansmod)&lt;br /&gt;   [&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;] &lt;span style=&quot;color: #0080a0;&quot;&gt;17&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;17&lt;/span&gt;&lt;/pre&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;Функции &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;dredge()&lt;/span&gt;&lt;span style=&quot;font-family: Times, Times New Roman, serif;&quot;&gt;, &lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;merge()&lt;/span&gt;&lt;span style=&quot;font-family: Times, Times New Roman, serif;&quot;&gt;,&amp;nbsp;&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;subset()&lt;/span&gt; и используемая ниже  функция &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;model.sel()&lt;/span&gt;&amp;nbsp; возвращают специальный объект класса&lt;span style=&quot;font-family: Times, Times New Roman, serif;&quot;&gt; &lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;model.selection&lt;/span&gt;, весьма похожий на обычную таблицу класса&amp;nbsp;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;data.frame&lt;/span&gt;. Мы может использовать компоненты этого объекта для вывода нужных нам блоков информации. Предварительно, разумеется, стоит ознакомиться с &quot;внутренностями&quot; объекта, выполнив команду&amp;nbsp; &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;str()&lt;/span&gt;&lt;span style=&quot;font-family: Times, Times New Roman, serif;&quot;&gt;:&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt; &lt;span style=&quot;color: #406040;&quot;&gt;# Извлекаем список формул моделей&lt;/span&gt;&lt;br /&gt;   ModList &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; as.character(attr(ansmod,&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;model.calls&quot;&lt;/span&gt;))&lt;br /&gt;   &lt;span style=&quot;color: #406040;&quot;&gt;# Из списка формул выделяем только предикторную часть&lt;/span&gt;&lt;br /&gt;   ModList &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; substring(ModList, regexpr(&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;~&quot;&lt;/span&gt;, ModList)&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;,&lt;br /&gt;       regexpr(&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;,&quot;&lt;/span&gt;, ModList) &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt;)&lt;br /&gt;   &lt;span style=&quot;color: #406040;&quot;&gt;# Для компактности удаляем пробелы&lt;/span&gt;&lt;br /&gt;   ModList &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt;gsub(&lt;span style=&quot;color: #c03030;&quot;&gt;&quot; &quot;&lt;/span&gt;, &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;&quot;&lt;/span&gt;, ModList, fixed &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; TRUE)&lt;br /&gt;   &lt;span style=&quot;color: #406040;&quot;&gt;# Объединяем данные&lt;/span&gt;&lt;br /&gt;   &lt;span style=&quot;color: #a08000;&quot;&gt;data.frame&lt;/span&gt;(logLik=ansmod&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;logLik, BIC=ansmod&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;BIC,&lt;br /&gt;       delta=ansmod&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;delta, weight=ansmod&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;weight, Formula=ModList)&lt;br /&gt;  logLik   BIC  delta weight                                              Formula&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;476.8&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;986.7&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0000&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.2688&lt;/span&gt;                      Solar.R&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Temp&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Temp.2&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Wind&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Wind.2&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;479.6&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;987.6&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.8917&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.1721&lt;/span&gt;                           Solar.R&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Temp.2&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Wind&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Wind.2&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;477.7&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;988.5&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1.7847&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.1101&lt;/span&gt;                    Solar.R.2&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Temp&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Temp.2&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Wind&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Wind.2&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;475.5&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;988.7&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;2.0011&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0988&lt;/span&gt;           sin.period&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Solar.R&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Temp&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Temp.2&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Wind&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Wind.2&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;480.2&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;988.8&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;2.0989&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0941&lt;/span&gt;                         Solar.R.2&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Temp.2&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Wind&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Wind.2&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;6&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;481.0&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;990.4&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;3.6889&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0425&lt;/span&gt;                             Solar.R&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Temp&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Wind&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Wind.2&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;7&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;476.5&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;990.7&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;4.0253&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0359&lt;/span&gt;            Solar.R&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Solar.R.2&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Temp&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Temp.2&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Wind&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Wind.2&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;8&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;476.7&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;991.2&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;4.5070&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0282&lt;/span&gt;         sin.period&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Solar.R.2&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Temp&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Temp.2&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Wind&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Wind.2&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;9&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;479.1&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;991.3&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;4.5954&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0270&lt;/span&gt;                sin.period&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Solar.R&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Temp.2&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Wind&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Wind.2&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;10&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;481.6&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;991.6&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;4.8897&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0233&lt;/span&gt;                           Solar.R.2&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Temp&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Wind&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Wind.2&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;11&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;474.6&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;991.7&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;4.9815&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0222&lt;/span&gt; sin.period&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Solar.R&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Solar.R.2&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Temp&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Temp.2&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Wind&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Wind.2&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;12&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;484.1&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;991.9&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;5.1737&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0202&lt;/span&gt;                                   Temp.2&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Wind&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Wind.2&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;13&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;479.5&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;992.0&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;5.3085&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0189&lt;/span&gt;                 Solar.R&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Solar.R.2&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Temp.2&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Wind&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Wind.2&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;14&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;479.9&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;992.8&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;6.1169&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0126&lt;/span&gt;              sin.period&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Solar.R.2&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Temp.2&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Wind&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Wind.2&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;15&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;482.3&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;992.8&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;6.1473&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0124&lt;/span&gt;                              Temp&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Temp.2&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Wind&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Wind.2&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;16&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;480.5&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;994.0&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;7.3394&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0068&lt;/span&gt;                  sin.period&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Solar.R&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Temp&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Wind&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Wind.2&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;17&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;485.4&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;994.4&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;7.7390&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0056&lt;/span&gt;                                     Temp&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Wind&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;Wind.2&lt;/pre&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;Отметим, что, рассматривая информационные потери по Кульбаку, полученная выше оптимальная модель в \(\exp((1012 - 986.7)/2) = 347000 \) раз лучше, чем линейная модель с тремя базовыми предикторами, и в \( exp((1101 - 986.7)/2) = 8 \times 10^{24}\) раз эффективнее по сравнению с нуль-моделью без параметров (К. Бёрнхэм и Д. Андерсон считают, что в том же соотношении находятся и вероятности соответствующих статистических гипотез). Далее заметим, что в окончательный список вошли только предискторы из второй модели, а относительная важность отдельных предикторов приобрела следующие значения:&lt;br /&gt;&lt;br /&gt;&lt;/div&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;importance(ansmod)&lt;br /&gt;                         Wind Wind.2 Temp.2 Solar.R Temp Solar.R.2 sin.period&lt;br /&gt;    Importance&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;          &lt;span style=&quot;color: #0080a0;&quot;&gt;1.00&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1.00&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.92&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.69&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;0.65&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.35&lt;/span&gt;      &lt;span style=&quot;color: #0080a0;&quot;&gt;0.20&lt;/span&gt;      &lt;br /&gt;    N containing models&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;17&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;17&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;13&lt;/span&gt;      &lt;span style=&quot;color: #0080a0;&quot;&gt;9&lt;/span&gt;      &lt;span style=&quot;color: #0080a0;&quot;&gt;11&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;8&lt;/span&gt;         &lt;span style=&quot;color: #0080a0;&quot;&gt;6&lt;/span&gt;   &lt;/pre&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;Для полноты изложения покажем, как к сформированному ансамблю &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;ansmod&lt;/span&gt; добавить обобщенную аддитивную модель, в которой варьирование трех основных предикторов аппроксимируется в виде сглаживающих &lt;i&gt;p&lt;/i&gt;-сплайнов:&lt;br /&gt;&lt;br /&gt;&lt;/div&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;   library(mgcv)&lt;br /&gt;   mgam &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; gam(Ozone &lt;span style=&quot;color: #2060a0;&quot;&gt;~&lt;/span&gt; s(Solar.R) &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt; s(Wind) &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt; s(Temp), &lt;br /&gt;      data &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; airquality)&lt;br /&gt;   summary(mgam)&lt;br /&gt;   Parametric coefficients&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;br /&gt;               Estimate Std. Error t value Pr(&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;gt;&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;|&lt;/span&gt;t&lt;span style=&quot;color: #2060a0;&quot;&gt;|&lt;/span&gt;)    &lt;br /&gt;   (Intercept)   &lt;span style=&quot;color: #0080a0;&quot;&gt;42.099&lt;/span&gt;      &lt;span style=&quot;color: #0080a0;&quot;&gt;1.663&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;25.32&lt;/span&gt;   &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;2e-16&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;br /&gt;   &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;br /&gt;   Signif. codes&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt; ‘&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.001&lt;/span&gt; ‘&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.01&lt;/span&gt; ‘&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.05&lt;/span&gt; ‘.’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.1&lt;/span&gt; ‘ ’ &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;&lt;br /&gt;   &lt;br /&gt;   Approximate significance of smooth terms&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;br /&gt;                edf Ref.df      F  p&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;value    &lt;br /&gt;   s(Solar.R) &lt;span style=&quot;color: #0080a0;&quot;&gt;2.760&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;3.447&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;3.967&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.00769&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt; &lt;br /&gt;   s(Wind)    &lt;span style=&quot;color: #0080a0;&quot;&gt;2.910&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;3.657&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;13.768&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1.52e-08&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;br /&gt;   s(Temp)    &lt;span style=&quot;color: #0080a0;&quot;&gt;3.833&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;4.753&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;11.769&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;7.40e-09&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;br /&gt;   &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;br /&gt;   Signif. codes&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt; ‘&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.001&lt;/span&gt; ‘&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.01&lt;/span&gt; ‘&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.05&lt;/span&gt; ‘.’ &lt;span style=&quot;color: #0080a0;&quot;&gt;0.1&lt;/span&gt; ‘ ’ &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;&lt;br /&gt;   &lt;br /&gt;   R&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;sq.(adj) &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.723&lt;/span&gt;   Deviance explained &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;74.7&lt;/span&gt;%&lt;br /&gt;   GCV score &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;338.9&lt;/span&gt;  Scale est. &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;306.83&lt;/span&gt;    n &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;111&lt;/span&gt;&lt;br /&gt;   BIC(mgam)&lt;br /&gt;   [&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;] &lt;span style=&quot;color: #0080a0;&quot;&gt;993.7625&lt;/span&gt;&lt;br /&gt;   gansmod &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; merge(ansmod, model.sel(mgam, rank=BIC))&lt;/pre&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;К сожалению, без тщательного подбора характеристик сглаживающих функций модель GAM продемонстрировала мало впечатляющую эффективность и в списке моделей заняла скромное 16 место. Однако наша задача заключалась лишь в иллюстрации работы функции&amp;nbsp;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;model.sel()&lt;/span&gt;, которая создает объект &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;model.selection&lt;/span&gt;, объединяя произвольное количество частных моделей.&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;b&gt;Рекомендуемая литература&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;&lt;ul&gt;&lt;li&gt;&lt;i&gt;Akaike&lt;/i&gt; &lt;i&gt;H&lt;/i&gt; (1973) Information theory as an extension of the maximum likelihood principle. In: Petrov BN, Csaki F (eds) Second international symposium on information theory. Akademiai Kiado, Budapest, pp 267-281&lt;/li&gt;&lt;li&gt;&lt;i&gt;Burnham KP&lt;/i&gt;, &lt;i&gt;Anderson DR&lt;/i&gt; (2002) Model selection and multimodel inference: a practical information-theoretic approach, 2nd edn. Springer, New York&lt;/li&gt;&lt;li&gt;&lt;i&gt;Claeskens G&lt;/i&gt;,&lt;i&gt; Hjort NL&lt;/i&gt; (2008) Model Selection and Model Averaging. Cambridge University Press, New York&lt;/li&gt;&lt;li&gt;&lt;i&gt;Kullback S&lt;/i&gt;, &lt;i&gt;Leibler RA&lt;/i&gt; (1951) On information and sufficiency. Ann Math Stat 22: 79-86&lt;/li&gt;&lt;/ul&gt;&lt;/div&gt;&lt;/div&gt;</content><link rel='replies' type='text/html' href='http://r-analytics.blogspot.com/2018/01/mumin-1.html#comment-form' title='Комментарии: 0'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/8132245469977807600'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/8132245469977807600'/><link rel='alternate' type='text/html' href='http://r-analytics.blogspot.com/2018/01/mumin-1.html' title='Работа с пакетом MuMIn. Часть 1: Селекция моделей'/><author><name>В.Шитиков</name><uri>http://www.blogger.com/profile/01896460847215383456</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='31' height='32' src='//1.bp.blogspot.com/-5Wttqmz7yaM/WFemBTJup6I/AAAAAAAADUE/VRlomgxu2QsLFzRgbGdGQzmQQ06lRKM7gCK4B/s220/Face2.JPG'/></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://1.bp.blogspot.com/-z1apGaf5ojo/WltSYqlnPhI/AAAAAAAADQ0/mBpfbhQ5gD86-TE7EbQqHwS4DFYCJ81dgCLcBGAs/s72-c/model_table.png" height="72" width="72"/><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-9120847565867616203.post-1540499715978210704</id><published>2017-12-25T15:06:00.000+00:00</published><updated>2017-12-25T15:06:28.964+00:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="R-пакеты"/><title type='text'>Обзор интересных R-пакетов за ноябрь-декабрь 2017 г.</title><content type='html'>&lt;ul&gt;&lt;a href=&quot;https://4.bp.blogspot.com/-tZSfet8vR2k/WkESdvu7P0I/AAAAAAAADQg/abGaxShz0FEJcjUWTRpvtkX6E73UDMc9ACLcBGAs/s1600/SnoppyAce2018.jpg&quot; imageanchor=&quot;1&quot; style=&quot;clear: right; float: right; margin-bottom: 1em; margin-left: 1em;&quot;&gt;&lt;img border=&quot;0&quot; data-original-height=&quot;194&quot; data-original-width=&quot;259&quot; src=&quot;https://4.bp.blogspot.com/-tZSfet8vR2k/WkESdvu7P0I/AAAAAAAADQg/abGaxShz0FEJcjUWTRpvtkX6E73UDMc9ACLcBGAs/s1600/SnoppyAce2018.jpg&quot; /&gt;&lt;/a&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/CVXR/index.html&quot; target=&quot;_blank&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;CVXR&lt;/span&gt;&lt;/a&gt;&amp;nbsp;- утилиты для решения задач&amp;nbsp;&lt;a href=&quot;https://ru.wikipedia.org/wiki/%D0%9E%D0%BF%D1%82%D0%B8%D0%BC%D0%B8%D0%B7%D0%B0%D1%86%D0%B8%D1%8F_(%D0%BC%D0%B0%D1%82%D0%B5%D0%BC%D0%B0%D1%82%D0%B8%D0%BA%D0%B0)&quot; target=&quot;_blank&quot;&gt;выпуклой оптимизации&lt;/a&gt;. Подробнее см.&amp;nbsp;&lt;a href=&quot;https://cran.rstudio.com/web/packages/CVXR/vignettes/cvxr_intro.html&quot; target=&quot;_blank&quot;&gt;здесь&lt;/a&gt;&amp;nbsp;и&amp;nbsp;&lt;a href=&quot;https://cvxr.rbind.io/&quot; target=&quot;_blank&quot;&gt;здесь&lt;/a&gt;.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/dbplot/index.html&quot; target=&quot;_blank&quot;&gt;dbplot&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- позволяет выполнять вычисления, необходимые для построения ggplot-графиков, на стороне базы данных.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/ESTER/index.html&quot; target=&quot;_blank&quot;&gt;ESTER&lt;/a&gt;&lt;/span&gt; - &lt;a href=&quot;https://ru.wikipedia.org/wiki/%D0%A1%D1%82%D0%B0%D1%82%D0%B8%D1%81%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D0%B9_%D0%BF%D0%BE%D1%81%D0%BB%D0%B5%D0%B4%D0%BE%D0%B2%D0%B0%D1%82%D0%B5%D0%BB%D1%8C%D0%BD%D1%8B%D0%B9_%D0%B0%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7&quot; target=&quot;_blank&quot;&gt;последовательная проверка&lt;/a&gt; статистических гипотез с использованием&amp;nbsp;&lt;a href=&quot;https://ru.wikipedia.org/wiki/%D0%98%D0%BD%D1%84%D0%BE%D1%80%D0%BC%D0%B0%D1%86%D0%B8%D0%BE%D0%BD%D0%BD%D1%8B%D0%B9_%D0%BA%D1%80%D0%B8%D1%82%D0%B5%D1%80%D0%B8%D0%B9&quot; target=&quot;_blank&quot;&gt;информационных критериев&lt;/a&gt;. Подробное описание подходов, реализованных в этом пакете, а также примеры кода можно найти &lt;a href=&quot;https://cran.r-project.org/web/packages/ESTER/vignettes/ESTER.html&quot; target=&quot;_blank&quot;&gt;здесь&lt;/a&gt;.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/geoops/index.html&quot; target=&quot;_blank&quot;&gt;geoops&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- набор утилит&amp;nbsp;&lt;a href=&quot;https://cran.r-project.org/web/packages/geoops/vignettes/geoops_vignette.html&quot; target=&quot;_blank&quot;&gt;для работы&lt;/a&gt;&amp;nbsp;с данными в формате&amp;nbsp;&lt;a href=&quot;https://ru.wikipedia.org/wiki/GeoJSON&quot; target=&quot;_blank&quot;&gt;GeoJSON&lt;/a&gt;.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/hdf5r/index.html&quot; target=&quot;_blank&quot;&gt;hdf5r&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- R-интерфейс для&amp;nbsp;&lt;a href=&quot;https://ru.wikipedia.org/wiki/Hierarchical_Data_Format&quot; target=&quot;_blank&quot;&gt;HDF5&lt;/a&gt;. См. примеры&amp;nbsp;&lt;a href=&quot;https://cran.rstudio.com/web/packages/hdf5r/vignettes/hdf5r.html&quot; target=&quot;_blank&quot;&gt;здесь&lt;/a&gt;.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/iheatmapr/index.html&quot; target=&quot;_blank&quot;&gt;iheatmapr&lt;/a&gt;&lt;/span&gt;&amp;nbsp;-&amp;nbsp;&lt;a href=&quot;https://ropensci.github.io/iheatmapr/index.html&quot; target=&quot;_blank&quot;&gt;создание&lt;/a&gt;&amp;nbsp;сложных интерактивных диаграмм типа &quot;&lt;a href=&quot;https://ru.wikipedia.org/wiki/%D0%A2%D0%B5%D0%BF%D0%BB%D0%BE%D0%B2%D0%B0%D1%8F_%D0%BA%D0%B0%D1%80%D1%82%D0%B0&quot; target=&quot;_blank&quot;&gt;тепловая карта&lt;/a&gt;&quot;.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/imbalance/index.html&quot; target=&quot;_blank&quot;&gt;imbalance&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- реализация различных&amp;nbsp;&lt;a href=&quot;https://cran.rstudio.com/web/packages/imbalance/vignettes/imbalance.pdf&quot; target=&quot;_blank&quot;&gt;методов обработки&lt;/a&gt;&amp;nbsp;несбалансированных наборов данных, необходимой перед построением моделей-классификаторов.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/MlBayesOpt/index.html&quot; target=&quot;_blank&quot;&gt;MlBayesOpt&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- байесовский подход к&amp;nbsp;&lt;a href=&quot;https://cran.r-project.org/web/packages/MlBayesOpt/vignettes/MlBayesOpt.html&quot; target=&quot;_blank&quot;&gt;нахождению оптимальных гиперпараметров&lt;/a&gt;&amp;nbsp;для таких алгоритмов, как &quot;машина опорных векторов&quot;, &quot;случайный лес&quot; и &quot;&lt;a href=&quot;https://github.com/dmlc/xgboost&quot; target=&quot;_blank&quot;&gt;XGboost&lt;/a&gt;&quot;.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/nnfor/index.html&quot; target=&quot;_blank&quot;&gt;nnfor&lt;/a&gt;&lt;/span&gt;&amp;nbsp;-&amp;nbsp;&lt;a href=&quot;http://kourentzes.com/forecasting/2017/02/10/forecasting-time-series-with-neural-networks-in-r/&quot; target=&quot;_blank&quot;&gt;прогнозирование временных рядов&lt;/a&gt;&amp;nbsp;с использованием нейронных сетей.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/ppclust/index.html&quot; target=&quot;_blank&quot;&gt;ppclust&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- реализация различных методов&amp;nbsp;&lt;a href=&quot;http://matlab.exponenta.ru/fuzzylogic/book1/12.php&quot; target=&quot;_blank&quot;&gt;нечеткой кластеризации&lt;/a&gt;.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/quokar/index.html&quot; target=&quot;_blank&quot;&gt;quokar&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- набор утилит для диагностики качества моделей&amp;nbsp;&lt;a href=&quot;https://en.wikipedia.org/wiki/Quantile_regression&quot; target=&quot;_blank&quot;&gt;квантильной регрессии&lt;/a&gt;.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/RMariaDB/index.html&quot; target=&quot;_blank&quot;&gt;RMariaDB&lt;/a&gt;&lt;/span&gt; - R-интерфейс для работы с базами данных &lt;a href=&quot;https://mariadb.org/&quot; target=&quot;_blank&quot;&gt;MariaDB&lt;/a&gt; и &lt;a href=&quot;https://www.mysql.com/&quot; target=&quot;_blank&quot;&gt;MySQL&lt;/a&gt;.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/shinyaframe/index.html&quot; target=&quot;_blank&quot;&gt;shinyaframe&lt;/a&gt;&lt;/span&gt;&amp;nbsp;-&amp;nbsp;&lt;a href=&quot;https://cran.rstudio.com/web/packages/shinyaframe/vignettes/scatterplot3d.html&quot; target=&quot;_blank&quot;&gt;визуализация трехмерных диаграмм рассеяния&lt;/a&gt;&amp;nbsp;с использованием технологии виртуальной реальности&amp;nbsp;&lt;a href=&quot;https://aframe.io/&quot; target=&quot;_blank&quot;&gt;A-Frame&lt;/a&gt;.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/textrank/index.html&quot; target=&quot;_blank&quot;&gt;textrank&lt;/a&gt;&lt;/span&gt;&amp;nbsp;-&amp;nbsp;&lt;a href=&quot;https://cran.rstudio.com/web/packages/textrank/vignettes/textrank.html&quot; target=&quot;_blank&quot;&gt;реализация&lt;/a&gt;&amp;nbsp;алгоритма&amp;nbsp;&lt;a href=&quot;https://web.eecs.umich.edu/~mihalcea/papers/mihalcea.emnlp04.pdf&quot; target=&quot;_blank&quot;&gt;textrank&lt;/a&gt;&amp;nbsp;(аналог алгоритма&amp;nbsp;&lt;a href=&quot;https://ru.wikipedia.org/wiki/PageRank&quot; target=&quot;_blank&quot;&gt;PageRank&lt;/a&gt;&amp;nbsp;для текстовых данных).&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/usethis/index.html&quot; target=&quot;_blank&quot;&gt;usethis&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- набор утилит для&amp;nbsp;&lt;a href=&quot;https://cran.rstudio.com/web/packages/usethis/README.html&quot; target=&quot;_blank&quot;&gt;автоматизации разработки&lt;/a&gt;&amp;nbsp;R-пакетов.&lt;/li&gt;&lt;/ul&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: center;&quot;&gt;&lt;span style=&quot;color: blue; font-size: large;&quot;&gt;&lt;i&gt;С наступающим Новым Годом!&lt;/i&gt;&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: center;&quot;&gt;&lt;span style=&quot;color: blue; font-size: large;&quot;&gt;&lt;i&gt;Добра и мира вам и вашим близким!&lt;/i&gt;&lt;/span&gt;&lt;/div&gt;&lt;br /&gt;&lt;br /&gt;&lt;script async=&quot;&quot; src=&quot;//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js&quot;&gt;&lt;/script&gt;&lt;!-- R Analytics Responsive --&gt;&lt;br /&gt;&lt;ins class=&quot;adsbygoogle&quot; data-ad-client=&quot;ca-pub-6457966355894443&quot; data-ad-format=&quot;auto&quot; data-ad-slot=&quot;8123690788&quot; style=&quot;display: block;&quot;&gt;&lt;/ins&gt;&lt;script&gt;(adsbygoogle = window.adsbygoogle || []).push({}); &lt;/script&gt;</content><link rel='replies' type='text/html' href='http://r-analytics.blogspot.com/2017/12/r-2017.html#comment-form' title='Комментарии: 1'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/1540499715978210704'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/1540499715978210704'/><link rel='alternate' type='text/html' href='http://r-analytics.blogspot.com/2017/12/r-2017.html' title='Обзор интересных R-пакетов за ноябрь-декабрь 2017 г.'/><author><name>Sergey Mastitsky</name><uri>https://plus.google.com/100743762419147389233</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='32' height='32' src='//lh3.googleusercontent.com/-S7CBBqIIWg0/AAAAAAAAAAI/AAAAAAAAANI/e7vggjNa3Mo/s512-c/photo.jpg'/></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://4.bp.blogspot.com/-tZSfet8vR2k/WkESdvu7P0I/AAAAAAAADQg/abGaxShz0FEJcjUWTRpvtkX6E73UDMc9ACLcBGAs/s72-c/SnoppyAce2018.jpg" height="72" width="72"/><thr:total>1</thr:total></entry><entry><id>tag:blogger.com,1999:blog-9120847565867616203.post-4182808737210084509</id><published>2017-11-05T20:57:00.000+00:00</published><updated>2017-11-05T20:57:34.310+00:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="R-пакеты"/><title type='text'>Обзор интересных R-пакетов за октябрь 2017 г.</title><content type='html'>&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;a href=&quot;https://3.bp.blogspot.com/-y6OXfIe9UGQ/Wf96Lasq-5I/AAAAAAAADP4/hjC9zej_FYIY_RM-kQnKhyQosWTeGpBHwCLcBGAs/s1600/j.PNG&quot; imageanchor=&quot;1&quot; style=&quot;clear: right; float: right; margin-bottom: 1em; margin-left: 1em;&quot;&gt;&lt;img border=&quot;0&quot; data-original-height=&quot;173&quot; data-original-width=&quot;248&quot; height=&quot;139&quot; src=&quot;https://3.bp.blogspot.com/-y6OXfIe9UGQ/Wf96Lasq-5I/AAAAAAAADP4/hjC9zej_FYIY_RM-kQnKhyQosWTeGpBHwCLcBGAs/s200/j.PNG&quot; width=&quot;200&quot; /&gt;&lt;/a&gt;&lt;/div&gt;&lt;ul&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.rstudio.com/web/packages/fastrtext/&quot; target=&quot;_blank&quot;&gt;fastrtext&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- R-интерфейс к библиотеке&amp;nbsp;&lt;a href=&quot;https://fasttext.cc/&quot; target=&quot;_blank&quot;&gt;fastText&lt;/a&gt;, разработанной исследователями из Facebook. Эта библиотека предназначена для работы с текстовыми данными и построения моделей путем&amp;nbsp;&lt;a href=&quot;https://cran.rstudio.com/web/packages/fastrtext/vignettes/supervised_learning.html&quot; target=&quot;_blank&quot;&gt;обучения с учителем&lt;/a&gt;&amp;nbsp;и&amp;nbsp;&lt;a href=&quot;https://cran.rstudio.com/web/packages/fastrtext/vignettes/unsupervised_learning.html&quot; target=&quot;_blank&quot;&gt;без учителя&lt;/a&gt;.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/googleLanguageR/index.html&quot; target=&quot;_blank&quot;&gt;googleLanguageR&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- пакет для работы с несколькими API от Google для обработки естественных языков (в частности,&amp;nbsp;&lt;a href=&quot;https://cran.r-project.org/web/packages/googleLanguageR/vignettes/nlp.html&quot; target=&quot;_blank&quot;&gt;Natural Language API&lt;/a&gt;,&amp;nbsp;&lt;a href=&quot;https://cran.r-project.org/web/packages/googleLanguageR/vignettes/speech.html&quot; target=&quot;_blank&quot;&gt;Cloud Speech API&lt;/a&gt;&amp;nbsp;и&amp;nbsp;&lt;a href=&quot;https://cran.r-project.org/web/packages/googleLanguageR/vignettes/translation.html&quot; target=&quot;_blank&quot;&gt;Cloud Translation API&lt;/a&gt;).&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/JuliaCall/index.html&quot; target=&quot;_blank&quot;&gt;JuliaCall&lt;/a&gt;&lt;/span&gt; - R-интерфейс к языку &lt;a href=&quot;https://julialang.org/&quot; target=&quot;_blank&quot;&gt;Julia&lt;/a&gt;.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/OutliersO3/index.html&quot; target=&quot;_blank&quot;&gt;OutliersO3&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- набор методов для обнаружения выбросов в наборах данных с большим количеством переменных.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/powerlmm/index.html&quot; target=&quot;_blank&quot;&gt;powerlmm&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- анализ мощности для&amp;nbsp;&lt;a href=&quot;http://www.machinelearning.ru/wiki/index.php?title=%D0%9E%D0%B1%D1%8A%D0%B5%D0%B4%D0%B8%D0%BD%D1%91%D0%BD%D0%BD%D0%B0%D1%8F_%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D1%8C_%D0%BF%D0%B0%D0%BD%D0%B5%D0%BB%D1%8C%D0%BD%D1%8B%D1%85_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85&quot; target=&quot;_blank&quot;&gt;панельных данных&lt;/a&gt;&amp;nbsp;с двумя или тремя уровнями случайных эффектов.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/re2r/index.html&quot; target=&quot;_blank&quot;&gt;re2r&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- пакет для работы с регулярными выражениями, в основе которого лежит алгоритм&amp;nbsp;&lt;a href=&quot;https://github.com/google/re2&quot; target=&quot;_blank&quot;&gt;RE2&lt;/a&gt;&amp;nbsp;от Google. См. примеры&amp;nbsp;&lt;a href=&quot;https://cran.r-project.org/web/packages/re2r/vignettes/re2r-intro.html&quot; target=&quot;_blank&quot;&gt;здесь&lt;/a&gt;.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/slowraker/index.html&quot; target=&quot;_blank&quot;&gt;slowraker&lt;/a&gt;&lt;/span&gt; - реализация &lt;a href=&quot;http://onlinelibrary.wiley.com/doi/10.1002/9780470689646.ch1/summary;jsessionid=12C42082140AF240529580980EE52B3E.f04t04&quot; target=&quot;_blank&quot;&gt;алгоритма RAKE&lt;/a&gt;, предназначенного для автоматического извлечения ключевых слов из отдельных текстовых документов. См. примеры &lt;a href=&quot;https://cran.r-project.org/web/packages/slowraker/vignettes/getting-started.html&quot; target=&quot;_blank&quot;&gt;здесь&lt;/a&gt;.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/tscount/index.html&quot; target=&quot;_blank&quot;&gt;tscount&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- построение моделей для временных рядов, представленных счетными переменными.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/udpipe/index.html&quot; target=&quot;_blank&quot;&gt;udpipe&lt;/a&gt;&lt;/span&gt; - пакет для выполнения распространенных задач, возникающих при обработке естественных языков (выделение токенов, лемматизация, определение части речи и др.).&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;a href=&quot;https://rviews.rstudio.com/2017/11/01/r-data-packages/&quot; target=&quot;_blank&quot;&gt;Здесь&lt;/a&gt; можно ознакомиться со списком из 44 пакетов для R, обеспечивающих доступ к источникам данных разной тематики.&lt;/li&gt;&lt;/ul&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;script async=&quot;&quot; src=&quot;//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js&quot;&gt;&lt;/script&gt;&lt;!-- R Analytics Responsive --&gt;&lt;br /&gt;&lt;ins class=&quot;adsbygoogle&quot; data-ad-client=&quot;ca-pub-6457966355894443&quot; data-ad-format=&quot;auto&quot; data-ad-slot=&quot;8123690788&quot; style=&quot;display: block;&quot;&gt;&lt;/ins&gt;&lt;script&gt;(adsbygoogle = window.adsbygoogle || []).push({}); &lt;/script&gt;</content><link rel='replies' type='text/html' href='http://r-analytics.blogspot.com/2017/11/r-2017.html#comment-form' title='Комментарии: 1'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/4182808737210084509'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/4182808737210084509'/><link rel='alternate' type='text/html' href='http://r-analytics.blogspot.com/2017/11/r-2017.html' title='Обзор интересных R-пакетов за октябрь 2017 г.'/><author><name>Sergey Mastitsky</name><uri>https://plus.google.com/100743762419147389233</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='32' height='32' src='//lh3.googleusercontent.com/-S7CBBqIIWg0/AAAAAAAAAAI/AAAAAAAAANI/e7vggjNa3Mo/s512-c/photo.jpg'/></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://3.bp.blogspot.com/-y6OXfIe9UGQ/Wf96Lasq-5I/AAAAAAAADP4/hjC9zej_FYIY_RM-kQnKhyQosWTeGpBHwCLcBGAs/s72-c/j.PNG" height="72" width="72"/><thr:total>1</thr:total></entry><entry><id>tag:blogger.com,1999:blog-9120847565867616203.post-7602436117868700168</id><published>2017-10-08T19:50:00.000+01:00</published><updated>2017-10-08T19:50:36.162+01:00</updated><title type='text'>Обзор интересных R-пакетов за сентябрь 2017 г. (и другие новости)</title><content type='html'>&lt;ul&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/billboarder/index.html&quot; target=&quot;_blank&quot;&gt;billboarder&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- R-интерфейс к&amp;nbsp;&lt;a href=&quot;https://naver.github.io/billboard.js/&quot; target=&quot;_blank&quot;&gt;billboard.js&lt;/a&gt;&amp;nbsp;- JavaScript-библиотеке для интерактивной визуализации данных. См. примеры&amp;nbsp;&lt;a href=&quot;https://cran.rstudio.com/web/packages/billboarder/vignettes/billboarder-intro.html&quot; target=&quot;_blank&quot;&gt;здесь&lt;/a&gt;&amp;nbsp;и&amp;nbsp;&lt;a href=&quot;https://cran.rstudio.com/web/packages/billboarder/vignettes/billboarder-options.html&quot; target=&quot;_blank&quot;&gt;здесь&lt;/a&gt;.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/blastula/index.html&quot; target=&quot;_blank&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;blastula&lt;/span&gt;&lt;/a&gt;&amp;nbsp;- хороший инструмент для формирования и отправки электронных писем с HTML-содержимым, которое будет правильно отображаться на любых устройствах. См. примеры&amp;nbsp;&lt;a href=&quot;https://cran.rstudio.com/web/packages/blastula/README.html&quot; target=&quot;_blank&quot;&gt;здесь&lt;/a&gt;.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/blogdown/index.html&quot; target=&quot;_blank&quot;&gt;blogdown&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- пакет от RStudio, позволяющий использовать синтаксис&amp;nbsp;&lt;a href=&quot;http://rmarkdown.rstudio.com/&quot; target=&quot;_blank&quot;&gt;R Markdown&lt;/a&gt;&amp;nbsp;для подготовки статей для блогов. С полной документацией и примерами можно ознакомиться&amp;nbsp;&lt;a href=&quot;https://bookdown.org/yihui/blogdown/&quot; target=&quot;_blank&quot;&gt;здесь&lt;/a&gt;.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/cetcolor/index.html&quot; target=&quot;_blank&quot;&gt;cetcolor&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- набор&amp;nbsp;&lt;a href=&quot;https://cran.rstudio.com/web/packages/cetcolor/vignettes/cet_color_schemes.html&quot; target=&quot;_blank&quot;&gt;хорошо воспринимаемых цветовых палитр&lt;/a&gt;, разработанных в соответствии с принципами, которые были описаны в работе&amp;nbsp;&lt;a href=&quot;https://arxiv.org/abs/1509.03700&quot; target=&quot;_blank&quot;&gt;Kovesi (2015)&lt;/a&gt;.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/esvis/index.html&quot; target=&quot;_blank&quot;&gt;esvis&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- набор функций для&amp;nbsp;&lt;a href=&quot;https://github.com/DJAnderson07/esvis&quot; target=&quot;_blank&quot;&gt;оценивания и визуализации&lt;/a&gt;&amp;nbsp;&quot;размера эффекта&quot;, вызванного тем или иным фактором (факторами) в экспериментальных и&amp;nbsp;&lt;a href=&quot;https://ru.wikipedia.org/wiki/%D0%9E%D0%B1%D1%81%D0%B5%D1%80%D0%B2%D0%B0%D1%86%D0%B8%D0%BE%D0%BD%D0%BD%D0%BE%D0%B5_%D0%B8%D1%81%D1%81%D0%BB%D0%B5%D0%B4%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5&quot; target=&quot;_blank&quot;&gt;обсервационных&lt;/a&gt;&amp;nbsp;исследованиях.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/googledrive/index.html&quot; target=&quot;_blank&quot;&gt;googledrive&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- набор утилит&amp;nbsp;&lt;a href=&quot;http://googledrive.tidyverse.org/index.html&quot; target=&quot;_blank&quot;&gt;для работы с Google Drive&lt;/a&gt;&amp;nbsp;из среды R.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/Knoema/index.html&quot; target=&quot;_blank&quot;&gt;Knoema&lt;/a&gt;&lt;/span&gt; - R-интерфейс к сервису &lt;a href=&quot;https://knoema.com/dev/docs&quot; target=&quot;_blank&quot;&gt;Knoema&lt;/a&gt;, предоставляющему доступ к огромной коллекции публичных данных разной тематики (~2.5 миллиарда временных рядов из тысяч источников).&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/missRanger/index.html&quot; target=&quot;_blank&quot;&gt;missRanger&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- реализация одного из эффективных алгоритмов заполнения пропущенных значений в наборах данных с разнотипными переменными.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/skpr/index.html&quot; target=&quot;_blank&quot;&gt;skpr&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- инструмент для нахождения оптимального&amp;nbsp;&lt;a href=&quot;https://ru.wikipedia.org/wiki/%D0%9F%D0%BB%D0%B0%D0%BD%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5_%D1%8D%D0%BA%D1%81%D0%BF%D0%B5%D1%80%D0%B8%D0%BC%D0%B5%D0%BD%D1%82%D0%B0&quot; target=&quot;_blank&quot;&gt;плана эксперимента&lt;/a&gt;. Имеется графический интерфейс, реализованный в виде Shiny-приложения.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/spm/index.html&quot; target=&quot;_blank&quot;&gt;spm&lt;/a&gt;&lt;/span&gt; - набор функций для моделирования пространственных данных с помощью как традиционных (&lt;i&gt;random forests,&lt;/i&gt; &lt;i&gt;GBM&lt;/i&gt;), так и гибридных методов машинного обучения.&lt;/li&gt;&lt;/ul&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;a href=&quot;https://3.bp.blogspot.com/-6PIbMHpitUc/Wdpxv9jwq0I/AAAAAAAADPk/Chgds3HWp3cR0cBPfBuVxpKWE8AYSQpIACLcBGAs/s1600/978-5-97060-508-0_270_369__100.jpg&quot; imageanchor=&quot;1&quot; style=&quot;clear: left; float: left; margin-bottom: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; data-original-height=&quot;369&quot; data-original-width=&quot;270&quot; height=&quot;320&quot; src=&quot;https://3.bp.blogspot.com/-6PIbMHpitUc/Wdpxv9jwq0I/AAAAAAAADPk/Chgds3HWp3cR0cBPfBuVxpKWE8AYSQpIACLcBGAs/s320/978-5-97060-508-0_270_369__100.jpg&quot; width=&quot;234&quot; /&gt;&lt;/a&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Из других хороших новостей: в московском издательстве &lt;a href=&quot;https://dmkpress.com/catalog/computer/data/978-5-97060-508-0/&quot; target=&quot;_blank&quot;&gt;ДМК Пресс&lt;/a&gt; вышла книга &quot;Машинное обучение с использованием библиотеки &lt;a href=&quot;https://www.h2o.ai/&quot; target=&quot;_blank&quot;&gt;H2O&lt;/a&gt;&quot; (ориг. назв. &quot;&lt;i&gt;&lt;a href=&quot;https://www.amazon.com/Practical-Machine-Learning-H2O-Techniques/dp/149196460X/ref=mt_paperback?_encoding=UTF8&amp;amp;me=&quot; target=&quot;_blank&quot;&gt;Practical Machine Learning with H2O&lt;/a&gt;&lt;/i&gt;&quot;) в переводе, выполненным Андреем Огурцовым (автор блога &quot;&lt;a href=&quot;http://biostat-r.blogspot.co.uk/&quot; target=&quot;_blank&quot;&gt;Биостатистика и язык R&lt;/a&gt;&quot;). В аннотации к книге говорится следующее:&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;div&gt;&quot;Машинное обучение наконец-то достигло стадии зрелости. При помощи программного обеспечения H2O вы можете решать задачи машинного обучения и анализа данных с использованием простого в использовании и открытого (open source) фреймворка, который поддерживает большое количество операционный систем и языков программирования, а также масштабируется для обработки больших данных. Это практическое руководство научит вас использовать алгоритмы машинного обучения, реализованные в H2O, с упором на наиболее важные для продуктивной работы аспекты.&lt;/div&gt;&lt;div&gt;&lt;br /&gt;&lt;/div&gt;&lt;div&gt;Если вы умеете программировать на R или Python, хотя бы немного знаете статистику и имеете опыт обработки данных, эта книга Даррена Кука познакомит вас с основами использования H2O и поможет вам поэкспериментировать с машинным обучением на наборах данных разного размера. Вы изучите несколько современных алгоритмов машинного обучения: глубокое обучение, «случайный лес», обучение на неразмеченных данных и ансамбли моделей.&lt;/div&gt;&lt;div&gt;&lt;br /&gt;&lt;/div&gt;&lt;div&gt;Прочтя эту книгу, вы:&lt;/div&gt;&lt;div&gt;&lt;br /&gt;&lt;/div&gt;&lt;div&gt;• узнаете, как импортировать данные в H2O, преобразовывать их и экспортировать их из H2O;&lt;/div&gt;&lt;div&gt;• изучите основные концепции машинного обучения, такие как перекрестная проверка и проверочные наборы данных;&lt;/div&gt;&lt;div&gt;• поработаете с тремя разными наборами данных, решая задачи регрессии, бинарной и многоклассовой классификации;&lt;/div&gt;&lt;div&gt;• используете H2O для анализа каждого набора данных при помощи четырех алгоритмов машинного обучения;&lt;/div&gt;&lt;div&gt;• поймете, как работает кластерный анализ и другие алгоритмы обучения на неразмеченных данных.&quot;&lt;/div&gt;&lt;div&gt;&lt;br /&gt;&lt;/div&gt;&lt;div&gt;Следует добавить, что А. Огурцов выполнил не только отличный перевод книги, но и подготовил некоторые дополнительные и очень полезные материалы по H2O (в частности, по &lt;a href=&quot;https://www.h2o.ai/deep-water/&quot; target=&quot;_blank&quot;&gt;Deep Water&lt;/a&gt;), которые можно найти в соответствующем &lt;a href=&quot;https://github.com/statist-bhfz/h2o_book_translate/tree/master/bonus&quot; target=&quot;_blank&quot;&gt;GitHub-репозитории&lt;/a&gt;.&lt;/div&gt;&lt;div&gt;&lt;br /&gt;&lt;/div&gt;&lt;div&gt;&lt;br /&gt;&lt;/div&gt;&lt;/div&gt;&lt;script async=&quot;&quot; src=&quot;//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js&quot;&gt;&lt;/script&gt;&lt;!-- R Analytics Responsive --&gt;&lt;br /&gt;&lt;ins class=&quot;adsbygoogle&quot; data-ad-client=&quot;ca-pub-6457966355894443&quot; data-ad-format=&quot;auto&quot; data-ad-slot=&quot;8123690788&quot; style=&quot;display: block;&quot;&gt;&lt;/ins&gt;&lt;script&gt;(adsbygoogle = window.adsbygoogle || []).push({}); &lt;/script&gt;</content><link rel='replies' type='text/html' href='http://r-analytics.blogspot.com/2017/10/2017.html#comment-form' title='Комментарии: 1'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/7602436117868700168'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/7602436117868700168'/><link rel='alternate' type='text/html' href='http://r-analytics.blogspot.com/2017/10/2017.html' title='Обзор интересных R-пакетов за сентябрь 2017 г. (и другие новости)'/><author><name>Sergey Mastitsky</name><uri>https://plus.google.com/100743762419147389233</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='32' height='32' src='//lh3.googleusercontent.com/-S7CBBqIIWg0/AAAAAAAAAAI/AAAAAAAAANI/e7vggjNa3Mo/s512-c/photo.jpg'/></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://3.bp.blogspot.com/-6PIbMHpitUc/Wdpxv9jwq0I/AAAAAAAADPk/Chgds3HWp3cR0cBPfBuVxpKWE8AYSQpIACLcBGAs/s72-c/978-5-97060-508-0_270_369__100.jpg" height="72" width="72"/><thr:total>1</thr:total></entry><entry><id>tag:blogger.com,1999:blog-9120847565867616203.post-2888108499725660845</id><published>2017-09-23T22:48:00.000+01:00</published><updated>2017-09-23T22:48:25.853+01:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="EARL"/><category scheme="http://www.blogger.com/atom/ns#" term="R-события"/><title type='text'>Отчет с конференции &quot;Enterprise Applications of the R Language&quot;</title><content type='html'>&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;a href=&quot;https://4.bp.blogspot.com/-ycca8u212WU/WcbQfZKsinI/AAAAAAAADPA/0aeAN9De4Bkw8td73HFe2RlLQ_CNoN3LQCLcBGAs/s1600/earl_logo.png&quot; imageanchor=&quot;1&quot; style=&quot;clear: left; float: left; margin-bottom: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; data-original-height=&quot;487&quot; data-original-width=&quot;1378&quot; height=&quot;70&quot; src=&quot;https://4.bp.blogspot.com/-ycca8u212WU/WcbQfZKsinI/AAAAAAAADPA/0aeAN9De4Bkw8td73HFe2RlLQ_CNoN3LQCLcBGAs/s200/earl_logo.png&quot; width=&quot;200&quot; /&gt;&lt;/a&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;12-14 сентября в Лондоне прошла ежегодная конференция &quot;&lt;i&gt;Enterprise Applications of the R Language&lt;/i&gt;&quot; (EARL) - один из наиболее значимых форумов, где пользователи R делятся своим опытом применения этой системы статистических вычислений для решения бизнес-задач.&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Конференция традиционно началась с серии практических семинаров, которые в этом году были посвящены следующим темам:&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;/div&gt;&lt;ul&gt;&lt;li&gt;Организация работы со &lt;a href=&quot;https://spark.apache.org/&quot; target=&quot;_blank&quot;&gt;Spark&lt;/a&gt;&#39;ом в среде R с помощью пакета &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://spark.rstudio.com/&quot; target=&quot;_blank&quot;&gt;sparklyr&lt;/a&gt;&lt;/span&gt;&lt;/li&gt;&lt;li&gt;Работа с пакетом &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://docs.microsoft.com/en-us/r-server/r-reference/microsoftml/microsoftml-package&quot; target=&quot;_blank&quot;&gt;MicrosoftML&lt;/a&gt;&lt;/span&gt;&lt;/li&gt;&lt;li&gt;Веб-скрейпинг и анализ текстовых данных с помощью R&lt;/li&gt;&lt;li&gt;Работа с GitHub&lt;/li&gt;&lt;li&gt;Принципы написания функций в R&lt;/li&gt;&lt;li&gt;Введение в &lt;a href=&quot;https://shiny.rstudio.com/&quot; target=&quot;_blank&quot;&gt;Shiny&lt;/a&gt;&lt;/li&gt;&lt;/ul&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;a href=&quot;https://2.bp.blogspot.com/-GMDWwh1ZQiQ/WcbT_7s05xI/AAAAAAAADPM/UneYMe-IbnAwFwmQ9rWzjrwydFYa0q-WQCLcBGAs/s1600/rete_130917_1260.jpg&quot; imageanchor=&quot;1&quot; style=&quot;clear: right; float: right; margin-bottom: 1em; margin-left: 1em;&quot;&gt;&lt;img border=&quot;0&quot; data-original-height=&quot;1067&quot; data-original-width=&quot;1600&quot; height=&quot;212&quot; src=&quot;https://2.bp.blogspot.com/-GMDWwh1ZQiQ/WcbT_7s05xI/AAAAAAAADPM/UneYMe-IbnAwFwmQ9rWzjrwydFYa0q-WQCLcBGAs/s320/rete_130917_1260.jpg&quot; width=&quot;320&quot; /&gt;&lt;/a&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;В последующие два дня было представлено около 60 докладов с примерами использования R в самых разнообразных индустриях - страхование, банковское дело, маркетинг, программное обеспечение, спорт, медицина, автомобилестроение и др. Слайды этих сообщений можно найти на &lt;a href=&quot;https://earlconf.com/london&quot; target=&quot;_blank&quot;&gt;сайте конференции&lt;/a&gt; (см. раздел &quot;&lt;i&gt;Speakers&lt;/i&gt;&quot;). Поделюсь некоторыми общими наблюдениями:&lt;/div&gt;&lt;ul&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;Два-три года назад было много обсуждений того, как основанные на R приложения можно запустить в производство. В этот раз таких обсуждений почти не было - то ли народ уже определился с &quot;оптимальными&quot; способами развертывания подобных приложений в своих организациях, то ли просто так получилось, что доклады были в основном посвящены другим темам. Одно из исключений - доклад вашего покорного слуги, в котором вместе с моим соавтором и коллегой &lt;a href=&quot;https://www.linkedin.com/in/dderyabin/&quot; target=&quot;_blank&quot;&gt;Дмитрием Дерябиным&lt;/a&gt; мы привели детальный пример создания автоматизированного прогнозного приложения, написанного на R и развернутого в &quot;облаке&quot; &lt;a href=&quot;https://aws.amazon.com/&quot; target=&quot;_blank&quot;&gt;Amazon&lt;/a&gt; с использованием целого ряда AWS-сервисов.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;R начинают широко использовать в таких традиционно консервативных в отношении новых технологий индустриях, как банковское дело и страхование, а также в государственных организациях (во всяком случае, в Великобритании).&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;Фреймворк Shiny стал де-факто стандартом в мире R для создания интерактивных аналитических веб-приложений.&lt;/li&gt;&lt;/ul&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;В представленных на конференции докладах было упомянуто большое количество интересных и полезных пакетов для R, на которые стоит обратить внимание, в частности: &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;prophet&lt;/span&gt;, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;shiny.semantic&lt;/span&gt;, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;plumber&lt;/span&gt;, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;mlogit&lt;/span&gt;, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;ChoiceModelR&lt;/span&gt;, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;markovchain&lt;/span&gt;, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;keras&lt;/span&gt;, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;here&lt;/span&gt;, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;purrr&lt;/span&gt;, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;ChannelAttribution&lt;/span&gt;, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;dataCompareR&lt;/span&gt;.&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: right;&quot;&gt;&lt;i&gt;Автор: Сергей Мастицкий&lt;/i&gt;&lt;/div&gt;&lt;div style=&quot;text-align: right;&quot;&gt;&lt;i&gt;&lt;br /&gt;&lt;/i&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;i&gt;&lt;br /&gt;&lt;/i&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;i&gt;&lt;br /&gt;&lt;/i&gt;&lt;/div&gt;&lt;script async=&quot;&quot; src=&quot;//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js&quot;&gt;&lt;/script&gt;&lt;!-- R Analytics Responsive --&gt;&lt;br /&gt;&lt;ins class=&quot;adsbygoogle&quot; data-ad-client=&quot;ca-pub-6457966355894443&quot; data-ad-format=&quot;auto&quot; data-ad-slot=&quot;8123690788&quot; style=&quot;display: block;&quot;&gt;&lt;/ins&gt;&lt;script&gt;(adsbygoogle = window.adsbygoogle || []).push({}); &lt;/script&gt;</content><link rel='replies' type='text/html' href='http://r-analytics.blogspot.com/2017/09/enterprise-applications-of-r-language.html#comment-form' title='Комментарии: 7'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/2888108499725660845'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/2888108499725660845'/><link rel='alternate' type='text/html' href='http://r-analytics.blogspot.com/2017/09/enterprise-applications-of-r-language.html' title='Отчет с конференции &quot;Enterprise Applications of the R Language&quot;'/><author><name>Sergey Mastitsky</name><uri>https://plus.google.com/100743762419147389233</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='32' height='32' src='//lh3.googleusercontent.com/-S7CBBqIIWg0/AAAAAAAAAAI/AAAAAAAAANI/e7vggjNa3Mo/s512-c/photo.jpg'/></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://4.bp.blogspot.com/-ycca8u212WU/WcbQfZKsinI/AAAAAAAADPA/0aeAN9De4Bkw8td73HFe2RlLQ_CNoN3LQCLcBGAs/s72-c/earl_logo.png" height="72" width="72"/><thr:total>7</thr:total></entry><entry><id>tag:blogger.com,1999:blog-9120847565867616203.post-6632189052273768903</id><published>2017-09-03T17:53:00.000+01:00</published><updated>2017-09-03T17:53:12.435+01:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="R-пакеты"/><title type='text'>Обзор интересных R-пакетов за август 2017 г.</title><content type='html'>&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;a href=&quot;https://2.bp.blogspot.com/-ArBXpQAwZpU/WawyjH1a8pI/AAAAAAAADOs/hvNKWEq7hIEys1brS6enUxW8rxQrlOQUACLcBGAs/s1600/pulsar_detail.jpg&quot; imageanchor=&quot;1&quot; style=&quot;clear: right; float: right; margin-bottom: 1em; margin-left: 1em;&quot;&gt;&lt;img border=&quot;0&quot; data-original-height=&quot;250&quot; data-original-width=&quot;250&quot; height=&quot;200&quot; src=&quot;https://2.bp.blogspot.com/-ArBXpQAwZpU/WawyjH1a8pI/AAAAAAAADOs/hvNKWEq7hIEys1brS6enUxW8rxQrlOQUACLcBGAs/s200/pulsar_detail.jpg&quot; width=&quot;200&quot; /&gt;&lt;/a&gt;&lt;/div&gt;&lt;ul&gt;&lt;li&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace; text-align: justify;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/brms/index.html&quot; target=&quot;_blank&quot;&gt;brms&lt;/a&gt;&lt;/span&gt;&lt;span style=&quot;text-align: justify;&quot;&gt;&amp;nbsp;- очень&amp;nbsp;&lt;/span&gt;&lt;a href=&quot;https://www.blogger.com/&quot; style=&quot;text-align: justify;&quot;&gt;&lt;span id=&quot;goog_161176925&quot;&gt;&lt;/span&gt;удобный в использовании&lt;span id=&quot;goog_161176926&quot;&gt;&lt;/span&gt;&lt;/a&gt;&lt;span style=&quot;text-align: justify;&quot;&gt;&amp;nbsp;пакет для построения регрессионных моделей, параметры которых оцениваются с использованием принципов байесовской статистики. По сути, это &quot;обертка&quot; вокруг известного фреймворка для создания байесовских моделей&amp;nbsp;&lt;/span&gt;&lt;a href=&quot;http://mc-stan.org/&quot; style=&quot;text-align: justify;&quot; target=&quot;_blank&quot;&gt;Stan&lt;/a&gt;&lt;span style=&quot;text-align: justify;&quot;&gt;.&lt;/span&gt;&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/blandr/index.html&quot; target=&quot;_blank&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;blandr&lt;/span&gt;&lt;/a&gt;&amp;nbsp;- пакет для выполнения&amp;nbsp;&lt;a href=&quot;http://statistica.ru/local-portals/medicine/sravnenie-dvukh-sposobov-izmereniya-metod-blenda-altmana/&quot; target=&quot;_blank&quot;&gt;анализа Бленда-Альтмана&lt;/a&gt;&amp;nbsp;(&lt;a href=&quot;http://www.thelancet.com/journals/lancet/article/PIIS0140-6736(86)90837-8/abstract&quot; target=&quot;_blank&quot;&gt;Bland &amp;amp; Altman 1986&lt;/a&gt;). См. примеры&amp;nbsp;&lt;a href=&quot;https://cran.r-project.org/web/packages/blandr/vignettes/introduction.html&quot; target=&quot;_blank&quot;&gt;здесь&lt;/a&gt;.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/ggjoy/index.html&quot; target=&quot;_blank&quot;&gt;ggjoy&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- расширение для&amp;nbsp;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;ggplot2&lt;/span&gt;, с помощью которого можно&amp;nbsp;&lt;a href=&quot;https://cran.r-project.org/web/packages/ggjoy/vignettes/gallery.html&quot; target=&quot;_blank&quot;&gt;наглядно изображать&lt;/a&gt;&amp;nbsp;распределения количественных переменных в нескольких группах в духе &quot;joy-диаграмм&quot; (диаграммы, которые своим внешним видом напоминают&amp;nbsp;&lt;a href=&quot;https://blogs.scientificamerican.com/sa-visual/pop-culture-pulsar-origin-story-of-joy-division-s-unknown-pleasures-album-cover-video/&quot; target=&quot;_blank&quot;&gt;обложку известного альбома &quot;Unknown Pleasures&quot; группы&amp;nbsp;&lt;i&gt;Joy Division&lt;/i&gt;&lt;/a&gt;).&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/keras/index.html&quot; target=&quot;_blank&quot;&gt;keras&lt;/a&gt;&lt;/span&gt; - высокоуровневый R-интерфейс к &lt;a href=&quot;https://keras.io/&quot; target=&quot;_blank&quot;&gt;Keras&lt;/a&gt; - известному фреймворку для построения предсказательных моделей на основе нейронных сетей.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/metaBMA/index.html&quot; target=&quot;_blank&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;metaBMA&lt;/span&gt;&lt;/a&gt;&amp;nbsp;- реализация метода &quot;&lt;a href=&quot;http://logic.pdmi.ras.ru/~sergey/teaching/mlau12/12-boosting.pdf&quot; target=&quot;_blank&quot;&gt;байесовского усреднения моделей&lt;/a&gt;&quot; (&lt;a href=&quot;http://www.tandfonline.com/doi/full/10.1080/23743603.2017.1326760&quot; target=&quot;_blank&quot;&gt;Bayesian model averaging&lt;/a&gt;), который можно применять&amp;nbsp;&lt;a href=&quot;https://cran.r-project.org/web/packages/metaBMA/vignettes/metaBMA.html&quot; target=&quot;_blank&quot;&gt;при выполнении мета-анализа&lt;/a&gt;.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/package=mize&quot; target=&quot;_blank&quot;&gt;mize&lt;/a&gt;&lt;/span&gt;&amp;nbsp;-&amp;nbsp;&lt;a href=&quot;https://cran.r-project.org/web/packages/mize/vignettes/mize.html&quot; target=&quot;_blank&quot;&gt;набор функций&lt;/a&gt;, реализующих некоторые распространенные алгоритмы оптимизации (&lt;a href=&quot;https://ru.wikipedia.org/wiki/%D0%9C%D0%B5%D1%82%D0%BE%D0%B4_%D1%81%D0%BE%D0%BF%D1%80%D1%8F%D0%B6%D1%91%D0%BD%D0%BD%D1%8B%D1%85_%D0%B3%D1%80%D0%B0%D0%B4%D0%B8%D0%B5%D0%BD%D1%82%D0%BE%D0%B2_(%D0%B4%D0%BB%D1%8F_%D1%80%D0%B5%D1%88%D0%B5%D0%BD%D0%B8%D1%8F_%D0%A1%D0%9B%D0%90%D0%A3)&quot; target=&quot;_blank&quot;&gt;CG&lt;/a&gt;,&amp;nbsp;&lt;a href=&quot;https://ru.wikipedia.org/wiki/%D0%90%D0%BB%D0%B3%D0%BE%D1%80%D0%B8%D1%82%D0%BC_%D0%91%D1%80%D0%BE%D0%B9%D0%B4%D0%B5%D0%BD%D0%B0_%E2%80%94_%D0%A4%D0%BB%D0%B5%D1%82%D1%87%D0%B5%D1%80%D0%B0_%E2%80%94_%D0%93%D0%BE%D0%BB%D1%8C%D0%B4%D1%84%D0%B0%D1%80%D0%B1%D0%B0_%E2%80%94_%D0%A8%D0%B0%D0%BD%D0%BD%D0%BE&quot; target=&quot;_blank&quot;&gt;BFGS&lt;/a&gt;, L-BFGS) для параметров с неограниченным множеством возможных значений.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/randomForestExplainer/index.html&quot; target=&quot;_blank&quot;&gt;randomForestExplainer&lt;/a&gt;&lt;/span&gt; - набор функций для &lt;a href=&quot;https://cran.r-project.org/web/packages/randomForestExplainer/vignettes/randomForestExplainer.html&quot; target=&quot;_blank&quot;&gt;расчета и визуализации&lt;/a&gt; нескольких показателей важности предикторов в моделях, построенных с использованием алгоритма &quot;случайный лес&quot;.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/rsample/index.html&quot; target=&quot;_blank&quot;&gt;rsample&lt;/a&gt;&lt;/span&gt; - пакет, который окажется полезным при необходимости &lt;a href=&quot;https://cran.r-project.org/web/packages/rsample/vignettes/Basics.html&quot; target=&quot;_blank&quot;&gt;создания&lt;/a&gt; и &lt;a href=&quot;https://cran.r-project.org/web/packages/rsample/vignettes/Working_with_rsets.html&quot; target=&quot;_blank&quot;&gt;анализа &lt;/a&gt;многократных повторных выборок из некоторого исходного набора данных (например, при выполнении бутстреп-анализа, перекрестной проверки, и т.п.).&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/sweep/index.html&quot; target=&quot;_blank&quot;&gt;sweep&lt;/a&gt;&lt;/span&gt; - одновременное &lt;a href=&quot;https://cran.rstudio.com/web/packages/sweep/vignettes/SW02_Forecasting_Multiple_Models.html&quot; target=&quot;_blank&quot;&gt;построение нескольких прогнозных моделей&lt;/a&gt; для временных рядов. Пакет основан на принципах &lt;a href=&quot;https://www.tidyverse.org/&quot; target=&quot;_blank&quot;&gt;&quot;опрятного&quot; (tidy) анализа данных&lt;/a&gt;.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/timetk/index.html&quot; target=&quot;_blank&quot;&gt;timetk&lt;/a&gt;&lt;/span&gt; - набор полезных функций для работы с временными рядами.&lt;/li&gt;&lt;/ul&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;script async=&quot;&quot; src=&quot;//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js&quot;&gt;&lt;/script&gt;&lt;!-- R Analytics Responsive --&gt;&lt;br /&gt;&lt;ins class=&quot;adsbygoogle&quot; data-ad-client=&quot;ca-pub-6457966355894443&quot; data-ad-format=&quot;auto&quot; data-ad-slot=&quot;8123690788&quot; style=&quot;display: block;&quot;&gt;&lt;/ins&gt;&lt;script&gt;(adsbygoogle = window.adsbygoogle || []).push({}); &lt;/script&gt;</content><link rel='replies' type='text/html' href='http://r-analytics.blogspot.com/2017/09/r-2017.html#comment-form' title='Комментарии: 0'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/6632189052273768903'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/6632189052273768903'/><link rel='alternate' type='text/html' href='http://r-analytics.blogspot.com/2017/09/r-2017.html' title='Обзор интересных R-пакетов за август 2017 г.'/><author><name>Sergey Mastitsky</name><uri>https://plus.google.com/100743762419147389233</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='32' height='32' src='//lh3.googleusercontent.com/-S7CBBqIIWg0/AAAAAAAAAAI/AAAAAAAAANI/e7vggjNa3Mo/s512-c/photo.jpg'/></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://2.bp.blogspot.com/-ArBXpQAwZpU/WawyjH1a8pI/AAAAAAAADOs/hvNKWEq7hIEys1brS6enUxW8rxQrlOQUACLcBGAs/s72-c/pulsar_detail.jpg" height="72" width="72"/><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-9120847565867616203.post-7887195868540879968</id><published>2017-08-17T18:54:00.002+01:00</published><updated>2017-08-17T22:00:56.344+01:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="глубокое обучение"/><category scheme="http://www.blogger.com/atom/ns#" term="книги"/><title type='text'>Классический труд по глубокому обучению теперь доступен на русском языке</title><content type='html'>&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;a href=&quot;https://4.bp.blogspot.com/-RKLTkYcfW2U/WZXX9EzRufI/AAAAAAAADOM/W9sxnd5hoYACzEdJXpQdyDn6FFkGsKwRwCLcBGAs/s1600/dl.jpg&quot; imageanchor=&quot;1&quot; style=&quot;clear: left; float: left; margin-bottom: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; data-original-height=&quot;369&quot; data-original-width=&quot;270&quot; height=&quot;320&quot; src=&quot;https://4.bp.blogspot.com/-RKLTkYcfW2U/WZXX9EzRufI/AAAAAAAADOM/W9sxnd5hoYACzEdJXpQdyDn6FFkGsKwRwCLcBGAs/s320/dl.jpg&quot; width=&quot;234&quot; /&gt;&lt;/a&gt;&lt;/div&gt;В издательстве ДМК Пресс вышла &lt;a href=&quot;http://dmkpress.com/catalog/computer/data/978-5-97060-554-7/&quot; target=&quot;_blank&quot;&gt;книга Я. Гудфеллоу и др. &quot;Глубокое обучение&quot;&lt;/a&gt;, которая представляет собой один из наиболее полных и широко цитируемых трудов по этой (очень &quot;горячей&quot; сегодня) теме. В аннотации к книге говорится следующее:&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&quot;Глубокое обучение - это вид машинного обучения, наделяющий компьютеры способностью учиться на опыте и понимать мир в терминах иерархии концепций. Поскольку компьютер приобретает знания из опыта, отпадает нужда в человеке-операторе, который формально описывает необходимые компьютеру знания. Иерархическая организация позволяет компьютеру обучаться сложным концепциям, конструируя их из более простых; граф такой иерархии может содержать много уровней. В этой книге читатель найдет широкий обзор тем, изучаемых в глубоком обучении.&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Книга содержит математические и концептуальные основы линейной алгебры, теории вероятностей и теории информации, численных расчетов и машинного обучения в том объеме, который необходим для понимания материала. Описываются приемы глубокого обучения, применяемые на практике, в том числе глубокие сети прямого распространения, регуляризация, алгоритмы оптимизации, сверточные сети, моделирование последовательностей, и др. Рассматриваются такие приложения, как обработка естественных языков, распознавание речи, компьютерное зрение, онлайновые рекомендательные системы, биоинформатика и видеоигры. Наконец, описываются перспективные направления исследований: линейные факторные модели, автокодировщики, обучение представлений, структурные вероятностные модели, методы Монте-Карло, статистическая сумма, приближенный вывод и глубокие порождающие модели.&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Издание будет полезно студентами и аспирантам, а также опытным программистам, которые хотели бы применить глубокое обучение в составе своих продуктов или платформ.&quot;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;P.S.: В качестве бонусной информации: на этой неделе на платформе начался новый &lt;a href=&quot;https://www.coursera.org/learn/neural-networks-deep-learning&quot; target=&quot;_blank&quot;&gt;курс-специализация по глубокому обучению&lt;/a&gt;. Курс разработан и преподается известным Эндрю Нг (&lt;i&gt;&lt;a href=&quot;http://www.andrewng.org/&quot; target=&quot;_blank&quot;&gt;Andrew Ng&lt;/a&gt;&lt;/i&gt;) в рамках его нового проекта &lt;a href=&quot;https://www.deeplearning.ai/&quot; target=&quot;_blank&quot;&gt;deeplearning.ai&lt;/a&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;script async=&quot;&quot; src=&quot;//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js&quot;&gt;&lt;/script&gt;&lt;!-- R Analytics Responsive --&gt;&lt;br /&gt;&lt;ins class=&quot;adsbygoogle&quot; data-ad-client=&quot;ca-pub-6457966355894443&quot; data-ad-format=&quot;auto&quot; data-ad-slot=&quot;8123690788&quot; style=&quot;display: block;&quot;&gt;&lt;/ins&gt;&lt;script&gt;(adsbygoogle = window.adsbygoogle || []).push({}); &lt;/script&gt;</content><link rel='replies' type='text/html' href='http://r-analytics.blogspot.com/2017/08/blog-post.html#comment-form' title='Комментарии: 1'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/7887195868540879968'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/7887195868540879968'/><link rel='alternate' type='text/html' href='http://r-analytics.blogspot.com/2017/08/blog-post.html' title='Классический труд по глубокому обучению теперь доступен на русском языке'/><author><name>Sergey Mastitsky</name><uri>https://plus.google.com/100743762419147389233</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='32' height='32' src='//lh3.googleusercontent.com/-S7CBBqIIWg0/AAAAAAAAAAI/AAAAAAAAANI/e7vggjNa3Mo/s512-c/photo.jpg'/></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://4.bp.blogspot.com/-RKLTkYcfW2U/WZXX9EzRufI/AAAAAAAADOM/W9sxnd5hoYACzEdJXpQdyDn6FFkGsKwRwCLcBGAs/s72-c/dl.jpg" height="72" width="72"/><thr:total>1</thr:total></entry><entry><id>tag:blogger.com,1999:blog-9120847565867616203.post-5321776672920024755</id><published>2017-08-05T15:00:00.001+01:00</published><updated>2017-08-05T15:00:26.694+01:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="R-пакеты"/><title type='text'>Обзор интересных R-пакетов за июль 2017 г.</title><content type='html'>&lt;ul&gt;&lt;a href=&quot;https://4.bp.blogspot.com/-xhuBaNEOoss/WYXN8khUAkI/AAAAAAAADN8/XczwvXnmZLE602UwfsaE5hPdxt2X9FQngCLcBGAs/s1600/plumber.png&quot; imageanchor=&quot;1&quot; style=&quot;clear: right; float: right; margin-bottom: 1em; margin-left: 1em;&quot;&gt;&lt;img border=&quot;0&quot; data-original-height=&quot;271&quot; data-original-width=&quot;192&quot; height=&quot;200&quot; src=&quot;https://4.bp.blogspot.com/-xhuBaNEOoss/WYXN8khUAkI/AAAAAAAADN8/XczwvXnmZLE602UwfsaE5hPdxt2X9FQngCLcBGAs/s200/plumber.png&quot; width=&quot;141&quot; /&gt;&lt;/a&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/charlatan/index.html&quot; target=&quot;_blank&quot;&gt;charlatan&lt;/a&gt;&lt;/span&gt;: пакет для&amp;nbsp;&lt;a href=&quot;https://cran.rstudio.com/web/packages/charlatan/vignettes/charlatan_vignette.html&quot; target=&quot;_blank&quot;&gt;создания &quot;фейковых&quot; наборов данных&lt;/a&gt;, которые могут включать адреса, имена людей, географические координаты, названия должностей, и т.п.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/colordistance/index.html&quot; target=&quot;_blank&quot;&gt;colordistance&lt;/a&gt;&lt;/span&gt;: пакет для работы с изображениями. В частности, пользователи могут избирательно маскировать определенные пиксели, вычислять количественные меры сходства между несколькими изображениями по присутствующим в них цветам, находить группы сходных изображений (кластерный анализ на основе доминирующих цветов), и т.п. См. примеры&amp;nbsp;&lt;a href=&quot;https://cran.r-project.org/web/packages/colordistance/vignettes/colordistance-introduction.html&quot; target=&quot;_blank&quot;&gt;здесь&lt;/a&gt;,&amp;nbsp;&lt;a href=&quot;https://cran.r-project.org/web/packages/colordistance/vignettes/binning-methods.html&quot; target=&quot;_blank&quot;&gt;здесь&lt;/a&gt;&amp;nbsp;и&amp;nbsp;&lt;a href=&quot;https://cran.r-project.org/web/packages/colordistance/vignettes/color-metrics.html&quot; target=&quot;_blank&quot;&gt;здесь&lt;/a&gt;.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/diceR/index.html&quot; target=&quot;_blank&quot;&gt;diceR&lt;/a&gt;&lt;/span&gt;: пакет для выполнения кластерного анализа, в ходе которого одновременно используется несколько алгоритмов кластеризации. Такой подход позволяет выяснить, насколько разные алгоритмы &quot;согласны&quot; (проявляют &quot;консенсус&quot;, англ. &quot;&lt;i&gt;consensus clustering&lt;/i&gt;&quot;) в отношении принадлежности того или иного наблюдения к определенному кластеру. См. примеры &lt;a href=&quot;https://cran.rstudio.com/web/packages/diceR/vignettes/overview.html&quot; target=&quot;_blank&quot;&gt;здесь&lt;/a&gt;.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/ggformula/index.html&quot; target=&quot;_blank&quot;&gt;ggformula&lt;/a&gt;&lt;/span&gt;:&amp;nbsp;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;http://dmkpress.com/catalog/computer/statistics/978-5-97060-470-0/&quot; target=&quot;_blank&quot;&gt;ggplot2&lt;/a&gt;&lt;/span&gt;-графики, спецификация которых задается c использованием стандартного для R &quot;формульного&quot; синтаксиса. См. многочисленные примеры&amp;nbsp;&lt;a href=&quot;https://cran.r-project.org/web/packages/ggformula/vignettes/ggformula.html&quot; target=&quot;_blank&quot;&gt;здесь&lt;/a&gt;.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/parallelDist/index.html&quot; target=&quot;_blank&quot;&gt;parallelDist&lt;/a&gt;&lt;/span&gt;: отличный инструмент для выполнения параллельных вычислений матриц сходства/различий (&quot;параллельная&quot; версия базовой R-функции &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;dist()&lt;/span&gt;). Реализовано &lt;a href=&quot;https://cran.rstudio.com/web/packages/parallelDist/vignettes/parallelDist.pdf&quot; target=&quot;_blank&quot;&gt;большое количество&lt;/a&gt; стандартных метрик сходства/различий.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;a href=&quot;https://www.rstudio.com/products/connect/&quot; target=&quot;_blank&quot;&gt;RStudioConnect&lt;/a&gt;&amp;nbsp;теперь поддерживает функционал&amp;nbsp;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://www.rplumber.io/&quot; target=&quot;_blank&quot;&gt;plumber&lt;/a&gt;&lt;/span&gt;&#39;а - пакета, с помощью которого можно легко создавать&amp;nbsp;&lt;a href=&quot;https://ru.wikipedia.org/wiki/REST&quot; target=&quot;_blank&quot;&gt;REST API&lt;/a&gt;&amp;nbsp;для практически любых приложений, написанных на R.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/secret/index.html&quot; target=&quot;_blank&quot;&gt;secrete&lt;/a&gt;&lt;/span&gt;:&amp;nbsp;&lt;a href=&quot;https://cran.rstudio.com/web/packages/secret/vignettes/secrets.html&quot; target=&quot;_blank&quot;&gt;позволяет зашифровывать&lt;/a&gt;&amp;nbsp;пароли, API-ключи и т.п. важные элементы, используемые в R-пакетах и приложениях.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/SentimentAnalysis/index.html&quot; target=&quot;_blank&quot;&gt;SentimentAnalysis&lt;/a&gt;&lt;/span&gt;: удобный пакет для&amp;nbsp;&lt;a href=&quot;https://ru.wikipedia.org/wiki/%D0%90%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7_%D1%82%D0%BE%D0%BD%D0%B0%D0%BB%D1%8C%D0%BD%D0%BE%D1%81%D1%82%D0%B8_%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%B0&quot; target=&quot;_blank&quot;&gt;анализа тональности&lt;/a&gt;&amp;nbsp;текстов. Содержит несколько встроенных словарей, как общих, так и тематических (например, финансы). Имеется возможность работать&amp;nbsp;&lt;a href=&quot;https://cran.r-project.org/web/packages/SentimentAnalysis/vignettes/SentimentAnalysis.html&quot; target=&quot;_blank&quot;&gt;не только&lt;/a&gt;&amp;nbsp;с англоязычными текстами.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/SimMultiCorrData/index.html&quot; target=&quot;_blank&quot;&gt;SimMultiCorrData&lt;/a&gt;&lt;/span&gt;: набор функций для создания &quot;искусственных&quot; наборов данных из нескольких переменных (непрерывные, бинарные, счетные) с заданной пользователем ковариационной матрицей. Такие наборы данных, в частности, являются ключевым компонентом&amp;nbsp;&lt;a href=&quot;https://ru.wikipedia.org/wiki/%D0%98%D0%BC%D0%B8%D1%82%D0%B0%D1%86%D0%B8%D0%BE%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5&quot; target=&quot;_blank&quot;&gt;имитационного моделирования&lt;/a&gt;.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/walker/index.html&quot; target=&quot;_blank&quot;&gt;walker&lt;/a&gt;&lt;/span&gt;: удобный &lt;a href=&quot;https://cran.rstudio.com/web/packages/walker/vignettes/walker.html&quot; target=&quot;_blank&quot;&gt;пакет для построения&lt;/a&gt; байесовских регрессионных моделей с динамическими коэффициентами (т.е. коэффициентами, изменяющимися во &quot;времени&quot;).&lt;/li&gt;&lt;/ul&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;script async=&quot;&quot; src=&quot;//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js&quot;&gt;&lt;/script&gt;&lt;!-- R Analytics Responsive --&gt;&lt;br /&gt;&lt;ins class=&quot;adsbygoogle&quot; data-ad-client=&quot;ca-pub-6457966355894443&quot; data-ad-format=&quot;auto&quot; data-ad-slot=&quot;8123690788&quot; style=&quot;display: block;&quot;&gt;&lt;/ins&gt;&lt;script&gt;(adsbygoogle = window.adsbygoogle || []).push({}); &lt;/script&gt;</content><link rel='replies' type='text/html' href='http://r-analytics.blogspot.com/2017/08/r-2017.html#comment-form' title='Комментарии: 2'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/5321776672920024755'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/5321776672920024755'/><link rel='alternate' type='text/html' href='http://r-analytics.blogspot.com/2017/08/r-2017.html' title='Обзор интересных R-пакетов за июль 2017 г.'/><author><name>Sergey Mastitsky</name><uri>https://plus.google.com/100743762419147389233</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='32' height='32' src='//lh3.googleusercontent.com/-S7CBBqIIWg0/AAAAAAAAAAI/AAAAAAAAANI/e7vggjNa3Mo/s512-c/photo.jpg'/></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://4.bp.blogspot.com/-xhuBaNEOoss/WYXN8khUAkI/AAAAAAAADN8/XczwvXnmZLE602UwfsaE5hPdxt2X9FQngCLcBGAs/s72-c/plumber.png" height="72" width="72"/><thr:total>2</thr:total></entry><entry><id>tag:blogger.com,1999:blog-9120847565867616203.post-9016380524484222613</id><published>2017-07-08T11:20:00.000+01:00</published><updated>2017-07-08T11:20:19.979+01:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="R-пакеты"/><title type='text'>Обзор интересных R-пакетов за июнь 2017 г.</title><content type='html'>&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;ul style=&quot;text-align: start;&quot;&gt;&lt;a href=&quot;https://4.bp.blogspot.com/-rrXG2oLsxYE/WWCwsE4D7xI/AAAAAAAADNo/L-Zgtm9K7gAL2abOie5cdyHqYUFOBIUOwCLcBGAs/s1600/dplyr.png&quot; imageanchor=&quot;1&quot; style=&quot;clear: right; float: right; margin-bottom: 1em; margin-left: 1em;&quot;&gt;&lt;img border=&quot;0&quot; data-original-height=&quot;139&quot; data-original-width=&quot;120&quot; src=&quot;https://4.bp.blogspot.com/-rrXG2oLsxYE/WWCwsE4D7xI/AAAAAAAADNo/L-Zgtm9K7gAL2abOie5cdyHqYUFOBIUOwCLcBGAs/s1600/dplyr.png&quot; /&gt;&lt;/a&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;В июне вышла&amp;nbsp;&lt;a href=&quot;https://stat.ethz.ch/pipermail/r-announce/2017/000616.html&quot; style=&quot;text-align: justify;&quot; target=&quot;_blank&quot;&gt;новая версия&lt;/a&gt;&lt;span style=&quot;text-align: justify;&quot;&gt;&amp;nbsp;R (v3.4.1) под кодовым названием &quot;Single Candle&quot;.&lt;/span&gt;&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://github.com/tidyverse/dbplyr&quot; target=&quot;_blank&quot;&gt;dbplyr&lt;/a&gt;&lt;/span&gt;: этот новый пакет содержит весь код, который ранее отвечал за работу с удаленными базами данных в пакете&amp;nbsp;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;dplyr&lt;/span&gt;. См. пояснения в&amp;nbsp;&lt;a href=&quot;https://blog.rstudio.org/2017/06/27/dbplyr-1-1-0/&quot; target=&quot;_blank&quot;&gt;статье Хэдли Уикхема&lt;/a&gt;.&lt;/li&gt;&lt;li&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/desctable/index.html&quot; style=&quot;text-align: justify;&quot; target=&quot;_blank&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;desctable&lt;/span&gt;&lt;/a&gt;&lt;span style=&quot;text-align: justify;&quot;&gt;: формирование таблиц с описательными статистиками, как стандартными, так и пользовательскими. Пакет обладает простым синтаксисом в духе &lt;span style=&quot;font-family: Courier New, Courier, monospace;&quot;&gt;dplyr&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;text-align: justify;&quot;&gt;. См. примеры&amp;nbsp;&lt;/span&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/desctable/vignettes/desctable.html&quot; style=&quot;text-align: justify;&quot; target=&quot;_blank&quot;&gt;здесь&lt;/a&gt;&lt;span style=&quot;text-align: justify;&quot;&gt;.&lt;/span&gt;&lt;/li&gt;&lt;li&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace; text-align: justify;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/dplyr/index.html&quot; target=&quot;_blank&quot;&gt;dplyr&lt;/a&gt;&lt;/span&gt;&lt;span style=&quot;text-align: justify;&quot;&gt;: опубликована новая версия (v0.7) этого популярного пакета. С перечнем основных нововведений можно ознакомиться в&amp;nbsp;&lt;/span&gt;&lt;a href=&quot;https://blog.rstudio.org/2017/06/13/dplyr-0-7-0/&quot; style=&quot;text-align: justify;&quot; target=&quot;_blank&quot;&gt;блоге компании RStudio&lt;/a&gt;&lt;span style=&quot;text-align: justify;&quot;&gt;.&lt;/span&gt;&lt;/li&gt;&lt;li&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace; text-align: justify;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/replyr/index.html&quot; target=&quot;_blank&quot;&gt;replyr&lt;/a&gt;&lt;/span&gt;&lt;span style=&quot;text-align: justify;&quot;&gt;: удобный&amp;nbsp;&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace; text-align: justify;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/dplyr/index.html&quot; target=&quot;_blank&quot;&gt;dplyr&lt;/a&gt;&lt;/span&gt;&lt;span style=&quot;text-align: justify;&quot;&gt;-подобный пакет для работы с &quot;большими данными&quot; (например, с данными, обрабатываемыми на&amp;nbsp;&lt;/span&gt;&lt;a href=&quot;https://spark.apache.org/&quot; style=&quot;text-align: justify;&quot; target=&quot;_blank&quot;&gt;Spark&lt;/a&gt;&lt;span style=&quot;text-align: justify;&quot;&gt;-кластере). См. примеры&amp;nbsp;&lt;/span&gt;&lt;a href=&quot;http://www.win-vector.com/blog/2017/07/working-with-r-and-big-data-use-replyr/#more-5078&quot; style=&quot;text-align: justify;&quot; target=&quot;_blank&quot;&gt;здесь&lt;/a&gt;&lt;span style=&quot;text-align: justify;&quot;&gt;.&lt;/span&gt;&lt;/li&gt;&lt;li&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace; text-align: justify;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/RJSplot/index.html&quot; target=&quot;_blank&quot;&gt;RJSplot&lt;/a&gt;&lt;/span&gt;&lt;span style=&quot;text-align: justify;&quot;&gt;: очередной пакет для создания интерактивных графиков и диаграмм средствами R и JavaScript. См. многочисленные примеры&amp;nbsp;&lt;/span&gt;&lt;a href=&quot;http://rjsplot.net/examples&quot; style=&quot;text-align: justify;&quot; target=&quot;_blank&quot;&gt;здесь&lt;/a&gt;&lt;span style=&quot;text-align: justify;&quot;&gt;.&lt;/span&gt;&lt;/li&gt;&lt;li&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace; text-align: justify;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/simglm/index.html&quot; target=&quot;_blank&quot;&gt;simglm&lt;/a&gt;&lt;/span&gt;&lt;span style=&quot;text-align: justify;&quot;&gt;: позволяет создавать искусственные наборы данных на основе &lt;/span&gt;&lt;a href=&quot;https://en.wikipedia.org/wiki/Generalized_linear_model&quot; style=&quot;text-align: justify;&quot; target=&quot;_blank&quot;&gt;обобщенных линейных моделей&lt;/a&gt;&lt;span style=&quot;text-align: justify;&quot;&gt; с заданной пользователем структурой (включая модели со &lt;/span&gt;&lt;a href=&quot;https://en.wikipedia.org/wiki/Multilevel_model&quot; style=&quot;text-align: justify;&quot; target=&quot;_blank&quot;&gt;смешанными эффектами&lt;/a&gt;&lt;span style=&quot;text-align: justify;&quot;&gt;).&lt;/span&gt;&lt;/li&gt;&lt;li&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace; text-align: justify;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/simstudy/index.html&quot; target=&quot;_blank&quot;&gt;simstudy&lt;/a&gt;&lt;/span&gt;&lt;span style=&quot;text-align: justify;&quot;&gt;: еще один пакет для создания искусственных наборов данных с заданными пользователем свойствами. См. примеры &lt;/span&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/simstudy/vignettes/simstudy.html&quot; style=&quot;text-align: justify;&quot; target=&quot;_blank&quot;&gt;здесь&lt;/a&gt;&lt;span style=&quot;text-align: justify;&quot;&gt;.&lt;/span&gt;&lt;/li&gt;&lt;li&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace; text-align: justify;&quot;&gt;&lt;a href=&quot;http://spark.rstudio.com/&quot; target=&quot;_blank&quot;&gt;sparklyr&lt;/a&gt;&lt;/span&gt;&lt;span style=&quot;text-align: justify;&quot;&gt;: на платформе DataCamp появился новый&amp;nbsp;&lt;/span&gt;&lt;a href=&quot;https://www.datacamp.com/community/blog/new-course-introduction-to-spark-in-r-using-sparklyr&quot; style=&quot;text-align: justify;&quot; target=&quot;_blank&quot;&gt;обучающий курс&lt;/a&gt;&lt;span style=&quot;text-align: justify;&quot;&gt;&amp;nbsp;по работе с этим пакетом.&lt;/span&gt;&lt;/li&gt;&lt;li&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace; text-align: justify;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/tidygraph/index.html&quot; target=&quot;_blank&quot;&gt;tidygraph&lt;/a&gt;&lt;/span&gt;&lt;span style=&quot;text-align: justify;&quot;&gt;: визуализация графов и дендрограмм с использованием &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;dplyr&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;text-align: justify;&quot;&gt;-подобного синтаксиса. См. примеры &lt;/span&gt;&lt;a href=&quot;http://www.data-imaginist.com/2017/Introducing-tidygraph/&quot; style=&quot;text-align: justify;&quot; target=&quot;_blank&quot;&gt;здесь&lt;/a&gt;&lt;span style=&quot;text-align: justify;&quot;&gt;.&lt;/span&gt;&lt;/li&gt;&lt;/ul&gt;&lt;div&gt;&lt;br /&gt;&lt;/div&gt;&lt;/div&gt;&lt;script async=&quot;&quot; src=&quot;//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js&quot;&gt;&lt;/script&gt;&lt;!-- R Analytics Responsive --&gt;&lt;br /&gt;&lt;ins class=&quot;adsbygoogle&quot; data-ad-client=&quot;ca-pub-6457966355894443&quot; data-ad-format=&quot;auto&quot; data-ad-slot=&quot;8123690788&quot; style=&quot;display: block;&quot;&gt;&lt;/ins&gt;&lt;script&gt;(adsbygoogle = window.adsbygoogle || []).push({}); &lt;/script&gt;</content><link rel='replies' type='text/html' href='http://r-analytics.blogspot.com/2017/07/r-2017.html#comment-form' title='Комментарии: 0'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/9016380524484222613'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/9016380524484222613'/><link rel='alternate' type='text/html' href='http://r-analytics.blogspot.com/2017/07/r-2017.html' title='Обзор интересных R-пакетов за июнь 2017 г.'/><author><name>Sergey Mastitsky</name><uri>https://plus.google.com/100743762419147389233</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='32' height='32' src='//lh3.googleusercontent.com/-S7CBBqIIWg0/AAAAAAAAAAI/AAAAAAAAANI/e7vggjNa3Mo/s512-c/photo.jpg'/></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://4.bp.blogspot.com/-rrXG2oLsxYE/WWCwsE4D7xI/AAAAAAAADNo/L-Zgtm9K7gAL2abOie5cdyHqYUFOBIUOwCLcBGAs/s72-c/dplyr.png" height="72" width="72"/><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-9120847565867616203.post-5731407287165194528</id><published>2017-07-05T22:42:00.000+01:00</published><updated>2017-07-05T22:42:17.954+01:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="ggmap"/><category scheme="http://www.blogger.com/atom/ns#" term="ggplot2"/><title type='text'>Визуализация пространственно-распределенных данных с помощью пакетов ggmap и ggplot2</title><content type='html'>&lt;div dir=&quot;ltr&quot; style=&quot;text-align: left;&quot; trbidi=&quot;on&quot;&gt;&lt;div align=&quot;center&quot; class=&quot;MsoNormal&quot; style=&quot;text-align: center;&quot;&gt;&lt;div style=&quot;text-align: right;&quot;&gt;&lt;i&gt;Aвтор: Владимир Шитиков&lt;/i&gt;&lt;/div&gt;&lt;div style=&quot;text-align: right;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;/div&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;text-align: left;&quot;&gt;&lt;b&gt;Введение&lt;/b&gt;&lt;/div&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;Целью многих исследований является анализ конфигурации пространственных объектов и отображение ее структуры на картосхемах. В среде &lt;span lang=&quot;EN-US&quot; style=&quot;color: black; mso-ansi-language: EN-US;&quot;&gt;R&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black;&quot;&gt; &lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt;для решения этой задачи часто используют методы и функции пакетов &lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;sp&lt;/span&gt;&lt;span style=&quot;color: black; font-family: inherit;&quot;&gt;, &lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;maps&lt;/span&gt;&lt;span style=&quot;color: black; font-family: inherit;&quot;&gt;, &lt;/span&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;RgoogleMaps&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt;&lt;span style=&quot;font-family: inherit;&quot;&gt; &lt;/span&gt;и связанных с ними ресурсов. При этом для создания основного слоя карты часто применяются свободно распространяемые &lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; mso-ansi-language: EN-US;&quot;&gt;shape&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt;-файлы, содержащие точечные и контурные графические примитивы, соответствующие отдельным географическим пунктам или регионам (&lt;/span&gt;&lt;span style=&quot;color: blue;&quot;&gt;см. пример &lt;a href=&quot;http://r-analytics.blogspot.co.uk/2013/07/r.html&quot; target=&quot;_blank&quot;&gt;здесь&lt;/a&gt; и &lt;a href=&quot;http://r-analytics.blogspot.co.uk/2013/07/r-2.html&quot; target=&quot;_blank&quot;&gt;здесь&lt;/a&gt;&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt;). Однако, по сравнению с картами, полученными на основе специализированных геоинформационных систем, таких как ArcGIS ESRI, подобная визуализация может показаться не столь симпатичной.&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: black;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;/div&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;color: black;&quot;&gt;Ниже рассматриваются некоторые &quot;продвинутые&quot; методы для быстрой визуализации пространственных данных в среде R, основанные на двух идеях: (1) формирование &quot;на лету&quot; статических карт необходимого качества и масштаба с использованием актуальной информации серверов GoogleMap, OpenStreetMap, Stamen Maps или CloudMade и (2) широкое использование грамматики создания графических слоев для отображения необходимой информации на основе функций пакета &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;ggplot2&lt;/span&gt; (&lt;i&gt;Wickham&lt;/i&gt; 2009, 2016; &lt;i&gt;Мастицкий&lt;/i&gt; 2016). В результате развития этих концепций был разработан удобный пакет R, названный &lt;/span&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;ggmap &lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt;(&lt;i&gt;Kahle &amp;amp; Wickham&lt;/i&gt; 2013). Продемонстрируем некоторые его возможности с использованием собственных данных.&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: black;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;script async=&quot;&quot; src=&quot;//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js&quot;&gt;&lt;/script&gt;&lt;!-- R Analytics Responsive --&gt;&lt;br /&gt;&lt;ins class=&quot;adsbygoogle&quot; data-ad-client=&quot;ca-pub-6457966355894443&quot; data-ad-format=&quot;auto&quot; data-ad-slot=&quot;8123690788&quot; style=&quot;display: block;&quot;&gt;&lt;/ins&gt;&lt;script&gt;(adsbygoogle = window.adsbygoogle || []).push({}); &lt;/script&gt;&lt;span style=&quot;color: black;&quot;&gt;&lt;/span&gt;&lt;br /&gt;&lt;a name=&#39;more&#39;&gt;&lt;/a&gt;&lt;/div&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;text-align: center;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;text-align: left;&quot;&gt;&lt;b&gt;Создание основного картографического слоя&lt;/b&gt;&lt;/div&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;color: black;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt;Формирование основого слоя карты в &lt;/span&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;ggmap&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt; состоит из двух этапов. На первом этапе с использованием функции &lt;/span&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;get_map()&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt;&lt;span style=&quot;font-family: inherit;&quot;&gt; &lt;/span&gt;осуществляется загрузка из Интернета необходимых картографических данных, их форматирование для создания наиболее подходящего изображения и формирование объекта &lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;ggmap&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt;&lt;span style=&quot;font-family: inherit;&quot;&gt;, &lt;/span&gt;включающего полученный растр и связанные с ним атрибуты. На втором этапе с использованием функции &lt;/span&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;qmap()&lt;/span&gt;&lt;span style=&quot;color: black; font-family: inherit;&quot;&gt;&amp;nbsp;&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt;осуществляется вывод на задаваемое графическое устройство основы карты, описанной объектом &lt;/span&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;ggmap&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt;.&lt;/span&gt;&lt;/div&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;color: black;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt;Источник данных, из которого осуществляется загрузка картоосновы, определяется при вызове функции&lt;/span&gt;&lt;span style=&quot;color: black; font-family: inherit;&quot;&gt; &lt;/span&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;get_map()&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt; параметром&lt;span style=&quot;mso-spacerun: yes;&quot;&gt;&amp;nbsp;&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;source = c(&quot;google&quot;, &quot;osm&quot;, &quot;stamen&quot;, &quot;cloudmade&quot;)&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt;, значения которого соответствуют вышеперечисленным серверам. Кроме того, для загрузки из каждого ресурса можно использовать также специальные функции &lt;/span&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;get_googlemap()&lt;/span&gt;&lt;span style=&quot;color: black; font-family: inherit;&quot;&gt;, &lt;/span&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;get_openstreetmap()&lt;/span&gt;&lt;span style=&quot;color: black; font-family: inherit;&quot;&gt;, &lt;/span&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;get_stamenmap()&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt;&lt;span style=&quot;font-family: inherit;&quot;&gt; &lt;/span&gt;или &lt;/span&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;get_cloudmademap()&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt;, для которых список используемых параметров становится более точно определенным. Все они возвращают объект &lt;/span&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;ggmap&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt; стандартизованной структуры, однако далее мы будем рассматривать только карты, загруженные с сервисов GoogleMap и Stamen Maps, поскольку использование OpenStreetMap и CloudMade требуют установки дополнительных модулей или предварительной регистрации на сервере и получения доступа к соответствующим&amp;nbsp;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; mso-ansi-language: EN-US;&quot;&gt;API&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt;. &lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: black;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;/div&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;color: black;&quot;&gt;Географическая локализация карты выполняется с использованием двух параметров:&amp;nbsp;&lt;/span&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;location&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt; и &lt;/span&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;zoom&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt;.&lt;span style=&quot;mso-spacerun: yes;&quot;&gt;&amp;nbsp; &lt;/span&gt;Для &lt;/span&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;get_googlemap() &lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt;стандартом &lt;/span&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;location&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt; является пара координат &quot;долгота/широта&quot;, определяющих центр карты. &lt;span style=&quot;mso-spacerun: yes;&quot;&gt;&amp;nbsp;&lt;/span&gt;Величина радиуса пространственного охвата вокруг этого центра определяется аргументом масштабирования &lt;/span&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;zoom&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt;, который является целым числом от 3 до 20. При &lt;/span&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;zoom =&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt; 3 получаем примерно уровень континента, а при &lt;/span&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;zoom&lt;/span&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt; =&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt; 20&lt;/span&gt; имеем масштаб отдельно стоящих зданий.&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: black;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;/div&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;color: black;&quot;&gt;Третьим важным аргументом&lt;span style=&quot;mso-spacerun: yes;&quot;&gt;&amp;nbsp;&lt;/span&gt;является &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;maptype&lt;/span&gt;, который определяет набор&amp;nbsp;&lt;/span&gt;загружаемых с сервера&lt;span style=&quot;color: black;&quot;&gt;&amp;nbsp;графических компонентов и их эстетику. Для GoogleMap возможны следующие аргументы &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;maptype &lt;/span&gt;= &lt;/span&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;c(&quot;terrain&quot;, &quot;satellite&quot;, &quot;roadmap&quot;, &quot;hybrid&quot;)&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt;. Рассмотрим пример создания основного слоя карты, выводящей фрагмент территории г. Саратова, на улицах которого, как уверяют, &quot;огней так много золотых&quot;. Координаты &lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; mso-ansi-language: EN-US;&quot;&gt;населенного пункта определим с использованием функции &lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black;&quot;&gt;&lt;span style=&quot;mso-spacerun: yes;&quot;&gt;&amp;nbsp;&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;geocode()&lt;/span&gt;&lt;span style=&quot;color: black; font-family: inherit;&quot;&gt;:&lt;/span&gt;&lt;/div&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;library(ggmap)&lt;br /&gt;(reg_center = geocode(&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;Saratov&quot;&lt;/span&gt;))&lt;br /&gt;      lon      lat&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;45.9608&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;51.59237&lt;/span&gt;&lt;br /&gt;ggmap(get_map(location = as.numeric(reg_center), source &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;google&quot;&lt;/span&gt;, zoom = &lt;span style=&quot;color: #0080a0;&quot;&gt;14&lt;/span&gt;, &lt;br /&gt;      maptype &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;roadmap&quot;&lt;/span&gt;))&lt;/pre&gt;&lt;br /&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;color: black;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;br /&gt;&lt;span style=&quot;color: black;&quot;&gt; &lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt;&lt;/span&gt;&lt;br /&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;span style=&quot;color: black;&quot;&gt;&lt;a href=&quot;https://3.bp.blogspot.com/-SXMwjHQ-h3k/WVnl2GI8EXI/AAAAAAAADbU/-vEmMNeveNI-syb533EqaNFWrY9wp0ylwCLcBGAs/s1600/Sarat_goog.jpg&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; data-original-height=&quot;768&quot; data-original-width=&quot;774&quot; height=&quot;633&quot; src=&quot;https://3.bp.blogspot.com/-SXMwjHQ-h3k/WVnl2GI8EXI/AAAAAAAADbU/-vEmMNeveNI-syb533EqaNFWrY9wp0ylwCLcBGAs/s640/Sarat_goog.jpg&quot; width=&quot;640&quot; /&gt;&lt;/a&gt;&lt;/span&gt;&lt;/div&gt;&lt;span style=&quot;color: black;&quot;&gt;&lt;/span&gt;&lt;br /&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;color: black;&quot;&gt;&lt;!--[if gte mso 9]&gt;&lt;xml&gt; &lt;w:WordDocument&gt;  &lt;w:View&gt;Normal&lt;/w:View&gt;  &lt;w:Zoom&gt;0&lt;/w:Zoom&gt;  &lt;w:PunctuationKerning/&gt;  &lt;w:ValidateAgainstSchemas/&gt;  &lt;w:SaveIfXMLInvalid&gt;false&lt;/w:SaveIfXMLInvalid&gt;  &lt;w:IgnoreMixedContent&gt;false&lt;/w:IgnoreMixedContent&gt;  &lt;w:AlwaysShowPlaceholderText&gt;false&lt;/w:AlwaysShowPlaceholderText&gt;  &lt;w:Compatibility&gt;   &lt;w:BreakWrappedTables/&gt;   &lt;w:SnapToGridInCell/&gt;   &lt;w:WrapTextWithPunct/&gt;   &lt;w:UseAsianBreakRules/&gt;   &lt;w:DontGrowAutofit/&gt;  &lt;/w:Compatibility&gt;  &lt;w:BrowserLevel&gt;MicrosoftInternetExplorer4&lt;/w:BrowserLevel&gt; &lt;/w:WordDocument&gt;&lt;/xml&gt;&lt;![endif]--&gt;&lt;!--[if gte mso 9]&gt;&lt;xml&gt; &lt;w:LatentStyles DefLockedState=&quot;false&quot; LatentStyleCount=&quot;156&quot;&gt; &lt;/w:LatentStyles&gt;&lt;/xml&gt;&lt;![endif]--&gt;&lt;!--[if gte mso 10]&gt;&lt;style&gt; /* Style Definitions */  table.MsoNormalTable  {mso-style-name:&quot;Обычная таблица&quot;;  mso-tstyle-rowband-size:0;  mso-tstyle-colband-size:0;  mso-style-noshow:yes;  mso-style-parent:&quot;&quot;;  mso-padding-alt:0cm 5.4pt 0cm 5.4pt;  mso-para-margin:0cm;  mso-para-margin-bottom:.0001pt;  mso-pagination:widow-orphan;  font-size:10.0pt;  font-family:&quot;Times New Roman&quot;;  mso-ansi-language:#0400;  mso-fareast-language:#0400;  mso-bidi-language:#0400;} &lt;/style&gt;&lt;![endif]--&gt; &lt;/span&gt;&lt;/div&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;mso-layout-grid-align: none; text-autospace: none;&quot;&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;color: black;&quot;&gt;После подготовки изображения основного картографического слоя можно приступить к нанесению дополнительных слоев данных, а также различных статистик или модельных объектов, полученных с использованием функций &lt;/span&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;ggplot2&lt;/span&gt;&lt;span style=&quot;color: black; font-family: inherit;&quot;&gt;.&lt;/span&gt;&lt;/div&gt;&lt;/div&gt;&lt;span style=&quot;color: black;&quot;&gt;&lt;/span&gt;&lt;br /&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;mso-layout-grid-align: none; text-autospace: none;&quot;&gt;&lt;span style=&quot;color: black;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;/div&gt;&lt;span style=&quot;color: black;&quot;&gt;&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt;&lt;/span&gt;&lt;br /&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;mso-layout-grid-align: none; text-autospace: none;&quot;&gt;&lt;span style=&quot;color: black;&quot;&gt;&lt;b&gt;&lt;span style=&quot;color: black;&quot;&gt;Отображение точечных данных&lt;/span&gt;&lt;/b&gt;&lt;/span&gt;&lt;/div&gt;&lt;span style=&quot;color: black;&quot;&gt;&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt;&lt;/span&gt;&lt;br /&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;mso-layout-grid-align: none; text-autospace: none;&quot;&gt;&lt;span style=&quot;color: black;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;/div&gt;&lt;span style=&quot;color: black;&quot;&gt;&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt; &lt;/span&gt;&lt;br /&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;mso-layout-grid-align: none; text-autospace: none;&quot;&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;color: black;&quot;&gt;&lt;span style=&quot;color: black;&quot;&gt;В качестве примера будем использовать базу гидробиологических данных Института экологии Волжского бассейна РАН. В ходе экспедиционных исследований было взято 1158&lt;/span&gt;&lt;span style=&quot;color: black; font-size: 14.0pt;&quot;&gt; &lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt;проб донных сообществ беспозвоночных организмов в 100 малых и средних реках Среднего и Нижнего Поволжья, после чего результаты гидробиологической съемки были загружены в таблицы базы Microsoft Access. Покажем, как можно работать в среде R с данными, представленными в подобном формате. К сожалению, предоставление этой базы данных в публичный доступ невозможно, что не позволит читателям воспроизвести приведенные ниже примеры. Тем не менее, будем надеятся, что эти примеры окажутся полезными, и читатель легко сможет &quot;спроецировать&quot; их на собственные задачи.&lt;/span&gt;&lt;/span&gt;&lt;/div&gt;&lt;/div&gt;&lt;span style=&quot;color: black;&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;mso-layout-grid-align: none; text-autospace: none;&quot;&gt;&lt;span style=&quot;color: black;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;color: black;&quot;&gt;Соединение с базой данных выполним через стандартный &lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; mso-ansi-language: EN-US;&quot;&gt;API&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt;-интерфейс &lt;/span&gt;&lt;span class=&quot;tgc&quot;&gt;&lt;a href=&quot;https://ru.wikipedia.org/wiki/ODBC&quot; target=&quot;_blank&quot;&gt;Open DatabaseConnectivity&lt;/a&gt;&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt;, для чего первым делом создадим новый объект ODBC, используя панель администрирования операционной системы Windows. Присвоим объекту ODBC имя &quot;База&quot;, свяжем его с актуальным файлом MDB и определим необходимый драйвер. Соединение с источником данных выполним при помощи функции&amp;nbsp;&lt;/span&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;odbcConnect()&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt;&amp;nbsp;из пакета &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;RODBC&lt;/span&gt;: &lt;/span&gt;&lt;/div&gt;&lt;/div&gt;&lt;/span&gt;&lt;br /&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;library(RODBC)&lt;br /&gt;con &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; odbcConnect(&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;База&quot;&lt;/span&gt;)&lt;/pre&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;mso-layout-grid-align: none; text-autospace: none;&quot;&gt;&lt;!--[if gte mso 9]&gt;&lt;xml&gt; &lt;w:WordDocument&gt;  &lt;w:View&gt;Normal&lt;/w:View&gt;  &lt;w:Zoom&gt;0&lt;/w:Zoom&gt;  &lt;w:PunctuationKerning/&gt;  &lt;w:ValidateAgainstSchemas/&gt;  &lt;w:SaveIfXMLInvalid&gt;false&lt;/w:SaveIfXMLInvalid&gt;  &lt;w:IgnoreMixedContent&gt;false&lt;/w:IgnoreMixedContent&gt;  &lt;w:AlwaysShowPlaceholderText&gt;false&lt;/w:AlwaysShowPlaceholderText&gt;  &lt;w:Compatibility&gt;   &lt;w:BreakWrappedTables/&gt;   &lt;w:SnapToGridInCell/&gt;   &lt;w:WrapTextWithPunct/&gt;   &lt;w:UseAsianBreakRules/&gt;   &lt;w:DontGrowAutofit/&gt;  &lt;/w:Compatibility&gt;  &lt;w:BrowserLevel&gt;MicrosoftInternetExplorer4&lt;/w:BrowserLevel&gt; &lt;/w:WordDocument&gt;&lt;/xml&gt;&lt;![endif]--&gt;&lt;/div&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;mso-layout-grid-align: none; text-autospace: none;&quot;&gt;&lt;!--[if gte mso 9]&gt;&lt;xml&gt; &lt;w:WordDocument&gt;  &lt;w:View&gt;Normal&lt;/w:View&gt;  &lt;w:Zoom&gt;0&lt;/w:Zoom&gt;  &lt;w:PunctuationKerning/&gt;  &lt;w:ValidateAgainstSchemas/&gt;  &lt;w:SaveIfXMLInvalid&gt;false&lt;/w:SaveIfXMLInvalid&gt;  &lt;w:IgnoreMixedContent&gt;false&lt;/w:IgnoreMixedContent&gt;  &lt;w:AlwaysShowPlaceholderText&gt;false&lt;/w:AlwaysShowPlaceholderText&gt;  &lt;w:Compatibility&gt;   &lt;w:BreakWrappedTables/&gt;   &lt;w:SnapToGridInCell/&gt;   &lt;w:WrapTextWithPunct/&gt;   &lt;w:UseAsianBreakRules/&gt;   &lt;w:DontGrowAutofit/&gt;  &lt;/w:Compatibility&gt;  &lt;w:BrowserLevel&gt;MicrosoftInternetExplorer4&lt;/w:BrowserLevel&gt; &lt;/w:WordDocument&gt;&lt;/xml&gt;&lt;![endif]--&gt;&lt;/div&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;mso-layout-grid-align: none; text-autospace: none;&quot;&gt;&lt;!--[if gte mso 9]&gt;&lt;xml&gt; &lt;w:LatentStyles DefLockedState=&quot;false&quot; LatentStyleCount=&quot;156&quot;&gt; &lt;/w:LatentStyles&gt;&lt;/xml&gt;&lt;![endif]--&gt;&lt;!--[if gte mso 10]&gt;&lt;style&gt; /* Style Definitions */  table.MsoNormalTable  {mso-style-name:&quot;Обычная таблица&quot;;  mso-tstyle-rowband-size:0;  mso-tstyle-colband-size:0;  mso-style-noshow:yes;  mso-style-parent:&quot;&quot;;  mso-padding-alt:0cm 5.4pt 0cm 5.4pt;  mso-para-margin:0cm;  mso-para-margin-bottom:.0001pt;  mso-pagination:widow-orphan;  font-size:10.0pt;  font-family:&quot;Times New Roman&quot;;  mso-ansi-language:#0400;  mso-fareast-language:#0400;  mso-bidi-language:#0400;} &lt;/style&gt;&lt;![endif]--&gt; &lt;/div&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;mso-layout-grid-align: none; text-autospace: none;&quot;&gt;&lt;span style=&quot;color: black;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;color: black;&quot;&gt;Таблица &quot;Координаты&quot; нашей базы данных содержит географические координаты рек и их отдельных участков (для средних рек выделены отдельно истоки, среднее и нижнее течения и устье). Выведем на картосхему названия обследованных рек. Для создания основного слоя карты используем опцию &lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;maptype = &quot;satellite&quot;&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt;: &lt;/span&gt;&lt;/div&gt;&lt;/div&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;SQL &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;SELECT Наименование, Avg(Широта) AS lat, Avg(Долгота) AS lon &lt;br /&gt;       FROM Координаты GROUP BY Наименование&quot;&lt;/span&gt;&lt;br /&gt;koord &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; sqlQuery(con, SQL)&lt;br /&gt;myMap_gs &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; ggmap(get_googlemap(center = c(&lt;span style=&quot;color: #0080a0;&quot;&gt;50&lt;/span&gt;, &lt;span style=&quot;color: #0080a0;&quot;&gt;51.4&lt;/span&gt;), zoom = &lt;span style=&quot;color: #0080a0;&quot;&gt;6&lt;/span&gt;,&lt;br /&gt;                  maptype &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;satellite&quot;&lt;/span&gt;, extent &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;device&quot;&lt;/span&gt;))&lt;br /&gt;myMap_gs &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt; geom_text(aes(x &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; lon, y &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; lat, label = Наименование),&lt;br /&gt;                     size = &lt;span style=&quot;color: #0080a0;&quot;&gt;2.7&lt;/span&gt;, colour = &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;green&quot;&lt;/span&gt;, data &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; koord) &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;&lt;br /&gt;           ggtitle(&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;Обследованные реки&quot;&lt;/span&gt;)&lt;br /&gt;&lt;/pre&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;mso-layout-grid-align: none; text-autospace: none;&quot;&gt;&lt;!--[if gte mso 9]&gt;&lt;xml&gt; &lt;w:LatentStyles DefLockedState=&quot;false&quot; LatentStyleCount=&quot;156&quot;&gt; &lt;/w:LatentStyles&gt;&lt;/xml&gt;&lt;![endif]--&gt;&lt;!--[if gte mso 10]&gt;&lt;style&gt; /* Style Definitions */  table.MsoNormalTable  {mso-style-name:&quot;Обычная таблица&quot;;  mso-tstyle-rowband-size:0;  mso-tstyle-colband-size:0;  mso-style-noshow:yes;  mso-style-parent:&quot;&quot;;  mso-padding-alt:0cm 5.4pt 0cm 5.4pt;  mso-para-margin:0cm;  mso-para-margin-bottom:.0001pt;  mso-pagination:widow-orphan;  font-size:10.0pt;  font-family:&quot;Times New Roman&quot;;  mso-ansi-language:#0400;  mso-fareast-language:#0400;  mso-bidi-language:#0400;} &lt;/style&gt;&lt;![endif]--&gt; &lt;/div&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;mso-layout-grid-align: none; text-autospace: none;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;mso-layout-grid-align: none; text-autospace: none;&quot;&gt;&lt;span style=&quot;color: black;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;a href=&quot;https://1.bp.blogspot.com/-Tg5vkMPDyTw/WVnl27_ZjOI/AAAAAAAADbg/6-INVb0jLlQP1GQF_SRK5XtpY1k28exQACEwYBhgL/s1600/sat_label.jpg&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; data-original-height=&quot;702&quot; data-original-width=&quot;800&quot; height=&quot;560&quot; src=&quot;https://1.bp.blogspot.com/-Tg5vkMPDyTw/WVnl27_ZjOI/AAAAAAAADbg/6-INVb0jLlQP1GQF_SRK5XtpY1k28exQACEwYBhgL/s640/sat_label.jpg&quot; width=&quot;640&quot; /&gt;&lt;/a&gt;&lt;/div&gt;&lt;br /&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;mso-layout-grid-align: none; text-autospace: none;&quot;&gt;&lt;span style=&quot;color: black;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;color: black;&quot;&gt;Теперь выведем точками на карте координаты мест отбора проб из таблицы &quot;Координаты&quot;, взяв за основу карту из сервиса Stamen Maps. Отметим, что при использовании карт этого типа необходимо установить пакет&amp;nbsp;&lt;/span&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;ggmap&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt; не из репозитория CRAN, а из Github-репозитория его разработчиков (подробности см. &lt;a href=&quot;https://github.com/dkahle/ggmap/issues/102&quot; target=&quot;_blank&quot;&gt;здесь&lt;/a&gt;&lt;/span&gt;&lt;span style=&quot;font-family: inherit;&quot;&gt;&lt;code&gt;&lt;span style=&quot;font-size: 10.0pt;&quot;&gt;)&lt;/span&gt;&lt;/code&gt;&lt;span style=&quot;color: black;&quot;&gt;:&lt;/span&gt;&lt;/span&gt;&lt;/div&gt;&lt;/div&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;library(devtools)&lt;br /&gt;install_github(&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;dkahle/ggmap&quot;&lt;/span&gt;)&lt;br /&gt;&lt;span style=&quot;color: #406040;&quot;&gt;# --------------------------------&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #406040;&quot;&gt;#  Участки отбора проб   &lt;/span&gt;&lt;br /&gt;SQL &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;  &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;SELECT * FROM [Координаты]&quot;&lt;/span&gt;&lt;br /&gt;koord &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; sqlQuery(con, SQL)&lt;br /&gt;bbox &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; c(left &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;45&lt;/span&gt;, bottom &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;48.5&lt;/span&gt;, right &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;55&lt;/span&gt;, top &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;55&lt;/span&gt;)&lt;br /&gt;myMap_st &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; ggmap(get_stamenmap(bbox, maptype &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;terrain&quot;&lt;/span&gt;))&lt;br /&gt;myMap_st &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt; geom_point(aes(x &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; Долгота, y &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; Широта), data &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; koord) &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;&lt;br /&gt;           ggtitle(&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;Точки отбора проб&quot;&lt;/span&gt;)&lt;/pre&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;mso-layout-grid-align: none; text-autospace: none;&quot;&gt;&lt;/div&gt;&lt;br /&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;color: black;&quot;&gt;&amp;nbsp;  &lt;/span&gt;&lt;/div&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;a href=&quot;https://1.bp.blogspot.com/-Xcb8OnxTE0U/WVnl2ciZeMI/AAAAAAAADbY/zk5FFqModx49htPSLatVPm_-j70VHhBdgCEwYBhgL/s1600/koord.jpg&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; data-original-height=&quot;823&quot; data-original-width=&quot;768&quot; height=&quot;640&quot; src=&quot;https://1.bp.blogspot.com/-Xcb8OnxTE0U/WVnl2ciZeMI/AAAAAAAADbY/zk5FFqModx49htPSLatVPm_-j70VHhBdgCEwYBhgL/s640/koord.jpg&quot; width=&quot;595&quot; /&gt;&lt;/a&gt;&lt;/div&gt;&lt;!--[if gte mso 9]&gt;&lt;xml&gt; &lt;w:WordDocument&gt;  &lt;w:View&gt;Normal&lt;/w:View&gt;  &lt;w:Zoom&gt;0&lt;/w:Zoom&gt;  &lt;w:PunctuationKerning/&gt;  &lt;w:ValidateAgainstSchemas/&gt;  &lt;w:SaveIfXMLInvalid&gt;false&lt;/w:SaveIfXMLInvalid&gt;  &lt;w:IgnoreMixedContent&gt;false&lt;/w:IgnoreMixedContent&gt;  &lt;w:AlwaysShowPlaceholderText&gt;false&lt;/w:AlwaysShowPlaceholderText&gt;  &lt;w:Compatibility&gt;   &lt;w:BreakWrappedTables/&gt;   &lt;w:SnapToGridInCell/&gt;   &lt;w:WrapTextWithPunct/&gt;   &lt;w:UseAsianBreakRules/&gt;   &lt;w:DontGrowAutofit/&gt;  &lt;/w:Compatibility&gt;  &lt;w:BrowserLevel&gt;MicrosoftInternetExplorer4&lt;/w:BrowserLevel&gt; &lt;/w:WordDocument&gt;&lt;/xml&gt;&lt;![endif]--&gt;&lt;br /&gt;&lt;br /&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;text-align: justify;&quot;&gt;&lt;!--[if gte mso 9]&gt;&lt;xml&gt; &lt;w:LatentStyles DefLockedState=&quot;false&quot; LatentStyleCount=&quot;156&quot;&gt; &lt;/w:LatentStyles&gt;&lt;/xml&gt;&lt;![endif]--&gt;&lt;!--[if gte mso 10]&gt;&lt;style&gt; /* Style Definitions */  table.MsoNormalTable  {mso-style-name:&quot;Обычная таблица&quot;;  mso-tstyle-rowband-size:0;  mso-tstyle-colband-size:0;  mso-style-noshow:yes;  mso-style-parent:&quot;&quot;;  mso-padding-alt:0cm 5.4pt 0cm 5.4pt;  mso-para-margin:0cm;  mso-para-margin-bottom:.0001pt;  mso-pagination:widow-orphan;  font-size:10.0pt;  font-family:&quot;Times New Roman&quot;;  mso-ansi-language:#0400;  mso-fareast-language:#0400;  mso-bidi-language:#0400;} &lt;/style&gt;&lt;![endif]--&gt; &lt;/div&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;mso-layout-grid-align: none; text-autospace: none;&quot;&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;color: black;&quot;&gt;Обратим внимание, что локализация карты в этом случае может выполняться иным, часто более удобным способом: с указанием точных географических координат углов выделяемого прямоугольника поверхности Земли. Кроме того, для карт Stamen Maps имеется возможность использовать различные опции параметра&lt;span style=&quot;font-family: inherit; mso-spacerun: yes;&quot;&gt;&amp;nbsp; &lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;maptype = c(&quot;terrain&quot;, &quot;terrain-background&quot;, &quot;terrain-labels&quot;, &quot;terrain-lines&quot;, &quot;toner&quot;, &quot;toner-2010&quot;, &quot;toner-2011&quot;, &quot;toner-background&quot;, &quot;toner-hybrid&quot;, &quot;toner-labels&quot;, &quot;toner-lines&quot;, &quot;toner-lite&quot;, &quot;watercolor&quot;).&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt; Использование стиля &lt;/span&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;toner&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt; приводит к резко контрастным черно-белым картам &quot;газетного&quot; вида, а карты &lt;/span&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;watercolor&lt;/span&gt;&lt;span style=&quot;color: black; font-family: inherit;&quot;&gt;,&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt;&lt;span style=&quot;font-family: inherit;&quot;&gt; &lt;/span&gt;предназначенные для визуализации озерных систем, изображаются двумя группами оттенков цвета (желто-коричневого для суши и голубого для водных объектов). Мы предпочитаем использовать &lt;/span&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;terrain&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt; или &lt;/span&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;terrain-background&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt;, где подавляются все надписи, часто только мешающие анализу карт. &lt;/span&gt;&lt;/div&gt;&lt;/div&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;mso-layout-grid-align: none; text-autospace: none;&quot;&gt;&lt;!--[if gte mso 9]&gt;&lt;xml&gt; &lt;w:WordDocument&gt;  &lt;w:View&gt;Normal&lt;/w:View&gt;  &lt;w:Zoom&gt;0&lt;/w:Zoom&gt;  &lt;w:PunctuationKerning/&gt;  &lt;w:ValidateAgainstSchemas/&gt;  &lt;w:SaveIfXMLInvalid&gt;false&lt;/w:SaveIfXMLInvalid&gt;  &lt;w:IgnoreMixedContent&gt;false&lt;/w:IgnoreMixedContent&gt;  &lt;w:AlwaysShowPlaceholderText&gt;false&lt;/w:AlwaysShowPlaceholderText&gt;  &lt;w:Compatibility&gt;   &lt;w:BreakWrappedTables/&gt;   &lt;w:SnapToGridInCell/&gt;   &lt;w:WrapTextWithPunct/&gt;   &lt;w:UseAsianBreakRules/&gt;   &lt;w:DontGrowAutofit/&gt;  &lt;/w:Compatibility&gt;  &lt;w:BrowserLevel&gt;MicrosoftInternetExplorer4&lt;/w:BrowserLevel&gt; &lt;/w:WordDocument&gt;&lt;/xml&gt;&lt;![endif]--&gt;&lt;/div&gt;&lt;br /&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;mso-layout-grid-align: none; text-autospace: none;&quot;&gt;&lt;!--[if gte mso 9]&gt;&lt;xml&gt; &lt;w:LatentStyles DefLockedState=&quot;false&quot; LatentStyleCount=&quot;156&quot;&gt; &lt;/w:LatentStyles&gt;&lt;/xml&gt;&lt;![endif]--&gt;&lt;!--[if gte mso 10]&gt;&lt;style&gt; /* Style Definitions */  table.MsoNormalTable  {mso-style-name:&quot;Обычная таблица&quot;;  mso-tstyle-rowband-size:0;  mso-tstyle-colband-size:0;  mso-style-noshow:yes;  mso-style-parent:&quot;&quot;;  mso-padding-alt:0cm 5.4pt 0cm 5.4pt;  mso-para-margin:0cm;  mso-para-margin-bottom:.0001pt;  mso-pagination:widow-orphan;  font-size:10.0pt;  font-family:&quot;Times New Roman&quot;;  mso-ansi-language:#0400;  mso-fareast-language:#0400;  mso-bidi-language:#0400;} &lt;/style&gt;&lt;![endif]--&gt; &lt;/div&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;mso-layout-grid-align: none; text-autospace: none;&quot;&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;color: black;&quot;&gt;В ходе гидробиологической съемки было обнаружено более 700 видов и более крупных таксонов водных беспозвоночных. Выгрузим из базы показатель &lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;Count&lt;/span&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;_&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;Sample&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt;, определяющий, сколько раз тот или иной вид встретился в процессе исследований на каждом из участков рек. Например, рассмотрим, как распространены в реках Поволжья личинки к&lt;/span&gt;&lt;span class=&quot;st&quot;&gt;ровососущих мокрецов рода &lt;/span&gt;&lt;em&gt;Culicoides. &lt;/em&gt;&lt;span style=&quot;color: black;&quot;&gt;Используем для отображения на карте кружки, диаметр которых пропорционален &lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;Count&lt;/span&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;_&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;Sample&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt;:&lt;/span&gt;&lt;/div&gt;&lt;/div&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;Species &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;CeCul.sp&#39;&lt;/span&gt;&lt;br /&gt;SQL &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;  paste(&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;SELECT * FROM [_Численность с координатами] &lt;br /&gt;             WHERE Code = &#39;&quot;&lt;/span&gt;, Species, &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;&#39;&quot;&lt;/span&gt;, sep = &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;&quot;&lt;/span&gt;)&lt;br /&gt;sumdat &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; sqlQuery(con, SQL)&lt;br /&gt;name_sp &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; as.character(sumdat&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;NAME.1[&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;])&lt;br /&gt;head(sumdat[, c(&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;, &lt;span style=&quot;color: #0080a0;&quot;&gt;10&lt;/span&gt;, &lt;span style=&quot;color: #0080a0;&quot;&gt;11&lt;/span&gt;, &lt;span style=&quot;color: #0080a0;&quot;&gt;6&lt;/span&gt;, &lt;span style=&quot;color: #0080a0;&quot;&gt;8&lt;/span&gt;, &lt;span style=&quot;color: #0080a0;&quot;&gt;9&lt;/span&gt;)])&lt;br /&gt;         NAME   Широта  Долгота         NAME.1 Count_Sample Sum_CHISL&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;        Анлы &lt;span style=&quot;color: #0080a0;&quot;&gt;53.93778&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;52.33430&lt;/span&gt; Culicoides sp.            &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;        &lt;span style=&quot;color: #0080a0;&quot;&gt;50&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt; Б. Саморода &lt;span style=&quot;color: #0080a0;&quot;&gt;49.11437&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;46.84341&lt;/span&gt; Culicoides sp.           &lt;span style=&quot;color: #0080a0;&quot;&gt;19&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;22140&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt;  Б.Черемшан &lt;span style=&quot;color: #0080a0;&quot;&gt;54.30345&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;52.02079&lt;/span&gt; Culicoides sp.            &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;        &lt;span style=&quot;color: #0080a0;&quot;&gt;60&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt;  Б.Черемшан &lt;span style=&quot;color: #0080a0;&quot;&gt;54.50150&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;50.39124&lt;/span&gt; Culicoides sp.            &lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt;       &lt;span style=&quot;color: #0080a0;&quot;&gt;100&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt;    Байтуган &lt;span style=&quot;color: #0080a0;&quot;&gt;54.16788&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;52.28791&lt;/span&gt; Culicoides sp.           &lt;span style=&quot;color: #0080a0;&quot;&gt;11&lt;/span&gt;      &lt;span style=&quot;color: #0080a0;&quot;&gt;2886&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;6&lt;/span&gt;     Домашка &lt;span style=&quot;color: #0080a0;&quot;&gt;52.93876&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;50.60469&lt;/span&gt; Culicoides sp.            &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;        &lt;span style=&quot;color: #0080a0;&quot;&gt;10&lt;/span&gt;&lt;br /&gt;&lt;/pre&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;myMap_st &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt; geom_point(aes(x &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; Долгота, y &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; Широта, size &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; Count_Sample), data &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; sumdat) &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;&lt;br /&gt;           ggtitle(name_sp)&lt;/pre&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;mso-layout-grid-align: none; text-autospace: none;&quot;&gt;&lt;/div&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;a href=&quot;https://3.bp.blogspot.com/-a-ycq2S44fM/WVnl3HCn5EI/AAAAAAAADbo/sXt1FnitpWswdDODXFH8GPEK2btvvtUyACEwYBhgL/s1600/var_point.jpg&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; data-original-height=&quot;768&quot; data-original-width=&quot;811&quot; height=&quot;604&quot; src=&quot;https://3.bp.blogspot.com/-a-ycq2S44fM/WVnl3HCn5EI/AAAAAAAADbo/sXt1FnitpWswdDODXFH8GPEK2btvvtUyACEwYBhgL/s640/var_point.jpg&quot; width=&quot;640&quot; /&gt;&lt;/a&gt;&lt;/div&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;mso-layout-grid-align: none; text-autospace: none;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;br /&gt;&lt;br /&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; font-size: 10.0pt;&quot;&gt;&lt;/span&gt; &lt;br /&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;text-align: left;&quot;&gt;&lt;b&gt;&lt;span style=&quot;color: black;&quot;&gt;Распределение плотности вероятностей встречаемости видов&lt;/span&gt;&lt;/b&gt;&lt;/div&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;mso-layout-grid-align: none; text-autospace: none;&quot;&gt;&lt;span style=&quot;color: black;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;color: black;&quot;&gt;Для построения 2D-диаграммы плотности вероятностей выгрузим из базы данных полный список и координаты проб, в которых встретились виды &lt;/span&gt;&lt;em&gt;Culicoides&lt;/em&gt;&lt;em&gt;&lt;span style=&quot;font-style: normal; mso-bidi-font-style: italic;&quot;&gt;: &lt;/span&gt;&lt;/em&gt;&lt;/div&gt;&lt;/div&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;SQL &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;  paste(&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;SELECT * FROM [_Проба с координатами] WHERE Code = &#39;&quot;&lt;/span&gt;, &lt;br /&gt;             Species, &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;&#39;&quot;&lt;/span&gt;, sep = &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;&quot;&lt;/span&gt;)&lt;br /&gt;pundat &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; sqlQuery(con, SQL)&lt;br /&gt;name_sp &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; as.character(pundat&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;NAME[&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;])&lt;br /&gt;nrow(pundat)&lt;br /&gt;[&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;] &lt;span style=&quot;color: #0080a0;&quot;&gt;222&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;&lt;/span&gt;&lt;/pre&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;mso-layout-grid-align: none; text-autospace: none;&quot;&gt;&lt;/div&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;mso-layout-grid-align: none; text-autospace: none;&quot;&gt;&lt;em&gt;&lt;span style=&quot;font-style: normal; mso-bidi-font-style: italic;&quot;&gt;&lt;/span&gt;&lt;/em&gt;&lt;/div&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;mso-layout-grid-align: none; text-autospace: none;&quot;&gt;&lt;em&gt;&lt;span style=&quot;font-style: normal; mso-bidi-font-style: italic;&quot;&gt;&lt;!--[if gte mso 9]&gt;&lt;xml&gt; &lt;w:WordDocument&gt;  &lt;w:View&gt;Normal&lt;/w:View&gt;  &lt;w:Zoom&gt;0&lt;/w:Zoom&gt;  &lt;w:PunctuationKerning/&gt;  &lt;w:ValidateAgainstSchemas/&gt;  &lt;w:SaveIfXMLInvalid&gt;false&lt;/w:SaveIfXMLInvalid&gt;  &lt;w:IgnoreMixedContent&gt;false&lt;/w:IgnoreMixedContent&gt;  &lt;w:AlwaysShowPlaceholderText&gt;false&lt;/w:AlwaysShowPlaceholderText&gt;  &lt;w:Compatibility&gt;   &lt;w:BreakWrappedTables/&gt;   &lt;w:SnapToGridInCell/&gt;   &lt;w:WrapTextWithPunct/&gt;   &lt;w:UseAsianBreakRules/&gt;   &lt;w:DontGrowAutofit/&gt;  &lt;/w:Compatibility&gt;  &lt;w:BrowserLevel&gt;MicrosoftInternetExplorer4&lt;/w:BrowserLevel&gt; &lt;/w:WordDocument&gt;&lt;/xml&gt;&lt;![endif]--&gt;&lt;!--[if gte mso 9]&gt;&lt;xml&gt; &lt;w:LatentStyles DefLockedState=&quot;false&quot; LatentStyleCount=&quot;156&quot;&gt; &lt;/w:LatentStyles&gt;&lt;/xml&gt;&lt;![endif]--&gt;&lt;!--[if gte mso 10]&gt;&lt;style&gt; /* Style Definitions */  table.MsoNormalTable  {mso-style-name:&quot;Обычная таблица&quot;;  mso-tstyle-rowband-size:0;  mso-tstyle-colband-size:0;  mso-style-noshow:yes;  mso-style-parent:&quot;&quot;;  mso-padding-alt:0cm 5.4pt 0cm 5.4pt;  mso-para-margin:0cm;  mso-para-margin-bottom:.0001pt;  mso-pagination:widow-orphan;  font-size:10.0pt;  font-family:&quot;Times New Roman&quot;;  mso-ansi-language:#0400;  mso-fareast-language:#0400;  mso-bidi-language:#0400;} &lt;/style&gt;&lt;![endif]--&gt; &lt;/span&gt;&lt;/em&gt;&lt;span style=&quot;font-style: normal; mso-bidi-font-style: italic;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;mso-layout-grid-align: none; text-autospace: none;&quot;&gt;&lt;span style=&quot;color: black;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;color: black;&quot;&gt;Графически плотность двухмерного распределения этих точек на карте можно отобразить, используя контурные линии, которые ограничивают участки с одинаковой плотностью вероятности. В пакете &lt;/span&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;ggplot2&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt; для нахождения границ контуров плотности служит функция &lt;/span&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;stat_density2d()&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt;, которая в свою очередь основана на функции &lt;/span&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;kde2d()&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt; из базового R-пакета &lt;/span&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;MASS&lt;/span&gt;&lt;span style=&quot;color: black;&quot;&gt;. Функция&lt;span style=&quot;mso-spacerun: yes;&quot;&gt;&amp;nbsp;&lt;/span&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;scale&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;_&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;fill&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;_&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;gradient&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;()&lt;/span&gt; определяет диапазон цветов заливки каждого из &lt;span lang=&quot;EN-US&quot; style=&quot;font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;bins&amp;nbsp;&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;= 5&lt;/span&gt; контуров, а функция &lt;span lang=&quot;EN-US&quot; style=&quot;font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;scale&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;_&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;alpha&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;;&quot;&gt;()&lt;/span&gt; управляет уровнем прозрачности в зависимости от градации встречаемости вида:&lt;/div&gt;&lt;/div&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;myMap_st &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;  ggtitle(name_sp) &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;&lt;br /&gt;stat_density2d(data &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; pundat,  aes(x &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; Долгота, y &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; Широта, &lt;br /&gt;               fill &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; ..level.., alpha &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; ..level..), bins = &lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt;, geom &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;polygon&quot;&lt;/span&gt;) &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;&lt;br /&gt;scale_fill_gradient(low &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;green&quot;&lt;/span&gt;, high &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;red&quot;&lt;/span&gt;) &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;&lt;br /&gt;scale_alpha(range &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; c(&lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt;, &lt;span style=&quot;color: #0080a0;&quot;&gt;0.3&lt;/span&gt;), guide &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; FALSE)&lt;/pre&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;mso-layout-grid-align: none; text-autospace: none;&quot;&gt;&lt;/div&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;mso-layout-grid-align: none; text-autospace: none;&quot;&gt;&lt;em&gt;&lt;span style=&quot;font-style: normal; mso-bidi-font-style: italic;&quot;&gt;&lt;!--[if gte mso 9]&gt;&lt;xml&gt; &lt;w:WordDocument&gt;  &lt;w:View&gt;Normal&lt;/w:View&gt;  &lt;w:Zoom&gt;0&lt;/w:Zoom&gt;  &lt;w:PunctuationKerning/&gt;  &lt;w:ValidateAgainstSchemas/&gt;  &lt;w:SaveIfXMLInvalid&gt;false&lt;/w:SaveIfXMLInvalid&gt;  &lt;w:IgnoreMixedContent&gt;false&lt;/w:IgnoreMixedContent&gt;  &lt;w:AlwaysShowPlaceholderText&gt;false&lt;/w:AlwaysShowPlaceholderText&gt;  &lt;w:Compatibility&gt;   &lt;w:BreakWrappedTables/&gt;   &lt;w:SnapToGridInCell/&gt;   &lt;w:WrapTextWithPunct/&gt;   &lt;w:UseAsianBreakRules/&gt;   &lt;w:DontGrowAutofit/&gt;  &lt;/w:Compatibility&gt;  &lt;w:BrowserLevel&gt;MicrosoftInternetExplorer4&lt;/w:BrowserLevel&gt; &lt;/w:WordDocument&gt;&lt;/xml&gt;&lt;![endif]--&gt;&lt;/span&gt;&lt;/em&gt;&lt;/div&gt;&lt;br /&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;mso-layout-grid-align: none; text-autospace: none;&quot;&gt;&lt;em&gt;&lt;span style=&quot;font-style: normal; mso-bidi-font-style: italic;&quot;&gt;&lt;!--[if gte mso 9]&gt;&lt;xml&gt; &lt;w:LatentStyles DefLockedState=&quot;false&quot; LatentStyleCount=&quot;156&quot;&gt; &lt;/w:LatentStyles&gt;&lt;/xml&gt;&lt;![endif]--&gt;&lt;!--[if gte mso 10]&gt;&lt;style&gt; /* Style Definitions */  table.MsoNormalTable  {mso-style-name:&quot;Обычная таблица&quot;;  mso-tstyle-rowband-size:0;  mso-tstyle-colband-size:0;  mso-style-noshow:yes;  mso-style-parent:&quot;&quot;;  mso-padding-alt:0cm 5.4pt 0cm 5.4pt;  mso-para-margin:0cm;  mso-para-margin-bottom:.0001pt;  mso-pagination:widow-orphan;  font-size:10.0pt;  font-family:&quot;Times New Roman&quot;;  mso-ansi-language:#0400;  mso-fareast-language:#0400;  mso-bidi-language:#0400;} &lt;/style&gt;&lt;![endif]--&gt;&lt;span style=&quot;font-family: &amp;quot;times new roman&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/span&gt;&lt;/em&gt;&lt;/div&gt;&lt;!--[if gte mso 9]&gt;&lt;xml&gt; &lt;w:WordDocument&gt;  &lt;w:View&gt;Normal&lt;/w:View&gt;  &lt;w:Zoom&gt;0&lt;/w:Zoom&gt;  &lt;w:PunctuationKerning/&gt;  &lt;w:ValidateAgainstSchemas/&gt;  &lt;w:SaveIfXMLInvalid&gt;false&lt;/w:SaveIfXMLInvalid&gt;  &lt;w:IgnoreMixedContent&gt;false&lt;/w:IgnoreMixedContent&gt;  &lt;w:AlwaysShowPlaceholderText&gt;false&lt;/w:AlwaysShowPlaceholderText&gt;  &lt;w:Compatibility&gt;   &lt;w:BreakWrappedTables/&gt;   &lt;w:SnapToGridInCell/&gt;   &lt;w:WrapTextWithPunct/&gt;   &lt;w:UseAsianBreakRules/&gt;   &lt;w:DontGrowAutofit/&gt;  &lt;/w:Compatibility&gt;  &lt;w:BrowserLevel&gt;MicrosoftInternetExplorer4&lt;/w:BrowserLevel&gt; &lt;/w:WordDocument&gt;&lt;/xml&gt;&lt;![endif]--&gt; &lt;br /&gt;&lt;div class=&quot;MsoNormal&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;a href=&quot;https://3.bp.blogspot.com/-5hIBYVvdQ0E/WVnl2ypekxI/AAAAAAAADbk/qlx1JOcoU_AkYNKPlSSNdbeR1cB9qVijwCEwYBhgL/s1600/var_dens.jpg&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; data-original-height=&quot;835&quot; data-original-width=&quot;761&quot; height=&quot;640&quot; src=&quot;https://3.bp.blogspot.com/-5hIBYVvdQ0E/WVnl2ypekxI/AAAAAAAADbk/qlx1JOcoU_AkYNKPlSSNdbeR1cB9qVijwCEwYBhgL/s640/var_dens.jpg&quot; width=&quot;582&quot; /&gt;&lt;/a&gt;&lt;/div&gt;&lt;div class=&quot;MsoNormal&quot;&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Предположим теперь, что мы хотим внимательнее рассмотреть ситуацию с распространением &lt;em&gt;Culicoides&lt;/em&gt; в районе оз. Эльтон (сгущение в нижней части карты). В дополнение к предыдущему скрипту в отдельном слое расставим местоположения точек отбора проб и добавим легенду с градациями встречаемости личинок мокреца. &lt;/div&gt;&lt;br /&gt;&lt;/div&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;ggmap(get_googlemap(center &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; c(&lt;span style=&quot;color: #0080a0;&quot;&gt;46.64&lt;/span&gt;, &lt;span style=&quot;color: #0080a0;&quot;&gt;49.21&lt;/span&gt;), zoom = &lt;span style=&quot;color: #0080a0;&quot;&gt;10&lt;/span&gt;,  &lt;br /&gt;      maptype &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;hybrid&quot;&lt;/span&gt;, extent &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;device&quot;&lt;/span&gt;)) &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;&lt;br /&gt;ggtitle(name_sp) &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;&lt;br /&gt;geom_point(data &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; pundat, aes (x &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; Долгота, y &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; Широта), colour &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;red&quot;&lt;/span&gt;) &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt; &lt;br /&gt;stat_density2d(data &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; pundat,  aes(x &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; Долгота, y &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; Широта, &lt;br /&gt;               fill &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; ..level.., alpha &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; ..level..), bins = &lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt;, geom &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;polygon&quot;&lt;/span&gt;) &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;&lt;br /&gt;scale_fill_gradient(&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;Плотность&lt;span style=&quot;color: maroon;&quot;&gt;\n&lt;/span&gt;встречаемости&quot;&lt;/span&gt;, low &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;green&quot;&lt;/span&gt;, high &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;red&quot;&lt;/span&gt;) &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt; &lt;br /&gt;guides(fill = guide_colorbar(barwidth &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1.5&lt;/span&gt;, barheight &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;10&lt;/span&gt;)) &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;&lt;br /&gt;scale_alpha(range &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; c(&lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt;, &lt;span style=&quot;color: #0080a0;&quot;&gt;0.3&lt;/span&gt;), guide &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; FALSE)&lt;/pre&gt;&lt;!--[if gte mso 9]&gt;&lt;xml&gt; &lt;w:LatentStyles DefLockedState=&quot;false&quot; LatentStyleCount=&quot;156&quot;&gt; &lt;/w:LatentStyles&gt;&lt;/xml&gt;&lt;![endif]--&gt;&lt;!--[if gte mso 10]&gt;&lt;style&gt; /* Style Definitions */  table.MsoNormalTable  {mso-style-name:&quot;Обычная таблица&quot;;  mso-tstyle-rowband-size:0;  mso-tstyle-colband-size:0;  mso-style-noshow:yes;  mso-style-parent:&quot;&quot;;  mso-padding-alt:0cm 5.4pt 0cm 5.4pt;  mso-para-margin:0cm;  mso-para-margin-bottom:.0001pt;  mso-pagination:widow-orphan;  font-size:10.0pt;  font-family:&quot;Times New Roman&quot;;  mso-ansi-language:#0400;  mso-fareast-language:#0400;  mso-bidi-language:#0400;} &lt;/style&gt;&lt;![endif]--&gt;&lt;br /&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;mso-layout-grid-align: none; text-autospace: none;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;em&gt;&lt;a href=&quot;https://4.bp.blogspot.com/-K1NYAoE0Axk/WVnl2ZUf8WI/AAAAAAAADbc/vfBDBRU7JYwk34nwestzOrNk19N0sFqfQCEwYBhgL/s1600/elton_dens.jpg&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; data-original-height=&quot;768&quot; data-original-width=&quot;862&quot; height=&quot;570&quot; src=&quot;https://4.bp.blogspot.com/-K1NYAoE0Axk/WVnl2ZUf8WI/AAAAAAAADbc/vfBDBRU7JYwk34nwestzOrNk19N0sFqfQCEwYBhgL/s640/elton_dens.jpg&quot; width=&quot;640&quot; /&gt;&lt;/a&gt;&lt;/em&gt;&lt;/div&gt;&lt;br /&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;mso-layout-grid-align: none; text-autospace: none;&quot;&gt;&lt;em&gt;&lt;span style=&quot;font-style: normal; mso-bidi-font-style: italic;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;times new roman&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;times new roman&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;!--[if gte mso 9]&gt;&lt;xml&gt; &lt;w:WordDocument&gt;  &lt;w:View&gt;Normal&lt;/w:View&gt;  &lt;w:Zoom&gt;0&lt;/w:Zoom&gt;  &lt;w:PunctuationKerning/&gt;  &lt;w:ValidateAgainstSchemas/&gt;  &lt;w:SaveIfXMLInvalid&gt;false&lt;/w:SaveIfXMLInvalid&gt;  &lt;w:IgnoreMixedContent&gt;false&lt;/w:IgnoreMixedContent&gt;  &lt;w:AlwaysShowPlaceholderText&gt;false&lt;/w:AlwaysShowPlaceholderText&gt;  &lt;w:Compatibility&gt;   &lt;w:BreakWrappedTables/&gt;   &lt;w:SnapToGridInCell/&gt;   &lt;w:WrapTextWithPunct/&gt;   &lt;w:UseAsianBreakRules/&gt;   &lt;w:DontGrowAutofit/&gt;  &lt;/w:Compatibility&gt;  &lt;w:BrowserLevel&gt;MicrosoftInternetExplorer4&lt;/w:BrowserLevel&gt; &lt;/w:WordDocument&gt;&lt;/xml&gt;&lt;![endif]--&gt;&lt;!--[if gte mso 9]&gt;&lt;xml&gt; &lt;w:LatentStyles DefLockedState=&quot;false&quot; LatentStyleCount=&quot;156&quot;&gt; &lt;/w:LatentStyles&gt;&lt;/xml&gt;&lt;![endif]--&gt;&lt;!--[if !mso]&gt;&lt;img src=&quot;https://img1.blogblog.com/img/video_object.png&quot; style=&quot;background-color: #b2b2b2; &quot; class=&quot;BLOGGER-object-element tr_noresize tr_placeholder&quot; id=&quot;ieooui&quot; data-original-id=&quot;ieooui&quot; /&gt;&lt;style&gt;st1\:*{behavior:url(#ieooui) } &lt;/style&gt;&lt;![endif]--&gt;&lt;!--[if gte mso 10]&gt;&lt;style&gt; /* Style Definitions */  table.MsoNormalTable  {mso-style-name:&quot;Обычная таблица&quot;;  mso-tstyle-rowband-size:0;  mso-tstyle-colband-size:0;  mso-style-noshow:yes;  mso-style-parent:&quot;&quot;;  mso-padding-alt:0cm 5.4pt 0cm 5.4pt;  mso-para-margin:0cm;  mso-para-margin-bottom:.0001pt;  mso-pagination:widow-orphan;  font-size:10.0pt;  font-family:&quot;Times New Roman&quot;;  mso-ansi-language:#0400;  mso-fareast-language:#0400;  mso-bidi-language:#0400;} &lt;/style&gt;&lt;![endif]--&gt; &lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/em&gt;&lt;em&gt;&lt;em&gt;&lt;span style=&quot;font-style: normal; mso-bidi-font-style: italic;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;times new roman&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;times new roman&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/em&gt;&lt;/em&gt;&lt;/div&gt;&lt;div class=&quot;MsoNormal&quot;&gt;&lt;b&gt;Литературные источники:&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;&lt;ul&gt;&lt;li&gt;&lt;i&gt;Wickham H.&lt;/i&gt; (2009, 2016) &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;ggplot2&lt;/span&gt;: Elegant Graphics for Data Analysis. Springer, New York. URL:&amp;nbsp;&lt;a href=&quot;http://ggplot2.org/book/&quot;&gt;http://ggplot2.org/book/&lt;/a&gt;&amp;nbsp;&lt;/li&gt;&lt;li&gt;&lt;i&gt;Мастицкий С. Э. &lt;/i&gt;(2016) Визуализация данных с помощью &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;ggplot2&lt;/span&gt;. М.: ДМК Пресс, 2016&lt;/li&gt;&lt;li&gt;&lt;i&gt;Kahle D., Wickham H. &lt;/i&gt;(2013) &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;ggmap&lt;/span&gt;: Spatial Visualization with &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;ggplot2&lt;/span&gt;. The R Journal 5: 144–162. URL: &lt;a href=&quot;http://vita.had.co.nz/papers/ggmap.html&quot;&gt;http://vita.had.co.nz/papers/ggmap.html&lt;/a&gt;&lt;/li&gt;&lt;/ul&gt;&lt;/div&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;text-align: justify;&quot;&gt;&lt;/div&gt;&lt;/div&gt;</content><link rel='replies' type='text/html' href='http://r-analytics.blogspot.com/2017/07/ggmap-ggplot2.html#comment-form' title='Комментарии: 1'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/5731407287165194528'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/5731407287165194528'/><link rel='alternate' type='text/html' href='http://r-analytics.blogspot.com/2017/07/ggmap-ggplot2.html' title='Визуализация пространственно-распределенных данных с помощью пакетов ggmap и ggplot2'/><author><name>В.Шитиков</name><uri>http://www.blogger.com/profile/01896460847215383456</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='31' height='32' src='//1.bp.blogspot.com/-5Wttqmz7yaM/WFemBTJup6I/AAAAAAAADUE/VRlomgxu2QsLFzRgbGdGQzmQQ06lRKM7gCK4B/s220/Face2.JPG'/></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://3.bp.blogspot.com/-SXMwjHQ-h3k/WVnl2GI8EXI/AAAAAAAADbU/-vEmMNeveNI-syb533EqaNFWrY9wp0ylwCLcBGAs/s72-c/Sarat_goog.jpg" height="72" width="72"/><thr:total>1</thr:total></entry><entry><id>tag:blogger.com,1999:blog-9120847565867616203.post-3173735840168812505</id><published>2017-06-04T14:03:00.000+01:00</published><updated>2017-06-20T21:26:13.135+01:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="R-пакеты"/><title type='text'>Обзор интересных R-пакетов за май 2017 г.</title><content type='html'>&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;a href=&quot;https://2.bp.blogspot.com/-5bLo_BdrIhI/WTPvA0zqYsI/AAAAAAAADNQ/bZULo3HKLDA-1C4qBfAvxqZkCbu46QGogCLcB/s1600/syberia.PNG&quot; imageanchor=&quot;1&quot; style=&quot;clear: right; float: right; margin-bottom: 1em; margin-left: 1em;&quot;&gt;&lt;br /&gt;&lt;/a&gt;&lt;br /&gt;&lt;ul&gt;&lt;li&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/CausalImpact/index.html&quot; target=&quot;_blank&quot;&gt;CausalImpact&lt;/a&gt;&lt;/span&gt;: великолепный инструмент от&amp;nbsp;&lt;a href=&quot;https://research.google.com/pubs/pub41854.html&quot; target=&quot;_blank&quot;&gt;аналитиков из Google&lt;/a&gt;, который позволяет&amp;nbsp;&lt;a href=&quot;https://cran.r-project.org/web/packages/CausalImpact/vignettes/CausalImpact.html&quot; target=&quot;_blank&quot;&gt;оценить эффект&lt;/a&gt;&amp;nbsp;экспериментального воздействия на изменяющуюся во времени переменную при отсутствии контрольной группы.&lt;/li&gt;&lt;li&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://github.com/lbartnik/defer&quot; target=&quot;_blank&quot;&gt;defer&lt;/a&gt;&lt;/span&gt;: пакет, с помощью которого можно удобно &quot;обернуть&quot; несколько функций в одну высокоуровневую функцию. Вот небольшой пример:&lt;br /&gt;&lt;br /&gt;&lt;pre style=&quot;background: rgb(241, 241, 241);&quot;&gt;C &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;10&lt;/span&gt;&lt;br /&gt;&lt;br /&gt;&lt;span style=&quot;color: maroon;&quot;&gt;f&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;function&lt;/span&gt;(x) x&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;x &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt; C&lt;br /&gt;&lt;span style=&quot;color: maroon;&quot;&gt;g&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;function&lt;/span&gt;(y) (f(y) &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;10&lt;/span&gt;) &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt; f(y&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt;)&lt;br /&gt;&lt;span style=&quot;color: maroon;&quot;&gt;h&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;function&lt;/span&gt;(z) mean(c(g(z), g(z&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;), g(z&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;)))&lt;br /&gt;&lt;br /&gt;wrapper &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; defer(h)&lt;br /&gt;&lt;span style=&quot;color: #406040;&quot;&gt;#&amp;gt; Found functions:&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #406040;&quot;&gt;#&amp;gt;   g, f&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #406040;&quot;&gt;#&amp;gt; variables:&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #406040;&quot;&gt;#&amp;gt;   C&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #406040;&quot;&gt;#&amp;gt; library calls:&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #406040;&quot;&gt;#&amp;gt;   base::mean&lt;/span&gt;&lt;br /&gt;&lt;br /&gt;rm(C, f, g, h)&lt;br /&gt;&lt;br /&gt;wrapper(&lt;span style=&quot;color: #0080a0;&quot;&gt;10&lt;/span&gt;)&lt;br /&gt;&lt;span style=&quot;color: #406040;&quot;&gt;#&amp;gt; [1] 29688.67&lt;/span&gt;&lt;br /&gt;&lt;/pre&gt;&lt;/li&gt;&lt;br /&gt;&lt;li&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/d3Tree/index.html&quot; target=&quot;_blank&quot;&gt;d3Tree&lt;/a&gt;&lt;/span&gt;: R-интерфейс к JavaScript-библиотеке&amp;nbsp;&lt;a href=&quot;https://d3js.org/&quot; target=&quot;_blank&quot;&gt;D3&lt;/a&gt;&amp;nbsp;для создания &quot;схлопывающихся&quot; дендрограмм. См. примеры&amp;nbsp;&lt;a href=&quot;https://github.com/metrumresearchgroup/d3Tree&quot; target=&quot;_blank&quot;&gt;здесь&lt;/a&gt;.&lt;/li&gt;&lt;li&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/MultiVarSel/index.html&quot; target=&quot;_blank&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;MultiVarSel&lt;/span&gt;&lt;/a&gt;: реализация метода&amp;nbsp;&lt;a href=&quot;https://arxiv.org/abs/1704.00076&quot; target=&quot;_blank&quot;&gt;Perrot-Dockes et al. (2017)&lt;/a&gt;&amp;nbsp;для селекции информативных предикторов для&amp;nbsp;&lt;a href=&quot;http://r-analytics.blogspot.co.uk/2013/03/blog-post.html&quot; target=&quot;_blank&quot;&gt;общих линейных моделей&lt;/a&gt;. См. примеры&amp;nbsp;&lt;a href=&quot;https://cran.r-project.org/web/packages/MultiVarSel/vignettes/MultiVarSel.pdf&quot; target=&quot;_blank&quot;&gt;здесь&lt;/a&gt;.&lt;/li&gt;&lt;li&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/networktools/index.html&quot; target=&quot;_blank&quot;&gt;networktools&lt;/a&gt;&lt;/span&gt;: набор функций для анализа графов (сетей). В частности, в этом пакете реализована новая метрика для&amp;nbsp;&lt;a href=&quot;https://cran.r-project.org/web/packages/networktools/vignettes/Impact.pdf&quot; target=&quot;_blank&quot;&gt;оценки &quot;влияния&quot;&lt;/a&gt;&amp;nbsp;(impact) отдельных узлов и ребер графа на устойчивость его структуры.&lt;/li&gt;&lt;li&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/philentropy/index.html&quot; target=&quot;_blank&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;philentropy&lt;/span&gt;&lt;/a&gt;: позволяет вычислить 46 различных метрик&amp;nbsp;&lt;a href=&quot;https://cran.r-project.org/web/packages/philentropy/vignettes/Distances.html&quot; target=&quot;_blank&quot;&gt;сходства/расстояния&lt;/a&gt;&amp;nbsp;между многомерными объектами. Вот список реализованных в этом пакете метрик:&lt;br /&gt;&lt;br /&gt;&lt;pre style=&quot;background: rgb(241, 241, 241);&quot;&gt;library(philentorpy)&lt;br /&gt;&lt;br /&gt;getDistMethods()&lt;br /&gt;&lt;br /&gt;&lt;span style=&quot;color: #406040;&quot;&gt;##  [1] &quot;euclidean&quot;         &quot;manhattan&quot;         &quot;minkowski&quot;         &quot;chebyshev&quot;        &lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #406040;&quot;&gt;##  [5] &quot;sorensen&quot;          &quot;gower&quot;             &quot;soergel&quot;           &quot;kulczynski_d&quot;     &lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #406040;&quot;&gt;##  [9] &quot;canberra&quot;          &quot;lorentzian&quot;        &quot;intersection&quot;      &quot;non-intersection&quot; &lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #406040;&quot;&gt;## [13] &quot;wavehedges&quot;        &quot;czekanowski&quot;       &quot;motyka&quot;            &quot;kulczynski_s&quot;     &lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #406040;&quot;&gt;## [17] &quot;tanimoto&quot;          &quot;ruzicka&quot;           &quot;inner_product&quot;     &quot;harmonic_mean&quot;    &lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #406040;&quot;&gt;## [21] &quot;cosine&quot;            &quot;hassebrook&quot;        &quot;jaccard&quot;           &quot;dice&quot;             &lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #406040;&quot;&gt;## [25] &quot;fidelity&quot;          &quot;bhattacharyya&quot;     &quot;hellinger&quot;         &quot;matusita&quot;         &lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #406040;&quot;&gt;## [29] &quot;squared_chord&quot;     &quot;squared_euclidean&quot; &quot;pearson&quot;           &quot;neyman&quot;           &lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #406040;&quot;&gt;## [33] &quot;squared_chi&quot;       &quot;prob_symm&quot;         &quot;divergence&quot;        &quot;clark&quot;            &lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #406040;&quot;&gt;## [37] &quot;additive_symm&quot;     &quot;kullback-leibler&quot;  &quot;jeffreys&quot;          &quot;k_divergence&quot;     &lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #406040;&quot;&gt;## [41] &quot;topsoe&quot;            &quot;jensen-shannon&quot;    &quot;jensen_difference&quot; &quot;taneja&quot;           &lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #406040;&quot;&gt;## [45] &quot;kumar-johnson&quot;     &quot;avg&quot;&lt;/span&gt;&lt;/pre&gt;&lt;/li&gt;&lt;br /&gt;&lt;li&gt;R, а также&amp;nbsp;&lt;a href=&quot;https://www.python.org/&quot; target=&quot;_blank&quot;&gt;Python&lt;/a&gt;&amp;nbsp;и&amp;nbsp;&lt;a href=&quot;http://fsharp.org/&quot; target=&quot;_blank&quot;&gt;F#&lt;/a&gt;&amp;nbsp;&lt;a href=&quot;https://blogs.msdn.microsoft.com/visualstudio/2017/05/10/build-intelligent-apps-faster-with-visual-studio/&quot; target=&quot;_blank&quot;&gt;теперь интегрированы&lt;/a&gt;&amp;nbsp;в IDE&amp;nbsp;&lt;a href=&quot;https://ru.wikipedia.org/wiki/Microsoft_Visual_Studio&quot; target=&quot;_blank&quot;&gt;Visual Studio&lt;/a&gt;, что, согласно задумке Microsoft, добавит удобства в процесс разработки &quot;умных приложений&quot; на основе этих языков благодаря использованию одной&amp;nbsp;&lt;a href=&quot;https://ru.wikipedia.org/wiki/%D0%98%D0%BD%D1%82%D0%B5%D0%B3%D1%80%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%BD%D0%B0%D1%8F_%D1%81%D1%80%D0%B5%D0%B4%D0%B0_%D1%80%D0%B0%D0%B7%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B8&quot; target=&quot;_blank&quot;&gt;IDE&lt;/a&gt;.&lt;/li&gt;&lt;li&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/shinymaterial/index.html&quot; target=&quot;_blank&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;shinymaterial&lt;/span&gt;&lt;/a&gt;: позволяет оформлять Shiny-приложения в духе &quot;&lt;a href=&quot;https://ru.wikipedia.org/wiki/Material_Design&quot; target=&quot;_blank&quot;&gt;материального дизайна&lt;/a&gt;&quot; (&lt;a href=&quot;https://material.io/guidelines/&quot; target=&quot;_blank&quot;&gt;material design&lt;/a&gt;), предложенного Google. Подробнее &lt;a href=&quot;https://ericrayanderson.github.io/shinymaterial/&quot; target=&quot;_blank&quot;&gt;см. здесь&lt;/a&gt;.&lt;/li&gt;&lt;li&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/simmer/index.html&quot; target=&quot;_blank&quot;&gt;simmer&lt;/a&gt;&lt;/span&gt;: набор функций для&amp;nbsp;&lt;a href=&quot;https://ru.wikipedia.org/wiki/%D0%94%D0%B8%D1%81%D0%BA%D1%80%D0%B5%D1%82%D0%BD%D0%BE-%D1%81%D0%BE%D0%B1%D1%8B%D1%82%D0%B8%D0%B9%D0%BD%D0%BE%D0%B5_%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5&quot; target=&quot;_blank&quot;&gt;моделирования дискретных событий&lt;/a&gt;.&lt;/li&gt;&lt;li&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;http://syberia.io/&quot; target=&quot;_blank&quot;&gt;Syberia&lt;/a&gt;&lt;/span&gt;: новый фреймворк для разработки предсказательных моделей средствами R и последующего внедрения этих моделей в бизнес-процессы. См. также &lt;a href=&quot;https://channel9.msdn.com/Events/RFinance/RFinance-2017/Syberia-A-development-framework-for-R&quot; target=&quot;_blank&quot;&gt;видео доклада&lt;/a&gt; по Syberia, сделанного недавно на конференции &lt;a href=&quot;http://www.rinfinance.com/&quot; target=&quot;_blank&quot;&gt;R/Finance&lt;/a&gt;.&lt;/li&gt;&lt;/ul&gt;&lt;/div&gt;&lt;script async=&quot;&quot; src=&quot;//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js&quot;&gt;&lt;/script&gt;&lt;!-- R Analytics Responsive --&gt;&lt;br /&gt;&lt;ins class=&quot;adsbygoogle&quot; data-ad-client=&quot;ca-pub-6457966355894443&quot; data-ad-format=&quot;auto&quot; data-ad-slot=&quot;8123690788&quot; style=&quot;display: block;&quot;&gt;&lt;/ins&gt;&lt;script&gt;(adsbygoogle = window.adsbygoogle || []).push({}); &lt;/script&gt;</content><link rel='replies' type='text/html' href='http://r-analytics.blogspot.com/2017/06/r-2017.html#comment-form' title='Комментарии: 2'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/3173735840168812505'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/3173735840168812505'/><link rel='alternate' type='text/html' href='http://r-analytics.blogspot.com/2017/06/r-2017.html' title='Обзор интересных R-пакетов за май 2017 г.'/><author><name>Sergey Mastitsky</name><uri>https://plus.google.com/100743762419147389233</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='32' height='32' src='//lh3.googleusercontent.com/-S7CBBqIIWg0/AAAAAAAAAAI/AAAAAAAAANI/e7vggjNa3Mo/s512-c/photo.jpg'/></author><thr:total>2</thr:total></entry><entry><id>tag:blogger.com,1999:blog-9120847565867616203.post-1018157782672596300</id><published>2017-05-10T22:34:00.000+01:00</published><updated>2017-05-10T22:39:06.285+01:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="R-пакеты"/><title type='text'>Обзор интересных R-пакетов за март-апрель 2017 г.</title><content type='html'>&lt;ul&gt;&lt;a href=&quot;https://3.bp.blogspot.com/-SCM-TjGTKKQ/WROITv28r9I/AAAAAAAADM8/dWgZ01RFFNE0m7C6blYWGbLdJ_omGZ1rACLcB/s1600/cron.png&quot; imageanchor=&quot;1&quot; style=&quot;clear: right; float: right; margin-bottom: 1em; margin-left: 1em;&quot;&gt;&lt;img border=&quot;0&quot; src=&quot;https://3.bp.blogspot.com/-SCM-TjGTKKQ/WROITv28r9I/AAAAAAAADM8/dWgZ01RFFNE0m7C6blYWGbLdJ_omGZ1rACLcB/s1600/cron.png&quot; /&gt;&lt;/a&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;21 апреля 2017 г. &lt;a href=&quot;https://stat.ethz.ch/pipermail/r-announce/2017/000612.html&quot; target=&quot;_blank&quot;&gt;вышла новая версия&lt;/a&gt; R (v3.4.0), в которую вошло несколько изменений, связанных с увеличением скорости вычислений. Подробнее можно узнать &lt;a href=&quot;https://www.r-statistics.com/2017/04/r-3-4-0-is-released-with-new-speed-upgrades-and-bug-fixes/&quot; target=&quot;_blank&quot;&gt;здесь&lt;/a&gt;.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/choroplethr/index.html&quot; target=&quot;_blank&quot;&gt;choroplethr&lt;/a&gt;&lt;/span&gt;: предназначен для создания&amp;nbsp;&lt;a href=&quot;https://ru.wikipedia.org/wiki/%D0%9A%D0%B0%D1%80%D1%82%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0&quot; target=&quot;_blank&quot;&gt;картограмм&lt;/a&gt;. Кроме того, с помощью этого пакета можно выполнять соединение с несколькими удаленными источниками картографических данных.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/cronR/&quot; target=&quot;_blank&quot;&gt;cronR&lt;/a&gt;&lt;/span&gt;: позволяет задавать расписание выполнения R-скриптов на Unix/Linux машинах. Есть и аналогичный пакет для Windows-машин -&amp;nbsp;&lt;a href=&quot;https://cran.r-project.org/web/packages/taskscheduleR/index.html&quot; target=&quot;_blank&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;taskscheduleR&lt;/span&gt;&lt;/a&gt;&amp;nbsp;(см. примеры&amp;nbsp;&lt;a href=&quot;https://cran.r-project.org/web/packages/taskscheduleR/vignettes/taskscheduleR.html&quot; target=&quot;_blank&quot;&gt;здесь&lt;/a&gt;).&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/errors/index.html&quot; target=&quot;_blank&quot;&gt;errors&lt;/a&gt;&lt;/span&gt;: в физике и других научных дисциплинах любое измерение всегда сопровождается определенной погрешностью. В R одновременно&amp;nbsp;работать с результатами подобных измерений и их погрешностями не трудно, но утомительно. Новый пакет&amp;nbsp;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;errors&lt;/span&gt;&amp;nbsp;&lt;a href=&quot;https://www.enchufa2.es/archives/errors-0-0-1.html&quot; target=&quot;_blank&quot;&gt;предлагает удобное решение&lt;/a&gt;&amp;nbsp;для работы с такими данными.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/HIBPwned/index.html&quot; target=&quot;_blank&quot;&gt;HIBPwned&lt;/a&gt;&lt;/span&gt;: R-интерфейс к&amp;nbsp;&lt;a href=&quot;https://haveibeenpwned.com/API/v2&quot; target=&quot;_blank&quot;&gt;API&lt;/a&gt;&amp;nbsp;сервиса &quot;&lt;a href=&quot;https://haveibeenpwned.com/&quot; target=&quot;_blank&quot;&gt;Have I Been Pwned&lt;/a&gt;?&quot;. С помощью этого сервиса можно выяснить, находится ли тот или иной адрес электронной почты в списках адресов, учетные данные которых стали по тем или иным причинам публично доступными.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/kerasR/index.html&quot; target=&quot;_blank&quot;&gt;kerasR&lt;/a&gt;&lt;/span&gt;: R-интерфейс к популярной Python-библиотеке для &quot;&lt;a href=&quot;https://ru.wikipedia.org/wiki/%D0%93%D0%BB%D1%83%D0%B1%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5&quot; target=&quot;_blank&quot;&gt;глубинного обучения&lt;/a&gt;&quot;&amp;nbsp;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://keras.io/&quot; target=&quot;_blank&quot;&gt;Keras&lt;/a&gt;&lt;/span&gt;. См. примеры&amp;nbsp;&lt;a href=&quot;https://cran.r-project.org/web/packages/anomalyDetection/vignettes/Introduction.html&quot; target=&quot;_blank&quot;&gt;здесь&lt;/a&gt;.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;Компания Microsoft&amp;nbsp;&lt;a href=&quot;https://blogs.technet.microsoft.com/dataplatforminsider/2017/04/19/introducing-microsoft-r-server-9-1-release/&quot; target=&quot;_blank&quot;&gt;объявила о выпуске&lt;/a&gt;&amp;nbsp;новой версии Microsoft R Server (v9.1).&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/modeval/index.html&quot; target=&quot;_blank&quot;&gt;modeleval&lt;/a&gt;&lt;/span&gt;: набор утилит для&amp;nbsp;&lt;a href=&quot;https://cran.r-project.org/web/packages/modeval/vignettes/modeval.html&quot; target=&quot;_blank&quot;&gt;анализа качества предсказательных моделей&lt;/a&gt;, построенных с помощью пакета&amp;nbsp;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://ranalytics.github.io/data-mining/031-Intro-to-Caret.html&quot; target=&quot;_blank&quot;&gt;caret&lt;/a&gt;&lt;/span&gt;.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;http://readxl.tidyverse.org/&quot; target=&quot;_blank&quot;&gt;readxl&lt;/a&gt;&lt;/span&gt;: как следует из названия, этот пакет предназначен для организации удобной работы с файлами Excel из среды R.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://github.com/eddelbuettel/rinside&quot; target=&quot;_blank&quot;&gt;RInside&lt;/a&gt;&lt;/span&gt;: с помощью этого пакета &lt;a href=&quot;http://dirk.eddelbuettel.com/code/rinside.html&quot; target=&quot;_blank&quot;&gt;можно встраивать&lt;/a&gt; функционал R в приложения, написанные на C++.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://github.com/metrumresearchgroup/sinew&quot; target=&quot;_blank&quot;&gt;Sinew&lt;/a&gt;&lt;/span&gt;: позволяет автоматически создать &quot;скелет&quot; справочного файла для той или иной функции в формате &lt;a href=&quot;https://cran.r-project.org/web/packages/roxygen2/vignettes/roxygen2.html&quot; target=&quot;_blank&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;roxygen2&lt;/span&gt;&lt;/a&gt;, что значительно сэкономит время при разработке новых пакетов для R.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/shinyWidgets/index.html&quot; target=&quot;_blank&quot;&gt;shinyWidgets&lt;/a&gt;&lt;/span&gt;: набор дополнительных виджетов для разработки &lt;a href=&quot;https://shiny.rstudio.com/&quot; target=&quot;_blank&quot;&gt;Shiny&lt;/a&gt;-приложений.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/shinyjqui/index.html&quot; target=&quot;_blank&quot;&gt;shinyjqui&lt;/a&gt;&lt;/span&gt;: с помощью этого пакета можно добавлять &lt;a href=&quot;https://jqueryui.com/&quot; target=&quot;_blank&quot;&gt;jQuery UI&lt;/a&gt;-элементы в Shiny-приложения. Примеры приведены&amp;nbsp;&lt;a href=&quot;https://cran.r-project.org/web/packages/shinyjqui/vignettes/introduction.html&quot; target=&quot;_blank&quot;&gt;здесь&lt;/a&gt; и &lt;a href=&quot;https://cran.r-project.org/web/packages/shinyjqui/vignettes/orderInput.html&quot; target=&quot;_blank&quot;&gt;здесь&lt;/a&gt;.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;a href=&quot;http://blog.fosstrading.com/2017/04/quantmod-0-4-8-on-cran.html&quot; target=&quot;_blank&quot;&gt;Исправлены небольшие ошибки&amp;nbsp;&lt;/a&gt;в популярном пакете&amp;nbsp;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;http://www.quantmod.com/&quot; target=&quot;_blank&quot;&gt;quantmod&lt;/a&gt;&lt;/span&gt;, предназначенном для разработки трейдинговых моделей.&lt;/li&gt;&lt;/ul&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;script async=&quot;&quot; src=&quot;//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js&quot;&gt;&lt;/script&gt;&lt;!-- R Analytics Responsive --&gt;&lt;br /&gt;&lt;ins class=&quot;adsbygoogle&quot; data-ad-client=&quot;ca-pub-6457966355894443&quot; data-ad-format=&quot;auto&quot; data-ad-slot=&quot;8123690788&quot; style=&quot;display: block;&quot;&gt;&lt;/ins&gt;&lt;script&gt;(adsbygoogle = window.adsbygoogle || []).push({}); &lt;/script&gt;</content><link rel='replies' type='text/html' href='http://r-analytics.blogspot.com/2017/05/r-2017.html#comment-form' title='Комментарии: 2'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/1018157782672596300'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/1018157782672596300'/><link rel='alternate' type='text/html' href='http://r-analytics.blogspot.com/2017/05/r-2017.html' title='Обзор интересных R-пакетов за март-апрель 2017 г.'/><author><name>Sergey Mastitsky</name><uri>https://plus.google.com/100743762419147389233</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='32' height='32' src='//lh3.googleusercontent.com/-S7CBBqIIWg0/AAAAAAAAAAI/AAAAAAAAANI/e7vggjNa3Mo/s512-c/photo.jpg'/></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://3.bp.blogspot.com/-SCM-TjGTKKQ/WROITv28r9I/AAAAAAAADM8/dWgZ01RFFNE0m7C6blYWGbLdJ_omGZ1rACLcB/s72-c/cron.png" height="72" width="72"/><thr:total>2</thr:total></entry><entry><id>tag:blogger.com,1999:blog-9120847565867616203.post-1648667655581590013</id><published>2017-04-30T20:53:00.001+01:00</published><updated>2017-04-30T20:55:40.024+01:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="plotly"/><category scheme="http://www.blogger.com/atom/ns#" term="лог-файлы"/><title type='text'>Делимся опытом: визуализация данных из лог-файлов</title><content type='html'>&lt;div style=&quot;text-align: justify;&quot;&gt;Сегодня в рамках рубрики &quot;&lt;a href=&quot;http://r-analytics.blogspot.co.uk/2014/11/r.html&quot; target=&quot;_blank&quot;&gt;Делимся опытом&lt;/a&gt;&quot; мы представляем вашему вниманию небольшую заметку&amp;nbsp;&lt;a href=&quot;https://github.com/Dmitryi&quot; target=&quot;_blank&quot;&gt;Дмитрия Берга&lt;/a&gt;, в которой он рассказывает о визуализации данных из &lt;a href=&quot;https://ru.wikipedia.org/wiki/%D0%A4%D0%B0%D0%B9%D0%BB_%D1%80%D0%B5%D0%B3%D0%B8%D1%81%D1%82%D1%80%D0%B0%D1%86%D0%B8%D0%B8&quot; target=&quot;_blank&quot;&gt;лог-файлов&lt;/a&gt; средствами сервиса &lt;a href=&quot;http://plot.ly/&quot;&gt;plot.ly.&lt;/a&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;/div&gt;&lt;script async=&quot;&quot; src=&quot;//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js&quot;&gt;&lt;/script&gt;&lt;!-- R Analytics Responsive --&gt;&lt;br /&gt;&lt;ins class=&quot;adsbygoogle&quot; data-ad-client=&quot;ca-pub-6457966355894443&quot; data-ad-format=&quot;auto&quot; data-ad-slot=&quot;8123690788&quot; style=&quot;display: block;&quot;&gt;&lt;/ins&gt;&lt;script&gt;(adsbygoogle = window.adsbygoogle || []).push({}); &lt;/script&gt;&lt;br /&gt;&lt;br /&gt;&lt;a name=&#39;more&#39;&gt;&lt;/a&gt;&lt;br /&gt;&lt;div style=&quot;text-align: right;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: right;&quot;&gt;Автор: &lt;i&gt;Дмитрий Берг&lt;/i&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Анализ логов веб-сайтов и других похожих систем - распространенная задача. В Linux это можно сделать из консоли терминала буквально одной строчкой кода, но возвращаемый при этом массив данных только в текстовом формате не позволяет сформировать полную картину о том, что происходит на сервере. Наглядная визуализация данных гораздо лучше помогла бы увидеть динамику изменений на сайте. В этой статье приводятся примеры подобной визуализации.&amp;nbsp;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Прежде чем продолжить, сделаю несколько комментариев:&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;/div&gt;&lt;ul&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;Для визуализациии я использую сервис &lt;a href=&quot;http://plot.ly/&quot;&gt;plot.ly&lt;/a&gt;, и вся полученная инфографика будет экспортироваться на их платформу. Безусловно, существуют альтернативные варианты размещения и сохранения созданных графиков, но, как мне кажется, этот сервис и соответствующий R-интерфейс к нему (&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;plotly&lt;/span&gt;) особенно удобны.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;Для подготовки данных я применяю пакет &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;data.table&lt;/span&gt;.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;Спецификация моей системы: R - версия 3.3.2 (2016-10-31) - &quot;Sincere Pumpkin Patch&quot;, RStudio - версия 1.0.136, ОС - Fеdora x86_64.&lt;/li&gt;&lt;/ul&gt;&lt;div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;1. В качестве первого шага подключаем необходимые пакеты:&lt;/div&gt;&lt;div&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;library(&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;plotly&quot;&lt;/span&gt;)&lt;br /&gt;library(&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;devtools&quot;&lt;/span&gt;)&lt;br /&gt;library(&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;data.table&quot;&lt;/span&gt;)&lt;br /&gt;library(&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;RCurl&quot;&lt;/span&gt;)&lt;br /&gt;library(&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;XML&quot;&lt;/span&gt;)&lt;br /&gt;&lt;/pre&gt;&lt;br /&gt;&lt;/div&gt;&lt;/div&gt;&lt;div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;2. Данные для воспроизведения рассматриваемого примера можно скачать по следующей ссылке:&amp;nbsp;&lt;a href=&quot;https://yadi.sk/d/TCGocq0K3ECZfH&quot;&gt;https://yadi.sk/d/TCGocq0K3ECZfH&lt;/a&gt;. В общем же случае, когда сервер сайта имеет адрес формата &quot;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;ftp://server/hosting/&lt;/span&gt;&quot;, для скачивания логов можно выполнить примерно следующие команды:&lt;/div&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;url &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;ftp://server/hosting/&#39;&lt;/span&gt; &lt;span style=&quot;color: #406040;&quot;&gt;# Через ftp подключаемся к серверу сайта&lt;/span&gt;&lt;br /&gt;userpwd &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;Логин:Пароль&quot;&lt;/span&gt;      &lt;span style=&quot;color: #406040;&quot;&gt;# Вводим логин и пароль&lt;/span&gt;&lt;br /&gt;filenames &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; getURL(url, userpwd &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; userpwd, ftp.use.epsv &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; TRUE, &lt;br /&gt;           dirlistonly &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; TRUE) &lt;span style=&quot;color: #406040;&quot;&gt;# Отправляем запрос на наличие файлов&lt;/span&gt;&lt;br /&gt;filenames                      &lt;span style=&quot;color: #406040;&quot;&gt;# Просматриваем список найденных файлов&lt;/span&gt;&lt;br /&gt;&lt;/pre&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Далее необходимо скачать обнаруженные лог-файлы с расширением &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;.log&lt;/span&gt;. Из терминала Linux или OSX это можно сделать с помощью следующих команд:&lt;/div&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;curl -u логиг:пароль -O ftp://server/hosting/access_file1.log&lt;br /&gt;curl -u логиг:пароль -O ftp://server/hosting/access_file2.log&lt;br /&gt;&lt;/pre&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;3.&amp;nbsp;Переходим к обработке данных. Как видите, моя стратегия заключается в том, чтобы сначала обработать каждую таблицу по отдельности, и только на заключительном этапе обьединить их в одну большую таблицу. Эта стратегия вызвана тем, что дальше при желании можно построить отдельные графики для каждой таблицы.&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Сохраняем данные в таблицы:&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;f1 &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; read.table(&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;access.file1.log&quot;&lt;/span&gt;)&lt;span style=&quot;color: #406040;&quot;&gt; &lt;/span&gt;&lt;br /&gt;f2 &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; read.table(&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;access.file2.log&quot;&lt;/span&gt;)&lt;br /&gt;&lt;/pre&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;При необходимости, удаляем пустые столбцы (в моем случае оказалось два столбца):&lt;br /&gt;&lt;br /&gt;&lt;pre style=&quot;background: rgb(241, 241, 241);&quot;&gt;&lt;span style=&quot;color: black;&quot;&gt;f1&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;V3 &lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; NULL&lt;br /&gt;f1&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;V4 &amp;lt;- NULL&lt;br /&gt;&lt;/pre&gt;&lt;br /&gt;В некоторых столбцах пришлось изменить формат:&lt;br /&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;f1&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;V5 &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; as.POSIXct(strptime(&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;2017-01-27&quot;&lt;/span&gt;, &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;%Y-%m-%d&quot;&lt;/span&gt;))&lt;br /&gt;f2&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;V5 &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; as.POSIXct(strptime(&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;2017-01-26&quot;&lt;/span&gt;, &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;%Y-%m-%d&quot;&lt;/span&gt;))&lt;br /&gt;f1&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;V8 &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; as.numeric(df&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;V8)&lt;br /&gt;f1&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;V2 &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; as.character.numeric_version(df&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;V2)&lt;br /&gt;&lt;/pre&gt;&lt;br /&gt;Обьединяем таблицы в одну общую:&lt;br /&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;df &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; merge(f1,f2, all &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; TRUE)&lt;br /&gt;&lt;/pre&gt;&lt;br /&gt;Переименуем названия столбцов на более осмысленные:&lt;br /&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;colnames(df) &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; c(&lt;span style=&quot;color: #c03030;&quot;&gt;&#39;host&#39;&lt;/span&gt;, &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;ip&#39;&lt;/span&gt;, &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;date&#39;&lt;/span&gt;, &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;method&#39;&lt;/span&gt;,&lt;br /&gt;                  &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;bit&#39;&lt;/span&gt;, &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;referer&#39;&lt;/span&gt;, &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;useragent&#39;&lt;/span&gt;)&lt;br /&gt;&lt;/pre&gt;&lt;br /&gt;Просмотрим структуру таблицы:&lt;br /&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;str(df)&lt;br /&gt;&lt;/pre&gt;&lt;br /&gt;На этом подготовка данных завершена. Переходим к их визуализации.&lt;br /&gt;&lt;br /&gt;4. Создадим два графика одновременно. На левом графике мы увидим, с каких IP адресов было выполнено обращение к тем или иным внутренним ресурсам, а на правом - распределение объема данных (в байтах), переданных клиентам/посетителям сайта.&lt;br /&gt;&lt;br /&gt;&lt;pre style=&quot;background: rgb(241, 241, 241);&quot;&gt;p1 &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; plot_ly(x &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;~&lt;/span&gt;df&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;ip, y &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;~&lt;/span&gt;df&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;referer) %&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;gt;&lt;/span&gt;%&lt;br /&gt;      add_markers(name &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;refer/ip&quot;&lt;/span&gt;)&lt;br /&gt;p2 &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; plot_ly(x &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;~&lt;/span&gt;df&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;useragent, y &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;~&lt;/span&gt;df&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;bit) %&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;gt;&lt;/span&gt;%&lt;br /&gt;      add_markers(name &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;~&lt;/span&gt;&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;useragent/bit&quot;&lt;/span&gt;)&lt;br /&gt;p3 &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; subplot(p1, p2)&lt;br /&gt;&lt;/pre&gt;&lt;br /&gt;Отправляем график в свой профиль на сервисе plot.ly (вводить логин и пароль достаточно только один раз - для этого задаются соответствующие глобальные системные переменные с помощью команды&amp;nbsp;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;Sys.setenv()&lt;/span&gt;):&lt;br /&gt;&lt;br /&gt;&lt;pre style=&quot;background: rgb(241, 241, 241);&quot;&gt;Sys.setenv(&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;plotly_username&quot;&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;Логин&quot;&lt;/span&gt;)          &lt;span style=&quot;color: #406040;&quot;&gt;# Вводим логин (имя) plot.ly&lt;/span&gt;&lt;br /&gt;Sys.setenv(&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;plotly_api_key&quot;&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;API KEY&quot;&lt;/span&gt;)         &lt;span style=&quot;color: #406040;&quot;&gt;# Вводим ключ API plot.ly&lt;/span&gt;&lt;br /&gt;plotly_POST(p3, &lt;/pre&gt;&lt;pre style=&quot;background: rgb(241, 241, 241);&quot;&gt;            filename &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;ip-refer-useragent-bit&quot;&lt;/span&gt;) &lt;span style=&quot;color: #406040;&quot;&gt;# Отправляем в личный профиль на plot.ly&lt;/span&gt;&lt;br /&gt;&lt;/pre&gt;&lt;br /&gt;Полученная интерактивная диаграмма выглядит следующим образом (см. также &lt;a href=&quot;https://plot.ly/~Dmitryi/205/?share_key=PX35kkdTkAqfsg9ooAqaUX&quot; target=&quot;_blank&quot;&gt;здесь&lt;/a&gt;):&lt;br /&gt;&lt;br /&gt;&lt;iframe frameborder=&quot;0&quot; height=&quot;800&quot; scrolling=&quot;no&quot; src=&quot;//plot.ly/~Dmitryi/205.embed&quot; width=&quot;620&quot;&gt;&lt;/iframe&gt; &lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Теперь создадим 3D график, который покажет нам, какие клиенты (посетители сайта) c уникальным IP адресом получили ответ от сервера, и каков был объем переданных данных:&lt;br /&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;p &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; plot_ly(df, x &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;~&lt;/span&gt;ip, y &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;~&lt;/span&gt;useragent, z &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;~&lt;/span&gt;bit, &lt;br /&gt;             marker &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #a08000;&quot;&gt;list&lt;/span&gt;(color &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;~&lt;/span&gt;bit, &lt;br /&gt;                           colorscale &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; c(&lt;span style=&quot;color: #c03030;&quot;&gt;&#39;#ffc2c6&#39;&lt;/span&gt;, &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;#480607&#39;&lt;/span&gt;), &lt;br /&gt;                           size &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt;, showscale &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; TRUE)) %&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;gt;&lt;/span&gt;%&lt;br /&gt;  add_markers() %&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;gt;&lt;/span&gt;%&lt;br /&gt;  layout(scene &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #a08000;&quot;&gt;list&lt;/span&gt;(xaxis &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #a08000;&quot;&gt;list&lt;/span&gt;(title &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;IP&#39;&lt;/span&gt;),&lt;br /&gt;                      yaxis &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #a08000;&quot;&gt;list&lt;/span&gt;(title &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;User Agent&#39;&lt;/span&gt;),&lt;br /&gt;                      zaxis &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #a08000;&quot;&gt;list&lt;/span&gt;(title &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;Bite&#39;&lt;/span&gt;)),&lt;br /&gt;         annotations &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #a08000;&quot;&gt;list&lt;/span&gt;(&lt;br /&gt;           x &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1.13&lt;/span&gt;,&lt;br /&gt;           y &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1.05&lt;/span&gt;,&lt;br /&gt;           text &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;Bite&#39;&lt;/span&gt;,&lt;br /&gt;           xref &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;paper&#39;&lt;/span&gt;,&lt;br /&gt;           yref &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;paper&#39;&lt;/span&gt;,&lt;br /&gt;           showarrow &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; FALSE&lt;br /&gt;         ))&lt;br /&gt;&lt;/pre&gt;&lt;br /&gt;&lt;br /&gt;Отправляем график на платформу plot.ly:&lt;br /&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;plotly_POST(p, filename &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;ip-useragent-bit&quot;&lt;/span&gt;)&lt;br /&gt;&lt;/pre&gt;&lt;br /&gt;Результат выглядит так (см. также &lt;a href=&quot;https://plot.ly/~Dmitryi/201/?share_key=OiUEY90RScnlglNUnclXra&quot; target=&quot;_blank&quot;&gt;здесь&lt;/a&gt;):&lt;br /&gt;&lt;br /&gt;&lt;iframe frameborder=&quot;0&quot; height=&quot;700&quot; scrolling=&quot;no&quot; src=&quot;//plot.ly/~Dmitryi/201.embed&quot; width=&quot;620&quot;&gt;&lt;/iframe&gt; &lt;br /&gt;&lt;br /&gt;Скачать файл с полным кодом для воспроизведения приведенных выше примеров можно из моего &lt;a href=&quot;https://github.com/Dmitryi/Infographics/blob/Dmitryi-patch-1/analytics_logs_foles&quot; target=&quot;_blank&quot;&gt;GitHub-репозитория&lt;/a&gt;.&lt;/div&gt;&lt;/div&gt;</content><link rel='replies' type='text/html' href='http://r-analytics.blogspot.com/2017/04/blog-post.html#comment-form' title='Комментарии: 2'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/1648667655581590013'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/1648667655581590013'/><link rel='alternate' type='text/html' href='http://r-analytics.blogspot.com/2017/04/blog-post.html' title='Делимся опытом: визуализация данных из лог-файлов'/><author><name>Sergey Mastitsky</name><uri>https://plus.google.com/100743762419147389233</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='32' height='32' src='//lh3.googleusercontent.com/-S7CBBqIIWg0/AAAAAAAAAAI/AAAAAAAAANI/e7vggjNa3Mo/s512-c/photo.jpg'/></author><thr:total>2</thr:total></entry><entry><id>tag:blogger.com,1999:blog-9120847565867616203.post-8428359752157465776</id><published>2017-04-07T11:09:00.000+01:00</published><updated>2017-04-07T11:33:17.009+01:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="R-события"/><category scheme="http://www.blogger.com/atom/ns#" term="книги"/><title type='text'>Новая книга по R: &quot;Классификация, регрессия и другие алгоритмы Data Mining с использованием R&quot;</title><content type='html'>&lt;div&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;a href=&quot;https://3.bp.blogspot.com/-FghUG3L5rdc/WOdqx-tePuI/AAAAAAAADMU/x8RecW_U4HE8qZJl4A8oiO-qL8EjM7MBQCLcB/s1600/cover_page.PNG&quot; imageanchor=&quot;1&quot; style=&quot;clear: left; float: left; margin-bottom: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; height=&quot;320&quot; src=&quot;https://3.bp.blogspot.com/-FghUG3L5rdc/WOdqx-tePuI/AAAAAAAADMU/x8RecW_U4HE8qZJl4A8oiO-qL8EjM7MBQCLcB/s320/cover_page.PNG&quot; width=&quot;233&quot; /&gt;&lt;/a&gt;&lt;/div&gt;Друзья!&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Владимир Кириллович и я рады представить вашему вниманию новый результат нашей совместной работы - книгу &quot;&lt;i&gt;Классификация, регрессия и другие алгоритмы Data Mining с использованием R&lt;/i&gt;&quot;.&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;В книге рассмотрена широкая совокупность методов построения статистических моделей классификации и регрессии для откликов, измеренных в альтернативной, категориальной и метрической шкалах. Подробно рассматриваются деревья решений, машины опорных векторов с различными разделяющими поверхностями, нелинейные формы дискриминантного анализа, искусственные нейронные сети и т.д. Показана технология применения таких методов бутстреп-агрегирования деревьев решений, как бэггинг, случайный лес и бустинг. Представлены различные методы построения ансамблей моделей для коллективного прогнозирования. Особое внимание уделяется сравнительной оценке эффективности и поиску оптимальных областей значений гиперпараметров моделей с использованием пакета &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;caret&lt;/span&gt;. Рассматриваются такие алгоритмы Data Mining, как генерация ассоциативных правил и анализ последовательностей. Отдельная глава посвящена методам многомерной ординации данных и различным алгоритмам кластерного анализа.&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Описание указанных методов сопровождается многочисленными примерами из различных областей на основе общедоступных исходных данных. Представлены несложные скрипты на языке R, дающие возможность читателю легко воспроизвести все расчеты.&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Книга может быть использована в качестве учебного пособия по статистическим методам для студентов и аспирантов высших учебных заведений.&lt;/div&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Книга распространяется совершенно бесплатно. Ее PDF-версию и соответствующие приложения можно скачать по следующим двум официальным адресам:&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;ul&gt;&lt;li&gt;GitHub-репозиторий:&amp;nbsp;&lt;i&gt;&lt;a href=&quot;https://github.com/ranalytics/data-mining&quot;&gt;https://github.com/ranalytics/data-mining&lt;/a&gt;&lt;/i&gt;&lt;/li&gt;&lt;li&gt;Сайт Института экологии Волжского бассейна:&amp;nbsp;&lt;i&gt;&lt;a href=&quot;http://www.ievbras.ru/ecostat/Kiril/R/DM/&quot;&gt;http://www.ievbras.ru/ecostat/Kiril/R/DM/&lt;/a&gt;&lt;/i&gt;&lt;/li&gt;&lt;/ul&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Кроме того, книга опубликована в виде отдельного сайта по адресу:&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: center;&quot;&gt;&lt;i&gt;&lt;a href=&quot;https://ranalytics.github.io/data-mining/&quot;&gt;https://ranalytics.github.io/data-mining/&lt;/a&gt;&lt;/i&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;В ближайшее время мы планируем выложить также EPUB- и MOBI-версии, предназначенные для чтения на соответствующих электронных устройствах.&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;div&gt;Мы будем благодарны за любые ваши замечания и пожелания касательно этой работы - отправляйте их, пожалуйста, по электронной почте &lt;i&gt;stok1946[&quot;собака&quot;]gmail.com&lt;/i&gt; и/или &lt;i&gt;rtutorialsbook[&quot;собака&quot;]gmail.com&lt;/i&gt;&lt;/div&gt;&lt;div&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: right;&quot;&gt;&lt;i&gt;Сергей Мастицкий, Владимир Шитиков&lt;/i&gt;&lt;/div&gt;&lt;div style=&quot;text-align: right;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: right;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div&gt;&lt;br /&gt;&lt;/div&gt;&lt;div&gt;P.S.: Как отмечено выше, книга распространяется бесплатно. Однако если она окажется вам полезной и вы сочтете уместным отблагодарить авторов за их работу, вы можете перечислить любую сумму, воспользовавшись следующей кнопкой (все транзакции выполняются в безопасном режиме через систему электронных платежей PayPal; наличие у вас аккаунта в этой системе необязательно):&lt;/div&gt;&lt;div&gt;&lt;br /&gt;&lt;/div&gt;&lt;div&gt;&lt;br /&gt;&lt;/div&gt;&lt;center&gt;&lt;form action=&quot;https://www.paypal.com/cgi-bin/webscr&quot; method=&quot;post&quot; target=&quot;_top&quot;&gt;&lt;input name=&quot;cmd&quot; type=&quot;hidden&quot; value=&quot;_s-xclick&quot; /&gt;&lt;input name=&quot;hosted_button_id&quot; type=&quot;hidden&quot; value=&quot;S4PUCGVTAYUBE&quot; /&gt;&lt;input alt=&quot;PayPal — более безопасный и легкий способ оплаты через Интернет!&quot; border=&quot;0&quot; name=&quot;submit&quot; src=&quot;https://s3-eu-west-1.amazonaws.com/public-links-and-html-elements/thanks_button.png&quot; type=&quot;image&quot; /&gt;&lt;img alt=&quot;&quot; border=&quot;0&quot; height=&quot;1&quot; src=&quot;https://www.paypalobjects.com/en_GB/i/scr/pixel.gif&quot; width=&quot;1&quot; /&gt;&lt;/form&gt;&lt;/center&gt;&lt;div&gt;&lt;br /&gt;&lt;/div&gt;&lt;/div&gt;</content><link rel='replies' type='text/html' href='http://r-analytics.blogspot.com/2017/04/r-data-mining-r.html#comment-form' title='Комментарии: 10'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/8428359752157465776'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/8428359752157465776'/><link rel='alternate' type='text/html' href='http://r-analytics.blogspot.com/2017/04/r-data-mining-r.html' title='Новая книга по R: &quot;Классификация, регрессия и другие алгоритмы Data Mining с использованием R&quot;'/><author><name>Sergey Mastitsky</name><uri>https://plus.google.com/100743762419147389233</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='32' height='32' src='//lh3.googleusercontent.com/-S7CBBqIIWg0/AAAAAAAAAAI/AAAAAAAAANI/e7vggjNa3Mo/s512-c/photo.jpg'/></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://3.bp.blogspot.com/-FghUG3L5rdc/WOdqx-tePuI/AAAAAAAADMU/x8RecW_U4HE8qZJl4A8oiO-qL8EjM7MBQCLcB/s72-c/cover_page.PNG" height="72" width="72"/><thr:total>10</thr:total></entry><entry><id>tag:blogger.com,1999:blog-9120847565867616203.post-6224115173991365600</id><published>2017-02-12T14:03:00.000+00:00</published><updated>2017-02-25T17:20:14.072+00:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="caret"/><category scheme="http://www.blogger.com/atom/ns#" term="rpart"/><category scheme="http://www.blogger.com/atom/ns#" term="train"/><category scheme="http://www.blogger.com/atom/ns#" term="деревья решений"/><title type='text'>Построение деревьев регрессии</title><content type='html'>&lt;div dir=&quot;ltr&quot; style=&quot;text-align: left;&quot; trbidi=&quot;on&quot;&gt;&lt;div style=&quot;text-align: right;&quot;&gt;Автор: &lt;i&gt;Владимир Шитиков&lt;/i&gt;&lt;/div&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;В одном из &lt;a href=&quot;http://r-analytics.blogspot.co.uk/2016/05/i.html&quot; target=&quot;_blank&quot;&gt;предыдущих сообщений&lt;/a&gt; были определены основные понятия, преимущества и недостатки деревьев классификации и регрессии, которые являются одним из наиболее популярных методов решения многих практических задач (Breiman at al., 1984; Quinlan, 1986). По своей сути деревья используют &quot;наивный подход&quot; (&lt;i&gt;naive approach&lt;/i&gt;) в том смысле, что исходят из предположения о взаимной независимости признаков. Поэтому модели регрессионных деревьев статистически наиболее работоспособны, когда &lt;a href=&quot;http://r-analytics.blogspot.co.uk/2012/07/blog-post.html&quot; target=&quot;_blank&quot;&gt;мультиколлинеарность&lt;/a&gt; в комплексе анализируемых переменных выражена незначительно.&lt;br /&gt;&lt;br /&gt;&lt;script async=&quot;&quot; src=&quot;//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js&quot;&gt;&lt;/script&gt;&lt;!-- R Analytics Responsive --&gt;&lt;br /&gt;&lt;ins class=&quot;adsbygoogle&quot; data-ad-client=&quot;ca-pub-6457966355894443&quot; data-ad-format=&quot;auto&quot; data-ad-slot=&quot;8123690788&quot; style=&quot;display: block;&quot;&gt;&lt;/ins&gt;&lt;script&gt;(adsbygoogle = window.adsbygoogle || []).push({}); &lt;/script&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;a name=&#39;more&#39;&gt;&lt;/a&gt;Алгоритм CART (&lt;i&gt;&lt;a href=&quot;https://en.wikipedia.org/wiki/Decision_tree_learning&quot; target=&quot;_blank&quot;&gt;Classification and Regression Trees&lt;/a&gt;&lt;/i&gt;) рекурсивно делит исходный набор данных на подмножества, которые становятся все более и более гомогенными относительно определенных признаков, в результате чего формируется древовидная иерархическая структура. Деление осуществляется на основе традиционных логических правил вида &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&quot;&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;ЕСЛИ (А) ТО (В)&quot;&lt;/span&gt;, где &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;А&lt;/span&gt; - некоторое логическое условие, а &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;В&lt;/span&gt; - процедура разбиения подмножества на две части, для одной из которых условие &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;А&lt;/span&gt; истинно, а для другой - ложно. Примеры условий: &lt;i style=&quot;mso-bidi-font-style: normal;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;times new roman&amp;quot;; font-size: 12.0pt; line-height: 115%;&quot;&gt;X&lt;/span&gt;&lt;sub&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;font-family: &amp;quot;times new roman&amp;quot;; font-size: 12.0pt; line-height: 115%;&quot;&gt;i&lt;/span&gt;&lt;/sub&gt;&lt;/i&gt; == &lt;i&gt;F&lt;/i&gt;, &lt;i style=&quot;mso-bidi-font-style: normal;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;times new roman&amp;quot;; font-size: 12.0pt; line-height: 115%;&quot;&gt;X&lt;/span&gt;&lt;sub&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;font-family: &amp;quot;times new roman&amp;quot;; font-size: 12.0pt; line-height: 115%;&quot;&gt;i&lt;/span&gt;&lt;/sub&gt;&lt;/i&gt; &amp;lt;= &lt;i&gt;V&lt;/i&gt;; &lt;i style=&quot;mso-bidi-font-style: normal;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;times new roman&amp;quot;; font-size: 12.0pt; line-height: 115%;&quot;&gt;X&lt;/span&gt;&lt;sub&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;font-family: &amp;quot;times new roman&amp;quot;; font-size: 12.0pt; line-height: 115%;&quot;&gt;i&lt;/span&gt;&lt;/sub&gt;&lt;/i&gt; &amp;gt;= &lt;i&gt;V&lt;/i&gt; и др., где &lt;i style=&quot;mso-bidi-font-style: normal;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;times new roman&amp;quot;; font-size: 12.0pt; line-height: 115%;&quot;&gt;X&lt;/span&gt;&lt;sub&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;font-family: &amp;quot;times new roman&amp;quot;; font-size: 12.0pt; line-height: 115%;&quot;&gt;i&lt;/span&gt;&lt;/sub&gt;&lt;/i&gt;  - один из предикторов, &lt;i&gt;F &lt;/i&gt;- выбранное значение категориальной переменной, &lt;i&gt;V&lt;/i&gt; - специально подобранное опорное значение (порог) количественной переменной.&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;На первой итерации корневой узел дерева связывается с наиболее оптимальным условным суждением, и все множество объектов разбивается на две группы. От каждого последующего узла-родителя к узлам-потомкам также может отходить по две ветви, в свою очередь связанные c граничными значениями других наиболее подходящих переменных и определяющие правила дальнейшего разбиения (&lt;i&gt;splitting criteria&lt;/i&gt;). Конечные узлы (&lt;i&gt;terminal nodes&lt;/i&gt;) дерева (также известны как &quot;листья&quot;, &lt;i&gt;leaves&lt;/i&gt;) представлены совокупностями наблюдений из обучающей выборки, полученными в результате проверки всех предыдущих условных суждений. Общее правило выбора опорного значения для каждого узла построенного дерева можно сформулировать следующим образом: &quot;выбранный признак должен разбить множество&amp;nbsp;&lt;b&gt;&lt;i&gt;Х&lt;/i&gt;&lt;/b&gt;* так, чтобы получаемые в итоге подмножества&amp;nbsp; &lt;b&gt;&lt;i&gt;Х&lt;/i&gt;&lt;/b&gt;*&lt;i&gt;k&lt;/i&gt;,&amp;nbsp;&lt;i&gt;k&lt;/i&gt; = 1, 2, ..., &lt;i&gt;p&lt;/i&gt;, состояли из наблюдений, принадлежащих к одному классу, или были максимально приближены к этому&quot;.&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Описанный процесс относится к так называемым &quot;жадным&quot; алгоритмам, стремящимся построить максимально &quot;кустистое&quot; дерево (также &quot;глубокое дерево&quot;, &lt;i&gt;deep tree&lt;/i&gt;). Естественно, чем &quot;кустистее&quot; дерево, тем лучше будут результаты его тестирования на &lt;i&gt;обучающей&lt;/i&gt; выборке, и, скорее всего, хуже - на незнакомых наблюдениях. Поэтому построенная модель должна быть еще и оптимальной по размерам, т.е. содержать информацию, улучшающую качество прогноза, и игнорировать ту информацию, которая его не улучшает. Для этого обычно проводят &quot;обрезание&quot; дерева (&lt;i&gt;tree pruning&lt;/i&gt;) - отсечение ветвей там, где эта процедура не приводит к серьезному возрастанию ошибки.&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Невозможно подобрать объективный внутренний критерий, приводящий к хорошему компромиссу между безошибочностью и компактностью модели, поэтому стандартный механизм оптимизации деревьев основан на перекрестной проверке (Loh &amp;amp; Shih, 1997).&amp;nbsp; Для этого обучающая выборка разделяется, например, на 10 равных частей: 9 частей используются для построения дерева, а оставшаяся часть играет роль проверочной выборки. После многократного повторения этой процедуры из некоторого набора деревьев-претендентов с приемлемым (для решаемой задачи) разбросом значений того или иного критерия качества модели, выбирается дерево, показавшее наилучший результат в ходе перекрестной проверки.&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Существует несколько алгоритмов построения деревьев, основанных на различной логике и критериях оптимизации. Функция &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;rpart()&lt;/span&gt; из одноименного пакета выполняет рекурсивный выбор для каждого следующего узла таких опорных значений, которые приводят к минимальной сумме квадратов внутригрупповых отклонений&amp;nbsp;&lt;i style=&quot;mso-bidi-font-style: normal;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;times new roman&amp;quot;; font-size: 12.0pt; line-height: 115%;&quot;&gt;D&lt;sub&gt;t&lt;/sub&gt;&lt;/span&gt;&lt;/i&gt; для всех &lt;i&gt;t&amp;nbsp;&lt;/i&gt;узлов дерева. Для оценки качества построенного дерева &lt;b&gt;&lt;i&gt;T&lt;/i&gt;&lt;/b&gt; в ходе его оптимизации используется следующая совокупность критериев:&lt;/div&gt;&lt;ul style=&quot;text-align: left;&quot;&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;i&gt;СС&lt;/i&gt;(&lt;b&gt;&lt;i&gt;T&lt;/i&gt;&lt;/b&gt;) =&amp;nbsp;&lt;span style=&quot;font-size: medium;&quot;&gt;&lt;b&gt;Σ&lt;/b&gt;(&lt;/span&gt;&lt;i style=&quot;mso-bidi-font-style: normal;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;times new roman&amp;quot;; font-size: 12.0pt; line-height: 115%;&quot;&gt;D&lt;sub&gt;t&lt;/sub&gt;&lt;/span&gt;&lt;/i&gt;&amp;nbsp; + λ&lt;i&gt;t&lt;/i&gt;) &amp;nbsp;-&amp;nbsp; штраф на сложность модели (&lt;i&gt;cost complexity&lt;/i&gt;), включающий штрафной множитель λ за каждую неотсечённую ветвь;&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;!--[if gte mso 9]&gt;&lt;xml&gt; &lt;w:LatentStyles DefLockedState=&quot;false&quot; LatentStyleCount=&quot;156&quot;&gt; &lt;/w:LatentStyles&gt;&lt;/xml&gt;&lt;![endif]--&gt;&lt;!--[if gte mso 10]&gt;&lt;style&gt; /* Style Definitions */  table.MsoNormalTable  {mso-style-name:&quot;Обычная таблица&quot;;  mso-tstyle-rowband-size:0;  mso-tstyle-colband-size:0;  mso-style-noshow:yes;  mso-style-parent:&quot;&quot;;  mso-padding-alt:0cm 5.4pt 0cm 5.4pt;  mso-para-margin:0cm;  mso-para-margin-bottom:.0001pt;  mso-pagination:widow-orphan;  font-size:10.0pt;  font-family:&quot;Times New Roman&quot;;  mso-ansi-language:#0400;  mso-fareast-language:#0400;  mso-bidi-language:#0400;} &lt;/style&gt;&lt;![endif]--&gt;&lt;i style=&quot;mso-bidi-font-style: normal;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;times new roman&amp;quot;; font-size: 12.0pt; line-height: 115%;&quot;&gt;D&lt;/span&gt;&lt;/i&gt;&lt;sub&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;times new roman&amp;quot;; font-size: x-small; line-height: 115%;&quot;&gt;0&lt;/span&gt;&lt;/sub&gt;&amp;nbsp; -&amp;nbsp; девианс для нулевого дерева (т.е. оценка разброса в исходных данных);&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;i&gt;C&lt;/i&gt;&lt;span style=&quot;font-size: x-small;&quot;&gt;&lt;i&gt;p&lt;/i&gt;&lt;/span&gt; = λ/&lt;i style=&quot;mso-bidi-font-style: normal;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;times new roman&amp;quot;; font-size: 12.0pt; line-height: 115%;&quot;&gt;D&lt;/span&gt;&lt;/i&gt;&lt;sub&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;times new roman&amp;quot;; font-size: 12.0pt; line-height: 115%;&quot;&gt;0&lt;/span&gt;&lt;/sub&gt;&amp;nbsp; - относительный штраф на сложность модели (также известен как &quot;статистика Мэллоу&quot;, &lt;i&gt;&lt;a href=&quot;https://en.wikipedia.org/wiki/Mallows&#39;s_Cp&quot; target=&quot;_blank&quot;&gt;Mallow&#39;s C&lt;span style=&quot;font-size: x-small;&quot;&gt;p&lt;/span&gt;&lt;/a&gt;&lt;/i&gt;);&lt;i style=&quot;mso-bidi-font-style: normal;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;times new roman&amp;quot;; font-size: 12.0pt; line-height: 115%;&quot;&gt;&amp;nbsp;&lt;/span&gt;&lt;/i&gt;&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;i style=&quot;mso-bidi-font-style: normal;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;times new roman&amp;quot;; font-size: 12.0pt; line-height: 115%;&quot;&gt;REL&lt;sub&gt;er&lt;/sub&gt;&lt;/span&gt;&lt;/i&gt; =&amp;nbsp; &lt;span style=&quot;font-size: medium;&quot;&gt;&lt;b&gt;Σ&lt;/b&gt;&lt;/span&gt;&lt;i style=&quot;mso-bidi-font-style: normal;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;times new roman&amp;quot;; font-size: 12.0pt; line-height: 115%;&quot;&gt;D&lt;sub&gt;t&lt;/sub&gt;&lt;/span&gt;&lt;/i&gt; /&lt;i style=&quot;mso-bidi-font-style: normal;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;times new roman&amp;quot;; font-size: 12.0pt; line-height: 115%;&quot;&gt;D&lt;/span&gt;&lt;/i&gt;&lt;sub&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;times new roman&amp;quot;; font-size: x-small; line-height: 115%;&quot;&gt;0&lt;/span&gt;&lt;/sub&gt;&amp;nbsp; - относительная ошибка обучения для дерева из &lt;i&gt;t&lt;/i&gt; узлов;&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;!--[if gte mso 9]&gt;&lt;xml&gt; &lt;w:LatentStyles DefLockedState=&quot;false&quot; LatentStyleCount=&quot;156&quot;&gt; &lt;/w:LatentStyles&gt;&lt;/xml&gt;&lt;![endif]--&gt;&lt;!--[if gte mso 10]&gt;&lt;style&gt; /* Style Definitions */  table.MsoNormalTable  {mso-style-name:&quot;Обычная таблица&quot;;  mso-tstyle-rowband-size:0;  mso-tstyle-colband-size:0;  mso-style-noshow:yes;  mso-style-parent:&quot;&quot;;  mso-padding-alt:0cm 5.4pt 0cm 5.4pt;  mso-para-margin:0cm;  mso-para-margin-bottom:.0001pt;  mso-pagination:widow-orphan;  font-size:10.0pt;  font-family:&quot;Times New Roman&quot;;  mso-ansi-language:#0400;  mso-fareast-language:#0400;  mso-bidi-language:#0400;} &lt;/style&gt;&lt;![endif]--&gt;&lt;i style=&quot;mso-bidi-font-style: normal;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;times new roman&amp;quot;; font-size: 12.0pt; line-height: 115%;&quot;&gt;CV&lt;sub&gt;er&lt;/sub&gt;&lt;/span&gt;&lt;/i&gt;&amp;nbsp; - ошибка перекрестной проверки (например, с разбиением на 10 блоков), также отнесенная к девиансу нуль-модели&amp;nbsp;&lt;i style=&quot;mso-bidi-font-style: normal;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;times new roman&amp;quot;; font-size: 12.0pt; line-height: 115%;&quot;&gt;D&lt;/span&gt;&lt;/i&gt;&lt;sub&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;times new roman&amp;quot;; font-size: x-small; line-height: 115%;&quot;&gt;0&lt;/span&gt;&lt;/sub&gt;. Как правило&amp;nbsp;&lt;i style=&quot;mso-bidi-font-style: normal;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;times new roman&amp;quot;; font-size: 12.0pt; line-height: 115%;&quot;&gt;CV&lt;sub&gt;er&amp;nbsp;&lt;/sub&gt;&lt;/span&gt;&lt;/i&gt;больше, чем &lt;i style=&quot;mso-bidi-font-style: normal;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;times new roman&amp;quot;; font-size: 12.0pt; line-height: 115%;&quot;&gt;REL&lt;sub&gt;er&lt;/sub&gt;&lt;/span&gt;&lt;/i&gt;;&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;i&gt;SE&lt;/i&gt;&amp;nbsp; - стандартное отклонение для ошибки перекрестной проверки.&lt;/li&gt;&lt;/ul&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Оптимальным обычно считается дерево, состоящее из такого количества ветвей &lt;i&gt;t&lt;/i&gt;, для которого сумма (&lt;i style=&quot;mso-bidi-font-style: normal;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;times new roman&amp;quot;; font-size: 12.0pt; line-height: 115%;&quot;&gt;CV&lt;sub&gt;er&lt;/sub&gt;&lt;/span&gt;&lt;/i&gt; +&amp;nbsp; &lt;i&gt;SE&lt;/i&gt;) является минимальной.&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;В качестве примера рассмотрим построение дерева CART, прогнозирующего обилие водорослей группы &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;a1&lt;/span&gt; в зависимости от гидрохимических показателей воды и условий отбора проб в различных водотоках (см. описание этих данных в &lt;a href=&quot;http://r-analytics.blogspot.co.uk/2017/01/blog-post.html&quot; target=&quot;_blank&quot;&gt;сообщении&lt;/a&gt;, посвященном алгоритмам восстановления пропущенных значений). Сначала воспользуемся пакетом&amp;nbsp;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;rpart&lt;/span&gt;. Обычно при построении деревьев регрессии применяется двухшаговая процедура: функция &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;rpart()&lt;/span&gt; устанавливает связи между зависимой и независимыми переменными и формирует бинарное дерево, а функция &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;prun()&lt;/span&gt;&lt;span style=&quot;font-family: inherit;&quot;&gt; &lt;/span&gt;выполняет обрезание лишних ветвей:&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;library(DMwR)&lt;br /&gt;library(rpart)&lt;br /&gt;data(algae)&lt;br /&gt;algae &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; algae[&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;manyNAs(algae), ]  &lt;span style=&quot;color: #406040;&quot;&gt;# Удаляем две записи с NA&lt;/span&gt;&lt;br /&gt;(rt.a1 &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; rpart(a1 &lt;span style=&quot;color: #2060a0;&quot;&gt;~&lt;/span&gt; ., data = algae[, &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;12&lt;/span&gt;]))&lt;br /&gt;&lt;br /&gt;n = &lt;span style=&quot;color: #0080a0;&quot;&gt;198&lt;/span&gt;&lt;br /&gt;node), split, n, deviance, yval&lt;br /&gt;      &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt; denotes terminal node&lt;br /&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;) root &lt;span style=&quot;color: #0080a0;&quot;&gt;198&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;90401.290&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;16.996460&lt;/span&gt;  &lt;br /&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;) PO4&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;gt;&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;43.818&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;147&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;31279.120&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;8.979592&lt;/span&gt;  &lt;br /&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt;) Cl&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;gt;&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;7.8065&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;140&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;21622.830&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;7.492857&lt;/span&gt;  &lt;br /&gt;       &lt;span style=&quot;color: #0080a0;&quot;&gt;8&lt;/span&gt;) oPO4&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;gt;&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;51.118&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;84&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;3441.149&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;3.846429&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;br /&gt;       &lt;span style=&quot;color: #0080a0;&quot;&gt;9&lt;/span&gt;) oPO4&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;51.118&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;56&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;15389.430&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;12.962500&lt;/span&gt;  &lt;br /&gt;        &lt;span style=&quot;color: #0080a0;&quot;&gt;18&lt;/span&gt;) mnO2&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;gt;&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;10.05&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;24&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;1248.673&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;6.716667&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;br /&gt;        &lt;span style=&quot;color: #0080a0;&quot;&gt;19&lt;/span&gt;) mnO2&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;10.05&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;32&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;12502.320&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;17.646880&lt;/span&gt;  &lt;br /&gt;          &lt;span style=&quot;color: #0080a0;&quot;&gt;38&lt;/span&gt;) NO3&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;gt;&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;3.1875&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;9&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;257.080&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;7.866667&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;br /&gt;          &lt;span style=&quot;color: #0080a0;&quot;&gt;39&lt;/span&gt;) NO3&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;3.1875&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;23&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;11047.500&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;21.473910&lt;/span&gt;  &lt;br /&gt;            &lt;span style=&quot;color: #0080a0;&quot;&gt;78&lt;/span&gt;) mnO2&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;8&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;13&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;2919.549&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;13.807690&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;br /&gt;            &lt;span style=&quot;color: #0080a0;&quot;&gt;79&lt;/span&gt;) mnO2&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;gt;&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;8&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;10&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;6370.704&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;31.440000&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;br /&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt;) Cl&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;7.8065&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;7&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;3157.769&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;38.714290&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;br /&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt;) PO4&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;43.818&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;51&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;22442.760&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;40.103920&lt;/span&gt;  &lt;br /&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;6&lt;/span&gt;) mxPH&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;7.87&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;28&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;11452.770&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;33.450000&lt;/span&gt;  &lt;br /&gt;      &lt;span style=&quot;color: #0080a0;&quot;&gt;12&lt;/span&gt;) mxPH&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;gt;&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;7.045&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;18&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;5146.169&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;26.394440&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;br /&gt;      &lt;span style=&quot;color: #0080a0;&quot;&gt;13&lt;/span&gt;) mxPH&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;7.045&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;10&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;3797.645&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;46.150000&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;br /&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;7&lt;/span&gt;) mxPH&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;gt;&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;7.87&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;23&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;8241.110&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;48.204350&lt;/span&gt;  &lt;br /&gt;      &lt;span style=&quot;color: #0080a0;&quot;&gt;14&lt;/span&gt;) PO4&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;gt;&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;15.177&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;12&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;3047.517&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;38.183330&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;br /&gt;      &lt;span style=&quot;color: #0080a0;&quot;&gt;15&lt;/span&gt;) PO4&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;15.177&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;11&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;2673.945&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;59.136360&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;br /&gt;&lt;br /&gt;&lt;/pre&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &amp;nbsp; &lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Приведенной выше командой мы построили полное дерево из 9 узлов и 10 листьев, обозначенных символом &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;*&lt;/span&gt;.&amp;nbsp; В каждой строке представлены по порядку: условие разбиения, число наблюдений, соответствующих этому условию, девианс (в данном случае - это эквивалент суммы квадратов отклонений от группового среднего) и среднее значение отклика для выделенной ветви. Например, перед первым разбиением общее множество из 198 наблюдений имеет среднее значение&lt;i&gt; m &lt;/i&gt;= 16.99 при девиансе&lt;i&gt; D&lt;/i&gt; = 90401. При&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt; PO4&lt;/span&gt; &amp;gt;= 43.8 это множество делится на две части: &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;2)&lt;/span&gt;&lt;span style=&quot;font-family: inherit;&quot;&gt; &lt;/span&gt;147 наблюдений (&lt;i&gt;m&lt;/i&gt;&amp;nbsp; = 8.98, &lt;i&gt;D&lt;/i&gt; = 31279) и &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;3)&lt;/span&gt; 51 наблюдение с высоким уровнем обилия водорослей (&lt;i&gt;m&lt;/i&gt; = 40.1, &lt;i&gt;D&lt;/i&gt; = 22442). Дальнейшие разбиения каждой из этих двух частей аналогичны.&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Разумеется, лучший вариант - представить дерево графически. Популярны три варианта визуализации с использованием различных функций:&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt; plot()&lt;/span&gt;, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;prettyTree()&lt;/span&gt; из пакета &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;DMwR&lt;/span&gt; и &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;prp()&lt;/span&gt; из чрезвычайно продвинутого пакета &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;rpart.plot&lt;/span&gt;:&lt;/div&gt;&amp;nbsp; &lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;prettyTree(rt.a1, compress = TRUE)&lt;/pre&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;a href=&quot;https://2.bp.blogspot.com/-IcXlf0PA7WA/WKBUnsfBGbI/AAAAAAAADKs/1M5kb1s95gM6MgKUelKlR3klrPWnUHdUQCLcB/s1600/p1.png&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; src=&quot;https://2.bp.blogspot.com/-IcXlf0PA7WA/WKBUnsfBGbI/AAAAAAAADKs/1M5kb1s95gM6MgKUelKlR3klrPWnUHdUQCLcB/s1600/p1.png&quot; /&gt;&lt;/a&gt;&lt;/div&gt;Полезно также проследить изменение перечисленных выше статистических критериев по мере выращивания дерева:&lt;/div&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt; printcp(rt.a1)&lt;br /&gt;   Variables actually used &lt;span style=&quot;color: #2060a0;&quot;&gt;in&lt;/span&gt; tree construction&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;br /&gt;   [&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;] Cl   mnO2 mxPH NO3  oPO4 PO4 &lt;br /&gt;   Root node error&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;90401&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;/&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;198&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;456.57&lt;/span&gt;&lt;br /&gt;   n= &lt;span style=&quot;color: #0080a0;&quot;&gt;198&lt;/span&gt; &lt;br /&gt;           CP nsplit rel error  xerror    xstd&lt;br /&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.405740&lt;/span&gt;      &lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;1.00000&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1.01753&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.13131&lt;/span&gt;&lt;br /&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.071885&lt;/span&gt;      &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.59426&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.76097&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.12507&lt;/span&gt;&lt;br /&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.030887&lt;/span&gt;      &lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.52237&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.73959&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.12512&lt;/span&gt;&lt;br /&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.030408&lt;/span&gt;      &lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.49149&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.68751&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.11861&lt;/span&gt;&lt;br /&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.027872&lt;/span&gt;      &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.46108&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.67415&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.11851&lt;/span&gt;&lt;br /&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;6&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.027754&lt;/span&gt;      &lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.43321&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.67136&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.11856&lt;/span&gt;&lt;br /&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;7&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.018124&lt;/span&gt;      &lt;span style=&quot;color: #0080a0;&quot;&gt;6&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.40545&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.64653&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.11017&lt;/span&gt;&lt;br /&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;8&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.016344&lt;/span&gt;      &lt;span style=&quot;color: #0080a0;&quot;&gt;7&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.38733&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.66502&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.11160&lt;/span&gt;&lt;br /&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;9&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.010000&lt;/span&gt;      &lt;span style=&quot;color: #0080a0;&quot;&gt;9&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;0.35464&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.70171&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.11799&lt;/span&gt;&lt;/pre&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Функция &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;rpart()&lt;/span&gt; и другие функции из этого пакета имеют собственные возможности выполнить перекрестную проверку и оценить ее ошибку при различных значениях штрафа на сложность модели&amp;nbsp;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;cp&lt;/span&gt;&amp;nbsp;(внимание: ваши результаты могут незначительно отличаться от приведенных в силу эффекта генератора случайных чисел!):&lt;/div&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;&lt;span style=&quot;color: #406040;&quot;&gt;# Снижаем пороговые значения штрафа с шагом .005&lt;/span&gt;&lt;br /&gt;rtp.a1 &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; rpart(a1 &lt;span style=&quot;color: #2060a0;&quot;&gt;~&lt;/span&gt; ., data = algae[, &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;12&lt;/span&gt;], control = rpart.control(cp = .&lt;span style=&quot;color: #0080a0;&quot;&gt;005&lt;/span&gt;)) &lt;br /&gt;&lt;span style=&quot;color: #406040;&quot;&gt;#  График изменения относительных ошибок от числа узлов дерева&lt;/span&gt;&lt;br /&gt;plotcp(rtp.a1) &lt;br /&gt;with(rtp.a1, {lines(cptable[, &lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;] &lt;span style=&quot;color: #2060a0;&quot;&gt;+ &lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;, cptable[, &lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt;],&lt;br /&gt;     type = &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;b&quot;&lt;/span&gt;, col = &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;red&quot;&lt;/span&gt;)&lt;br /&gt;     legend(locator(&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;), c(&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;Ошибка обучения&quot;&lt;/span&gt;,&lt;br /&gt;     &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;Ошибка крос-проверки (CV)&quot;&lt;/span&gt;, &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;min(CV ошибка)+SE&quot;&lt;/span&gt;),&lt;br /&gt;     lty = c(&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;, &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;, &lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;), col = c(&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;red&quot;&lt;/span&gt;, &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;black&quot;&lt;/span&gt;, &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;black&quot;&lt;/span&gt;), bty = &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;n&quot;&lt;/span&gt;) })&lt;/pre&gt;&lt;br /&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;a href=&quot;https://2.bp.blogspot.com/-iD6jj43BaxM/WKBWgeORVjI/AAAAAAAADK4/IYChp3klIaQ8y7McNFORW9NtQL1FVLenwCLcB/s1600/p2.png&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; src=&quot;https://2.bp.blogspot.com/-iD6jj43BaxM/WKBWgeORVjI/AAAAAAAADK4/IYChp3klIaQ8y7McNFORW9NtQL1FVLenwCLcB/s1600/p2.png&quot; /&gt;&lt;/a&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;На графике видно, что минимум относительной ошибки при перекрестной проверке примерно приходится на значение &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;cp&lt;/span&gt; = 0.029. Выполним обрезку дерева при этом значении:&lt;/div&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;rtp.a1 &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; prune(rtp.a1, cp = &lt;span style=&quot;color: #0080a0;&quot;&gt;0.029&lt;/span&gt;)&lt;br /&gt;prettyTree(rtp.a1)&lt;/pre&gt;&lt;br /&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;/div&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;a href=&quot;https://4.bp.blogspot.com/-7V5wLsV1hlk/WKBXINNU4JI/AAAAAAAADLA/SUMUv2x7EcsPc2MMYfL8uu-uzl2V9dV2QCLcB/s1600/p3.png&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; src=&quot;https://4.bp.blogspot.com/-7V5wLsV1hlk/WKBXINNU4JI/AAAAAAAADLA/SUMUv2x7EcsPc2MMYfL8uu-uzl2V9dV2QCLcB/s1600/p3.png&quot; /&gt;&lt;/a&gt;&lt;/div&gt;&lt;div style=&quot;text-align: center;&quot;&gt;&amp;nbsp; &amp;nbsp;&amp;nbsp;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Выполним теперь дополнительную оптимизацию параметра &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;ср&lt;/span&gt; с использованием функции &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;train()&lt;/span&gt;&lt;span style=&quot;font-family: inherit;&quot;&gt;&amp;nbsp;&lt;/span&gt;из пакета &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;caret&lt;/span&gt; (подробнее см. &lt;a href=&quot;http://r-analytics.blogspot.co.uk/2017/01/train-caret_22.html&quot; target=&quot;_blank&quot;&gt;здесь&lt;/a&gt;). Будем тестировать деревья регрессии при 30 значениях критерия &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;ср&lt;/span&gt;, применяя к каждому из них 10-кратную перекрестную проверку с 3 повторностями (как и выше, ваши результаты могут немного отличаться от приведенных):&lt;/div&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;library(caret)&lt;br /&gt;cvCtrl &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; trainControl(method &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;repeatedcv&quot;&lt;/span&gt;, repeats &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt;)&lt;br /&gt;rt.a1.train &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; train(a1 &lt;span style=&quot;color: #2060a0;&quot;&gt;~&lt;/span&gt; ., data = na.omit(algae[, &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;12&lt;/span&gt;]), &lt;br /&gt;                     method &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;rpart&quot;&lt;/span&gt;, tuneLength &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;30&lt;/span&gt;, trControl &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; cvCtrl)&lt;br /&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;184&lt;/span&gt; samples&lt;br /&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;15&lt;/span&gt; predictors&lt;br /&gt;   Resampling&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; Cross&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;Validation (&lt;span style=&quot;color: #0080a0;&quot;&gt;10&lt;/span&gt; fold, repeated &lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt; times) &lt;br /&gt;     cp      RMSE  Rsquared  RMSE SD  Rsquared SD&lt;br /&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt;       &lt;span style=&quot;color: #0080a0;&quot;&gt;15.8&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.45&lt;/span&gt;      &lt;span style=&quot;color: #0080a0;&quot;&gt;3.19&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.18&lt;/span&gt;       &lt;br /&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0139&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;15.8&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.446&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;3.23&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.189&lt;/span&gt;      &lt;br /&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0279&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;15.6&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.459&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;3.5&lt;/span&gt;      &lt;span style=&quot;color: #0080a0;&quot;&gt;0.208&lt;/span&gt;      &lt;br /&gt;     &lt;b&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.0418&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;15.1&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.474&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;3.64&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.216&lt;/span&gt;&lt;/b&gt;      &lt;br /&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0557&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;15.2&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.468&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;3.79&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.216&lt;/span&gt;      &lt;br /&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0697&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;15.4&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.454&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;4.01&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.234&lt;/span&gt;      &lt;br /&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0836&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;15.7&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.451&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;4.18&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.242&lt;/span&gt;      &lt;br /&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0976&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;16.2&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.428&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;4.08&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.214&lt;/span&gt;      &lt;br /&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.111&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;16.4&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.403&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;3.86&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.211&lt;/span&gt;      &lt;br /&gt;   &lt;span style=&quot;color: #2060a0;&quot;&gt;...&lt;/span&gt;&lt;br /&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.362&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;16.4&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.411&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;3.84&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.213&lt;/span&gt;      &lt;br /&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.376&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;17&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;0.388&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;4.04&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.203&lt;/span&gt;      &lt;br /&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.39&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;17.5&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.374&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;3.84&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.201&lt;/span&gt;      &lt;br /&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.404&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;19.4&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.236&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;2.93&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.166&lt;/span&gt;      &lt;br /&gt;   RMSE was used to select optimal model using smallest value.&lt;br /&gt;   The final value used &lt;span style=&quot;color: #2060a0;&quot;&gt;for&lt;/span&gt; the model was cp &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0418&lt;/span&gt;.&lt;br /&gt;   &lt;br /&gt;plot(rt.a1.train)&lt;/pre&gt;&lt;br /&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;/div&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;a href=&quot;https://2.bp.blogspot.com/-egpQm8wQ0aA/WKBZicAQZmI/AAAAAAAADLQ/4kRL0CQM3AUq8mniePvHR2Q4jjdLLYaQwCLcB/s1600/p4.png&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; src=&quot;https://2.bp.blogspot.com/-egpQm8wQ0aA/WKBZicAQZmI/AAAAAAAADLQ/4kRL0CQM3AUq8mniePvHR2Q4jjdLLYaQwCLcB/s1600/p4.png&quot; /&gt;&lt;/a&gt;&lt;/div&gt;&lt;div style=&quot;text-align: center;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;br /&gt;&lt;div class=&quot;main-section highlighter-parsed-section&quot;&gt;&lt;div class=&quot;code&quot; id=&quot;parsed_code&quot;&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;rtt.a1 &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; rt.a1.train&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;finalModel&lt;br /&gt;prettyTree(rtt.a1)&lt;br /&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;&lt;br /&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;/div&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;a href=&quot;https://3.bp.blogspot.com/-Om_YRC_oq50/WKBZ2KnxNuI/AAAAAAAADLU/yZjPB8YLzPQWIvD93l_fYqVc6xfTlR5QgCLcB/s1600/p5.png&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; src=&quot;https://3.bp.blogspot.com/-Om_YRC_oq50/WKBZ2KnxNuI/AAAAAAAADLU/yZjPB8YLzPQWIvD93l_fYqVc6xfTlR5QgCLcB/s1600/p5.png&quot; /&gt;&lt;/a&gt;&lt;/div&gt;&lt;div style=&quot;text-align: center;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;При &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;cp = 0.0418&lt;/span&gt; было получено существенно урезанное дерево, которое, правда, значительно потеряло в своей объясняющей ценности (с т.з. биологических механизмов, определяющих обилие водорослей).&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Обратимся теперь к принципиально другим методам рекурсивного разбиения, представленным в пакете &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;party&lt;/span&gt;. Стандартный механизм проверки статистических гипотез, который предотвращает переусложнение модели, реализован в функции&amp;nbsp;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;ctree()&lt;/span&gt;, использующей метод построения деревьев на основе &quot;&lt;i&gt;условного вывода&lt;/i&gt;&quot; (англ. &lt;i&gt;conditional inference&lt;/i&gt;). Алгоритм принимает во внимание характер распределения независимых переменных и на каждом шаге рекурсивного разбиения данных осуществляет отбор несмещенного набора предикторов, используя формальный тест на основе статистического критерия&amp;nbsp;&lt;i&gt;Crit&lt;/i&gt;(&lt;span style=&quot;mso-bidi-font-weight: normal;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;times new roman&amp;quot;; font-size: 12pt; line-height: 115%;&quot;&gt;&lt;i&gt;t&lt;/i&gt;&lt;/span&gt;&lt;/span&gt;&lt;i style=&quot;mso-bidi-font-style: normal;&quot;&gt;&lt;sub&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;times new roman&amp;quot;; font-size: 12.0pt; line-height: 115%;&quot;&gt;j&lt;/span&gt;&lt;/sub&gt;&lt;/i&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;times new roman&amp;quot;; font-size: 12pt; line-height: 115%;&quot;&gt;,&amp;nbsp;&lt;i&gt;µ&lt;/i&gt;&lt;/span&gt;&lt;sub&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;times new roman&amp;quot;; font-size: 12.0pt; line-height: 115%;&quot;&gt;&lt;i&gt;j&lt;/i&gt;&lt;/span&gt;&lt;/sub&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;times new roman&amp;quot;; font-size: 12pt; line-height: 115%;&quot;&gt;, Σ&lt;/span&gt;&lt;sub&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;times new roman&amp;quot;; font-size: 12.0pt; line-height: 115%;&quot;&gt;&lt;i&gt;j&lt;/i&gt;&lt;/span&gt;&lt;/sub&gt;), &lt;i&gt;j&lt;/i&gt; = 1, ..., &lt;i&gt;m&lt;/i&gt;,&amp;nbsp; где, &lt;i&gt;µ&lt;/i&gt;, &lt;span style=&quot;color: black; font-family: &amp;quot;times new roman&amp;quot;; font-size: 12pt; line-height: 115%;&quot;&gt;Σ&lt;/span&gt; - соответственно среднее и ковариация (Hothorn et al., 2006). Оценка статистической значимости этого критерия выполняется на основе перестановочного теста, в результате чего формируются компактные деревья, не требующие процедуры обрезания.&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;library(party)  &lt;span style=&quot;color: #406040;&quot;&gt;# Построение дерева методом &quot;условного вывода&quot;&lt;/span&gt;&lt;br /&gt;(ctree.a1 &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; ctree(a1 &lt;span style=&quot;color: #2060a0;&quot;&gt;~ &lt;/span&gt;., data = algae[, &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;12&lt;/span&gt;]))&lt;br /&gt;            &lt;br /&gt;Conditional inference tree with &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt; terminal nodes&lt;br /&gt;   Response&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;  a1 &lt;br /&gt;   Inputs&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;  season, size, speed, mxPH, mnO2, Cl, NO3, NH4, oPO4, PO4, Chla &lt;br /&gt;   Number of observations&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;198&lt;/span&gt; &lt;br /&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;) PO4 &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;43.5&lt;/span&gt;; criterion &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;, statistic &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;46.49&lt;/span&gt;&lt;br /&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;)&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;  weights &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;50&lt;/span&gt; &lt;br /&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;) PO4 &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;gt;&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;43.5&lt;/span&gt;&lt;br /&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt;) oPO4 &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;51.111&lt;/span&gt;; criterion &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.989&lt;/span&gt;, statistic &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;10.861&lt;/span&gt;&lt;br /&gt;       &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt;) size &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; {small}; criterion &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.995&lt;/span&gt;, statistic &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;15.311&lt;/span&gt;&lt;br /&gt;         &lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt;)&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;  weights &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;15&lt;/span&gt; &lt;br /&gt;       &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt;) size &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; {large, medium}&lt;br /&gt;         &lt;span style=&quot;color: #0080a0;&quot;&gt;6&lt;/span&gt;)&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;  weights &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;49&lt;/span&gt; &lt;br /&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt;) oPO4 &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;gt;&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;51.111&lt;/span&gt;&lt;br /&gt;       &lt;span style=&quot;color: #0080a0;&quot;&gt;7&lt;/span&gt;)&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;  weights &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;84&lt;/span&gt;&lt;br /&gt;&lt;br /&gt;plot(ctree.a1)&lt;br /&gt;&lt;/pre&gt;&lt;br /&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;/div&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;a href=&quot;https://1.bp.blogspot.com/-zzKP0P58HSY/WKBbg_Um7gI/AAAAAAAADLg/jNUdcK5hrWwSgPuZvkkI5Cf02Ug2-qrAwCLcB/s1600/p6.png&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; src=&quot;https://1.bp.blogspot.com/-zzKP0P58HSY/WKBbg_Um7gI/AAAAAAAADLg/jNUdcK5hrWwSgPuZvkkI5Cf02Ug2-qrAwCLcB/s1600/p6.png&quot; /&gt;&lt;/a&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;Оптимизацию параметра &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;mincriterion &lt;/span&gt;выполним с использованием функции &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;train()&lt;/span&gt; при тех же условиях перекрестной проверки: &lt;/div&gt;&amp;nbsp; &lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;ctree.a1.train &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; train(a1 &lt;span style=&quot;color: #2060a0;&quot;&gt;~&lt;/span&gt; ., data = algae[, &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;12&lt;/span&gt;], &lt;br /&gt;                        method &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;ctree&quot;&lt;/span&gt;, tuneLength &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;10&lt;/span&gt;, trControl &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; cvCtrl)&lt;br /&gt;   Resampling&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; Cross&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;Validation (&lt;span style=&quot;color: #0080a0;&quot;&gt;10&lt;/span&gt; fold, repeated &lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt; times)&lt;br /&gt;     mincriterion  RMSE  Rsquared  RMSE SD  Rsquared SD&lt;br /&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.01&lt;/span&gt;          &lt;span style=&quot;color: #0080a0;&quot;&gt;16&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;0.422&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;3.69&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.191&lt;/span&gt;      &lt;br /&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.119&lt;/span&gt;         &lt;span style=&quot;color: #0080a0;&quot;&gt;15.9&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.427&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;3.71&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.193&lt;/span&gt;      &lt;br /&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.228&lt;/span&gt;         &lt;span style=&quot;color: #0080a0;&quot;&gt;16&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;0.421&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;3.61&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.189&lt;/span&gt;      &lt;br /&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.337&lt;/span&gt;         &lt;span style=&quot;color: #0080a0;&quot;&gt;16&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;0.417&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;3.54&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.187&lt;/span&gt;      &lt;br /&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.446&lt;/span&gt;         &lt;span style=&quot;color: #0080a0;&quot;&gt;15.9&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.426&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;3.59&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.187&lt;/span&gt;      &lt;br /&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.554&lt;/span&gt;         &lt;span style=&quot;color: #0080a0;&quot;&gt;15.9&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.425&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;3.43&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.172&lt;/span&gt;      &lt;br /&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.663&lt;/span&gt;         &lt;span style=&quot;color: #0080a0;&quot;&gt;15.8&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.437&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;3.3&lt;/span&gt;      &lt;span style=&quot;color: #0080a0;&quot;&gt;0.178&lt;/span&gt;      &lt;br /&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.772&lt;/span&gt;         &lt;span style=&quot;color: #0080a0;&quot;&gt;15.7&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.442&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;3.37&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.183&lt;/span&gt;      &lt;br /&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.881&lt;/span&gt;         &lt;span style=&quot;color: #0080a0;&quot;&gt;15.6&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.444&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;3.67&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.18&lt;/span&gt;       &lt;br /&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.99&lt;/span&gt;          &lt;span style=&quot;color: #0080a0;&quot;&gt;15.9&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.428&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;4.1&lt;/span&gt;      &lt;span style=&quot;color: #0080a0;&quot;&gt;0.246&lt;/span&gt;      &lt;br /&gt;   RMSE was used to select optimal model using smallest value.&lt;br /&gt;   The final value used &lt;span style=&quot;color: #2060a0;&quot;&gt;for&lt;/span&gt; the model was mincriterion &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.881&lt;/span&gt;.&lt;br /&gt;&lt;br /&gt;plot(ctree.a1.train)&lt;br /&gt;ctreet.a1 &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; ctree.a1.train&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;finalModel&lt;br /&gt;plot(ctreet.a1)&lt;/pre&gt;&lt;br /&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;a href=&quot;https://2.bp.blogspot.com/-KtAPrzV8ySw/WKBcOLFq4eI/AAAAAAAADLk/QvKkEJLSDCEgwTVbUzt4QUk_saxjMzbqwCLcB/s1600/p7.png&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; src=&quot;https://2.bp.blogspot.com/-KtAPrzV8ySw/WKBcOLFq4eI/AAAAAAAADLk/QvKkEJLSDCEgwTVbUzt4QUk_saxjMzbqwCLcB/s1600/p7.png&quot; /&gt;&lt;/a&gt;&lt;/div&gt;&lt;div style=&quot;text-align: center;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Здесь имел место обратный процесс: число узлов дерева было предложено увеличить с 7 до 9. Обратим также внимание на то, что в дереве появились категориальные переменные (размер и скорость течения реки), которые ранее были проигнорированы &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;rpart&lt;/span&gt;-деревьями.&amp;nbsp;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Возникает естественный вопрос: а какому из полученных четырех деревьев следует отдать предпочтение при прогнозировании? Хорошую возможность ответить на этот вопрос предоставляет нам &lt;i&gt;L. Torgo&lt;/i&gt;, подготовивший &lt;a href=&quot;http://www.dcc.fc.up.pt/~ltorgo/DataMiningWithR/datasets2.html&quot; target=&quot;_blank&quot;&gt;на сайте своей книги&lt;/a&gt;&amp;nbsp;набор данных из 140 проверочных наблюдений (см. файл &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;Eval.txt&lt;/span&gt; с предикторами и &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;Sols.txt&lt;/span&gt;&lt;span style=&quot;font-family: inherit;&quot;&gt; &lt;/span&gt;со значениями отклика). &lt;a href=&quot;http://r-analytics.blogspot.co.uk/2017/01/blog-post.html&quot; target=&quot;_blank&quot;&gt;Пропущенные значения&lt;/a&gt; заполним с использованием алгоритма бэггинга:&lt;/div&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;Eval &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; read.table(&lt;span style=&quot;color: #c03030;&quot;&gt;&#39;Eval.txt&#39;&lt;/span&gt;, header = F, dec = &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;.&#39;&lt;/span&gt;,&lt;br /&gt;                   col.names = c(&lt;span style=&quot;color: #c03030;&quot;&gt;&#39;season&#39;&lt;/span&gt;, &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;size&#39;&lt;/span&gt;, &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;speed&#39;&lt;/span&gt;, &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;mxPH&#39;&lt;/span&gt;, &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;mnO2&#39;&lt;/span&gt;, &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;Cl&#39;&lt;/span&gt;,&lt;br /&gt;                                 &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;NO3&#39;&lt;/span&gt;, &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;NH4&#39;&lt;/span&gt;, &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;oPO4&#39;&lt;/span&gt;, &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;PO4&#39;&lt;/span&gt;, &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;Chla&#39;&lt;/span&gt;),&lt;br /&gt;                                 na.strings = c(&lt;span style=&quot;color: #c03030;&quot;&gt;&#39;XXXXXXX&#39;&lt;/span&gt;))&lt;br /&gt;Sols &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; read.table(&lt;span style=&quot;color: #c03030;&quot;&gt;&#39;Sols.txt&#39;&lt;/span&gt;, header = FALSE, dec = &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;.&#39;&lt;/span&gt;,          &lt;br /&gt;                   col.names = c(&lt;span style=&quot;color: #c03030;&quot;&gt;&#39;a1&#39;&lt;/span&gt;, &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;a2&#39;&lt;/span&gt;, &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;a3&#39;&lt;/span&gt;, &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;a4&#39;&lt;/span&gt;, &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;a5&#39;&lt;/span&gt;, &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;a6&#39;&lt;/span&gt;, &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;a7&#39;&lt;/span&gt;),&lt;br /&gt;                   na.strings = c(&lt;span style=&quot;color: #c03030;&quot;&gt;&#39;XXXXXXX&#39;&lt;/span&gt;))&lt;br /&gt;ImpEval &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; preProcess(Eval[, &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;11&lt;/span&gt;], method = &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;bagImpute&#39;&lt;/span&gt;)&lt;br /&gt;Eval[, &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;11&lt;/span&gt;] &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; predict(ImpEval, Eval[, &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;11&lt;/span&gt;])&lt;/pre&gt;&lt;br /&gt;&lt;div style=&quot;text-align: left;&quot;&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-size: small;&quot;&gt;&lt;span style=&quot;font-family: inherit;&quot;&gt;&lt;span style=&quot;font-family: inherit;&quot;&gt;Выполним прогноз для проверочной выборки и оценим точность каждой модели по трем показателям: среднему абсолютному отклонению (&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;MAE&lt;/span&gt;&lt;span style=&quot;font-family: inherit;&quot;&gt;), корню из среднеквадратичного отклонения (&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;RSME&lt;/span&gt;&lt;span style=&quot;font-family: inherit;&quot;&gt;) и &lt;/span&gt;&lt;span style=&quot;color: black; font-family: inherit; line-height: 115%;&quot;&gt;коэффициенту детерминации &lt;/span&gt;&lt;span style=&quot;color: black; line-height: 115%;&quot;&gt;&lt;span style=&quot;font-family: inherit;&quot;&gt;(&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;Rsq&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;span style=&quot;color: black; line-height: 115%;&quot;&gt; = 1 - &lt;/span&gt;&lt;span style=&quot;color: black; line-height: 115%;&quot;&gt;NSME&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;color: black; font-family: inherit; line-height: 115%;&quot;&gt; &lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: inherit; line-height: 115%;&quot;&gt;, где &lt;/span&gt;&lt;span style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace; line-height: 115%;&quot;&gt;NSME&lt;/span&gt;&lt;span style=&quot;color: black; font-family: inherit; line-height: 115%;&quot;&gt; &lt;/span&gt;&lt;span style=&quot;font-family: inherit; line-height: 115%;&quot;&gt;–&lt;/span&gt;&lt;span style=&quot;color: black; font-family: inherit; line-height: 115%;&quot;&gt; относительная ошибка, равная отношению средних квадратов относительно регрессии и общего среднего)&lt;/span&gt;&lt;span style=&quot;font-family: inherit;&quot;&gt;:&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/div&gt;&lt;/div&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;&lt;span style=&quot;color: #406040;&quot;&gt;# Функция, выводящая вектор критериев&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: maroon;&quot;&gt;ModCrit&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;function&lt;/span&gt; (pred, fact) {&lt;br /&gt;     mae &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; mean(abs(pred&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;fact))&lt;br /&gt;     rmse &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; sqrt(mean((pred&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;fact)&lt;span style=&quot;color: #2060a0;&quot;&gt;^&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;))&lt;br /&gt;     Rsq &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; 1-mean((pred&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;fact)&lt;span style=&quot;color: #2060a0;&quot;&gt;^&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;)&lt;span style=&quot;color: #2060a0;&quot;&gt;/&lt;/span&gt;mean((mean(fact)&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;fact)&lt;span style=&quot;color: #2060a0;&quot;&gt;^&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;)&lt;br /&gt;     c(MAE=mae, RSME=rmse, Rsq=Rsq)&lt;br /&gt;   } &lt;br /&gt;&lt;br /&gt;Result &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; rbind(&lt;br /&gt;    rpart_prune &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; ModCrit(predict(rtp.a1, Eval), Sols[, &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;]),&lt;br /&gt;    rpart_train &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; ModCrit(predict(rt.a1.train, Eval), Sols[, &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;]),&lt;br /&gt;    ctree_party &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; ModCrit(predict(ctree.a1, Eval), Sols[, &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;]),&lt;br /&gt;    ctree_train &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; ModCrit(predict(ctree.a1.train, Eval), Sols[, &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;])&lt;br /&gt;   )&lt;br /&gt;&lt;br /&gt;Result&lt;br /&gt;                    MAE     RSME      Rsq&lt;br /&gt;   rpart_prune &lt;span style=&quot;color: #0080a0;&quot;&gt;11.16546&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;16.09485&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.3828278&lt;/span&gt;&lt;br /&gt;   rpart_train &lt;span style=&quot;color: #0080a0;&quot;&gt;10.72834&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;15.36578&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.4374751&lt;/span&gt;&lt;br /&gt;   ctree_party &lt;span style=&quot;color: #0080a0;&quot;&gt;11.32286&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;16.53470&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.3486336&lt;/span&gt;&lt;br /&gt;   ctree_train &lt;span style=&quot;color: #0080a0;&quot;&gt;11.25551&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;16.40532&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.3587876&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;&lt;/span&gt;&lt;/pre&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Можно с разумной осторожностью сделать вывод о том, что прогнозирующая ценность деревьев после дополнительной оптимизации функцией &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;train()&lt;/span&gt; несколько возрастает, а деревья, построенные с помощью&amp;nbsp;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;rpart()&lt;/span&gt;, немного точнее, чем деревья &quot;условного вывода&quot;&amp;nbsp;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;ctree()&lt;/span&gt;.&lt;/div&gt;&lt;br /&gt;&lt;br /&gt;&lt;span style=&quot;color: #444444;&quot;&gt;&lt;b&gt;Использованные источники:&lt;/b&gt;&lt;/span&gt;&lt;br /&gt;&lt;ul&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;i&gt;Breiman L., Friedman J.H., Olshen R.A. &lt;/i&gt;et al&lt;i&gt;. &lt;/i&gt;(1984)&lt;i&gt;&amp;nbsp;&lt;/i&gt;Classifcation and Regression Trees. Belmont (CA): Wadsworth Int. Group, 368 p.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;i&gt;Quinlan J. R. &lt;/i&gt;(1986) Induction of Decision Trees. Machine Learning 1: 81-106&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;i&gt;Loh W.-Y,&amp;nbsp; Shih Y.-S.&lt;/i&gt;&amp;nbsp;(1997) Split selection methods for classification trees. Statistica Sinica 7: 815-840&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;i&gt;Torgo L.&lt;/i&gt;&amp;nbsp;(2011) Data mining with R : learning with case studies. Chapman &amp;amp; Hall/CRC, 272 p.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;a href=&quot;https://www.r-project.org/nosvn/conferences/useR-2013/Tutorials/Kuhn.html&quot; target=&quot;_blank&quot;&gt;&lt;i&gt;Kuhn M. &lt;/i&gt;(2013)&lt;/a&gt;&amp;nbsp;Predictive Modeling with R and the &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;caret&lt;/span&gt; Package&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;i&gt;Hothorn T, Hornik K, Zeileis A. &lt;/i&gt;(2006)&lt;i&gt;&amp;nbsp;&lt;/i&gt;Unbiased Recursive Partitioning: A Conditional Inference Framework. Journal of Computational and Graphical Statistics 15(3): 651-674&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;i&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/partykit/vignettes/ctree.pdf&quot; target=&quot;_blank&quot;&gt;Hothorn T, Hornik K, Zeileis A&lt;/a&gt;. &lt;/i&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;ctree&lt;/span&gt;: Conditional Inference Trees&lt;/li&gt;&lt;/ul&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;/div&gt;</content><link rel='replies' type='text/html' href='http://r-analytics.blogspot.com/2017/02/blog-post.html#comment-form' title='Комментарии: 3'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/6224115173991365600'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/6224115173991365600'/><link rel='alternate' type='text/html' href='http://r-analytics.blogspot.com/2017/02/blog-post.html' title='Построение деревьев регрессии'/><author><name>В.Шитиков</name><uri>http://www.blogger.com/profile/01896460847215383456</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='31' height='32' src='//1.bp.blogspot.com/-5Wttqmz7yaM/WFemBTJup6I/AAAAAAAADUE/VRlomgxu2QsLFzRgbGdGQzmQQ06lRKM7gCK4B/s220/Face2.JPG'/></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://2.bp.blogspot.com/-IcXlf0PA7WA/WKBUnsfBGbI/AAAAAAAADKs/1M5kb1s95gM6MgKUelKlR3klrPWnUHdUQCLcB/s72-c/p1.png" height="72" width="72"/><thr:total>3</thr:total></entry><entry><id>tag:blogger.com,1999:blog-9120847565867616203.post-7288733461628027162</id><published>2017-02-04T18:59:00.001+00:00</published><updated>2017-02-04T23:46:31.270+00:00</updated><title type='text'>Обзор интересных R-пакетов за январь 2017 г.</title><content type='html'>&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;div style=&quot;text-align: right;&quot;&gt;Автор: &lt;i&gt;Сергей Мастицкий&lt;/i&gt;&lt;/div&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;a href=&quot;https://1.bp.blogspot.com/-a3eyttu1bUo/WJZnz2U_k4I/AAAAAAAADKY/zB605x4coWovPdaaBo-1E4GH6P1BcoJJACLcB/s1600/logo.png&quot; imageanchor=&quot;1&quot; style=&quot;clear: left; float: left; margin-bottom: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; src=&quot;https://1.bp.blogspot.com/-a3eyttu1bUo/WJZnz2U_k4I/AAAAAAAADKY/zB605x4coWovPdaaBo-1E4GH6P1BcoJJACLcB/s1600/logo.png&quot; /&gt;&lt;/a&gt;Перед тем как привести обзор новых (и обновленных) R-пакетов за январь, стоит сказать о важном событии: в этом месяце общее количество пакетов в хранилище &lt;a href=&quot;https://cran.r-project.org/&quot; target=&quot;_blank&quot;&gt;CRAN&lt;/a&gt; перевалило за 10000 (эта цифра &lt;i&gt;не&lt;/i&gt; включает в себя примерно 1300 пакетов, опубликованных в хранилище &lt;a href=&quot;https://www.bioconductor.org/packages/release/BiocViews.html#___Software&quot; target=&quot;_blank&quot;&gt;BioConductor&lt;/a&gt;, а также сотни пакетов, доступных только в репозиториях &lt;a href=&quot;https://github.com/&quot; target=&quot;_blank&quot;&gt;GitHub&lt;/a&gt;). Наличие такого разнообразия пакетов в распоряжении пользователей R - дело, несомненно, хорошее. Однако со временем пользователям становится все сложнее ориентироваться в этом разнообразии и находить нужные пакеты. В этой связи, возможно, стоит напомнить о некоторых инструментах, которые могут оказаться полезными при выполнении соответствующего поиска:&lt;br /&gt;&lt;br /&gt;&lt;script async=&quot;&quot; src=&quot;//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js&quot;&gt;&lt;/script&gt;&lt;!-- R Analytics Responsive --&gt;&lt;br /&gt;&lt;ins class=&quot;adsbygoogle&quot; data-ad-client=&quot;ca-pub-6457966355894443&quot; data-ad-format=&quot;auto&quot; data-ad-slot=&quot;8123690788&quot; style=&quot;display: block;&quot;&gt;&lt;/ins&gt;&lt;script&gt;(adsbygoogle = window.adsbygoogle || []).push({}); &lt;/script&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;/div&gt;&lt;ul&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;Обзор пакетов для решения ряда распространенных задач, приведенный на сайте CRAN - &lt;a href=&quot;https://cran.r-project.org/web/views/&quot; target=&quot;_blank&quot;&gt;CRAN Task Views&lt;/a&gt;;&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;Список популярных пакетов на сайте &lt;a href=&quot;https://www.rdocumentation.org/trends&quot; target=&quot;_blank&quot;&gt;RDocumentation.org&lt;/a&gt;;&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;Список популярных пакетов, опубликованных на плафторме &lt;a href=&quot;https://github.com/trending/r?since=monthly&quot; target=&quot;_blank&quot;&gt;GitHub&lt;/a&gt;;&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;a href=&quot;http://dirk.eddelbuettel.com/cranberries/cran/new/&quot; target=&quot;_blank&quot;&gt;CRANberries&lt;/a&gt; - обновляющийся в реальном времени список пакетов, добавляемых в хранилище CRAN;&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;a href=&quot;https://mran.microsoft.com/packages/&quot; target=&quot;_blank&quot;&gt;Инструмент для поиска&lt;/a&gt; по хранилищу CRAN, доступный на сайте MRAN (Microsoft R Application Network);&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;a href=&quot;https://bearloga.shinyapps.io/taskviewr/&quot; target=&quot;_blank&quot;&gt;Shiny-приложение&lt;/a&gt; для поиска пакетов по категориям CRAN Task Views, созданное &lt;a href=&quot;https://github.com/bearloga&quot; target=&quot;_blank&quot;&gt;Михаилом Поповым&lt;/a&gt;;&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;a href=&quot;http://r-analytics.blogspot.co.uk/2012/10/sos-r.html&quot; target=&quot;_blank&quot;&gt;Функция &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;findFn()&lt;/span&gt;&lt;/a&gt; из пакета &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;sos&lt;/span&gt;.&lt;/li&gt;&lt;/ul&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;А теперь, собственно, сам список новых/обновленных пакетов, показавшихся мне особенно интересными:&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;ul&gt;&lt;li&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;http://www.fstpackage.org/&quot; target=&quot;_blank&quot;&gt;fst&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- пакет для выполнения (сверх-)быстрой&amp;nbsp;&lt;a href=&quot;https://ru.wikipedia.org/wiki/%D0%A1%D0%B5%D1%80%D0%B8%D0%B0%D0%BB%D0%B8%D0%B7%D0%B0%D1%86%D0%B8%D1%8F&quot; target=&quot;_blank&quot;&gt;сериализации&lt;/a&gt;&amp;nbsp;и десериализации таблиц данных R.&lt;/li&gt;&lt;li&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://github.com/psolymos/intrval&quot; target=&quot;_blank&quot;&gt;intrval&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- набор утилит, облегчающих разбиение количественных переменных на интервалы.&lt;/li&gt;&lt;li&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://github.com/hrbrmstr/newsflash&quot; target=&quot;_blank&quot;&gt;newsflash&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- R-интерфейс к&amp;nbsp;&lt;a href=&quot;http://gdeltproject.org/&quot; target=&quot;_blank&quot;&gt;GDELT&lt;/a&gt;&amp;nbsp;Television Explorer API, с помощью которого можно выяснить, сколько раз то и или иное ключевое слово встречалось в новостях телевизионных каналов США за определенное время.&lt;/li&gt;&lt;li&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/roxygen2/index.html&quot; target=&quot;_blank&quot;&gt;roxygen2&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- вышла новая версия этого популярного пакета, предназначенного для написания документации в ходе разработки R-пакетов. Теперь такую документацию&amp;nbsp;&lt;a href=&quot;https://blog.rstudio.org/2017/02/01/roxygen2-6-0-0/&quot; target=&quot;_blank&quot;&gt;можно писать&lt;/a&gt;&amp;nbsp;и в формате&amp;nbsp;&lt;a href=&quot;http://rmarkdown.rstudio.com/&quot; target=&quot;_blank&quot;&gt;Markdown&lt;/a&gt;.&lt;/li&gt;&lt;li&gt;&lt;a href=&quot;http://dirk.eddelbuettel.com/code/rpushbullet.html&quot; target=&quot;_blank&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;RPushbullet&lt;/span&gt;&lt;/a&gt;&amp;nbsp;- новая версия пакета, представляющего собой R-интерфейс к&amp;nbsp;&lt;a href=&quot;https://www.pushbullet.com/&quot; target=&quot;_blank&quot;&gt;Pushbullet API&lt;/a&gt;&amp;nbsp;- сервису для обмена сообщениями между устройствами.&lt;/li&gt;&lt;li&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://jannesm.wordpress.com/2017/01/23/releasing-rqgis-0-2-0/&quot; target=&quot;_blank&quot;&gt;RQGIS&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- новая версия пакета, представляющего собой R-интерфейс к&amp;nbsp;&lt;a href=&quot;http://qgis.org/api/&quot; target=&quot;_blank&quot;&gt;QGIS API&lt;/a&gt;. QGIS - это геоинформационная система с открытым кодом, в которой реализовано более 1000 различных алгоритмов обработки геоданных.&lt;/li&gt;&lt;li&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/sparklyr/index.html&quot; target=&quot;_blank&quot;&gt;sparklyr&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- новая версия пакета, предназначенного для работы со Spark-кластерами из среды R.&lt;/li&gt;&lt;li&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://rlbarter.github.io/superheat/index.html&quot; target=&quot;_blank&quot;&gt;superheat&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- новый пакет для построения диаграмм типа &quot;тепловая карта&quot; (&lt;i&gt;heatmap&lt;/i&gt;). Имеется возмжность создавать составные рисунки (например, путем добавления к тепловой карте диаграмм рассеяния, диаграмм размахов и т.п.) и выполнять тонкую настройку их элементов.&lt;/li&gt;&lt;li&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://github.com/rstudio/tensorflow&quot; target=&quot;_blank&quot;&gt;tensorflow&lt;/a&gt;&lt;/span&gt; - R-интерфейс к &lt;a href=&quot;https://www.tensorflow.org/&quot; target=&quot;_blank&quot;&gt;TensorFlow&lt;/a&gt;&amp;nbsp;- известной библиотеке от Google для создания предсказательных моделей.&lt;/li&gt;&lt;li&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/xml2/index.html&quot; target=&quot;_blank&quot;&gt;xml2&lt;/a&gt;&lt;/span&gt; - новая версия пакета от &lt;a href=&quot;https://blog.rstudio.org/2017/01/24/xml-1-1-1/&quot; target=&quot;_blank&quot;&gt;RStudio&lt;/a&gt; для работы с данными в формате XML.&lt;/li&gt;&lt;/ul&gt;&lt;div&gt;&lt;br /&gt;&lt;/div&gt;&lt;/div&gt;</content><link rel='replies' type='text/html' href='http://r-analytics.blogspot.com/2017/02/r-2017.html#comment-form' title='Комментарии: 1'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/7288733461628027162'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/7288733461628027162'/><link rel='alternate' type='text/html' href='http://r-analytics.blogspot.com/2017/02/r-2017.html' title='Обзор интересных R-пакетов за январь 2017 г.'/><author><name>Sergey Mastitsky</name><uri>https://plus.google.com/100743762419147389233</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='32' height='32' src='//lh3.googleusercontent.com/-S7CBBqIIWg0/AAAAAAAAAAI/AAAAAAAAANI/e7vggjNa3Mo/s512-c/photo.jpg'/></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://1.bp.blogspot.com/-a3eyttu1bUo/WJZnz2U_k4I/AAAAAAAADKY/zB605x4coWovPdaaBo-1E4GH6P1BcoJJACLcB/s72-c/logo.png" height="72" width="72"/><thr:total>1</thr:total></entry><entry><id>tag:blogger.com,1999:blog-9120847565867616203.post-8303436101707448037</id><published>2017-01-22T14:22:00.003+00:00</published><updated>2017-01-22T18:31:19.564+00:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="caret"/><category scheme="http://www.blogger.com/atom/ns#" term="машинное обучение"/><title type='text'>Особенности работы с функцией train() из пакета caret</title><content type='html'>&lt;div style=&quot;text-align: right;&quot;&gt;Автор: &lt;i&gt;Владимир Шитиков&lt;/i&gt;&lt;/div&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;div style=&quot;clear: left; float: left; margin-bottom: 1em; margin-right: 1em;&quot;&gt;&lt;a href=&quot;https://1.bp.blogspot.com/-xSl8_UGEHKw/WIS_z_EbhRI/AAAAAAAADKA/80Wo6pYHFdcqkvWHLJXWiLWg9utRQnb_ACLcB/s1600/carrots13.png&quot; imageanchor=&quot;1&quot; style=&quot;clear: left; float: left; margin-bottom: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; height=&quot;200&quot; src=&quot;https://1.bp.blogspot.com/-xSl8_UGEHKw/WIS_z_EbhRI/AAAAAAAADKA/80Wo6pYHFdcqkvWHLJXWiLWg9utRQnb_ACLcB/s200/carrots13.png&quot; width=&quot;100&quot; /&gt;&lt;/a&gt;Как обсуждалось нами &lt;a href=&quot;http://r-analytics.blogspot.ru/2015/06/caret.html&quot; target=&quot;_blank&quot;&gt;ранее&lt;/a&gt;, пакет &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;caret&lt;/span&gt; (сокращение от &lt;i&gt;&lt;u&gt;C&lt;/u&gt;lassification &lt;u&gt;a&lt;/u&gt;nd &lt;u&gt;Re&lt;/u&gt;gression &lt;u&gt;T&lt;/u&gt;raining&lt;/i&gt;) был разработан как эффективная надстройка, позволяющая унифицировать и интегрировать использование множества различных функций и методов построения предсказательных моделей, реализованных в других пакетах R. При этом происходит всестороннее тестирование и оптимизация настраиваемых параметров и гиперпараметров (&lt;i&gt;tuning parameters&lt;/i&gt;) моделей. Разработанная единая технология настройки моделей основана на использовании полуавтоматических интеллектуальных подходов и ряда широко применяемых критериев качества, рассчитываемых с применением алгоритмов создания повторных выборок (&lt;i&gt;resampling&lt;/i&gt;).  &lt;br /&gt;&lt;br /&gt;&lt;script async src=&quot;//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js&quot;&gt;&lt;/script&gt;&lt;!-- R Analytics Responsive --&gt;&lt;ins class=&quot;adsbygoogle&quot;      style=&quot;display:block&quot;      data-ad-client=&quot;ca-pub-6457966355894443&quot;      data-ad-slot=&quot;8123690788&quot;      data-ad-format=&quot;auto&quot;&gt;&lt;/ins&gt;&lt;script&gt;(adsbygoogle = window.adsbygoogle || []).push({}); &lt;/script&gt;&lt;br /&gt;&lt;br /&gt;&lt;a name=&#39;more&#39;&gt;&lt;/a&gt;Процесс поиска оптимальных значений параметров моделей с использованием функции &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;train()&lt;/span&gt; в общем виде реализуется по следующей схеме:&lt;br /&gt;&lt;/div&gt;&lt;br /&gt;&lt;table border=&quot;1&quot; cellpadding=&quot;0&quot; cellspacing=&quot;0&quot; class=&quot;MsoTableGrid&quot; style=&quot;border-collapse: collapse; border: none; mso-border-alt: solid windowtext .5pt; mso-border-insideh: .5pt solid windowtext; mso-border-insidev: .5pt solid windowtext; mso-padding-alt: 0cm 5.4pt 0cm 5.4pt; mso-yfti-tbllook: 480;&quot;&gt;&lt;tbody&gt;&lt;tr style=&quot;mso-yfti-firstrow: yes; mso-yfti-irow: 0; mso-yfti-lastrow: yes;&quot;&gt;&lt;td style=&quot;border: 1pt solid; padding: 0cm 5.4pt; width: 481.4pt;&quot; valign=&quot;top&quot; width=&quot;642&quot;&gt;&lt;br /&gt;1. &amp;nbsp; Определение наборов данных и их предварительная обработка (при необходимости)&lt;br /&gt;2. &amp;nbsp; Определение спецификации параметров модели&lt;br /&gt;3. &amp;nbsp; Цикл для каждого параметра модели:&lt;br /&gt;4. &amp;nbsp; &amp;nbsp; &amp;nbsp;| Итеративная оптимизация параметров:&lt;br /&gt;5. &amp;nbsp; &amp;nbsp; &amp;nbsp;| &amp;nbsp; &amp;nbsp; | Выделение и предобработка подвыборок для обучения и тестирования модели&lt;br /&gt;6. &amp;nbsp; &amp;nbsp; &amp;nbsp;| &amp;nbsp; &amp;nbsp; | Подгонка модели по обучающим объектам&lt;br /&gt;7. &amp;nbsp; &amp;nbsp; &amp;nbsp;| &amp;nbsp; &amp;nbsp; | Прогнозирование отклика для тестовых объектов&lt;br /&gt;8. &amp;nbsp; &amp;nbsp; &amp;nbsp;| &amp;nbsp; &lt;i&gt;end&lt;/i&gt;&lt;br /&gt;9. &amp;nbsp; &amp;nbsp; &amp;nbsp;| Вычисление показателей средней эффективности прогноза&lt;br /&gt;10. &amp;nbsp;&lt;i&gt;end&lt;/i&gt;&lt;br /&gt;11. Установление оптимальных параметров&lt;br /&gt;12. Подгонка итоговой модели по всей выборке с использованием оптимальных параметров&lt;br /&gt;&lt;br /&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/tbody&gt;&lt;/table&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Перед обучением модели при помощи функции &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;train()&lt;/span&gt; необходимо задать соответствующий алгоритм и всю совокупность условий процесса оптимизации, для чего функцией &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;trainControl()&lt;/span&gt; создается специальный объект. Вызов этой функции с исходными настройками имеет следующий вид:&lt;/div&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;trainControl(method = &quot;boot&quot;,&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;number = ifelse(grepl(&quot;cv&quot;, method), 10, 25),&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;p = 0.75,&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;repeats = ifelse(grepl(&quot;cv&quot;, method), 1, number),&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;search = &quot;grid&quot;,&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;initialWindow = NULL,&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;horizon = 1,&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;fixedWindow = TRUE,&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;verboseIter = FALSE,&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;returnData = TRUE,&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;returnResamp = &quot;final&quot;,&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;savePredictions = FALSE,&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;classProbs = FALSE,&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;summaryFunction = defaultSummary,&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;selectionFunction = &quot;best&quot;,&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;seeds = NA,&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;preProcOptions = list(thresh = 0.95,&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;ICAcomp = 3,&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;k = 5),&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;sampling = NULL,&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;index = NULL,&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;indexOut = NULL,&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;timingSamps = 0,&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;predictionBounds = rep(FALSE, 2),&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;adaptive = list(min = 5,&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;alpha = 0.05,&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;method = &quot;gls&quot;,&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;complete = TRUE),&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;trim = FALSE,&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp;allowParallel = TRUE)&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;Остановимся на описании наиболее важных аргументов этой функции:&lt;/div&gt;&lt;ul&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;method&lt;/span&gt; - метод создания повторных выборок: &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&quot;boot&quot;&lt;/span&gt;, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&quot;boot632&quot;&lt;/span&gt;, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&quot;cv&quot;&lt;/span&gt;, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&quot;repeatedcv&quot;&lt;/span&gt;, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&quot;LOOCV&quot;&lt;/span&gt;, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&quot;LGOCV&quot;&lt;/span&gt; (для повторяющихся разбиений на обучающую и контрольную выборки), &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&quot;none&quot;&lt;/span&gt; (проверка качества модели&amp;nbsp;выполняется только на обучающей выборке), &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&quot;oob&quot;&lt;/span&gt; (для таких алгоритмов, как случайные леса, бэггинг и др.), &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&quot;adaptive_cv&quot;&lt;/span&gt;, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&quot;adaptive_boot&quot;&lt;/span&gt; или &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&quot;adaptive_LGOCV&quot;&lt;/span&gt;;&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;number&lt;/span&gt; - задает число итераций при создании повторных выборок, в частности - количество таких выборок (&lt;i&gt;k-folds&lt;/i&gt;) при перекрестной проверке;&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;repeats&lt;/span&gt; - число повторностей для выполнения &lt;i&gt;k&lt;/i&gt;-кратной перекрестной проверки;&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;p&lt;/span&gt; - доля обучающей выборки от общего объема данных (при выполнении &lt;i&gt;k&lt;/i&gt;-кратной перекрестной проверки);&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;verboseIter&lt;/span&gt; - &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;TRUE&lt;/span&gt; означает, что пользователь будет получать сообщения о ходе вычислений&amp;nbsp;(это удобно для оценки оставшегося времени вычислений, которое зачастую бывает очень большим);&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;search&lt;/span&gt; - задает способ перебора параметров модели при ее настройке - по предварительно заданной сетке (&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&quot;grid&quot;&lt;/span&gt;) или случайным образом (&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&quot;random&quot;&lt;/span&gt;);&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;returnResamp&lt;/span&gt; и &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;savePredictions&lt;/span&gt; - определяют условия сохранения результатов вычислений и предсказанных значений (возможные варианты: без сохранения - &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&quot;none&quot;&lt;/span&gt;, сохранение только для итоговой модели - &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&quot;final&quot;&lt;/span&gt;, или сохранение всех результатов - &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&quot;all&quot;&lt;/span&gt;);&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;classProbs&lt;/span&gt;&amp;nbsp;- при выполнении классификации&amp;nbsp;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;TRUE&lt;/span&gt; означает, что в процессе вычислений будут сохраняться не только конечные метки предсказанного класса, но и&amp;nbsp;значения вероятности принадлежности того или иного наблюдения к каждому из имеющихся классов;&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;summaryFunction&lt;/span&gt; - определяет функцию, которая вычисляет сводную метрику качества модели на основе повторных выборок;&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;selectionFunction&lt;/span&gt; - определяет функцию выбора оптимального значения настраиваемого параметра;&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;preProcOptions&lt;/span&gt; - список опций, который передается на функцию предварительной обработки данных &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;preprocess()&lt;/span&gt;.&lt;/li&gt;&lt;/ul&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Например, при создании объекта &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;ctrl&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;ctrl &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; trainControl(method &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;repeatedcv&quot;&lt;/span&gt;, number &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;10&lt;/span&gt;, repeats &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;10&lt;/span&gt;)&lt;br /&gt;&lt;/pre&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;параметры перекрестной проверки будут иметь следующий смысл:&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;/div&gt;&lt;ul&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;method = &quot;repeatedcv&quot;&lt;/span&gt; означает, что необходимо выполнить повторную перекрестную проверку (также возможна перекрестная проверка без повторов, проверка по одному наблюдению и др.);&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;number = 10&lt;/span&gt; означает, что в процессе перекрестной проверки исходные данные необходимо разбить на 10 (примерно) равных частей.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;repeats = 10&lt;/span&gt; означает, что перекрестная проверка будет запущена 10 раз.&lt;/li&gt;&lt;/ul&gt;&lt;span style=&quot;text-align: justify;&quot;&gt;Теперь перейдем непосредственно к описанию функции &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;train()&lt;/span&gt;, которая имеет следующий формат вызова:&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;train(x, y,&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; rf&quot;,preProcess = NULL,&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; weights = NULL,&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; metric = ifelse(is.factor(y), &quot;Accuracy&quot;, &quot;RMSE&quot;),&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; maximize = ifelse(metric %in%&amp;nbsp;&lt;/span&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; &amp;nbsp; c(&quot;RMSE&quot;, &quot;logLoss&quot;), FALSE, TRUE),&lt;/span&gt;&lt;/div&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;span style=&quot;text-align: justify;&quot;&gt;&lt;/span&gt;&lt;/span&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&amp;nbsp; &amp;nbsp; &amp;nbsp; trControl = trainControl(), tuneGrid = NULL, tuneLength = 3)&lt;/span&gt;&lt;/div&gt;&lt;span style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Как всегда, исходные данные задаются либо матрицей предикторов и вектором со значениями отклика, либо объектом &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;formula&lt;/span&gt; с одновременным указанием таблицы данных &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;data&lt;/span&gt;. Следующий аргумент - &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;method&lt;/span&gt; - в сущности, определяет модель классификации или регрессии, которую необходимо построить и протестировать. Если выполнить команду &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;names(getModelInfo())&lt;/span&gt;, то можно увидеть список из 233 доступных методов (количество этих методов постоянно растет). Тот же список, но с различными возможностями поиска и сортировки можно найти по следующим ссылкам:&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;a href=&quot;http://topepo.github.io/caret/modelList.html&quot;&gt;http://topepo.github.io/caret/modelList.html&lt;/a&gt; или &lt;a href=&quot;http://topepo.github.io/caret/bytag.html&quot;&gt;http://topepo.github.io/caret/bytag.html&lt;/a&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Пакет &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;caret&lt;/span&gt;&amp;nbsp;предоставляет пользователю унифицированный интерфейс доступа к пакетам, содержащим все эти функции. Необходимые компоненты автоматически подгружаются по мере их использования (предполагается, что соответствующие пакеты уже инсталлированы).&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Например, следующим образом можно ознакомиться со списком всех моделей, имеющих отношение к линейной регрессии:&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;ls(getModelInfo(model &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;lm&quot;&lt;/span&gt;))&lt;br /&gt;[&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;] &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;bayesglm&quot;&lt;/span&gt;   &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;elm&quot;&lt;/span&gt;        &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;glm&quot;&lt;/span&gt;        &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;glmboost&quot;&lt;/span&gt;   &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;glmnet&quot;&lt;/span&gt;&lt;br /&gt;[&lt;span style=&quot;color: #0080a0;&quot;&gt;6&lt;/span&gt;] &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;glmStepAIC&quot;&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;lm&quot;&lt;/span&gt;         &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;lmStepAIC&quot;&lt;/span&gt;  &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;plsRglm&quot;&lt;/span&gt;    &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;rlm&quot;&lt;/span&gt;&lt;br /&gt;&lt;/pre&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;С каждым методом связан набор подлежащих оптимизации (гипер-)параметров. Например, легко убедиться в том, что простая линейная регрессия (&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;method = &quot;lm&quot;&lt;/span&gt;) не имеет таких параметров:&lt;br /&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;modelLookup(&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;lm&quot;&lt;/span&gt;)&lt;br /&gt;   model parameter     label forReg forClass probModel&lt;br /&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;    lm parameter parameter   TRUE    FALSE     FALSE&lt;br /&gt;&lt;/pre&gt;&lt;br /&gt;В свою очередь модель &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;rpart&lt;/span&gt;&amp;nbsp;(мы познакомимся с ней подробнее в следующем сообщении, в котором &lt;a href=&quot;http://r-analytics.blogspot.ru/2016/05/i.html&quot; target=&quot;_blank&quot;&gt;продолжим рассмотрение&lt;/a&gt;&amp;nbsp;деревьев решений), имеет один параметр - &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;Complexity Parameter&lt;/span&gt;&amp;nbsp;(&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;cp&lt;/span&gt;&amp;nbsp;в сокращенном виде):&lt;br /&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;modelLookup(&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;rpart&quot;&lt;/span&gt;)&lt;br /&gt;   model parameter                label forReg forClass probModel&lt;br /&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt; rpart        cp Complexity Parameter   TRUE     TRUE      TRUE&lt;br /&gt;&lt;/pre&gt;&lt;br /&gt;Из вывода функции &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;modelLookup()&lt;/span&gt; можно также увидеть, что линейная регрессия не используется для классификации (&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;forClass = FALSE&lt;/span&gt;), тогда как &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;rpart&lt;/span&gt; (от &quot;&lt;i&gt;&lt;u&gt;R&lt;/u&gt;ecursive &lt;u&gt;Pa&lt;/u&gt;rtitioning and &lt;u&gt;R&lt;/u&gt;egression &lt;u&gt;T&lt;/u&gt;rees&lt;/i&gt;&quot;) можно применять для построения деревьев как&amp;nbsp;регрессии, так и классификации. В последнем случае модель осуществляет не только предсказание класса, но и оценивает апостериорные вероятности (&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;probModel = TRUE&lt;/span&gt;).&lt;br /&gt;&lt;br /&gt;Метод перекрестной проверки, заданный объектом &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;trControl = trainControl()&lt;/span&gt;, хранит список опций, используемых на каждой итерации в ходе настройки параметров модели и оценки ее качества по определенным критериям. При построении каждой частной модели может осуществляться предварительная обработка данных с использованием методов, перечисленных в &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;preProcess&lt;/span&gt; (и с учетом опций &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;preProcOptions&lt;/span&gt; объекта &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;trControl&lt;/span&gt;).&lt;br /&gt;&lt;br /&gt;По умолчанию аргумент &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;metric&lt;/span&gt; использует в качестве критерия качества точность предсказания (&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&quot;Accuracy&quot;&lt;/span&gt;) в случае классификации и корень из среднеквадратичного отклонения прогнозных значений от наблюдаемых (&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&quot;RMSE&quot;&lt;/span&gt;) в случае регрессии. Логический аргумент &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;maximize&lt;/span&gt; уточняет, должен ли этот критерий быть максимизирован или минимизирован. Другие значения &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;metric&lt;/span&gt; в совокупности с различными аргументами&amp;nbsp;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;summaryFunction&lt;/span&gt; и &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;selectionFunction&lt;/span&gt; объекта &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;trControl&lt;/span&gt; обеспечивают широкие возможности для определения критериев поиска оптимальных моделей.&lt;br /&gt;&lt;br /&gt;Количество перебираемых значений того или иного настраиваемого параметра задается аргументом &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;tuneLength&lt;/span&gt;. Например, чтобы задать 30 повторов оценки параметра &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;ср&lt;/span&gt; модели &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;rpart&lt;/span&gt;, необходимо указать &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;tuneLength = 30&lt;/span&gt;. Другой вариант - сохранить последовательность этих значений в отдельной таблице данных и затем подать эту таблицу на аргумент &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;tuneGrid&lt;/span&gt;&amp;nbsp;(например,&amp;nbsp;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;tuneGrid = expand.grid(.cp = 0.5^(1:10))&lt;/span&gt;). Последний подход особенно полезен, когда диапазон возможных значений настраиваемого параметра известен заранее.&lt;br /&gt;&lt;br /&gt;В результате спецификации всех положенных аргументов функции &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;train()&lt;/span&gt;&amp;nbsp;пользователь получает объект класса &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;train&lt;/span&gt;, соответствующие элементы которого можно извлечь с помощью оператора &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;$&lt;/span&gt;:&lt;br /&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;ls(mytrain)&lt;br /&gt;[&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;]  &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;bestTune&quot;&lt;/span&gt;     &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;call&quot;&lt;/span&gt;         &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;coefnames&quot;&lt;/span&gt;    &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;control&quot;&lt;/span&gt;     &lt;br /&gt;[&lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt;]  &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;dots&quot;&lt;/span&gt;         &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;finalModel&quot;&lt;/span&gt;   &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;maximize&quot;&lt;/span&gt;     &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;method&quot;&lt;/span&gt;      &lt;br /&gt;[&lt;span style=&quot;color: #0080a0;&quot;&gt;9&lt;/span&gt;]  &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;metric&quot;&lt;/span&gt;       &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;modelInfo&quot;&lt;/span&gt;    &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;modelType&quot;&lt;/span&gt;    &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;perfNames&quot;&lt;/span&gt;   &lt;br /&gt;[&lt;span style=&quot;color: #0080a0;&quot;&gt;13&lt;/span&gt;] &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;pred&quot;&lt;/span&gt;         &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;preProcess&quot;&lt;/span&gt;   &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;resample&quot;&lt;/span&gt;     &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;resampledCM&quot;&lt;/span&gt; &lt;br /&gt;[&lt;span style=&quot;color: #0080a0;&quot;&gt;17&lt;/span&gt;] &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;results&quot;&lt;/span&gt;      &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;terms&quot;&lt;/span&gt;        &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;times&quot;&lt;/span&gt;        &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;trainingData&quot;&lt;/span&gt;&lt;br /&gt;[&lt;span style=&quot;color: #0080a0;&quot;&gt;21&lt;/span&gt;] &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;xlevels&quot;&lt;/span&gt;      &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;yLimits&quot;&lt;/span&gt;&lt;br /&gt;&lt;/pre&gt;&lt;br /&gt;Приведем краткий пример, иллюстрирующий нахождение оптимальной степени полинома для модели зависимости электрического сопротивления (Ом) мякоти фруктов киви от процентного содержания в ней сока (эти данные были подробно рассмотрены нами &lt;a href=&quot;http://r-analytics.blogspot.ru/2015/05/blog-post.html&quot; target=&quot;_blank&quot;&gt;ранее&lt;/a&gt;). В одном из предыдущих сообщений &lt;a href=&quot;http://r-analytics.blogspot.ru/2016/12/blog-post.html&quot; target=&quot;_blank&quot;&gt;мы выяснили&lt;/a&gt;, как найти оптимальную степень полинома &lt;i&gt;d&lt;/i&gt; = 5 с использованием самостоятельно написанной функции скользящего контроля. К сожалению, функция &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;train()&lt;/span&gt;&amp;nbsp;не позволяет выполнить отбор предикторов для метода &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&quot;lm&quot;&lt;/span&gt; и тем самым выбрать оптимальную степень полинома. Однако мы можем выполнить любую из доступных типов перекрестной проверки и найти оптимальную степень полинома опосредованно, оценив характер изменения таких критериев качества, как например, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;RMSE&lt;/span&gt; или среднего коэффициента детерминации &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;RSquared&lt;/span&gt;:&lt;br /&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;library(caret)&lt;br /&gt;library(DAAG) &lt;br /&gt;data(&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;fruitohms&quot;&lt;/span&gt;)&lt;br /&gt;&lt;br /&gt;set.seed(&lt;span style=&quot;color: #0080a0;&quot;&gt;123&lt;/span&gt;)&lt;br /&gt;max.poly &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;7&lt;/span&gt;&lt;br /&gt;degree &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;max.poly&lt;br /&gt;RSquared &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; rep(&lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt;, max.poly)&lt;br /&gt;RMSE &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; rep(&lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt;, max.poly)&lt;br /&gt;&lt;br /&gt;&lt;span style=&quot;color: #406040;&quot;&gt;# Выполним 10-кратную перекрестную проверку 10 раз&lt;/span&gt;&lt;br /&gt;fitControl &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; trainControl(method &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;repeatedcv&quot;&lt;/span&gt;,&lt;br /&gt;                           number &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;10&lt;/span&gt;, repeats &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;10&lt;/span&gt;)&lt;br /&gt;&lt;br /&gt;&lt;span style=&quot;color: #406040;&quot;&gt;# Использование функции train() для полиномиальной регрессии&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;for&lt;/span&gt; (d &lt;span style=&quot;color: #2060a0;&quot;&gt;in&lt;/span&gt; degree)  {&lt;br /&gt;     &lt;br /&gt;     f &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; bquote(juice &lt;span style=&quot;color: #2060a0;&quot;&gt;~&lt;/span&gt; poly(ohms, .(d)))&lt;br /&gt;     LinearRegressor &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; train(as.formula(f),&lt;br /&gt;     data &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; fruitohms,&lt;br /&gt;     method &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;lm&quot;&lt;/span&gt;, &lt;br /&gt;     trControl &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; fitControl)&lt;br /&gt;     &lt;br /&gt;     RSquared[d] &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; LinearRegressor&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;results&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;Rsquared&lt;br /&gt;     RMSE[d]&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; LinearRegressor&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;results&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;RMSE&lt;br /&gt;}&lt;br /&gt;&lt;br /&gt;library(ggplot2)&lt;br /&gt;Degree.RegParams &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #a08000;&quot;&gt;data.frame&lt;/span&gt;(degree, RSquared, RMSE)&lt;br /&gt;ggplot(aes(x &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; degree, y &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; RSquared), data &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; Degree.RegParams) &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt; geom_line()&lt;br /&gt;ggplot(aes(x &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; degree, y &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; RMSE), data &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; Degree.RegParams) &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt; geom_line()&lt;br /&gt;&lt;/pre&gt;&lt;br /&gt;&lt;br /&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;a href=&quot;https://4.bp.blogspot.com/-3X7WPay91iE/WISlSC_-H3I/AAAAAAAADJw/GjMcVTizwM0v8GXKtkXYw6pfCMpNfjuwwCLcB/s1600/d_graphs.png&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; src=&quot;https://4.bp.blogspot.com/-3X7WPay91iE/WISlSC_-H3I/AAAAAAAADJw/GjMcVTizwM0v8GXKtkXYw6pfCMpNfjuwwCLcB/s1600/d_graphs.png&quot; /&gt;&lt;/a&gt;&lt;/div&gt;&lt;div style=&quot;text-align: center;&quot;&gt;&lt;br /&gt;&lt;/div&gt;Как и ранее, минимум ошибки и максимум коэффициента детерминации имеют место при &lt;i&gt;d&lt;/i&gt; = 5. Выполним проверку качества итоговой модели, не указывая непосредственно объект &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;trControl&lt;/span&gt;:&lt;br /&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;Poly5 &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; train(juice &lt;span style=&quot;color: #2060a0;&quot;&gt;~&lt;/span&gt; poly(ohms, &lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt;), data &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; fruitohms, method &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;lm&quot;&lt;/span&gt;)&lt;br /&gt;&lt;br /&gt;summary(Poly5&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;finalModel)&lt;br /&gt; Coefficients&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;br /&gt;                  Estimate Std. Error t value Pr(&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;gt;&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;|&lt;/span&gt;t&lt;span style=&quot;color: #2060a0;&quot;&gt;|&lt;/span&gt;)    &lt;br /&gt; (Intercept)        &lt;span style=&quot;color: #0080a0;&quot;&gt;35.152&lt;/span&gt;      &lt;span style=&quot;color: #0080a0;&quot;&gt;0.766&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;45.893&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;2e-16&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;br /&gt; `poly(ohms, &lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt;)&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;` &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;148.943&lt;/span&gt;      &lt;span style=&quot;color: #0080a0;&quot;&gt;8.666&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;17.187&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;2e-16&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;br /&gt; `poly(ohms, &lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt;)&lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;`   &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;5.540&lt;/span&gt;      &lt;span style=&quot;color: #0080a0;&quot;&gt;8.666&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0.639&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.52383&lt;/span&gt;    &lt;br /&gt; `poly(ohms, &lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt;)&lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt;`   &lt;span style=&quot;color: #0080a0;&quot;&gt;51.078&lt;/span&gt;      &lt;span style=&quot;color: #0080a0;&quot;&gt;8.666&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;5.894&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;3.43e-08&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;br /&gt; `poly(ohms, &lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt;)&lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt;`  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;13.905&lt;/span&gt;      &lt;span style=&quot;color: #0080a0;&quot;&gt;8.666&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;1.605&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.11118&lt;/span&gt;    &lt;br /&gt; `poly(ohms, &lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt;)&lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt;`  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;23.528&lt;/span&gt;      &lt;span style=&quot;color: #0080a0;&quot;&gt;8.666&lt;/span&gt;  &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;2.715&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.00759&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt; &lt;br /&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;&lt;br /&gt; Signif. codes&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt; С&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;Т &lt;span style=&quot;color: #0080a0;&quot;&gt;0.001&lt;/span&gt; С&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;Т &lt;span style=&quot;color: #0080a0;&quot;&gt;0.01&lt;/span&gt; С&lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt;Т &lt;span style=&quot;color: #0080a0;&quot;&gt;0.05&lt;/span&gt; С.Т &lt;span style=&quot;color: #0080a0;&quot;&gt;0.1&lt;/span&gt; С Т &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt; &lt;br /&gt; Residual standard error&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;8.666&lt;/span&gt; on &lt;span style=&quot;color: #0080a0;&quot;&gt;122&lt;/span&gt; degrees of freedom&lt;br /&gt; Multiple R&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;squared&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.7362&lt;/span&gt;,     Adjusted R&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;squared&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.7254&lt;/span&gt; &lt;br /&gt; F&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;statistic&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;68.1&lt;/span&gt; on &lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt; and &lt;span style=&quot;color: #0080a0;&quot;&gt;122&lt;/span&gt; DF,  p&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;value&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;2.2e-16&lt;/span&gt; &lt;br /&gt;&lt;br /&gt;Poly5&lt;br /&gt; Resampling&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt; Bootstrap (&lt;span style=&quot;color: #0080a0;&quot;&gt;25&lt;/span&gt; reps) &lt;br /&gt;   RMSE  Rsquared  RMSE SD  Rsquared SD&lt;br /&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;10&lt;/span&gt;    &lt;span style=&quot;color: #0080a0;&quot;&gt;0.663&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;1.87&lt;/span&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;0.0745&lt;/span&gt;   &lt;br /&gt;&lt;/pre&gt;&lt;br /&gt;Мы получили в точности те же коэффициенты модели, что и при использовании обычной функции &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;lm()&lt;/span&gt;, однако для критериев качества &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;RMSE&lt;/span&gt; и &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;RSquared&lt;/span&gt;&amp;nbsp;здесь были найдены стандартные ошибки. Эти статистики оценивались на основе 25 бутстреп-выборок (Шитиков, Розенберг 2014), формируемых функцией &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;train()&lt;/span&gt; по умолчанию. Обратите внимание, что несмещенное бутстреп-значение коэффициента детерминации (0.663) несколько меньше полученного по полной модели (0.7362).&lt;br /&gt;&lt;br /&gt;В заключение приведем сокращенную таблицу со списком моделей (Khun 2008), доступных в пакете &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;caret&lt;/span&gt;&amp;nbsp;при использовании функции &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;train()&lt;/span&gt;&amp;nbsp;(указаны также наименования оптимизируемых параметров этих моделей). Эта таблица полезна также тем, что является своеобразным путеводителем по пакетам R и реализованным в них статистическим методам:&lt;br /&gt;&lt;br /&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm; text-align: justify; text-indent: 36.0pt;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;table border=&quot;0&quot; cellpadding=&quot;0&quot; cellspacing=&quot;0&quot; class=&quot;MsoNormalTable&quot; style=&quot;border-collapse: collapse; margin-left: 2.0pt; mso-padding-alt: 0cm 2.0pt 0cm 2.0pt; mso-table-layout-alt: fixed;&quot;&gt; &lt;tbody&gt;&lt;tr style=&quot;height: 27.85pt; mso-yfti-firstrow: yes; mso-yfti-irow: 0;&quot;&gt;  &lt;td style=&quot;background-attachment: initial; background-clip: initial; background-image: initial; background-origin: initial; background-position: initial; background-repeat: initial; background-size: initial; border: none; height: 27.85pt; padding: 0cm 2pt; width: 171pt;&quot; width=&quot;228&quot;&gt;&lt;b&gt;Модели&lt;/b&gt;&lt;/td&gt;  &lt;td style=&quot;background-attachment: initial; background-clip: initial; background-image: initial; background-origin: initial; background-position: initial; background-repeat: initial; background-size: initial; border: none; height: 27.85pt; padding: 0cm 2pt; width: 90pt;&quot; width=&quot;120&quot;&gt;&lt;b&gt;&lt;span style=&quot;font-family: inherit;&quot;&gt;Значение &lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;method&lt;/span&gt;&lt;/b&gt;&lt;/td&gt;  &lt;td style=&quot;background-attachment: initial; background-clip: initial; background-image: initial; background-origin: initial; background-position: initial; background-repeat: initial; background-size: initial; border: none; height: 27.85pt; padding: 0cm 2pt; width: 90pt;&quot; width=&quot;120&quot;&gt;&lt;b&gt;Пакет&lt;/b&gt;&lt;/td&gt;  &lt;td style=&quot;background-attachment: initial; background-clip: initial; background-image: initial; background-origin: initial; background-position: initial; background-repeat: initial; background-size: initial; border: none; height: 27.85pt; padding: 0cm 2pt; width: 126pt;&quot; width=&quot;168&quot;&gt;&lt;b&gt;Оптимизируемые параметры&lt;/b&gt;&lt;/td&gt; &lt;/tr&gt;&lt;tr style=&quot;height: 27.85pt; mso-yfti-irow: 1;&quot;&gt;  &lt;td rowspan=&quot;2&quot; style=&quot;background-attachment: initial; background-clip: initial; background-image: initial; background-origin: initial; background-position: initial; background-repeat: initial; background-size: initial; border: none; height: 27.85pt; padding: 0cm 2pt; width: 171pt;&quot; valign=&quot;top&quot; width=&quot;228&quot;&gt;&lt;span style=&quot;font-family: inherit;&quot;&gt;&lt;br /&gt;Деревья на основе рекурсивного деления (recursive partitioning)&lt;/span&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; border-top: solid windowtext 1.0pt; border: none; height: 27.85pt; mso-border-top-alt: solid windowtext .75pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;rpart&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; border-top: solid windowtext 1.0pt; border: none; height: 27.85pt; mso-border-top-alt: solid windowtext .75pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;rpart&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; border-top: solid windowtext 1.0pt; border: none; height: 27.85pt; mso-border-top-alt: solid windowtext .75pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 126.0pt;&quot; valign=&quot;top&quot; width=&quot;168&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;maxdepth&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt; &lt;/tr&gt;&lt;tr style=&quot;height: 12.95pt; mso-yfti-irow: 2;&quot;&gt;  &lt;td style=&quot;background: white; height: 12.95pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;ctree&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 12.95pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;party&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 12.95pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 126.0pt;&quot; valign=&quot;top&quot; width=&quot;168&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;mincriterion&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt; &lt;/tr&gt;&lt;tr style=&quot;height: 27.85pt; mso-yfti-irow: 3;&quot;&gt;  &lt;td rowspan=&quot;3&quot; style=&quot;background-attachment: initial; background-clip: initial; background-image: initial; background-origin: initial; background-position: initial; background-repeat: initial; background-size: initial; height: 27.85pt; padding: 0cm 2pt; width: 171pt;&quot; valign=&quot;top&quot; width=&quot;228&quot;&gt;&lt;span style=&quot;font-family: inherit;&quot;&gt;&lt;br /&gt;Деревья на основе бустинга (boosted trees)&lt;/span&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 27.85pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;gbm&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 27.85pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;gbm&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 27.85pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 126.0pt;&quot; valign=&quot;top&quot; width=&quot;168&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;interaction.depth&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; mso-ansi-language: EN-US; mso-hansi-font-family: &amp;quot;Courier New&amp;quot;;&quot;&gt;, &lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;n.trees&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; mso-ansi-language: EN-US; mso-hansi-font-family: &amp;quot;Courier New&amp;quot;;&quot;&gt;, &lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;shrinkage&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt; &lt;/tr&gt;&lt;tr style=&quot;height: 13.2pt; mso-yfti-irow: 4;&quot;&gt;  &lt;td style=&quot;background: white; height: 13.2pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;blackboost&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.2pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;mboost&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.2pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 126.0pt;&quot; valign=&quot;top&quot; width=&quot;168&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;maxdepth&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: inherit; mso-ansi-language: EN-US;&quot;&gt;,&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt; mstop&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt; &lt;/tr&gt;&lt;tr style=&quot;height: 13.45pt; mso-yfti-irow: 5;&quot;&gt;  &lt;td style=&quot;background: white; height: 13.45pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;ada&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.45pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;ada&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.45pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 126.0pt;&quot; valign=&quot;top&quot; width=&quot;168&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;maxdepth&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: inherit; mso-ansi-language: EN-US;&quot;&gt;,&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt; iter&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: inherit; mso-ansi-language: EN-US;&quot;&gt;,&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt; nu&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt; &lt;/tr&gt;&lt;tr style=&quot;height: 13.45pt; mso-yfti-irow: 6;&quot;&gt;  &lt;td rowspan=&quot;3&quot; style=&quot;background-attachment: initial; background-clip: initial; background-image: initial; background-origin: initial; background-position: initial; background-repeat: initial; background-size: initial; height: 13.45pt; padding: 0cm 2pt; width: 171pt;&quot; valign=&quot;top&quot; width=&quot;228&quot;&gt;&lt;span style=&quot;font-family: inherit;&quot;&gt;&lt;br /&gt;Другие модели на основе бустинга&lt;/span&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.45pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;glmboost&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.45pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;mboost&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.45pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 126.0pt;&quot; valign=&quot;top&quot; width=&quot;168&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;mstop&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt; &lt;/tr&gt;&lt;tr style=&quot;height: 13.7pt; mso-yfti-irow: 7;&quot;&gt;  &lt;td style=&quot;background: white; height: 13.7pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;gamboost&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.7pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;mboost&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.7pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 126.0pt;&quot; valign=&quot;top&quot; width=&quot;168&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;mstop&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt; &lt;/tr&gt;&lt;tr style=&quot;height: 13.45pt; mso-yfti-irow: 8;&quot;&gt;  &lt;td style=&quot;background: white; height: 13.45pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;logitboost&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.45pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;caTools&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.45pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 126.0pt;&quot; valign=&quot;top&quot; width=&quot;168&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;nIter&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt; &lt;/tr&gt;&lt;tr style=&quot;height: 13.7pt; mso-yfti-irow: 9;&quot;&gt;  &lt;td rowspan=&quot;2&quot; style=&quot;background-attachment: initial; background-clip: initial; background-image: initial; background-origin: initial; background-position: initial; background-repeat: initial; background-size: initial; height: 13.7pt; padding: 0cm 2pt; width: 171pt;&quot; valign=&quot;top&quot; width=&quot;228&quot;&gt;&lt;span style=&quot;font-family: inherit;&quot;&gt;&lt;br /&gt;Случайные леса (random forests)&lt;/span&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.7pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;rf&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.7pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;randomForest&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.7pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 126.0pt;&quot; valign=&quot;top&quot; width=&quot;168&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;mtry&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt; &lt;/tr&gt;&lt;tr style=&quot;height: 13.7pt; mso-yfti-irow: 10;&quot;&gt;  &lt;td style=&quot;background: white; height: 13.7pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;cforest&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.7pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;party&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.7pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 126.0pt;&quot; valign=&quot;top&quot; width=&quot;168&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;mtry&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt; &lt;/tr&gt;&lt;tr style=&quot;height: 13.45pt; mso-yfti-irow: 11;&quot;&gt;  &lt;td style=&quot;background-attachment: initial; background-clip: initial; background-image: initial; background-origin: initial; background-position: initial; background-repeat: initial; background-size: initial; height: 13.45pt; padding: 0cm 2pt; width: 171pt;&quot; valign=&quot;top&quot; width=&quot;228&quot;&gt;&lt;span style=&quot;font-family: inherit;&quot;&gt;&lt;br /&gt;Деревья на основе бэггинга (bagged trees)&lt;/span&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.45pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;treebag&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.45pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;ipred&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.45pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 126.0pt;&quot; valign=&quot;top&quot; width=&quot;168&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;/td&gt; &lt;/tr&gt;&lt;tr style=&quot;height: 13.2pt; mso-yfti-irow: 12;&quot;&gt;  &lt;td style=&quot;background-attachment: initial; background-clip: initial; background-image: initial; background-origin: initial; background-position: initial; background-repeat: initial; background-size: initial; height: 13.2pt; padding: 0cm 2pt; width: 171pt;&quot; valign=&quot;top&quot; width=&quot;228&quot;&gt;&lt;span style=&quot;font-family: inherit;&quot;&gt;&lt;br /&gt;Нейронные сети (neural networks)&lt;/span&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.2pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;nnet&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.2pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;nnet&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.2pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 126.0pt;&quot; valign=&quot;top&quot; width=&quot;168&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;decay&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; mso-ansi-language: EN-US; mso-hansi-font-family: &amp;quot;Courier New&amp;quot;;&quot;&gt;, &lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;size&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt; &lt;/tr&gt;&lt;tr style=&quot;height: 13.9pt; mso-yfti-irow: 13;&quot;&gt;  &lt;td style=&quot;background-attachment: initial; background-clip: initial; background-image: initial; background-origin: initial; background-position: initial; background-repeat: initial; background-size: initial; height: 13.9pt; padding: 0cm 2pt; width: 171pt;&quot; valign=&quot;top&quot; width=&quot;228&quot;&gt;&lt;span style=&quot;font-family: inherit;&quot;&gt;&lt;br /&gt;Модели на основе частных наименьших квадратов (partial least squares)&lt;/span&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.9pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;pls&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.9pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;pls&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: inherit; mso-ansi-language: EN-US;&quot;&gt;,&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt; caret&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.9pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 126.0pt;&quot; valign=&quot;top&quot; width=&quot;168&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;ncomp&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt; &lt;/tr&gt;&lt;tr style=&quot;height: 13.45pt; mso-yfti-irow: 14;&quot;&gt;  &lt;td style=&quot;background-attachment: initial; background-clip: initial; background-image: initial; background-origin: initial; background-position: initial; background-repeat: initial; background-size: initial; height: 13.45pt; padding: 0cm 2pt; width: 171pt;&quot; valign=&quot;top&quot; width=&quot;228&quot;&gt;&lt;span style=&quot;font-family: inherit;&quot;&gt;&lt;br /&gt;Машины опорных векторов с RBF ядром (support vector machines, RBF kernel)&lt;/span&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.45pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;svmRadial&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.45pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;kernlab&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.45pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 126.0pt;&quot; valign=&quot;top&quot; width=&quot;168&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;sigma&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; mso-ansi-language: EN-US; mso-hansi-font-family: &amp;quot;Courier New&amp;quot;;&quot;&gt;, &lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;C&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt; &lt;/tr&gt;&lt;tr style=&quot;height: 13.2pt; mso-yfti-irow: 15;&quot;&gt;  &lt;td style=&quot;background-attachment: initial; background-clip: initial; background-image: initial; background-origin: initial; background-position: initial; background-repeat: initial; background-size: initial; height: 13.2pt; padding: 0cm 2pt; width: 171pt;&quot; valign=&quot;top&quot; width=&quot;228&quot;&gt;&lt;span style=&quot;font-family: inherit;&quot;&gt;&lt;br /&gt;Машины опорных векторов с полиномиальным ядром (support vector machines, polynomial kernel)&lt;/span&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.2pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;svmPoly&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.2pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;kernlab&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.2pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 126.0pt;&quot; valign=&quot;top&quot; width=&quot;168&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;scale&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; mso-ansi-language: EN-US; mso-hansi-font-family: &amp;quot;Courier New&amp;quot;;&quot;&gt;, &lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;degree&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; mso-ansi-language: EN-US; mso-hansi-font-family: &amp;quot;Courier New&amp;quot;;&quot;&gt;, &lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;C&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt; &lt;/tr&gt;&lt;tr style=&quot;height: 13.2pt; mso-yfti-irow: 16;&quot;&gt;  &lt;td style=&quot;background-attachment: initial; background-clip: initial; background-image: initial; background-origin: initial; background-position: initial; background-repeat: initial; background-size: initial; height: 13.2pt; padding: 0cm 2pt; width: 171pt;&quot; valign=&quot;top&quot; width=&quot;228&quot;&gt;&lt;br /&gt;Гауссовы процессы с  RBF ядром (Gaussian processes, RBF kernel)&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.2pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;gaussprRadial&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.2pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;kernlab&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.2pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 126.0pt;&quot; valign=&quot;top&quot; width=&quot;168&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;sigma&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt; &lt;/tr&gt;&lt;tr style=&quot;height: 13.2pt; mso-yfti-irow: 17;&quot;&gt;  &lt;td style=&quot;background-attachment: initial; background-clip: initial; background-image: initial; background-origin: initial; background-position: initial; background-repeat: initial; background-size: initial; height: 13.2pt; padding: 0cm 2pt; width: 171pt;&quot; valign=&quot;top&quot; width=&quot;228&quot;&gt;&lt;span style=&quot;font-family: inherit;&quot;&gt;&lt;br /&gt;Гауссовы процессы с  полиномиальным ядром (Gaussian processes, polynomial kernel)&lt;/span&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.2pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;gaussprPoly&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.2pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;kernlab&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.2pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 126.0pt;&quot; valign=&quot;top&quot; width=&quot;168&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;scale&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; mso-ansi-language: EN-US; mso-hansi-font-family: &amp;quot;Courier New&amp;quot;;&quot;&gt;, &lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;degree&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt; &lt;/tr&gt;&lt;tr style=&quot;height: 20.15pt; mso-yfti-irow: 18;&quot;&gt;  &lt;td style=&quot;background-attachment: initial; background-clip: initial; background-image: initial; background-origin: initial; background-position: initial; background-repeat: initial; background-size: initial; height: 20.15pt; padding: 0cm 2pt; width: 171pt;&quot; valign=&quot;top&quot; width=&quot;228&quot;&gt;&lt;br /&gt;Линейные модели наименьших квадратов (linear least squares)&lt;/td&gt;  &lt;td style=&quot;background: white; height: 20.15pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;lm&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 20.15pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;stats&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 20.15pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 126.0pt;&quot; valign=&quot;top&quot; width=&quot;168&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;/td&gt; &lt;/tr&gt;&lt;tr style=&quot;height: 13.7pt; mso-yfti-irow: 19;&quot;&gt;  &lt;td style=&quot;background-attachment: initial; background-clip: initial; background-image: initial; background-origin: initial; background-position: initial; background-repeat: initial; background-size: initial; height: 13.7pt; padding: 0cm 2pt; width: 171pt;&quot; valign=&quot;top&quot; width=&quot;228&quot;&gt;&lt;br /&gt;Многомерные адаптивные регрессионные сплайны (multivariate adaptive regression splines, MARS)&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.7pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;earth&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; mso-ansi-language: EN-US;&quot;&gt;, &lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US; mso-hansi-font-family: Calibri;&quot;&gt;mars&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.7pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;earth&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.7pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 126.0pt;&quot; valign=&quot;top&quot; width=&quot;168&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;degree&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; mso-ansi-language: EN-US; mso-hansi-font-family: &amp;quot;Courier New&amp;quot;;&quot;&gt;, &lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;nprune&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt; &lt;/tr&gt;&lt;tr style=&quot;height: 13.45pt; mso-yfti-irow: 20;&quot;&gt;  &lt;td style=&quot;background-attachment: initial; background-clip: initial; background-image: initial; background-origin: initial; background-position: initial; background-repeat: initial; background-size: initial; height: 13.45pt; padding: 0cm 2pt; width: 171pt;&quot; valign=&quot;top&quot; width=&quot;228&quot;&gt;&lt;br /&gt;MARS на основе бэггинга (bagged MARS)&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.45pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;bagEarth&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.45pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;caret&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: inherit; mso-ansi-language: EN-US;&quot;&gt;,&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt; earth&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.45pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 126.0pt;&quot; valign=&quot;top&quot; width=&quot;168&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;degree&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; mso-ansi-language: EN-US; mso-hansi-font-family: &amp;quot;Courier New&amp;quot;;&quot;&gt;, &lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;nprune&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt; &lt;/tr&gt;&lt;tr style=&quot;height: 13.2pt; mso-yfti-irow: 21;&quot;&gt;  &lt;td style=&quot;background-attachment: initial; background-clip: initial; background-image: initial; background-origin: initial; background-position: initial; background-repeat: initial; background-size: initial; height: 13.2pt; padding: 0cm 2pt; width: 171pt;&quot; valign=&quot;top&quot; width=&quot;228&quot;&gt;&lt;br /&gt;Эластичные сети (elastic net)&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.2pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;enet&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.2pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;elasticnet&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.2pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 126.0pt;&quot; valign=&quot;top&quot; width=&quot;168&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;lambda&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; mso-ansi-language: EN-US; mso-hansi-font-family: &amp;quot;Courier New&amp;quot;;&quot;&gt;, &lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;fraction&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt; &lt;/tr&gt;&lt;tr style=&quot;height: 13.45pt; mso-yfti-irow: 22;&quot;&gt;  &lt;td style=&quot;background-attachment: initial; background-clip: initial; background-image: initial; background-origin: initial; background-position: initial; background-repeat: initial; background-size: initial; height: 13.45pt; padding: 0cm 2pt; width: 171pt;&quot; valign=&quot;top&quot; width=&quot;228&quot;&gt;&lt;br /&gt;Модели лассо (lasso)&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.45pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;lasso&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.45pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;elasticnet&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.45pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 126.0pt;&quot; valign=&quot;top&quot; width=&quot;168&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;fraction&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt; &lt;/tr&gt;&lt;tr style=&quot;height: 13.45pt; mso-yfti-irow: 23;&quot;&gt;  &lt;td style=&quot;background-attachment: initial; background-clip: initial; background-image: initial; background-origin: initial; background-position: initial; background-repeat: initial; background-size: initial; height: 13.45pt; padding: 0cm 2pt; width: 171pt;&quot; valign=&quot;top&quot; width=&quot;228&quot;&gt;&lt;br /&gt;Машины релевантных векторов с  RBF ядром (relevance vector machines, RBF kernel)&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.45pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;rvmRadial&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.45pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;kernlab&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.45pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 126.0pt;&quot; valign=&quot;top&quot; width=&quot;168&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;sigma&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt; &lt;/tr&gt;&lt;tr style=&quot;height: 13.2pt; mso-yfti-irow: 24;&quot;&gt;  &lt;td style=&quot;background-attachment: initial; background-clip: initial; background-image: initial; background-origin: initial; background-position: initial; background-repeat: initial; background-size: initial; height: 13.2pt; padding: 0cm 2pt; width: 171pt;&quot; valign=&quot;top&quot; width=&quot;228&quot;&gt;&lt;br /&gt;Машины релевантных векторов с  полиномиальным ядром (relevance vector machines, polynomial kernel)&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.2pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;rvmPoly&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.2pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;kernlab&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.2pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 126.0pt;&quot; valign=&quot;top&quot; width=&quot;168&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;scale&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; mso-ansi-language: EN-US; mso-hansi-font-family: &amp;quot;Courier New&amp;quot;;&quot;&gt;, &lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;degree&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt; &lt;/tr&gt;&lt;tr style=&quot;height: 19.9pt; mso-yfti-irow: 25;&quot;&gt;  &lt;td style=&quot;background-attachment: initial; background-clip: initial; background-image: initial; background-origin: initial; background-position: initial; background-repeat: initial; background-size: initial; height: 19.9pt; padding: 0cm 2pt; width: 171pt;&quot; valign=&quot;top&quot; width=&quot;228&quot;&gt;&lt;br /&gt;Линейный дискриминантный анализ (linear discriminant analysis)&lt;/td&gt;  &lt;td style=&quot;background: white; height: 19.9pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;lda&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 19.9pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;MASS&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 19.9pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 126.0pt;&quot; valign=&quot;top&quot; width=&quot;168&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;/td&gt; &lt;/tr&gt;&lt;tr style=&quot;height: 13.9pt; mso-yfti-irow: 26;&quot;&gt;  &lt;td style=&quot;background-attachment: initial; background-clip: initial; background-image: initial; background-origin: initial; background-position: initial; background-repeat: initial; background-size: initial; height: 13.9pt; padding: 0cm 2pt; width: 171pt;&quot; valign=&quot;top&quot; width=&quot;228&quot;&gt;&lt;br /&gt;Пошаговый диагональный дискриминантный анализ (stepwise diagonal discriminant analysis)&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.9pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;sddaLDA&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: inherit; mso-ansi-language: EN-US;&quot;&gt;,&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt; sddaQDA&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.9pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;SDDA&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.9pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 126.0pt;&quot; valign=&quot;top&quot; width=&quot;168&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;/td&gt; &lt;/tr&gt;&lt;tr style=&quot;height: 13.9pt; mso-yfti-irow: 27;&quot;&gt;  &lt;td style=&quot;background-attachment: initial; background-clip: initial; background-image: initial; background-origin: initial; background-position: initial; background-repeat: initial; background-size: initial; height: 13.9pt; padding: 0cm 2pt; width: 171pt;&quot; valign=&quot;top&quot; width=&quot;228&quot;&gt;&lt;br /&gt;Логистическая регрессия для двух или более классов (logistic/multinomial regression)&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.9pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;multinom&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.9pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;nnet&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.9pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 126.0pt;&quot; valign=&quot;top&quot; width=&quot;168&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;decay&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt; &lt;/tr&gt;&lt;tr style=&quot;height: 13.2pt; mso-yfti-irow: 28;&quot;&gt;  &lt;td style=&quot;background-attachment: initial; background-clip: initial; background-image: initial; background-origin: initial; background-position: initial; background-repeat: initial; background-size: initial; height: 13.2pt; padding: 0cm 2pt; width: 171pt;&quot; valign=&quot;top&quot; width=&quot;228&quot;&gt;&lt;br /&gt;Регуляризованный дискриминантный анализ (regularized discriminant analysis)&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.2pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;rda&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.2pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;klaR&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.2pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 126.0pt;&quot; valign=&quot;top&quot; width=&quot;168&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;lambda&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; mso-ansi-language: EN-US; mso-hansi-font-family: &amp;quot;Courier New&amp;quot;;&quot;&gt;, &lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;gamma&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt; &lt;/tr&gt;&lt;tr style=&quot;height: 12.95pt; mso-yfti-irow: 29;&quot;&gt;  &lt;td style=&quot;background-attachment: initial; background-clip: initial; background-image: initial; background-origin: initial; background-position: initial; background-repeat: initial; background-size: initial; height: 12.95pt; padding: 0cm 2pt; width: 171pt;&quot; valign=&quot;top&quot; width=&quot;228&quot;&gt;&lt;br /&gt;Гибкий дискриминантный анализ (flexible discriminant analysis, FDA)&lt;/td&gt;  &lt;td style=&quot;background: white; height: 12.95pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;fda&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 12.95pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;mda, earth&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 12.95pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 126.0pt;&quot; valign=&quot;top&quot; width=&quot;168&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;degree&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; mso-ansi-language: EN-US; mso-hansi-font-family: &amp;quot;Courier New&amp;quot;;&quot;&gt;, &lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;nprune&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt; &lt;/tr&gt;&lt;tr style=&quot;height: 27.85pt; mso-yfti-irow: 30;&quot;&gt;  &lt;td style=&quot;background-attachment: initial; background-clip: initial; background-image: initial; background-origin: initial; background-position: initial; background-repeat: initial; background-size: initial; height: 27.85pt; padding: 0cm 2pt; width: 171pt;&quot; valign=&quot;top&quot; width=&quot;228&quot;&gt;&lt;br /&gt;FDA на основе бэггинга (Bagged FDA)&lt;/td&gt;  &lt;td style=&quot;background: white; height: 27.85pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;bagFDA*&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 27.85pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;caret&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: inherit; mso-ansi-language: EN-US;&quot;&gt;,&amp;nbsp;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;earth&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 27.85pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 126.0pt;&quot; valign=&quot;top&quot; width=&quot;168&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;degree&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; mso-ansi-language: EN-US; mso-hansi-font-family: &amp;quot;Courier New&amp;quot;;&quot;&gt;, &lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;nprune&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt; &lt;/tr&gt;&lt;tr style=&quot;height: 13.2pt; mso-yfti-irow: 31;&quot;&gt;  &lt;td style=&quot;background-attachment: initial; background-clip: initial; background-image: initial; background-origin: initial; background-position: initial; background-repeat: initial; background-size: initial; height: 13.2pt; padding: 0cm 2pt; width: 171pt;&quot; valign=&quot;top&quot; width=&quot;228&quot;&gt;&lt;br /&gt;Машины опорных векторов на основе метода наименьших квадратов (least squares support vector machines)&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.2pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;ssvmRadial&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.2pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;kernlab&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.2pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 126.0pt;&quot; valign=&quot;top&quot; width=&quot;168&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;sigma&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt; &lt;/tr&gt;&lt;tr style=&quot;height: 13.45pt; mso-yfti-irow: 32;&quot;&gt;  &lt;td style=&quot;background-attachment: initial; background-clip: initial; background-image: initial; background-origin: initial; background-position: initial; background-repeat: initial; background-size: initial; height: 13.45pt; padding: 0cm 2pt; width: 171pt;&quot; valign=&quot;top&quot; width=&quot;228&quot;&gt;&lt;br /&gt;Метод &lt;i&gt;k&lt;/i&gt;-ближайших соседей (k nearest neighbours)&lt;/td&gt;  &lt;td style=&quot;background-attachment: initial; background-clip: initial; background-image: initial; background-origin: initial; background-position: initial; background-repeat: initial; background-size: initial; height: 13.45pt; padding: 0cm 2pt; width: 90pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;br /&gt;knnЗ&lt;/span&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.45pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;caret&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.45pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 126.0pt;&quot; valign=&quot;top&quot; width=&quot;168&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-size: 12.0pt;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-size: 12.0pt;&quot;&gt;k&lt;/span&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt; &lt;/tr&gt;&lt;tr style=&quot;height: 13.45pt; mso-yfti-irow: 33;&quot;&gt;  &lt;td style=&quot;background-attachment: initial; background-clip: initial; background-image: initial; background-origin: initial; background-position: initial; background-repeat: initial; background-size: initial; height: 13.45pt; padding: 0cm 2pt; width: 171pt;&quot; valign=&quot;top&quot; width=&quot;228&quot;&gt;&lt;br /&gt;Разделение по центроидам (nearest shrunken centroids)&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.45pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;pam&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.45pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;pamr&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.45pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 126.0pt;&quot; valign=&quot;top&quot; width=&quot;168&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;threshold&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt; &lt;/tr&gt;&lt;tr style=&quot;height: 13.45pt; mso-yfti-irow: 34;&quot;&gt;  &lt;td style=&quot;background-attachment: initial; background-clip: initial; background-image: initial; background-origin: initial; background-position: initial; background-repeat: initial; background-size: initial; height: 13.45pt; padding: 0cm 2pt; width: 171pt;&quot; valign=&quot;top&quot; width=&quot;228&quot;&gt;&lt;br /&gt;Наивный байесовский классификатор (naive Bayes classifier)&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.45pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;nb&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.45pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;klaR&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 13.45pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 126.0pt;&quot; valign=&quot;top&quot; width=&quot;168&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;usekernel&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt; &lt;/tr&gt;&lt;tr style=&quot;height: 14.15pt; mso-yfti-irow: 35;&quot;&gt;  &lt;td style=&quot;background-attachment: initial; background-clip: initial; background-image: initial; background-origin: initial; background-position: initial; background-repeat: initial; background-size: initial; height: 14.15pt; padding: 0cm 2pt; width: 171pt;&quot; valign=&quot;top&quot; width=&quot;228&quot;&gt;&lt;br /&gt;Обобщенный метод частных наименьших квадратов (generalized partial least squares)&lt;/td&gt;  &lt;td style=&quot;background: white; height: 14.15pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;gpls&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 14.15pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;gpls&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; height: 14.15pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 126.0pt;&quot; valign=&quot;top&quot; width=&quot;168&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;K.prov&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt; &lt;/tr&gt;&lt;tr style=&quot;height: 27.6pt; mso-yfti-irow: 36; mso-yfti-lastrow: yes;&quot;&gt;  &lt;td style=&quot;background-attachment: initial; background-clip: initial; background-image: initial; background-origin: initial; background-position: initial; background-repeat: initial; background-size: initial; border: none; height: 27.6pt; padding: 0cm 2pt; width: 171pt;&quot; valign=&quot;top&quot; width=&quot;228&quot;&gt;&lt;br /&gt;Сети с квантованием обучающего вектора (learned vector quantization)&lt;/td&gt;  &lt;td style=&quot;background: white; border-bottom: solid windowtext 1.0pt; border: none; height: 27.6pt; mso-border-bottom-alt: solid windowtext .75pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;lvq&lt;/span&gt;&lt;span style=&quot;font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; border-bottom: solid windowtext 1.0pt; border: none; height: 27.6pt; mso-border-bottom-alt: solid windowtext .75pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 90.0pt;&quot; valign=&quot;top&quot; width=&quot;120&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; mso-ansi-language: EN-US;&quot;&gt;class&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt;  &lt;td style=&quot;background: white; border-bottom: solid windowtext 1.0pt; border: none; height: 27.6pt; mso-border-bottom-alt: solid windowtext .75pt; padding: 0cm 2.0pt 0cm 2.0pt; width: 126.0pt;&quot; valign=&quot;top&quot; width=&quot;168&quot;&gt;&lt;div class=&quot;MsoNormal&quot; style=&quot;background: white; line-height: normal; margin-bottom: .0001pt; margin-bottom: 0cm;&quot;&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;color: black; font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;k&lt;/span&gt;&lt;span lang=&quot;EN-US&quot; style=&quot;font-family: &amp;quot;courier new&amp;quot;; font-size: 12.0pt;&quot;&gt;&lt;/span&gt;&lt;/div&gt;&lt;/td&gt; &lt;/tr&gt;&lt;/tbody&gt;&lt;/table&gt;&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;В будущем мы планируем описать большинство из перечисленных методов и продемонстрировать процесс оптимизации их параметров с использованием функции &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;train()&lt;/span&gt;.&lt;br /&gt;&lt;br /&gt;&lt;div style=&quot;text-align: left;&quot;&gt;&lt;span style=&quot;color: #444444;&quot;&gt;&lt;b&gt;Использованные источники:&lt;/b&gt;&lt;/span&gt;&lt;/div&gt;&lt;ul style=&quot;text-align: left;&quot;&gt;&lt;li&gt;&lt;i&gt;Kuhn M.&lt;/i&gt;&amp;nbsp;(2008) Building Predictive Models in R Using the caret Package. Journal of Statistical Software 5:113-142&lt;/li&gt;&lt;li&gt;&lt;i&gt;Шитиков В. К., Розенберг Г. С.&lt;/i&gt;&amp;nbsp;(2014) Рандомизация и бутстреп: статистический анализ в биологии и экологии с использованием R. Тольятти: Кассандра, 314 с. (PDF, данные и скрипты доступны на сайте авторов&amp;nbsp;&lt;a href=&quot;http://www.ievbras.ru/ecostat/Kiril/default.htm&quot;&gt;ievbras.ru/ecostat&lt;/a&gt;)&lt;/li&gt;&lt;/ul&gt;&lt;/div&gt;&lt;/div&gt;</content><link rel='replies' type='text/html' href='http://r-analytics.blogspot.com/2017/01/train-caret_22.html#comment-form' title='Комментарии: 0'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/8303436101707448037'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/8303436101707448037'/><link rel='alternate' type='text/html' href='http://r-analytics.blogspot.com/2017/01/train-caret_22.html' title='Особенности работы с функцией train() из пакета caret'/><author><name>Sergey Mastitsky</name><uri>https://plus.google.com/100743762419147389233</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='32' height='32' src='//lh3.googleusercontent.com/-S7CBBqIIWg0/AAAAAAAAAAI/AAAAAAAAANI/e7vggjNa3Mo/s512-c/photo.jpg'/></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://1.bp.blogspot.com/-xSl8_UGEHKw/WIS_z_EbhRI/AAAAAAAADKA/80Wo6pYHFdcqkvWHLJXWiLWg9utRQnb_ACLcB/s72-c/carrots13.png" height="72" width="72"/><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-9120847565867616203.post-7142059808357478590</id><published>2017-01-08T15:27:00.000+00:00</published><updated>2017-01-22T18:37:51.326+00:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="R-пакеты"/><title type='text'>Обзор интересных R-пакетов за декабрь 2016 г.</title><content type='html'>&lt;div style=&quot;text-align: right;&quot;&gt;Автор: &lt;i&gt;Сергей Мастицкий&lt;/i&gt;&lt;/div&gt;&lt;br /&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;a href=&quot;https://2.bp.blogspot.com/-PwjyFwnCE0k/WHJYjkm9zFI/AAAAAAAADJM/fE0pQVg2jAM3w_CBD5G9siFPyynaFp1FgCLcB/s1600/r_lexicon.png&quot; imageanchor=&quot;1&quot; style=&quot;clear: left; float: left; margin-bottom: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; height=&quot;181&quot; src=&quot;https://2.bp.blogspot.com/-PwjyFwnCE0k/WHJYjkm9zFI/AAAAAAAADJM/fE0pQVg2jAM3w_CBD5G9siFPyynaFp1FgCLcB/s200/r_lexicon.png&quot; width=&quot;200&quot; /&gt;&lt;/a&gt;&lt;/div&gt;&lt;ul&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://github.com/cloudyr/aws.ses&quot; target=&quot;_blank&quot;&gt;aws.ses&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- R-клиент для работы с сервисом&amp;nbsp;&lt;a href=&quot;https://aws.amazon.com/ses/&quot; target=&quot;_blank&quot;&gt;AWS Simple Email Service&lt;/a&gt;.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;a href=&quot;https://github.com/hrbrmstr/censys&quot; target=&quot;_blank&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;censys&lt;/span&gt;&lt;/a&gt;&amp;nbsp;- R-клиент для поискового сервиса&amp;nbsp;&lt;a href=&quot;https://www.censys.io/&quot; target=&quot;_blank&quot;&gt;Censys&lt;/a&gt;.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://github.com/alishinski/clustRcompaR&quot; target=&quot;_blank&quot;&gt;clustRcompaR&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- пакет для выполнения&amp;nbsp;&lt;a href=&quot;https://ru.wikipedia.org/wiki/%D0%9A%D0%BB%D0%B0%D1%81%D1%82%D0%B5%D1%80%D0%B8%D0%B7%D0%B0%D1%86%D0%B8%D1%8F_%D0%B4%D0%BE%D0%BA%D1%83%D0%BC%D0%B5%D0%BD%D1%82%D0%BE%D0%B2&quot; target=&quot;_blank&quot;&gt;кластеризации документов&lt;/a&gt;&amp;nbsp;(например, для обнаружения групп документов, схожих по своей тематике). Позволяет автоматически выделять оптимальное число кластеров и оценивать качество получаемых решений путем сравнения с документами, чья групповая принадлежность известна.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://github.com/haleyjeppson/ggmosaic&quot; target=&quot;_blank&quot;&gt;ggmosaic&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- пакет для создания&amp;nbsp;&lt;a href=&quot;https://en.wikipedia.org/wiki/Mosaic_plot&quot; target=&quot;_blank&quot;&gt;мозаичных диаграмм&lt;/a&gt;&amp;nbsp;в стиле&amp;nbsp;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;http://ggplot2.org/&quot; target=&quot;_blank&quot;&gt;ggplot2&lt;/a&gt;&lt;/span&gt;.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://github.com/trinker/gofastr&quot; target=&quot;_blank&quot;&gt;gofastr&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- пакет для быстрого формирования&amp;nbsp;&lt;a href=&quot;https://ru.wikipedia.org/wiki/%D0%A2%D0%B5%D1%80%D0%BC-%D0%B4%D0%BE%D0%BA%D1%83%D0%BC%D0%B5%D0%BD%D1%82%D0%BD%D0%B0%D1%8F_%D0%BC%D0%B0%D1%82%D1%80%D0%B8%D1%86%D0%B0&quot; target=&quot;_blank&quot;&gt;терм-документных матриц&lt;/a&gt;.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://github.com/trinker/lexicon/&quot; target=&quot;_blank&quot;&gt;lexicon&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- набор лексических таблиц, тематических списков слов и словарей (например, наиболее часто встречающиеся имена и фамилии в США, коллекция&amp;nbsp;&lt;a href=&quot;https://ru.wikipedia.org/wiki/%D0%AD%D0%BC%D0%BE%D1%82%D0%B8%D0%BA%D0%BE%D0%BD&quot; target=&quot;_blank&quot;&gt;эмотиконов&lt;/a&gt;, список распространенных сокращений и др.). Может оказаться полезным при выполнении анализа текстовых данных.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;a href=&quot;https://github.com/eddelbuettel/nanotime&quot; target=&quot;_blank&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;nanotime&lt;/span&gt;&lt;/a&gt;&amp;nbsp;- пакет для работы с метками времени с разрешением на уровне наносекунд.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/rtrie/index.html&quot; target=&quot;_blank&quot;&gt;rtrie&lt;/a&gt;&lt;/span&gt; - набор функций для визуализации &lt;a href=&quot;https://ru.wikipedia.org/wiki/%D0%9F%D1%80%D0%B5%D1%84%D0%B8%D0%BA%D1%81%D0%BD%D0%BE%D0%B5_%D0%B4%D0%B5%D1%80%D0%B5%D0%B2%D0%BE&quot; target=&quot;_blank&quot;&gt;префиксных деревьев&lt;/a&gt; (англ. &lt;i&gt;trie&lt;/i&gt;). Подобные структуры данных широко используются для решения задач, связанных с выполнением быстрого поиска, автокоррекцией слов, рекомендацией следующего слова в предложении и др.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://github.com/nealrichardson/skeletor&quot; target=&quot;_blank&quot;&gt;skeletor&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- создание &quot;скелета&quot; будущего пакета для R. В отличие от стандартных утилит (базовая R-функция&amp;nbsp;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;package.skeleton()&lt;/span&gt;&amp;nbsp;или&amp;nbsp;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;create()&lt;/span&gt;&amp;nbsp;из пакета&amp;nbsp;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;devtools&lt;/span&gt;),&amp;nbsp;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;skeletor&lt;/span&gt;&amp;nbsp;создает &quot;болванки&quot; с более богатым (и полезным) содержимым.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://github.com/mlampros/textTinyR&quot; target=&quot;_blank&quot;&gt;textTinyR&lt;/a&gt;&lt;/span&gt; - набор функций для выполнения анализа текстовых данных большого объема (создание словарей, &lt;a href=&quot;https://ru.wikipedia.org/wiki/%D0%A2%D0%B5%D1%80%D0%BC-%D0%B4%D0%BE%D0%BA%D1%83%D0%BC%D0%B5%D0%BD%D1%82%D0%BD%D0%B0%D1%8F_%D0%BC%D0%B0%D1%82%D1%80%D0%B8%D1%86%D0%B0&quot; target=&quot;_blank&quot;&gt;терм-документных матриц&lt;/a&gt;, подсчет частоты встречаемости слов и т.п. типичные задачи). Обработка выполняется по частям, что позволяет анализировать данные, объем которых превышает имеющийся объем памяти. Примеры можно найти в &lt;a href=&quot;http://mlampros.github.io/2017/01/05/textTinyR_package/&quot; target=&quot;_blank&quot;&gt;блоге автора&lt;/a&gt;.&lt;/li&gt;&lt;/ul&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;script async src=&quot;//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js&quot;&gt;&lt;/script&gt;&lt;!-- R Analytics Responsive --&gt;&lt;ins class=&quot;adsbygoogle&quot;      style=&quot;display:block&quot;      data-ad-client=&quot;ca-pub-6457966355894443&quot;      data-ad-slot=&quot;8123690788&quot;      data-ad-format=&quot;auto&quot;&gt;&lt;/ins&gt;&lt;script&gt;(adsbygoogle = window.adsbygoogle || []).push({}); &lt;/script&gt;</content><link rel='replies' type='text/html' href='http://r-analytics.blogspot.com/2017/01/r-2016.html#comment-form' title='Комментарии: 0'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/7142059808357478590'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/7142059808357478590'/><link rel='alternate' type='text/html' href='http://r-analytics.blogspot.com/2017/01/r-2016.html' title='Обзор интересных R-пакетов за декабрь 2016 г.'/><author><name>Sergey Mastitsky</name><uri>https://plus.google.com/100743762419147389233</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='32' height='32' src='//lh3.googleusercontent.com/-S7CBBqIIWg0/AAAAAAAAAAI/AAAAAAAAANI/e7vggjNa3Mo/s512-c/photo.jpg'/></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://2.bp.blogspot.com/-PwjyFwnCE0k/WHJYjkm9zFI/AAAAAAAADJM/fE0pQVg2jAM3w_CBD5G9siFPyynaFp1FgCLcB/s72-c/r_lexicon.png" height="72" width="72"/><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-9120847565867616203.post-3367920865287237361</id><published>2017-01-04T21:33:00.000+00:00</published><updated>2017-01-22T18:38:30.305+00:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="caret"/><category scheme="http://www.blogger.com/atom/ns#" term="kNN"/><category scheme="http://www.blogger.com/atom/ns#" term="пропущенные значения"/><title type='text'>Заполнение пропущенных значений в данных</title><content type='html'>&lt;div dir=&quot;ltr&quot; style=&quot;text-align: right;&quot; trbidi=&quot;on&quot;&gt;Автор: &lt;i&gt;Владимир Шитиков&lt;/i&gt;&lt;/div&gt;&lt;div dir=&quot;ltr&quot; style=&quot;text-align: left;&quot; trbidi=&quot;on&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div dir=&quot;ltr&quot; style=&quot;text-align: left;&quot; trbidi=&quot;on&quot;&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;К сожалению, на практике в ходе сбора данных далеко не всегда удается получить полностью укомплектованные их наборы. Пропуски отдельных значений являются повсеместным явлением и поэтому, прежде чем начать применять статистические методы, обрабатываемые данные следует привести к &quot;каноническому&quot; виду. Для этого необходимо, либо удалить фрагменты объектов с недостающими элементами, либо заменить имеющиеся пропуски на некоторые разумные значения.&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;script async src=&quot;//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js&quot;&gt;&lt;/script&gt;&lt;!-- R Analytics Responsive --&gt;&lt;ins class=&quot;adsbygoogle&quot;      style=&quot;display:block&quot;      data-ad-client=&quot;ca-pub-6457966355894443&quot;      data-ad-slot=&quot;8123690788&quot;      data-ad-format=&quot;auto&quot;&gt;&lt;/ins&gt;&lt;script&gt;(adsbygoogle = window.adsbygoogle || []).push({}); &lt;/script&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;a name=&#39;more&#39;&gt;&lt;/a&gt;Проблема &quot;борьбы с пропусками&quot; столь же сложна, как и сама статистика, поскольку в этой области существует впечатляющее множество подходов. В русскоязычных книгах по использованию R (Кабаков, 2014; Мастицкий, Шитиков, 2015) бегло представлены только некоторые функции пакета &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;mice&lt;/span&gt;, который, несмотря на свою &quot;продвинутость&quot;, мало удобен для практической работы. Хорошей альтернативой являются методы &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&quot;knnImpute&quot;&lt;/span&gt;, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&quot;bagImpute&quot;&lt;/span&gt;&amp;nbsp;и&amp;nbsp;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&quot;medianImpute&quot;&lt;/span&gt; функции &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;preProcess()&lt;/span&gt;&amp;nbsp;из пакета &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;caret&lt;/span&gt;, которую мы рассмотрели&amp;nbsp;&lt;a href=&quot;http://r-analytics.blogspot.ru/2015/07/blog-post_19.html&quot;&gt;ранее&lt;/a&gt; как инструмент для трансформации данных.&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Используем для дальнейших примеров таблицу &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;algae&lt;/span&gt;, включенную в пакет &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;DMwR&lt;/span&gt; и содержащую данные гидробиологических исследований обилия водорослей в различных реках. Каждое из 200 наблюдений содержит информацию о 18 переменных, в том числе:&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;ul&gt;&lt;li&gt;три номинальных переменных, описывающих размеры &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;size = c(&quot;large&quot;, &quot;medium&quot;, &quot;small&quot;)&lt;/span&gt; и скорость течения реки &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;speed = c(&quot;high&quot;, &quot;low&quot;, &quot;medium&quot;)&lt;/span&gt;, а также время года &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;season = c(&quot;autumn&quot;, &quot;spring&quot;, &quot;summer&quot;, &quot;winter&quot;)&lt;/span&gt;, сопряженное с&amp;nbsp; моментом взятия проб;&lt;/li&gt;&lt;li&gt;8 переменных, составляющих комплекс наблюдаемых гидрохимических показателей: максимальное значение рН&amp;nbsp; &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;mxPH&lt;/span&gt; (1), минимальное содержание кислорода &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;mnO2&lt;/span&gt; (2), хлориды &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;Cl&lt;/span&gt;&lt;span style=&quot;font-family: inherit;&quot;&gt; &lt;/span&gt;(10), нитраты &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;NO3&lt;/span&gt; (2), ионы аммония &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;NH4&lt;/span&gt; (2), орто-фосфаты &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;oPO4&lt;/span&gt; (2), общий минеральный фосфор &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;PO4&lt;/span&gt; (2) и число клеток хлорофилла &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;Chla&lt;/span&gt; (12); в скобках приведено число пропущенных значений;&lt;/li&gt;&lt;li&gt;средняя численность каждой из 7 групп водорослей &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;a1&lt;/span&gt;-&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;a7 &lt;/span&gt;(видовой состав не идентифицировался).&lt;/li&gt;&lt;/ul&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Читатель может самостоятельно воспользоваться функциями описательной статистики &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;summary&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;()&lt;/span&gt; или &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;describe&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;()&lt;/span&gt; из пакета &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;Hmisc&lt;/span&gt;, а мы постараемся поддержать добрую традицию и привести парочку примеров диаграмм, построенных с использованием пакета&amp;nbsp;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;ggplot2&lt;/span&gt;&amp;nbsp;(подробнее на русском языке см. Мастицкий, 2016):&lt;/div&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;library(DMwR)&lt;br /&gt;library(ggplot2)&lt;br /&gt;&lt;br /&gt;summary(algae) # вывод не приводится&lt;br /&gt;&lt;br /&gt;ggplot(data=algae[&lt;span style=&quot;color: #2060a0;&quot;&gt;!&lt;/span&gt;is.na(algae&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;mnO2),], aes(speed , mnO2)) &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt; &lt;br /&gt;       geom_violin(aes(fill &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; speed), trim &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; FALSE, alpha &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.3&lt;/span&gt;) &lt;span style=&quot;color: #2060a0;&quot;&gt;+ &lt;br /&gt;&lt;/span&gt;       geom_boxplot(aes(fill &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; speed), width &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.2&lt;/span&gt;, outlier.colour &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; NA) + &lt;br /&gt;       theme(legend.position = &quot;NA&quot;)&lt;/pre&gt;&lt;br /&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;a href=&quot;https://2.bp.blogspot.com/-NaAS7QuiYlA/WG04yLEeHwI/AAAAAAAADIY/fH_wyplMhRsMsm0WkslsuOYU08QcQMsEQCLcB/s1600/fig_1.png&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; src=&quot;https://2.bp.blogspot.com/-NaAS7QuiYlA/WG04yLEeHwI/AAAAAAAADIY/fH_wyplMhRsMsm0WkslsuOYU08QcQMsEQCLcB/s1600/fig_1.png&quot; /&gt;&lt;/a&gt;&lt;/div&gt;&lt;div style=&quot;text-align: center;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Мы получили, так называемую &quot;&lt;i&gt;скрипичную&lt;/i&gt;&quot; диаграмму (англ. &lt;i&gt;violin plots&lt;/i&gt;),  которая объединяет в себе идеи диаграмм размахов и кривых распределения вероятности. Суть достаточно проста: продольные края &quot;ящиков с усами&quot; (для сравнения приведены тоже) замещаются кривыми плотности вероятности. В итоге, например, легко можно выяснить не только тот факт, что в потоках с быстрым течением (&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;high&lt;/span&gt;) содержание кислорода выше, но и ознакомиться с характером распределения соответствующих значений.&lt;/div&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Другой пример - категоризованные графики, удобные  для визуализации данных, разбитых на отдельные подмножества (категории), каждое из которых отображается в отдельной диаграмме подходящего типа. Такие диаграммы (или &quot;панели&quot;, от англ. &lt;i&gt;panels&lt;/i&gt;, &lt;i&gt;facets&lt;/i&gt; или &lt;i&gt;multiples&lt;/i&gt;) определенным образом упорядочиваются и размещаются на одной странице:&lt;/div&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;qplot(PO4, a1, data &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; algae[&lt;span style=&quot;color: #2060a0;&quot;&gt;!&lt;/span&gt;is.na(algae&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;PO4), ]) &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;&lt;br /&gt;      facet_grid(facets &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;~&lt;/span&gt; season)&lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt;&lt;br /&gt;      geom_smooth(color=&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;red&quot;&lt;/span&gt;, se = FALSE)  &lt;/pre&gt;&amp;nbsp; &lt;br /&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;/div&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;a href=&quot;https://4.bp.blogspot.com/-fS2qJgAYrwQ/WG06VXKrxKI/AAAAAAAADIk/zcFk47nOhMQ_D9T_Xxs0fEPpandQ_2puwCLcB/s1600/fig_2.png&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; src=&quot;https://4.bp.blogspot.com/-fS2qJgAYrwQ/WG06VXKrxKI/AAAAAAAADIk/zcFk47nOhMQ_D9T_Xxs0fEPpandQ_2puwCLcB/s1600/fig_2.png&quot; /&gt;&lt;/a&gt;&lt;/div&gt;&lt;div style=&quot;text-align: center;&quot;&gt;&lt;br /&gt;&lt;/div&gt;Из представленных графиков легко сделать предположение о том, что численность водорослей группы &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;а1&lt;/span&gt; падает с увеличением концентрации фосфатов. &lt;br /&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Однако в контексте темы этой статьи важно обратить внимание, что мы все время старались блокировать появление пропущенных значений: &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;algae[!is.na(algae$PO4), ]&lt;/span&gt;. Если в обрабатываемой таблице обнаружены недостающие данные, то в общих чертах можно избрать одну из следующих возможных стратегий:&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;/div&gt;&lt;ul&gt;&lt;li&gt;удалить строки с неопределенностями;&lt;/li&gt;&lt;li&gt;заполнить неизвестные значения выборочными статистиками соответствующей переменной (среднее, медиана и т.д.), полагая, что взаимосвязь между переменными в имеющемся наборе данных отсутствует (это соответствует известному &quot;наивному&quot; подходу);&lt;/li&gt;&lt;li&gt;заполнить неизвестные значения с учетом корреляции между переменными или меры близости между наблюдениями;&lt;/li&gt;&lt;li&gt;постараться обходить эту неприятную ситуацию, используя, например, формальный параметр &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace; text-align: left;&quot;&gt;na.rm&lt;/span&gt;&lt;span style=&quot;text-align: left;&quot;&gt; некоторых функций.&lt;/span&gt;&lt;/li&gt;&lt;/ul&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Последняя альтернатива является самой ограничивающей, поскольку она далеко не во всех случаях позволяет осуществить необходимый анализ. В свою очередь, удаление строк данных более радикально, но может привести к серьезным потерям важной информации:&lt;/div&gt;&lt;br /&gt;&lt;pre style=&quot;background: rgb(241, 241, 241);&quot;&gt;&lt;span style=&quot;color: #406040;&quot;&gt;# Число строк с пропущенными значениями&lt;/span&gt;&lt;br /&gt;nrow(algae[&lt;span style=&quot;color: #2060a0;&quot;&gt;!&lt;/span&gt;complete.cases(algae),])&lt;br /&gt;[&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;] &lt;span style=&quot;color: #0080a0;&quot;&gt;&lt;span style=&quot;color: black;&quot;&gt;16&lt;/span&gt;&lt;br /&gt;&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;&lt;br /&gt;&lt;/span&gt;# Их удаление&lt;br /&gt;algae &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; na.omit(algae)&lt;/pre&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Можно удалить не все строки, а только те, в которых число пропущенных значений превышает, например, 20% от общего числа переменных, для чего существует специальная функция из пакета &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;DMwR&lt;/span&gt;:&lt;/div&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;data(algae)&lt;br /&gt;&lt;br /&gt;manyNAs(algae, &lt;span style=&quot;color: #0080a0;&quot;&gt;0.2&lt;/span&gt;)&lt;br /&gt;[&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;]  &lt;span style=&quot;color: #0080a0;&quot;&gt;62&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;&lt;span style=&quot;color: black;&quot;&gt;199&lt;br /&gt;&lt;/span&gt;&lt;/span&gt;&lt;br /&gt;algae &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; algae[&lt;span style=&quot;color: #2060a0;&quot;&gt;-&lt;/span&gt;manyNAs(algae, &lt;span style=&quot;color: #0080a0;&quot;&gt;0.2&lt;/span&gt;), ]&lt;/pre&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;В результате мы удалили только две строки &amp;nbsp;(62-ю и 199-ю), где число пропущенных значений больше одного. Обратите внимание, что выполняя команду &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;data(algae)&lt;/span&gt;, мы обновляем в памяти содержимое этого набора данных.&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Если мы готовы принять гипотезу о том, что зависимости между переменными нет, то простым и часто весьма эффективным способом заполнения пропусков является использование средних значений. В том случае, если есть сомнения в нормальности распределения данных, предпочтительнее использовать медиану. Покажем, как это можно сделать с использованием функции &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;preProcess()&lt;/span&gt;&amp;nbsp;из пакета &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;caret&lt;/span&gt;:&lt;/div&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;data(algae)&lt;br /&gt;ind&lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; apply(algae, &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;, &lt;span style=&quot;color: #2060a0;&quot;&gt;function&lt;/span&gt;(x) sum(is.na(x))) &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;gt; &lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;0&lt;/span&gt;&lt;br /&gt;algae[ind, &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;11&lt;/span&gt;]&lt;br /&gt;    mxPH mnO2    Cl   NO3 NH4    oPO4     PO4  Chla&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;28&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;6.80&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;11.1&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;9.000&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.630&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;20&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;4.000&lt;/span&gt;      NA  &lt;span style=&quot;color: #0080a0;&quot;&gt;2.70&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;38&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;8.00&lt;/span&gt;   NA &lt;span style=&quot;color: #0080a0;&quot;&gt;1.450&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.810&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;10&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;2.500&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;3.000&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.30&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;48&lt;/span&gt;    NA &lt;span style=&quot;color: #0080a0;&quot;&gt;12.6&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;9.000&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.230&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;10&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;5.000&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;6.000&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;1.10&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;55&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;6.60&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;10.8&lt;/span&gt;    NA &lt;span style=&quot;color: #0080a0;&quot;&gt;3.245&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;10&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;1.000&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;6.500&lt;/span&gt;    NA&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;56&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;5.60&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;11.8&lt;/span&gt;    NA &lt;span style=&quot;color: #0080a0;&quot;&gt;2.220&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;5&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;1.000&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;1.000&lt;/span&gt;    NA&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;57&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;5.70&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;10.8&lt;/span&gt;    NA &lt;span style=&quot;color: #0080a0;&quot;&gt;2.550&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;10&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;1.000&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;4.000&lt;/span&gt;    NA&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;58&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;6.60&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;9.5&lt;/span&gt;    NA &lt;span style=&quot;color: #0080a0;&quot;&gt;1.320&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;20&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;1.000&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;6.000&lt;/span&gt;    NA&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;59&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;6.60&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;10.8&lt;/span&gt;    NA &lt;span style=&quot;color: #0080a0;&quot;&gt;2.640&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;10&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;2.000&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;11.000&lt;/span&gt;    NA&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;60&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;6.60&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;11.3&lt;/span&gt;    NA &lt;span style=&quot;color: #0080a0;&quot;&gt;4.170&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;10&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;1.000&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;6.000&lt;/span&gt;    NA&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;61&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;6.50&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;10.4&lt;/span&gt;    NA &lt;span style=&quot;color: #0080a0;&quot;&gt;5.970&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;10&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;2.000&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;14.000&lt;/span&gt;    NA&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;62&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;6.40&lt;/span&gt;   NA    NA    NA  NA      NA  &lt;span style=&quot;color: #0080a0;&quot;&gt;14.000&lt;/span&gt;    NA&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;63&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;7.83&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;11.7&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;4.083&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1.328&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;18&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;3.333&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;6.667&lt;/span&gt;    NA&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;116&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;9.70&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;10.8&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.222&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.406&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;10&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;22.444&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;10.111&lt;/span&gt;    NA&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;161&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;9.00&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;5.8&lt;/span&gt;    NA &lt;span style=&quot;color: #0080a0;&quot;&gt;0.900&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;142&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;102.000&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;186.000&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;68.05&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;184&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;8.00&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;10.9&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;9.055&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.825&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;40&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;21.083&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;56.091&lt;/span&gt;    NA&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;199&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;8.00&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;7.6&lt;/span&gt;    NA    NA  NA      NA      NA    NA&lt;br /&gt;&lt;br /&gt;library(caret)&lt;br /&gt;pPmI &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; preProcess(algae[, &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;11&lt;/span&gt;], method = &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;medianImpute&#39;&lt;/span&gt;)&lt;br /&gt;algae[, &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;11&lt;/span&gt;] &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; predict(pPmI, algae[, &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;11&lt;/span&gt;])&lt;br /&gt;(Imp.Med &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; algae[ind, &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;11&lt;/span&gt;])&lt;br /&gt;    mxPH mnO2     Cl   NO3      NH4    oPO4      PO4   Chla&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;28&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;6.80&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;11.1&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;9.000&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.630&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;20.0000&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;4.000&lt;/span&gt; &lt;b&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;103.2855&lt;/span&gt;&lt;/b&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;2.700&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;38&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;8.00&lt;/span&gt;  &lt;b&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;9.8&lt;/span&gt;&lt;/b&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;1.450&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.810&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;10.0000&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;2.500&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;3.0000&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.300&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;48&lt;/span&gt;  &lt;b&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;8.06&lt;/span&gt;&lt;/b&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;12.6&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;9.000&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.230&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;10.0000&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;5.000&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;6.0000&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;1.100&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;55&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;6.60&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;10.8&lt;/span&gt; &lt;b&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;32.730&lt;/span&gt;&lt;/b&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;3.245&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;10.0000&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;1.000&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;6.5000&lt;/span&gt;  &lt;b&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;5.475&lt;/span&gt;&lt;/b&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;56&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;5.60&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;11.8&lt;/span&gt; &lt;b&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;32.730&lt;/span&gt;&lt;/b&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;2.220&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;5.0000&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;1.000&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;1.0000&lt;/span&gt;  &lt;b&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;5.475&lt;/span&gt;&lt;/b&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;57&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;5.70&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;10.8&lt;/span&gt; &lt;b&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;32.730&lt;/span&gt;&lt;/b&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;2.550&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;10.0000&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;1.000&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;4.0000&lt;/span&gt;  &lt;b&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;5.475&lt;/span&gt;&lt;/b&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;58&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;6.60&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;9.5&lt;/span&gt; &lt;b&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;32.730&lt;/span&gt;&lt;/b&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1.320&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;20.0000&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;1.000&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;6.0000&lt;/span&gt;  &lt;b&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;5.475&lt;/span&gt;&lt;/b&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;59&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;6.60&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;10.8&lt;/span&gt; &lt;b&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;32.730&lt;/span&gt;&lt;/b&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;2.640&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;10.0000&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;2.000&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;11.0000&lt;/span&gt;  &lt;b&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;5.475&lt;/span&gt;&lt;/b&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;60&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;6.60&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;11.3&lt;/span&gt; &lt;b&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;32.730&lt;/span&gt;&lt;/b&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;4.170&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;10.0000&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;1.000&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;6.0000&lt;/span&gt;  &lt;b&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;5.475&lt;/span&gt;&lt;/b&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;61&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;6.50&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;10.4&lt;/span&gt; &lt;b&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;32.730&lt;/span&gt;&lt;/b&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;5.970&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;10.0000&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;2.000&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;14.0000&lt;/span&gt;  &lt;b&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;5.475&lt;/span&gt;&lt;/b&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;62&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;6.40&lt;/span&gt; &lt;b&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;9.8&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;32.730&lt;/span&gt;&lt;/b&gt; &lt;b&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;2.675&lt;/span&gt;&lt;/b&gt; &lt;b&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;103.1665&lt;/span&gt;&lt;/b&gt;  &lt;b&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;40.150&lt;/span&gt;&lt;/b&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;14.0000&lt;/span&gt;  &lt;b&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;5.475&lt;/span&gt;&lt;/b&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;63&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;7.83&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;11.7&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;4.083&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1.328&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;18.0000&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;3.333&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;6.6670&lt;/span&gt;  &lt;b&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;5.475&lt;/span&gt;&lt;/b&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;116&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;9.70&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;10.8&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;0.222&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.406&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;10.0000&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;22.444&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;10.1110&lt;/span&gt;  &lt;b&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;5.475&lt;/span&gt;&lt;/b&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;161&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;9.00&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;5.8&lt;/span&gt; &lt;b&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;32.730&lt;/span&gt;&lt;/b&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.900&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;142.0000&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;102.000&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;186.0000&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;68.050&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;184&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;8.00&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;10.9&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;9.055&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;0.825&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;40.0000&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;21.083&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;56.0910&lt;/span&gt;  &lt;b&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;5.475&lt;/span&gt;&lt;/b&gt;&lt;br /&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;199&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;8.00&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;7.6&lt;/span&gt; &lt;b&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;32.730&lt;/span&gt;&lt;/b&gt; &lt;b&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;2.675&lt;/span&gt;&lt;/b&gt; &lt;b&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;103.1665&lt;/span&gt;&lt;/b&gt;  &lt;b&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;40.150&lt;/span&gt;&lt;/b&gt; &lt;b&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;103.2855&lt;/span&gt;&lt;/b&gt;  &lt;b&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;5.475&lt;/span&gt;&lt;/b&gt;&lt;br /&gt;&lt;/pre&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Альтернативой &quot;наивному&quot; подходу является учет структуры связей между переменными. Например, можно воспользоваться тем, что между двумя формами фосфора &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;oPO4&lt;/span&gt; и &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;PO4&lt;/span&gt; существует тесная корреляционная связь. Тогда, например, можно избавиться от некоторых неопределенностей в показателе &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;PO4&lt;/span&gt;, вычислив его пропущенные значения по уравнению простой регрессии:&lt;/div&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;data(algae)&lt;br /&gt;lm(PO4 &lt;span style=&quot;color: #2060a0;&quot;&gt;~&lt;/span&gt; oPO4, data = algae)&lt;br /&gt;&lt;br /&gt;Coefficients&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;br /&gt;(Intercept)         oPO4  &lt;br /&gt;     &lt;span style=&quot;color: #0080a0;&quot;&gt;42.897&lt;/span&gt;        &lt;span style=&quot;color: #0080a0;&quot;&gt;1.293&lt;/span&gt;  &lt;br /&gt;&lt;span style=&quot;color: #406040;&quot;&gt;&lt;br /&gt;# Функция  вывода значений PO4 в зависимости от оPO4 &lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: maroon;&quot;&gt;fillPO4&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;function&lt;/span&gt;(oP) {&lt;span style=&quot;color: #2060a0;&quot;&gt;if&lt;/span&gt; (is.na(oP)) &lt;span style=&quot;color: #2060a0;&quot;&gt;return&lt;/span&gt;(NA)&lt;br /&gt;      &lt;span style=&quot;color: #2060a0;&quot;&gt;else&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;return&lt;/span&gt;(&lt;span style=&quot;color: #0080a0;&quot;&gt;42.897&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;1.293&lt;/span&gt; &lt;span style=&quot;color: #2060a0;&quot;&gt;*&lt;/span&gt; oP)&lt;br /&gt;}&lt;br /&gt;&lt;span style=&quot;color: #406040;&quot;&gt;&lt;br /&gt;# Восстановление пропущенных значений PO4&lt;/span&gt;&lt;br /&gt;algae[is.na(algae&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;PO4), &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;PO4&#39;&lt;/span&gt;] &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; sapply(algae[is.na(algae&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;PO4), &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;oPO4&#39;&lt;/span&gt;], fillPO4)&lt;br /&gt;algae[ind, &lt;span style=&quot;color: #0080a0;&quot;&gt;10&lt;/span&gt;]&lt;br /&gt; [&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;]  &lt;b&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;48.069&lt;/span&gt;&lt;/b&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;3.000&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;6.000&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;6.500&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;1.000&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;4.000&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;6.000&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;11.000&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;6.000&lt;/span&gt;&lt;br /&gt;[&lt;span style=&quot;color: #0080a0;&quot;&gt;10&lt;/span&gt;]  &lt;span style=&quot;color: #0080a0;&quot;&gt;14.000&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;14.000&lt;/span&gt;   &lt;span style=&quot;color: #0080a0;&quot;&gt;6.667&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;10.111&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;186.000&lt;/span&gt;  &lt;span style=&quot;color: #0080a0;&quot;&gt;56.091&lt;/span&gt;      NA&lt;/pre&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Одно из пропущенных значений удалось восстановить.&lt;/div&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Разумеется, легко придти к мысли не утруждать себя перебором всех возможных корреляций, а учесть все связи скопом. Использование метода &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&quot;&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;bagImpute&quot;&lt;/span&gt; осуществляет для каждой из имеющихся переменных построение множественной бутстреп-агрегированной модели или бэггинг-модели (англ. bagging) на основе деревьев регрессии, принимая все остальные переменные в качестве предикторов. Этот метод мудр и точен, но требует значительных затрат времени на вычисление, особенно при работе с данными большого объема:&lt;/div&gt;&amp;nbsp; &lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;data(algae)&lt;br /&gt;pPbI &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; preProcess(algae[, &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;11&lt;/span&gt;], method = &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;bagImpute&#39;&lt;/span&gt;)&lt;br /&gt;algae[, &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;11&lt;/span&gt;] &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; predict(pPbI, algae[, &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;11&lt;/span&gt;])&lt;br /&gt;Imp.Bag &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; algae[ind, &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;11&lt;/span&gt;]&lt;br /&gt;&lt;/pre&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Наконец, третий метод функции&amp;nbsp;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;preProcess&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;()&lt;/span&gt;&amp;nbsp;для заполнения пропусков - &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&quot;&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;knnImpute&quot;&lt;/span&gt;&amp;nbsp;- основан на простейшем, но чрезвычайно эффективном алгоритме &lt;i&gt;k&lt;/i&gt; ближайших соседей (англ. &lt;i&gt;k-nearest neighbours&lt;/i&gt;) или kNN. В основе метода kNN лежит гипотеза о том, что тестируемый объект &lt;i&gt;d&lt;/i&gt; будет иметь примерно тот же набор признаков, как и обучающие объекты в локальной области его ближайшего окружения:&lt;/div&gt;&lt;br /&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;a href=&quot;https://4.bp.blogspot.com/-pAsyvp-RrMI/WF0tMECDSPI/AAAAAAAADXo/m2gfdirDn74L7N1k7U_LV7r5nqLEt3RdACLcB/s1600/N2_3.png&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; height=&quot;382&quot; src=&quot;https://4.bp.blogspot.com/-pAsyvp-RrMI/WF0tMECDSPI/AAAAAAAADXo/m2gfdirDn74L7N1k7U_LV7r5nqLEt3RdACLcB/s400/N2_3.png&quot; width=&quot;400&quot; /&gt;&lt;/a&gt;&lt;/div&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Если речь идет о классификации, то неизвестный класс объекта определяется голосованием &lt;i&gt;k&lt;/i&gt; его ближайших соседей (на рис. &lt;i&gt;k&amp;nbsp;&lt;/i&gt; = 5). kNN-регрессия оценивает неопределенное значение неизвестной координаты &lt;i&gt;Y&lt;/i&gt;, усредняя известные ее величины для тех же &lt;i&gt;k&lt;/i&gt; соседних точек.&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Одна из важных проблем kNN - выбор метрики, на основе которой оценивается близость объектов. Наиболее общей формулой для подсчета расстояния в &lt;i&gt;m&lt;/i&gt;-мерном пространстве между объектами &lt;span style=&quot;font-family: &amp;quot;times new roman&amp;quot;; font-size: 12.0pt; line-height: 115%;&quot;&gt;&lt;b style=&quot;mso-bidi-font-weight: normal;&quot;&gt;X&lt;span style=&quot;mso-bidi-font-style: normal;&quot;&gt;&lt;sub&gt;1&lt;/sub&gt;&lt;/span&gt;&lt;/b&gt;&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;times new roman&amp;quot;; font-size: 12.0pt; line-height: 115%;&quot;&gt; и  &lt;b style=&quot;mso-bidi-font-weight: normal;&quot;&gt;X&lt;span style=&quot;mso-bidi-font-style: normal;&quot;&gt;&lt;sub&gt;2&lt;i&gt;&amp;nbsp;&lt;/i&gt;&lt;/sub&gt;&lt;/span&gt;&lt;/b&gt;&lt;/span&gt;&amp;nbsp;является мера Минковского:&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;i style=&quot;mso-bidi-font-style: normal;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;times new roman&amp;quot;; font-size: 12.0pt; line-height: 115%;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;/i&gt;&lt;/div&gt;&lt;div style=&quot;text-align: center;&quot;&gt;&lt;i style=&quot;mso-bidi-font-style: normal;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;times new roman&amp;quot;; font-size: 12.0pt; line-height: 115%;&quot;&gt;D&lt;sub&gt;S&lt;/sub&gt;&lt;/span&gt;&lt;/i&gt;&lt;span style=&quot;font-family: &amp;quot;times new roman&amp;quot;; font-size: 12pt; line-height: 115%;&quot;&gt;(&lt;b style=&quot;mso-bidi-font-weight: normal;&quot;&gt;X&lt;span style=&quot;mso-bidi-font-style: normal;&quot;&gt;&lt;sub&gt;1&lt;/sub&gt;&lt;/span&gt;&lt;/b&gt;, &lt;b style=&quot;mso-bidi-font-weight: normal;&quot;&gt;X&lt;span style=&quot;mso-bidi-font-style: normal;&quot;&gt;&lt;sub&gt;2&lt;/sub&gt;&lt;/span&gt;&lt;/b&gt;)&lt;span style=&quot;mso-spacerun: yes;&quot;&gt;&amp;nbsp; &lt;/span&gt;=&lt;span style=&quot;mso-spacerun: yes;&quot;&gt;&amp;nbsp; &lt;/span&gt;[&amp;nbsp;&lt;/span&gt;&lt;span style=&quot;font-size: large;&quot;&gt;Σ&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;symbol&amp;quot;; font-size: 12pt; line-height: 115%;&quot;&gt;&lt;span style=&quot;mso-char-type: symbol; mso-symbol-font-family: Symbol;&quot;&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;times new roman&amp;quot;; font-size: 12pt; line-height: 115%;&quot;&gt; |&lt;span style=&quot;mso-bidi-font-style: normal;&quot;&gt;&lt;i&gt;x&lt;/i&gt;&lt;sub&gt;1&lt;i&gt;i&lt;/i&gt;&lt;/sub&gt;&lt;/span&gt; – &lt;span style=&quot;mso-bidi-font-style: normal;&quot;&gt;&lt;i&gt;x&lt;/i&gt;&lt;sub&gt;2&lt;i&gt;i&lt;/i&gt;&lt;/sub&gt;&lt;/span&gt;|&lt;i style=&quot;mso-bidi-font-style: normal;&quot;&gt;&lt;sup&gt;p&lt;/sup&gt;&lt;/i&gt;]&lt;span style=&quot;mso-bidi-font-style: normal;&quot;&gt;&lt;sup&gt;1&lt;i&gt;/r&lt;/i&gt;&lt;/sup&gt;&lt;/span&gt;,&lt;/span&gt;&lt;/div&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;где&lt;i&gt; i&lt;/i&gt; изменяется от 1 до &lt;i&gt;m&lt;/i&gt;, а &lt;i&gt;r&lt;/i&gt; и &lt;i&gt;p&lt;/i&gt; - задаваемые исследователем параметры, с помощью которых можно осуществить нелинейное масштабирование расстояний между объектами. Мера расстояния по Евклиду получается, если принять в метрике Минковского&lt;i&gt; r&lt;/i&gt; = &lt;i&gt;p&lt;/i&gt; = 2, и является, по-видимому, наиболее общей мерой расстояния, знакомой всем по школьной теореме Пифагора. При&lt;i&gt; r&lt;/i&gt; = &lt;i&gt;p&lt;/i&gt; = 1 имеем &quot;манхеттенское расстояние&quot;, не столь контрастно оценивающее большие разности координат&amp;nbsp;&lt;i&gt;x&lt;/i&gt;.&lt;/div&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Вторая проблема с kNN заключается в решении вопроса о том, на мнение скольких конкретно соседей &lt;i&gt;k&lt;/i&gt; нам целесообразно положиться? В свое время мы обсудим этот вопрос детально, а сейчас будем ориентироваться на значение &lt;i&gt;k&lt;/i&gt;&amp;nbsp; = 5, используемое по умолчанию:&lt;/div&gt;&amp;nbsp; &lt;br /&gt;&lt;div class=&quot;main-section highlighter-parsed-section&quot;&gt;&lt;div class=&quot;code&quot; id=&quot;parsed_code&quot;&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;data(algae)&lt;br /&gt;pPkI &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; preProcess(algae[, &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;11&lt;/span&gt;], method = &lt;span style=&quot;color: #c03030;&quot;&gt;&#39;knnImpute&#39;&lt;/span&gt;)&lt;br /&gt;alg.stand &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; predict(pPkI, algae[, &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;11&lt;/span&gt;])&lt;br /&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Получив в результате применения&amp;nbsp;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;predict()&lt;/span&gt; матрицу переменных с пропущенными значениями, заполненными этим методом, мы с удивлением обнаруживаем, что данные оказались стандартизованными (т.е. центрированными и нормированными на дисперсию). Но, а как иначе можно было посчитать меры близости с переменными, измеренными в разных шкалах? Пришлось для возвращения в исходное состояние применить операцию &quot;решкалирования&quot;:&lt;/div&gt;&amp;nbsp; &lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;m &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; pPkI&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;mean&lt;br /&gt;sd &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; pPkI&lt;span style=&quot;color: #2060a0;&quot;&gt;$&lt;/span&gt;std&lt;br /&gt;algae[, &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;11&lt;/span&gt;] &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; t(apply(alg.stand, &lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;, &lt;span style=&quot;color: #2060a0;&quot;&gt;function&lt;/span&gt; (r) m &lt;span style=&quot;color: #2060a0;&quot;&gt;+&lt;/span&gt; r &lt;span style=&quot;color: #2060a0;&quot;&gt;* &lt;/span&gt;sd))&lt;br /&gt;(Imp.Knn &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; algae[ind, &lt;span style=&quot;color: #0080a0;&quot;&gt;4&lt;/span&gt;&lt;span style=&quot;color: #2060a0;&quot;&gt;:&lt;/span&gt;&lt;span style=&quot;color: #0080a0;&quot;&gt;11&lt;/span&gt;])&lt;/pre&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Наконец, зададимся следующим закономерным вопросом: а какой метод лучше? Обычно эта проблема не имеет теоретического решения и исследователь полагается на собственную интуицию и опыт. Но мы можем оценить, насколько расходятся между собой результаты, полученные каждым способом заполнения. Для этого сформируем блок данных из &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;3 * 16 = 48&lt;/span&gt; строк исходной таблицы с заполненными пропусками тремя методами (&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&quot;Med&quot;&lt;/span&gt;, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&quot;Bag&quot;&lt;/span&gt;, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&quot;Knn&quot;&lt;/span&gt;) и выполним редукцию переменных &lt;a href=&quot;https://ru.wikipedia.org/wiki/%D0%9C%D0%B5%D1%82%D0%BE%D0%B4_%D0%B3%D0%BB%D0%B0%D0%B2%D0%BD%D1%8B%D1%85_%D0%BA%D0%BE%D0%BC%D0%BF%D0%BE%D0%BD%D0%B5%D0%BD%D1%82&quot; target=&quot;_blank&quot;&gt;методом главных компонент&lt;/a&gt; из многомерного пространства в двухмерное. Посмотрим, как &quot;лягут карты&quot; на плоскости:&lt;/div&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f1f1f1; color: black;&quot;&gt;ImpVal &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; rbind(Imp.Med, Imp.Knn)&lt;br /&gt;ImpVal &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; rbind(ImpVal, Imp.Bag)&lt;br /&gt;Imp.Metod &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; as.factor(c(rep(&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;Med&quot;&lt;/span&gt;, &lt;span style=&quot;color: #0080a0;&quot;&gt;16&lt;/span&gt;), rep(&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;Knn&quot;&lt;/span&gt;, &lt;span style=&quot;color: #0080a0;&quot;&gt;16&lt;/span&gt;), rep(&lt;span style=&quot;color: #c03030;&quot;&gt;&quot;Bag&quot;&lt;/span&gt;, &lt;span style=&quot;color: #0080a0;&quot;&gt;16&lt;/span&gt;)))&lt;br /&gt;&lt;br /&gt;library(vegan)&lt;br /&gt;Imp.M &lt;span style=&quot;color: #2060a0;&quot;&gt;&amp;lt;-&lt;/span&gt; rda(ImpVal &lt;span style=&quot;color: #2060a0;&quot;&gt;~&lt;/span&gt; Imp.Metod, ImpVal)&lt;br /&gt;plot(Imp.M, display &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;sites&quot;&lt;/span&gt;, type &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;p&quot;&lt;/span&gt;)&lt;br /&gt;ordihull(Imp.M, Imp.Metod, draw &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #c03030;&quot;&gt;&quot;polygon&quot;&lt;/span&gt;, alpha &lt;span style=&quot;color: #2060a0;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0080a0;&quot;&gt;67&lt;/span&gt;, &lt;br /&gt;         lty = &lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;, col = c(&lt;span style=&quot;color: #0080a0;&quot;&gt;1&lt;/span&gt;, &lt;span style=&quot;color: #0080a0;&quot;&gt;2&lt;/span&gt;, &lt;span style=&quot;color: #0080a0;&quot;&gt;3&lt;/span&gt;), label = TRUE)&lt;br /&gt;&lt;/pre&gt;&lt;br /&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;a href=&quot;https://2.bp.blogspot.com/-zybpILjvnJ8/WG1nTucfdFI/AAAAAAAADI8/JbWYNSkTTXEA3HoeibpooqNP0GNFcK6aACLcB/s1600/fig_3.png&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; src=&quot;https://2.bp.blogspot.com/-zybpILjvnJ8/WG1nTucfdFI/AAAAAAAADI8/JbWYNSkTTXEA3HoeibpooqNP0GNFcK6aACLcB/s1600/fig_3.png&quot; /&gt;&lt;/a&gt;&lt;/div&gt;&lt;div style=&quot;text-align: center;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Мы выделили контуром (англ.&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt; &lt;/span&gt;&lt;span style=&quot;font-family: inherit;&quot;&gt;&lt;i&gt;hull&lt;/i&gt;&lt;/span&gt;), проведенным через крайние точки, области каждого из трех блоков данных и поместили метку метода в центры тяжести полученных многоугольников. Понятно, что медианное заполнение характеризуется меньшей вариацией результатов, поскольку игнорирует специфичность свойств каждого объекта. Оба других метода, учитывающих внутреннюю структуру данных, дали приблизительно похожие результаты.&lt;/div&gt;&lt;br /&gt;&lt;br /&gt;&lt;span style=&quot;color: blue;&quot;&gt;&lt;b&gt;Использованные источники:&lt;/b&gt;&lt;/span&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;/div&gt;&lt;ul&gt;&lt;li&gt;&lt;i&gt;Кабаков Р.И.&lt;/i&gt; R в действии: Анализ и визуализация данных на языке R.&amp;nbsp; М.: ДМК Пресс, 2014.&amp;nbsp; 580 с.&lt;/li&gt;&lt;li&gt;&lt;i&gt;Мастицкий С.Э., Шитиков В.К. &lt;/i&gt;Статистический анализ и визуализация данных с помощью R . М.: ДМК Пресс, 2015. 496 с.&lt;/li&gt;&lt;li&gt;&lt;i&gt;Мастицкий С.Э.&amp;nbsp;&lt;/i&gt;Визуализация данных с помощью &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;ggplot2&lt;/span&gt;. - М.: ДМК Пресс, 2016. 222 с.&lt;/li&gt;&lt;li&gt;&lt;i&gt;Torgo L.&lt;/i&gt; Data mining with R : learning with case studies. Chapman &amp;amp; Hall/CRC, 2011. 272 p.&lt;/li&gt;&lt;/ul&gt;&lt;/div&gt;</content><link rel='replies' type='text/html' href='http://r-analytics.blogspot.com/2017/01/blog-post.html#comment-form' title='Комментарии: 3'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/3367920865287237361'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/3367920865287237361'/><link rel='alternate' type='text/html' href='http://r-analytics.blogspot.com/2017/01/blog-post.html' title='Заполнение пропущенных значений в данных'/><author><name>В.Шитиков</name><uri>http://www.blogger.com/profile/01896460847215383456</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='31' height='32' src='//1.bp.blogspot.com/-5Wttqmz7yaM/WFemBTJup6I/AAAAAAAADUE/VRlomgxu2QsLFzRgbGdGQzmQQ06lRKM7gCK4B/s220/Face2.JPG'/></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://2.bp.blogspot.com/-NaAS7QuiYlA/WG04yLEeHwI/AAAAAAAADIY/fH_wyplMhRsMsm0WkslsuOYU08QcQMsEQCLcB/s72-c/fig_1.png" height="72" width="72"/><thr:total>3</thr:total></entry><entry><id>tag:blogger.com,1999:blog-9120847565867616203.post-3167054372435911647</id><published>2016-12-29T15:56:00.000+00:00</published><updated>2017-01-22T18:38:59.344+00:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="ggplot2"/><category scheme="http://www.blogger.com/atom/ns#" term="h2o"/><category scheme="http://www.blogger.com/atom/ns#" term="R-события"/><title type='text'>Пять наиболее важных событий в мире R по итогам 2016 г.</title><content type='html'>&lt;div style=&quot;text-align: right;&quot;&gt;Автор: &lt;i&gt;Сергей Мастицкий&lt;/i&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;table cellpadding=&quot;0&quot; cellspacing=&quot;0&quot; class=&quot;tr-caption-container&quot; style=&quot;float: left; margin-right: 1em; text-align: left;&quot;&gt;&lt;tbody&gt;&lt;tr&gt;&lt;td style=&quot;text-align: center;&quot;&gt;&lt;a href=&quot;https://2.bp.blogspot.com/-Adfml3edCUM/WGUOuQt2wGI/AAAAAAAADHo/YFrtC72YuU8udsGoxasJPmLm7XY6ZywfACLcB/s1600/Richie_logo-232x300.png&quot; imageanchor=&quot;1&quot; style=&quot;clear: left; margin-bottom: 1em; margin-left: auto; margin-right: auto;&quot;&gt;&lt;img border=&quot;0&quot; height=&quot;200&quot; src=&quot;https://2.bp.blogspot.com/-Adfml3edCUM/WGUOuQt2wGI/AAAAAAAADHo/YFrtC72YuU8udsGoxasJPmLm7XY6ZywfACLcB/s200/Richie_logo-232x300.png&quot; width=&quot;154&quot; /&gt;&lt;/a&gt;&lt;/td&gt;&lt;/tr&gt;&lt;tr&gt;&lt;td class=&quot;tr-caption&quot; style=&quot;text-align: center;&quot;&gt;&lt;i&gt;Рисунок заимствован с сайта&lt;br /&gt;https://www.r-consortium.org&lt;/i&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/tbody&gt;&lt;/table&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Традиционно попытаюсь подвести&amp;nbsp;итоги 2016 г., перечислив пять наиболее важных (на мой взгляд) событий и тенденций, имевших место в этом году в мире R. Если упустил что-то интересное, пожалуйста, сообщите об этом в комментариях.&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;/div&gt;&lt;ul&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;color: blue;&quot;&gt;&lt;b&gt;IDE RStudio v1.0&lt;/b&gt;&lt;/span&gt;. В ноябре компания RStudio &lt;a href=&quot;https://blog.rstudio.org/2016/11/01/announcing-rstudio-v1-0/&quot; target=&quot;_blank&quot;&gt;объявила&lt;/a&gt; о выходе новой версии (1.0) их одноименного &lt;a href=&quot;https://ru.wikipedia.org/wiki/%D0%98%D0%BD%D1%82%D0%B5%D0%B3%D1%80%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%BD%D0%B0%D1%8F_%D1%81%D1%80%D0%B5%D0%B4%D0%B0_%D1%80%D0%B0%D0%B7%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B8&quot; target=&quot;_blank&quot;&gt;IDE&lt;/a&gt; для R. Это был 10-й крупный релиз этого продукта, начиная с февраля 2011 г. В состав RStudio v1.0 вошло большое количество нововведений, среди которых стоит отметить следующие:&lt;/li&gt;&lt;ul&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;работа с &lt;a href=&quot;http://rmarkdown.rstudio.com/r_notebooks.html&quot; target=&quot;_blank&quot;&gt;R Notebooks&lt;/a&gt; - инструментом для интерактивного исполнения R-кода и одновременного документирования получаемых результатов;&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;интеграция с функционалом пакета &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;http://spark.rstudio.com/&quot; target=&quot;_blank&quot;&gt;sparkyr&lt;/a&gt;&lt;/span&gt; (см. ниже);&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;интеграция с функционалом пакета &lt;a href=&quot;https://github.com/rstudio/profvis&quot; target=&quot;_blank&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;profvis&lt;/span&gt;&lt;/a&gt;, предназначенного для выполнения профилирования R-кода;&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;улучшенные средства импорта данных (на основе пакетов&amp;nbsp;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://github.com/tidyverse/readr&quot; target=&quot;_blank&quot;&gt;readr&lt;/a&gt;&lt;/span&gt;, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://github.com/hadley/readxl&quot; target=&quot;_blank&quot;&gt;readxl&lt;/a&gt;&lt;/span&gt;&amp;nbsp;и &lt;a href=&quot;https://github.com/hadley/haven&quot; target=&quot;_blank&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;haven&lt;/span&gt;&lt;/a&gt;);&amp;nbsp;&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;возможность создавать несложные &lt;a href=&quot;http://rmarkdown.rstudio.com/rmarkdown_websites.html&quot; target=&quot;_blank&quot;&gt;веб-сайты&lt;/a&gt; и &lt;a href=&quot;https://bookdown.org/&quot; target=&quot;_blank&quot;&gt;документы размером с книгу&lt;/a&gt;&amp;nbsp;при помощи языка разметки &lt;a href=&quot;http://rmarkdown.rstudio.com/&quot; target=&quot;_blank&quot;&gt;R Markdown&lt;/a&gt;.&lt;/li&gt;&lt;/ul&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;b&gt;&lt;span style=&quot;color: blue;&quot;&gt;Создание пакета &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;sparklyr&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;. &lt;a href=&quot;http://spark.apache.org/&quot; target=&quot;_blank&quot;&gt;Apache Spark&lt;/a&gt; - это чрезвычайно популярный инструмент для выполнения вычислений над &quot;&lt;a href=&quot;https://ru.wikipedia.org/wiki/%D0%91%D0%BE%D0%BB%D1%8C%D1%88%D0%B8%D0%B5_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D0%B5&quot; target=&quot;_blank&quot;&gt;большими данными&lt;/a&gt;&quot;. Разработанный компанией RStudio пакет &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;http://spark.rstudio.com/&quot; target=&quot;_blank&quot;&gt;sparklyr&lt;/a&gt;&lt;/span&gt; представляет собой R-интерфейс для работы с этим инструментом. Важными особенностями &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;sparklyr&lt;/span&gt; (в отличие от, например, встроенного в Spark пакета &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://spark.apache.org/docs/latest/sparkr.html&quot; target=&quot;_blank&quot;&gt;sparkR&lt;/a&gt;&lt;/span&gt;) являются следующие:&lt;/li&gt;&lt;ul&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;возможность написания легко читаемого кода с использованием синтаксиса, принятого в пакете&amp;nbsp;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.rstudio.com/web/packages/dplyr/vignettes/introduction.html&quot; target=&quot;_blank&quot;&gt;dplyr&lt;/a&gt;&lt;/span&gt;;&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;пользователи R могут работать с большинством алгоритмов машинного обучения, реализованных в Spark&#39;овской библиотеке &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;http://spark.apache.org/mllib/&quot; target=&quot;_blank&quot;&gt;MLlib&lt;/a&gt;&lt;/span&gt;;&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;как было отмечено выше, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;sparklyr&lt;/span&gt; интегрирован в RStudio v1.0, что делает работу с ним еще удобнее.&lt;/li&gt;&lt;/ul&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;color: blue; font-weight: bold;&quot;&gt;Релиз платформы Steam&lt;/span&gt;. Компания&amp;nbsp;&lt;a href=&quot;http://h20.ai/&quot;&gt;h20.ai&lt;/a&gt;&amp;nbsp;&lt;a href=&quot;https://github.com/h2oai/steam&quot; target=&quot;_blank&quot;&gt;выпустила&lt;/a&gt;&amp;nbsp;&lt;a href=&quot;http://www.h2o.ai/steam/&quot; target=&quot;_blank&quot;&gt;Steam&lt;/a&gt;&amp;nbsp;(под лицензией&amp;nbsp;&lt;a href=&quot;https://en.wikipedia.org/wiki/Affero_General_Public_License&quot; target=&quot;_blank&quot;&gt;AGPL&lt;/a&gt;) - платформу, которая позволяет &quot;...&lt;i&gt;от начала и до конца выстроить весь процесс создания и разворачивания &quot;умных&quot; приложений&lt;/i&gt;&quot;. Если говорить &quot;немаркетинговым&quot; языком, то эта платформа помогает наладить совместную работу аналитиков, разрабатывающих предсказательные модели на базе движка &lt;a href=&quot;http://www.h2o.ai/h2o/&quot; target=&quot;_blank&quot;&gt;h2o&lt;/a&gt; (поддерживаются такие языки программирования, как &lt;a href=&quot;https://cran.r-project.org/web/packages/h2o/&quot; target=&quot;_blank&quot;&gt;R&lt;/a&gt;, Python и Java), и разработчиков приложений (последние &quot;потребляют&quot; предсказания моделей посредством запросов к соответствующим&amp;nbsp;&lt;a href=&quot;https://ru.wikipedia.org/wiki/API&quot; target=&quot;_blank&quot;&gt;API&lt;/a&gt;, которые можно легко опубликовать с помощью Steam). Выстраивание подобной связи между аналитиками и разработчиками эффективным образом - большая головная боль многих компаний, которые пытаются внедрять предсказательные модели в свои бизнес-процессы. В этом смысле Steam - платформа с большим потенциалом, особенно если учесть, что в состав h2o входят одни из наиболее эффективных &lt;a href=&quot;http://www.h2o.ai/h2o/machine-learning/&quot; target=&quot;_blank&quot;&gt;алгоритмов машинного обучения&lt;/a&gt; среди существующих. Подробнее о Steam можно узнать из &lt;a href=&quot;http://docs.h2o.ai/steam/latest-stable/Installation.html&quot; target=&quot;_blank&quot;&gt;официальной документации&lt;/a&gt;, а также из приведенного ниже видео.&lt;/li&gt;&lt;/ul&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;center&gt;&lt;iframe allowfullscreen=&quot;&quot; frameborder=&quot;0&quot; height=&quot;315&quot; src=&quot;https://www.youtube.com/embed/EaWFBrEA5fw&quot; width=&quot;560&quot;&gt;&lt;/iframe&gt;&lt;/center&gt;&lt;br /&gt;&lt;ul&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;b&gt;&lt;span style=&quot;color: blue;&quot;&gt;Проект RL10N&lt;/span&gt;&lt;/b&gt;. &lt;a href=&quot;https://www.linuxfoundation.org/news-media/announcements/2015/06/linux-foundation-announces-r-consortium-support-millions-users&quot; target=&quot;_blank&quot;&gt;Создание&lt;/a&gt; Концсорциума R (&lt;a href=&quot;https://www.r-consortium.org/&quot; target=&quot;_blank&quot;&gt;R Consortium&lt;/a&gt;) начинает приносить первые плоды. Одним из &lt;a href=&quot;https://www.r-consortium.org/projects/awarded-projects&quot; target=&quot;_blank&quot;&gt;восьми проектов&lt;/a&gt;, профинансированных этой организацией в 2016 г., стал &quot;&lt;a href=&quot;https://www.r-consortium.org/blog/2016/11/22/rl10n-hits-its-first-milestone&quot; target=&quot;_blank&quot;&gt;RL10N&lt;/a&gt;&quot; - проект, целью которого является создание инфраструктуры, облегчающей локализацию R-приложений на языки, отличные от английского. Первым результатом работы над этим проектом стала разработка пакета &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/poio/index.html&quot; target=&quot;_blank&quot;&gt;poio&lt;/a&gt;&lt;/span&gt;, с помощью которого можно легче выполнять перевод сообщений, генерируемых R-функциями (поддерживаются все языки из списка &lt;a href=&quot;https://en.wikipedia.org/wiki/ISO_639&quot; target=&quot;_blank&quot;&gt;ISO 639&lt;/a&gt;).&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;b&gt;&lt;span style=&quot;color: blue;&quot;&gt;Книги по R на русском языке&lt;/span&gt;&lt;/b&gt;. В московском издательстве ДМК Пресс в 2016 г. вышло три книги по R:&lt;/li&gt;&lt;ul&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;i&gt;&lt;a href=&quot;http://dmkpress.com/catalog/computer/statistics/978-5-97060-293-5/&quot; target=&quot;_blank&quot;&gt;Джеймс Г., Уиттон Д., Хасти Т., Тибширани Р. (2016) Введение в статистическое обучение с примерами на языке R. - М.: ДМК Пресс, 460 с. - пер. с англ. С. Э. Мастицкого.&lt;/a&gt;&lt;/i&gt;&lt;br /&gt;К сожалению, в первое издание этой книги закралось большое количество &lt;a href=&quot;https://github.com/ranalytics/islr-ru&quot; target=&quot;_blank&quot;&gt;опечаток и ошибок&lt;/a&gt; технического характера. В начале 2017 г. выйдет второе издание с исправлениями обнаруженных недочетов.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;i&gt;&lt;a href=&quot;https://dmkpress.com/catalog/computer/statistics/978-5-97060-470-0/&quot; target=&quot;_blank&quot;&gt;Мастицкий С. Э. (2016) Визуализация данных с помощью ggplot2. - М.: ДМК Пресс, 222 с.&lt;/a&gt;&amp;nbsp;&lt;/i&gt;См. примеры кода из книги&amp;nbsp;&lt;a href=&quot;https://github.com/ranalytics/ggplot2-ru&quot; target=&quot;_blank&quot;&gt;здесь&lt;/a&gt;.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;i&gt;&lt;a href=&quot;https://dmkpress.com/catalog/computer/statistics/978-5-97060-459-5/&quot; target=&quot;_blank&quot;&gt;Храмов Д. А. (2016) Сбор данных в Интернете на языке R. - М.: ДМК Пресс, 283 с.&lt;/a&gt;&lt;/i&gt;&lt;/li&gt;&lt;/ul&gt;&lt;/ul&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;/div&gt;&lt;div style=&quot;text-align: center;&quot;&gt;&lt;i&gt;&lt;span style=&quot;font-size: medium;&quot;&gt;С наступающим Новым Годом! Добра и мира вам и вашим близким!&lt;/span&gt;&lt;/i&gt;&lt;/div&gt;&lt;div style=&quot;text-align: center;&quot;&gt;&lt;i&gt;&lt;span style=&quot;font-size: large;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;/i&gt;&lt;/div&gt;&lt;script async src=&quot;//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js&quot;&gt;&lt;/script&gt;&lt;!-- R Analytics Responsive --&gt;&lt;ins class=&quot;adsbygoogle&quot;      style=&quot;display:block&quot;      data-ad-client=&quot;ca-pub-6457966355894443&quot;      data-ad-slot=&quot;8123690788&quot;      data-ad-format=&quot;auto&quot;&gt;&lt;/ins&gt;&lt;script&gt;(adsbygoogle = window.adsbygoogle || []).push({}); &lt;/script&gt;</content><link rel='replies' type='text/html' href='http://r-analytics.blogspot.com/2016/12/r-2016_29.html#comment-form' title='Комментарии: 2'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/3167054372435911647'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/3167054372435911647'/><link rel='alternate' type='text/html' href='http://r-analytics.blogspot.com/2016/12/r-2016_29.html' title='Пять наиболее важных событий в мире R по итогам 2016 г.'/><author><name>Sergey Mastitsky</name><uri>https://plus.google.com/100743762419147389233</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='32' height='32' src='//lh3.googleusercontent.com/-S7CBBqIIWg0/AAAAAAAAAAI/AAAAAAAAANI/e7vggjNa3Mo/s512-c/photo.jpg'/></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://2.bp.blogspot.com/-Adfml3edCUM/WGUOuQt2wGI/AAAAAAAADHo/YFrtC72YuU8udsGoxasJPmLm7XY6ZywfACLcB/s72-c/Richie_logo-232x300.png" height="72" width="72"/><thr:total>2</thr:total></entry><entry><id>tag:blogger.com,1999:blog-9120847565867616203.post-3878179241674388012</id><published>2016-12-18T22:59:00.002+00:00</published><updated>2017-01-22T18:39:16.288+00:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="информационные критерии"/><category scheme="http://www.blogger.com/atom/ns#" term="линейные модели"/><category scheme="http://www.blogger.com/atom/ns#" term="обобщенные линейные модели"/><category scheme="http://www.blogger.com/atom/ns#" term="переобучение"/><title type='text'>Методы и критерии верификации регрессионных моделей</title><content type='html'>&lt;div style=&quot;text-align: right;&quot;&gt;Автор:&lt;i&gt; Владимир Шитиков&lt;/i&gt;&lt;/div&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;В предыдущих сообщениях неоднократно поднимались важные проблемы, связанные с диагностикой регрессионных моделей: проверка статистических допущений, лежащих в основе используемого метода построения модели, оценка адекватности структуры систематической части модели, тестирование чувствительности модели к аномалиям в структуре исходных данных и др. (см. &lt;a href=&quot;http://r-analytics.blogspot.ru/2014/09/1.html&quot; target=&quot;_blank&quot;&gt;часть 1&lt;/a&gt;, &lt;a href=&quot;http://r-analytics.blogspot.ru/2015/01/2.html&quot; target=&quot;_blank&quot;&gt;часть 2&lt;/a&gt;, &lt;a href=&quot;http://r-analytics.blogspot.ru/2015/03/3.html&quot; target=&quot;_blank&quot;&gt;часть 3&lt;/a&gt;). В данном сообщения попробуем в сжатой форме дать сводку методов и критериев верификации регрессионных моделей и подвести некоторые итоги того, что было частично рассмотрено ранее.&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;script async src=&quot;//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js&quot;&gt;&lt;/script&gt;&lt;!-- R Analytics Responsive --&gt;&lt;ins class=&quot;adsbygoogle&quot;      style=&quot;display:block&quot;      data-ad-client=&quot;ca-pub-6457966355894443&quot;      data-ad-slot=&quot;8123690788&quot;      data-ad-format=&quot;auto&quot;&gt;&lt;/ins&gt;&lt;script&gt;(adsbygoogle = window.adsbygoogle || []).push({}); &lt;/script&gt;&lt;br /&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;br /&gt;&lt;a name=&#39;more&#39;&gt;&lt;/a&gt;Действительно, первое, что следует сделать сразу после построения модели, так это убедиться в том, насколько она полезна и эффективна. Проверка работоспособности полученных моделей (англ. &lt;i&gt;model verification&lt;/i&gt;) представляет собой сложный и многостадийный процесс, по итогам которого может быть достигнут приемлемый уровень уверенности исследователя в том, что результаты, полученные при практическом использовании модели, окажутся правильными. Верификация включает оценку качества модели (англ. &lt;i&gt;model evaluation&lt;/i&gt;) и ее адекватности выборочным данным (англ. &lt;i&gt;model validation&lt;/i&gt;) по совокупности объективных критериев, анализ вклада отдельных предикторов и отбор их оптимальной комбинации (англ. &lt;i&gt;model selection&lt;/i&gt;) и, наконец, независимое тестирование модели с целью настройки ее параметров (англ. &lt;i&gt;model tuning&lt;/i&gt;).&lt;br /&gt;&lt;br /&gt;Тестирование регрессионных моделей ставит своей задачей выявление следующих основных проблем:&lt;br /&gt;&lt;ul&gt;&lt;li&gt;&lt;i&gt;Смещение&lt;/i&gt; (англ. &lt;i&gt;bias&lt;/i&gt;), или систематическая ошибка модели (например, сдвиг предсказываемых значений на какую-то трудно объяснимую величину);&lt;/li&gt;&lt;li&gt;&lt;i&gt;Высокая дисперсия&lt;/i&gt; прогноза, определяемая чаще всего излишней чувствительностью модели к небольшим изменениям в распределении обучающих данных;&lt;/li&gt;&lt;li&gt;&lt;i&gt;Неадекватность&lt;/i&gt;&amp;nbsp;- свойство модели, которая не отражает основных закономерностей в генеральной совокупности и в силу случайного характера обучающей выборки;&lt;/li&gt;&lt;li&gt;&lt;i&gt;Переусложнение&lt;/i&gt;, или &lt;i&gt;переобучение модели&lt;/i&gt; (англ. &lt;i&gt;overfitting&lt;/i&gt;), которое «...так же вредно, как и ее недоусложнение» (Ивахненко, 1982). Переобученная модель дает хорошие результаты подгонки на обучающей совокупности, но часто ведет себя непредсказуемо при прогнозировании на &quot;свежих&quot; данных, не участвовавших в построении модели. Построение модели оптимальной сложности, в которой сбалансирована точность и устойчивость прогнозных значений, является фундаментальной задачей совершенствования методов моделирования. Тема переобучения моделей уже поднималась нами &lt;a href=&quot;http://r-analytics.blogspot.ru/2015/06/blog-post_21.html&quot; target=&quot;_blank&quot;&gt;ранее&lt;/a&gt;, однако, безусловно, заслуживает дополнительного обсуждения.&lt;/li&gt;&lt;/ul&gt;&lt;b&gt;&lt;span style=&quot;color: blue;&quot;&gt;&lt;br /&gt;&lt;/span&gt;&lt;/b&gt;&lt;b&gt;&lt;span style=&quot;color: #444444;&quot;&gt;Данные, используемые в примерах&lt;/span&gt;&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;В одном из &lt;a href=&quot;http://r-analytics.blogspot.ru/2015/05/blog-post.html&quot; target=&quot;_blank&quot;&gt;предыдущих сообщений&lt;/a&gt; в качестве простого примера мы использовали данные по электрическому сопротивлению (Ом) мякоти фруктов киви в зависимости от процентного содержания в ней сока. Одним из наиболее эффективных способов выявления характера связи между подлежащей предсказанию переменной и предикторами является графическое изображение этой зависимости (глаз человека - все еще наиболее совершенный инструмент экспертизы нелинейности связи!).&lt;br /&gt;&lt;br /&gt;Здесь и далее для построения графиков воспользуемся одним из наиболее популярных графических пакетов для R – &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;ggplot2&lt;/span&gt;, который позволяет строить как всевозможные простые диаграммы, так и гораздо более сложные графики, такие как двухмерные диаграммы распределения плотности (см., например, &lt;a href=&quot;https://dmkpress.com/catalog/computer/statistics/978-5-97060-470-0/&quot; target=&quot;_blank&quot;&gt;Мастицкий, 2016&lt;/a&gt;). Легко показать линию простой регрессии с ее доверительными интервалами, которая в рассматриваемом нами примере не вполне адекватна имеющимся данным:&lt;br /&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f9f9f9; color: #080808;&quot;&gt;library(&lt;span style=&quot;color: #234a97;&quot;&gt;ggplot2&lt;/span&gt;)&lt;br /&gt;library(&lt;span style=&quot;color: #234a97;&quot;&gt;DAAG&lt;/span&gt;)&lt;br /&gt;data(&lt;span style=&quot;color: #0b6125;&quot;&gt;&quot;fruitohms&quot;&lt;/span&gt;)&lt;br /&gt;ggplot(&lt;span style=&quot;color: #234a97;&quot;&gt;fruitohms&lt;/span&gt;, aes(&lt;span style=&quot;color: #234a97;&quot;&gt;x&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;juice&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;y&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;ohms&lt;/span&gt;)) &lt;span style=&quot;color: #794938;&quot;&gt;+&lt;/span&gt; geom_point() &lt;span style=&quot;color: #794938;&quot;&gt;+&lt;/span&gt;&lt;br /&gt;       stat_smooth(&lt;span style=&quot;color: #234a97;&quot;&gt;method&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0b6125;&quot;&gt;&quot;lm&quot;&lt;/span&gt;) &lt;span style=&quot;color: #794938;&quot;&gt;+&lt;/span&gt; &lt;br /&gt;       xlab(&lt;span style=&quot;color: #0b6125;&quot;&gt;&quot;Содержание сока, %&quot;&lt;/span&gt;) &lt;span style=&quot;color: #794938;&quot;&gt;+&lt;/span&gt; &lt;br /&gt;       ylab(&lt;span style=&quot;color: #0b6125;&quot;&gt;&quot;Сопротивление, Ом&quot;&lt;/span&gt;)&lt;br /&gt;&lt;/pre&gt;&lt;br /&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;/div&gt;&lt;div style=&quot;text-align: center;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;a href=&quot;https://2.bp.blogspot.com/-BAha1xkNPSA/WFcIz-pEUzI/AAAAAAAADGw/U1L2lv_KKXEIqLaIH3JOhFGNKe0X8k04ACLcB/s1600/N1_1.png&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; src=&quot;https://2.bp.blogspot.com/-BAha1xkNPSA/WFcIz-pEUzI/AAAAAAAADGw/U1L2lv_KKXEIqLaIH3JOhFGNKe0X8k04ACLcB/s1600/N1_1.png&quot; /&gt;&lt;/a&gt;&lt;/div&gt;&lt;div style=&quot;text-align: center;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: center;&quot;&gt;&lt;br /&gt;&lt;/div&gt;Сглаживание данных c использованием базовой R-функции &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;loess()&lt;/span&gt; лучше подходит для описания этой зависимости (в качестве примера, вместо обычной диаграммы рассеяния данные будут изображены в виде &quot;сотовой диаграммы&quot;, где наблюдения распределены по ячейкам и число наблюдений в каждой ячейке представлено цветом соответствующего оттенка):&lt;br /&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f9f9f9; color: #080808;&quot;&gt;library(&lt;span style=&quot;color: #234a97;&quot;&gt;hexbin&lt;/span&gt;)&lt;br /&gt;ggplot(&lt;span style=&quot;color: #234a97;&quot;&gt;fruitohms&lt;/span&gt;, aes(&lt;span style=&quot;color: #234a97;&quot;&gt;x&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;juice&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;y&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;ohms&lt;/span&gt;)) &lt;span style=&quot;color: #794938;&quot;&gt;+&lt;/span&gt;&lt;br /&gt;       geom_hex(&lt;span style=&quot;color: #234a97;&quot;&gt;binwidth&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;=&lt;/span&gt; c(&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;3&lt;/span&gt;, &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;500&lt;/span&gt;)) &lt;span style=&quot;color: #794938;&quot;&gt;+&lt;/span&gt;&lt;br /&gt;       geom_smooth(&lt;span style=&quot;color: #234a97;&quot;&gt;color&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0b6125;&quot;&gt;&quot;red&quot;&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;se&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;FALSE&lt;/span&gt;) &lt;span style=&quot;color: #794938;&quot;&gt;+&lt;/span&gt; &lt;br /&gt;       xlab(&lt;span style=&quot;color: #0b6125;&quot;&gt;&quot;Содержание сока, %&quot;&lt;/span&gt;) &lt;span style=&quot;color: #794938;&quot;&gt;+&lt;/span&gt; &lt;br /&gt;       ylab(&lt;span style=&quot;color: #0b6125;&quot;&gt;&quot;Сопротивление, Ом&quot;&lt;/span&gt;)&lt;br /&gt;&lt;/pre&gt;&lt;br /&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;/div&gt;&lt;br /&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;a href=&quot;https://2.bp.blogspot.com/-Ks5SyTdoKSA/WFcI9VBMRYI/AAAAAAAADG0/rB3krIlnCZM2ngDZlHB8JHVmlo59gTrRgCLcB/s1600/N1_2.png&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; src=&quot;https://2.bp.blogspot.com/-Ks5SyTdoKSA/WFcI9VBMRYI/AAAAAAAADG0/rB3krIlnCZM2ngDZlHB8JHVmlo59gTrRgCLcB/s1600/N1_2.png&quot; /&gt;&lt;/a&gt;&lt;/div&gt;&lt;div style=&quot;text-align: center;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;br /&gt;&lt;b&gt;&lt;span style=&quot;color: #444444;&quot;&gt;Оценка адекватности (валидности) модели&lt;/span&gt;&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;При выполнении поиска оптимальной модели для тех или иных данных полезно иметь набор &quot;эталонов&quot; для сравнения. Если мы зададимся каким-нибудь подходящим критерием качества, то сможем оценить, насколько тестируемая модель отличается по этому критерию от эталона. Такими эталонными моделями могут быть следующие:&lt;br /&gt;&lt;ul&gt;&lt;li&gt;&lt;i&gt;Нулевая модель&lt;/i&gt; (англ. &lt;i&gt;null model&lt;/i&gt;) – модель, которая не содержит никаких предикторов. В случае с количественной зависимой переменной нулевая модель описывает ни что иное, как среднее значение этой переменной в имеющейся обучающей выборке. В случае же с качественной зависимой переменной (задача классификации) нулевая модель предсказывает наиболее часто встречающуюся категорию. Если тестируемая нами предсказательная модель не превосходит по своей эффективности нулевую, то результат моделирования можно трактовать как неудачу.&lt;/li&gt;&lt;li&gt;&lt;i&gt;Насыщенная модель&lt;/i&gt; (англ. &lt;i&gt;saturated model&lt;/i&gt;) – модель, включающая все имеющиеся предикторы. Если качество тестируемой модели по тому или иному критерию значимо превышает таковое у нулевой модели и приближается к качеству максимально насыщенной модели, то процесс отбора оптимальной модели можно считать завершенным.&lt;/li&gt;&lt;li&gt;&lt;i&gt;Модель с одним наиболее информативным предиктором&lt;/i&gt;. Если в процессе отбора более сложные модели по своей эффективности не превосходят модель с одним наиболее информативным предиктором, то включение дополнительных предикторов вряд ли имеет смысл.&lt;/li&gt;&lt;/ul&gt;Процедуры оценки адекватности классической модели регрессии (обозначим ее как &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;f&lt;/span&gt;) основаны на анализе остатков (англ. &lt;i&gt;residuals&lt;/i&gt;), т.е. разностей между прогнозируемыми &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;f(x[i,])&lt;/span&gt; и наблюдаемыми &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;y[i]&lt;/span&gt; значениями, где &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;x&lt;/span&gt; - матрица независимых переменных (предикторов). Базовыми критериями являются &lt;i&gt;сумма квадратов остатков&lt;/i&gt; RSS (англ. &lt;i&gt;residual sum of squares&lt;/i&gt;), &lt;i&gt;корень из среднеквадратичной ошибки&lt;/i&gt; RMSE (англ. &lt;i&gt;root mean square error&lt;/i&gt;) и стандартное отклонение остатков RSE (англ. &lt;i&gt;residual standard error&lt;/i&gt;): В рассматриваемом примере у нас есть лишь одна зависимая переменная (электропроводность) и один предиктор (содержание сока в мякоти фруктов). Для удобства обозначим их как &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;y&lt;/span&gt; и &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;x&lt;/span&gt; соответственно:&lt;br /&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f9f9f9; color: #080808;&quot;&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;y&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;fruitohms&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;$&lt;/span&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;juice&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;x&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;fruitohms&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;$&lt;/span&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;ohms&lt;/span&gt;&lt;br /&gt;&lt;br /&gt;&lt;span style=&quot;color: #5a525f; font-style: italic;&quot;&gt;#  Строим модель с одним предиктором:&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;n&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; dim(as.matrix(&lt;span style=&quot;color: #234a97;&quot;&gt;x&lt;/span&gt;))[&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;1&lt;/span&gt;]&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;m&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; dim(as.matrix(&lt;span style=&quot;color: #234a97;&quot;&gt;x&lt;/span&gt;))[&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;2&lt;/span&gt;] &lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;M_reg&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; lm(&lt;span style=&quot;color: #234a97;&quot;&gt;y&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;~&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;x&lt;/span&gt;)&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;pred&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; predict(&lt;span style=&quot;color: #234a97;&quot;&gt;M_reg&lt;/span&gt;)&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;RSS&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; sum((&lt;span style=&quot;color: #234a97;&quot;&gt;y&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;pred&lt;/span&gt;) &lt;span style=&quot;color: #794938;&quot;&gt;*&lt;/span&gt; (&lt;span style=&quot;color: #234a97;&quot;&gt;y&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;pred&lt;/span&gt;))&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;RMSE&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; sqrt(&lt;span style=&quot;color: #234a97;&quot;&gt;RSS&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;/&lt;/span&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;n&lt;/span&gt;)&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;RSE&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; sqrt(&lt;span style=&quot;color: #234a97;&quot;&gt;RSS&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;/&lt;/span&gt;(&lt;span style=&quot;color: #234a97;&quot;&gt;n&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;m&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;1&lt;/span&gt;)) &lt;br /&gt;c(&lt;span style=&quot;color: #234a97;&quot;&gt;RSS&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;RMSE&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;RSE&lt;/span&gt;)&lt;br /&gt;[&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;1&lt;/span&gt;] &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;12548.645657&lt;/span&gt;     &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;9.901328&lt;/span&gt;     &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;9.979600&lt;/span&gt;&lt;br /&gt;&lt;/pre&gt;&lt;br /&gt;Другими важными критериями качества аппроксимации данных являются коэффициент детерминации (&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;Rsquared&lt;/span&gt;), дисперсионное отношение Фишера (&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;F&lt;/span&gt;) и соответствующее ему &lt;i&gt;р&lt;/i&gt;-значение:  &lt;br /&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f9f9f9; color: #080808;&quot;&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;Rsquared&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;1&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;RSS&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;/&lt;/span&gt;sum((mean(&lt;span style=&quot;color: #234a97;&quot;&gt;y&lt;/span&gt;) &lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;y&lt;/span&gt;)&lt;span style=&quot;color: #794938;&quot;&gt;^&lt;/span&gt;&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;2&lt;/span&gt;)&lt;br /&gt;&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;F&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; (sum((mean(&lt;span style=&quot;color: #234a97;&quot;&gt;y&lt;/span&gt;) &lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;pred&lt;/span&gt;)&lt;span style=&quot;color: #794938;&quot;&gt;^&lt;/span&gt;&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;2&lt;/span&gt;)&lt;span style=&quot;color: #794938;&quot;&gt;/&lt;/span&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;m&lt;/span&gt;)&lt;span style=&quot;color: #794938;&quot;&gt;/&lt;/span&gt;(&lt;span style=&quot;color: #234a97;&quot;&gt;RSS&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;/&lt;/span&gt;(&lt;span style=&quot;color: #234a97;&quot;&gt;n&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;m&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;1&lt;/span&gt;))&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;p&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; pf(&lt;span style=&quot;color: #234a97;&quot;&gt;q&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;F&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;df1&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;m&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;df2&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;=&lt;/span&gt; (&lt;span style=&quot;color: #234a97;&quot;&gt;n&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;m&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;1&lt;/span&gt;), &lt;span style=&quot;color: #234a97;&quot;&gt;lower.tail&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;FALSE&lt;/span&gt;)&lt;br /&gt;c(&lt;span style=&quot;color: #234a97;&quot;&gt;Rsquared&lt;/span&gt;, &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;F&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;p&lt;/span&gt;)&lt;br /&gt;[&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;1&lt;/span&gt;] &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;6.387089e-01&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;2.227492e+02&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;1.234110e-29&lt;/span&gt;&lt;br /&gt;&lt;/pre&gt;&lt;br /&gt;Разумеется, все эти величины можно было бы получить и с помощью команды&amp;nbsp;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;summary(M_reg)&lt;/span&gt;, но нам показалось интересным показать всю &quot;кухню&quot; их расчетов. Отметим, что &lt;i&gt;F&lt;/i&gt;-критерий интерпретируется как мера превышения качества построенной модели над качеством нулевой модели, которая не содержит объясняющих переменных.&lt;br /&gt;&lt;div&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f9f9f9; color: #080808;&quot;&gt;summary(&lt;span style=&quot;color: #234a97;&quot;&gt;M_reg&lt;/span&gt;)&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;Coefficients&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;:&lt;/span&gt;&lt;br /&gt;              &lt;span style=&quot;color: #234a97;&quot;&gt;Estimate&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;Std&lt;/span&gt;. &lt;span style=&quot;color: #234a97;&quot;&gt;Error&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;t&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;value&lt;/span&gt; Pr(&lt;span style=&quot;color: #794938;&quot;&gt;&amp;gt;&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;|&lt;/span&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;t&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;|&lt;/span&gt;)    &lt;br /&gt;(&lt;span style=&quot;color: #234a97;&quot;&gt;Intercept&lt;/span&gt;) &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;66.1364158&lt;/span&gt;  &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;2.2556380&lt;/span&gt;   &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;29.32&lt;/span&gt;   &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;&lt;/span&gt;&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;2e-16&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;*&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;x&lt;/span&gt;           &lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;0.0071064&lt;/span&gt;  &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;0.0004762&lt;/span&gt;  &lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;14.93&lt;/span&gt;   &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;&lt;/span&gt;&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;2e-16&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;*&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;Signif&lt;/span&gt;. &lt;span style=&quot;color: #234a97;&quot;&gt;codes&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;:&lt;/span&gt;  &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;0&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;*&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;0.001&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;*&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;0.01&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;*&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;0.05&lt;/span&gt; . &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;0.1&lt;/span&gt;  &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;1&lt;/span&gt; &lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;Residual&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;standard&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;error&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;:&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;9.98&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;on&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;126&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;degrees&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;of&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;freedom&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;Multiple&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;R&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;squared&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;:&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;0.6387&lt;/span&gt;,  &lt;span style=&quot;color: #234a97;&quot;&gt;Adjusted&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;R&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;squared&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;:&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;0.6358&lt;/span&gt; &lt;br /&gt;&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;F&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;statistic&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;:&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;222.7&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;on&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;1&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;and&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;126&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;DF&lt;/span&gt;,  &lt;span style=&quot;color: #234a97;&quot;&gt;p&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;value&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;:&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;2.2e-16&lt;/span&gt;&lt;br /&gt;&lt;/pre&gt;&lt;br /&gt;Чтобы выяснить, насколько объясненная нашей моделью сумма квадратов остатков превысила общую сумму квадратов остатков (т.е. сумму квадратов остатков у нулевой модели) можно выполнить дисперсионный анализ (см. также &lt;a href=&quot;http://r-analytics.blogspot.co.uk/2014/05/blog-post_18.html&quot; target=&quot;_blank&quot;&gt;здесь&lt;/a&gt;):&lt;br /&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f9f9f9; color: #080808;&quot;&gt;anova(&lt;span style=&quot;color: #234a97;&quot;&gt;M_reg&lt;/span&gt;)&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;Analysis&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;of&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;Variance&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;Table&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;Response&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;:&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;y&lt;/span&gt;&lt;br /&gt;           &lt;span style=&quot;color: #234a97;&quot;&gt;Df&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;Sum&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;Sq&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;Mean&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;Sq&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;F&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;value&lt;/span&gt;    Pr(&lt;span style=&quot;color: #794938;&quot;&gt;&amp;gt;&lt;/span&gt;&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;F&lt;/span&gt;)    &lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;x&lt;/span&gt;           &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;1&lt;/span&gt;  &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;22184&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;22184.1&lt;/span&gt;  &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;222.75&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;2.2e-16&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;*&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;Residuals&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;126&lt;/span&gt;  &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;12549&lt;/span&gt;    &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;99.6&lt;/span&gt;&lt;br /&gt;&lt;/pre&gt;&lt;br /&gt;В случае обобщенных линейных моделей (&lt;a href=&quot;https://en.wikipedia.org/wiki/Generalized_linear_model&quot; target=&quot;_blank&quot;&gt;&lt;i&gt;Generalized Linear Models&lt;/i&gt;&lt;/a&gt;, GLM) вместо минимизации суммы квадратов отклонений выполняется поиск экстремума логарифма функции &lt;a href=&quot;https://ru.wikipedia.org/wiki/%D0%9C%D0%B5%D1%82%D0%BE%D0%B4_%D0%BC%D0%B0%D0%BA%D1%81%D0%B8%D0%BC%D0%B0%D0%BB%D1%8C%D0%BD%D0%BE%D0%B3%D0%BE_%D0%BF%D1%80%D0%B0%D0%B2%D0%B4%D0%BE%D0%BF%D0%BE%D0%B4%D0%BE%D0%B1%D0%B8%D1%8F&quot; target=&quot;_blank&quot;&gt;максимального правдоподобия&lt;/a&gt; (англ. &lt;i&gt;maximum likelihood&lt;/i&gt;), вид которой зависит от характера распределения данных. В общем случае значение функции правдоподобия численно равно вероятности того, что модель правильно предсказывает любое предъявленное ей наблюдение из заданной выборки. Логарифм функции правдоподобия (&lt;span style=&quot;font-family: inherit;&quot;&gt;LL&lt;/span&gt;) всегда будет&amp;nbsp;отрицательным, и поскольку \(\log(1) = 0\), то для наиболее оптимальной модели, прогнозирующей значение отклика с наименьшей ошибкой, значение LL будет стремиться к 0. Часто для оценки расхождений между наблюдаемыми и прогнозируемыми значениями вместо LL используют &lt;i&gt;девианс&lt;/i&gt; (англ. &lt;i&gt;deviance&lt;/i&gt;; в русскоязычной литературе используются также термины &quot;&lt;i&gt;девиация&lt;/i&gt;&quot; и &quot;&lt;i&gt;аномалия&lt;/i&gt;&quot;), который определен как \(D = -2(LL - S)\), где &lt;i&gt;S&lt;/i&gt; – правдоподобие модели с минимально возможным уровнем ошибки (такую ошибку называют также неустранимой, или (в задачах классификации) &lt;i&gt;байесовской&lt;/i&gt;). Обычно принимают&amp;nbsp;&lt;i&gt;S&lt;/i&gt; = 0, поскольку истинно оптимальная модель, как правило, выполняет верные предсказания.&lt;br /&gt;&lt;br /&gt;Чем меньше остаточный девианс &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;D&lt;/span&gt;&amp;nbsp;некоторой модели, тем лучше эта модель. Аналогично можно рассчитать логарифм правдоподобия и девианс для нулевой модели (ниже обозначен как &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;D.null&lt;/span&gt;). Тогда адекватность тестируемой модели можно описать при помощи &lt;i&gt;псевдо-коэффициента детерминации&lt;/i&gt; (&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;Prsquar&lt;/span&gt;), который рассчитывается с учетом того, во сколько раз &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;D&lt;/span&gt; превышает &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;D.null&lt;/span&gt;. Подобный анализ является обобщением техники дисперсионного анализа. При этом статистическую значимость разности девиансов можно оценить по критерию \(\chi^2\):&lt;br /&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f9f9f9; color: #080808;&quot;&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;M_glm&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; glm(&lt;span style=&quot;color: #234a97;&quot;&gt;y&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;~&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;x&lt;/span&gt;)&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;lgLik&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; logLik(&lt;span style=&quot;color: #234a97;&quot;&gt;M_glm&lt;/span&gt;)&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;D.null&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;M_glm&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;$&lt;/span&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;null.deviance&lt;/span&gt; &lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;D&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;M_glm&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;$&lt;/span&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;deviance&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;df&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; with(&lt;span style=&quot;color: #234a97;&quot;&gt;M_glm&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;df.null&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;df.residual&lt;/span&gt;)&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;p&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; pchisq(&lt;span style=&quot;color: #234a97;&quot;&gt;D.null&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;D&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;df&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;lower.tail&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;FALSE&lt;/span&gt;)&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;PRsquar&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;1&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;D&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;/&lt;/span&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;D.null&lt;/span&gt;&lt;br /&gt;c(&lt;span style=&quot;color: #234a97;&quot;&gt;lgLik&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;D&lt;/span&gt; , &lt;span style=&quot;color: #234a97;&quot;&gt;D.null&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;p&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;PRsquar&lt;/span&gt;)&lt;br /&gt;[&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;1&lt;/span&gt;]  &lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;475.08574&lt;/span&gt;  &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;12548.64565&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;34732.77929&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;0.00000&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;0.63871&lt;/span&gt;&lt;br /&gt;&lt;br /&gt;&lt;/pre&gt;&lt;br /&gt;То же можно получить и с использованием функции &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;summary()&lt;/span&gt;:&lt;br /&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f9f9f9; color: #080808;&quot;&gt;summary(&lt;span style=&quot;color: #234a97;&quot;&gt;M_glm&lt;/span&gt;)&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;Coefficients&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;:&lt;/span&gt;&lt;br /&gt;              &lt;span style=&quot;color: #234a97;&quot;&gt;Estimate&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;Std&lt;/span&gt;. &lt;span style=&quot;color: #234a97;&quot;&gt;Error&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;t&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;value&lt;/span&gt; Pr(&lt;span style=&quot;color: #794938;&quot;&gt;&amp;gt;&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;|&lt;/span&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;t&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;|&lt;/span&gt;)    &lt;br /&gt;(&lt;span style=&quot;color: #234a97;&quot;&gt;Intercept&lt;/span&gt;) &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;66.1364158&lt;/span&gt;  &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;2.2556380&lt;/span&gt;   &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;29.32&lt;/span&gt;   &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;&lt;/span&gt;&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;2e-16&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;*&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;x&lt;/span&gt;           &lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;0.0071064&lt;/span&gt;  &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;0.0004762&lt;/span&gt;  &lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;14.93&lt;/span&gt;   &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;&lt;/span&gt;&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;2e-16&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;*&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;Signif&lt;/span&gt;. &lt;span style=&quot;color: #234a97;&quot;&gt;codes&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;:&lt;/span&gt;  &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;0&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;С&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;Т&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;0.001&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;С&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;Т&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;0.01&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;С&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;Т&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;0.05&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;С.Т&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;0.1&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;С&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;Т&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;1&lt;/span&gt; &lt;br /&gt;(&lt;span style=&quot;color: #234a97;&quot;&gt;Dispersion&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;parameter&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;for&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;gaussian&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;family&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;99.59243&lt;/span&gt;)&lt;br /&gt;    &lt;span style=&quot;color: #234a97;&quot;&gt;Null&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;deviance&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;:&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;34733&lt;/span&gt;  &lt;span style=&quot;color: #234a97;&quot;&gt;on&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;127&lt;/span&gt;  &lt;span style=&quot;color: #234a97;&quot;&gt;degrees&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;of&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;freedom&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;Residual&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;deviance&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;:&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;12549&lt;/span&gt;  &lt;span style=&quot;color: #234a97;&quot;&gt;on&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;126&lt;/span&gt;  &lt;span style=&quot;color: #234a97;&quot;&gt;degrees&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;of&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;freedom&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;AIC&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;:&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;956.17&lt;/span&gt;&lt;br /&gt;&lt;br /&gt;with(&lt;span style=&quot;color: #234a97;&quot;&gt;M_glm&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;null.deviance&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;deviance&lt;/span&gt;)&lt;br /&gt;[&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;1&lt;/span&gt;] &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;22184.13&lt;/span&gt;&lt;br /&gt;&lt;br /&gt;anova(&lt;span style=&quot;color: #234a97;&quot;&gt;M_glm&lt;/span&gt;, glm(&lt;span style=&quot;color: #234a97;&quot;&gt;x&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;~&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;1&lt;/span&gt;) , &lt;span style=&quot;color: #234a97;&quot;&gt;test&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0b6125;&quot;&gt;&quot;Chisq&quot;&lt;/span&gt;)&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;Analysis&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;of&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;Deviance&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;Table&lt;/span&gt;&lt;br /&gt;     &lt;span style=&quot;color: #234a97;&quot;&gt;Df&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;Deviance&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;Resid&lt;/span&gt;. &lt;span style=&quot;color: #234a97;&quot;&gt;Df&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;Resid&lt;/span&gt;. &lt;span style=&quot;color: #234a97;&quot;&gt;Dev&lt;/span&gt; P(&lt;span style=&quot;color: #794938;&quot;&gt;&amp;gt;&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;|&lt;/span&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;Chi&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;|&lt;/span&gt;)    &lt;br /&gt;&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;NULL&lt;/span&gt;                   &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;127&lt;/span&gt;      &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;34733&lt;/span&gt;              &lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;x&lt;/span&gt;     &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;1&lt;/span&gt;    &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;22184&lt;/span&gt;       &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;126&lt;/span&gt;      &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;12549&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;2.2e-16&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;*&lt;/span&gt;&lt;br /&gt;&lt;br /&gt;&lt;/pre&gt;&lt;br /&gt;Нетрудно заметить, что классическая (т.е. рассчитываемая по методу наименьших квадратов) и обобщенная линейные модели в случае нормального распределения дают идентичные результаты.&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;b&gt;&lt;span style=&quot;color: #444444;&quot;&gt;Оптимизация параметров моделей с использованием информационных критериев&lt;/span&gt;&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;Поиск оптимальной модели часто реализуется с использованием тех или иных критериев качества, налагающих &quot;штраф&quot; на добавление новых параметров. Если &lt;i&gt;D&lt;/i&gt; - выборочный остаточный девианс, &lt;i&gt;k&lt;/i&gt; – число свободных параметров модели, а &lt;i&gt;n&lt;/i&gt; - объем обучающей выборки, то можно определить семейство следующих информационных критериев (Burnham, Anderson, 2002):&lt;br /&gt;&lt;ul&gt;&lt;li&gt;классический критерий Акаике:&lt;span class=&quot;Apple-tab-span&quot; style=&quot;white-space: pre;&quot;&gt; &lt;/span&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;AIC = D + 2 * k&lt;/span&gt;&lt;/li&gt;&lt;li&gt;байесовский критерий Шварца: &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;BIC = D + k * ln(n)&lt;/span&gt;&lt;/li&gt;&lt;li&gt;скорректированный критерий Акаике:&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt; AICс = AIC + 2 * k * (k+1)/(n-k-1)&lt;/span&gt;&lt;/li&gt;&lt;/ul&gt;&lt;/div&gt;&lt;div&gt;При построении параметрических моделей с использованием R рассчитать эти критерии можно различными способами:&lt;/div&gt;&lt;div&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f9f9f9; color: #080808;&quot;&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;k&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; extractAIC(&lt;span style=&quot;color: #234a97;&quot;&gt;M_glm&lt;/span&gt;)[&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;1&lt;/span&gt;]&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;AIC&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; extractAIC(&lt;span style=&quot;color: #234a97;&quot;&gt;M_glm&lt;/span&gt;)[&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;2&lt;/span&gt;]&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;AIC&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; AIC(&lt;span style=&quot;color: #234a97;&quot;&gt;M_glm&lt;/span&gt;)&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;AICc&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; AIC(&lt;span style=&quot;color: #234a97;&quot;&gt;M_glm&lt;/span&gt;) &lt;span style=&quot;color: #794938;&quot;&gt;+&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;2&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;*&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;k&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;*&lt;/span&gt; (&lt;span style=&quot;color: #234a97;&quot;&gt;k&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;+&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;1&lt;/span&gt;)&lt;span style=&quot;color: #794938;&quot;&gt;/&lt;/span&gt;(&lt;span style=&quot;color: #234a97;&quot;&gt;n&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;k&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;1&lt;/span&gt;)&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;BIC&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; BIC(&lt;span style=&quot;color: #234a97;&quot;&gt;M_glm&lt;/span&gt;)&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;BIC&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; AIC(&lt;span style=&quot;color: #234a97;&quot;&gt;M_glm&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;k&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;=&lt;/span&gt; log(&lt;span style=&quot;color: #234a97;&quot;&gt;n&lt;/span&gt;))&lt;br /&gt;c(&lt;span style=&quot;color: #234a97;&quot;&gt;AIC&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;AICc&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;BIC&lt;/span&gt;)&lt;br /&gt;[&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;1&lt;/span&gt;] &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;956.1715&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;956.2675&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;964.7276&lt;/span&gt;&lt;br /&gt;&lt;/pre&gt;&lt;br /&gt;&lt;/div&gt;&lt;div&gt;Оптимальной считается модель с минимальным значением соответствующего информационного критерия. Рассмотрим пример использования информационных критериев для выбора оптимального числа параметров полиномиальной регрессии:&lt;br /&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f9f9f9; color: #080808;&quot;&gt;&lt;span style=&quot;color: #5a525f; font-style: italic;&quot;&gt;# Построение моделей со степенью полинома от 1 до 7:&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;max.poly&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;7&lt;/span&gt;&lt;br /&gt;&lt;br /&gt;&lt;span style=&quot;color: #5a525f; font-style: italic;&quot;&gt;# Создание пустой таблицы для хранения значений AIC и BIC,&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #5a525f; font-style: italic;&quot;&gt;# рассчитанных для всех моделей и ее заполнение:&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;AIC.BIC&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; &lt;span style=&quot;color: #a71d5d; font-style: italic;&quot;&gt;data.frame&lt;/span&gt;(&lt;span style=&quot;color: #234a97;&quot;&gt;criterion&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;=&lt;/span&gt; c(rep(&lt;span style=&quot;color: #0b6125;&quot;&gt;&quot;AIC&quot;&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;max.poly&lt;/span&gt;),&lt;br /&gt;                                    rep(&lt;span style=&quot;color: #0b6125;&quot;&gt;&quot;BIC&quot;&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;max.poly&lt;/span&gt;)),&lt;br /&gt;                      &lt;span style=&quot;color: #234a97;&quot;&gt;value&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #a71d5d; font-style: italic;&quot;&gt;numeric&lt;/span&gt;(&lt;span style=&quot;color: #234a97;&quot;&gt;max.poly&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;*&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;2&lt;/span&gt;),&lt;br /&gt;                      &lt;span style=&quot;color: #234a97;&quot;&gt;degree&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;=&lt;/span&gt; rep(&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;1&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;:&lt;/span&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;max.poly&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;times&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;2&lt;/span&gt;))&lt;br /&gt;&lt;span style=&quot;color: #794938;&quot;&gt;for&lt;/span&gt;(&lt;span style=&quot;color: #234a97;&quot;&gt;i&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;in&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;1&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;:&lt;/span&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;max.poly&lt;/span&gt;) {&lt;br /&gt;     &lt;span style=&quot;color: #234a97;&quot;&gt;AIC.BIC&lt;/span&gt;[&lt;span style=&quot;color: #234a97;&quot;&gt;i&lt;/span&gt;, &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;2&lt;/span&gt;] &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; AIC(lm(&lt;span style=&quot;color: #234a97;&quot;&gt;y&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;~&lt;/span&gt; poly(&lt;span style=&quot;color: #234a97;&quot;&gt;x&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;i&lt;/span&gt;)))&lt;br /&gt;     &lt;span style=&quot;color: #234a97;&quot;&gt;AIC.BIC&lt;/span&gt;[&lt;span style=&quot;color: #234a97;&quot;&gt;i&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;+&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;max.poly&lt;/span&gt;, &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;2&lt;/span&gt;] &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; BIC(lm(&lt;span style=&quot;color: #234a97;&quot;&gt;y&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;~&lt;/span&gt; poly(&lt;span style=&quot;color: #234a97;&quot;&gt;x&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;i&lt;/span&gt;)))&lt;br /&gt;}&lt;br /&gt;&lt;br /&gt;&lt;span style=&quot;color: #5a525f; font-style: italic;&quot;&gt;# График AIC и BIC для разных степеней полинома:&lt;/span&gt;&lt;br /&gt;qplot(&lt;span style=&quot;color: #234a97;&quot;&gt;degree&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;value&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;data&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;AIC.BIC&lt;/span&gt;, &lt;br /&gt;      &lt;span style=&quot;color: #234a97;&quot;&gt;geom&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0b6125;&quot;&gt;&quot;line&quot;&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;linetype&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;criterion&lt;/span&gt;) &lt;span style=&quot;color: #794938;&quot;&gt;+&lt;/span&gt;&lt;br /&gt;xlab(&lt;span style=&quot;color: #0b6125;&quot;&gt;&quot;Степень полинома&quot;&lt;/span&gt;) &lt;span style=&quot;color: #794938;&quot;&gt;+&lt;/span&gt; ylab(&lt;span style=&quot;color: #0b6125;&quot;&gt;&quot;Значение критерия&quot;&lt;/span&gt;)&lt;br /&gt;&lt;/pre&gt;&lt;br /&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;a href=&quot;https://1.bp.blogspot.com/-FS28lKhXcI0/WFhDpOm5G9I/AAAAAAAADHE/kKLN0B7sUOUWszP47QB0kbq5jepdX3ucQCLcB/s1600/N1_3.png&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; src=&quot;https://1.bp.blogspot.com/-FS28lKhXcI0/WFhDpOm5G9I/AAAAAAAADHE/kKLN0B7sUOUWszP47QB0kbq5jepdX3ucQCLcB/s1600/N1_3.png&quot; /&gt;&lt;/a&gt;&lt;/div&gt;&lt;div style=&quot;text-align: center;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;br /&gt;Минимальные значения информационных критериев приводят к выводу о том, что оптимальным является полином 5-й степени.&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;b&gt;&lt;span style=&quot;color: #444444;&quot;&gt;Использование алгоритмов ресэмплинга для тестирования и оптимизации параметров моделей&lt;/span&gt;&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;Минимизация ошибок на обучающем множестве, которое не бывает ни идеальным, ни бесконечно большим, неизбежно приводит к моделям, смещенным относительно истинной функции процесса, порождающего наблюдаемые данные. Преодолеть это смещение можно только с использованием &quot;принципа внешнего дополнения&quot;, т.е. блоков &quot;свежих&quot; данных, не участвовавших в построении модели.&lt;br /&gt;&lt;br /&gt;&lt;i&gt;Перекрестная проверка&lt;/i&gt; или &quot;кросс-проверка&quot; (англ. &lt;i&gt;cross-validation&lt;/i&gt;, CV) является общей процедурой эмпирического оценивания&amp;nbsp;параметров моделей по выборочным данным. В ходе многократного случайного разбиения исходной выборки на обучающее и проверочное подмножества оценка параметров модели выполняется только на обучающей выборке, тогда как оценка погрешности прогноза выполняется для наблюдений из проверочной совокупности.&lt;br /&gt;&lt;br /&gt;Одной из часто применяемых является методика &lt;i&gt;r&lt;/i&gt;×&lt;i&gt;k&lt;/i&gt;-кратной перекрестной проверки (англ.&amp;nbsp;&lt;i&gt;r&lt;/i&gt;×&lt;i&gt;k&lt;/i&gt;-&lt;i&gt;fold cross-validation&lt;/i&gt;), когда исходная выборка случайным образом &lt;i&gt;r&lt;/i&gt; раз разбивается на &lt;i&gt;k&lt;/i&gt; блоков (англ. &lt;i&gt;folds&lt;/i&gt;) равной (или почти равной) длины. При реализации каждой повторности &lt;i&gt;r&lt;/i&gt; (англ. &lt;i&gt;replication&lt;/i&gt;) один из блоков по очереди становится проверочной последовательностью, а все остальные блоки – обучающей выборкой. При этом генерируется &lt;i&gt;r&lt;/i&gt;×&lt;i&gt;n&lt;/i&gt; модельных значений отклика (&lt;i&gt;n&lt;/i&gt; – общее количество наблюдений), по которым оценивается ошибка перекрестной проверки.&lt;br /&gt;&lt;br /&gt;Выполнить разбиение исходной выборки &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;y&lt;/span&gt; на &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;k&lt;/span&gt; блоков можно с использованием следующих функций из пакета &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;caret&lt;/span&gt;&amp;nbsp;(Kuhn, Johnson, 2013), о которых мы &lt;a href=&quot;http://r-analytics.blogspot.ru/2015/08/blog-post_13.html&quot; target=&quot;_blank&quot;&gt;упоминали ранее&lt;/a&gt; при рассмотрении функции &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;createDataPartition()&lt;/span&gt;:&lt;br /&gt;&lt;div&gt;&lt;br /&gt;&lt;/div&gt;&lt;pre style=&quot;background: #f9f9f9; color: #080808;&quot;&gt;createFolds (&lt;span style=&quot;color: #234a97;&quot;&gt;y&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;k&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;10&lt;/span&gt;)&lt;br /&gt;createMultiFolds (&lt;span style=&quot;color: #234a97;&quot;&gt;y&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;k&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;10&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;times&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;r&lt;/span&gt;)&lt;br /&gt;&lt;/pre&gt;&lt;div&gt;&lt;br /&gt;&lt;/div&gt;&lt;div&gt;Частным случаем является &quot;&lt;i&gt;скользящий контроль&lt;/i&gt;&quot;, или &lt;i&gt;перекрестная проверка с последовательным исключением одного наблюдения&lt;/i&gt; (англ. &lt;i&gt;leave-one-out CV&lt;/i&gt;), т.е. &lt;i&gt;k&lt;/i&gt; = &lt;i&gt;n&lt;/i&gt;. При этом строится &lt;i&gt;n&lt;/i&gt; моделей по (&lt;i&gt;n&lt;/i&gt; – 1) выборочным значениям, а исключенное наблюдение каждый раз используется для расчета ошибки прогноза. В. Н. Вапник (1984) теоретически обосновал применение скользящего контроля и показал, что если исходные выборки независимы, то средняя ошибка перекрестной проверки дает несмещенную оценку ошибки модели. Это выгодно отличает ее от средней ошибки на обучающей выборке, которая при переусложнении модели может оказаться оптимистично заниженной.&lt;br /&gt;&lt;br /&gt;Выше мы рассмотрели пример выбора оптимального числа параметров полиномиальной регрессии с использованием информационных критериев. Попробуем достичь той же цели, выполнив перекрестную проверку моделей в режиме &quot;leave-one-out&quot; с использованием самостоятельно оформленной функции:&lt;/div&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f9f9f9; color: #080808;&quot;&gt;&lt;span style=&quot;color: #5a525f; font-style: italic;&quot;&gt;# Функция для выполнения скользящего контроля &lt;/span&gt;&lt;span style=&quot;color: #5a525f; font-style: italic;&quot;&gt;для модели y ~ poly(x, degree):&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #bf4f24;&quot;&gt;crossvalidate&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;function&lt;/span&gt;(&lt;span style=&quot;color: #234a97;&quot;&gt;x&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;y&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;degree&lt;/span&gt;) {&lt;br /&gt;   &lt;br /&gt;   &lt;span style=&quot;color: #234a97;&quot;&gt;preds&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; &lt;span style=&quot;color: #a71d5d; font-style: italic;&quot;&gt;numeric&lt;/span&gt;(length(&lt;span style=&quot;color: #234a97;&quot;&gt;x&lt;/span&gt;))&lt;br /&gt;&lt;br /&gt;   &lt;span style=&quot;color: #794938;&quot;&gt;for&lt;/span&gt; (&lt;span style=&quot;color: #234a97;&quot;&gt;i&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;in&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;1&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;:&lt;/span&gt;length(&lt;span style=&quot;color: #234a97;&quot;&gt;x&lt;/span&gt;)) {&lt;br /&gt;      &lt;span style=&quot;color: #234a97;&quot;&gt;x.in&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;x&lt;/span&gt;[&lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;i&lt;/span&gt;]&lt;br /&gt;      &lt;span style=&quot;color: #234a97;&quot;&gt;x.out&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;x&lt;/span&gt;[&lt;span style=&quot;color: #234a97;&quot;&gt;i&lt;/span&gt;]&lt;br /&gt;      &lt;span style=&quot;color: #234a97;&quot;&gt;y.in&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;y&lt;/span&gt;[&lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;i&lt;/span&gt;]&lt;br /&gt;      &lt;span style=&quot;color: #234a97;&quot;&gt;y.out&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;x&lt;/span&gt;[&lt;span style=&quot;color: #234a97;&quot;&gt;i&lt;/span&gt;]&lt;br /&gt;      &lt;span style=&quot;color: #234a97;&quot;&gt;m&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; lm(&lt;span style=&quot;color: #234a97;&quot;&gt;y.in&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;~&lt;/span&gt; poly(&lt;span style=&quot;color: #234a97;&quot;&gt;x.in&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;degree&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;degree&lt;/span&gt;) )&lt;br /&gt;      &lt;span style=&quot;color: #234a97;&quot;&gt;new&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; &lt;span style=&quot;color: #a71d5d; font-style: italic;&quot;&gt;data.frame&lt;/span&gt;(&lt;span style=&quot;color: #234a97;&quot;&gt;x.in&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;=&lt;/span&gt; seq(&lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;3&lt;/span&gt;, &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;3&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;by&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;0.1&lt;/span&gt;))&lt;br /&gt;      &lt;span style=&quot;color: #234a97;&quot;&gt;preds&lt;/span&gt;[&lt;span style=&quot;color: #234a97;&quot;&gt;i&lt;/span&gt;] &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; predict(&lt;span style=&quot;color: #234a97;&quot;&gt;m&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;newdata&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #a71d5d; font-style: italic;&quot;&gt;data.frame&lt;/span&gt;(&lt;span style=&quot;color: #234a97;&quot;&gt;x.in&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;x.out&lt;/span&gt;))&lt;br /&gt;   }&lt;br /&gt;&lt;br /&gt;  &lt;span style=&quot;color: #5a525f; font-style: italic;&quot;&gt;# Тестовая статистика - сумма квадратов отклонений:&lt;/span&gt;&lt;br /&gt;  &lt;span style=&quot;color: #794938;&quot;&gt;return&lt;/span&gt;(sum((&lt;span style=&quot;color: #234a97;&quot;&gt;y&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;preds&lt;/span&gt;)&lt;span style=&quot;color: #794938;&quot;&gt;^&lt;/span&gt;&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;2&lt;/span&gt;))&lt;br /&gt;}&lt;br /&gt;&lt;br /&gt;&lt;span style=&quot;color: #5a525f; font-style: italic;&quot;&gt;# Заполнение таблицы результатами перекрестной проверки &lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #5a525f; font-style: italic;&quot;&gt;# и сохранение квадрата ошибки в таблице &quot;a&quot;:&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;a&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; &lt;span style=&quot;color: #a71d5d; font-style: italic;&quot;&gt;data.frame&lt;/span&gt;(&lt;span style=&quot;color: #234a97;&quot;&gt;cross&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #a71d5d; font-style: italic;&quot;&gt;numeric&lt;/span&gt;(&lt;span style=&quot;color: #234a97;&quot;&gt;max.poly&lt;/span&gt;))&lt;br /&gt;&lt;span style=&quot;color: #794938;&quot;&gt;for&lt;/span&gt; (&lt;span style=&quot;color: #234a97;&quot;&gt;i&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;in&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;1&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;:&lt;/span&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;max.poly&lt;/span&gt;)&lt;br /&gt;{&lt;br /&gt;  &lt;span style=&quot;color: #234a97;&quot;&gt;a&lt;/span&gt;[&lt;span style=&quot;color: #234a97;&quot;&gt;i&lt;/span&gt;, &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;1&lt;/span&gt;] &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; crossvalidate(&lt;span style=&quot;color: #234a97;&quot;&gt;x&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;y&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;degree&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;i&lt;/span&gt;)&lt;br /&gt;}&lt;br /&gt;&lt;br /&gt;&lt;span style=&quot;color: #5a525f; font-style: italic;&quot;&gt;# График суммы квадратов ошибки при перекрестной проверке:&lt;/span&gt;&lt;br /&gt;qplot(&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;1&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;:&lt;/span&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;max.poly&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;cross&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;data&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;a&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;geom&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;=&lt;/span&gt; c(&lt;span style=&quot;color: #0b6125;&quot;&gt;&quot;line&quot;&lt;/span&gt;)) &lt;span style=&quot;color: #794938;&quot;&gt;+&lt;/span&gt;&lt;br /&gt;      xlab(&lt;span style=&quot;color: #0b6125;&quot;&gt;&quot;Степень полинома&quot;&lt;/span&gt;) &lt;span style=&quot;color: #794938;&quot;&gt;+&lt;/span&gt; ylab(&lt;span style=&quot;color: #0b6125;&quot;&gt;&quot;Квадратичная ошибка&quot;&lt;/span&gt;)&lt;br /&gt;&lt;/pre&gt;&lt;br /&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;a href=&quot;https://1.bp.blogspot.com/-dDs7-E1UcTk/WFhHZGQs-yI/AAAAAAAADHQ/Y-MddxU_oNMkFADicrdJ8_lzvrBTUwZAwCLcB/s1600/N1_4.png&quot; imageanchor=&quot;1&quot; style=&quot;margin-left: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; src=&quot;https://1.bp.blogspot.com/-dDs7-E1UcTk/WFhHZGQs-yI/AAAAAAAADHQ/Y-MddxU_oNMkFADicrdJ8_lzvrBTUwZAwCLcB/s1600/N1_4.png&quot; /&gt;&lt;/a&gt;&lt;/div&gt;&lt;div style=&quot;text-align: center;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;br /&gt;Из представленного выше графика следует, что в нашем конкретном случае оба метода в качестве оптимальной выбрали модель с полиномом 5-й степени. Проверим, имеется ли значимое превышение ее качества над моделью с одним предиктором:&lt;br /&gt;&lt;br /&gt;&lt;pre style=&quot;background: #f9f9f9; color: #080808;&quot;&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;M_poly&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;&amp;lt;-&lt;/span&gt; glm(&lt;span style=&quot;color: #234a97;&quot;&gt;y&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;~&lt;/span&gt; poly(&lt;span style=&quot;color: #234a97;&quot;&gt;x&lt;/span&gt;, &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;5&lt;/span&gt;))&lt;br /&gt;summary(&lt;span style=&quot;color: #234a97;&quot;&gt;M_poly&lt;/span&gt;)&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;Coefficients&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;:&lt;/span&gt;&lt;br /&gt;(&lt;span style=&quot;color: #234a97;&quot;&gt;Intercept&lt;/span&gt;)  poly(&lt;span style=&quot;color: #234a97;&quot;&gt;x&lt;/span&gt;, &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;5&lt;/span&gt;)&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;1&lt;/span&gt;  poly(&lt;span style=&quot;color: #234a97;&quot;&gt;x&lt;/span&gt;, &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;5&lt;/span&gt;)&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;2&lt;/span&gt;  poly(&lt;span style=&quot;color: #234a97;&quot;&gt;x&lt;/span&gt;, &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;5&lt;/span&gt;)&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;3&lt;/span&gt;  poly(&lt;span style=&quot;color: #234a97;&quot;&gt;x&lt;/span&gt;, &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;5&lt;/span&gt;)&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;4&lt;/span&gt;  poly(&lt;span style=&quot;color: #234a97;&quot;&gt;x&lt;/span&gt;, &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;5&lt;/span&gt;)&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;5&lt;/span&gt;  &lt;br /&gt;      &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;35.15&lt;/span&gt;      &lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;148.94&lt;/span&gt;        &lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;5.54&lt;/span&gt;        &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;51.08&lt;/span&gt;       &lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;13.90&lt;/span&gt;       &lt;span style=&quot;color: #794938;&quot;&gt;-&lt;/span&gt;&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;23.53&lt;/span&gt;  &lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;Degrees&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;of&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;Freedom&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;:&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;127&lt;/span&gt; Total (&lt;span style=&quot;color: #234a97;&quot;&gt;i.e&lt;/span&gt;. &lt;span style=&quot;color: #234a97;&quot;&gt;Null&lt;/span&gt;);  &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;122&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;Residual&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;Null&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;Deviance&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;:&lt;/span&gt;      &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;34730&lt;/span&gt; &lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;Residual&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;Deviance&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;:&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;9162&lt;/span&gt;         &lt;span style=&quot;color: #234a97;&quot;&gt;AIC&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;:&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;923.9&lt;/span&gt; &lt;br /&gt;&lt;br /&gt;anova(&lt;span style=&quot;color: #234a97;&quot;&gt;M_glm&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;M_poly&lt;/span&gt;, &lt;span style=&quot;color: #234a97;&quot;&gt;test&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;=&lt;/span&gt; &lt;span style=&quot;color: #0b6125;&quot;&gt;&quot;Chisq&quot;&lt;/span&gt;)&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;Analysis&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;of&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;Deviance&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;Table&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;Model&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;1&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;:&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;y&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;~&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;x&lt;/span&gt;&lt;br /&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;Model&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;2&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;:&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;y&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;~&lt;/span&gt; poly(&lt;span style=&quot;color: #234a97;&quot;&gt;x&lt;/span&gt;, &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;5&lt;/span&gt;)&lt;br /&gt;  &lt;span style=&quot;color: #234a97;&quot;&gt;Resid&lt;/span&gt;. &lt;span style=&quot;color: #234a97;&quot;&gt;Df&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;Resid&lt;/span&gt;. &lt;span style=&quot;color: #234a97;&quot;&gt;Dev&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;Df&lt;/span&gt; &lt;span style=&quot;color: #234a97;&quot;&gt;Deviance&lt;/span&gt; P(&lt;span style=&quot;color: #794938;&quot;&gt;&amp;gt;&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;|&lt;/span&gt;&lt;span style=&quot;color: #234a97;&quot;&gt;Chi&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;|&lt;/span&gt;)    &lt;br /&gt;&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;1&lt;/span&gt;       &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;126&lt;/span&gt;      &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;12549&lt;/span&gt;                          &lt;br /&gt;&lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;2&lt;/span&gt;       &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;122&lt;/span&gt;       &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;9162&lt;/span&gt;  &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;4&lt;/span&gt;   &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;3386.6&lt;/span&gt; &lt;span style=&quot;color: #811f24; font-weight: 700;&quot;&gt;3.798e-09&lt;/span&gt; &lt;span style=&quot;color: #794938;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;*&lt;/span&gt;&lt;span style=&quot;color: #794938;&quot;&gt;*&lt;/span&gt;&lt;br /&gt;&lt;/pre&gt;&lt;br /&gt;Как видим, имеет место статистически значимое снижение ошибки модели.&lt;br /&gt;&lt;br /&gt;В R перекрестную проверку модели можно выполнить с использованием не только самостоятельно оформленных процедур, но и функций из нескольких общедоступных пакетов:&lt;br /&gt;&lt;ul&gt;&lt;li&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;CVlm(df, form.lm, m = 3)&lt;/span&gt; из пакета &lt;span style=&quot;font-family: Courier New, Courier, monospace;&quot;&gt;DAAG&lt;/span&gt;, где &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;df&lt;/span&gt; – исходная таблица с данными, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;form.lm&lt;/span&gt; – формула линейной модели, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;m&lt;/span&gt; – число блоков (сюда подставляется значение &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;k&lt;/span&gt;);&lt;/li&gt;&lt;li&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;cv.glm(df, glmfit, K = n)&lt;/span&gt; из пакета &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;boot&lt;/span&gt;, где &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;df&lt;/span&gt; – исходная таблица с данными, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;glmfit&lt;/span&gt; – объект обобщенной линейной модели класса &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;glm&lt;/span&gt;, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;K&lt;/span&gt; – число блоков (по умолчанию выполняется скользящий контроль);&lt;/li&gt;&lt;li&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;cvLm(lmfit, folds = cvFolds(n, K, R), cost)&lt;/span&gt; из пакета &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;cvTools&lt;/span&gt;, где &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;lmfit&lt;/span&gt; – объект обобщенной линейной модели, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;K&lt;/span&gt; – число блоков, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;R&lt;/span&gt; – число репликаций, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;cost&lt;/span&gt; – наименование одного из пяти разновидностей выводимых критериев перекрестной проверки;&lt;/li&gt;&lt;li&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;train(form, df, method, trainControl, ...)&lt;/span&gt; из пакета &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;caret&lt;/span&gt;, где &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;df&lt;/span&gt; – исходная таблица с данными, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;form&lt;/span&gt;, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;method&lt;/span&gt; – формула и метод построения модели, &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;trainControl&lt;/span&gt; – объект, в котором прописываются все необходимые параметры перекрестной проверки.&lt;/li&gt;&lt;/ul&gt;Использование функции &lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;train(...)&lt;/span&gt; будет предметом наших дальнейших сообщений.&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;b&gt;&lt;span style=&quot;color: #444444;&quot;&gt;Литературные источники&lt;/span&gt;&lt;/b&gt;&lt;br /&gt;&lt;ul&gt;&lt;li&gt;Вапник В. Н. (1984) Алгоритмы и программы восстановления зависимостей. М.: Наука, 816 с.&lt;/li&gt;&lt;li&gt;Ивахненко А. Г. (1982) Индуктивный метод самоорганизации моделей сложных систем. Киев: Наук. думка, 296 с.&lt;/li&gt;&lt;li&gt;Мастицкий С. Э. (2016) Визуализация данных с помощью ggplot2. М.: ДМК Пресс, 222 с.&lt;/li&gt;&lt;li&gt;Burnham K. P., Anderson D. R. (2002) Model selection and multimodel inference: a practical information-theoretic approach. N.Y.: Springer-Verlag, 496 p.&lt;/li&gt;&lt;li&gt;Kuhn M., Johnson K. (2013) Applied Predictive Modeling. Springer, 600 p.&lt;/li&gt;&lt;/ul&gt;&lt;/div&gt;&lt;/div&gt;</content><link rel='replies' type='text/html' href='http://r-analytics.blogspot.com/2016/12/blog-post.html#comment-form' title='Комментарии: 3'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/3878179241674388012'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/3878179241674388012'/><link rel='alternate' type='text/html' href='http://r-analytics.blogspot.com/2016/12/blog-post.html' title='Методы и критерии верификации регрессионных моделей'/><author><name>Sergey Mastitsky</name><uri>https://plus.google.com/100743762419147389233</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='32' height='32' src='//lh3.googleusercontent.com/-S7CBBqIIWg0/AAAAAAAAAAI/AAAAAAAAANI/e7vggjNa3Mo/s512-c/photo.jpg'/></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://2.bp.blogspot.com/-BAha1xkNPSA/WFcIz-pEUzI/AAAAAAAADGw/U1L2lv_KKXEIqLaIH3JOhFGNKe0X8k04ACLcB/s72-c/N1_1.png" height="72" width="72"/><thr:total>3</thr:total></entry><entry><id>tag:blogger.com,1999:blog-9120847565867616203.post-2897078093273152065</id><published>2016-12-10T12:49:00.001+00:00</published><updated>2017-01-22T18:40:29.402+00:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="R-пакеты"/><title type='text'>Обзор R-пакетов за ноябрь 2016 г.</title><content type='html'>&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;table cellpadding=&quot;0&quot; cellspacing=&quot;0&quot; class=&quot;tr-caption-container&quot; style=&quot;float: left; margin-right: 1em; text-align: left;&quot;&gt;&lt;tbody&gt;&lt;tr&gt;&lt;td style=&quot;text-align: center;&quot;&gt;&lt;a href=&quot;https://1.bp.blogspot.com/--CDuFm5imFI/WEv3ZvEHgeI/AAAAAAAADGA/1PP-u5VfnyY02Cjmq8YaIKKmAp0ZOh8eACLcB/s1600/available-R-packages.png&quot; imageanchor=&quot;1&quot; style=&quot;clear: left; margin-bottom: 1em; margin-left: auto; margin-right: auto;&quot;&gt;&lt;img border=&quot;0&quot; height=&quot;280&quot; src=&quot;https://1.bp.blogspot.com/--CDuFm5imFI/WEv3ZvEHgeI/AAAAAAAADGA/1PP-u5VfnyY02Cjmq8YaIKKmAp0ZOh8eACLcB/s400/available-R-packages.png&quot; width=&quot;400&quot; /&gt;&lt;/a&gt;&lt;/td&gt;&lt;/tr&gt;&lt;tr&gt;&lt;td class=&quot;tr-caption&quot; style=&quot;text-align: center;&quot;&gt;Автор рисунка:&amp;nbsp;&lt;i&gt;Xiao Nan&lt;/i&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/tbody&gt;&lt;/table&gt;По состоянию на 10 декабря 2016 г. на сайте CRAN было опубликовано около 12 тысяч пакетов для R. Такое разнообразие приложений, наряду с очень активным сообществом пользователей, является уникальным преимуществом R, по сравнению с другими языками и системами, предназначенными для анализа данных. В то же время становится все труднее находить пакеты, подходящие для решения тех или иных задач. Эта проблема особенно актуальна среди пользователей, недотостаточно владеющих английским языком. Чтобы как-то помочь таким пользователям, я буду периодически делать небольшие обзоры наиболее интересных пакетов, опубликованных или обновленных &lt;i&gt;примерно&amp;nbsp;за последний месяц&lt;/i&gt;&amp;nbsp;(ниже представлен обзор для ноябрь - начало декабря 2016 г.)&lt;i&gt;.&lt;/i&gt;&amp;nbsp;Безусловно, эти обзоры будут в значительной мере отражать мое собственное представление о том, что является интересным. Поэтому если я что-то упустил, сообщайте об этом в комментариях.&amp;nbsp;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;/div&gt;&lt;ul&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/anytime/index.html&quot; target=&quot;_blank&quot;&gt;anytime&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- мощный инструмент для работы с любыми форматами дат.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;Несколько утилит от Томаса Липера (&lt;i&gt;Thomas Leeper&lt;/i&gt;) для работы с Amazon Web Services:&lt;/li&gt;&lt;ul&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/aws.signature/index.html&quot; target=&quot;_blank&quot;&gt;aws.signature&lt;/a&gt;&lt;/span&gt;: генерация подписей для различных AWS API;&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/aws.polly/index.html&quot; target=&quot;_blank&quot;&gt;aws.polly&lt;/a&gt;&lt;/span&gt;: R-клиент для работы с сервисом имитации речи&amp;nbsp;&lt;a href=&quot;https://aws.amazon.com/documentation/polly/&quot; target=&quot;_blank&quot;&gt;Polly&lt;/a&gt;;&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/aws.sns/index.html&quot; target=&quot;_blank&quot;&gt;aws.sns&lt;/a&gt;&lt;/span&gt;: R-клиент для работы с сервисом отправки уведомений&amp;nbsp;&lt;a href=&quot;https://aws.amazon.com/documentation/sns/&quot; target=&quot;_blank&quot;&gt;Simple Notification Service&lt;/a&gt;&amp;nbsp;(SNS);&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/aws.sqs/index.html&quot; target=&quot;_blank&quot;&gt;aws.sqs&lt;/a&gt;&lt;/span&gt;: R-клиент для работы с&amp;nbsp;&lt;a href=&quot;https://aws.amazon.com/sqs/&quot; target=&quot;_blank&quot;&gt;Simple Queue Service&lt;/a&gt;.&lt;/li&gt;&lt;/ul&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/bayesplot/index.html&quot; target=&quot;_blank&quot;&gt;bayesplot&lt;/a&gt;&lt;/span&gt; - набор функций для визуализации апостериорных распределений параметров моделей и диагностики качества моделей, построенных с использованием принципов байесовской статистики. В частности, содержит функции, которые позволяют работать с моделями&amp;nbsp;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;http://mc-stan.org/interfaces/rstan&quot; target=&quot;_blank&quot;&gt;Stan&lt;/a&gt;&lt;/span&gt;.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/bookdown/index.html&quot; target=&quot;_blank&quot;&gt;bookdown&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- набор утилит для подготовки книг и технической документации с помощью&amp;nbsp;&lt;a href=&quot;http://rmarkdown.rstudio.com/&quot; target=&quot;_blank&quot;&gt;R Markdown&lt;/a&gt;.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/diverse/index.html&quot; target=&quot;_blank&quot;&gt;diverse&lt;/a&gt;&lt;/span&gt; - предназначен для вычисления целого ряда мер энтропии, используемых в социальных и других науках. Может оказаться особенно полезным для создания новых предикторов по имеющимся переменным&amp;nbsp;при разработке предсказательных моделей.&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/fastcluster/index.html&quot; target=&quot;_blank&quot;&gt;fastcluster&lt;/a&gt;&lt;/span&gt; - эффективная (с точки зрения скорости вычислений) реализация иерархического кластерного анализа. Пакет одновременно содержит соответствующие функции как для R, так и для Python (см. &lt;a href=&quot;https://cran.r-project.org/web/packages/fastcluster/vignettes/fastcluster.pdf&quot; target=&quot;_blank&quot;&gt;руководство пользователя&lt;/a&gt;).&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/Radviz/index.html&quot; target=&quot;_blank&quot;&gt;Radviz&lt;/a&gt;&lt;/span&gt;&amp;nbsp;(от англ.&amp;nbsp;&lt;i&gt;&lt;a href=&quot;http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.135.889&quot; target=&quot;_blank&quot;&gt;radial coordinate&amp;nbsp;visualisation&lt;/a&gt;&lt;/i&gt;) - позволяет выполнять проецирование многомерных данных на двухмерную плоскость, что, в частности, будет полезным при визуализации результатов кластерного анализа (см. &lt;a href=&quot;https://cran.r-project.org/web/packages/Radviz/vignettes/single_cell_projections.html&quot; target=&quot;_blank&quot;&gt;руководство пользователя&lt;/a&gt;).&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/rex/index.html&quot; target=&quot;_blank&quot;&gt;rex&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- набор функций для работы с регулярными выражениями. Стандартные возможности R для работы с регулярными выражениями трудно назвать &quot;дружественными&quot; для пользователя. Пакет&amp;nbsp;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;rex&lt;/span&gt;&amp;nbsp;решает эту проблему очень удачно (см.&amp;nbsp;&lt;a href=&quot;https://cran.r-project.org/web/packages/rex/vignettes/log_parsing.html&quot; target=&quot;_blank&quot;&gt;пример&lt;/a&gt;).&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/tsoutliers/index.html&quot; target=&quot;_blank&quot;&gt;tsoutliers&lt;/a&gt;&lt;/span&gt; - функции для обнаружения выбросов при работе с временными рядами (по методу &lt;a href=&quot;http://www.jstor.org/stable/2290724&quot; target=&quot;_blank&quot;&gt;&lt;i&gt;Chen&lt;/i&gt; &amp;amp; &lt;i&gt;Liu&lt;/i&gt;, 1993&lt;/a&gt;).&lt;/li&gt;&lt;li style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family: &amp;quot;courier new&amp;quot; , &amp;quot;courier&amp;quot; , monospace;&quot;&gt;&lt;a href=&quot;https://cran.r-project.org/web/packages/Strategy/index.html&quot; target=&quot;_blank&quot;&gt;Strategy&lt;/a&gt;&lt;/span&gt;&amp;nbsp;- пакет для разработки и оценки эффективности торговых стратегий. Имеется возможность использовать как готовые стратегии, так и добавлять свои собственные.&lt;/li&gt;&lt;/ul&gt;&lt;div style=&quot;text-align: right;&quot;&gt;&lt;i&gt;Сергей Мастицкий&lt;/i&gt;&lt;/div&gt;&lt;div style=&quot;text-align: right;&quot;&gt;&lt;i&gt;&lt;br /&gt;&lt;/i&gt;&lt;/div&gt;&lt;br /&gt;&lt;script async src=&quot;//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js&quot;&gt;&lt;/script&gt;&lt;!-- R Analytics Responsive --&gt;&lt;ins class=&quot;adsbygoogle&quot;      style=&quot;display:block&quot;      data-ad-client=&quot;ca-pub-6457966355894443&quot;      data-ad-slot=&quot;8123690788&quot;      data-ad-format=&quot;auto&quot;&gt;&lt;/ins&gt;&lt;script&gt;(adsbygoogle = window.adsbygoogle || []).push({}); &lt;/script&gt;</content><link rel='replies' type='text/html' href='http://r-analytics.blogspot.com/2016/12/r-2016.html#comment-form' title='Комментарии: 3'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/2897078093273152065'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/2897078093273152065'/><link rel='alternate' type='text/html' href='http://r-analytics.blogspot.com/2016/12/r-2016.html' title='Обзор R-пакетов за ноябрь 2016 г.'/><author><name>Sergey Mastitsky</name><uri>https://plus.google.com/100743762419147389233</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='32' height='32' src='//lh3.googleusercontent.com/-S7CBBqIIWg0/AAAAAAAAAAI/AAAAAAAAANI/e7vggjNa3Mo/s512-c/photo.jpg'/></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://1.bp.blogspot.com/--CDuFm5imFI/WEv3ZvEHgeI/AAAAAAAADGA/1PP-u5VfnyY02Cjmq8YaIKKmAp0ZOh8eACLcB/s72-c/available-R-packages.png" height="72" width="72"/><thr:total>3</thr:total></entry><entry><id>tag:blogger.com,1999:blog-9120847565867616203.post-7829070664808810682</id><published>2016-12-04T10:04:00.000+00:00</published><updated>2017-01-22T18:40:47.779+00:00</updated><category scheme="http://www.blogger.com/atom/ns#" term="R-события"/><category scheme="http://www.blogger.com/atom/ns#" term="книги"/><title type='text'>Новые книги по R на русском языке</title><content type='html'>&lt;div style=&quot;text-align: justify;&quot;&gt;Осенью этого года в московском издательстве &quot;ДМК Пресс&quot; вышли две новые книги по R на русском языке. Краткое описание этих книг приводится ниже.&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;a href=&quot;https://1.bp.blogspot.com/-7kqjioRakik/WEPnMMXFcbI/AAAAAAAADFg/JB7BNFZ-BOQbyzERklK4HVn-XpqVrLXUQCLcB/s1600/978-5-97060-470-0_270_369__100.jpg&quot; imageanchor=&quot;1&quot; style=&quot;clear: left; float: left; margin-bottom: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; height=&quot;320&quot; src=&quot;https://1.bp.blogspot.com/-7kqjioRakik/WEPnMMXFcbI/AAAAAAAADFg/JB7BNFZ-BOQbyzERklK4HVn-XpqVrLXUQCLcB/s320/978-5-97060-470-0_270_369__100.jpg&quot; width=&quot;234&quot; /&gt;&lt;/a&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;a href=&quot;https://dmkpress.com/catalog/computer/statistics/978-5-97060-470-0/&quot; target=&quot;_blank&quot;&gt;&lt;i&gt;Мастицкий С. Э. (2016) Визуализация данных с помощью ggplot2. - М.: ДМК Пресс, 222 с.&lt;/i&gt;&lt;/a&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Визуализация данных играет важную роль на всех этапах статистического анализа – от первичного ознакомления со свойствами данных до диагностики качества построенных моделей и представления полученных результатов. Из всего разнообразия статистических программ выделяется R - интенсивно развивающаяся и свободно распространяемая система статистических вычислений, в которой реализовано множество классических и современных методов анализа данных. Программные реализации алгоритмов, входящих в базовую версию R, проверены на практике не одним поколением пользователей и ученых. Кроме того, пользователи R постоянно разрабатывают многочисленные дополнения (т.н. «пакеты») для этой системы. Настоящая книга посвящена &lt;span style=&quot;font-family: Courier New, Courier, monospace;&quot;&gt;ggplot2&lt;/span&gt;&amp;nbsp;- одному из таких пакетов, который значительно расширяет и без того богатые базовые графические возможности R. В 2015 г. &lt;span style=&quot;font-family: Courier New, Courier, monospace;&quot;&gt;ggplot2&lt;/span&gt; был установлен более миллиона раз. Такая популярность этого пакета обусловлена несколькими причинами, среди которых можно отметить эстетическую привлекательность и пригодное для публикации качество получаемых с его помощью графиков, возможность создавать пользовательские типы диаграмм, а также большой набор опций для тонкой настройки внешнего вида графиков. В этой книге описаны основы работы с &lt;span style=&quot;font-family: Courier New, Courier, monospace;&quot;&gt;ggplot2&lt;/span&gt; и приведены многочисленные примеры кода, которые читатели легко могут модифицировать для собственных нужд. Книга окажется полезной для всех пользователей R, желающих освоить новый мощный инструмент анализа данных.&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div class=&quot;separator&quot; style=&quot;clear: both; text-align: center;&quot;&gt;&lt;a href=&quot;https://2.bp.blogspot.com/-V2l8KV0Vz70/WEPokiI6sqI/AAAAAAAADFs/LMSZOZcNH3AAxhug8tm2SoPEF-snRVWRwCLcB/s1600/978-5-97060-459-5_270_369__100.jpg&quot; imageanchor=&quot;1&quot; style=&quot;clear: left; float: left; margin-bottom: 1em; margin-right: 1em;&quot;&gt;&lt;img border=&quot;0&quot; height=&quot;320&quot; src=&quot;https://2.bp.blogspot.com/-V2l8KV0Vz70/WEPokiI6sqI/AAAAAAAADFs/LMSZOZcNH3AAxhug8tm2SoPEF-snRVWRwCLcB/s320/978-5-97060-459-5_270_369__100.jpg&quot; width=&quot;234&quot; /&gt;&lt;/a&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;a href=&quot;https://dmkpress.com/catalog/computer/statistics/978-5-97060-459-5/&quot; target=&quot;_blank&quot;&gt;&lt;i&gt;Храмов Д. А. (2017) Сбор данных в Интернете на языке R. - М.: ДМК Пресс, 283 с.&lt;/i&gt;&lt;/a&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Всё, что регистрирует человек и созданные им машины, может считаться данными. Фиксируя новое и переводя архивы в цифровую форму, мы с каждым днём производим всё больше данных. Часть из них находится в специальных хранилищах, готовые к использованию. Но гораздо чаще случается так, что данные разбросаны по всемирной сети на многочисленных страницах онлайновых магазинов, заметках в со­циальных сетях, логах серверов и т. п. Прежде чем начать работать с такими данными, их необходимо собрать и сохранить в пригодном для анализа виде. Решению этих вопросов и посвящена данная книга. Основной материал книги разделён на две части. В первой части дано краткое введение в R - описание среды разра­ботки, языка и основных пакетов-расширений. Вторая часть посвящена непосредственно сбору данных: работе с открытыми данными, извлечению данных из веб-страниц и из соци­альных сетей. Также рассмотрены необходимые технические вопро­сы: протокол HTTP, функции импорта данных различных форматов и регулярные выражения. Завершается рассказ созданием карт на основе собранных данных. Издание предназначено специалистам по анализу данных, а также программистам, интересующихся сбором данных в Интернете.&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;Распространение информации об этих книгах приветствуется!&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: right;&quot;&gt;&lt;i&gt;Сергей Мастицкий&lt;/i&gt;&lt;/div&gt;&lt;div style=&quot;text-align: right;&quot;&gt;&lt;i&gt;&lt;br /&gt;&lt;/i&gt;&lt;/div&gt;&lt;div style=&quot;text-align: right;&quot;&gt;&lt;i&gt;&lt;br /&gt;&lt;/i&gt;&lt;/div&gt;&lt;script async src=&quot;//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js&quot;&gt;&lt;/script&gt;&lt;!-- R Analytics Responsive --&gt;&lt;ins class=&quot;adsbygoogle&quot;      style=&quot;display:block&quot;      data-ad-client=&quot;ca-pub-6457966355894443&quot;      data-ad-slot=&quot;8123690788&quot;      data-ad-format=&quot;auto&quot;&gt;&lt;/ins&gt;&lt;script&gt;(adsbygoogle = window.adsbygoogle || []).push({}); &lt;/script&gt;</content><link rel='replies' type='text/html' href='http://r-analytics.blogspot.com/2016/12/r.html#comment-form' title='Комментарии: 3'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/7829070664808810682'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/7829070664808810682'/><link rel='alternate' type='text/html' href='http://r-analytics.blogspot.com/2016/12/r.html' title='Новые книги по R на русском языке'/><author><name>Sergey Mastitsky</name><uri>https://plus.google.com/100743762419147389233</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='32' height='32' src='//lh3.googleusercontent.com/-S7CBBqIIWg0/AAAAAAAAAAI/AAAAAAAAANI/e7vggjNa3Mo/s512-c/photo.jpg'/></author><media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" url="https://1.bp.blogspot.com/-7kqjioRakik/WEPnMMXFcbI/AAAAAAAADFg/JB7BNFZ-BOQbyzERklK4HVn-XpqVrLXUQCLcB/s72-c/978-5-97060-470-0_270_369__100.jpg" height="72" width="72"/><thr:total>3</thr:total></entry><entry><id>tag:blogger.com,1999:blog-9120847565867616203.post-7271793707166778289</id><published>2016-11-19T05:39:00.000+00:00</published><updated>2016-11-19T05:39:14.074+00:00</updated><title type='text'>Перезагрузка</title><content type='html'>&lt;div style=&quot;text-align: justify;&quot;&gt;В июне этого года я объявил о прекращении ведения блога &quot;R: Анализ и визуализация данных&quot; в связи с хронической нехваткой у меня свободного времени. Оказалось, однако, что многие читатели хотели бы продолжения этого проекта. Сегодня я рад сообщить о его &quot;возвращении к жизни&quot;, хотя и в несколько измененном виде. У сайта появился новый редактор - доктор биологических наук, профессор&amp;nbsp;&lt;a href=&quot;https://petrsu.ru/persons/870/korosov&quot; target=&quot;_blank&quot;&gt;Андрей Викторович Коросов&lt;/a&gt;, который любезно согласился взять на себя основной труд по подготовке новых публикаций. Я также буду участвовать в написании новых материалов, однако не так активно, как в прошлом. Вместе с Андреем Викторовичем мы постараемся привлечь и других авторов, желающих поделиться своим опытом работы с R. Если бы вы хотели бы стать одним из таких авторов, то свяжитесь с нами, пожалуйста,&amp;nbsp;&amp;nbsp;по адресу электронной почты, приведенному в разделе &quot;О проекте&quot;.&lt;/div&gt;&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;br /&gt;&lt;/div&gt;&lt;div style=&quot;text-align: right;&quot;&gt;&lt;i&gt;Сергей Мастицкий&lt;/i&gt;&lt;/div&gt;</content><link rel='replies' type='text/html' href='http://r-analytics.blogspot.com/2016/11/blog-post.html#comment-form' title='Комментарии: 11'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/7271793707166778289'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/9120847565867616203/posts/default/7271793707166778289'/><link rel='alternate' type='text/html' href='http://r-analytics.blogspot.com/2016/11/blog-post.html' title='Перезагрузка'/><author><name>Sergey Mastitsky</name><uri>https://plus.google.com/100743762419147389233</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='32' height='32' src='//lh3.googleusercontent.com/-S7CBBqIIWg0/AAAAAAAAAAI/AAAAAAAAANI/e7vggjNa3Mo/s512-c/photo.jpg'/></author><thr:total>11</thr:total></entry></feed>