Контрольная работа по разделу «Разведочный анализ данных в R»
Разведочный анализ – это исследование данных при помощи методов описательной статистики и визуализации с целью выявления зависимостей в них и выдвижения гипотез для последующего углубленного анализа, - например, моделирования. Еще одной целью разведочного анализа является оценка пригодности данных к анализу, выявление наличия в них различных проблем, таких как выбросы, пропущенные или некорректные значения, нарушение допущений статистических моделей, которые предполагается в дальнейшем применять к этим данным.
В процессе выполнения этого задания вы выполните разведочный анализ предложенного вам, или самостоятельно выбранного набора данных и продемонстрируете свой уровень владения R для анализа и визуализации данных, а также свою способность интерпретировать полученные результаты и делать выводы на их основе.
Все этапы подготовки и анализа данных необходимо отразить в HTML-отчете, сгенерированном RStudio. Исходные данные, требования к содержанию отчета и критерии оценивания вы найдете в следующих разделах. Структура отчета
Все этапы подготовки данных и анализа должны быть отражены в HTML-отчете, полученном при помощи кнопки knit в RStudio.
Ваш отчет должен включать следующие разделы:
1) Заголовок и сведения об авторе (заполняется автоматически в соответствии с параметрами документа RMarkdown)
2) Аннотация – краткое (2-3 предложения) описание того, какая задача решена в вашем исследовании и какие результаты получены
3) Введение – постановка задачи и описание набора данных, если собирали данные сами – ссылки на источники.
4) Подготовка данных к анализу – в этот раздел поместите код для загрузки данных, а также проверку технического качества (обработка пропусков, изменение форматов, работа с уровнями факторов и т.п., фильтрация или подвыборка).
5) Разведочный анализ данных – в этом разделеследует отразить ваши мысли, гипотезы и результаты их проверки в ходе поиска и анализа зависимостей в данных. Раздел должен быть структурирован на подразделы при помощи заголовков. Вы можете использовать здесь «черновые» графики и не тратить много времени на их оформление, однако корректность выбора способа визуализации в зависимости от вида данных и решаемой задачи будет оцениваться. Обязательно следует описывать ваши предположения и комментировать полученные результаты. Вы можете оставлять в отчете «тупиковые» ветви вашего анализа – гипотезы, которые не нашли подтверждения в данных. При оформлении кода придерживайтесь этих рекомендаций.
6) Итоговые результаты и выводы
В этом разделе необходимо поместить три визуализации, которые наилучшим образом отражают результаты вашего исследования. Эти визуализации должны быть оформлены максимально наглядным образом (подберите эффективную палитру, используйте аннотации и инструменты для сравнения, «отполируйте» названия и метки на графике, выделите наиболее важные элементы для привлечения внимания к ним и т.п.). Рекомендуем ознакомиться с руководством CreatingEffecitvePlots из MOOC и главой GraphicsforCommunication из книги R for Data Science. Вы можете повторить визуализации, которые уже были включены в раздел «Разведочный анализ», или сделать новые. Постарайтесь, чтобы ваша идея была понятна аудитории уже при просмотре визуализации, и для понимания не требовалось изучать ваше описание и, тем более, код.
В выводах следует отразить и интерпретировать основные результаты, полученные вами в ходе разведочного анализа. Какие гипотезы подтвердились, а какие – нет. Как эти результаты могут быть использованы, и какие ограничения при этом следует учесть.
По желанию, вы можете также отразить трудности, которые встретились вам в процессе анализа, а также указать источники/материалы, которые помогли вам их преодолеть.
Тип: Контрольная работа
Предмет: HTML
Создать сайт в нотациях HTML5 с использованием CSS3
Стоимость: 515 руб.
Тип: Контрольная работа
Предмет: HTML
Контрольная работа HTML - CSS шаблон сайта
Стоимость: 530 руб.
Тип: Контрольная работа
Предмет: HTML
практическое работа 4 задания создание HTML страниц и одна итоговая создание сайта
Стоимость: 490 руб.
– раздел механики, которому уделяется больше всего учебных часов. Уделите 5 минут на то, чтобы прочесть нашу статью и чуть больше разобраться в решении задач по динамике.Наш – место, где мы скрупулезно отбираем, фильтруем и выкладываем все, что может быть полезно современному студенту. Под лежачи…
Читать дальшеРоль самостоятельной работы довольно велика:Самостоятельная работа не нацелена на то, чтобы давать знания. Она направлена на обучение студентов правильному самостоятельному поиску этих знаний. Образовательная система несовершенна. Существует огромный разрыв между тем, что должен знать студент, и т…
Читать дальше