Для всех заданий надо взять класс MapReduce и для него написать функции reader, map и reduce.
TF-IDF: надо скачать любые 10 книг на одном языке в txt формате и для каждого слова в каждой книге посчитать TF-IDF. Тут вот удобно показано, что надо подавать на вход функциям и что возвращать из них: https://marcellodesales.wordpress.com/2009/12/31/tf-idf-in-hadoop-part-1-word-frequency-in-doc/
Для регрессии и град. спуска надо взять два любых временных ряда (например, стоимости акций каких-нибудь) и построить зависимость одной акции от другой (акция2 = b_0 + b_1 * акция1).
Для графов есть файл для которого надо считать. Сначала надо перевести данные из формата, в котором они на почте в формат связанных списков, т.е. "список рёбер" -> "список смежности" (http://vtcloud5.ulstu.ru/ru/figureimageru?pid=c3a4). А потом принять расстояние до первого узла за 0 и посчитать расстояния до всех остальных узлов алгоритмом BFS (https://courses.cs.washington.edu/courses/cse490h/08au/lectures/algorithms.pdf)
После окончания специалитета или магистратуры выпускник может заниматься профессиональной деятельностью или продолжить обучение на следующем образовательном уроне — в аспирантуре. Чтобы поступить туда, нужно сдать вступительные экзамены.Но не все так просто. Для начала придется сформулировать тему …
Читать дальшеПлан учебно-творческой работы по технологии, музыке или ИЗО – неотъемлемая часть процесса обучения. План реализации творческого проекта понадобится в ходе выполнения проектной работы, а также чтобы оформить групповой или индивидуальный проект.Если вы ищете информацию по другим видам работ, сможете …
Читать дальше