Homework1 (1185387)
Текст из файла
Домашнее задание №1Целью домашнего задания №1 является освоение работы с Microsoft HDInsight,технологией MapReduce, компиляцией и постановкой hadoop-задач на счет.Срок сдачи: 28 октября, 23:59:59. Решения, присланные позже данного срока, непринимаются.Формулировка задания: Вам необходимо проделать по инструкции, составленнойпреподавателями: http://bigdata.cs.msu.ru/images/c/c0/Hadoop_Introduction.pdf все шаги посозданию хранилища, созданию кластера, компиляции программы WordCount, ее запускуна кластере и просмотру результата.После того, как Вы получите вывод статистики по частоте слов, выведите списокнаиболее часто встречаемых слов (с максимальной частотой встречаемости).
Данныйсписок сохраните в текстовом файле в формате «слово пробел частота встречаемости»,список должен быть упорядоченным по словам.Далее Вам необходимо модифицировать исходную программу таким образом, чтобы уВас выводилась статистика по длинам слов.Программу по подсчету статистики по длинам слов необходимо запустить как на наборевходных данных, указанном в инструкции, так и на наборе данных, выданномпреподавателями: wasb://hometask1@bigdatamsu.blob.core.windows.net/Далее Вам необходимо на почту курса bigdata@cs.msu.ru отправить архив в форматеTask1-Фамилия.rar (фамилия на англ.), состоящий из шести файлов:wordcount.java файл с Вашим кодом по выводу наиболее часто встречаемых словwordlencount.java файл с Вашим кодом по подсчету статистики длин словСформированные wordcount.jar и wordlencount.jar файлыТекстовый файл с наиболее часто встречаемыми словами (для набора данных,указанного в инструкции)5) Вспомогательные файлы для сборки (если используются)6) Файл readme.txt с описанием того, как Вы компилировали и запускали программы1)2)3)4).
Характеристики
Тип файла PDF
PDF-формат наиболее широко используется для просмотра любого типа файлов на любом устройстве. В него можно сохранить документ, таблицы, презентацию, текст, чертежи, вычисления, графики и всё остальное, что можно показать на экране любого устройства. Именно его лучше всего использовать для печати.
Например, если Вам нужно распечатать чертёж из автокада, Вы сохраните чертёж на флешку, но будет ли автокад в пункте печати? А если будет, то нужная версия с нужными библиотеками? Именно для этого и нужен формат PDF - в нём точно будет показано верно вне зависимости от того, в какой программе создали PDF-файл и есть ли нужная программа для его просмотра.