Главная » Все файлы » Просмотр файлов из архивов » PDF-файлы » Лекция 0. Аналитическое ПО SAS и его применение в BIG DATA

Лекция 0. Аналитическое ПО SAS и его применение в BIG DATA (Лекции 2015), страница 3

PDF-файл Лекция 0. Аналитическое ПО SAS и его применение в BIG DATA (Лекции 2015), страница 3 (ППП СОиАД) (SAS) Пакеты прикладных программ для статистической обработки и анализа данных (63197): Лекции - 10 семестр (2 семестр магистратуры)Лекция 0. Аналитическое ПО SAS и его применение в BIG DATA (Лекции 2015) - PDF, страница 3 (63197) - СтудИзба2020-08-25СтудИзба

Описание файла

Файл "Лекция 0. Аналитическое ПО SAS и его применение в BIG DATA" внутри архива находится в папке "Лекции 2015". PDF-файл из архива "Лекции 2015", который расположен в категории "". Всё это находится в предмете "(ппп соиад) (sas) пакеты прикладных программ для статистической обработки и анализа данных" из 10 семестр (2 семестр магистратуры), которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .

Просмотр PDF-файла онлайн

Текст 3 страницы из PDF

A l l r i g h t s r es er v e d .НОВЫЕИСТОЧНИКИДАННЫХ:ЗАГРУЗКА,ХРАНЕНИЕ,ОБРАБОТКААНАЛИТИЧЕСКОЕМОДЕЛИРОВАНИЕ/ПРОТОТИПЫИНТЕРАКТИВНОЕИССЛЕДОВАНИЕДАННЫХ/ ПРОВЕРКАКЕЙСОВSAS & HADOOPSAS & Hadoop точки пересечения: SAS использует Hadoop как источник данных, забирая информацию FROM Hadoop, когда это необходимо; SAS работает WITH Hadoop, поднимая данные воперативную память для разработки и примененияаналитических моделей; SAS выполняется непосредственно IN Hadoop, используя возможности Hadoop по распределеннымвычислениям.C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c .

A l l r i g h t s r es er v e d .SAS + FROM HADOOPSAS извлекает данные из Hadoop на SAS сервердля обработки и записи результатов обратноМост к традиционной SAS средеHadoop, как “очередной источник данных”Ограничения по производительности связанные соднопотоковостью чтения данныхИдеально, когда не все данные находятся в Hadoop,или определенные процессы не могут быть выполненыв HadoopDATA MOVEMENTC op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c .

A l l r i g h t s r es er v e d .SAS + FROM HadoopSAS ServersSAS/ACCESS®SAS ApplicationsHiveCloudera ImpalaHadoopC op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .SAS/ACCESSto HadoopSAS/ACCESSto ClouderaImpalaSAS SPDEformatsSAS + IN HADOOPSAS обрабатывает данные непосредственно вкластере Hadoop.INSAS Embedded Process позволяют выполнять SAS в HadoopВычисления SAS управляются технологиями HadoopПоддержка манипуляций с данными, обеспечения качества иприменения моделейИдеально, когда все данные находятся в HadoopSAS LOGICC op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c .

A l l r i g h t s r es er v e d .ВОЗМОЖНОСТИ - SAS DATA LOADER ДЛЯ HADOOP1ИЗВЛЕЧЕНИЕ ИИССЛЕДОВАНИЕДАННЫХ2ТРАНСФОРМАЦИЯДАННЫХ3ОЧИСТКАДАННЫХ4ИНТЕГРАЦИЯДАННЫХ5ДОСТАВКАДАННЫХ• Копирование данныхв Hadoop• Запросы к данным• Проверка• Объединение• Выбор колонок• Парсинг• Исследование ипрофилированиеданных• Применениефильтров• Стандартизация• Построение кодовнечёткого поиска• Сортировка идедубликация• Идентификационныйанализ• Меппинг колонок• Сортировка• Агрегация• Расчет колонок• Запуск программ SAS• Загрузка данных вSAS LASRОбъединяйте данные,в том числе те,которые не имеютоднозначных ключей,дедублицируйте иагрегируйтеСоздавайте новыетаблицы и вью,доставляйте новыйконтент в любыесистемы-источники,включая SAS LASR inmemory analytic server• Запросы к данным• Транспонирование• Создание таблиц вHadoop• Создание вью вHadoop• Выгрузка данных изHadoop в любую БД• Агрегация• ТрансформацияДоступ к данным,загрузка их в Hadoop,оценка структурыданных и контентаC op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c .

A l l r i g h t s r es er v e d .Выбор интересующихданных, манипуляциис ними и построениенеобходимой дляиспользованияструктурыПриведите данные втребуемый форматSAS® EVENT STREAM PROCESSINGSOURCESXMLCloudMQC op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .SAS® Event Stream Processing EngineОбесспечение обработкивысокоскоростных потоковсобытий в реальном времени,тригеры, преобразования,реакцииУправление потокамисобытий для обнаружения,фильтрации, агрешации иоценки корреляциисобытий, удаление шумаПрименение аналитики вреальном времени длянепрерывной оценкиважности и релевантностипоступающих событийCONSUMERSSAS EVENT STREAM ПРИМЕРЫ ИСПОЛЬЗОВАНИЯPROCCESSINGЭЛЕКТРОННАЯ КОММЕРЦИЯ• Маркетинг и реклама в реальномвремени• Анализ кликов и профиляпользователяФОНДОВЫЕ БИРЖИ• Дополнение SAS HP Risk• Сокращение времени от сделки доотчета• Непрерывный расчет на потоковыхданныхПРОМЫШЛЕННОСТЬ• Мониторинг производства• Диагностировние неисправностейC op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c .

A l l r i g h t s r es er v e d .АНТИФРОД И ИБ• Анализ транзакций в реальномвремени• Анализ поведения• Алерты и триггерыТЕЛЕКОММУНИКАЦИЯ• Маркетинг в реальном времени• Выявление мошенничества• Исследование ИТ-системТЭК• Предсказание потребления• Выявление сбоев в реальномвремени• Контроль качества услугSAS® Data DirectorРАЗРАБОТКАSAS® EVENT STREAM PROCESSING STUDIOМОДЕЛИ ESPГибкое, «drag&drop»визуальное моделирование,используя веб-интерфейсна HTML5Конструктор языкавыраженийESP STUDIOSCREENSHOTAND KEYELEMENTSИмпорт/экспорт XMLмоделейИнтегрированная среда интерактивной отладкиC op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c .

A l l r i g h t s r es er v e d .User NameУНИФИКАЦИЯ ИТИНФРАСТРУКТУРЫПолучениеинформации изновых данных:360 Customer ViewМОНИТОРИНГЭФФЕКТИВНОСТИПОСТАНОВКАПРОТОТИПОВМОДЕЛЕЙ НАРЕГЛАМЕНТ/ТЕСТИРОВАНИЕИЗВЛЕЧЕНИЕНОВЫХХАРАКТЕРИСТИК:ИЗ ТЕКСТА,ВЗАИМОСВЯЗЕЙУСКОРЕНИЕРАБОТЫ BDЛАБОРАТОРИИИ ТЕКУЩИХСИСТЕМSAS Text AnalyticsSAS Customer Link AnalyticsC op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .НОВЫЕИСТОЧНИКИДАННЫХ:ЗАГРУЗКА,ХРАНЕНИЕ,ОБРАБОТКААНАЛИТИЧЕСКОЕМОДЕЛИРОВАНИЕ/ПРОТОТИПЫИНТЕРАКТИВНОЕИССЛЕДОВАНИЕДАННЫХ/ ПРОВЕРКАКЕЙСОВРАБОТА С ИНТЕЛЛЕКТУАЛЬНЫЙ МОНИТОРИНГ ПОТОКАТЕКСТОМ ДОКУМЕНТОВ/СООБЩЕНИЙОпыт в предметной областиПрогнозированиеТекстовыеиструктурированныеданныеКатегоризацияКонцептыИсследовательскийText MiningВизуализацияОбогащенныйнабор данныхАнализТональностиAd HocанализБизнесприложенияC op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c .

A l l r i g h t s r es er v e d .SAS TEXT MINER КЛАСТЕРИЗАЦИЯ И ВЫДЕЛЕНИЕ КЛЮЧЕВЫХ ТЕМ ДОКУМЕНТОВ1. Входные данные –текстыЖалобы, логифорумов, блоги,СУБД, эл. почта2. Структурирование текста –Текст разбирается на слова ивыражения, определяются частиречи слов, нормализуются формыслов, группируются сообщения спохожим содержанием3.

Поиск тем – документыразбиваются на группы с похожимсодержанием, которое описываетсянабором ключевых словСегодня в новостях:разрушения отурагана, новый закон,выход ноутбуковнового поколенияЭто письмо лучшеперенаправить вотдел маркетингаC op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .Наиболее частаятема звонка втех.поддержку –вопросы по сайтуИЗВЛЕЧЕНИЕSAS CONTEXTUAL ANALYSISФАКТОВ1. Доступ к источникамтекстовой информации –письменные жалобы, форумы,блоги, СУБД, эл. почта2.

Извлечение фактовопределенных в таксономии3. Результаты– каждый документтеперь ассоциирован со спискомизвлеченных фактовТаксономия фактовФакты• Дата – 28.06.2010• Место – Смоленск• Причина – хамство• Объект – проводникСУБДC op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .Результаты индексированы дляорганизации поиска и/или отправлены всуществующие СУБДПОСТРОЕНЫ ОТЧЕТЫКАТЕГОРИЗАЦИЯ SAS CONTEXTUAL ANALYSIS1.

Доступ к источникамтекстовой информации –письменные жалобы, форумы,блоги, СУБД, эл. почта2. Определение категориидокумента изпредопределеннойтаксономии3. Результаты – каждому документуприсвоена конкретная категорияТаксономия категорийКатегория = Проблемы с проводникамиСУБДC op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c .

A l l r i g h t s r es er v e d .Результаты индексированы дляорганизации поиска и/или отправлены всуществующие СУБДПОСТРОЕНЫ ОТЧЕТЫSAS SENTIMENTАНАЛИЗ МНЕНИЙANALYSISАвтоматическое выделение позитивного или негативного отношения людей: всообщении в целом, к определенному объекту (бренду, продукту, публичному лицу)или характеристикам объектаОбычный холодильник, чего-либо необычного в нем нет,простой среднего класса холодильник, главное что покаработает, но еще такой же я бы не взял.Лично мое мнение, если бы эту модель собирали не чертикак «славянские руки», то модель отличная была бы.Так что мое мнение, лучше взять сборки из Китая илиКореи, и любой марки, главное чтоб Вам нравилосьПродукт: холодильник; Мнение: нейтральноеХарактеристика: модель; Мнение: положительноеХарактеристика: сборка; Мнение: отрицательноеC op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .SAS SENTIMENTАНАЛИЗ МНЕНИЙANALYSIS1.

Доступ к источникамтекстовой информации –письменные жалобы, форумы,блоги, СУБД, эл. почта2. Автоматическоеопределение тональностина основе таксономиимнений3. Результаты – в каждом документеопределен предмет обсуждения и мнения,высказанные о немЭто позитивное сообщениеТаксономия мненийТочно негативноеДа, негативное сообщениеЭто тоже позитивноеПохоже негативное сообщениеИ это позитивное тожеРезультаты индексированы дляорганизации поиска и/илиотправлены в существующиеСУБДПОСТРОЕНЫ ОТЧЕТЫC op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .SAS TEXT MINER ПОСТРОЕНИЕ МОДЕЛЕЙ1.

Входные данные – нетолько структурированныепараметры, но исопутствующий текстНапример, email-сообщения,логи операторов callцентров, документация…2. Структурирование текста – Текстразбирается на слова и выражения,определяются части речи слов,нормализуются формы слов,группируются сообщения с похожимсодержанием3. Предиктивное моделирование сиспользованием текста –Структурированный текст используется вмодели вместе с другими параметрами,значительно повышая точностьпредсказанияCustomerdataРазмер выплаты поэтому случаю составитоколо 1135$…С вероятностью 78% этомошенник…C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .Этот клиент не уйдет вотток с вероятностью90%…АНАЛИЗ ГРАФОВSAS CUSTOMER LINK ANALYTICSПостроение графа наоснове любых типов связейВыявление тесносвязанных сообществАнализ роли узла всообществемошенникC op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c .

A l l r i g h t s r es er v e d .УНИФИКАЦИЯ ИТИНФРАСТРУКТУРЫИнтерактивнаяаналитика:ИсследованиеданныхПроверка кейсовМОНИТОРИНГЭФФЕКТИВНОСТИПОСТАНОВКАПРОТОТИПОВМОДЕЛЕЙ НАРЕГЛАМЕНТ/ТЕСТИРОВАНИЕИЗВЛЕЧЕНИЕНОВЫХХАРАКТЕРИСТИК:ИЗ ТЕКСТА,ВЗАИМОСВЯЗЕЙУСКОРЕНИЕРАБОТЫ BDЛАБОРАТОРИИИ ТЕКУЩИХСИСТЕМSAS Visual AnalyticsSAS Visual StatisticsC op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c .

Свежие статьи
Популярно сейчас
Почему делать на заказ в разы дороже, чем купить готовую учебную работу на СтудИзбе? Наши учебные работы продаются каждый год, тогда как большинство заказов выполняются с нуля. Найдите подходящий учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
5167
Авторов
на СтудИзбе
437
Средний доход
с одного платного файла
Обучение Подробнее