Crawling AJAX ... перевод 5000 знаков (1176905)

Файл №1176905 Crawling AJAX ... перевод 5000 знаков (тематика web-краулеров)Crawling AJAX ... перевод 5000 знаков (1176905)2020-08-172020-08-17СтудИзба

тематика web-краулеров

Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Регистрация/авторизация

Текст из файла

Перевод статьи Mesbah A., Bozdag E., Van Deursen A. Crawling Ajax by inferring user interface state changes //Web Engineering, 2008. ICWE'08. Eighth International Conference on. – IEEE, 2008. – С. 122-134.

Переведено предисловие и первая глава. Русских знаков без пробелов = 5406.

Краулинг AJAX (асинхронный javascript) на основе изменения пользовательского интерфейса

Предисловие.

AJAX является многообещающим подходом на пути к развитию интерактивности и отзывчивости веб-приложений.

В то же время, AJAX методы нарушают метафору «веб-страница», на основе которой все современные веб-краулеры работают. Данная статья описывает новую технику краулинга веб-приложений посредством динамического анализа и реконструкции изменений состояний пользовательского интерфейса. Наш метод динамически создаёт граф состояний и переходов моделируя различные пути обхода и состояния при этом в AJAX приложении. Созданная модель может быть использована для генерации статических слинкованных страниц. Эти страницы могут использоваться для предоставления основным поисковым движкам. Более того, мы считаем, что техники краулинга, являющиеся частью нашего решения имеют и другие приложения, например, в рамках основных поисковых движков, в рамках улучшения доступности, или для автоматического перебора всех пользовательских элементов интерфейс и поддержки тестирования на основе состояний AJAX приложения. Мы представляем вам наш продукт crawljax с открытым исходным кодом, который реализует концепции, обсуждаемые в этой статье. Дополнительно, мы дадим отчёт о применении нашего подхода к набору представительных AJAX веб-приложений и обсуждаем полученные результаты.

Введение

Известный нам веб сейчас переживает сильные изменения. Недавно появившаяся технология в следствие распространения Web 2.0 – это AJAX (асинхронный javascript и XML) [13], в котором хитроумная комбинация javascript и манипуляций объектной модели документа (DOM) вместе с асинхронным взаимодействием с сервером, используется для достижения высокого уровня пользовательской интерактивности. Одними из самых заметных примеров являются приложения Google Maps, Google документы и последняя версия Yahoo! Mail.

C новыми изменениями в разработке веб-приложений появляются целый набор новых задач, в основном связанных с тем, что AJAX ломает метафору «веб-страница», на которой основываются многие веб-технологии. Среди этих задач есть следующие:

Возможность поиска, чтобы добиться возможности индексирования AJAX сайтов основными поисковыми движками, вместо того чтобы быть просто проигнорированными (что сейчас часто и происходит), из-за использования скриптинга на стороне клиента и динамического изменения состояний DOM.
Тестебельность, чтобы систематично проверять динамический пользовательский интерфейс (UI) и состояния AJAX, чтобы находить ошибки и аномалии.
Доступность, чтобы проверить, что все состояния AJAX страницы удовлетворяет необходимым требованиям доступности.

Единственный способ удовлетворить эти требования – это использование краулера, который может автоматически обходить различные состояния крайне динамичного AJAX сайта, создавать модель возможных путей выполнения и потенциальных состояний, и генерировать традиционную связную статическую версию сайта на основе статических страниц. Сгенерированные статические страницы могут использоваться, например, чтобы показать AJAX сайт основным поисковым движкам, или чтобы проверить доступность различных динамических состояний [2]. Подобный краулер так же может быть использован для способствования тестированию состояний асинхронных приложений [16], и автоматического тестирования всех элементов пользовательского интерфейса асинхронного сайта, чтобы найти, например, сломанные ссылки, скрытые ссылки и другие ошибки.

Сегодня не существует краулера, который способ обрабатывать сложный код на клиентской стороне асинхронного приложения. Основная причина в том, что краулить AJAX фундоментально тяжелее, по сравнению с классическими многостраничными веб-приложениями. В традиционных веб-приложениях, состояния отделены и соответствуют страницам с уникальным url. В асинхронных приложениях, тем не менее, состояние пользовательского интерфейса определяется динамически, также как и изменения в DOM, которые видны только лишь после выполнения соответствующего javascript кода.

В данной статье мы описываем подход для анализа и реконструкции состояний пользовательского интерфейса автоматически. Наш подход основан на краулере, который способен выполнять код на клиентской стороне, и способен идентифицировать кликабельные элементы (которые могут изменяться вместе с каждым кликом), которые могут изменять динамическое состояние DOM в рамках браузера. Из этих изменений мы восстанавливаем граф потока-состояний, который фиксирует состояния пользовательского интерфейса и возможные переходы между ними. Этот граф способен впоследствии быть использован для генерации много-страничной статической версии оригинального асинхронного приложения.

Идеи лежащие в основе реализованы в инструменте под названием «Crawljax».

Мы провели эксперимент по запуску нашего фреймвокра-краулера на нескольких репрезентативных асинхронных сайтах, чтобы проанализировать общую производительность нашего подхода, вычислить эффективность выбора необходимых кликабельных элементов, оценить качество и корректность детектированных состояний и сгенерированных статических страниц, и проверить способность нашего инструмента на реальных сайтах используемых на практике и проверить масштабируемость краулинга сайтов с тысячами динамических состояний и кликабельных элементов.

Статья структурирована следующим образом. Мы начнём с того, что в Секции 2 расскажем о трудностях краулинга и индексирования AJAX. В секциях 3 и 4, мы представим подробный рассказ наших новых техник краулинга, процесса генерирования и самого инструмента Crawljax. В секции 5 результаты применения наших методов к нескольких AJAX приложениях, которые будут указаны, после чего в секции 6 будет описаны открытия и найденные возможности. Секция 7 представляет различные приложения наших техник краулинга. В заключении мы рассказываем о связанных с этой тематикой работах, кратким изложением ключевых достижений и предположения о дальнейшей работе.

Характеристики

Тип файла

Документ

Размер

19,71 Kb

Материал

тематика web-краулеров

Тип материала

Реферат

Предмет

Английский язык

Высшее учебное заведение

МГУ им. Ломоносова

Тип файла документ

Документы такого типа открываются такими программами, как Microsoft Office Word на компьютерах Windows, Apple Pages на компьютерах Mac, Open Office - бесплатная альтернатива на различных платформах, в том числе Linux. Наиболее простым и современным решением будут Google документы, так как открываются онлайн без скачивания прямо в браузере на любой платформе. Существуют российские качественные аналоги, например от Яндекса.

Будьте внимательны на мобильных устройствах, так как там используются упрощённый функционал даже в официальном приложении от Microsoft, поэтому для просмотра скачивайте PDF-версию. А если нужно редактировать файл, то используйте оригинальный файл.

Файлы такого типа обычно разбиты на страницы, а текст может быть форматированным (жирный, курсив, выбор шрифта, таблицы и т.п.), а также в него можно добавлять изображения. Формат идеально подходит для рефератов, докладов и РПЗ курсовых проектов, которые необходимо распечатать. Кстати перед печатью также сохраняйте файл в PDF, так как принтер может начудить со шрифтами.

Список файлов реферата

tematika-web-kraulerov.rar

тематика web-краулеров

An Adaptive Crawler ... перевод 4000 знаков.docx

An Adaptive Crawler for Locating Hidden-Web Entry Points (2007).pdf

Crawling AJAX ... перевод 5000 знаков.docx

Crawling AJAX by Inferring User Interface State Changes (2008).pdf

Задание.txt

Поделитесь ссылкой:

Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.

Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.

Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.

Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.

Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.

Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.

Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.

Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.

Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.

Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.

Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.

Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.