Труевцева (1194872), страница 2
Текст из файла (страница 2)
Так, поправки в ФЗ-149 указывают на необходимость включения сайтов с предложениями дистанционной розничной продажи наркотических и психотропных препаратов в Единый реестр запрещенных доменных имен и адресов.
В ФЗ-61 поправки коснутся п.24 ст.5. Именно он в прошлом году заставил поволноваться аптечную розницу на тему закрытия всех интернет-аптек. Формулировку "Досудебное закрытие" разработчик предлагает заменить на "ограничение" в порядке, установленном законодательством о защите информации.
1.2 Виртуальная витрина
Виртуальная витрина представляет собой сайт, который предназначен преимущественно для рекламы и продажи продукции в сети Интернет. При помощи виртуальной витрины можно продвигать интернет-магазин, либо любой offline-магазин.
Главная задача виртуальной витрины – обеспечить покупателя подробной информацией о предлагаемом товаре или услуге. На таком сайте продавец обычно представляет подробное описание продаваемой продукции.
Описание товаров на сайте виртуальной витрины обычно подробное, и сопровождается фотографиями, видеозаписями, обзорами на товар. Какой должна быть виртуальная витрина? Если с помощью виртуальной витрины вы продвигаете интернет-магазин, к сайту витрины можно прикрепить систему автоматического оформления заказа на товар.
Тогда виртуальная витрина станет небольшим интернет-магазином. Виртуальная витрина идеально подойдёт для малого и среднего бизнеса. Такой сайт – отличный способ представить свои товары в сети Интернет.
Для продвижения сайта виртуальной витрины обычно используют традиционные методы рекламы в Интернете. Привлекать посетителей на витрину удобно с помощью использования контекстной рекламы и продвижения в социальных сетях.
Если на сайте витрины публиковать уникальные обзоры на товар, дополнительно можно использовать продвижение с помощью контента. У виртуальной витрины множество преимуществ.
Создание виртуальной витрины гораздо дешевле, чем создание полноценного интернет-магазина. А в будущем при необходимости можно превратить виртуальную витрину в интернет-магазин. Виртуальная витрина идеально подойдёт для тех компаний, ассортимент которых ограничен. Это прекрасный способ презентовать свой товар или услуги.
Разберемся, какую структуру должна иметь виртуальная витрина. Виртуальная витрина должна быть яркой и запоминающейся. Ведь витрины обычных магазинов всем своим видом привлекают покупателей. Такой же яркой и красивой должна быть виртуальная витрина. Виртуальную витрину можно сделать на основе flash-технологии.
Выбрав хорошего дизайнера, можно создать отличную виртуальную витрину, которая будет привлекать клиентов. Для виртуальной витрины нужно организовать каталог товар, с описанием и фотогалереей. Лучше всего загружать фотографии высокого качества.
Обязательно следует обеспечить высокую скорость загрузки страницы.. На сайте виртуальной витрины можно публиковать обзоры на продаваемый товар. Качественные обзоры вдобавок станут инструментом продвижения сайта витрины с помощью статей.
На сайте виртуальной витрины так же должно быть описание компании: реквизиты, ключевые преимущества покупки товара, опыт работы в данной сфере бизнеса. Виртуальная витрина – это представительство в сети Интернет.
Поэтому такой сайт должен быть максимально простым, но в тоже время ярким и запоминающимся для посетителей.
1.3 Разведочный анализ
В связи с тем, что данные, которые доступны для анализа, очень велики по объему и разнообразны по форме представления (база данных, личные данные аптек, международные БД), перед началом исследования необходимо выполнить разведочный анализ.
Предварительный анализ данных с целью выявления наиболее общих закономерностей и тенденций, характера и свойств анализируемых данных, законов распределения анализируемых величин. Применяется для нахождения связей между переменными в ситуациях, когда отсутствуют (или недостаточны) априорные представления о природе этих связей. Как правило, при разведочном анализе учитывается и сравнивается большое число переменных, а для поиска закономерностей используются самые разные методы.
Термин «разведочный анализ» был впервые введен математиком из Принстонского университета Дж. Тьюки. Он также сформулировал основные цели данного анализа:
-
Максимальное «проникновение» в данные.
-
Выявление основных структур.
-
Выбор наиболее важных переменных.
-
Обнаружение отклонений и аномалий.
-
Проверка основных гипотез (предположений).
-
Разработка начальных моделей.
Результаты разведочного анализа не используются для выработки управленческих решений. Их назначение - помощь в разработке наилучшей стратегии углубленного анализа, выдвижение гипотез, уточнение особенностей применения тех или иных математических методов и моделей. Без разведочного анализа углубленный анализ данных будет производиться практически «вслепую».
К основным методам разведочного анализа относится процедура анализа распределений переменных, просмотр корреляционных матриц с целью поиска коэффициентов, превосходящих по величине определенные пороговые значения, факторный анализ, дискриминантный анализ, многомерное шкалирование, визуальный анализ гистограмм и т.д.
Подчеркнем, что предварительное исследование данных может служить лишь первым этапом в процессе их анализа, и пока результаты не подтверждены на других выборках или на независимом множестве данных, их следует воспринимать самое большее как гипотезу. Если результаты разведочного анализа говорят в пользу некоторой модели, то ее правильность можно затем проверить, применив ее к новым данным.[4]
1.4 Вычислительные методы разведочного анализа данных
Вычислительные методы РАД включают основные статистические методы, а также более сложные, специально разработанные методы многомерного анализа, предназначенные для отыскания закономерностей.
К основным методам разведочного статистического анализа относится процедура анализа распределений переменных (например, чтобы выявить переменные с несимметричным или негауссовым распределением, в том числе и бимодальные), просмотр корреляционных матриц с целью поиска коэффициентов, превосходящих по величине определенные пороговые значения, или анализ многовходовых таблиц частот (например, "послойный" последовательный просмотр комбинаций уровней управляющих переменных).
Методы многомерного разведочного анализа специально разработаны для поиска закономерностей в многомерных данных (или последовательностях одномерных данных). К ним относятся: кластерный анализ, факторный анализ, анализ дискриминантных функций, многомерное шкалирование, логлинейный анализ, канонические корреляции, пошаговая линейная и нелинейная (например, логит) регрессия, анализ соответствий, анализ временных рядов и деревья классификации. Рассмотрим некоторые из них.
1.4.1 Факторный анализ
Факторный анализ — многомерный метод, применяемый для изучения взаимосвязей между значениями переменных. Предполагается, что известные переменные зависят от меньшего количества неизвестных переменных и случайной ошибки.
Факторный анализ позволяет решить две важные проблемы исследователя: описать объект измерения всесторонне и в то же время компактно. С помощью факторного анализа возможно выявление скрытых переменных факторов, отвечающих за наличие линейных статистических корреляций между наблюдаемыми переменными.
Две основных цели факторного анализа:
-
определение взаимосвязей между переменными, (классификация переменных), то есть «объективная R-классификация»
-
сокращение числа переменных необходимых для описания данных.
Факторный анализ может быть:
-
разведочным — он осуществляется при исследовании скрытой факторной структуры без предположения о числе факторов и их нагрузках;
-
конфирматорным (подтверждающим), предназначенным для проверки гипотез о числе факторов и их нагрузках.
Практическое выполнение факторного анализа начинается с проверки его условий. В обязательные условия факторного анализа входят:
-
все признаки должны быть количественными;
-
число наблюдений должно быть не менее чем в два раза больше числа переменных;
-
выборка должна быть однородна;
-
исходные переменные должны быть распределены симметрично;
-
факторный анализ осуществляется по коррелирующим переменным.
Два основных понятия факторного анализа: фактор — скрытая переменная и нагрузка — корреляция между исходной переменной и фактором
Основные методы факторного анализа:
-
Метод главных компонент
-
Корреляционный анализ
-
Метод максимального правдоподобия
Метод главных компонент(МГК) — один из основных способов уменьшить размерность данных, потеряв наименьшее количество информации. Применяется во многих областях, в том числе, в эконометрике, биоинформатике, обработке изображений, для сжатия данных, в общественных науках.
Суть данного метода состоит в замене коррелированных компонентов некоррелированными факторами. Другой важной характеристикой метода является возможность ограничиться наиболее информативными главными компонентами и исключить остальные из анализа, что упрощает интерпретацию результатов. Достоинство МГК также в том, что он — единственный математически обоснованный метод факторного анализа.
Вычисление главных компонент может быть сведено к вычислению сингулярного разложения матрицы данных или к вычислению собственных векторов и собственных значений ковариационной матрицы исходных данных.
Корреляционный анализ — метод обработки статистических данных, с помощью которого измеряется теснота связи между двумя или более переменными. Корреляционный анализ тесно связан с регрессионным анализом (также часто встречается термин «корреляционно-регрессионный анализ», который является более общим статистическим понятием), с его помощью определяют необходимость включения тех или иных факторов в уравнение множественной регрессии, а также оценивают полученное уравнение регрессии на соответствие выявленным связям (используя коэффициент детерминации).
Метод максимального правдоподобия или метод наибольшего правдоподобия в математической статистике — это метод оценивания неизвестного параметра путём максимизации функции правдоподобия. Основан на предположении о том, что вся информация о статистической выборке содержится в функции правдоподобия.
1.4.2 Кластерный анализ
Кластерный анализ — многомерная статистическая процедура, выполняющая сбор данных, содержащих информацию о выборке объектов, и затем упорядочивающая объекты в сравнительно однородные группы. Задача кластеризации относится к статистической обработке, а также к широкому классу задач обучения без учителя.
Большинство исследователей склоняются к тому, что впервые термин «кластерный анализ» был предложен математиком Р. Трионом. Впоследствии возник ряд терминов, которые в настоящее время принято считать синонимами термина «кластерный анализ»: автоматическая классификация, ботриология.
Спектр применений кластерного анализа очень широк: его используют в археологии, медицине, психологии, химии, биологии, государственном управлении, филологии, антропологии, маркетинге, социологии, геологии и других дисциплинах. Однако универсальность применения привела к появлению большого количества несовместимых терминов, методов и подходов, затрудняющих однозначное использование и непротиворечивую интерпретацию кластерного анализа.
Кластерный анализ выполняет следующие основные задачи:
-
Разработка типологии или классификации.
-
Исследование полезных концептуальных схем группирования объектов.
-
Порождение гипотез на основе исследования данных.
-
Проверка гипотез или исследования для определения, действительно ли типы (группы), выделенные тем или иным способом, присутствуют в имеющихся данных.
Независимо от предмета изучения применение кластерного анализа предполагает следующие этапы:
-
Отбор выборки для кластеризации. Подразумевается, что имеет смысл кластеризовать только количественные данные.
-
Определение множества переменных, по которым будут оцениваться объекты в выборке, то есть признакового пространства.
-
Вычисление значений той или иной меры сходства (или различия) между объектами.
-
Применение метода кластерного анализа для создания групп сходных объектов.
-
Проверка достоверности результатов кластерного решения.
Можно встретить описание двух фундаментальных требований предъявляемых к данным — однородность и полнота. Однородность требует, чтобы все кластеризуемые сущности были одной природы, описывались сходным набором характеристик. Если кластерному анализу предшествует факторный анализ, то выборка не нуждается в «ремонте» — изложенные требования выполняются автоматически самой процедурой факторного моделирования (есть ещё одно достоинство — z-стандартизация без негативных последствий для выборки; если её проводить непосредственно для кластерного анализа, она может повлечь за собой уменьшение чёткости разделения групп). В противном случае выборку нужно корректировать.
Типы входных данных:
-
Признаковое описание объектов. Каждый объект описывается набором своих характеристик, называемых признаками. Признаки могут быть числовыми или нечисловыми.
-
Матрица расстояний между объектами. Каждый объект описывается расстояниями до всех остальных объектов метрического пространства.
-
Матрица сходства между объектами. Учитывается степень сходства объекта с другими объектами выборки в метрическом пространстве. Сходство здесь дополняет расстояние (различие) между объектами до 1.
В современной науке применяется несколько алгоритмов обработки входных данных. Анализ путём сравнения объектов, исходя из признаков, (наиболее распространённый в биологических науках) называется Q-типом анализа, а в случае сравнения признаков, на основе объектов — R-типом анализа. Существуют попытки использования гибридных типов анализа (например, RQ-анализ), но данная методология ещё должным образом не разработана.















