Корниенко (1214588)
Текст из файла
Содержание
ВВЕДЕНИЕ 7
1 Методы поиска и анализа информации 11
1.1 Поиск информации в базах данных 11
1.2 Информационные технологии поиска информации 13
1.2.1 Информационно-поисковые системы 16
1.2.2 Автоматизированные Информационно-поисковые системы 17
1.2.3 Организация поиска 22
1.2.4 Технологии поиска информации 23
1.2.5 Интернет-поисковые системы 27
2 Разработка алгоритма исследования 34
2.1 Постановка задачи 34
2.2 Математические методы 34
3 Реализация алгоритма исследования 41
3.1 Применение алгоритма исследования для лекарственных препаратов группы жизненно важные 50
3.2 Результаты исследования 54
ЗАКЛЮЧЕНИЕ 56
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 58
ПРИЛОЖЕНИЕ А 59
ПРИЛОЖЕНИЕ Б 62
ПРИЛОЖЕНИЕ В 66
ПРИЛОЖЕНИЕ Г 70
ПРИЛОЖЕНИЕ Д 73
ПРИЛОЖЕНИЕ Е 75
ВВЕДЕНИЕ
Сегодня успешность деятельности предприятий в значительной степени определяется эффективно организованным информационным обеспечением деятельности. Появилась потребность в информационных системах, которые позволяют автоматизировать не только повседневные операции учета и отчетности, но и задачи анализа. Для этого разработаны информационно-аналитические системы, которые позволяют оперативно предоставлять необходимые сведения, требования к которым в современных системах управления меняются. Поэтому актуальность разработки и внедрения информационно-аналитических систем не вызывает сомнений.
В современный период появилась острая необходимость в различных информационных системах для управления предприятиями, в основе которых лежит комплексная система автоматизации, представляющая собой систему процедур, методов и средств, охватывающих основные задачи и функции управления деятельностью предприятия, обеспечивающие принятие управленческих решений на основе информации, получаемой с помощью современных информационных технологий.
Во многих регионах мира сo сложившейся развитой рыночной экономикой достижение заметного повышения прибыли связано сo сложной аналитической работой с использованием новейших достижений науки: математики всех направлений, информационных технологий и т.д., которые являются инструментом экономических наук, менеджмента, маркетинга и т.д. Огромное влияние на эффективность предприятий в условиях возросшей конкуренции экономики оказывает субъективный фактор, под которым понимают влияние на ход бизнес-процессов работников предприятия и в особенности лиц, принимающих решения (ЛПР).
Для выработки и принятия соответствующих складывающейся обстановке решений необходимы информация и знания, которые должны удовлетворять требованиям полноты, достоверности, своевременности, полезности. Одной из первостепенных задач при подготовке и принятии решений является, как известно, анализ имеющейся в распоряжении ЛПР информации, который является фундаментом обоснования решения.
Современные условия ведения бизнеса предъявляют повышенные требования к системам управления: в условиях динамичной внешней среды и ужесточения конкуренции все более значительную роль начинают играть методы и модели экономического анализа, позволяющие оперативно реагировать на возникающие проблемы и имеющиеся возможности. Задачи бизнес-анализа очень непросты, но здесь на помощь руководителю приходят современные управленческие концепции и технологии.
Теория и практика управления породили целый ряд разнообразных подходов, методов и моделей, нацеленных на повышение эффективности. Такие методы и модели, в свою очередь, обусловили появление и развитие разнообразных аналитических информационных систем. Эти системы занимают определенное положение в информационной инфраструктуре предприятия и играют не маловажную роль в процессах управления.
Такие обстоятельства вынуждают использовать имеющиеся на сегодняшний день развитые программно-технические средства. Широкое и эффективное применение этих средств стало одним из факторов успеха предприятия в условиях конкурентной борьбы. Получили широкое распространение автоматизированные информационные системы – так в последние годы чаще называют информационные системы, подразумевая, что без автоматизации их просто невозможно представить.
Проблема анализа исходной информации для принятия решений оказалась настолько серьезной, что появилось отдельное направление или вид информационных систем — информационно-аналитические системы, под которыми понимают комплекс аппаратных, программных средств, информационных ресурсов, методик, которые используются для обеспечения автоматизации аналитических работ в целях обоснования принятия управленческих решений и других возможных применений. Входящие в состав информационно-аналитических систем хранилища данных обеспечивают преобразование больших объемов сильно детализированных данных в управляемые и выверяемые обзорные отчеты, которые могут быть использованы работниками управления для принятия решений. Информационно-аналитические системы являются сегодня инструментом для всех руководителей, столь же настоятельно необходимым, как и транзакционные системы, которые эффективно регистрируют операционную активность организации.
Следует отметить, что особое внимание уделяется развитию современных статистических методов обработки данных, а также проектированию различных программных средств, позволяющих автоматизировать этот процесс.
Объект исследования: метаданные сети Интернет, специализированные базы данных.
Цель: разработка алгоритма для автоматизированного проведения выборок из специализированных баз данных и интернет-ресурсов для сравнения математической модели принятия решения в сфере фармации.
Задачей исследования является разработка методов выборки информации из баз данных; разработка алгоритма сравнительного анализа ценовой политики аптечного предприятия; экономический анализ: расчет пространственного индекса; формулировка задач автоматизации исследования.
Метод математические методы анализа данных и принятия решения; методы Data Mining.
Для решения поставленной задачи, необходимо обработать большие массивы данных, хранящиеся в базах данных открытых для общего доступа.
Работа разбита на главы и разделы, причем нумерация разделов сквозная. Нумерация формул, изображений и таблиц двойная: первое число номер раздела, второе номер изображения или таблицы.
В первой главе описаны методы поиска, сбора и анализа информации в различных базах данных. Вторая глава несёт в себе математические методы анализа принятия решения а так же алгоритм проведения исследования. Во главе номер три представлена последовательная реализация алгоритма сформированного мной во второй главе.
В Приложении А расположена таблица с данными о ценах на лекарственные препараты (ЛП) в аптеках г.Москва, в Приложении Б находится таблица с информацией o ценах на ЛП в аптеках г.Новосибирск, в Приложении В добавлена таблица с ценами на ЛП в аптеках г.Хабаровск. Далее представлены таблицы с отклонениями цен в Приложениях Г, Д, Е для городов Новосибирск, Москва и Хабаровск, соответственно.
-
Методы поиска и анализа информации
1.1 Поиск информации в базах данных
Поиск информации в базах данных – это процесс отбора из них множества описаний объектов, удовлетворяющих сформулированным в запросе условиям. Процедура поиска является одной из главных процедур в системах автоматической обработки информации. При решении любой задачи требуется выбирать исходные данные из некоторых заранее подготовленных массивов информации и записывать результаты решения в эти или другие массивы. Наиболее рациональным подходом к организации массивов данных при решении вычислительных задач является концепция банков и баз данных. Проблемы поиска информации в формализованных базах данных заслуживают самого серьезного внимания. При этом в качестве результатов поиска могут выдаваться не все признаки объектов, а только часть их. Объект может выбираться из массива по значению одного ключевого его признака или по сочетанию значений нескольких идентифицирующих признаков. Он может также выбираться по сочетанию любых других признаков, если это сочетание однозначно выделяет его из множества всех объектов массива.
Важной методологической проблемой прикладной компьютерной лингвистики является правильная оценка необходимого соотношения между декларативной и процедурной частями систем автоматической обработки текстовой информации. Чему отдать предпочтение: мощным вычислительным процедурам, опирающимся на относительно небольшие словарные системы с богатой грамматической и семантической информацией, или мощной декларативной компоненте при относительно простых процедурных средствах. И высказали мнение, что второй путь предпочтительнее. Можно представить себе крайний случай такого предпочтения, когда лингвистическая задача решается путем создания большого словаря и поиска в этом словаре необходимой информации. Однако более реальна ситуация, когда задача решается путем последовательного поиска в небольшом количестве достаточно представительных словарей и выполнения несложных процедур преобразования результатов поиска.
Различаются первичные и производные признаки объектов. Первичные признаки назначаются при первоначальном описании объектов, а производные являются функциями первичных. Поиск может вестись как по первичным, так и по производным признакам. Чаще всего в процессе поиска информации выбирается не один объект, а множество объектов. Оно может быть задано различными способами:
-
перечнем значений ключевых признаков или сочетаний ключевых признаков;
-
значением или интервалом (перечнем) значений одного неключевого признака;
-
булевой функцией значений или интервалов (перечней) значений любых признаков объекта (как ключевых, так и неключевых);
-
отношением между признаками, выраженным с помощью арифметических и логических операции, а также отношений =, >, < и их отрицаний. Условия выборки признаков у найденных объектов задаются в виде перечней наименований этих признаков.
Важной проблемой, возникающей при реализации процедур поиска информации, является проблема отождествления признаков объектов и установления отношений сходств или различий между ними. Общее решение этой проблемы связано с возможностью распознавания смыслового тождества и парадигматических отношений различных форм наименований понятий на основе их морфологического, синтаксического и семантического анализа. Но на практике широко применяются и другие решения, основанные на унификации форм представления наименований понятий в базах данных и использования систем меню, в которых пользователю предлагается делать выбор наименований понятий только из числа рекомендованных[1].
Поиск информации может выполняться за один или несколько шагов. В первом случае он ведется по одному запросу, во втором – по серии нескольких запросов. При многошаговом поиске возможны три основных способа организации процесса выполнения запросов:
-
композиция запросов – запросы выполняются в строго опреде-ленной последовательности, а результаты поиска по предыдущему запросу используются в качестве исходных данных для формирования следующего за ним запроса. При этом первый запрос в серии запросов определяется полностью, а остальные – не полностью и доопределяются в процессе поиска.
-
объединение запросов – когда результаты поиска по нескольким запросам объединяются в одну общую выдачу.
-
разветвление запросов – когда после выполнения очередного запроса есть возможность перехода к одному из нескольких запросов в зависимости от выполнения тех или иных условий. Перечисленные способы организации процесса выполнения запросов могут применяться в различных сочетаниях, что позволяет строить различные процедуры многошагового поиска.
1.2 Информационные технологии поиска информации
Поиск информации или информационный поиск представляет один из основных информационных процессов. Цели, возможности и характер поиска всегда зависели от наличия, информации, её важности и доступности, а также средств организации поиска.
Конец XX - начало XXI века, характеризуется огромными массивами постоянно растущей разнообразной информации, доступной и представляющей интерес для самых широких слоев социума. Более того, Интернет-технологии и программно-технические средства, также доступные большинству людей, позволяют осуществлять данный процесс в любое время, практически в любом месте по любым запросам.
Поиск - процесс, в ходе которого в той или иной последовательности производится соотнесение отыскиваемого с каждым объектом, хранящимся в массиве. Цель любого поиска заключается в потребности, необходимости или желании находить различные виды информации, способствующие получению лицом, осуществляющим поиск, нужных ему сведений, знаний и т.д. для повышения собственного профессионального, культурного и любого иного уровня; создания новой информации и формирования новых знаний; принятия управленческих решений и т.п.
По оценке специалистов в Интернете работает 30 и более миллионов пользователей. Из них десятки тысяч - в режиме онлайн и количество таких пользователей постоянно растет. Это затрудняет организацию оперативного поиска и нахождения нужной такому количеству пользователей информации. Возникают проблемы, обусловленные разнообразными возможностями (видами) поиска информации, различными способами их реализации в информационно-поисковых системах (ИПС), разным уровнем знаний пользователей о возможностях таких систем, особенно в области формирования запросов и обработки данных, полученных в результате выполнения этих запросов и т.д.
Характеристики
Тип файла документ
Документы такого типа открываются такими программами, как Microsoft Office Word на компьютерах Windows, Apple Pages на компьютерах Mac, Open Office - бесплатная альтернатива на различных платформах, в том числе Linux. Наиболее простым и современным решением будут Google документы, так как открываются онлайн без скачивания прямо в браузере на любой платформе. Существуют российские качественные аналоги, например от Яндекса.
Будьте внимательны на мобильных устройствах, так как там используются упрощённый функционал даже в официальном приложении от Microsoft, поэтому для просмотра скачивайте PDF-версию. А если нужно редактировать файл, то используйте оригинальный файл.
Файлы такого типа обычно разбиты на страницы, а текст может быть форматированным (жирный, курсив, выбор шрифта, таблицы и т.п.), а также в него можно добавлять изображения. Формат идеально подходит для рефератов, докладов и РПЗ курсовых проектов, которые необходимо распечатать. Кстати перед печатью также сохраняйте файл в PDF, так как принтер может начудить со шрифтами.