problemzadacha (710492)
Текст из файла
Московский Государственный Университет Путей Сообщения (МИИТ)
Проблемная задача
для студентов 2 курса (2 семестр) специальности «Программное обеспечение вычислительной техники и автоматизированных систем» по дисциплине «Теория вычислительных процессов»
«Разработка программы фильтрации статей конференций RELCOM.»
Общее число часов: 20
В т.ч. лабораторных - 5
Самостоятельная работа студентов – 15
Выполнил:
Аспирант Соболев А.В.
Москва 2001
Проблемная ситуация.
В органах снабжения железнодорожного транспорта с целью ценового анализа рынка материально-технических ресурсов проводится регулярная отработка предложений от покупателей-продавцов, поступающих в коммерческие конференции сети RELCOM (один из провайдеров Интернет)
Список статей представляет собой текстовый файл (на дискете), содержащий в себе набор предложений от организаций и частных лиц о покупке, продаже какого-либо материала и другую, в том числе бесполезную информацию. Предложения могут повторяться неоднократно. Регулярный просмотр этих предложений занимает много рабочего времени и малоэффективен в связи с отсутствием программных средств. Для снижения рутинного ручного труда по просмотру этой информации и отбора предложений для дальнейшей отработки возникла насущная потребность в программе автоматической фильтрации и сортировки исходных данных.
Проблемные вопросы
-
Как определить общую функциональность программы?
-
Как разработать внешний интерфейс программы?
-
Как создать рабочую версию программы (разработка внутренних интерфейсов межмодульных взаимодействий с целью дальнейшего развития программы)?
-
Как усовершенствовать программу с целью достижения максимального быстродействия?
Проблемная задача
Написать компьютерную программу автоматической фильтрации и сортировки исходных данных, удовлетворяющую следующим требованиям:
-
Для ручного анализа программа должна оставлять только те предложения, которые содержат одно из искомых слов.(«Купим», «Куплю», «Найти», «Преобрету», «Приобрету» и т.д.)
-
Предложения, содержащиеся в списках неоднократно, должны попадать в результат лишь однажды.
-
Предложения, проанализированные в предыдущий период, не должны больше предоставляться для отработки (история).
-
Интерфейс программы должен позволять простое изменение набора искомых слов.
Методические указания
Для решения задачи студенты должны актуализировать знания одного из языков программирования, курса «Теория вычислительных процессов» в части «Конечные автоматы» и курса «Структуры данных». Для разработки внутренних интерфейсов межмодульных взаимодействий потребуется актуализировать знания в области объектно-ориентированного программирования. В качестве учебного пособия по этим разделам компьютерного знания преподаватель рекомендует учащимся использовать литературу, указанную в конце данного документа.
Задача решается последовательным ответом на проблемные вопросы и программной реализацией найденных решений.
Для ответа на первый проблемный вопрос целесообразно использовать требования к программе (раздел «Проблемная задача») Исходя из определения функций системы, формулируются требования к входным и выходным данным и способу их интерпретации программой. Таким образом, формируется внешний интерфейс программы и появляется ответ на второй проблемный вопрос. Третий проблемный вопрос решается программной реализацией системы.
Наибольшую сложность представляет собой решение четвертого проблемного вопроса. Здесь подразумевается
-
Создание оптимальной структуры данных для накопления уже имеющихся предложений с целью исключения их из результата работы программы (вместо связного списка –> упорядоченный список -> древовидная структура -> что-то еще?)
-
Оптимальный алгоритм поиска сразу нескольких слов в одном предложении с целью определения наличия хотя бы одного из них (вместо последовательного перебора каждого из слов с выяснением его наличия в предложении (многопроходная схема) -> автоматическое построение конечного автомата по заданному набору слов и его использование для однопроходного просмотра предложения.)
-
Возможна дополнительная функциональность – разработка алгоритма определения похожести двух предложений (одни и те же по смыслу) при физическом (по количеству и расположению слов) их различии.
Цель работы
-
Создание реально работающей системы помощи в информационном анализе.
-
Актуализация ранее усвоенных и новых знаний по:
-
объектно-ориентированному программированию,
-
конечным автоматам,
-
структурам данных,
-
оптимизации процессов;
-
На основе вышеуказанных знаний формирование навыков и умений:
-
анализа исходных данных для дальнейшего их программного преобразования,
-
формулировки задачи,
-
разбиения задачи на подзадачи,
-
применения теоретических знаний по программированию в практическом аспекте,
-
разработки легко модифицируемых программ,
-
работы с выбранной средой программирования,
-
отладки сложных многомодульных программ,
-
В результате у студентов формируется творческое мышление, и настойчивость в достижении поставленной цели.
Литература
-
Яблонский С.Б. «Дискретная математика»
-
Бьярн Строуструп «Язык программирования С++»
-
Дейкстра «Алгоритмы + Структуры данных = Программы»
-
Допускается использование любой другой литературы, позволяющей выполнить цель работы.
Приложение
Дискета с исходными текстами программы и кратким описанием (для преподавателя), исходными данными (для студентов).
4
Характеристики
Тип файла документ
Документы такого типа открываются такими программами, как Microsoft Office Word на компьютерах Windows, Apple Pages на компьютерах Mac, Open Office - бесплатная альтернатива на различных платформах, в том числе Linux. Наиболее простым и современным решением будут Google документы, так как открываются онлайн без скачивания прямо в браузере на любой платформе. Существуют российские качественные аналоги, например от Яндекса.
Будьте внимательны на мобильных устройствах, так как там используются упрощённый функционал даже в официальном приложении от Microsoft, поэтому для просмотра скачивайте PDF-версию. А если нужно редактировать файл, то используйте оригинальный файл.
Файлы такого типа обычно разбиты на страницы, а текст может быть форматированным (жирный, курсив, выбор шрифта, таблицы и т.п.), а также в него можно добавлять изображения. Формат идеально подходит для рефератов, докладов и РПЗ курсовых проектов, которые необходимо распечатать. Кстати перед печатью также сохраняйте файл в PDF, так как принтер может начудить со шрифтами.