Популярные услуги

Все письменные КМ под ключ за 3 суток! (КМ-6 + КМ-7 + КМ-8 + КМ-9 + КМ-10)
КМ-6. Динамические массивы. Семинар - выполню любой вариант!
Любая задача на C/C++
Одно любое задание в mYsql
Любой тест по базам данных максимально быстро на хорошую оценку - или верну деньги!
Любой реферат по объектно-ориентированному программированию (ООП)
Повышение уникальности твоей работе
КМ-2. Разработка простейших консольных программ с использованием ООП + КМ-4. Более сложные элементы ООП - под ключ!
Оба семинара по программированию под ключ! КМ-2. Разработка циклических алгоритмов + КМ-3. Функции и многофайловые программы в Си
Любой реферат по информатике

Информация и её свойства

2021-03-09СтудИзба

2.1. ИНФОРМАЦИЯ И ЕЕ СВОЙСТВА

ИНФОРМАЦИЯ И ДАННЫЕ

Термин информация происходит от латинского informatio, что означает разъяснение, осведомление, изложение. С позиции материалистической философии информация есть от­ражение реального мира с помощью сведений (сообщений). Сообщение — это форма пред­ставления информации в виде речи, текста, изображения, цифровых данных, графиков, таблиц и т.п. В широком смысле информация — это общенаучное понятие, включающее в себя обмен сведениями между людьми, обмен сигналами между живой и неживой приро­дой, людьми и устройствами.

Информация — сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии, которые уменьшают имеющуюся о них степень неопределенности, неполноты знаний.

Информатика рассматривает информацию как концептуально связанные между собой сведения, данные, понятия, изменяющие наши представления о явлении или объекте окру­жающего мира. Наряду с информацией в информатике часто употребляется понятие дан­ные. Покажем, в чем их отличие.

Данные могут рассматриваться как признаки или записанные наблюдения, которые по каким-то причинам не используются, а только хранятся. В том случае, если появляется воз­можность использовать эти данные для уменьшения неопределенности о чем-либо, данные превращаются в информацию. Поэтому можно утверждать, что информацией являются ис­пользуемые данные.

Пример 2.1. Напишите на листе десять номеров телефонов в виде последовательнос­ти десяти чисел и покажите их вашему другу. Он воспримет эти цифры как данные, так как они не предоставляют ему никаких сведений.

Затем против каждого номера укажите название фирмы и род деятельности. Для ва­шего друга непонятные цифры обретут определенность и превратятся из данных в ин­формацию, которую он в дальнейшем мог бы использовать.

Одной из важнейших разновидностей информации является информация экономи­ческая. Ее отличительная черта — связь с процессами управления коллективами людей, организацией. Экономическая информация сопровождает процессы производства, распре­деления, обмена и потребления материальных благ и услуг. Значительная часть ее связана с общественным производством и может быть названа производственной информацией.

Рекомендуемые материалы

Экономическая информация — совокупность сведений, отражающих со­циально-экономические процессы и служащих для управления этими про­цессами и коллективами людей в производственной и непроизводственной сфере.

При работе с информацией всегда имеется ее источник и потребитель (получатель). Пути и процессы, обеспечивающие передачу сообщений от источника информации к ее по­требителю, называются информационными коммуникациями.

Для потребителя информации очень важной характеристикой является ее адекват­ность.

Адекватность информации — это определенный уровень соответствия со­здаваемого с помощью полученной информации образа реальному объекту, процессу, явлению и т.п.

В реальной жизни вряд ли возможна ситуация, когда вы сможете рассчитывать на пол­ную адекватность информации. Всегда присутствует некоторая степень неопределенности. От степени адекватности информации реальному состоянию объекта или процесса зависит правильность принятия решений человеком.

Пример 2.2. Вы успешно закончили школу и хотите продолжить образование по эко­номическому направлению. Поговорив с друзьями, вы узнаете, что подобную подго­товку можно получить в разных вузах. В результате таких бесед вы получаете весьма разноречивые сведения, которые не позволяют вам принять решение в пользу того или иного варианта, т.е. полученная информация неадекватна реальному состоянию дел. Для того чтобы получить более достоверные сведения, вы покупаете справочник для поступающих в вузы, из которого получаете исчерпывающую информацию. В этом случае можно говорить, что информация, полученная вами из справочника, аде­кватно отражает направления обучения в вузах и помогает вам определиться в окон­чательном выборе.

ФОРМЫ АДЕКВАТНОСТИ ИНФОРМАЦИИ

Адекватность информации может выражаться в трех формах: семантической, синтаксичес­кой, прагматической.

Синтаксическая адекватность. Она отображает формально-структурные характерис­тики информации и не затрагивает ее смыслового содержания. На синтаксическом уровне учитываются тип носителя и способ представления информации, скорость передачи и обра­ботки, размеры кодов представления информации, надежность и точность преобразования этих кодов и т.п. Информацию, рассматриваемую только с синтаксических позиций, обыч­но называют данными, так как при этом не имеет значения смысловая сторона. Эта форма способствует восприятию внешних структурных характеристик, т.е. синтаксической сторо­ны информации.

Семантическая (смысловая) адекватность. Эта форма определяет степень соответ­ствия образа объекта и самого объекта. Семантический аспект предполагает учет смыслово­го содержания информации. На этом уровне анализируются те сведения, которые отражает информация, рассматриваются смысловые связи. В информатике устанавливаются смысло­вые связи между кодами представления информации. Эта форма служит для формирования понятий и представлений, выявления смысла, содержания информации и ее обобщения.

Прагматическая (потребительская) адекватность. Она отражает отношение инфор­мации и ее потребителя, соответствие информации цели управления, которая на ее основе реализуется. Проявляются прагматические свойства информации только при наличии един­ства информации (объекта), пользователя и цели управления. Прагматический аспект рас­смотрения связан с ценностью, полезностью использования информации при выработке потребителем решения для достижения своей цели. С этой точки зрения анализируются по­требительские свойства информации. Эта форма адекватности непосредственно связана с практическим использованием информации, с соответствием ее целевой функции деятель­ности системы.

МЕРЫ ИНФОРМАЦИИ

Классификация мер

Для измерения информации вводятся два параметра: количество информации  I и объем дан­ных VД.

Эти параметры имеют разные выражения и интерпретацию в зависимости от рассмат­риваемой формы адекватности. Каждой форме адекватности соответствует своя мера коли­чества информации и объема данных (рис. 2.1).

Рис. 2.1.  Меры информации

Синтаксическая мера информации

Эта мера количества информации оперирует с обезличенной информацией, не выражающей смыслового отношения к объекту.

Объем данных VД в сообщении измеряется количеством символов (разрядов) в этом сообщении. В различных системах счисления один разряд имеет различный вес и соот­ветственно меняется единица измерения данных:

•       в двоичной системе счисления единица измерения — бит (bit binary digit — двоич­ный разряд);

Примечание. В современных ЭВМ наряду с минимальной единицей измерения данных "бит" широко используется укрупненная единица измерения "байт", равная 8 бит.

•       в десятичной системе счисления единица измерения — дат (десятичный разряд).

Пример 2.3. Сообщение в двоичной системе в виде восьмиразрядного двоичного кода 10111011 имеет объем данных VД  = 8 бит.

Сообщение в десятичной системе в виде шестиразрядного числа 275903 имеет объем данных VД = 6 дит.

Количество информации I на синтаксическом уровне невозможно опреде­лить без  рассмотрения понятия неопределенности состояния системы (энтропии системы). Действительно, получение информации о какой-либо системе всегда связано с изменением степени неосведомленности получателя о состоянии этой системы. Рассмотрим это понятие.

Пусть до получения информации потребитель имеет некоторые предварительные (ап­риорные) сведения о системе α. Мерой его неосведомленности о системе является функция H(α), которая в то же время служит и мерой неопределенности состояния системы.

После получения некоторого сообщения β получатель приобрел некоторую дополни­тельную информацию Iβ(α), уменьшившую его априорную неосведомленность так, что апостериорная (после получения сообщения β) неопределенность состояния системы стала Hβ(α).

Тогда количество информации Iβ(α) о системе, полученной в сообщении β, опреде­лится как

Iβ(α) = H(α) - Hβ(α),

т.е. количество информации измеряется изменением (уменьшением) неопределенности со­стояния системы.

Если конечная неопределенность Hβ(α) обратится в нуль, то первоначальное непол­ное знание заменится полным знанием и количество информации Iβ(α) = H(α). Иными сло­вами, энтропия системы H(α) может рассматриваться как мера недостающей информации.

Энтропия системы H(α), имеющая N возможных состояний, согласно формуле Шенно­на, равна:

 

где pi  — вероятность того, что система находится в i-м состоянии.

Дня случая, когда все состояния системы равновероятны, т.е. их вероятности равны Pi =, ее энтропия определяется соотношением

Часто информация кодируется числовыми кодами в той или иной системе счисления, особенно это актуально при представлении информации в компьютере. Естественно, что одно и то же количество разрядов в разных системах счисления может передать разное число состояний отображаемого объекта, что можно представить в виде соотношения

N=mn,

где N — число всевозможных отображаемых состояний;

т — основание системы счисления (разнообразие символов, применяемых в алфавите); п — число разрядов (символов) в сообщении.

Пример 2.4. По каналу связи передается n-разрядное сообщение, использующее т различных символов. Так как количество всевозможных кодовых комбинаций будет N=mn, то при равновероятности появления любой из них количество информации, приобретенной абонентом в результате получения сообщения, будет I = log N = п log т — формула Хартли.

Если в качестве основания логарифма принять т, то I = п. В данном случае количест­во информации (при условии полного априорного незнания абонентом содержания сообщения) будет равно объему данных I = VД, полученных по каналу связи. Для неравновероятных состояний системы всегда I < VД  = n.

Наиболее часто используются двоичные и десятичные логарифмы. Единицами измере­ния в этих случаях будут соответственно бит и дит.

Коэффициент (степень) информативности (лаконичность) сообще­ния определяется отношением количества информации к объему данных, т.е.

, причем 0<Y<1.

С увеличением Y уменьшаются объемы работы по преобразованию информации (дан­ных) в системе. Поэтому стремятся к повышению информативности, для чего разрабатыва­ются специальные методы оптимального кодирования информации.

Семантическая мера информации

Для измерения смыслового содержания информации, т.е. ее количества на семантическом уровне, наибольшее признание получила тезаурусная мера, которая связывает семантичес­кие свойства информации со способностью пользователя принимать поступившее сообще­ние. Для этого используется понятие тезаурус пользователя.

Тезаурус — это совокупность сведений, которыми располагает пользова­тель или система.

В зависимости от соотношений между смысловым содержанием информации S и теза­урусом пользователя Sp изменяется количество семантической информации Ic, восприни­маемой пользователем и включаемой им в дальнейшем в свой тезаурус. Характер такой зависимости показан на рис. 2.2. Рассмотрим два предельных случая, когда количество се­мантической информации Ic  равно 0:

• при Sp 0 пользователь не воспринимает, не понимает поступающую информацию;

• при Sp  →∞ пользователь все знает, и поступающая информация ему не нужна.

Рис. 2.2.  Зависимость 

Количества семантической

 информации, воспринимаемой

потребителем, от его тезауруса

Ic=f(Sp)

Максимальное количество семантической информации 1c потребитель приобретает при согласовании ее смыслового содержания S со своим тезаурусом Sp (Sp = Spopt), когда поступающая информация понятна пользователю и несет ему ранее не известные (отсутст­вующие в его тезаурусе) сведения.

Следовательно, количество семантической информации в сообщении, количество новых знаний, получаемых пользователем, является величиной относительной. Одно и то же сообщение может иметь смысловое содержание для компетентного пользователя и быть бессмысленным (семантический шум) для пользователя некомпетентного.

При оценке семантического (содержательного) аспекта информации необходимо стре­миться к согласованию величин S и Sp.

Относительной мерой количества семантической информации может служить коэф­фициент содержательности С, который определяется как отношение количества семанти­ческой информации к ее объему:

.

Прагматическая мера информации

Эта мера определяет полезность информации (ценность) для достижения пользователем по­ставленной цели. Эта мера также величина относительная, обусловленная особенностями использования этой информации в той или иной системе. Ценность информации целесооб­разно измерять в тех же самых единицах (или близких к ним), в которых измеряется целе­вая функция.

Пример 2.5. В экономической системе прагматические свойства (ценность) информа­ции можно определить приростом экономического эффекта функционирования, до­стигнутым благодаря использованию этой информации для управления системой:

I(γ)=П(γ/β) – П(γ),

где I(γ) — ценность информационного сообщения β для системы   

      управления γ,

      П(γ)   — априорный ожидаемый экономический эффект

      функционирования системы управления γ,

                                                П(γ/β) — ожидаемый эффект функционирования системы γ при условии,

                                                что для управления будет использована информация, содержащаяся в

                                                сообщении γ.

Для сопоставления введенные меры информации представим в табл. 2.1. Таблица 2.1. Единицы измерения информации и примеры

Мера информации                             Единицы измерения                                     Примеры                      

                                                                                                                          (для компьютерной области)

Синтаксическая :

шенноновский подход                 Степень уменьшения неопределен-        Вероятность события

                                                       ности

компьютерный подход                Единицы   представления   инфор-          Бит, байт, Кбайт и т.д.

                                                        мации

Семантическая                              Тезаурус                                                    Пакет прикладных программ,

                                                                                                                            персональный компьютер,

                                                                                                                            компьютерные сети и т.д.

                                                        Экономические показатели                     Рентабельность, производи-  

                                                                                                                            тельность, коэффициент

                                                                                                                            амортизации и т.д.

Прагматическая                             Ценность использования                         Емкость  памяти, производи-

                                                                                                                            тельность компьютера,

                                                                                                                            скорость передачи данных

                                                                                                                            и т.д.

                                                                                                                            Денежное выражение

                                                                                                                            Время обработки информа-

                                                                                                                            ции и принятия решений

КАЧЕСТВО ИНФОРМАЦИИ

Возможность и эффективность использования информации обусловливаются такими основными ее потребительскими показателями качества, как репрезентативность, содержательность, достаточность, доступность, актуальность, своевременность, точность, достоверность, устойчивость.

Репрезентативность информации связана с правильностью ее отбора и фор­мирования в целях адекватного отражения свойств объекта. Важнейшее значение здесь имеют:

• правильность концепции, на базе которой сформулировано исходное понятие;

• обоснованность отбора существенных признаков и связей отображаемого явления.
Нарушение репрезентативности информации приводит нередко к существенным ее

погрешностям.

Содержательность информации отражает семантическую емкость, равную отношению количества семантической информации в сообщении к объему обрабатываемых данных, т.е.

С увеличением содержательности информации растет семантическая пропускная спо­собность информационной системы, так как для получения одних и тех же сведений требу­ется преобразовать меньший объем данных.

Наряду с коэффициентом содержательности С, отражающим семантический аспект, можно использовать и коэффициент информативности, характеризующийся отношением количества синтаксической информации (по Шеннону) к объему данных

Достаточность (полнота) информации означает, что она содержит мини­мальный, но достаточный для принятия правильного решения состав (набор показателей). Понятие полноты информации связано с ее смысловым содержанием (семантикой) и праг­матикой. Как неполная, т.е. недостаточная для принятия правильного решения, так и избы­точная информация снижает эффективность принимаемых пользователем решений.

Доступность информации восприятию пользователя обеспечивается выполнени­ем соответствующих процедур ее получения и преобразования. Например, в информацион­ной системе информация преобразовывается к доступной и удобной для восприятия пользователя форме. Это достигается, в частности, и путем согласования ее семантической формы с тезаурусом пользователя.

Актуальность информации определяется степенью сохранения ценности инфор­мации для управления в момент ее использования и зависит от динамики изменения ее ха­рактеристик и от интервала времени, прошедшего с момента возникновения данной информации.

Своевременность информации означает ее поступление не позже заранее на­значенного момента времени, согласованного с временем решения поставленной задачи.

Точность информации определяется степенью близости получаемой информации к реальному состоянию объекта, процесса, явления и т.п. Для информации, отображаемой цифровым кодом, известны четыре классификационных понятия точности:

• формальная точность, измеряемая значением единицы младшего разряда числа;

• реальная точность, определяемая значением единицы последнего разряда числа, вер­ность которого гарантируется;

• максимальная точность, которую можно получить в конкретных условиях функциони­рования системы;

• необходимая точность, определяемая функциональным назначением показателя.

Достоверность информации определяется ее свойством отражать реально суще­ствующие объекты с необходимой точностью. Измеряется достоверность информации дове­рительной вероятностью необходимой точности, т.е. вероятностью того, что отображаемое информацией значение параметра отличается от истинного значения этого параметра в пре­делах необходимой точности.

Устойчивость информации отражает ее способность реагировать на изменения исходных данных без нарушения необходимой точности. Устойчивость информации, как и репрезентативность, обусловлена выбранной методикой ее отбора и формирования.

В заключение следует отметить, что такие параметры качества информации, как реп­резентативность, содержательность, достаточность, доступность, устойчивость, целиком определяются на методическом уровне разработки информационных систем. Параметры ак­туальности, своевременности, точности и достоверности обусловливаются в большей степе­ни также на методическом уровне, однако на их величину существенно влияет и характер функционирования системы, в первую очередь ее надежность. При этом параметры акту­альности и точности жестко связаны соответственно с параметрами своевременности и до­стоверности.

2.2. КЛАССИФИКАЦИЯ И КОДИРОВАНИЕ ИНФОРМАЦИИ

СИСТЕМА КЛАССИФИКАЦИИ

Общие сведения

Важным понятием при работе с информацией является классификация объектов.

Классификация — система распределения объектов (предметов, явлений, процессов, понятий) по классам в соответствии с определенным признаком.

Под объектом понимается любой предмет, процесс, явление материального или нематериального свойства. Система классификации позволяет сгруппировать объекты и вы­делить определенные классы, которые будут характеризоваться рядом общих свойств. Классификация объектов — это процедура группировки на качественном уровне, направ­ленная на выделение однородных свойств. Применительно к информации как к объекту классификации выделенные классы называют информационными объектами.

Пример 2.6. Всю информацию об университете можно классифицировать по много­численным информационным объектам, которые будут характеризоваться общими свойствами:

•   информация о студентах — в виде информационного объекта "Студент";

•  информация о преподавателях — в виде информационного объекта "Преподава­тель";

•   информация о факультетах — в виде информационного объекта "Факультет" и т.п.

Свойства информационного объекта определяются информационными параметрами, называемыми реквизитами. Реквизиты представляются либо числовыми данными, напри­мер вес, стоимость, год, либо признаками, например цвет, марка машины, фамилия.

Реквизит — логически неделимый информационный элемент, описываю­
щий[определешюесвойство объекта, процесса, явления и т.п.

Пример 2.7. Информация о каждом студенте в отделе кадров университета система­тизирована и представлена посредством одинаковых реквизитов:

фамилия, имя, отчество;

пол;

год рождения;

место рождения;

адрес проживания;

факультет, где проходит обучение студент, и т.д.

Все перечисленные реквизиты характеризуют свойства информационного объекта "Студент".

Кроме выявления общих свойств информационного объекта классификация нужна для разработки правил (алгоритмов) и процедур обработки информации, представленной сово­купностью реквизитов.

Пример 2.8. Алгоритм обработки информационных объектов библиотечного фонда позволяет получить информацию о всех книгах по определенной тематике, об авто­рах, абонентах и т.д.

Алгоритм обработки информационных объектов фирмы позволяет получить инфор­мацию об объемах продаж, о прибыли, заказчиках, видах производимой продукции и т.д.

Алгоритмы обработки в том и другом случае преследуют разные цели, обрабатывают разную информацию, реализуются разными способами.

При любой классификации желательно, чтобы соблюдались следующие требования:

• полнота охвата объектов рассматриваемой области;

• однозначность реквизитов;

• возможность включения новых объектов.

В любой стране разработаны и применяются государственные, отраслевые, региональ­ные классификаторы. Например, классифицированы: отрасли промышленности, оборудова­ние, профессии, единицы измерения, статьи затрат и т.д.

Классификатор — систематизированный свод наименований и кодов клас­сификационных группировок.

При классификации широко используются понятия классификационный признак и значение классификационного признака, которые позволяют установить сходство или различие объектов. Возможен подход к классификации с объеди­нением этих двух понятий в одно, названное как признак классификации. Признак класси­фикации имеет также синоним основание деления.

Пример 2.9. В качестве признака классификации выбирается возраст, который состо­ит из трех значений: до 20 лет, от 20 до 30 лет, свыше 30 лет.

Можно в качестве признаков классификации использовать: возраст до 20 лет, возраст от 20 до 30 лет, возраст свыше 30 лет.

Разработаны три метода классификации объектов: иерархический, фасетный, дескрип-торный. Эти методы различаются разной стратегией применения классификационных при­знаков. Рассмотрим основные идеи этих методов для создания систем классификации.

Иерархическая система классификации

Иерархическая система классификации (рис. 2.3) строится следующим об­разом:

• исходное множество элементов составляет 0-й уровень и делится в зависимости от выбранного классификационного признака на классы (группировки), которые образуют 1-й уровень;

• каждый класс 1-го уровня в соответствии со своим, характерным для него классификационным признаком делится на подклассы, которые образуют 2-й уровень;

• каждый класс 2-го уровня аналогично делится на группы, которые образуют 3-й уровень, и т.д.

Рис. 2.3. Иерархическая   система классификации

Учитывая достаточно жесткую процедуру построения структуры классификации, не­обходимо перед началом работы определить ее цель, т.е. какими свойствами должны обла­дать объединяемые в классы объекты. Эти свойства принимаются в дальнейшем за признаки классификации.

Запомните! В иерархической системе классификации из-за жесткой структуры особое внимание следует уделить выбору классификационных признаков.

В иерархической системе классификации каждый объект на любом уровне должен быть отнесен к одному классу, который характеризуется конкретным значением выбранно­го классификационного признака. Для последующей группировки в каждом новом классе необходимо задать свои классификационные признаки и их значения. Таким образом, выбор классификационных признаков будет зависеть от семантического содержания того класса, для которого необходима группировка на последующем уровне иерархии.

Количество уровней классификации, соответствующее числу признаков, выбранных в качестве основания деления, характеризует глубину классификации.

Достоинства иерархической системы классификации:

• простота построения;

• использование независимых- классификационных признаков в различных ветвях иерархической структуры.

Недостатки иерархической системы классификации:

• жесткая структура, которая приводит к сложности внесения изменений, так как приходится перераспределять все классификационные группировки;

• невозможность группировать объекты по заранее не предусмотренным сочетаниям
признаков.

Пример 2.10. Поставлена задача — создать иерархическую систему классификации для информационного объекта "Факультет", которая позволит классифицировать ин­формацию обо всех студентах по следующим классификационным признакам: фа­культет, на котором он учится, возрастной состав студентов, пол студента, для женщин — наличие детей.

Система классификации представлена на рис.2.4 и будет иметь следующие уровни:

0-й уровень. Информационный объект "Факультет";

1-й уровень. Выбирается классификационный признак — название факультета, что позволяет выделить несколько классов с разными названиями факультетов, в которых хранится информация обо всех студентах.

2-й уровень. Выбирается классификационный признак — возраст, который имеет три градации: до 20 лет, от 20 до 30 лет, свыше 30 лет. По каждому факультету выделяют­ся три возрастных подкласса студентов.

3-й уровень. Выбирается классификационный признак — пол. Каждый подкласс 2-го уровня разбивается на две группы. Таким образом, информация о студентах каждого факультета в каждом возрастном подклассе разделяется на две группы — мужчин и женщин.

4-й уровень. Выбирается классификационный признак — наличие детей у женщин: есть, нет.

Созданная иерархическая система классификации имеет глубину классификации, рав­ную четырем.

Рис. 2.4. Пример иерархической системы классификации для информационного объекта "Факультет"

Фасетная система классификации

Фасетная система классификации в отличие от иерархической позволяет выбирать признаки классификации независимо как друг от друга, так и от семантического содержания классифицируемого объекта. Признаки классификации называются фасета-м и (facet — рамка). Каждый фасет (Фi) содержит совокупность однородных значений дан­ного классификационного признака. Причем значения в фасете могут располагаться в произвольном порядке, хотя предпочтительнее их упорядочение.

Пример 2.11. Фасет цвет содержит значения: красный, белый, зеленый, черный,

желтый.

Фасет специальность содержит названия специальностей.

Фасет образование содержит значения: среднее, среднее специальное, высшее.

Схема построения фасетной системы классификации в виде таблицы отображена на рис. 2.5. Названия столбцов соответствуют выделенным классификационным признакам(фасетам), обозначенным Ф, Ф2, ..., Ф, ..., Фп- Например, цвет, размер одежды, вес и т.д. Произведена нумерация строк таблицы. В каждой клетке таблицы хранится конкретное зна­чение фасета. Например, фасет цвет, обозначенный Ф2, содержит значения: красный, белый, зеленый, черный, желтый.


Рис. 2.5. Фасетная система классификации

Процедура классификации состоит в присвоении каждому объекту соответствующих значений из фасетов. При этом могут быть использованы не все фасеты. Для каждого объ­екта задается конкретная группировка фасетов структурной формулой, в которой отражает­ся их порядок следования:

КS = (Ф12,..., Фi,..., Фn),

где Фit i-й фасет;

       п  — количество фасетов.

При построении фасетной системы классификации необходимо, чтобы значения, ис­пользуемые в различных фасетах, не повторялись. Фасетную систему легко можно модифи­цировать, внося изменения в конкретные значения любого фасета.

Достоинства фасетной системы классификации:

• возможность создания большой емкости классификации, т.е. использования большого
числа признаков классификации и их значений для создания группировок;

• возможность простой модификации всей системы классификации без изменения
структуры существующих группировок.

Недостатком фасетной системы классификации является сложность ее постро­ения, так как необходимо учитывать все многообразие классификационных признаков.

Пример 2.12. Обратитесь к содержанию примера 2.10, где показано построение ие­рархической системы классификации. Для сопоставления разработаем фасетную сис­тему классификации.

Сгруппируем и представим в виде таблицы (рис. 2.6) все классификационные призна­ки по фасетам:

• фасет название факультета с пятью названиями факультетов;

• фасет возраст с тремя возрастными группами;

• фасет пол с двумя градациями;

• фасет дети с двумя градациями.

Структурную формулу любого класса можно представить в виде:

Ks = (Факультет, Возраст, Пол, Дети)

Присваивая конкретные значения каждому фасету, получим следующие классы:

K1 = (Радиотехнический факультет, возраст до 20 лет, мужчина, есть дети);

k2= (Коммерческий факультет, возраст от 20 до 30 лет, мужчина, детей нет);

К3 = (Математический факультет, возраст до 20 лет, женщина, детей нет) и т.д.

Рис. 2.6.  Пример фасетной системы классификации для информационного объекта "Факультет"

Дескрипторная система классификации

Для организации поиска информации, для ведения тезаурусов (словарей) эффективно ис­пользуется дескрипторная (описательная) система классификации, язык которой приближа­ется к естественному языку описания информационных объектов. Особенно широко она используется в библиотечной системе поиска.

Суть дескрипторного метода классификации заключается в следующем:

• отбирается совокупность ключевых слов или словосочетаний, описывающих определенную предметную область или совокупность однородных объектов. Причем среди
ключевых слов могут находиться синонимы;

• выбранные ключевые слова и словосочетания подвергаются нормализации, т.е.
из совокупности синонимов выбирается один или несколько наиболее употребимых;

• создается словарь дескрипторов, т. е. словарь ключевых слов и словосочетаний, отобранных в результате процедуры нормализации.

Пример 2.13. В качестве объекта классификации рассматривается успеваемость сту­дентов. Ключевыми словами могут быть выбраны: оценка, экзамен, зачет, преподава­тель, студент, семестр, название предмета. Здесь нет синонимов, и поэтому указанные ключевые слова можно использовать как словарь дескрипторов. В качестве предметной области выбирается учебная деятельность в высшем учебном заведении. Ключевыми словами могут быть выбраны: студент, обучаемый, учащийся, преподаватель, учитель, педагог, лектор, ассистент, доцент, профессор, коллега, фа­культет, подразделение университета, аудитория, комната, лекция, практическое заня­тие, занятие и т.д. Среди указанных ключевых слов встречаются синонимы, например: студент, обучаемый, учащийся; преподаватель, учитель, педагог; факуль­тет, подразделение университета и т.д. После нормализации словарь дескрипторов будет состоять из следующих слов: студент, преподаватель, лектор, ассистент, до­цент, профессор, факультет, аудитория, лекция, практическое занятие и т.д.

Между дескрипторами устанавливаются связи, которые позволяют расширить область поиска информации. Связи могут быть трех видов:

синонимические, указывающие некоторую совокупность ключевых слов как си­
нонимы;

родо-видовые, отражающие включение некоторого класса объектов в более пред­
ставительный класс;

ассоциативные, соединяющие дескрипторы, обладающие общими свойствами.

Пример 2.14. Синонимическая связь: студент — учащийся — обучаемый.

Родо-видовая связь: университет — факультет — кафедра. Ассоциативная связь: студент — экзамен — профессор — аудитория.

СИСТЕМА КОДИРОВАНИЯ

Общие понятия

Система кодирования применяется для замены названия объекта на условное обозначение (код) в целях обеспечения удобной и более эффективной обработки информации.

Система кодирования — совокупность правил кодового обозначения объектов.

Код строится на базе алфавита, состоящего из букв, цифр и других символов. Код ха­рактеризуется:

длиной — число позиций в коде;

структурой — порядок расположения в коде символов, используемых для обозначе­ния классификационного признака.

Процедура присвоения объекту кодового обозначения называется кодированием. Можно выделить две группы методов, используемых в системе кодирования (рис.2.7), ко­торые образуют:

классификационную систему кодирования, ориентированную на про­
ведение предварительной классификации объектов либо на основе иерархической сис­темы, либо на основе фасетной системы;

регистрационную систему кодирования, не требующую предваритель­ной классификации объектов.

Рассмотрим представленную на рис. 2.7 систему кодирования.

Рис. 2.7. Система кодирования, использующая разные методы

Классификационное кодирование

Классификационное кодирование применяется после проведения классификации объектов. Различают последовательное и параллельное кодирование.

Последовательное кодирование используется для иерархической классифика­ционной структуры. Суть метода заключается в следующем: сначала записывается код стар­шей группировки 1-го уровня, затем код группировки 2-го уровня, затем код группировки 3-го уровня и т.д. В результате получается кодовая комбинация, каждый разряд которой со­держит информацию о специфике выделенной группы на каждом уровне иерархической структуры. Последовательная система кодирования обладает теми же достоинствами и не­достатками, что и иерархическая система классификации.

Пример 2.15. Проведем кодирование информации, классифицированной с помощью иерархической схемы (см. рис. 2.4). Количество кодовых группировок будет опреде­ляться глубиной классификации и равно 4. Прежде чем начать кодирование, необхо­димо определиться с алфавитом, т.е. какие будут использоваться символы. Для большей наглядности выберем десятичную систему счисления — 10 арабских цифр. Анализ схемы на рис. 2.4 показывает, что длина кода определяется 4 десятичными разрядами, а кодирование группировки на каждом уровне можно делать путем после­довательной нумерации слева направо. В общем виде код можно записать как ХХХХ, где X — значение десятичного разряда. Рассмотрим структуру кода, начиная со стар­шего разряда:

1-й (старший) разряд выделен для классификационного признака "название факульте­та" и имеет следующие значения: 1 — коммерческий; 2 — информационные системы; 3 — для следующего названия факультета и т.д.;

2-й разряд выделен для классификационного признака "возраст" и имеет следующие значения: 1 — до 20 лет; 2 — от 20 до 30 лет; 3 — свыше 30 лет; 3-й разряд выделен для классификационного признака "пол" и имеет следующие зна­чения: 1 — мужчины; 2 — женщины;

4-й разряд выделен для классификационного признака "наличие детей у женщин" и имеет следующие значения: 1 — есть дети; 2 — нет детей, 0 — для мужчин, так как подобной информации не требуется.

Принятая система кодирования позволяет легко расшифровать любой код группиров­ки, например:

1310 — студенты коммерческого факультета, свыше 30 лет, мужчины;

2221 — студенты факультета информационных систем, от 20 до 30 лет, женщины, имеющие детей.

Параллельное кодирование используется для фасетной системы классификации. Суть метода заключается в Следующем: все фасеты кодируются независимо друг от друга; для значений каждого фасета выделяется определенное количество разрядов кода. Парал­лельная система кодирования обладает теми же достоинствами и недостатками, что и фасетная система классификации.

Пример 2.16. Проведем кодирование информации, классифицированной с помощью
фасетной схемы (см. рис. 2.6). Количество кодовых группировок определяется количеством фасетов и равно 4. Выберем десятичную систему счисления в качестве алфавита кодировки, что позволит для значений фасетов выделить один разряд и иметь
длину кода, равную 4. В отличие от последовательного кодирования для иерархичес­кой системы классификации в данном методе не имеет значения порядок кодировки
фасетов. В общем виде код можно записать как ХХХХ, где X — значение десятичного разряда. Рассмотрим структуру кода, начиная со старшего разряда:

1-й (старший) разряд выделен для фасета "пол" и имеет следующие значения: 1 — мужчины; 2 — женщины;

2-й разряд выделен для фасета "наличие детей у женщин" и имеет следующие значе­ния: 1 — есть дети; 2 — нет детей, 0 — для мужчин, так как подобной информации не требуется;

3-й разряд выделен для фасета "возраст" и имеет следующие значения: 1 — до 20 лет; 2 — от 20 до 30 лет; 3 — свыше 30 лет;

4-й разряд выделен для фасета "название факультета" и имеет следующие значения: 1 — радиотехнический, 2 — машиностроительный, 3 — коммерческий; 4 — инфор­мационные системы; 5 — математический и т.д.

Принятая система кодирования позволяет легко расшифровать любой код группиров­ки, например:

2135 — женщины в возрасте свыше 30 лет, имеющие детей и являющиеся студентами математического факультета;

1021 — мужчины возраста от 20 до 30 лет, являющиеся студентами радиотехническо­го факультета.

Регистрационное кодирование

Регистрационное кодирование используется для однозначной идентификации объектов и не требует предварительной классификации объектов. Различают порядковую и серийно-по­рядковую систему.

Порядковая система кодирования предполагает последовательную нумерацию объектов числами натурального ряда. Этот порядок может быть случайным или определять­ся после предварительного упорядочения объектов, например по алфавиту. Этот метод при­меняется в том случае, когда количество объектов невелико, например кодирование названий факультетов университета, кодирование студентов в учебной группе.

Серийно-порядковая система кодирования предусматривает предварительное выделение групп объектов, которые составляют серию, а затем в каждой серии производит­ся порядковая нумерация объектов. Каждая серия также будет иметь порядковую нумера­цию. По своей сути серийно-порядковая система является смешанной: классифицирующей и идентифицирующей. Применяется тогда, когда количество групп невелико.

Пример 2.17. Все студенты одного факультета разбиваются на учебные группы (в данной терминологии — серии), для которых используется порядковая нумерация. Внутри каждой группы производится упорядочение фамилий студентов по алфавиту и каждому студенту присваивается номер.

КЛАССИФИКАЦИЯ ИНФОРМАЦИИ ПО РАЗНЫМ ПРИЗНАКАМ

Любая классификация всегда относительна. Один и тот же объект может быть классифици­рован по разным признакам или критериям. Часто встречаются ситуации, когда в зависи­мости от условий внешней среды объект может быть отнесен к разным классификационным группировкам. Эти рассуждения особенно актуальны при классификации видов информа­ции без учета ее предметной ориентации, так как она часто может быть использована в раз­ных условиях, разными потребителями, для разных целей.

На рис. 2.8 приведена одна из схем классификации циркулирующей в организации (фирме) информации. В основу классификации положено пять наиболее общих признаков: место возникновения, стадия обработки, способ отображения, стабильность, функция уп­равления.

Рис. 2.8.  Классификация информации, циркулирующей в организации

Место возникновения. По этому признаку информацию можно разделить на вход­ную выходную, внутреннюю, внешнюю.

Входная информация — это информация, поступающая в фирму или ее подразде­ления.

Выходная информация — это информация, поступающая из фирмы в другую фирму, организацию (подразделение).

Одна и та же информация может являться входной для одной фирмы, а для другой, ее вырабатывающей, выходной. По отношению к объекту управления (фирма или ее подразде­ление: цех, отдел, лаборатория) информация может быть определена как внутренняя, так и внешняя.

Внутренняя информация возникает внутри объекта, внешняя информация — за пределами объекта.

Пример 2.18. Содержание указа правительства об изменении уровня взимаемых нало­гов для фирмы является, с одной стороны, внешней информацией, с другой сторо­ны — входной. Сведения фирмы в налоговую инспекцию о размере отчислений в госбюджет являются, с одной стороны, выходной информацией, с другой стороны — внешней по отношению к налоговой инспекции.

Стадия обработки. По стадии обработки информация может быть первичной, вторич­ной, промежуточной, результатной.

Первичная информация — это информация, которая возникает непосредственно в процессе деятельности объекта и регистрируется на начальной стадии.

Вторичная информация — это информация, которая получается в результате об­работки первичной информации и может быть промежуточной и результатной.

Промежуточная информация используется в качестве исходных данных для последующих расчетов.

Результатная информация получается в процессе обработки первичной и про­межуточной информации и используется для выработки управленческих решений.

Пример 2.19. В художественном цехе, где производится роспись чашек, в конце каж­дой смены регистрируется общее количество произведенной продукции и количество расписанных чашек каждым работником. Это первичная информация. В конце каждо­го месяца мастер подводит итоги первичной информации. Это будет, с одной сторо­ны, вторичная промежуточная информация, а с другой стороны — результатная. Итоговые данные поступают в бухгалтерию, где производится расчет заработной платы каждого работника в зависимости от его выработки. Полученные расчетные данные — результатная информация.

Способ отображения. По способу отображения информация подразделяется на текс­товую и графическую.

Текстовая информация — это совокупность алфавитных, цифровых и специаль­ных символов, с помощью которых представляется информация на физическом носителе (бумага, изображение на экране дисплея).

Графическая информация — это различного рода графики, диаграммы, схемы, рисунки и т.д.

Стабильность. По стабильности информация может быть переменной (текущей) и по­стоянной (условно-постоянной).

Переменная информация отражает фактические количественные и качественные характеристики производственно-хозяйственной деятельности фирмы. Она может меняться для каждого случая как по назначению, так и по количеству. Например, количество произ­веденной продукции за смену, еженедельные затраты на доставку сырья, количество ис­правных станков и т.п.

Постоянная (условно-постоянная) информация — это неизменная и многократно используемая в течение длительного периода времени информация Постоянная информа­ция может быть справочной, нормативной, плановой:

• постоянная справочная информация включает описание постоянных свойств объекта в
виде устойчивых длительное время признаков. Например, табельный номер служаще­го, профессия работника, номер цеха и т.п.;

• постоянная нормативная информация содержит местные, отраслевые и общегосудар­ственные нормативы. Например, размер налога на прибыль, стандарт на качество продуктов определенного вида, размер минимальной оплаты труда, тарифная сетка
оплаты государственным служащим;

• постоянная плановая информация содержит многократно используемые в фирме пла­новые показатели. Например, план выпуска телевизоров, план подготовки специалистов определенной квалификации.

Функция управления. По функциям управления обычно классифицируют эконо­мическую информацию. При этом выделяют следующие группы: плановую, норма­тивно-справочную, учетную и оперативную (текущую).

Плановая информация — информация о параметрах объекта управления на буду­щий период. На эту информацию идет ориентация всей деятельности фирмы.

Пример 2.20. Плановой информацией фирмы могут быть такие показатели, как план выпуска продукции, планируемая прибыль от реализации, ожидаемый спрос на про­дукцию и т.д.

Нормативно-справочная информация содержит различные нормативные и справочные данные. Ее обновление происходит достаточно редко.

Пример 2.21. Нормативно-справочной информацией на предприятии являются:

• время, предназначенное для изготовления типовой детали (нормы трудоемкости);

• среднедневная оплата рабочего по разряду;

• оклад служащего;

• адрес поставщика или покупателя и т.д.

Учетная информация — это информация, которая характеризует деятельность фирмы за определенный прошлый период времени. На основании этой информации могут быть проведены следующие действия: скорректирована плановая информация, сделан ана­лиз хозяйственной деятельности фирмы, приняты решения по более эффективному управ­лению работами и пр. На практике в качестве учетной информации может выступать информация бухгалтерского учета, статистическая информация и информация оперативно­го учета.

Пример 2.22. Учетной информацией являются: количество проданной продукции за определенный период времени; среднесуточная загрузка или простой станков и т.п.

Оперативная (текущая) информация — это информация, используемая в оперативном управлении и характеризующая производственные процессы в текущий (дан­ный) период времени. К оперативной информации предъявляются серьезные требования по скорости поступления и обработки, а также по степени ее достоверности. От того, насколь­ко быстро и качественно проводится ее обработка, во многом зависит успех фирмы на рынке.

Пример 2.23. Оперативной информацией являются:

     количество изготовленных деталей за час, смену, день;

• количество проданной продукции за день или определенный час;

• объем сырья от поставщика на начало рабочего дня и т.д.

КЛЮЧЕВЫЕ ПОНЯТИЯ

Адекватность информации                             достоверность

Вид информации:                                            доступность

внешняя                                                   репрезентативность

внутренняя                                              своевременность

вторичная                                                содержательность

входная                                                   точность

выходная                                                 устойчивость

                                         графическая                                                  Реквизит

первичная                                       Связь между дескрипторами:
переменная                                     ассоциативная

постоянная                                              родо-видовая

промежуточная                                       синонимическая

результатная                                  Система классификации:
текстовая                                                   дескрипторная

Глубина классификации                                  иерархическая

                               Данные                                                                                        фасетная

дескриптор                                              Система кодирования:
Значение фасета                                                классификационная

Информация                                                        параллельная

Информационный объект                                   последовательная

Информационные коммуникации                   регистрационная

Классификатор                                                    порядковая

Классификационный признак                             серийно-порядковая

Классификация                                      

Код                                                          Словарь дескрипторов

Кодирование                                           Тезаурус

Количество информации                       Фасет

Коэффициент (степень) информа-         Форма адекватности:
тивности                                         прагматическая

Мера измерения информации:                        семантическая

прагматическая                                       синтаксическая

семантическая                                Экономическая информация:
синтаксическая                               нормативно-справочная

Объем данных                                                 оперативная

                               Показатель качества информации:                              плановая

актуальность                                           учетная

достаточность                                Энтропия системы

ВОПРОСЫ ДЛЯ САМОПРОВЕРКИ

1. В чем различие информации и данных?

2. Что такое адекватность и в каких формах она проявляется?

3. Какие существуют меры информации и когда ими надо пользоваться?

4. Расскажите о синтаксической, семантической, прагматической мерах информации.

5. Какие существуют показатели качества информации?

"5 Символика формы" - тут тоже много полезного для Вас.

6. Что такое система классификации информации?

7. Основные идеи иерархического, фасетного, дескрипторного методов классификации.
Примеры.

8. Что такое система кодирования информации? Классификация методов.

9. Что такое классификационное, регистрационное кодирование? Примеры.

10. Сопоставьте назначения системы классификации и системы кодирования.

11. Расскажите о классификации информации, циркулирующей в организации.

Свежие статьи
Популярно сейчас
А знаете ли Вы, что из года в год задания практически не меняются? Математика, преподаваемая в учебных заведениях, никак не менялась минимум 30 лет. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
5160
Авторов
на СтудИзбе
439
Средний доход
с одного платного файла
Обучение Подробнее