Популярные услуги

Семантическое кодирование информации

2021-03-09СтудИзба

Тема 24. Семантическое кодирование информации

  Термин “семантическое кодирование” возник в 60-х годах прошлого века в разработках, посвященных созданию баз данных, различных форм представления знаний, компьютерных методов обработки текстов, а также машинного перевода. Согласно А.М. Кондратову, семантический код – это особый “язык смысла”, в котором “из одних понятий – основных – должны выводиться другие”. Идея такого языка восходит к Г. Лейбницу, к его “универсальной характеристике”, т.е. к знаковой системе, с помощью которой возможно исчисление смыслов. По мнению Г. Лейбница, “все человеческие мысли вполне разрешаются на немногие, как бы первичные”. Если этим первичным понятиям будут “поставлены в соответствие характеры, то из них могли бы образовываться характеры производных понятий”.

   Кодирование представляет собой образование по определенным правилам кодов присвоение их объекту или группе объектов, позволяющее заменить несколькими знаками (символами) наименования этих объектов. С помощью кодов обеспечивается идентификация объектов максимально коротким способом, т.е. с помощью минимального числа знаков. Минимизация количества знаков, идентифицирующих объекты, способствует повышению эффективности сбора, учета, хранения, обработки (анализа) информации.

   Код – это символ, посредством которого объекты предметной области могут быть представлены с целью хранения в памяти ЭВМ и вывода информации на любой носитель.

   В области машинной обработки информации различают два типа кодов: машинные и экономические.

   Машинные коды используются для управления машиной и подачи команд. Это так называемые служебные коды.

   Под экономическим кодом понимается код, используемый для представления разнообразной информации. Например, код профессии работника, код жилых зданий, код вида подземных коммуникаций и так далее.

   Совокупность методов и правил кодирования объектов классификации называется системой кодирования.

   Кодовое обозначение характеризуется:

Рекомендуемые материалы

· алфавитом кода;

· структурой кода;

· числом знаков – длиной кода;

· методом кодирования.

   Алфавит кода представляет собой систему знаков (символов), составленных в определенном порядке, куда могут входить цифры, буквы и другие знаки, имеющиеся на клавиатуре печатающего устройства. Коды бывают цифровые, буквенные и смешанные – буквенно-цифровые.

   Структура кода представляет собой, как правило, графическое изображение последовательности расположения знаков кода и соответствующие этим знакам наименования уровней деления. Обычно структура кода представляется в нормативном документе как "ХХ.ХХ".

   Число знаков в коде определяется его структурой и зависит от количества объектов, входящих в подмножества, образуемые на каждом уровне деления. При определении числа знаков на каждом уровне деления необходимо иметь в виду возможность появления новых объектов и предусматривать резервные емкости кода.

   Части кода разделяются между собой точкой, после последней цифры кода точка не ставится. Обозначение года в коде ставится в конце, отделяется дефисом и имеет емкость 4 знака, т.е. "ХХ.ХХ-20ХХ".

   Методы кодирования в значительной степени связаны с методами разделения множества на подмножества. При разработке структуры кода важно выбрать оптимальное соотношение между уровнями деления и числом знаков в каждом разряде кода. При этом коды должны удовлетворять следующим основным требованиям:

однозначно идентифицировать объекты и (или) группы объектов, т.е. являться идентификаторами;

иметь минимальное число знаков (минимальную длину) и достаточное для кодирования всех объектов (признаков) заданного множества;

иметь достаточный резерв для кодирования вновь возникающих объектов кодируемого множества;

обеспечивать возможность автоматического контроля ошибок при вводе в компьютерные системы.

   Выделяют две группы методов, используемых в системе кодирования, которые образуют:

· классификационную систему кодирования, ориентированную на проведение предварительной классификации объектов либо на основе иерархической системы, либо на основе фасетной системы;

· регистрационную систему кодирования, не требующую предварительной классификации объектов. Рассмотрим представленную на рис. 1 систему кодирования.

  рис.1

 

   Классификационное кодирование применяется после проведения классификации объектов. Различают последовательное и параллельное кодирование.

   Последовательное кодирование используется для иерархической классификационной структуры. Суть метода заключается в следующем: сначала записывается код старшей группировки 1-го уровня, затем код группировки 2-го уровня, затем код группировки 3-го уровня и т.д. В результате получается кодовая комбинация, каждый разряд которой содержит информацию о специфике выделенной группы на каждом уровне иерархической структуры. Последовательная система кодирования обладает теми же достоинствами и недостатками, что и иерархическая система классификации.

   Параллельное кодирование используется для фасетной системы классификации. Суть метода заключается в следующем: все фасеты кодируются независимо друг от друга; для значений каждого фасета выделяется определенное количество разрядов кода. Параллельная система кодирования обладает теми же достоинствами и недостатками, что и фасетная система классификации.

   Пример 1. Проведем кодирование информации, классифицированной с помощью иерархической схемы. Количество кодовых группировок будет определяться глубиной классификации и равно 4, Прежде чем начать кодирование, необходимо определиться с алфавитом, т.е. какие будут использоваться символы. Для большей наглядности выберем десятичную систему счисления – 10 арабских цифр. Анализ схемы на рис. 2.4 показывает, что длина кода определяется 4 десятичными разрядами, а кодирование группировки на каждом уровне можно делать путем последовательной нумерации слева направо. В общем виде код можно записать как ХХХХ, где Х – значение десятичного разряда. Рассмотрим структуру кода, начиная со старшего разряда:

1-й (старший) разряд выделен для классификационного признака "название факультета" и имеет следующие значения: 1 – коммерческий; 2 – информационные системы; 3 – для следующего названия факультета и т.д.;

2-й разряд выделен для классификационного признака "возраст" и имеет следующие значения: 1 – до 20 лет; 2 – от 20 до 30 лет; 3 – свыше 30 лет;

3-й разряд выделен для классификационного признака "пол" и имеет следующие значения: 1 - мужчины; 2 - женщины;

4-й разряд выделен для классификационного признака "наличие детей у женщин" и имеет следующие значения; 1 – есть дети; 2 – нет детей, 0 – для мужчин, так как подобной информации не требуется.

   Принятая система кодирования позволяет легко расшифровать любой код группировки, например:

   1310 – студенты коммерческого факультета, свыше 30 лет мужчины;

   2221 – студенты факультета информационных систем, от 20 до 30 лет, женщины имеющие детей. Пример 2. Проведем кодирование информации, классифицированной с помощью фасетной схемы. Количество кодовых группировок определяется количеством фасетов и равно 4. Выберем десятичную систему счисления в качестве алфавита кодировки, что позволит для значений фасетов выделить один разряд и иметь длину кода, равную 4. В отличие от последовательного кодирования для иерархической системы классификации в данном метоле не имеет значения порядок кодировки фасетов. В общем виде код можно записать как ХХХХ, где Х – значение десятичного разряда. Рассмотрим структуру кода, начиная со старшего разряда:

1-й (старший) разряд выделен для фасета "пол" и имеет следующие значения: 1 – мужчины; 2 – женщины;

2-й разряд выделен для фасета "наличие детей у женщин" и имеет следующие значения: 1 – есть дети; 2 – нет детей; 0 – для мужчин, так как подобной информации не требуется;

3-й разряд выделен для фасета "возраст" и имеет следующие значения: 1 – до 20 лет; 2 – от 20 до 30 лет; 3 – свыше 30 лет;

4-й разряд выделен для фасета "название факультета" и имеет следующие значения 1 – радиотехнический, 2 – машиностроительный, 3 – коммерческий; 4 – информационные системы; 5 – математический и т.д.

   Принятая система кодирования позволяет легко расшифровать любой пол группировки, например:

   2135 –женщины в возрасте свыше 30 лет, имеющие детей и являющиеся студентами математического факультета;

   1021 – мужчины возраста от 20 до 30 лет, являющиеся студентами радиотехнического факультета.

   Кодирование при обоих методах осуществляется путем присвоения порядковых номеров, причем параллельный метод может успешно применяться при иерархическом методе классификации, когда одинаковыми кодами кодируются одинаковые объекты (признаки), находящиеся на одном уровне деления, но в разных подмножествах.

   При фасетной классификации коды признаков, входящих в отдельные фасеты, представляют собой, как правило, порядковые номера либо строятся на основе классификационных методов кодирования.

   Регистрационное кодирование

   Регистрационное кодирование используется для однозначной идентификации объектов и не требует предварительной классификации объектов. Различают порядковую и серийно-порядковую систему.

   Порядковая система кодирования предполагает последовательную нумерацию объектов числами натурального ряда. Этот порядок может быть случайным или определяться после предварительного упорядочения объектов, например по алфавиту. Этот метод применяется в том случае, когда количество объектов невелико, например кодирование названий факультетов университета, кодирование студентов в учебной группе.

   Серийно-порядковая система кодирования предусматривает предварительное выделение групп объектов, которые составляют серию, а затем в каждой серии производится порядковая нумерация объектов. Каждая серия также будет иметь порядковую нумерацию. По своей сути серийно-порядковая система является смешанной: классифицирующей и идентифицирующей. Применяется тогда, когда количество групп невелико.

   Пример 3. Все студенты одного факультета разбиваются на учебные группы (в данной терминологии – серии), для которых используется порядковая нумерация. Внутри каждой группы производится упорядочение фамилий студентов по алфавиту и каждому студенту присваивается номер. Выбор методов классификации и кодирования в каждом конкретном случае осуществляется разработчиком классификатора, возможны комбинации как принципов классификации, так и методов кодирования. Выбор комбинации зависит от назначения классификатора, решаемых им конкретных задач, специфики информации и области применения.

   Классификация – это разделение множества объектов на подмножества по их сходству или различию в соответствии с принятыми методами. Классификация фиксирует закономерные связи между классами объектов. Под объектом понимается любой процесс, предмет или явление.

Если Вам понравилась эта лекция, то понравится и эта - 9 - Пищеварительная система.

   Классификатор – это документ, с помощью которого осуществляется формализованное описание информации в ИС, содержащей наименования объектов, наименования классификационных группировок и их кодовые обозначения.

   По сфере действия выделяют следующие виды классификаторов: международные, общегосударственные (общесистемные), отраслевые и локальные классификаторы.

   Международные классификаторы входят в состав Системы международных экономических стандартов (СМЭС) и обязательны для передачи информации между организациями разных стран мирового сообщества.

   Общегосударственные (общесистемные) классификаторы, обязательны для организации процессов передачи и обработки информации между экономическими системами государственного уровня внутри страны.

   Отраслевые классификаторы используют для выполнения процедур обработки информации и передачи ее между организациями внутри отрасли.

   Локальные классификаторы используют в пределах отдельных предприятий.

Свежие статьи
Популярно сейчас
Зачем заказывать выполнение своего задания, если оно уже было выполнено много много раз? Его можно просто купить или даже скачать бесплатно на СтудИзбе. Найдите нужный учебный материал у нас!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Нашёл ошибку?
Или хочешь предложить что-то улучшить на этой странице? Напиши об этом и получи бонус!
Бонус рассчитывается индивидуально в каждом случае и может быть в виде баллов или бесплатной услуги от студизбы.
Предложить исправление
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
5137
Авторов
на СтудИзбе
441
Средний доход
с одного платного файла
Обучение Подробнее