ПОД_1 (1184241)
Текст из файла
Казачкин Дмитрий, 522 гр.
Контрольная работа №1.
-
Метрики измерения содержательности естественных языков
Аддитивная мера (мера Хартли):
I = L*log2h,
где I – количество информации, L – длина сообщения, h – мощность исходного алфавита.
Абсолютная интенсивность языка, вводится на ее основе для L =1:
R = log2h,
что можно интерпретировать как число бит, которые можно закодировать одним символом алфавита в предположении их равной вероятности.
Абсолютная интенсивность для некоторых языков:
-
Английский (латиница) Reng=log226=4.70
-
Русский (кириллица) Rrus=log233=5.04
-
Японский (слоговая азбука катакана) Rkatakana=log2124=6.95
-
Китайский (иероглифическое письмо) Rchina> log280000=16.29
Информационная энтропия (мера Шеннона):
H(x) = -n*∑i=1..np(i)*log2p(i) ,
где H(x) – неопределённость появления символа алфавита, p(i) – вероятность i-го символа алфавита в слове x.
Интенсивность языка:
r = lim H(M)/N при N→∞,
где M – всевозможные сообщения длины N.
Интенсивность для некоторых языков:
-
Английский (латиница) reng=1.2~1.5 по разным источникам
-
Р
усский (кириллица) rrus=0.83~1.4
Избыточность языка:
D = R – r,
т.е. разность введенных выше величин.
-
Области применения мер бит, дит, нат
В общем случае, мера Хартли определяется так:
I = K*logBN,
где K – масштабирующий коэффициент, B – основание логарифма, N – число состояний системы.
-
B=2 (бит) – дискретная математика, вычислительная техника, физика полупроводников. 8 бит = 1 байт.
-
B=3 (трит) – троичная логика. 6 трит = 1 трайт.
-
B=e (нат) – теория информации (собственная информация), термодинамика, эконометрика
-
B=10 (дит, он же хартли, он же ban) – теория вероятности, анализ десятичных записей чисел. 10 дит = 1 децидит.
-
Иные количественные меры оценки информации кроме мер Хартли и Шеннона
В информатике, как правило, измерению подвергается информация, представленная дискретным сигналом. При этом различают следующие подходы1:
-
структурный. Измеряет количество информации простым подсчетом информационных элементов, составляющих сообщение. Применяется для оценки возможностей запоминающих устройств, объемов передаваемых сообщений, инструментов кодирования без учета статистических характеристик их эксплуатации.
-
Геометрическая мера - максимально возможное количество информации в заданных объемах
-
Комбинаторная мера - оценивает возможность представления информации при помощи различных комбинаций информационных элементов в заданном объеме. Использует типы комбинаций элементов и соответствующие математические соотношения, которые приводятся в одном из разделов дискретной математики – комбинаторике.
-
статистический. Учитывает вероятность появления сообщений: более информативным считается то сообщение, которое менее вероятно, т.е. менее всего ожидалось. Применяется при оценке значимости получаемой информации.
-
Вероятность. p(i)
-
Частная энтропия.
-
Условная энтропия Hn(S). Текст рассматривается как цепь Маркова, при этом возможны зависимости символов от K предыдущих. В случае K=0 имеет место норма Шеннона. При K=1 учитывается один предыдущий символ и т.д.
-
Термодинамическая мера. H0-H1
-
семантический. Учитывает целесообразность и полезность информации. Применяется при оценке эффективности получаемой информации и ее соответствия реальности.
-
Целесообразность информации (мера Винера). Количество I получаемой вместе с сообщением информации с позиций ее целесообразности определяется по формуле: I = log(p1/p2), где p1, p2 – вероятности достижения цели после и до получения сообщения, соответственно.
-
Полезность информации. Количество усваиваемой потребителем информации Iусв тесно связано с теми знаниями, которые имеет потребитель к моменту получения информации – с тезаурусом (ТЗ) потребителя.
-
Истинность информации. Эта мера оценивает информацию с позиций ее соответствия отображаемому источнику информации, т.е. реальному миру.
-
-
Измерение скорости передачи данных
Скорость передачи данных – отношение объема переданных данных к времени передачи. Единицы измерения – бит/с (и производные от него – байт/с, нат/с, дит/с и т.п.).
Бод (англ. baud) — единица измерения символьной скорости, количество изменений информационного параметра несущего периодического сигнала в секунду. Названа по имени Эмиля Бодо, изобретателя кода Бодо — кодировки символов для телетайпов.
Количество бод не всегда совпадает байт/с. При двоичном кодировании это почти одно и тоже, однако, использую квадратурную амплитудную модуляцию (КАМ), одним изменением уровня сигнала может кодироваться до 16 бит информации, таким образом при символьной скорости в N бод приблизиться к скорости передачи данных в 16N бит/с. Однако, не все так гладко – сигнал несет помимо полезной информации еще и служебную, управляющую. Поэтому, скорость передачи данных (эффективная скорость) не может совпадать в символьной скоростью.
-
Измерение знаний
Знание — в теории искусственного интеллекта, совокупность данных (у индивидуума, общества или у системы ИИ) о мире, включающих в себя информацию о свойствах объектов, закономерностях процессов и явлений, а также правилах использования этой информации для принятия решений. Правила использования включают систему причинно-следственных связей.
Главное отличие знаний от данных состоит в их активности, то есть появление в базе новых фактов или установление новых связей может стать источником изменений в принятии решений.
-
Метрики информации. Все те, что описаны выше, применительно к информации, может быть применено и к знаниям.
-
Метрики учебной информации2. Учебную информацию делят на N понятий и M умений. Каждое понятие делится на линки, а умения – на степы. Число усвоенных линков и степов, а также полностью освоенных понятий и умений – метрики учебной информации.
-
Метрика системы знаний.3 Система Знания оценивается по диапазону доступных уровней и рисунку распределения плотности (интегрирования) знания в системе. Оценка Квантовой Магии как Системы Знаний обнаруживает ее тенденции, которые зададут стратегию и тактику ее становления и развития и соотносит с другими Системами Знания.
1 http://www.klgtu.ru/ru/students/literature/inf_asu/290.html
2 И.В. Богданов. «Учебная информация и единицы ее измерения» (http://www.muh.ru/.Docs/niipo/10.htm?user=c31fba667ec9fe8589607f888a5d6d12)
3 С этажа на этаж. - Квантовая магия - Магия - современный взгляд. (http://fancy-work.ucoz.ru/publ/7-1-0-43)
Характеристики
Тип файла документ
Документы такого типа открываются такими программами, как Microsoft Office Word на компьютерах Windows, Apple Pages на компьютерах Mac, Open Office - бесплатная альтернатива на различных платформах, в том числе Linux. Наиболее простым и современным решением будут Google документы, так как открываются онлайн без скачивания прямо в браузере на любой платформе. Существуют российские качественные аналоги, например от Яндекса.
Будьте внимательны на мобильных устройствах, так как там используются упрощённый функционал даже в официальном приложении от Microsoft, поэтому для просмотра скачивайте PDF-версию. А если нужно редактировать файл, то используйте оригинальный файл.
Файлы такого типа обычно разбиты на страницы, а текст может быть форматированным (жирный, курсив, выбор шрифта, таблицы и т.п.), а также в него можно добавлять изображения. Формат идеально подходит для рефератов, докладов и РПЗ курсовых проектов, которые необходимо распечатать. Кстати перед печатью также сохраняйте файл в PDF, так как принтер может начудить со шрифтами.