Проектирование распределенных информационных систем - Елена Чернопрудова
Шрифт:
Интервал:
Закладка:
Данными называют описание в сознании человека предметов, событий и явлений окружающего мира. Существуют три основных формы описания и дальнейшего представления данных:
– символьная;
– текстовая;
– графическая.
Символьная форма, основанная на использовании символов – букв, цифр, знаков, является наиболее простой, но она практически применяется только для передачи несложных сигналов и различных событий. (Например – сигналы светофора).
Более сложной является текстовая форма, в которой, как и в предыдущей форме, используются символы – буквы, цифры, математические знаки. Однако информация заложена не только в этих символах, но и в их сочетании, порядке следования. Удобство текстовой информации обусловлено взаимосвязью текста и речи человека.
Самой емкой и сложной является графическая форма представления информации. К этой форме относятся виды природы, фотографии, чертежи, схемы, рисунки.
Говоря о формах информации важно еще раз подчеркнуть свойство нематериальной информации – для ее существования обязательно должен быть какойлибо материальный объект: свет, воздух, вода, электрический ток, эфир электромагнитных колебаний и т.д.
Итак, носителем информации может быть как непосредственно наблюдаемый физический объект, так и энергетический субстрат. В последнем случае информация представлена в виде сигналов световых, звуковых, электрических и т.д. При отображении на носителе информация кодируется, т.е. ей ставится в соответствие форма, цвет, структура и другие параметры элементов носителя.
Примеры:
1 Почему человек различает цвета воспринимаемого изображения?
Потому, что простой белый цвет имеет частотные составляющие спектры электромагнитных колебаний для цветов: красного, оранжевого, желтого, зеленого, голубого, синего, фиолетового. Сетчатка глаз способна различать частотные спектры цветности и сообщать сведения в мозг человека.
2 Книга – носитель кодированной последовательности букв, цифр, символов, графики. Читая книгу, мы как раз и воспринимаем информацию, записанную на ее страницах, в виде кодовых комбинаций (слов), состоящих из последовательности символов (букв, цифр) принятого алфавита. То же самое можно сказать и относительно информации, сообщаемой в процессе устной речи.
В теории информации особого внимания заслужила наиболее стандартная и единая форма представления информации – двоичная форма. Она заключается в записи любой информации в виде последовательности только двух символов: 1, или «да», или «истина»; 0, или «нет», или «ложь». В ЭВМ эти символы обозначаются наличием либо отсутствием в рассматриваемой точке электрического или магнитного импульса. В этом случае реквизитом информации, т.е. самой малой порцией информации (меньше не может быть) является ответ на любой вопрос в виде «да» или «нет». Эта порция определяет единицу измерения информации, называемую «битом». Последовательность битов может иметь различную разрядность. Запись нулей и единиц производится по правилам кодирования, используемых в ЭВМ.
Поясняя определение данных, мы непроизвольно стали использовать термин информация. Уясним взаимосвязь этих двух терминов.
Мы с вами уяснили, что информация – это первичное понятие, точного определения которого не существует.
Существует четыре основных направлений толкования термина информация:
1 Информация – это смысл полученного сообщения, его интерпретация. Пример учителя и ученика. Учитель имеет информацию о предмете. С помощью сообщений (рассказ с показом, демонстрация) передает ученику сведения, данные. Ученик получает сообщения и усваивает их. То, что он понял со своей точки зрения и есть информация. Степень адекватности реальному образу проверяется учителем контрольным опросом. В этом отношении компьютер никогда не оценивает смысл информации, ему все равно с какими данными работать. Только человек имеет возможность получить информацию на основе данных компьютера.
2 Информация – это как содержание сообщений, так и само сообщение, данные. В этом смысле примером может служить книга с ценными для потребителя сведениями, газета, кодограмма и т.п.
3 Некоторые ученые и, прежде всего, философы считают, что информация – это третья составляющая основ мироздания (материя, энергия и информация).
Н. Винер в одной из работ написал: «Информация и есть информация, а не материя и энергия».
4 4 В математической теории информации понятие информация определяется только для случайных событий. В этом отношении информация – это то, что уменьшает неопределенность события.
Приведем пример: Компьютер с помощью генератора случайных чисел выдал число от 1 до 16. Наша задача угадать это число. Мы задаем вопросы компьютеру, а он отвечает «да» (истина, 1) или «нет» (ложь, 0). За какое минимальное количество вопросов можно отгадать число? Сколько нужно информации, чтобы угадать загаданное число? Неопределенность равна 16. Первый вопрос: задуманное число меньше 8? Ответ «да» или «нет» уменьшает неопределенность в два раза и мы получаем информацию, равную одному биту. Если число находится в пределах от 1 до 8, то мы задаем вопрос: число меньше 4? Получаем ответ и еще один бит информации и т.д. Итого, количество информации, необходимое для угадывания числа равно 4 битам.
Подведем итоги и решим проблемный вопрос в однозначном понятии информации:
1 Под словом «информация» (в переводе с латинского «Jnformation») понимается разъяснение, изложение, чего-либо, сообщение о чем-либо.
2 Ответьте на вопрос – материальна или нематериальна информация? Будем понимать так, информация не материальна, но информация является свойством материи и не может существовать без своего материального носителя – средства переноса ее в пространстве и во времени.
Рассмотрим взаимосвязь двух понятий – данных и информации. Если рассматривать процесс передачи данных от источника данных до потребителя (рисунок 1.8), то можно сделать вывод о том, что источник в виде базы данных содержит большое количество различных и неупорядоченных данных, а потребителю информации нужна определенная и необходимая ему информация о конкретной предметной области.
Рисунок 1.8 – Взаимосвязь данных и информации
Исходя из данной взаимосвязи мы можем дать свое определение информации. Информация – это необходимые для получателя данные, переданные по каналу связи от источника данных своевременно и достоверно.
Количество и качество информации – как их анализировать?
В предыдущем разделе мы дали определение информации исходя из взаимосвязи данных и информации, при этом указали два показателя качества информации – достоверность и своевременность. Возникает проблемный вопрос – как анализировать и оценивать качество и количество информации.
В свете идей науки о знаковых системах – семиотики адекватность информации, т.е. соответствие содержания образа отображаемому объекту, может выражаться в трех формах: синтаксический, семантический и прагматический.
Синтаксическая адекватность связана с воспроизведением формально-структурных характеристик отражения независимо от смысловых и потребительских (полезностных) параметров объекта. На синтаксическом уровне учитываются тип носителя и способ представления информации, скорость ее передачи и обработки, размеры кодов представления информации, надежность и точность преобразования этих кодов и т.п. Информацию, рассматриваемую только с синтаксических позиций, обычно называют данными.
Семантическая адекватность выражает аспект соответствия образа, знака и объекта, т.е. отношение информации и ее источника. Проявляется семантическая информация при наличии единства информации (объекта) и пользователя. Семантический аспект имеет в виду учет смыслового содержания информации; на этом уровне анализируются те сведения, которые отражает информация, рассматриваются смысловые связи между кодами представления информации.
Прагматическая адекватность отражает отношение информации и ее потребителя, соответствие информации цели управления, которые на ее основе реализуется. Прагматический аспект связан с ценностью, полезностью использования информации для выработки правильного управленческого решения. С этой точки зрения анализируются потребительские свойства информации.
Три формы адекватности информации соответствуют трем ступеням познания истины, сформулированным философами: «От живого созерцания к абстрактному мышлению и от него к практике – таков диалектический путь познания истины, познания объективной реальности». Первая ступень соответствует восприятию внешних структурных характеристик, т.е. синтаксической стороны информации; вторая – ступень формирования понятий и представлений, выявления смысла, содержания информации и ее обобщения; третья – непосредственно связана с практическим использованием информации в соответствии ее целевой функции деятельности системы. В соответствии с тремя формами адекватности выполняется и измерение информации. Терминологически принято говорить о количестве информации и об объеме данных. Объем данных в сообщении измеряется количеством символов (разрядов) принятого алфавита в этом сообщении. Часто информация кодируется числовыми кодами в той или иной системе счисления. Естественно, что одно и то же количество разрядов в разных системах счисления может передать разное число состояний отображаемого объекта.