Единицы измерения и хранения данных
Информации и способы её представления в вычислительной технике
Определения и основные свойства информации
Информация (от лат. informatio — осведомление, разъяснение, изложение) — в широком смысле абстрактное понятие, имеющее множество значений в зависимости от контекста. В узком смысле этого слова — сведения (сообщения, данные) независимо от формы их представления. В настоящее время не существует единого определения термина информация. С точки зрения различных областей знания, данное понятие описывается своим специфическим набором признаков.
Определения информации
1. Информация — совокупность данных, зафиксированных на материальном носителе, сохранённых и распространённых во времени и пространстве.[1]
2. Информация – это совокупность сведений (данных), которая воспринимается из окружающей среды (входная информация), выдается в окружающую среду (исходная информация) или сохраняется внутри определенной системы.
3. Информация – это продукт взаимодействия данных и адекватных им методов. Информация возникает в процессе взаимодействия данных и соответствующих методов.[2]
Свойства информации
1. Объективность информации. Информация объективна, если она не зависит от методов ее фиксации, чьего-либо мнения или суждения.
2. Достоверность информации. Информация достоверна, если она отражает истинное положение дел.
3. Полнота информации. Информацию является полной, если ее достаточно для понимания и принятия решений.
4. Точность информации определяется степенью ее близости к реальному состоянию объекта, процесса, явления.
5. Актуальность информации – важность для настоящего времени, злободневность, насущность.
6. Полезность (ценность) информации. Полезность может быть оценена применительно к нуждам потребителей и по отношению к результатам решения конкретных задач.
Сигналы и данные
Все физические объекты находятся в состоянии непрерывного движении или изменения, которое сопровождается обменом энергией и ее переходом из одной формы в другую. Энергообмен между объектами сопровождаются появлением сигналов. Все сигналы имеют в своей основе материальную энергетическую природу. При взаимодействии сигналов с физическими телами в последних возникают определенные изменения свойств — это явление называется регистрацией сигналов. Такие изменения можно наблюдать, измерять или фиксировать разными способами — при этом возникают и регистрируются новые сигналы, то есть образуются данные.
Данные — это зарегистрированные сигналы, совокупность сведений, зафиксированных на определенном носителе в форме, пригодной для постоянного хранения, передачи и обработки. Преобразование и обработка данных позволяет получить информацию.[3]
Единицы измерения и хранения данных
В информатике, как правило, измерению подвергается информация, представленная дискретным сигналом. При этом различают следующие подходы к оценке информации.
1. Структурный подход. Измеряет количество информации простым подсчетом информационных элементов, составляющих сообщение. Применяется для оценки возможностей запоминающих устройств или объемов передаваемых сообщений.
2. Статистический подход. Учитывает вероятность появления сообщений: более информативным считается то сообщение, которое менее вероятно, т.е. менее всего ожидалось. Применяется при оценке значимости получаемой информации.
3. Семантический подход. Учитывает целесообразность и полезность информации. Применяется при оценке эффективности получаемой информации и ее соответствия реальности.
На практике чаще используется структурный подход. При этом наименьшей единицей представления информации является бит(bit - binary digit), который может принимать только два значения (0/1 или да/нет).
Наименьшей единицей измерения является байт, поскольку одним байтом, как правило, кодируется один символ текстовой информации.
Более крупная единица измерения - килобайт (Кбайт). В килобайтах измеряют сравнительно небольшие объемы данных. Условно можно считать, что одна страница неформатированного машинописного текста составляет около 2 Кбайт.
Более крупные единицы измерения данных образуются добавлением префиксов мега, гига, тера.
1 Мбайт = 1024 Кбайт = 1020 байт
1 Гбайт = 1024 Мбайт = 1030 байт
1 Тбайт = 1024 Гбайт = 1040 байт
При хранении данных решаются две проблемы: как сохранить данные в наиболее компактном виде и как обеспечить к ним удобный и быстрый доступ. В качестве единицы хранения данных принят объект переменной длины, называемый файлом.
Файл — это последовательность произвольного числа байтов, обладающая уникальным собственным именем. Обычно в отдельном файле хранят данные, относящиеся к одному типу. В этом случае тип данных определяет тип файла.
Энтропия - мера измерения недостающей информации.
Энтропия (информационная) — мера хаотичности информации, неопределённость появления какого-либо символа первичного алфавита. При отсутствии информационных потерь численно равна количеству информации на символ передаваемого сообщения.
Информационная энтропия для независимых случайных событий X с N возможными состояниями (от 1 до N) рассчитывается по формуле:
,
где Х – дискретная случайная величина с диапазоном изменчивости N,
P(Xi) – вероятность i – го уровня X.
Операции с данными
Обработка данных включает в себя множество различных операций.
1. Сбор данных — накопление информации с целью обеспечения достаточной полноты для принятия решений.
2. Формализация данных — приведение данных из разных источников к одинаковой форме.
3. Фильтрация данных — отсеивание «лишних» данных.
4. Сортировка данных — упорядочение данных по заданному признаку.
5. Архивация данных — организация хранения данных в удобной и легкодоступной форме.
6. Защита данных — комплекс мер, направленных на предотвращение утраты, воспроизведения и модификации данных.
7. Транспортировка данных — прием и передача данных между удаленными участниками информационного процесса.
8. Преобразование данных — перевод данных из одной формы в другую или из одной структуры в другую.
Дата добавления: 2016-11-26; просмотров: 3099;