Что такое кодирование информации с точки зрения информации

Одно из основных достоинств компьютера связано с тем, что это удивительно универсальная машина. Каждый, кто хоть когда-нибудь с ним сталкивался, знает, что занятие арифметическими подсчетами составляет совсем не главный метод использования компьютера. Компьютеры прекрасно воспроизводят музыку и видеофильмы, с их помощью можно организовывать речевые и видеоконференции в Интернет, создавать и обрабатывать графические изображения, а возможность использования компьютера в сфере компьютерных игр на первый взгляд выглядит совершенно несовместимой с образом суперарифмометра, перемалывающего сотни миллионов цифр в секунду.

Составляя информационную модель объекта или явления, мы должны договориться о том, как понимать те или иные обозначения. То есть договориться о виде представления информации.

Человек выражает свои мысли в виде предложений, составленных из слов. Они являются алфавитным представлением информации. Основу любого языка составляет алфавит — конечный набор различных знаков (символов) любой природы, из которых складывается сообщение.

Одна и та же запись может нести разную смысловую нагрузку. Например, набор цифр 251299 может обозначать: массу объекта; длину объекта; расстояние между объектами; номер телефона; запись даты 25 декабря 1999 года.

Для представления информации могут использоваться разные коды и, соответственно, надо знать определенные правила — законы записи этих кодов, т.е. уметь кодировать.

Код — набор условных обозначений для представления информации.

Кодирование — процесс представления информации в виде кода.

Для общения друг с другом мы используем код — русский язык. При разговоре этот код передается звуками, при письме — буквами. Водитель передает сигнал с помощью гудка или миганием фар. Вы встречаетесь с кодированием информации при переходе дороги в виде сигналов светофора. Таким образом, кодирование сводиться к использованию совокупности символов по строго определенным правилам.

Кодировать информацию можно различными способами: устно; письменно; жестами или сигналами любой другой природы.

По мере развития техники появлялись разные способы кодирования информации. Во второй половине XIXвека американский изобретатель Сэмюэль Морзе изобрел удивительный код, который служит человечеству до сих пор. Информация кодируется тремя символами: длинный сигнал (тире), короткий сигнал (точка), нет сигнала (пауза) — для разделения букв.

Своя система существует и в вычислительной технике — она называется двоичным кодированиеми основана на представлении данных последовательностью всего двух знаков: 0 и 1. Эти знаки называютсядвоичными цифрами, по-английски -binary digit или сокращенноbit(бит).

Одним битом могут быть выражены два понятия: 0 или 1 (даилинет, черноеилибелое, истинаилиложьи т.п.). Если количество битов увеличить до двух, то уже можно выразить четыре различных понятия:

Тремя битами можно закодировать восемь различных значений:

000 001 010 011 100 101 110 111

Увеличивая на единицу количество разрядов в системе двоичного кодирования, мы увеличиваем в два раза количество значений, которое может быть выражено в данной системе, то есть общая формула имеет вид:

где N- количество независимых кодируемых значений;

m — разрядность двоичного кодирования, принятая в данной системе.

Что такое кодирование информации и ее обработка?

В мире идет постоянный обмен потоками информации. Источниками могут быть люди, технические устройства, различные вещи, объекты неживой и живой природы. Получать сведения может как один объект, так и несколько.

Кодирование информации на компьютере

Есть много способов обработки данных (тексты, числа, графика, видео, звук) с помощью компьютера. Вся информация, обрабатываемая компьютером, представлена в двоичном коде — с помощью цифр 1 и 0, называемых битами. Технически этот способ реализуется очень просто: 1 — электрический сигнал присутствует, 0 — отсутствует. С точки зрения человека, такие коды неудобны для восприятия — длинные строчки нулей и единиц, представляющие собой кодированные символы, очень сложно сходу расшифровать. Зато такой формат записи сразу наглядно показывает, что такое кодирование информации. Например, число 8 в двоичном восьмиразрядном виде выглядит как следующая последовательность бит: 000001000. Но то, что сложно человеку, просто компьютеру. Электронике проще обработать множество простых элементов, чем небольшое количество сложных.

Кодирование текстов

Когда мы нажимаем кнопку на клавиатуре, компьютер получает определенный код нажатой кнопки, ищет его в стандартной таблице символов ASCII (американский код для обмена информацией), «понимает» какая кнопка нажата и передает этот код для дальнейшей обработки (например, для отображения символа на мониторе). Для хранения символьного кода в двоичном виде используется 8 разрядов, поэтому максимальное число комбинаций равняется 256. Первые 128 символов используется под управляющие символы, цифры и латинские буквы. Вторая половина предназначается для национальных символов и псевдографики.

Кодирование текстов

Легче будет понять, что такое кодирование информации, на примере. Рассмотрим коды английского символа «С» и русской буквы «С». Заметим, что взяты символы заглавные, и их коды отличаются от строчных. Английский символ будет выглядеть как 01000010, а русский — 11010001. То, что для человека на экране монитора выглядит одинаково, компьютер воспринимает совершенно по-разному. Необходимо также обратить внимание на то, что коды первых 128 символов остаются неизменны, а начиная от 129 и далее одному двоичному коду могут соответствовать различные буквы в зависимости от используемой кодовой таблицы. К примеру, десятичный код 194 может соответствовать в КОИ8 букве «б», в СР1251 — «В», в ISO — «Т», а в кодировках СР866 и Мас вообще этому коду не соответствует ни один символ. Поэтому, когда при открытии текста мы вместо русских слов видим буквенную-символьную абракадабру, это означает, что такое кодирование информации нам не подходит и нужно выбрать другой конвертор символов.

Кодирование чисел

В двоичной системе исчисления берутся всего два варианта значения — 0 и 1. Все основные операции с двоичными числами использует наука под названием двоичная арифметика. Эти действия имеют свои особенности. Возьмем, к примеру, число 45, набранное на клавиатуре. Каждая цифра имеет свой восьмиразрядный код в кодовой таблице ASCII, поэтому число занимает два байта (16 бит): 5 — 01010011, 4 — 01000011 . Для того чтобы использовать это число в вычислениях, оно переводится по специальным алгоритмам в двоичную систему исчисления в виде восьмиразрядного двоичного числа: 45 — 00101101.

Кодирование и обработка графической информации

В 50-х годах на компьютерах, которые чаще всего использовались в научных и военных целях, впервые реализовали графическое отображение данных. Сегодня визуализация информации, получаемой от компьютера, является обычным и привычным для любого человека явлением, а в те времена это произвело необычайный переворот в работе с техникой. Возможно, сказалось влияние человеческой психики: наглядно представленная информация лучше усваивается и воспринимается. Большой рывок в развитии визуализации данных произошел в 80-х годах, когда кодирование и обработка графической информации получили мощное развитие.

Аналоговое и дискретное представление графики

Графическая информация бывает двух видов: аналоговая (живописное полотно с непрерывно изменяющимся цветом) и дискретная (картинка, состоящая из множества точек разного цвета). Для удобства работы с изображениями на компьютере их подвергают обработке — пространственной дискретизации, при которой каждому элементу назначается конкретное значение цвета в виде индивидуального кода. Кодирование и обработка графической информации похожи на работу с мозаикой, состоящей из большого количества мелких фрагментов. Причем качество кодирования зависит от размеров точек (чем меньше размер элемента — точек будет большее количество на единицу площади, — тем выше качество) и размера палитры используемых цветов (чем больше цветовых состояний может принимать каждая точка, соответственно, неся больше информации, тем лучше качество).

Создание и хранение графики

Есть несколько основных форматов изображений — векторный, фрактальный и растровый. Отдельно рассматривается сочетание растровой и векторной — широко распространенная в наше время мультимедийная 3D-графика представляющая собой приемы и методы построения трехмерных объектов в виртуальном пространстве. Кодирование и обработка графической и мультимедийной информации различна для каждого формата изображений.

Растровое изображение

Суть этого графического формата в том, что рисунок разбивается на мелкие разноцветные точки (пиксели). Верхняя левая точка контрольная. Кодирование графической информации всегда начинается с левого угла изображения построчно, каждый пиксель получает код цвета. Объем растровой картинки можно вычислить умножением количества точек на информационный объем каждого из них (который зависит от количества вариантов цвета). Чем выше разрешающая способность монитора, тем больше количество строк растра и точек в каждой строке, соответственно, выше качество изображения. Для обработки графических данных растрового типа можно использовать двоичный код, так как яркость каждой точки и координаты ее расположения можно представить в виде целых чисел.

Векторное изображение

Кодирование графической и мультимедийной информации векторного типа сводится к тому, что графический объект представляется в виде элементарных отрезков и дуг. Свойствами линии, являющейся базовым объектом, являются форма (прямая или кривая), цвет, толщина, начертание (пунктир или сплошная линия). Те линии, которые являются замкнутыми, обладают еще одним свойством — заполнение другими объектами или цветом. Положение объекта определяется точками начала и конца линии и радиусом искривления дуги. Объем графической информации векторного формата значительно меньше растрового, но требует специальных программ для просмотра графики этого типа. Существуют также программы — векторизаторы, преобразующие растровые изображения в векторные.

Фрактальная графика

Этот тип графики, как и векторный, основан на математических расчетах, но ее базовой составляющей является сама формула. В памяти компьютера нет необходимости хранить никаких изображений или объектов, сама картинка рисуется только по формуле. Графикой такого типа удобно визуализировать не только простые регулярные структуры, но и сложные иллюстрации, имитирующие, например, ландшафты в играх или эмуляторах.

Звуковые волны

Что такое кодирование информации, еще можно продемонстрировать на примере работы со звуком. Мы знаем, что наш мир переполнен звуками. С древних времен люди разобрались, как рождаются звуки — волны сжатого и разреженного воздуха, воздействующие на барабанные перепонки уха. Человек может воспринимать волны с частотой от 16 Гц до 20 кГц (1 Герц — одно колебание в секунду). Все волны, частоты колебаний которых попадают в этот диапазон, называются звуковыми.

Свойства звука

Характеристиками звука являются тон, тембр (окраска звука, зависящая от формы колебаний), высота (частота, которая определяется частотой колебаний в секунду) и громкость, зависящая от интенсивности колебаний. Любой реальный звук состоит из смеси гармонических колебаний с фиксированным набором частот. Колебание с самой низкой частотой называют основным тоном, остальные — обертонами. Особую окраску звуку придает тембр — различное количество обертонов, присущее именно этому звуку. Именно по тембру мы можем узнавать голоса близких людей, отличать звучание музыкальных инструментов.

Программы для работы со звуком

Условно программы по функционалу можно разделить на несколько видов: служебные программы и драйверы для звуковых плат, работающие с ними на низком уровне, аудио редакторы, которые производят различные операции со звуковыми файлами и применяют к ним различные эффекты, программные синтезаторы и преобразователи аналого-цифровые (АЦП) и цифро-аналоговые (ЦАП).

Кодирование звука

Кодирование мультимедийной информации состоит в преобразовании аналоговой природы звука в дискретную для более удобной ее обработки. АЦП получает на входе аналоговый сигнал, измеряет его амплитуду в определенные промежутки времени и выдает на выходе цифровую последовательность с данными об изменениях амплитуды. Никаких физических преобразований не происходит.

Выходной сигнал является дискретным, поэтому, чем чаще частота измерения амплитуды (сэмпл), тем точнее выходной сигнал соответствует входному, тем лучше проходит кодирование и обработка мультимедийной информации. Сэмплом также принято называть упорядоченную последовательность цифровых данных, полученных через АЦП. Сам процесс при этом называется сэмплированием, по-русски — дискретизацией.

Параметры дискретизации

Основными параметрами сэплирования являются не только частота измерения, но и разрядность — точность измерения изменения амплитуды за каждый сэмпл. Чем точнее передается при оцифровке значение амплитуды сигнала в каждую единицу времени, тем выше качество сигнала после АЦП, тем выше достоверность восстановление волны при обратном преобразовании.

1. Представление информации, языки, кодирование

Из базового курса известно:

— Историческое развитие человека, формирование человеческого общества связано с развитием речи, с появлением и распространением языков. Язык — это знаковая система для представления и передачи информации.

— Люди сохраняют свои знания в записях на различных носителях. Благодаря этому знания передаются не только в пространстве, но и во времени — от поколения к поколению.

— Языки бывают естественными , например, русский, китайский, английский, и формальные , например, математическая символика, нотная грамота, языки программирования. Естественные языки развивались веками и служат для общения людей между собой. Формальные языки разрабатываются для специальных применений.

— Каждый язык имеет свой алфавит . Под алфавитом языка понимают набор используемых символов. Под мощностью алфавита понимают количество составляющих алфавит символов.

Под словом « кодирование » понимают процесс представления информации, удобный для её хранения и/или передачи. Следовательно, запись текста на естественном языке можно рассматривать как способ кодирования речи с помощью графических элементов (букв, иероглифов). Записанный текст является кодом , заключающим в себе содержание речи, т. е. информацию.

Код — система условных знаков (символов), предназначенных для представления информации в соответствии с определенными правилами.

Кодирование — переход от одной формы представления информации к другой, наиболее удобной для её хранения, передачи или обработки.

Декодирование — процесс по восстановлению первоначальной формы представления информации, т. е. операция, обратная кодированию.

При кодировании ставятся разные цели и, соответственно, применяются различные способы кодирования.

Наиболее распространенные цели кодирования:

1) экономность (сократить запись);

2) надежность (засекретить информацию);

3) удобство обработки или восприятия .

Чаще всего кодированию подвергаются тексты на естественных языках (русском, английском и пр.).

Существуют три основных способа кодирования текста:

1) графический — с помощью специальных рисунков или значков;

2) числовой — с помощью чисел;

3) символьный — с помощью символов того же алфавита, что и исходный текст.

Процесс чтения текста — это обратный по отношению к письму процесс, при котором письменный текст преобразуется в устную речь. Чтение можно назвать декодированием письменного текста.

А теперь обратим внимание на то, что может существовать много способов кодирования одного и того же текста на одном и том же языке.

Русский текст мы привыкли записывать с помощью русского ал фавита. Но то же самое можно сделать, используя латинский алфавит. Иногда так приходится поступать, отправляя SMS по мобильному телефону, на котором нет русских букв, или электронное письмо на русском языке за границу, если у адресата нет русифицированного программного обеспечения. Например, фразу «Здравствуй, дорогой Саша!» приходится писать так: «Zdravstvui, dorogoi Sasha! ».

Существует множество способов кодирования. Например, стенография — быстрый способ записи устной речи. Ею владеют лишь немногие специально обученные люди — стенографисты. Они успевают записывать текст синхронно с речью выступающего человека. В стенограмме один значок обозначает целое слово или сочетание букв. Скорость стенографического письма превосходит скорость обычного в 4-7 раз. Р асшифровать (декодировать) стенограмму может только сам стенографист.

Пример стенографии, в которой написано следущее: «Говорить умеют все люди на свете. Даже у са мых примитивных племен есть речь. Язык — это нечто всеобщее и самое человеческое, что есть на свете»:

Приведённые примеры иллюстрируют следующее важное правило:

Для кодирования одной и той же информации могут быть использованы разные способы; их выбор зависит от ряда обстоятельств: цели кодирования, условий, имеющихся средств.

Если надо записать текст в темпе речи, делаем это с помощью стенографии; если надо передать текст за границу, пользуемся латинским алфавитом; если надо представить текст в виде, понятном для грамотного русского человека, записываем его по правилам грамматики русского языка.

Еще одно важное обстоятельство:

Выбор способа кодирования информации может быть связан с предполагаемым способом её обработки.

Обсудим это на примере представления чисел — количественной информации. Используя русский алфавит, можно записать число «тридцать пять». Используя же алфавит арабской десятичной системы счисления, пишем: \(35\). Пусть нам надо произвести вычисления. Скажи, какая запись удобнее для выполнения расчётов: «тридцать пять умножить на сто двадцать семь» или «\(35 х 127\)»? Очевидно, что для перемножения многозначных чисел вы будете пользоваться второй записью.

Заметим, что две эти записи, эквивалентные по смыслу, используют разные языки: первая — естественный русский язык, вторая — формальный язык математики, не имеющий национальной принадлежности. Переход от представления на естественном языке к представлению на формальном языке можно также рассматривать как кодирование. Человеку удобно использовать для кодирования чисел десятичную систему счисления, а компьютеру — двоичную систему.

В некоторых случаях возникает потребность засекречивания текста сообщения или документа для того, чтобы его не смогли прочитать те, кому не положено. Это называется защитой от несанкционированного доступа. В таком случае секретный текст шифруется. В давние времена шифрование называлось тайнописью.

Для осуществления шифрования используются специальные математические алгоритмы (криптоалгоритмы). Шифрование гарантирует защиту секретной информации от несанкционированного доступа со стороны третьих лиц. Для восстановления зашифрованной информации осуществляется обратное преобразование — расшифровка . Для расшифровки информации необходимо наличие соответствующего секретного ключа .

Подробнее об основных алгоритмах шифрования можно узнать здесь.

Шифрование — метод защиты любой информации от несанкционированного доступа, просмотра, а также её использования, основанный на преобразовании данных в зашифрованный формат.

Ключ — секретная информация, используемая криптографическим алгоритмом при шифровании/расшифровке сообщений.

Семакин И. Г. Информатика и ИКТ. Базовый уровень: учебник для 10-11 классов / И. Г. Семакин, Е. К. Хеннер. — 8-е изд. — М. : БИНОМ. Лаборатория знаний, 2012, стр. 13-15

Информатика и ИКТ. Задачник-практикум : в 2т. Т. 1 / Л. А. Залогова [и др.] ; под ред. И. Г. Семакина, Е. К. Хеннера. — 3-е изд. — М. : БИНОМ. Лаборатория знаний, 2011, стр. 10

Кодирование информации

Код — это набор условных обозначений (или сигналов) для записи (или передачи) некоторых заранее определенных понятий.

Кодирование информации – это процесс формирования определенного представления информации. В более узком смысле под термином «кодирование» часто понимают переход от одной формы представления информации к другой, более удобной для хранения, передачи или обработки.

Обычно каждый образ при кодировании (иногда говорят — шифровке) представлении отдельным знаком.

Знак — это элемент конечного множества отличных друг от друга элементов.

В более узком смысле под термином «кодирование» часто понимают переход от одной формы представления информации к другой, более удобной для хранения, передачи или обработки.

Компьютер может обрабатывать только информацию, представленную в числовой форме. Вся другая информация (например, звуки, изображения, показания приборов и т. д.) для обработки на компьютере должна быть преобразована в числовую форму. Например, чтобы перевести в числовую форму музыкальный звук, можно через небольшие промежутки времени измерять интенсивность звука на определенных частотах, представляя результаты каждого измерения в числовой форме. С помощью программ для компьютера можно выполнить преобразования полученной информации, например «наложить» друг на друга звуки от разных источников.

Аналогичным образом на компьютере можно обрабатывать текстовую информацию. При вводе в компьютер каждая буква кодируется определенным числом, а при выводе на внешние устройства (экран или печать) для восприятия человеком по этим числам строятся изображения букв. Соответствие между набором букв и числами называется кодировкой символов.

Как правило, все числа в компьютере представляются с помощью нулей и единиц (а не десяти цифр, как это привычно для людей). Иными словами, компьютеры обычно работают в двоичной системе счисления, поскольку при этом устройства для их обработки получаются значительно более простыми. Ввод чисел в компьютер и вывод их для чтения человеком может осуществляться в привычной десятичной форме, а все необходимые преобразования выполняют программы, работающие на компьютере.

Способы кодирования информации.

Одна и та же информация может быть представлена (закодирована) в нескольких формах. C появлением компьютеров возникла необходимость кодирования всех видов информации, с которыми имеет дело и отдельный человек, и человечество в целом. Но решать задачу кодирования информации человечество начало задолго до появления компьютеров. Грандиозные достижения человечества — письменность и арифметика — есть не что иное, как система кодирования речи и числовой информации. Информация никогда не появляется в чистом виде, она всегда как-то представлена, как-то закодирована.

Двоичное кодирование – один из распространенных способов представления информации. В вычислительных машинах, в роботах и станках с числовым программным управлением, как правило, вся информация, с которой имеет дело устройство, кодируется в виде слов двоичного алфавита.

Кодирование символьной (текстовой) информации.

Основная операция, производимая над отдельными символами текста — сравнение символов.

При сравнении символов наиболее важными аспектами являются уникальность кода для каждого символа и длина этого кода, а сам выбор принципа кодирования практически не имеет значения.

Для кодирования текстов используются различные таблицы перекодировки. Важно, чтобы при кодировании и декодировании одного и того же текста использовалась одна и та же таблица.

Таблица перекодировки — таблица, содержащая упорядоченный некоторым образом перечень кодируемых символов, в соответствии с которой происходит преобразование символа в его двоичный код и обратно.

Наиболее популярные таблицы перекодировки: ДКОИ-8, ASCII, CP1251, Unicode.

Исторически сложилось, что в качестве длины кода для кодирования символов было выбрано 8 бит или 1 байт. Поэтому чаще всего одному символу текста, хранимому в компьютере, соответствует один байт памяти.

Различных комбинаций из 0 и 1 при длине кода 8 бит может быть 28 = 256, поэтому с помощью одной таблицы перекодировки можно закодировать не более 256 символов. При длине кода в 2 байта (16 бит) можно закодировать 65536 символов.

Кодирование числовой информации.

Сходство в кодировании числовой и текстовой информации состоит в следующем: чтобы можно было сравнивать данные этого типа, у разных чисел (как и у разных символов) должен быть различный код. Основное отличие числовых данных от символьных заключается в том, что над числами кроме операции сравнения производятся разнообразные математические операции: сложение, умножение, извлечение корня, вычисление логарифма и пр. Правила выполнения этих операций в математике подробно разработаны для чисел, представленных в позиционной системе счисления.

Основной системой счисления для представления чисел в компьютере является двоичная позиционная система счисления.

Кодирование текстовой информации

В настоящее время, большая часть пользователей, при помощи компьютера обрабатывает текстовую информацию, которая состоит из символов: букв, цифр, знаков препинания и др. Подсчитаем, сколько всего символов и какое количество бит нам нужно.

10 цифр, 12 знаков препинания, 15 знаков арифметических действий, буквы русского и латинского алфавита, ВСЕГО: 155 символов, что соответствует 8 бит информации.

Единицы измерения информации.

1 Кбайт = 1024 байтам

1 Мбайт = 1024 Кбайтам

1 Гбайт = 1024 Мбайтам

1 Тбайт = 1024 Гбайтам

Суть кодирования заключается в том, что каждому символу ставят в соответствие двоичный код от 00000000 до 11111111 или соответствующий ему десятичный код от 0 до 255.

Необходимо помнить, что в настоящее время для кодировки русских букв используют пять различных кодовых таблиц (КОИ — 8, СР1251, СР866, Мас, ISO), причем тексты, закодированные при помощи одной таблицы не будут правильно отображаться в другой

Основным отображением кодирования символов является код ASCII — American Standard Code for Information Interchange- американский стандартный код обмена информацией, который представляет из себя таблицу 16 на 16, где символы закодированы в шестнадцатеричной системе счисления.

Кодирование графической информации.

Важным этапом кодирования графического изображения является разбиение его на дискретные элементы (дискретизация).

Основными способами представления графики для ее хранения и обработки с помощью компьютера являются растровые и векторные изображения

Векторное изображение представляет собой графический объект, состоящий из элементарных геометрических фигур (чаще всего отрезков и дуг). Положение этих элементарных отрезков определяется координатами точек и величиной радиуса. Для каждой линии указывается двоичные коды типа линии (сплошная, пунктирная, штрихпунктирная), толщины и цвета.

Растровое изображение представляет собой совокупность точек (пикселей), полученных в результате дискретизации изображения в соответствии с матричным принципом.

Матричный принцип кодирования графических изображений заключается в том, что изображение разбивается на заданное количество строк и столбцов. Затем каждый элемент полученной сетки кодируется по выбранному правилу.

Pixel (picture element — элемент рисунка) — минимальная единица изображения, цвет и яркость которой можно задать независимо от остального изображения.

В соответствии с матричным принципом строятся изображения, выводимые на принтер, отображаемые на экране дисплея, получаемые с помощью сканера.

Качество изображения будет тем выше, чем «плотнее» расположены пиксели, то есть чем больше разрешающая способность устройства, и чем точнее закодирован цвет каждого из них.

Для черно-белого изображения код цвета каждого пикселя задается одним битом.

Если рисунок цветной, то для каждой точки задается двоичный код ее цвета.

Поскольку и цвета кодируются в двоичном коде, то если, например, вы хотите использовать 16-цветный рисунок, то для кодирования каждого пикселя вам потребуется 4 бита (16=24), а если есть возможность использовать 16 бит (2 байта) для кодирования цвета одного пикселя, то вы можете передать тогда 216 = 65536 различных цветов. Использование трех байтов (24 битов) для кодирования цвета одной точки позволяет отразить 16777216 (или около 17 миллионов) различных оттенков цвета — так называемый режим “истинного цвета” (True Color). Заметим, что это используемые в настоящее время, но далеко не предельные возможности современных компьютеров.

Кодирование звуковой информации.

Из курса физики вам известно, что звук — это колебания воздуха. По своей природе звук является непрерывным сигналом. Если преобразовать звук в электрический сигнал (например, с помощью микрофона), мы увидим плавно изменяющееся с течением времени напряжение.

Для компьютерной обработки аналоговый сигнал нужно каким-то образом преобразовать в последовательность двоичных чисел, а для этого его необходимо дискретизировать и оцифровать.

Можно поступить следующим образом: измерять амплитуду сигнала через равные промежутки времени и записывать полученные числовые значения в память компьют

1.3. Представление и кодирование информации

Естественные и формальные языки. Для обмена информацией используются естественные и формальные языки. Основное отличие формальных языков от естественных состоит в том, что формальные языки имеют строгие правила составления слов и предложений. Эти правила называются синтаксисом. Примером естественных языков являются русский язык, английский, китайский и т.д. Примерами формальных языков являются языки программирования, системы счисления, азбука Морзе.

В основе любого языка лежит набор определенных символов (знаков), который называется алфавитом. Алфавит любого естественного языка состоит из букв или иероглифов. Алфавит формального языка может состоять как из букв и иероглифов, так и из других символов, например, точки и тире (азбука Морзе), цифр (системы счисления), скрипичные ключи (ноты) и т.д.

Представление информации. Символы и знаки, составляющие алфавит языка, могут быть представлены в различных формах. Например, для представления информации с использованием языка в письменной форме используются знаки, которые являются изображениями на бумаге или других носителях, в устной речи в качестве знаков используются различные звуки, а при обработке текста на компьютере знаки представляются в форме двоичных кодов (последовательностей электрических импульсов).

Кроме изображений, звуков и электрических импульсов существуют и другие формы представления информации, например:

— световые сигналы (цветомузыка);

— нервные импульсы (воздействие света, температуры на человека);

— магнитные записи (аудиокассеты, видеокассеты);

— жесты и мимика (язык глухонемых);

— запахи и вкусовые ощущения (информация о продукте питания);

— молекулы ДНК (генетическая информация) и т.д.

Кодирование информации. Часто при работе с информацией ее приходится переводить из одной формы представления в другую. Этот процесс называется кодированием.

Например, при вводе знака алфавита в компьютер путем нажатия соответствующей клавиши клавиатуры происходит кодирование информации, то есть преобразование знака в компьютерный код. При выводе знака на экран монитора происходит обратный процесс, когда компьютерный код знака преобразуется в его графическое изображение. Процесс восстановления данных в первичной форме называется декодированием.

Все виды информации в компьютере кодируются на машинном языке, в виде последовательностей нулей и единиц. Каждая цифра машинного двоичного кода несет информацию в 1 бит (так как всего есть два варианта – 0 и 1 – то при появлении одной из них неопределенность знаний уменьшается в два раза), по этому количество информации в битах равно количеству цифр двоичного машинного кода.

1. Чем отличаются естественные языки от формальных?

2. Язык жестов глухонемых является формальных или естественных?

3. В какой форме информация представлена в сети Интернет?

4. Почему каждая цифра машинного двоичного кода несет информацию в 1 бит?

1.4. Системы счисления

Системы счисления. Практически в любой информации, с которой приходится сталкиваться человеку, содержатся числа. Для записи чисел используются особые формальные языки. Эти языки называются системами счисления, в них числа записываются по определенным правилам с помощью символов некоторого алфавита. Символы алфавита системы счисления называются цифрами. Например, в десятичной системе счисления, с которой обычно работает человек, числа записываются с помощью десяти цифр: 0, 1, 2, 3, 4 , 5, 6, 7, 8, 9. В двоичной системе счисления используется только две цифры: 0 и 1, а в шестнадцатеричной системе кроме цифр десятичной системы счисления используются буквы латинского алфавита: A, B, C, D, E (эти буквы соответствуют цифрам 11, 12, 13, 14, 15).

Все системы счисления делятся на позиционные и непозиционные. В позиционных системах счисления значение цифры зависит от ее положения в числе, а в непозиционных – не зависит.

Римская система счисления. Самой известной непозиционной системой счисления является римская. В качестве цифр в ней используются следующие буквы латинского алфавита: I (соответствует значению 1), V (5), X (10), L (50), C (100), D (500), M (1000). Так как римская система счисления непозиционная, то значение цифры не зависит от ее положения в числе. Например, в числе XX цифра X встречается два раза, и каждый раз обозначает одну и ту же величину – число 10. Тогда число XX будет равно 20 (10+10).

Величина числа в римской системе счисления определяется как сумма или разность цифр в числе. Если меньшая цифра стоит слева от большей, то она вычитается, если справа – прибавляется.

Задача 1.15. Перевести из римской системы счисления в десятичную:

в) MMDCCCLXXVII; г) MCDXLV.

а) В данном числе всего две цифры, причем цифра, стоящая справа меньше. Это значит, что значением числа будет сумма этих цифр: XV=10+5=15.

б) Если количество цифр в числе больше 2, то начинаем перевод с первых двух чисел – XI. Так как меньшая цифра стоит правее, то первая цифра будет обозначать свое значение – 10. Первую цифру отбрасываем, и дальше будем рассматривать следующие две цифры – IX. Так как в этом случае меньшая цифра стоит левее, то значение этих двух цифр будет равно разности 10 – 1=9. Таким образом, получили, что число XIX=10+(10 – 1)=19.

в) Начинаем с первых двух цифр – MM. Так цифры одинаковые (главное, что цифра, стоящее правее не больше), то значение первой цифры будет равно 1000. Первую цифру отбрасываем и дальше рассматриваем следующие две цифры – MD. В этом случае снова цифра, стоящая правее, не больше цифры, стоящей левее. Значит, вторая цифра так же будет равна своему значению (1000). Рассматриваем следующие две цифры – DC. Продолжая процесс заметим, что все цифры числа расположены в неубывающем порядке. Значит, MMDCCCLXXVII=1000+1000+500+100+100+100+50+10+10+5+1+1=2877.

г) Начинаем с первых двух цифр – MC. Правая цифра меньше, значит, первая цифра равна 1000. Рассматриваем следующие две цифры – CD. Так как права цифра больше, то вместе эти две цифры будут равны 500–100 =400. Отбрасываем обе эти цифры, рассматриваем следующие – XL. Правая цифра больше, поэтому вместе эти цифры будет равны 50–10=40. Отбрасывает обе эти цифры. Осталась одна цифра, которая будет равна своему значению (5). Таким образом, получили, что MCDXLV=1000+400+40+5=1445.

Ответы: а) 15; б) 19; в) 2887; г) 1445. 

При переводе из десятичной системы счисления в римскую стоит учитывать, что разряды, начинающиеся с цифр 4 и 9, записывают в виде сочетания двух цифр римской системы: 4=IV, 9=IX, 40=XL, 90=XC, 400=CD, 900=CM.

Задача 1.16. Перевести из десятичной системы счисления в римскую:

а) 2589; б) 694; в) 1999.

Перевод из десятичной системы счисления в римскую намного проще. В этом случае достаточно просто перевести все разряды слева направо в римскую систему счисления и полученные результаты соединить.

а) Разложим данное число на разряды: 2589=2000+500+80+9. Переведем каждый разряд в римскую систему счисления: 2000=1000+1000=ММ, 500=D, 80=50+10+10+10=LXXX, 9=IX. Тогда данное число будет равно: 2589=MMDLXXXIX.

б) Проделаем аналогичные действия: 694=600+90+4. 600=500+100=DC, 90=XC, 4=IV. Получим 694=DCXCIV.

в) 1999=1000+900+90+9. 1000=M, 900=CM, 90=XC, 9=IX. 1999=MCMXCIX.

Ответы: а) MMDLXXXIX; б) DCXCIV; в) MCMXCIX. 

Позиционные системы счисления. Каждая позиционная система счисления имеет определенный алфавит и основание. Основание позиционной системы счисления равно количеству цифр алфавита. То есть, в десятичной системе счисления основание равно 10, в двоичной – 2, в восьмеричной – 8 и т.п.

В позиционных системах счисления количественное значение цифры зависит от ее позиции в числе. Например, в десятичной системе счисления первая цифра справа обозначается количество единиц, вторая – количество десятков, третья – количество сотен и т.д. Если в соседних позициях стоят одинаковые цифры, то значениях этих цифр отличаются в десять раз (в двоичной системе в два раза, в восьмеричной – в восемь).

В общем случае цифра а, стоящая в разряде n, равна аg n -1 , где g – основание системы счисления. Действительно, цифра 4, стоящая в третьем разряде числа, записанного в десятичной системе счисления равна 410 3-1 =400.Очевидно, что любое число, можно разложить в виде суммы значений цифр (например, 5678=5000+600+70+8). А каждое значение цифры можно записать в виде аg n -1 (5000=510 3 , 600=610 2 ,70=710 1 , 8=810 0 ).Это значит, что каждое число можно записать в так называемом развернутом виде (форме) (5678=510 3 +610 2 +710 1 +810 0 ). Дробное число 78,52 в развернутом виде запишется следующим образом 710 1 +810 0 +510 -1 +210 -2 . Привычная для нас форма записи числе называется свернутая.

Стоит отметить важное свойство позиционных систем счисления: если число умножить (разделить) на основание системы счисления, то запятая, отделяющая целую часть от дробной, переместится на один разряд вправо (влево). Например, 25,6710=256,7.

Самой распространенной позиционной системой счисления является десятичная. Мы не будем подробно останавливаться на этой системе счисления, так как она достаточно подробно изучается в курсе математики средней школы. Из других позиционных систем счисления наиболее распространенными являются двоичная, восьмеричная и шестнадцатеричная.

Двоичная система счисления. Алфавит двоичной системы состоит из двух цифр (0 и 1), а значит основание равно 2. То что, число записано в двоичной системе счисления указывается нижним индексом 2 справа (11101₂). Если индекс у числа не стоит, то считается, что оно записано в десятичной системе. Любое число двоичной системы счисления можно записать в развернутой форме в виде суммы степеней числа 2 с коэффициентами, в качестве которых выступают цифры 0 и 1. Например, 1101₂=12 3 +12 2 +02 1 +12 0 .

Умножение (деление) двоичного числа на 2 приведет к перемещению запятой на один разряд вправо (влево). Например, 101,01₂2=1010,1₂.

Позиционные системы счисления с произвольным основанием. Рассмотрим произвольную систему счисления с основанием g (g>1). В этой системе счисления алфавит состоит из g цифр: 0,1,…,g-2,g-1. Если g 10, то тогда для записи цифр, больших 9, используются буквы латинского алфавита. Цифра А равна 10, цифра В – 11, цифра С – 12 и т.д.

Если g=16 (шестнадцатеричная система счисления), то в качестве цифр будут использоваться буквы А, В, С, D, E и F. Число в шестнадцатеричной системе может выглядеть следующим образом: 6С4А₁₆. Это число в развернутом виде запишется так 616 3 +С16 2 +416 1 +А16 0 или 616 3 +1216 2 +416 1 +1016 0 .

Перевод чисел в десятичную систему счисления. Для перевода числа из недесятичной системы счисления в десятичную достаточно записать число в развернутой форме и вычислить его значение.

Задача 1.17. Перевести числа в десятичную систему счисления:

Запишем данные числа в развернутой форме и вычислим их значения.

а) 10101,01₂=12 4 +02 3 +12 2 +02 1 +12 0 +02 -1 +12 -2 =16+0+4+0+1+0+0,25= 21,25.

б) 2547,7=28 3 +58 2 +48 1 +78 0 +78 -1 =1024+320+32+7+0,875=1383,875.

в) A1D,E₁₆=A16 2 +116 1 +D16 0 +E16 -1 =1016 2 +116 1 +1316 0 +1416 -1 = 2560+16+13+0,875= 2589,875.

Ответы: а) 21,25; б) 1383,875; в) 2589,875. 

Перевод целых чисел из десятичной системы счисления. Перевод чисел из десятичной системы счисления в недесятичную более сложен и может осуществляться различными способами.

Кодирование информации

Код — система условных знаков (символов) для передачи, обработки и хранения информации (сообщения).

Кодирование — процесс представления информации (сообщения) в виде кода.

Все множество символов, используемых для кодирования, называется алфавитом кодирования. Например, в памяти компьютера любая информация кодируется с помощью двоичного алфавита, содержащего всего два символа: 0 и 1.

Научные основы кодирования были описаны К.Шенноном, который исследовал процессы передачи информации по техническим каналам связи (теория связи, теория кодирования). При таком подходе кодирование понимается в более узком смысле: как переход от представления информации в одной символьной системе к представлению в другой символьной системе. Например, преобразование письменного русского текста в код азбуки Морзе для передачи его по телеграфной связи или радиосвязи. Такое кодирование связано с потребностью приспособить код к используемым техническим средствам работы с информацией (см. “Передача информации”).

Декодирование — процесс обратного преобразования кода к форме исходной символьной системы, т.е. получение исходного сообщения. Например: перевод с азбуки Морзе в письменный текст на русском языке.

В более широком смысле декодирование — это процесс восстановления содержания закодированного сообщения. При таком подходе процесс записи текста с помощью русского алфавита можно рассматривать в качестве кодирования, а его чтение — это декодирование.

Цели кодирования и способы кодирования

Способ кодирования одного и того же сообщения может быть разным. Например, русский текст мы привыкли записывать с помощью русского алфавита. Но то же самое можно сделать, используя английский алфавит. Иногда так приходится поступать, посылая SMS по мобильному телефону, на котором нет русских букв, или отправляя электронное письмо на русском языке из-за границы, если на компьютере нет русифицированного программного обеспечения. Например, фразу: “Здравствуй, дорогой Саша!” приходится писать так: “Zdravstvui, dorogoi Sasha!”.

Существуют и другие способы кодирования речи. Например, стенография — быстрый способ записи устной речи. Ею владеют лишь немногие специально обученные люди — стенографисты. Стенографист успевает записывать текст синхронно с речью говорящего человека. В стенограмме один значок обозначал целое слово или словосочетание. Расшифровать (декодировать) стенограмму может только стенографист.

Приведенные примеры иллюстрируют следующее важное правило: для кодирования одной и той же информации могут быть использованы разные способы; их выбор зависит от ряда обстоятельств: цели кодирования, условий, имеющихся средств. Если надо записать текст в темпе речи — используем стенографию; если надо передать текст за границу — используем английский алфавит; если надо представить текст в виде, понятном для грамотного русского человека, — записываем его по правилам грамматики русского языка.

Еще одно важное обстоятельство: выбор способа кодирования информации может быть связан с предполагаемым способом ее обработки. Покажем это на примере представления чисел — количественной информации. Используя русский алфавит, можно записать число “тридцать пять”. Используя же алфавит арабской десятичной системы счисления, пишем: “35”. Второй способ не только короче первого, но и удобнее для выполнения вычислений. Какая запись удобнее для выполнения расчетов: “тридцать пять умножить на сто двадцать семь” или “35 х 127”? Очевидно — вторая.

Однако если важно сохранить число без искажения, то его лучше записать в текстовой форме. Например, в денежных документах часто сумму записывают в текстовой форме: “триста семьдесят пять руб.” вместо “375 руб.”. Во втором случае искажение одной цифры изменит все значение. При использовании текстовой формы даже грамматические ошибки могут не изменить смысла. Например, малограмотный человек написал: “Тристо семдесять пят руб.”. Однако смысл сохранился.

В некоторых случаях возникает потребность засекречивания текста сообщения или документа, для того чтобы его не смогли прочитать те, кому не положено. Это называется защитой от несанкционированного доступа. В таком случае секретный текст шифруется. В давние времена шифрование называлось тайнописью. Шифрование представляет собой процесс превращения открытого текста в зашифрованный, а дешифрование — процесс обратного преобразования, при котором восстанавливается исходный текст. Шифрование — это тоже кодирование, но с засекреченным методом, известным только источнику и адресату. Методами шифрования занимается наука под названием криптография (см. “Криптография”).

История технических способов кодирования информации

С появлением технических средств хранения и передачи информации возникли новые идеи и приемы кодирования. Первым техническим средством передачи информации на расстояние стал телеграф, изобретенный в 1837 году американцем Сэмюэлем Морзе. Телеграфное сообщение — это последовательность электрических сигналов, передаваемая от одного телеграфного аппарата по проводам к другому телеграфному аппарату. Эти технические обстоятельства привели С.Морзе к идее использования всего двух видов сигналов — короткого и длинного — для кодирования сообщения, передаваемого по линиям телеграфной связи.

Сэмюэль Финли Бриз Морзе (1791–1872), США

Такой способ кодирования получил название азбуки Морзе. В ней каждая буква алфавита кодируется последовательностью коротких сигналов (точек) и длинных сигналов (тире). Буквы отделяются друг от друга паузами — отсутствием сигналов.

Самым знаменитым телеграфным сообщением является сигнал бедствия “SOS” (Save Our Souls — спасите наши души). Вот как он выглядит в коде азбуки Морзе, применяемом к английскому алфавиту:

Три точки (буква S), три тире (буква О), три точки (буква S). Две паузы отделяют буквы друг от друга.

На рисунке показана азбука Морзе применительно к русскому алфавиту. Специальных знаков препинания не было. Их записывали словами: “тчк” — точка, “зпт” — запятая и т.п.

Характерной особенностью азбуки Морзе является переменная длина кода разных букв, поэтому код Морзе называют неравномерным кодом. Буквы, которые встречаются в тексте чаще, имеют более короткий код, чем редкие буквы. Например, код буквы “Е” — одна точка, а код твердого знака состоит из шести знаков. Это сделано для того, чтобы сократить длину всего сообщения. Но из-за переменной длины кода букв возникает проблема отделения букв друг от друга в тексте. Поэтому приходится для разделения использовать паузу (пропуск). Следовательно, телеграфный алфавит Морзе является троичным, т.к. в нем используется три знака: точка, тире, пропуск.

Равномерный телеграфный код был изобретен французом Жаном Морисом Бодо в конце XIX века. В нем использовалось всего два разных вида сигналов. Не важно, как их назвать: точка и тире, плюс и минус, ноль и единица. Это два отличающихся друг от друга электрических сигнала. Длина кода всех символов одинаковая и равна пяти. В таком случае не возникает проблемы отделения букв друг от друга: каждая пятерка сигналов — это знак текста. Поэтому пропуск не нужен.

Жан Морис Эмиль Бодо (1845–1903), Франция

Код Бодо — это первый в истории техники способ двоичного кодирования информации. Благодаря этой идее удалось создать буквопечатающий телеграфный аппарат, имеющий вид пишущей машинки. Нажатие на клавишу с определенной буквой вырабатывает соответствующий пятиимпульсный сигнал, который передается по линии связи. Принимающий аппарат под воздействием этого сигнала печатает ту же букву на бумажной ленте.

В современных компьютерах для кодирования текстов также применяется равномерный двоичный код (см. “Системы кодирования текста”).

Методические рекомендации

Тема кодирования информации может быть представлена в учебной программе на всех этапах изучения информатики в школе.

В пропедевтическом курсе ученикам чаще предлагаются задачи, не связанные с компьютерным кодированием данных и носящие, в некотором смысле, игровую форму. Например, на основании кодовой таблицы азбуки Морзе можно предлагать как задачи кодирования (закодировать русский текст с помощью азбуки Морзе), так и декодирования (расшифровать текст, закодированный с помощью азбуки Морзе).

Выполнение таких заданий можно интерпретировать как работу шифровальщика, предлагая различные несложные ключи шифрования. Например, буквенно-цифровой, заменяя каждую букву ее порядковым номером в алфавите. Кроме того, для полноценного кодирования текста в алфавит следует внести знаки препинания и другие символы. Предложите ученикам придумать способ для отличия строчных букв от прописных.

При выполнении таких заданий следует обратить внимание учеников на то, что необходим разделительный символ — пробел, поскольку код оказывается неравномерным: какие-то буквы шифруются одной цифрой, какие-то — двумя.

Предложите ученикам подумать о том, как можно обойтись без разделения букв в коде. Эти размышления должны привести к идее равномерного кода, в котором каждый символ кодируется двумя десятичными цифрами: А — 01, Б — 02 и т.д.

Подборки задач на кодирование и шифрование информации имеются в ряде учебных пособий для школы [4].

В базовом курсе информатики для основной школы тема кодирования в большей степени связывается с темой представления в компьютере различных типов данных: чисел, текстов, изображения, звука (см. “Информационные технологии” ).

В старших классах в содержании общеобразовательного или элективного курса могут быть подробнее затронуты вопросы, связанные с теорией кодирования, разработанной К.Шенноном в рамках теории информации. Здесь существует целый ряд интересных задач, понимание которых требует повышенного уровня математической и программистской подготовки учащихся. Это проблемы экономного кодирования, универсального алгоритма кодирования, кодирования с исправлением ошибок. Подробно многие из этих вопросов раскрываются в учебном пособии “Математические основы информатики” [1].

1. Андреева Е.В., Босова Л.Л., Фалина И.Н. Математические основы информатики. Элективный курс. М.: БИНОМ. Лаборатория Знаний, 2005.

2. Бешенков С.А., Ракитина Е.А. Информатика. Систематический курс. Учебник для 10-го класса. М.: Лаборатория Базовых Знаний, 2001, 57 с.

3. Винер Н. Кибернетика, или Управление и связь в животном и машине. М.: Советское радио, 1968, 201 с.

4. Информатика. Задачник-практикум в 2 т. / Под ред. И.Г. Семакина, Е.К. Хеннера. Т. 1. М.: БИНОМ. Лаборатория Знаний, 2005.

5. Кузнецов А.А., Бешенков С.А., Ракитина Е.А., Матвеева Н.В., Милохина Л.В. Непрерывный курс информатики (концепция, система модулей, типовая программа). Информатика и образование, № 1, 2005.

6. Математический энциклопедический словарь. Раздел: “Словарь школьной информатики”. М.: Советская энциклопедия, 1988.

7. Фридланд А.Я. Информатика: процессы, системы, ресурсы. М.: БИНОМ. Лаборатория Знаний, 2003.

Источники:

http://fb.ru/article/236949/chto-takoe-kodirovanie-informatsii-i-ee-obrabotka
http://www.yaklass.ru/p/informatika/10-klass/informatciia-i-informatcionnye-protcessy-11955/kodirovanie-informatcii-11899/re-9dab4961-d1c0-4168-b17e-53b36fe80ae2
http://www.kazedu.kz/referat/84695
http://studfiles.net/preview/3795806/page:3/
http://xn----7sbbfb7a7aej.xn--p1ai/informatika_kabinet/inf_prozes/inf_prozes_12.html