15.10.2019

ЦБ РФ

USD

15.10

64,37

 

0,14

14.10

64,22

 

EUR

15.10

70,93

 

0,20

14.10

70,73

Coinmarketcap

BTC 8324.42

ETH 184.202

XRP 0.29273

BCH 226.211

LTC 55.9208

ADA 0.04111

Кодирование текстовой информации в памяти компьютера, декодирование

Кодирование текстовой информации в памяти компьютера, декодирование

Что такое кодирование?

Процесс, при котором передаётся информация между человеком и компьютером, между несколькими компьютерами либо несколькими людьми, происходитс помощью различных форм.

Люди общаются между собой на понятном для них языке, используя при этом буквенный алфавит. Для восприятия компьютером информации, которую ему передаёт человек, нужно язык человека преобразовать в язык, понятный компьютеру, то есть, произвести её кодирование.

Таким образом, кодирование – это такой процесс, при котором происходит трансформация информации одной системы знаков в другую.

Что такое декодирование?

Декодирование, наоборот, трансформирует закодированную первоначальную информацию в исходную форму, понятную человеку. Это обратный кодированию процесс. Он известен уже давно.

Как пример постоянного декодирования можно привести азбуку Морзе. Она передаёт сообщения кодами. Чтобы их можно было прочесть, нужно выполнить преобразования кода в язык, понятный человеку, то есть в слова.

Двоичный код кодировки

Кодирование информации производится не только на компьютере, но и на всей электронной технике. К ней относятся и смартфоны, и планшеты, и ноутбуки, и прочие устройства. Для преобразования в них информации используется двоичный код, то есть код, состоящий из двух символов – «0» и «1».

Сегодня известно множество кодов, и у каждого их них есть свой алфавит. Вся вводимая в компьютер информация кодируется. Чтобы человек ни делал (писал текст, печатал, рисовал, создавал файлы, играл в игры), всё превращается в компьютере в определённый набор из нолей и единиц.

Для того, чтобы закодированная информация могла появиться на экране компьютера в понятном человеку виде, в системе проводится декодирование. Числовая последовательность преобразуется в понятные для восприятия человека буквы, цифры и знаки. Оба процесса, кодирование и декодирование, происходят мгновенно, за доли секунды.

Сегодня для кодирования информации в памяти компьютеров используют двоичный код – это самый простой способ кодирования. Специальные программы преобразуют информацию в числовую последовательность и хранят её в памяти компьютера. При необходимости вывести её на экран, трансформируют в форму, понятную нам.

Чтобы представить слова, цифры и символы в числовой последовательности, используются специальные таблицы перевода. В них каждой букве латиницы, цифре и символу соответствует определённый числовой ряд из «0» и «1». В таблице можно увидеть, что двоичный код содержит 8 разрядов.

Но для преобразования информации из одной системы языков в другую существует алфавит, состоящий из 256 символов, он считается достаточным. Значит, у каждого символа свой десятичный код от 0 до 256, что соответствует двоичному коду от 00000000 до 11111111. Таким образом, любую информацию можно представить в виде символов.

Любой человек может, пользуясь таблицей, закодировать какую-либо фразу и посмотреть, как она будет выглядеть в компьютере. Программы, которые проводят кодирование и декодирование информации, называются кодировщиками.

Таблица кодирования символов ASCII относится к международным стандартам для ПК. Она восьмиразрядная. Это значит, что один символ занимает объём памяти равный 1 байту.


Пример двоичной системы исчисления


В кодировочной таблице символы, имеющие порядковые номера от 0 до 31, относят к управляющим. С их помощью происходит управление процессами, которые преобразуют текстовую информацию для вывода её на экран. Номера от 32 до 127 считаются стандартными, или английскими. Пробел — это просто пустота, но он также закодирован. В таблице его номер 32.

Номера от 128 до 255 принято считать альтернативными или русскими. Это вторая половина таблицы. Во второй её половине 128 кодов, а начинается она с 10000000 и заканчивается 11111111. Эта часть таблицы кодирования имеет название – кодовая страница. В ней размещают алфавиты, которые отличаются от латиницы, поэтому у неё множество вариантов.

В таблице кодов цифры размещены от меньшего к большему, а буквы – в алфавитном порядке.

Две части таблицы кодировки

Самая используемая кодировка, которую применяют в большинстве случаев кодировщики, Microsoft Windows, или сокращённо СР 1251. Кодирование символов происходит по международным стандартам, иначе невозможно было бы пользоваться электроникой, купленной в другой стране.

В международной системе кодирования символов есть 16-ти разрядная система кодировки –Unicode. В этой системе один символ занимает объём памяти в 2 байта. Это больше в 2 раза, чем в системе кодировки ASCII. Такой факт, безусловно, является недостатком.

Но зато символов эта система содержит гораздо больше – 65536. В Unicode включены все известные и неизвестные алфавиты во всём мире. Она содержит огромное количество всевозможных символов, относящихся к математике, химии, физике, музыке и т.д.

Если при переносе информации, написанной русским языком, с одного компьютера на другой на экране мы видим что-то несуразное, это говорит о том, что использовались различные кодировки символов.

Поделитесь статьёй в соцсетях:

Оставить комментарий

avatar
  Подписаться  
Уведомление о