Сколько байт содержит текст последнего абзаца

Так в ASCII-совместимой кодировке (windows-1251, cp866) 1 символ занимает ровно 1 байт.
Поэтому в 256 байт можно поместить 256 символов (включая специальные символы – перевод строки, табуляция, пробел) .

В Unicode символ может занимать больше 1 байта, тут все зависит от реализации Юникода (UTF-8, UTF-16. ).
Так в UTF-8 (наиболее распространенный вариант Юникода) латинские символы и спец. символы представляются также как и в ASCII, т. о. занимают 1 байт.
А, например, символы русского алфавита будут занимать уже 2 байта.
Таким образом, в UTF-8 в 256 байт можно поместить 256 латинских символов или 128 русских, ну или если в перемешку, то надо считать сколько тех и других.

Устанавливая рекомендуемое программное обеспечение вы соглашаетесь
с лицензионным соглашением Яндекс.Браузера и настольного ПО Яндекса .

Решение задач на тему «Кодирование текстовой информации»

Объем памяти, занимаемый текстом.

В задачах такого типа используются понятия:

единицы измерения информации (бит, байт и др.)

Для представления текстовой (символьной) информации в компьютере используется алфавит мощностью 256 символов. Один символ из такого алфавита несет 8 бит информации (2 8 =256). 8 бит =1 байту, следовательно, двоичный код каждого символа в компьютерном тексте занимает 1 байт памяти.

1. Сколько бит памяти займет слово «Микропроцессор»?([1], c .131, пример 1)

Слово состоит из 14 букв. Каждая буква – символ компьютерного алфавита, занимает 1 байт памяти. Слово занимает 14 байт =14*8=112 бит памяти.

2. Текст занимает 0, 25 Кбайт памяти компьютера. Сколько символов содержит этот текст? ([1], c .133, №31)

Переведем Кб в байты: 0, 25 Кб * 1024 =256 байт. Так как текст занимает объем 256 байт, а каждый символ – 1 байт, то в тексте 256 символов.

Ответ: 256 символов

3. Текст занимает полных 5 страниц. На каждой странице размещается 30 строк по 70 символов в строке. Какой объем оперативной памяти (в байтах) займет этот текст? ([1], c .133, №32)

30*70*5 = 10500 символов в тексте на 5 страницах. Текст займет 10500 байт оперативной памяти.

Ответ: 10500 байт

4. Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения из пушкинского четверостишия:

Певец-Давид был ростом мал, Но повалил же Голиафа! (ЕГЭ_2005. демо, уровень А)

В тексте 50 символов, включая пробелы и знаки препинания. При кодировании каждого символа одним байтом на символ будет приходиться по 8 бит, Следовательно, переведем в биты 50*8= 400 бит.

Читайте также:  Программа для доступа к телефону через компьютер

5 . Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения в кодировке КОИ-8: Сегодня метеорологи предсказывали дождь. (ЕГЭ_2005, уровень А)

В таблице КОИ-8 каждый символ закодирован с помощью 8 бит. См. решение задачи №4.

6. Считая, что каждый символ кодируется 16 битами, оцените информационный объем следующего предложения в кодировке Unicode :

Каждый символ кодируется 8 битами.

34 символа в предложении. Переведем в биты: 34*16=544 бита.

7. Каждый символ закодирован двухбайтным словом. Оцените информационный объем следующего предложения в этой кодировке:

В одном килограмме 100 грамм.

19 символов в предложении. 19*2 =38 байт

8. Текст занимает полных 10 секторов на односторонней дискете объемом 180 Кбайт. Дискета разбита на 40 дорожек по 9 секторов. Сколько символов содержит текст? ([1], c .133, №34)

40*9 = 360 -секторов на дискете.

180 Кбайт : 360 * 10 =5 Кбайт – поместится на одном секторе.

5*1024= 5120 символов содержит текст.

Ответ: 5120 символов

9. Сообщение передано в семибитном коде. Каков его информационный объем в байтах, если известно, что передано 2000 символов.

Если код символа содержит 7 бит, а всего 2000 символов, узнаем сколько бит займет все сообщение. 2000 х 7=14000 бит.

Переведем результат в байты. 14000 : 8 =1750 байт

Ответ: 1750 байт.

10. Сколько секунд потребуется модему, передающему сообщение со скоростью 28800 бит/с, чтобы передать 100 страниц текста в 30 строк по 60 символов каждая, при условии, что каждый символ кодируется одним байтом? (ЕГЭ_2005, уровень В)

Найдем объем сообщения. 30*60*8*100 =1440000 бит.

Найдем время передачи сообщения модемом. 1440000 : 28800 =50 секунд

Ответ: 50 секунд

11. Сколько секунд потребуется модему, передающему сообщения со скоростью 14400 бит/с, чтобы передать сообщение длиной 225 Кбайт? (ЕГЭ_2005, уровень В)

Переведем 225 Кб в биты.225 Кб *1024*8 = 1843200 бит.

Найдем время передачи сообщения модемом. 1843200: 14400 =128 секунд.

Ответ: 128 секунд

Кодирование (декодирование) текстовой информации.

В задачах такого типа используются понятия:

Кодирование – отображение дискретного (прерывного, импульсного) сообщения в виде определенных сочетаний символов.

Код (от французского слова code – кодекс, свод законов) – правило по которому выполняется кодирование.

Читайте также:  Распознать речь в текст

Кодовая таблица (или кодовая страница) – таблица, устанавливающая соответствие между символами алфавита и двоичными числами.

Примеры кодовых таблиц (имеются на CD диске к учебнику Н. Угринович):

КОИ-7, КОИ-8 – кодирование русских букв и символов (семи-, восьми -битное кодирование)

1) #154 неразрывный пробел .

Рис.1 Кодировка КОИ8-Р

ASCII – American Standard Code for Information Interchange (американский стандарт кодов для обмена информацией) – это восьмиразрядная кодовая таблица, в ней закодировано 256 символов (127- стандартные коды символов английского языка, спецсимволы, цифры, а коды от 128 до 255 – национальный стандарт, алфавит языка, символы псевдографики, научные символы, коды от 0 до 32 отведены не символам, а функциональным клавишам).

Рис. 2 Международная кодировка ASCII

Unicode – стандарт, согласно которому для представления каждого символа используется 2 байта. (можно кодировать математические символы, русские, английские, греческие, и даже китайские). C его помощью можно закодировать не 256, а 65536 различных символов. Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов

СР1251 – наиболее распространенной в настоящее время является кодировка Microsoft Windows, ("CP" означает "Code Page", "кодовая страница").

1) #160 неразрывный пробел,

2) #173 мягкий перенос.

Рис. 3 Кодировка CP 1251

СР866 – кодировка под MS DOS

1) #255 неразрывный пробел.

Рис. 4 Кодировка СР866

Мас – кодировка в ПК фирмы Apple, работающих под управлением операционной системы Mac OS .

#202 неразрывный пробел.

Рис. 5 Кодировка Mac

ISO 8859-5 – Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку.

1) Коды 128-159 не используются;

2) #160 неразрывный пробел,

3) #173 мягкий перенос.

Рис. 6 Кодировка ISO 8859-5

Используем кодировочные таблицы

12. Как будет выглядеть слово "диск", записанное в кодировке СР1251, в других кодировках. ([2], стр. 68 №2.63)

Последовательность десятичных кодов слова "диск" составляем на основе кодировочных таблиц

228 232 241 234

228 232 241 234

228 232 241 234

228 232 241 234

228 232 241 234

13. Перейдите от двоичного кода к десятичному и декодируйте следующие тексты:

а) 01010101 01110000 0100000 00100110 00100000 01000100 1101111 01110111 01101110;
б) 01001001 01000010 01001101;
в) 01000101 01101110 01110100 01100101 01110010

Читайте также:  Помехи на кабельном тв

Решение:

1. Переведите коды из двоичной системы счисления в десятичную.
а) 01010101 01110000 00100000 00100110 00100000 01000100 1101111 01110111 01101110 → 85 112 32 38 32 68 111 119 110
б) 01001001 01000010 01001101 → 73 66 77
в) 01000101 01101110 01110100 01100101 01110010 → 69 110 116 101 114
2. Запустите текстовый редактор Hieroglyph
3. Включить клавишу Num Lock. Удерживая клавишу Alt, набрать код символа на цифровой клавиатуре. Отпустить клавишу Alt, на экране появится соответствующая буква.
а ) 85 112 32 26 32 68 111 119 110 → Up & Down;
б ) 73 66 77 → IBM;
в ) 69 110 116 101 114 → Enter

1 4. Декодируйте следующие тексты, заданные десятичным кодом:
а) 087 111 114 100;
б) 068 079 083;
в) 080 097 105 110 116 098 114 117 115 104.

Решение:

Запустите текстовый редактор Hieroglyph. Включить клавишу Num Lock. Удерживая клавишу Alt, набрать код символа на цифровой клавиатуре. Отпустить клавишу Alt, на экране появится соответствующая буква.
а) 087 111 114 100 → Word;
б) 068 079 083 → DOS;
в) 080 097 105 110 116 098 114 117 115 104 → Paintbrush.

Не используем кодировочные таблицы

15. Буква « I »в таблице кодировки символов имеет десятичный код 105. что зашифровано последовательностью десятичных кодов: 108 105 110 107? ([1],пример 2, стр.132)

Учитываем принцип последовательности кодирования и порядок букв в латинском алфавите и, можно, не обращаться к таблице кодировки символов.

Ответ: Закодировано слово « link »

16. Десятичный код (номер) буквы «е» в таблице кодировки символов ASCII равен 101. Какая последовательность десятичных кодов будет соответствовать слову:

Учитываем принцип последовательности кодирования и порядок букв в латинском алфавите:

Ответ оставил Гость

900 * 2 = 1800 байт весь текст

1800 : 1024 = 1.76 кбайт

Нельзя всё время учиться. А для развлечения мы рекомендуем вам поиграть в отличную игру:

Leave a Reply

Ваш адрес email не будет опубликован. Обязательные поля помечены *

You may use these HTML tags and attributes:

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>