Какое количество байт содержится в слове информация
Анонимный вопрос
3 мая 2018 · 6,3 K
Кандидат физ.-мат. наук, делаю Яндекс, увлекаюсь всем на свете
Если бы этот вопрос задали моему ребенку на уроке информатики, то я бы, чтобы помочь ему получить хорошую оценку, ответил, что 88. Сейчас объясню, как обосновать этот ответ в школе, и почему он при этом не совсем правильный, а в настоящем программировании всё сложнее.
В слове “информатика” 11 букв. Каждую букву мы можем закодировать одним байтом. В одном байте 8 бит, поэтому ответ 11х8=88.
Как это проверить? Очень просто, запустите на компьютере “Блокнот” (я предполагаю, что у вас Windows), напечатайте в нём это слово и сохраните в текстовый файл. Кликните правой кнопкой, выберите “свойства”, видите? Размер: 11 байт (то есть 88 бит).
Теперь о том, почему в реальности всё сложнее. Мы выше написали, что каждую букву мы закодируем одним байтом. Всего разных символов у нас, таким образом, может быть максимум столько, сколько разных значений у одного байта, то есть 2 в восьмой степени, 256. Это значит, что все буквы всех алфавитов мира в один байт точно не влезут. Даже одни только японские или китайские иероглифы в один байт не вмещаются.
То есть кодировка, какому значению байта соответствует какая буква, это вовсе не универсальная штука, они бывают разные. В “Блокноте” и много где ещё в Windows используется кодировка Windows-1251 (это если вы в России живете, в других странах другие). В некоторых кодировках слово “информатика” просто нельзя записать. А в Windows-1251 нельзя записать слово 信息学. Если вы свой текстовый файлик, содержащий слово “информатика”, пришлёте китайцу, он, открыв его, увидит какую-то абракадабру, и наоборот. Так что ответ “11 байт или 88 бит” предполагает, что мы с получателем используем одну и ту же однобайтовую кодировку, содержащую кириллические буквы.
А есть такой стандарт кодирования, в котором можно написать что угодно и не устраивать вот этих сложностей? Как ни странно, есть! Он называется Unicode, и в ней каждому символу всех алфавитов Земли (даже вымершим языкам, даже египетским иероглифам, даже смайликам и эмоджи) присвоен свой код. Естественно, в нём много тысяч символов и в один байт всё это не влезет. Unicode можно для компьютера кодировать по-разному, но самый популярный вариант устроен так. В нём самые распространенные символы (цифры, точки-запятые-скобки и буквы латинского алфавита) занимают один байт, чуть менее распространенные (кириллические буквы, а также всякие там Ä и π) два байта, а всякая экзотика вроде индейских узелковых письменностей и четыре может занимать.
С каждым годом Unicode становится всё более популярным, а “старые” кодировки вроде Windows 1251, господствовавшие, когда писался школьный учебник по информатике, уходят на второй план. Так что по-честному я бы ответил, что в слове “информатика” 22 байта = 176 бит, ну, насколько уж этот вопрос вообще имеет смысл.
Вы тоже забыли символ конца строки 🙂
Смотря какой алфавит Вы используете.
Если алфавит – просто строчные русские буквы, то всего имеется 33 символа. В таком случае, для кодировки каждого символа понадобится 6 бит (2^5 < 33, 2^6 >= 33 – берем ближайшую степень двойки, которая вместит наш алфавит). Значит, для кодировки слова “информатика”, где 11 букв, нужно будет 66 бит.
По образу и… Читать далее
Вы символ конца строки забыли 🙂 То есть всего будет 72 бита.
Вероятно, “66 бит” считается правильным ответом в… Читать дальше
Какие два значения имеет слово бит?
Не перестаю узнавать новое. Люблю путешествия и все с этим связанное. Много лет…
Первое значение этого слова: бит – единица, при помощи которой измерияется количество информации.
Второе значение у этого слова музыкальное: бит (от английского beat) – это такт в музыке. Его часто употребляют в выражении “бит в минуту” – bpm, которым измеряется темп музыки. Т.е. чем больше значение bpm, тем быстрее музыка.
Чему учат на специальностях “Информатика и вычислительная техника” и “Информационные системы и технологии”? Чем они отличаются между собой?
DevOps и просто плохой человек
Да, действительно схожие специальности, но есть принципиальное различие. Не знаю, если ли оно в программах обучения, но оно есть в терминологии.
“Информатика и вычислительная техника”
Информатика — Наука, изучающая структуру, общие свойства и методы передачи информации, в том числе связанной с применением ЭВМ. Вычислительная техника — соответсвенно, сами ЭВМ
“Информационные системы и технологии”
Информационная система — система, предназначенная для хранения, поиска и обработки информации и соответствующие организационные ресурсы (человеческие, технические, финансовые и т. д.), которые обеспечивают и распространяют информацию. Информационная технология — это процесс, использующий совокупность средств и методов сбора, обработки и передачи данных для получения информации нового качества о состоянии объекта, процесса или явления.
Из этих определений следует, что первая специальность более ориентирована на аппаратную часть вычислительной техники и её низкоуровневое программное обеспечение(железо, операционная система), а вторая — на программную, скорее прикладную(программы общего пользования)
Прочитать ещё 1 ответ
Какое название у единицы КАЧества информации если КОЛичество информации измеряется в битах?
В отличие от количества информации, которое является конкретной, матемачически определенной величиной, под качеством информации могут подразумевать множество ее свойств, в зависимости от контекста, и не все из них вообще измеримы. Например, если в сообщении от камеры указана скорость автомобиля, то кроме количества инфмормации (скорее всего 32 или 64 бита на собственно число), можно оценить точность этого измерения (погрешность тогда будет измеряться либо в км/ч как и исходная величина, либо в процентах от переданного значения). Еще пример, у сообщения в новостях о некотором происшествии есть достоверность, т.е. вероятность того, что в сообщение отражает истинное положение дел. Эту вероятность нельзя точно знать, но можно оценить, например, по репутации новостного издания.
Почему в одном КилоБайте именно 1024 байта?
Дизайнер шрифтов. Интересуюсь типографикой, историей дизайна, философией…
Легко находится. Исторически сложилось, что для двоичной системы удобнее, когда в байте 8 бит. Если бы в байте было 10 бит, то в килобайте удобнее было бы считать 1000 байт:
Бит – очень маленькая единица информации. Работать с каждым битом отдельно, конечно, можно, но это малопроизводительно. Обработкой информации в компьютере занимается специальная микросхема, которая называется процессор. Эта микросхема устроена так, что может обрабатывать группу битов одновременно (параллельно).
Один из первых персональных компьютеров (Altair, 1974 г.) имел восьмиразрядный процессор, то есть он мог параллельно обрабатывать восемь битов информации. Это в восемь раз быстрее, чем работать с каждым битом отдельно, поэтому в вычислительной технике появилась новая единица измерения информации – байт. Байт – это группа из восьми битов.
Мы знаем, что один бит может хранить в себе один двоичный знак – 0 или 1. Это наименьшая единица представления информации – простой ответ на вопрос Да или Нет. А что может хранить байт?
На первый взгляд кажется, что раз в байте восемь битов, то и информации он может хранить в восемь раз больше, чем один бит, но это не так. Дело в том, что в байте важно не только, включен бит или выключен, но и то, в каком месте стоят включенные биты. Байты 0000 0001, 0000 1000 и 1000 0000 – не одинаковые, а разные.
Если учесть, что важны не только нули и единицы, но и позиции, в которых они стоят, то с помощью одного байта можно выразить 256 различных единиц информации (oт 0 до 255).
Всегда ли байты состояли из восьми битов? Нет, не всегда. Еще в 60-е годы, когда не было персональных компьютеров и все вычисления проводились на больших электронно-вычислительных машинах (ЭВМ), байты могли быть какими угодно. Наиболее широко были распространены ЭВМ, у которых байт состоял из шести битов, но были и такие, у которых он состоял из четырех и даже из семи битов.
Восьмибитный байт появился достаточно поздно (в начале семидесятых годов), но быстро завоевал популярность. С тех пор понятие о байте, как о группе из восьми битов, является общепризнанным.
1 Килобайт = 1024 байт = 2 в 10-й степени байт
1 Мегабайт = 1024 Кбайт = 2 в 20-й степени байт
1 Гигабайт = 1024 Мбайт = 2 в 30-й степени байт
Прочитать ещё 3 ответа
Источник
Теория:
1 Гб = 1024 Мб
1 Мб = 1024 Кб
1 Кб = 1024 байта
1 байт = 8 бит
1. Переведите 2 Мб в Кб, байты, биты.
Решение:
1 способ:
2 Мб * 1024 Кб = 2048 Кб
2 Мб * 1024 Кб * 1024 байт = 2097152 байт
2 Мб * 1024 Кб * 1024 байт * 8 бит = 16777216 бит
2 способ:
2 Мб * 1024 Кб = 2048 Кб
2048 Кб * 1024 байт = 2097152 байт
2097152 байт * 8 бит = 16777216 бит
2. Переведите 27262976 бит в Мб, Кб, байты
Решение:
1 способ:
27262976 бит : 8 бит = 3407872 байта
27262976 бит : 8 бит : 1024 байта = 3328 Кб
27262976 бит : 8 бит : 1024 байта : 1024 Кб = 3,25 Мб
2 способ:
27262976 бит :8 бит = 3407872 байта
3407872 байта : 1024 байта = 3328 Кб
3328 Кб : 1024 Кб = 3,25 Мб
Теория:
По умолчанию (если в задаче не указано специально) при решении задачи указывается 256-символьный алфавит – таблица ASCII (мощность алфавита = 256 символов). Значит, на один символ (букву, цифру, знак, знак препинания, пробел) приходится 8 бит информации или 1 байт.
3. Определить количество информации, которое содержится на печатном листе бумаги (двусторонняя печать), если на одной стороне умещается 40 строк по 67 символов в строке.
Решение:
Определим количество символов на одной стороне листа:
40 строк * 67 символов = 2680 символов
Определим количество символов на 2-х сторонах листа:
2680 символов * 2 = 5360 символов
Количество информации = 5360 символов * 1 байт = 5360 байт
Переводим в Кб: 5360 байт : 1024 байт = 5,23 Кб
Если бы необходимо было получить ответ в бит, то
Количество информации = 5360 символов * 8 бит = 42880 бит
Переводим в байты 42880 бит : 8 бит = 5360 байт
Переводим в Кб 5360 байт : 1024 байт = 5,23 Кб
Теория:
,
где i – количество информации в бит, N – количество символов, количество событий
Символом является и знак препинания, и цифра, и специальные знаки. И пробел!
4. Какое количество информации будет содержаться на странице печатного текста при использовании 32-х символьного алфавита (на странице 60 строк по 56 символов).
Решение:
Количество символов на странице = 60 строк * 56 символов = 3360 символов
По условию используется 32-х символьный алфавит (т.е. мощность алфавита = 32 символа).
Тогда , отсюда i = 5 бит. Такое количество информации приходится на 1 символ 32-х символьного алфавита.
Количество информации, содержащееся на странице = 3360 символов * 5 бит = 16800 бит
Переводим в байты: 16800 бит : 8 бит = 2100 байт
Переводим в Кб 2100 байт : 1024 байт = 2,05 Кб
Теория:
общее количество символов на одной странице | количество бит информации, приходящейся на один символ | ||||||
I (количество информации) | |||||||
= * *
Единицы измерения информации правой и левой части должны быть одинаковыми.
5. Какое количество символов содержится на странице энциклопедического словаря, если в памяти компьютера эта страница занимает 13 Кб?
Решение:
По умолчанию количество бит информации, приходящейся на один символ, равно 8 бит.
Переведем 13 Кб в биты:
13 Кб * 1024 байт * 8 бит = 106496 бит
6. Используя данные предыдущей задачи и зная, что в одной строке находится 85 знаков, определить количество строк на странице.
Решение:
Общее число символов на странице (по предыдущей задаче) = 13312 символов
Общее число символов 13312 символов
Количество строк = ————————————————– = —————————-
Количество символов в одной строке 85 знаков
» 157 строк
7. Сколько бит содержится в слове ИНФОРМАЦИЯ?
Решение:
Т.к. по умолчанию количество бит информации, приходящейся на 1 символ = 8 бит
(256-символьный алфавит, , i=8 бит), а в предлагаемом слове 10 букв, то количество бит, содержащихся в слове =
10 букв * 8 бит = 80 бит = 10 байт
8. В каком алфавите одна буква несет в себе больше информации, в русском или латинском? Примечание: в русском языке 33 буквы, в латинском – 26 букв.
Решение:
Русский язык: , i = 6 бит (i не должно быть меньше 6, т.к. , а у нас 33 буквы
Латинский язык: , i = 5 бит.
Количество бит информации одного символа русского языка больше на 1, чем в латинском языке.
Теория:
При форматировании дискеты 3.5 (А) ее физический размер составляет 1.44 Мб. Тем не менее, доступно для записи непосредственно самой информации пользователя только 1.37 Мб, т.к. 71,7 Кб отводится на создание каталога диска и нулевую дорожку.
9. Сколько дискет объемом 1.37 Мб необходимо для сохранения информации с винчестера объемом 40 Гб? А сколько CD-дисков?
Решение:
Переводим единицы измерения информации к одному виду.
40 Гб * 1024 Мб = 40960 Мб
Количество дискет = 40960 Мб : 1.37 Мб = 29 897 дискет.
Т.е. примерно 30 тыс. дискет 3.5 (А)!
Один CD-диск содержит примерно 700 Mb информации, тогда 40960 Mb / 700Mb = 58,51? Т.е. примерно 59 компакт-дисков CD-R объемом по 700 Мб.
10. Какое количество вопросов необходимо задать, чтобы наверняка угадать загаданного ученика из вашего класса?
Решение:
Допустим, в вашем классе 27 человек.
, где N=27, т.е.
Точной степени для этого уравнения нет ( и ).
В первом случае мы угадаем только из 16 человек, во втором из 32-х.
Значит, чтобы угадать из 27 человек необходимо получить 5 бит информации,
т.е. задать 5 вопросов.
11. Сколько символов содержится в алфавите, при помощи которого написана книга из 20 страниц, на каждой из которых содержится 15 строк по 20 символов и занимает в памяти компьютера вся книга 5,86 Кб.
Решение:
Количество символов на одной странице – 15 строк * 20 символов = 300 символов
Всего символов в книге n = 300 символов * 20 страниц = 6000 символов
Общее количество информации I = бит в 1 символе * n символов
5,86 Кб = 48005,12 бит
Определим сколько бит в 1 символе:
x =
, где N – мощность алфавита, значит ,
N=256 символов в алфавите
12. В алфавите некоторого формального языка всего два знака буквы. Каждое слово этого языка состоит обязательно из 7 букв. Какое максимальное число слов возможно записать в этом языке?
Решение:
Т.к. для записи слов используется только 2 знака-буквы, при N-перемещениях существует различных наборов слов. N=7, значит , тогда N=128 слов.
13. Решить уравнение
Решение:
Приведем выражение к общему основанию и общим единицам измерения.
, т.к. 1 Мб =
Решаем уравнение:
5(x+3) = 8x + 20
5x + 15 = 8x + 20
5x – 8x = 20 – 15
-3x = 5
x =
14. Какое количество информации несет в себе экран SVGA – монитора (16-bit кодирование, размер экрана 800*600)?
Решение:
Определим, сколько всего пиксел содержится на всем экране:
800*600=480 000 пиксел
480 000 * 16 бит = 7 680 000 бит = 960 000 байт = 937,5 Кб = 0,9 Мб
15. Сколько цветов содержит рисунок размером 100*150 пиксел и объемом 29,3 Кб
Решение:
Количество точек по вертикали
I (количество информации) | |||
Количество точек по горизонтали
= * *
Количество цветов =
Тогда, 29,3 Кб = 30003,2 байт = 240025,6 бит
Общее число точек = 100*150 = 15 000
Глубина цвета =
Тогда количество цветов =
16. 256-цветный рисунок содержит 120 байт информации. Из скольких точек он состоит?
Решение:
Т.к. рисунок содержит 256 цветов, то , i = 8 бит – глубина цвета
I = кол-во точек * глубину цвета
Количество точек = , т.к. 120 байт = 960 бит
17. Достаточно ли видеопамяти объемом 256 Кб для работы монитора в режиме 640*480 точек и палитрой в 16 цветов.
Решение:
Т.к. используется 16 цветов, значит глубина цвета = 4 бита ( )
256 Кб = 2 097 152 бит
640*480 = 307 200 всего точек
Необходимое количество видеопамяти:
2 097 152 бит дано изначально
307 200 * 4 бита = 1 228 800 занимает экран
– получается, что дано в 1,7 раз больше, значит видеопамяти хватит!
Источник
Единицы измерения информации
Для информации существуют свои единицы измерения информации.
Если рассматривать сообщения информации как последовательность знаков,
то их можно представлять битами, а измерять в байтах, килобайтах,
мегабайтах, гигабайтах, терабайтах и петабайтах.
Давайте разберемся с этим, ведь нам придется измерять объем памяти и быстродействие компьютера.
Бит
Единицей измерения количества информации является бит – это наименьшая (элементарная) единица.
1бит – это количество информации, содержащейся в сообщении, которое вдвое уменьшает неопределенность знаний о чем-либо.
Байт
Байт – основная единица измерения количества информации.
Байтом называется последовательность из 8 битов.
Байт – довольно мелкая единица измерения информации. Например, 1 символ – это 1 байт.
Производные единицы измерения количества информации
1 байт=8 битов
1 килобайт (Кб)=1024 байта =210 байтов
1 мегабайт (Мб)=1024 килобайта =210 килобайтов=220 байтов
1 гигабайт (Гб)=1024 мегабайта =210 мегабайтов=230 байтов
1 терабайт (Гб)=1024 гигабайта =210 гигабайтов=240 байтов
Запомните, приставка КИЛО в информатике – это не 1000, а 1024, то есть 210 .
Методы измерения количества информации
Итак, количество информации в 1 бит вдвое уменьшает неопределенность знаний. Связь же между количеством возможных событий N и количеством информации I определяется формулой Хартли:
Алфавитный подход к измерению количества информации
При этом подходе отвлекаются от содержания (смысла) информации и
рассматривают ее как последовательность знаков определенной знаковой
системы. Набор символов языка, т.е. его алфавит можно рассматривать как
различные возможные события. Тогда, если считать, что появление символов
в сообщении равновероятно, по формуле Хартли можно рассчитать, какое
количество информации несет в себе каждый символ:
Вероятностный подход к измерению количества информации
Этот подход применяют, когда возможные события имеют различные
вероятности реализации. В этом случае количество информации определяют
по формуле Шеннона:
.
, где
I – количество информации,
N – количество возможных событий,
Pi – вероятность i-го события.
Задача 1.
Шар находится в одной из четырех коробок. Сколько бит информации несет сообщение о том, в какой именно коробке находится шар.
Имеется 4 равновероятных события (N=4).
По формуле Хартли имеем: 4=2i. Так как 22=2i, то i=2. Значит, это сообщение содержит 2 бита информации.
Задача 2.
Чему равен информационный объем одного символа русского языка?
В русском языке 32 буквы (буква ё обычно не используется), то есть количество событий будет равно 32. Найдем информационный объем одного символа. I=log2 N=log2 32=5 битов (25=32).
Примечание. Если невозможно найти целую степень числа, то округление производится в большую сторону.
Задача 3.
Чему равен информационный объем одного символа английского языка?
Задача 4.
Световое табло состоит из лампочек, каждая из которых может
находиться в одном из двух состояний (“включено” или “выключено”). Какое
наименьшее количество лампочек должно находиться на табло, чтобы с его
помощью можно было передать 50 различных сигналов?
С помощью N лампочек, каждая из которых может находиться в одном из двух состояний, можно закодировать 2N сигналов.
25< 50 <26, поэтому пяти лампочек недостаточно, а шести хватит. Значит, нужно 6 лампочек.
Задача 5.
Метеостанция ведет наблюдения за влажностью воздуха.
Результатом одного измерения является целое число от 0 до 100, которое
записывается при помощи минимально возможного количества битов. Станция
сделала 80 измерений. Определите информационный объем результатов
наблюдений.
В данном случае алфавитом является множество чисел от 0 до 100, всего
101 значение. Поэтому информационный объем результатов одного измерения
I=log2101. Но это значение не
будет целочисленным, поэтому заменим число 101 ближайшей к нему степенью
двойки, большей, чем 101. это число 128=27. Принимаем для одного измерения I=log2128=7 битов. Для 80 измерений общий информационный объем равен 80*7 = 560 битов = 70 байтов.
Задача 6.
Определите количество информации, которое будет получено
после подбрасывания несимметричной 4-гранной пирамидки, если делают один
бросок.
Пусть при бросании 4-гранной несимметричной пирамидки вероятности отдельных событий будут равны: p1=1/2, p2=1/4, p3=1/8, p4=1/8.
Тогда количество информации, которое будет получено после реализации одного из них, можно вычислить по формуле Шеннона:
I = -[1/2 * log2(1/2) + 1/4 * log2(1/4) + 1/8 * log(1/8) + 1/8 * log(1/8)] = 14/8 битов = 1,75 бита.
Задача 7.
В книге 100 страниц; на каждой странице – 20 строк, в каждой
строке – 50 символов. Определите объем информации, содержащийся в книге.
Задача 8.
Оцените информационный объем следующего предложения:
Тяжело в ученье – легко в бою!
Так как каждый символ кодируется одним байтом, нам только нужно
подсчитать количество символов, но при этом не забываем считать знаки
препинания и пробелы. Всего получаем 30 символов. А это означает, что
информационный объем данного сообщения составляет 30 байтов или 30 * 8 = 240 битов.
Источник