Какое количество бит информации содержится в этом сообщении

Анонимный вопрос

3 мая 2018  · 11,8 K

Кандидат физ.-мат. наук, делаю Яндекс, увлекаюсь всем на свете

Если бы этот вопрос задали моему ребенку на уроке информатики, то я бы, чтобы помочь ему получить хорошую оценку, ответил, что 88. Сейчас объясню, как обосновать этот ответ в школе, и почему он при этом не совсем правильный, а в настоящем программировании всё сложнее.

В слове “информатика” 11 букв. Каждую букву мы можем закодировать одним байтом. В одном байте 8 бит, поэтому ответ 11х8=88.

Как это проверить? Очень просто, запустите на компьютере “Блокнот” (я предполагаю, что у вас Windows), напечатайте в нём это слово и сохраните в текстовый файл. Кликните правой кнопкой, выберите “свойства”, видите? Размер: 11 байт (то есть 88 бит).

Теперь о том, почему в реальности всё сложнее. Мы выше написали, что каждую букву мы закодируем одним байтом. Всего разных символов у нас, таким образом, может быть максимум столько, сколько разных значений у одного байта, то есть 2 в восьмой степени, 256. Это значит, что все буквы всех алфавитов мира в один байт точно не влезут. Даже одни только японские или китайские иероглифы в один байт не вмещаются.

То есть кодировка, какому значению байта соответствует какая буква, это вовсе не универсальная штука, они бывают разные. В “Блокноте” и много где ещё в Windows используется кодировка Windows-1251 (это если вы в России живете, в других странах другие). В некоторых кодировках слово “информатика” просто нельзя записать. А в Windows-1251 нельзя записать слово 信息学. Если вы свой текстовый файлик, содержащий слово “информатика”, пришлёте китайцу, он, открыв его, увидит какую-то абракадабру, и наоборот. Так что ответ “11 байт или 88 бит” предполагает, что мы с получателем используем одну и ту же однобайтовую кодировку, содержащую кириллические буквы.

А есть такой стандарт кодирования, в котором можно написать что угодно и не устраивать вот этих сложностей? Как ни странно, есть! Он называется Unicode, и в ней каждому символу всех алфавитов Земли (даже вымершим языкам, даже египетским иероглифам, даже смайликам и эмоджи) присвоен свой код. Естественно, в нём много тысяч символов и в один байт всё это не влезет. Unicode можно для компьютера кодировать по-разному, но самый популярный вариант устроен так. В нём самые распространенные символы (цифры, точки-запятые-скобки и буквы латинского алфавита) занимают один байт, чуть менее распространенные (кириллические буквы, а также всякие там Ä и π) два байта, а всякая экзотика вроде индейских узелковых письменностей и четыре может занимать.

С каждым годом Unicode становится всё более популярным, а “старые” кодировки вроде Windows 1251, господствовавшие, когда писался школьный учебник по информатике, уходят на второй план. Так что по-честному я бы ответил, что в слове “информатика” 22 байта = 176 бит, ну, насколько уж этот вопрос вообще имеет смысл.

Вы тоже забыли символ конца строки 🙂

Смотря какой алфавит Вы используете.
Если алфавит – просто строчные русские буквы, то всего имеется 33 символа. В таком случае, для кодировки каждого символа понадобится 6 бит (2^5 < 33, 2^6 >= 33 – берем ближайшую степень двойки, которая вместит наш алфавит). Значит, для кодировки слова “информатика”, где 11 букв, нужно будет 66 бит.
По образу и… Читать далее

Вы символ конца строки забыли 🙂 То есть всего будет 72 бита.

Вероятно, “66 бит” считается правильным ответом в… Читать дальше

Почему в одном Килобайте 1024 байт, а не 1000?

IT, телеком, телефония, базы данных, интеграционные решения, естествознание…

Обозначения единиц измерения — это всегда результат договорённости, отражённый в нормативных документах. Так «ПОЛОЖЕНИЕ о единицах величин, допускаемых к применению в Российской Федерации», принятое в 2009 году и действующее сейчас в редакции от 2015, гласит:

Наименование и обозначение  единицы  количества  информации  “байт”  (1  байт  =  8  бит) применяются  с  двоичными  приставками  “Кило”,  “Мега”,  “Гига”,  которые  соответствуют множителям “2¹⁰”,  “2²⁰” и “2³⁰” (1 Кбайт = 1024 байт,  1 Мбайт = 1024 Кбайт,  1 Гбайт = 1024 Мбайт). Данные приставки пишутся  с большой буквы. Допускается применение международного обозначения единицы информации с приставками “K” “M” “G”, рекомендованного Международным стандартом Международной электротехнической комиссии МЭК 60027-2 (KB, MB, GB, Kbyte, Mbyte, Gbyte).

Как видно, авторы Положения пошли на хитрость, чтобы подружить сложившуюся практику с нормативными документами Международной системы единиц (СИ), и ГОСТ 8.417—2002. Обратите внимание, СИ предписывает стандартные приставки начинать с маленькой буквы: кВт, кОм, кг. А для байтов это Положение утверждает приставки с большой буквы.

Маленькая буква тоже применяется: 123 кбайта — это по закону именно 123000 байт ровно. А 123 Кбайта = 125925 байт.

Читайте также:  В каких семенах содержится крахмал белки жиры

Прочитать ещё 2 ответа

Чему учат на специальностях “Информатика и вычислительная техника” и “Информационные системы и технологии”? Чем они отличаются между собой?

DevOps и просто плохой человек

Да, действительно схожие специальности, но есть принципиальное различие. Не знаю, если ли оно в программах обучения, но оно есть в терминологии.

“Информатика и вычислительная техника”

Информатика — Наука, изучающая структуру, общие свойства и методы передачи информации, в том числе связанной с применением ЭВМ. Вычислительная техника — соответсвенно, сами ЭВМ

“Информационные системы и технологии”

Информационная система — система, предназначенная для хранения, поиска и обработки информации и соответствующие организационные ресурсы (человеческие, технические, финансовые и т. д.), которые обеспечивают и распространяют информацию. Информационная технология — это процесс, использующий совокупность средств и методов сбора, обработки и передачи данных для получения информации нового качества о состоянии объекта, процесса или явления.

Из этих определений следует, что первая специальность более ориентирована на аппаратную часть вычислительной техники и её низкоуровневое программное обеспечение(железо, операционная система), а вторая — на программную, скорее прикладную(программы общего пользования)

Прочитать ещё 1 ответ

Что такое 1 бит?

Бит (русское обозначение: бит; международное: bit; от англ. binary digit — двоичное число; также игра слов: англ. bit — кусочек, частица) — единица измерения количества информации. 1 бит информации — это символ или сигнал, который может принимать два значения: включено или выключено, да или нет, высокий или низкий, заряженный или незаряженный; в двоичной системе исчисления это 1 (единица) или 0 (ноль).

Подробнее: https://ru.wikipedia.org/wiki/Бит

Источник

Анонимный вопрос

11 мая 2018  · 482

А что вы думаете про фильм Social Dilemma? Нагнетания и вот это всё – или в целом так и есть, чего скрывать?

Новый документальный фильм о нашей цифровой жизни «Социальная дилемма» Джеффа Орловски уже вызвал немало дискуссий. Каждый воспринял его по-своему, но зрителей можно поделить на два условных лагеря – скепсис и ирония и апокалипсис.

Я, скорее, та, кто принадлежит к первому лагерю. Фильм фильмом, а в реальности все гораздо сложнее. Проблема пропаганды, хейтспича и дезинформации на самом деле гораздо шире и выходит за пределы соцсетей. Фильм нам словно демонстрирует, что социальные сети несут ответственность за все болезни общества. Но это не так. И в этом и есть социальная дилемма.

Да, конечно, социальные сети и их алгоритмы – мощная система, которую все сложнее контролировать, но удаление всех приложений с телефона делу не поможет и общество не улучшит – обществу нужно начать с себя. И желательно с самых малых лет.

Прочитать ещё 1 ответ

Почему в одном Килобайте 1024 байт, а не 1000?

IT, телеком, телефония, базы данных, интеграционные решения, естествознание…

Обозначения единиц измерения — это всегда результат договорённости, отражённый в нормативных документах. Так «ПОЛОЖЕНИЕ о единицах величин, допускаемых к применению в Российской Федерации», принятое в 2009 году и действующее сейчас в редакции от 2015, гласит:

Наименование и обозначение  единицы  количества  информации  “байт”  (1  байт  =  8  бит) применяются  с  двоичными  приставками  “Кило”,  “Мега”,  “Гига”,  которые  соответствуют множителям “2¹⁰”,  “2²⁰” и “2³⁰” (1 Кбайт = 1024 байт,  1 Мбайт = 1024 Кбайт,  1 Гбайт = 1024 Мбайт). Данные приставки пишутся  с большой буквы. Допускается применение международного обозначения единицы информации с приставками “K” “M” “G”, рекомендованного Международным стандартом Международной электротехнической комиссии МЭК 60027-2 (KB, MB, GB, Kbyte, Mbyte, Gbyte).

Как видно, авторы Положения пошли на хитрость, чтобы подружить сложившуюся практику с нормативными документами Международной системы единиц (СИ), и ГОСТ 8.417—2002. Обратите внимание, СИ предписывает стандартные приставки начинать с маленькой буквы: кВт, кОм, кг. А для байтов это Положение утверждает приставки с большой буквы.

Маленькая буква тоже применяется: 123 кбайта — это по закону именно 123000 байт ровно. А 123 Кбайта = 125925 байт.

Прочитать ещё 2 ответа

В каких единицах измеряют количество информации?

Имею высшее образование в сфере IT. Увлекаюсь компьютерами, чтением, спортом…

В науке общепринято измерять количество информации в битах. Поскольку бит это наименьшая единица измерения информации, а в современном мире используются огромные объемы информации, то для удобства вводят более крупные единицы измерения информации. К таким относят байт, он состоит из восьми бит, затем килобайт – 1024 байта, мегабайт – 1024 килобайта, гигабайт – 1024 мегабайта, терабайт – 1024 гигабайта. Существуют и более крупные единицы информации.

Прочитать ещё 6 ответов

Почему 1 кибибайт (~ килобайт) равен 1024 байтам?

Учебный центр информационных технологий. Компьютерные и бухгалтерские курсы от нуля до…  · infa-education.ru

Потому что в Информатике используется двоичная система исчисления, состоящая из 0 и 1. Так намного проще для машины: есть сигнал (1) – нет сигнала (0), есть намагниченность (1) – нет намагниченности (0) и т.д. Цифра 2 в 10 степени равно 1024, что наиболее близко в 1000, при которой применяется привычная нам приставка кило. Например, 1 килограмм = 1000 грамм, 1 километр = 1000 метров. По аналогии приняли 1 килобайт = 1024 байт, что примерно в 1000 раз больше, чем байт.

Читайте также:  В каких продуктах содержится белок вегетарианцу

Источник

2015-09-07

Пример 1. В коробке 32 карандаша, все карандаши разного цвета. Наугад вытащили красный. Какое количество информации при этом было получено?

Решение.

Так как вытаскивание карандаша любого цвета из имеющихся в коробке 32 карандашей является равновероятным, то число возможных событий равно 32.
N = 32, I = ?
N = 2I, 32 = 25, I = 5 бит.
Ответ: 5 бит.

Пример 2.В коробке 50 шаров, из них 40 белых и 10 чёрных. Определить количество информации в сообщении о вытаскивании наугад белого шара и чёрного шара.

Решение.

Вероятность вытаскивания белого шара
P1 = 40/50 = 0,8
Вероятность вытаскивания чёрного шара
P2 = 10/50 = 0,2
Количество информации о вытаскивании белого шара I1 = log2(1/0,8) = log21,25 = log1,25/log2 = 0,32 бит
Количество информации о вытаскивании чёрного шара I2 = log2(1/0,2) = log25 = log5/log2 » 2,32 бит
Ответ: 0,32 бит, 2,32 бит

Пример 3. В озере живут караси и окуни. Подсчитано, что карасей 1500, а окуней – 500. Сколько информации содержится в сообщениях о том, что рыбак поймал карася, окуня, поймал рыбу?

Решение.

События поимки карася или окуня не являются равновероятными, так как окуней в озере меньше, чем карасей.
Общее количество карасей и окуней в пруду 1500 + 500 = 2000.
Вероятность попадания на удочку карася
p1 = 1500/2000 = 0,75, окуня p2 – 500/2000 = 0,25.
I1 = log2(1/p1), I1 = log2(1/p2), где I1 и I2 – вероятности поймать карася и окуня соответственно.
I1 = log2(1 / 0,75) = 0,43 бит, I2 = log2(1 / 0,25) = 2 бит – количество информации в сообщении поймать карася и поймать окуня соответственно.
Количество информации в сообщении поймать рыбу (карася или окуня) рассчитывается по формуле Шеннона
I = – p1log2p1 – p2log2p2
I = – 0,75*log20,75 – 0,25*log20,25 = – 0,75*(log0,75/log2)-0,25*(log0,25/log2) =
= 0,604 бит = 0.6 бит.
Ответ: в сообщении содержится 0,6 бит информации.

Пример 4. Какое количество информации несет в себе сообщение о том, что нужная вам программа находится на одной из восьми дискет?

Решение.

Количество информации вычисляется по формуле: 2i = N, где i – искомая величина, N – количество событий. Следовательно, 23 =8.
Ответ: 3 бита.

Пример 5. Заполнить пропуски числами:

а) 5 Кбайт = __ байт = __ бит, б) __ Кбайт = __ байт = 12288 бит; в) __ Кбайт = __ байт = 2 13 бит; г) __Гбайт =1536 Мбайт = __ Кбайт; д) 512 Кбайт = 2__ байт = 2__ бит.

Решение.
а) 5 Кбайт = 5120 байт =40 960 бит,
б) 1,5 Кбайт = 1536 байт = 12 288 бит;
в) 1 Кбайт = 210 байт = 213 бит;
г) 1,5 Гбайт = 1536 Мбайт = 1 572 864 Кбайт;
д) 512 Кбайт = 219 байт = 222 бит.

Пример 6. Какова мощность алфавита, с помощью которого записано сообщение, содержащее 2048 символов, если его объем составляет 1/512 часть одного мегабайта?

Решение.

1) 1/512 Мб * 1024 = 2 Кб * 1024 = 2048 байт
2) К = 2048 символов, следовательно, i = 1 байт = 8 бит
3) 2i = N; 28 = 256 символов

Ответ:

1) 1/512 Мб * 1024 = 2 Кб * 1024 = 2048 байт
2) К = 2048 символов, следовательно, i = 1 байт = 8 бит
3) 2i = N; 28 = 256 символов.

Пример 7.Книга, набранная с помощью компьютера, содержит 150 страниц; на каждой странице – 40 строк, в каждой строке – 60 символов. Каков объем информации в книге?

Решение.

Мощность компьютерного алфавита равна 256. Один символ несет 1 байт информации.
Значит, страница содержит 40*60=2400 байт информации. Объем всей информации в книге: 2400*150 = 360 000 байт.
Ответ: 360 000 байт.

Пример 8. Для передачи секретного сообщения используется код, состоящий из десяти цифр. При этом все цифры кодируются одним и тем же (минимально возможным) количеством бит. Определите информационный объем сообщения длиной в 150 символов.

Решение.

Для кодировки одной из 10 цифр необходимо 4 бита. Это получаем из 23 < 10 < 24. Объём 150 символов получим 150*4=600(бит).
Ответ: 600 бит.

Пример 9.В кодировке Unicode на каждый символ отводится два байта. Определите информационный объем слова из двадцати четырех символов в этой кодировке.

Решение.

I= K*i; I = 24*2 байт = 48 байт = 48*8бит = 384 бит.
Ответ: 384 бита.

Пример 10.В рулетке общее количество лунок равно 128. Какое количество информации мы получаем в зрительном сообщения об остановке шарика в одной из лунок?

Решение.

Количество информации вычисляется по формуле: 2i = N, где i – искомая величина, N – количество событий.
2i=128. Следовательно, i=7.
Ответ: 7 бит.

Читайте также:  Какой витамин содержится в мидиях

Скачать раздаточный материал

Источник

Источник

Единицы измерения информации

Для информации существуют свои единицы измерения информации.
Если рассматривать сообщения информации как последовательность знаков,
то их можно представлять битами, а измерять в байтах, килобайтах,
мегабайтах, гигабайтах, терабайтах и петабайтах.

Давайте разберемся с этим, ведь нам придется измерять объем памяти и быстродействие компьютера.

Бит

Единицей измерения количества информации является бит – это наименьшая (элементарная) единица.

1бит – это количество информации, содержащейся в сообщении, которое вдвое уменьшает неопределенность знаний о чем-либо.

Байт

Байт – основная единица измерения количества информации.

Байтом называется последовательность из 8 битов.

Байт – довольно мелкая единица измерения информации. Например, 1 символ – это 1 байт.

Производные единицы измерения количества информации

1 байт=8 битов

1 килобайт (Кб)=1024 байта =210 байтов

1 мегабайт (Мб)=1024 килобайта =210 килобайтов=220 байтов

1 гигабайт (Гб)=1024 мегабайта =210 мегабайтов=230 байтов

1 терабайт (Гб)=1024 гигабайта =210 гигабайтов=240 байтов

Запомните, приставка КИЛО в информатике – это не 1000, а 1024, то есть 210 .

Методы измерения количества информации

Итак, количество информации в 1 бит вдвое уменьшает неопределенность знаний. Связь же между количеством возможных событий N и количеством информации I определяется формулой Хартли:

Алфавитный подход к измерению количества информации

При этом подходе отвлекаются от содержания (смысла) информации и
рассматривают ее как последовательность знаков определенной знаковой
системы. Набор символов языка, т.е. его алфавит можно рассматривать как
различные возможные события. Тогда, если считать, что появление символов
в сообщении равновероятно, по формуле Хартли можно рассчитать, какое
количество информации несет в себе каждый символ:

Вероятностный подход к измерению количества информации

Этот подход применяют, когда возможные события имеют различные
вероятности реализации. В этом случае количество информации определяют
по формуле Шеннона:

.

, где

I – количество информации,

N – количество возможных событий,

Pi – вероятность i-го события.

Задача 1.

Шар находится в одной из четырех коробок. Сколько бит информации несет сообщение о том, в какой именно коробке находится шар.

Имеется 4 равновероятных события (N=4).

По формуле Хартли имеем: 4=2i. Так как 22=2i, то i=2. Значит, это сообщение содержит 2 бита информации.

Задача 2.

Чему равен информационный объем одного символа русского языка?

В русском языке 32 буквы (буква ё обычно не используется), то есть количество событий будет равно 32. Найдем информационный объем одного символа. I=log2 N=log2 32=5 битов (25=32).

Примечание. Если невозможно найти целую степень числа, то округление производится в большую сторону.

Задача 3.

Чему равен информационный объем одного символа английского языка?

Задача 4.

Световое табло состоит из лампочек, каждая из которых может
находиться в одном из двух состояний (“включено” или “выключено”). Какое
наименьшее количество лампочек должно находиться на табло, чтобы с его
помощью можно было передать 50 различных сигналов?

С помощью N лампочек, каждая из которых может находиться в одном из двух состояний, можно закодировать 2N сигналов.

25< 50 <26, поэтому пяти лампочек недостаточно, а шести хватит. Значит, нужно 6 лампочек.

Задача 5.

Метеостанция ведет наблюдения за влажностью воздуха.
Результатом одного измерения является целое число от 0 до 100, которое
записывается при помощи минимально возможного количества битов. Станция
сделала 80 измерений. Определите информационный объем результатов
наблюдений.

В данном случае алфавитом является множество чисел от 0 до 100, всего
101 значение. Поэтому информационный объем результатов одного измерения
I=log2101. Но это значение не
будет целочисленным, поэтому заменим число 101 ближайшей к нему степенью
двойки, большей, чем 101. это число 128=27.  Принимаем для одного измерения I=log2128=7 битов. Для 80 измерений общий информационный объем равен 80*7 = 560 битов = 70 байтов.

Задача 6.

Определите количество информации, которое будет получено
после подбрасывания несимметричной 4-гранной пирамидки, если делают один
бросок.

Пусть при бросании 4-гранной несимметричной пирамидки вероятности отдельных событий будут равны: p1=1/2, p2=1/4, p3=1/8, p4=1/8.

Тогда количество информации, которое будет получено после реализации одного из них, можно вычислить по формуле Шеннона:

I = -[1/2 * log2(1/2) + 1/4 * log2(1/4) + 1/8 * log(1/8) + 1/8 * log(1/8)] = 14/8 битов = 1,75 бита.

Задача 7.

В книге 100 страниц; на каждой странице – 20 строк, в каждой
строке – 50 символов. Определите объем информации, содержащийся в книге.

Задача 8.

Оцените информационный объем следующего предложения:

Тяжело в ученье – легко в бою!

Так как каждый символ кодируется одним байтом, нам только нужно
подсчитать количество символов, но при этом не забываем считать знаки
препинания и пробелы. Всего получаем 30 символов. А это означает, что
информационный объем данного сообщения составляет 30 байтов или 30 * 8 = 240 битов.

Источник