Какое количество байтов содержится слово информация
Анонимный вопрос
3 мая 2018 · 23,2 K
Кандидат физ.-мат. наук, делаю Яндекс, увлекаюсь всем на свете
Если бы этот вопрос задали моему ребенку на уроке информатики, то я бы, чтобы помочь ему получить хорошую оценку, ответил, что 88. Сейчас объясню, как обосновать этот ответ в школе, и почему он при этом не совсем правильный, а в настоящем программировании всё сложнее.
В слове “информатика” 11 букв. Каждую букву мы можем закодировать одним байтом. В одном байте 8 бит, поэтому ответ 11х8=88.
Как это проверить? Очень просто, запустите на компьютере “Блокнот” (я предполагаю, что у вас Windows), напечатайте в нём это слово и сохраните в текстовый файл. Кликните правой кнопкой, выберите “свойства”, видите? Размер: 11 байт (то есть 88 бит).
Теперь о том, почему в реальности всё сложнее. Мы выше написали, что каждую букву мы закодируем одним байтом. Всего разных символов у нас, таким образом, может быть максимум столько, сколько разных значений у одного байта, то есть 2 в восьмой степени, 256. Это значит, что все буквы всех алфавитов мира в один байт точно не влезут. Даже одни только японские или китайские иероглифы в один байт не вмещаются.
То есть кодировка, какому значению байта соответствует какая буква, это вовсе не универсальная штука, они бывают разные. В “Блокноте” и много где ещё в Windows используется кодировка Windows-1251 (это если вы в России живете, в других странах другие). В некоторых кодировках слово “информатика” просто нельзя записать. А в Windows-1251 нельзя записать слово 信息学. Если вы свой текстовый файлик, содержащий слово “информатика”, пришлёте китайцу, он, открыв его, увидит какую-то абракадабру, и наоборот. Так что ответ “11 байт или 88 бит” предполагает, что мы с получателем используем одну и ту же однобайтовую кодировку, содержащую кириллические буквы.
А есть такой стандарт кодирования, в котором можно написать что угодно и не устраивать вот этих сложностей? Как ни странно, есть! Он называется Unicode, и в ней каждому символу всех алфавитов Земли (даже вымершим языкам, даже египетским иероглифам, даже смайликам и эмоджи) присвоен свой код. Естественно, в нём много тысяч символов и в один байт всё это не влезет. Unicode можно для компьютера кодировать по-разному, но самый популярный вариант устроен так. В нём самые распространенные символы (цифры, точки-запятые-скобки и буквы латинского алфавита) занимают один байт, чуть менее распространенные (кириллические буквы, а также всякие там Ä и π) два байта, а всякая экзотика вроде индейских узелковых письменностей и четыре может занимать.
С каждым годом Unicode становится всё более популярным, а “старые” кодировки вроде Windows 1251, господствовавшие, когда писался школьный учебник по информатике, уходят на второй план. Так что по-честному я бы ответил, что в слове “информатика” 22 байта = 176 бит, ну, насколько уж этот вопрос вообще имеет смысл.
Вы тоже забыли символ конца строки 🙂
11 букв содержит в слове информатика а в одном байте 8 бит надо 8 бит умножить на 11 потому что в слове информатика 11 букв Решения: 11*8=88 Ответ:88
Смотря какой алфавит Вы используете.
Если алфавит – просто строчные русские буквы, то всего имеется 33 символа. В таком случае, для кодировки каждого символа понадобится 6 бит (2^5 < 33, 2^6 >= 33 – берем ближайшую степень двойки, которая вместит наш алфавит). Значит, для кодировки слова “информатика”, где 11 букв, нужно будет 66 бит.
По образу и… Читать далее
Вы символ конца строки забыли 🙂 То есть всего будет 72 бита.
Вероятно, “66 бит” считается правильным ответом в… Читать дальше
Какие два значения имеет слово бит?
Не перестаю узнавать новое. Люблю путешествия и все с этим связанное. Много лет…
Первое значение этого слова: бит – единица, при помощи которой измерияется количество информации.
Второе значение у этого слова музыкальное: бит (от английского beat) – это такт в музыке. Его часто употребляют в выражении “бит в минуту” – bpm, которым измеряется темп музыки. Т.е. чем больше значение bpm, тем быстрее музыка.
Как определить информационный объем сообщения?
IT, Web, игры и масса других интересов
Чтобы сосчитать информационный объем всего сообщения необходимо знать из скольких символов оно состоит и какой в нем используется алфавит. Дело в том, что от алфавита зависит, сколько «весит» один символ.
Как только эти данные будут известны, можно умножить количество символов на информационный объем одного символа.
Что такое 1 бит?
Бит (русское обозначение: бит; международное: bit; от англ. binary digit — двоичное число; также игра слов: англ. bit — кусочек, частица) — единица измерения количества информации. 1 бит информации — это символ или сигнал, который может принимать два значения: включено или выключено, да или нет, высокий или низкий, заряженный или незаряженный; в двоичной системе исчисления это 1 (единица) или 0 (ноль).
Подробнее: https://ru.wikipedia.org/wiki/Бит
Источник
Информатика
7 класс
Урок № 6
Единицы измерения информации
Перечень вопросов, рассматриваемых в теме:
- Алфавитный подход к измерению информации.
- Наименьшая единица измерения информации.
- Информационный вес одного символа алфавита и информационный объём всего сообщения.
- Единицы измерения информации.
- Задачи по теме урока.
Тезаурус:
Каждый символ информационного сообщения несёт фиксированное количество информации.
Единицей измерения количества информации является бит – это наименьшаяединица.
1 байт = 8 бит
1 Кб (килобайт) = 1024 байта= 210байтов
1 Мб (мегабайт) = 1024 Кб = 210Кб
1 Гб (гигабайт) = 1024 Мб = 210 Мб
1 Тб (терабайт) =1024 Гб = 210 Гб
Формулы, которые используются при решении типовых задач:
Информационный вес символа алфавита и мощность алфавита связаны между собой соотношением: N = 2i.
Информационный объём сообщения определяется по формуле:
I = К · i,
I – объём информации в сообщении;
К – количество символов в сообщении;
i – информационный вес одного символа.
Основная литература:
- Босова Л. Л. Информатика: 7 класс. // Босова Л. Л., Босова А. Ю. – М.: БИНОМ, 2017. – 226 с.
Дополнительная литература:
- Босова Л. Л. Информатика: 7–9 классы. Методическое пособие. // Босова Л. Л., Босова А. Ю., Анатольев А. В., Аквилянов Н.А. – М.: БИНОМ, 2019. – 512 с.
- Босова Л. Л. Информатика. Рабочая тетрадь для 7 класса. Ч 1. // Босова Л. Л., Босова А. Ю. – М.: БИНОМ, 2019. – 160 с.
- Босова Л. Л. Информатика. Рабочая тетрадь для 7 класса. Ч 2. // Босова Л. Л., Босова А. Ю. – М.: БИНОМ, 2019. – 160 с.
- Гейн А. Г. Информатика: 7 класс. // Гейн А. Г., Юнерман Н. А., Гейн А.А. – М.: Просвещение, 2012. – 198 с.
Теоретический материал для самостоятельного изучения.
Любое сообщение несёт некоторое количество информации. Как же его измерить?
Одним из способов измерения информации является алфавитный подход, который говорит о том, что каждый символ любого сообщения имеет определённый информационный вес, то есть несёт фиксированное количество информации.
Сегодня на уроке мы узнаем, чему равен информационный вес одного символа и научимся определять информационный объём сообщения.
Что же такое символ в компьютере? Символом в компьютере является любая буква, цифра, знак препинания, специальный символ и прочее, что можно ввести с помощью клавиатуры. Но компьютер не понимает человеческий язык, он каждый символ кодирует. Вся информация в компьютере представляется в виде нулей и единичек. И вот эти нули и единички называются битом.
Информационный вес символа двоичного алфавита принят за минимальную единицу измерения информации и называется один бит.
Алфавит любого понятного нам языка можно заменить двоичным алфавитом. При этом мощность исходного алфавита связана с разрядностью двоичного кода соотношением: N = 2i.
Эту формулу можно применять для вычисления информационного веса одного символа любого произвольного алфавита.
Рассмотрим пример:
Алфавит древнего племени содержит 16 символов. Определите информационный вес одного символа этого алфавита.
Составим краткую запись условия задачи и решим её:
Дано:
N=16, i = ?
Решение:
N = 2i
16 = 2i, 24 = 2i, т. е. i = 4
Ответ: i = 4 бита.
Информационный вес одного символа этого алфавита составляет 4 бита.
Сообщение состоит из множества символов, каждый из которых имеет свой информационный вес. Поэтому, чтобы вычислить объём информации всего сообщения, нужно количество символов, имеющихся в сообщении, умножить на информационный вес одного символа.
Математически это произведение записывается так: I = К · i.
Например: сообщение, записанное буквами 32-символьного алфавита, содержит 180 символов. Какое количество информации оно несёт?
Дано:
N = 32,
K = 180,
I= ?
Решение:
I = К · i,
N = 2i
32 = 2i, 25 = 2 i, т.о. i = 5,
I = 180 · 5 = 900 бит.
Ответ: I = 900 бит.
Итак, информационный вес всего сообщения равен 900 бит.
В алфавитном подходе не учитывается содержание самого сообщения. Чтобы вычислить объём содержания в сообщении, нужно знать количество символов в сообщении, информационный вес одного символа и мощность алфавита. То есть, чтобы определить информационный вес сообщения: «сегодня хорошая погода», нужно сосчитать количество символов в этом сообщении и умножить это число на восемь.
I = 23 · 8 = 184 бита.
Значит, сообщение весит 184 бита.
Как и в математике, в информатике тоже есть кратные единицы измерения информации. Так, величина равная восьми битам, называется байтом.
Бит и байт – это мелкие единицы измерения. На практике для измерения информационных объёмов используют более крупные единицы: килобайт, мегабайт, гигабайт и другие.
1 байт = 8 бит
1 Кб (килобайт) = 1024 байта= 210байтов
1 Мб (мегабайт) = 1024 Кб = 210Кб
1 Гб (гигабайт) = 1024 Мб = 210 Мб
1 Тб (терабайт) =1024 Гб = 210 Гб
Итак, сегодня мы узнали, что собой представляет алфавитный подход к измерению информации, выяснили, в каких единицах измеряется информация и научились определять информационный вес одного символа и информационный объём сообщения.
Материал для углубленного изучения темы.
Как текстовая информация выглядит в памяти компьютера.
Набирая текст на клавиатуре, мы видим привычные для нас знаки (цифры, буквы и т.д.). В оперативную память компьютера они попадают только в виде двоичного кода. Двоичный код каждого символа, выглядит восьмизначным числом, например 00111111. Теперь возникает вопрос, какой именно восьмизначный двоичный код поставить в соответствие каждому символу?
Все символы компьютерного алфавита пронумерованы от 0 до 255. Каждому номеру соответствует восьмиразрядный двоичный код от 00000000 до 11111111. Этот код ‑ просто порядковый номер символа в двоичной системе счисления.
Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера, называется таблицей кодировки.Таблица для кодировки – это «шпаргалка», в которой указаны символы алфавита в соответствии порядковому номеру. Для разных типов компьютеров используются различные таблицы кодировки.
Таблица ASCII (или Аски), стала международным стандартом для персональных компьютеров. Она имеет две части.
В этой таблице латинские буквы (прописные и строчные) располагаются в алфавитном порядке. Расположение цифр также упорядочено по возрастанию значений. Это правило соблюдается и в других таблицах кодировки и называется принципом последовательного кодирования алфавитов. Благодаря этому понятие «алфавитный порядок» сохраняется и в машинном представлении символьной информации. Для русского алфавита принцип последовательного кодирования соблюдается не всегда.
Запишем, например, внутреннее представление слова «file». В памяти компьютера оно займет 4 байта со следующим содержанием:
01100110 01101001 01101100 01100101.
А теперь попробуем решить обратную задачу. Какое слово записано следующим двоичным кодом:
01100100 01101001 01110011 01101011?
В таблице 2 приведен один из вариантов второй половины кодовой таблицы АSСII, который называется альтернативной кодировкой. Видно, что в ней для букв русского алфавита соблюдается принцип последовательного кодирования.
Вывод: все тексты вводятся в память компьютера с помощью клавиатуры. На клавишах написаны привычные для нас буквы, цифры, знаки препинания и другие символы. В оперативную память они попадают в форме двоичного кода.
Из памяти же компьютера текст может быть выведен на экран или на печать в символьной форме.
Сейчас используют целых пять систем кодировок русского алфавита (КОИ8-Р, Windows, MS-DOS, Macintosh и ISO). Из-за количества систем кодировок и отсутствия одного стандарта, очень часто возникают недоразумения с переносом русского текста в компьютерный его вид. Поэтому, всегда нужно уточнять, какая система кодирования установлена на компьютере.
Разбор решения заданий тренировочного модуля
№1. Определите информационный вес символа в сообщении, если мощность алфавита равна 32?
Варианты ответов:
3
5
7
9
Решение:
Информационный вес символа алфавита и мощность алфавита связаны между собой соотношением: N = 2i.
32 = 2i, 32 – это 25, следовательно, i =5 битов.
Ответ:5 битов.
№2. Выразите в килобайтах 216 байтов.
Решение:
216 можно представить как 26 · 210.
26 = 64, а 210 байт – это 1 Кб. Значит, 64 · 1 = 64 Кб.
Ответ:64 Кб.
№3. Тип задания: выделение цветом
8х = 32 Кб, найдите х.
Варианты ответов:
3
4
5
6
Решение:
8 можно представить как 23. А 32 Кб переведём в биты.
Получаем 23х=32 · 1024 ·8.
Или 23х = 25 · 210 · 23.
23х = 218.
3х = 18, значит, х=6.
Ответ:6.
Источник
Роман Станиславович Юдин
5 октября 2018 · 3,4 K
Имею естественно научное образование, в юношестве прикипел к литературе, сейчас…
Перевести нужный фрагмет в систему счисления, которая указана в задании или нужна вам и посчитать количество символов, 1 символ = 1 байт. Если нужно чуть глубже, то вот отличная статья https://comnew.ru/text/yashin/03.htm
Где можно подсчитать количество символов в тексте?
В текстовом редакторе типа Word количество символов отображается на нижней панели, где показано количество страниц. Если там отображается только количество слов, кликните два раз на него, и откроется окошко с полной статистикой символов в тексте. Или можно воспользоваться он-лайн сервисами вроде simvoli.net, скопировав туда текст.
Прочитать ещё 5 ответов
Какое название у единицы КАЧества информации если КОЛичество информации измеряется в битах?
В отличие от количества информации, которое является конкретной, матемачически определенной величиной, под качеством информации могут подразумевать множество ее свойств, в зависимости от контекста, и не все из них вообще измеримы. Например, если в сообщении от камеры указана скорость автомобиля, то кроме количества инфмормации (скорее всего 32 или 64 бита на собственно число), можно оценить точность этого измерения (погрешность тогда будет измеряться либо в км/ч как и исходная величина, либо в процентах от переданного значения). Еще пример, у сообщения в новостях о некотором происшествии есть достоверность, т.е. вероятность того, что в сообщение отражает истинное положение дел. Эту вероятность нельзя точно знать, но можно оценить, например, по репутации новостного издания.
В каких единицах измеряют количество информации?
Имею высшее образование в сфере IT. Увлекаюсь компьютерами, чтением, спортом…
В науке общепринято измерять количество информации в битах. Поскольку бит это наименьшая единица измерения информации, а в современном мире используются огромные объемы информации, то для удобства вводят более крупные единицы измерения информации. К таким относят байт, он состоит из восьми бит, затем килобайт – 1024 байта, мегабайт – 1024 килобайта, гигабайт – 1024 мегабайта, терабайт – 1024 гигабайта. Существуют и более крупные единицы информации.
Прочитать ещё 6 ответов
Какой объем информации можно поместить в QR-код?
программист, эксперт в области высоких технологий
Количество информации, которую можно закодировать в QR-код, зависит от версии QR-кода (чем выше версия, тем больше точек, несущих информацию) и уровня коррекции ошибок (на самом высоком уровне может быть повреждено до 30% QR-кода, например, картинка затёрта, но данные считаются полностью).
Максимальное количество данных, как и было сказано, это 7089 чисел или 4296 символов.
Это могут быть числа и символы латинского алфавита, а также пробел, $ % * + — . / :
Кроме того, можно ещё кодировать двоичные данные – набор единиц и нулей.
Менять или подделывать QR-код не имеет смысла, поскольку можно взять QR-генератор и создать любой код с любой ссылкой.
QR-код – это просто графическое кодирование информации – весь стандарт открытый, генераторов бесплатный много. Он сделан так, чтобы QR-ридером можно было считать информацию вне зависимости от ориентации картинки и при частичной порчи этой картинки.
У QR-кода нет никакого срока годности. То есть можно будет открыть что-то или нет, зависит только от того, сохранится ли ссылка на сервере на определенный контент.
Прочитать ещё 6 ответов
Источник
Проповедник 6 лет назад Каждая буква считается за 8 бит. Вот и считайте, сколько там букв и умножайте на 8. 80 будет. Правда, если считать это в интернет-символах, то получается, что каждая буква по3 символа занимает, например и=%D0. Так что это уже в 3 раза больше. Но, думаю, в школьной информатике это не учитывается. система выбрала этот ответ лучшим Зависит от кодировки, а именно, от количества информации, которая выделяется каждому символу. В кодировке КОИ-8, каждый символ кодируется одним байтом. В слове “информация” 10 букв, значит информационный объём данного слова равен 10-ти байтам. В кодировке UNICODE, каждый символ кодируется двумя байтами. Соответсвенно, инф. объём равен 2*10 = 20-ти байтам. [пользователь заблокирован] 6 лет назад 2байта на каждый символ, если это юникод, в слове информация – 10 букв(символов), значит 20 байт Syshka 6 лет назад если не ошибаюсь, то информационный вес слова “информация” = 80 бит, то есть 10 байт В слове информация десять букв. Это значит, что это слово занимает 10 байт в памяти если кодируется по системе ASCII, в которой на один символ приходится один байт. Если же информация кодируется по системе Unicode, то тогда вдвое больше, то есть 20 байт, так как в системе Unicode на каждый символ выделяется по два байта, что позволяет закодировать до 65536 символов. Kobayashi 2 года назад Информационный объем в словах считается просто в буквах. И каждая из них равна числу восемь, а в слове информация десять букв. Что мы делаем просто умножаем восемь на десять и получаем ответ на ваш вопрос. Это информационный объем слова информация будет равен восьмидесяти. Знаете ответ? |
Источник