Начальная

Windows Commander

Far
WinNavigator
Frigate
Norton Commander
WinNC
Dos Navigator
Servant Salamander
Turbo Browser

Winamp, Skins, Plugins
Необходимые Утилиты
Текстовые редакторы
Юмор

File managers and best utilites

Реферат: Содержательный подход к измерению информации. Реферат на тему алфавитный подход к измерению информации


Персональный сайт - Алфавитный подход к измерению информации. Информационная деятельность человека

Алфавитный подход к измерению информации

Вы научились определять количество информации, которое содержится в сообщениях, уменьшающих неопределенность наших знаний, т. е. мы рассматривали информацию со своей точки зрения - с позиции человека. Для нас количество информации зависит от ее содержания, понятности и новизны. Например, в опыте по доставанию шара из корзины одинаковое количество информации содержится и в зрительном образе (мы видим красный шар), и во фразе «Красный шар», и в длинной фразе «Я достал красный шар».

Однако любое техническое устройство не воспринимает содержание информации. Здесь не работают «неопределенность знаний» и «вероятность информации». Поэтому в вычислительной технике используется другой подход к измерению информации. Вокруг нас везде и всюду происходят информационные обмены. Информацией обмениваются между собой люди, животные, технические устройства, органы человека или животного и т.д. во всех этих случаях передача информации происходит в виде последовательностей различных сигналов. В вычислительной технике такие сигналы кодируют определенные смысловые символы, т.е. такие сигналы кодируют последовательности знаков - букв, цифр, кодов цвета точек и т.д. С этой точки зрения рассматривается другой подход к измерению информации - алфавитный.

Каким образом в этом случае можно найти количество информации. Рассмотрим пример.

У нас есть небольшой текст, написанный на русском языке. Он состоит из букв русского алфавита, цифр, знаков препинания. Для простоты будем считать, что символы в тексте присутствуют с одинаковой вероятностью. Множество используемых в тексте символов называется алфавитом. В информатике под алфавитом понимают не только буквы, но и цифры, и знаки препинания, и другие специальные знаки. У алфавита есть размер (полное количество его символов), который называется мощностью алфавита.

Обозначим мощность алфавита через N. Тогда воспользуемся формулой для нахождения количества информации их вероятностного подхода: I = log2N.

Для расчета количества информации по этой формуле нам необходимо найти мощность алфавита N. На самом деле мы уже рассчитывали мощность алфавита, когда рассматривали кодирование текстовой информации (найдите упражнение в уроке 5). Найдем N для нашей задачи.

Пример 1

Найти объём информации, содержащейся в тексте из 3000 символов, написанном русскими буквами.

Решение:

1. Найдем мощность алфавита: N = 33 русских прописных буквы + 33 русских строчных букв + 21 специальный знак = 87 символов.

Подставим в формулу и рассчитаем количество информации:

2. I = log287 = 6,4 бита.

Такое количество информации - информационный объем - несет один символ в русском тексте. Теперь, чтобы найти количество информации во всем тесте, нужно найти общее количество символов в нем и умножить на информационный объем одного символа. Пусть в тексте 3000 символов. Значит: 3. 6,4-3000 =19140 бит.

Теперь дадим задание переводчику перевести этот текст на немецкий язык. Причем так, чтобы в тексте осталось 3000 символов. Содержание текста при этом осталось точно такое же. Поэтому с точки зрения вероятностного подхода количество информации также не изменится, т.е. новых и понятных знаний не прибавилось и не убавилось.

Пример 2

Найти количество информации, содержащейся в немецком тексте с таким же количеством символов.

Решение:

Найдем мощность немецкого алфавита:

1. N = 26 немецких прописных буквы + 26 немецких строчных букв + 21 специальный знак = 73 символа.

Найдем информационный объем одного символа:

2. I = log273 = 6,1 бит. Найдем объем всего текста. 3. 6,1*3000= 18300 бит.

Сравнивая объемы информации русского текста и немецкого, мы видим, что на немецком языке информации меньше, чем на русском. Но ведь содержание не изменилось. Следовательно, при алфавитном подходе к измерению информации ее количество не зависит от содержания, а зависит от мощности алфавита и количества символов в тексте. С точки зрения алфавитного подхода, в толстой книге информации больше, чем в тонкой. При этом содержание книги не учитывается.

Правило для измерения информации с точки зрения алфавитного подхода.

1. Найти мощность алфавита - N.

2. Найти информационный объем одного символа - I = log2N.

3. Найти количество символов в сообщении - К. 4. Найти информационный объем всего сообщения — К*I.

Пример 3

Найти объем текста, записанного на языке, алфавит которого содержит 128 символов и 2000 символов в сообщении.

Дано: К = 2000, N = 128.

Найти: Iт - ?

Решение: 1. I = log2N = log2128 = 7 бит - объем одного символа. 2. Iт= I*K = 7-2000 = 14000 бит - объем сообщения.

Ответ: 14000 бит.

2. Другие единицы измерения информации

В компьютере также используется свой алфавит, который можно назвать компьютерным. Количество символов, которое в него входит, равно 256 символов. Это мощность компьютерного алфавита. Также мы выяснили, Что закодировать 256 разных символом можно с помощью 8 бит. 8 бит является настолько характерной величиной, что ей присвоили свое название - байт.

Итак, следующая по величине единица измерения информации - байт. 1 байт = 8 битам.

Используя этот факт можно быстро подсчитать количество информации, содержащееся в компьютерном тексте, т.е. тексте, набранном с помощью компьютера. А, учитывая, что большинство статей, книг, публикаций и т.д. написаны с помощью текстовых редакторов, то таким способом можно найти информационный объем любого сообщения, созданного подобным образом.

Пример 4

Найти информационный объем страницы компьютерного текста. Пояснение: возьмите в качестве примера реальный текст из какой-нибудь учебника без картинок. Расчеты производить приблизительно.

Решение:

1. Найдем информационный объем одного символа: I = log2N, N = 256 I = log2256 = 8 бит = 1 байт.

2. Найдем количество символов на странице. Примерно. ? Как можно это сделать быстро? (Найти количество символов в строке и умножить на количество строк.)

Пояснение: пусть дети выберут произвольную строку и подсчитают количество символов в ней, учитывая все знаки препинания и пробелы. Упростите до целого значения. 40 символов 50 строк = 2000 символов.

3. Найдем информационный объем всей страницы: 2000 • 1 = 2000 байт. Ответ: 2000 байт.

Вывод: дело в том, что информационный объем одного символа несет как раз 1 байт информации. Поэтому достаточно подсчитать количество символов в тексте, которое и даст объем текста в байтах. Например, если в тексте 3000 символов, то его информационный объем равен 3000 байтам. Согласитесь, что байт - маленькая единица измерения информации.

Пример 5

Найти информационный объем небольшой книги в 130 страниц. Пояснение: страницы взять из предыдущей задачи. Решение: 2000 байт • 130 = 260000 байт. Ответ: 260000 байт.

И это информационный объем только одной книги! А если взять объем целой библиотеки? Получится очень большое число.

Для измерения больших объемов информации используют следующие единицы:

1 килобайт = 1 Кб = 210 байт = 1024 байта;

1 мегабайт = 1 Мб = 210 Кб = 1024 Кб;

1 гигабайт = 1 Гб = 210 Мб = 1024 Мб.

Примеры объемов информации.

Страница книги

2,5 Кбайт

Учебник

0,5 Мбайт

БСЭ

120 Мбайт

Газета

150 Кбайт

Черно-белый телевизионный кадр

300 Кбайт

Цветной кадр из трех цветов

1 Мбайт

1,5-часовой цветной художественный фильм

135 Гбайт

В 100 Мб можно уместить:

Страниц текста

50000

Цветных слайдов высочайшего качества

150

Аудиозапись

1,5 часа

Музыкальный фрагмент качества CD-стерео

10 минут

Фильм высокого качества записи

15 секунд

Протоколы операций по банковским счетам

За 1000 лет

Обмен информацией происходит с разной скоростью. Если говорить о людях, то темп речи очень важен для взаимопонимания. Некоторые люди разговаривают очень медленно, другие - наоборот быстро (тараторят). И с теми и с другими иногда слушателю бывает некомфортно. Скорость чтения также у людей бывает разная. Конечно, хорошо обладать высокой скоростью чтения, больше книг можно прочитать. Существуют даже специальные приемы развития высокой скорости чтения. Скорость передачи информации называется скоростью информационного потока и выражается в битах в секунду (бит/с), байтов в секунду (байт/с), Кбайтов в секунду (Кб/с) и т.д.

Скорость чтения и скорость речи можно вычислить. Скорость информационного потока в случае, когда он происходит между техническими устройствами, намного выше, чем между людьми. Прием и передачи информации в этом случае происходит по каналам связи.

К основным характеристикам каналов связи относятся:

  1. максимальная скорость передачи информации по каналу связи называется пропускной способностью канала;
  2. надежность;
  3. стоимость;
  4. резервы развития.

В следующей таблице приведены характеристики некоторых каналов связи.

Тип связи

Скорость передачи данных (Мбит/с)

Помехоустойчивость

Наращиваемость

Электрический кабель:

- витая пара

- коаксиальный кабель

10-100

до 10

Низкая

Высокая

Простоая Проблематичная

Телефонная линия

1-2

Низкая

Без проблем

Оптические светодиоды (Сверхтонкие силиконовые волокна)

10 - 200

Абсолютная

Без проблем

Пояснение: таблицу подготовьте заранее на доске или на бумаге и раздайте детям.

Анализируя эту таблицу, можно сказать, что сегодня предпочтение отдается высокосортному оптоволокну. Информация по таким каналам связи передается в виде светового сигнала, посылаемого лазерным излучателем. Например, при скорости 50 Мбайт/с в течение 1 минуты передается объем информации, равный содержанию 10 школьных учебников.

Завершающая часть:

Задания:

Перевести объем книги из примера 5 в другие единицы измерения.

Решение: 260000/1024 = 253,90625 Кб. 253,90625/1024 = 0, 247955 Мб.

Найти х из соотношения: 16х байт = 256 Мбайт.

1. Как определяется количество информации с алфавитной точки зрения? Выучить правило для измерения информации с точки зрения алфавитного подхода.

2. Выучить единицы измерения информации.

Уровень понимания:

1. В чем отличие алфавитного подхода к измерению информации от вероятностного?

2. Выразите:

3 Кбайта в байтах и битах;

81920 бит в байтах и Кбайтах;

3072 Мбайта в Гбайтах и Кбайтах.

3. Мощность некоторого алфавита равна 64 символам. Каким будет объем информации в тексте, состоящем из 100 символов.

Уровень применения: определите свою скорость речи и скорость чтения с точки зрения информатики.

Творческий уровень:

1. Наберите на домашнем компьютере текст, информационный объем которого равен 2400 байт.

2. Наберите на домашнем компьютере текст, содержащий не нулевое количество символов и информационный объем которого равен нулю.

class-8.ucoz.ru

Урок информатики и ИКТ "Измерение информации. Алфавитный подход"

Разделы: Информатика

Цель урока: познакомить с понятиями: “измерение информации”, “алфавит”, “мощность алфавита”, “алфавитный подход в измерении информации”, научить измерять информационный объём сообщений, с учётом информационного веса символов.

Тип урока: объяснительно-демонстрационный с элементами практикума.

Нагляднось: презентация “Измерение информации” (приложение 1).

Учебная литература: учебник “Информатика”. 8-й класс (базовый курс) И.Г.Семакин, “Информатика” задачник-практикум (1 часть) И.Г.Семакин.

Требования к знаниям и умениям:

Учащиеся должны знать:

  • что такое “алфавит”, “мощность алфавита”, “алфавитный подход в измерении информации”;
  • как измерить информационный объём;
  • как определяется единица измерения информации бит;
  • что такое байт, килобайт, мегабайт, гигабайт.

Учащиеся должны уметь:

  • приводить примеры сообщений, несущих 1 бит информации;
  • измерять информационный объем текста;
  • представлять количество полученной информации в различных единицах (битах, байтах, килобайтах, мегабайтах, гигабайтах).

План урока

  1. Орг. момент - 1 мин.
  2. Проверка домашнего задания - 2 мин.
  3. Новый материал. Измерение информации. Алфавитный подход - 25 мин.
  4. Закрепление изученного - 14 мин.
  5. Подведение итогов урока. - 2 мин.
  6. Домашнее задание - 1 мин.

Содержание урока

I. Орг. момент.

II. Проверка домашнего задания.

Задачник-практикум № 1. с. 11 № 2, 5, 8, 11, 19*.

III. Новый материал.

1. Введение.

Процесс познания окружающего мира приводит к накоплению информации в форме знаний.

Как же узнать, много получено информации или нет?

Необходимо измерить объём информации. А как это сделать мы сегодня узнаем.

Получение новой информации приводит к расширению знаний или, как иначе можно сказать, к уменьшению неопределённости знания.

Если некоторое сообщение приводит к уменьшению неопределённости нашего знания, то можно сказать, что такое знание содержит информацию (рисунок 1).

2. Как можно измерить количество информации.

Для измерения различных величин существуют эталонные единицы измерения.

Например:

  • Расстояние измеряют в миллиметрах, сантиметрах, дециметрах…
  • Массу измеряют в граммах, килограммах, тоннах…
  • Время измеряют в секундах, минутах, сутках, годах…

Следовательно, для измерения информации должна быть введена своя эталонная единица.

Существует два подхода к измерению информации:

а) Содержательный (вероятностный). Количество информации связывается с содержанием (смыслом) полученного сообщения или с учётом вероятности событий.

б) Алфавитный. Позволяет измерять информационный объём текста на любом языке (естественном или формальном), при использовании данного подхода объём информации не связывают с содержанием текста, в данном случае, объём зависит от информационного веса символов.

3. Алфавитный подход к измерению информации.

- Давайте вспомним, что же такое алфавит?

  • Алфавит – весь набор букв, знаков препинания, цифр, скобок и других символов, используемых в тексте.

*Алфавит включают и пробел (пропуск между словами).

- Что такое мощность алфавита?

  • Мощность алфавита - полное число символов в алфавите.

Например: мощность алфавита русских букв и используемых символов равна 54:

33 буквы + 10 цифр + 11 знаков препинания, скобки, пробел.

Наименьшую мощность имеет алфавит, используемый в компьютере (машинный язык), его называют двоичным алфавитом, т.к. он содержит только два знака “0”, “1”.

Информационный вес символа двоичного алфавита принят за единицу измерения информации и называется 1 бит.

Попробуйте определить объём информационного сообщения:

Информация, записанная на машинном языке, весит:

01110 - … бит

010010 - … бит

010 - … бита

0111111011110 - … бит

При алфавитном подходе считают, что каждый символ текста, имеет информационный вес.

Информационный вес символа зависит от мощности алфавита.

С увеличением мощности алфавита, увеличивается информационный вес каждого символа.

Для измерения объёма информации необходимо определить сколько раз информация равная 1 биту содержится в определяемом объёме информации.

Например:

1) Возьмём четырёхзначный алфавит (придуманный), (рисунок 2).

Все символы исходного алфавита можно закодировать всеми возможными комбинациями, используя цифры двоичного алфавита.

Получим двоичный код каждого символа алфавита. Для того чтобы закодировать символы алфавита мощность которого равна четырём, нам понадобится два символа двоичного кода.

Следовательно, каждый символ четырёхзначного алфавита весит 2 бита.

2) Закодируйте с помощью двоичного кода каждый символ алфавита, мощность которого равна 8 (рисунок 3) .

Вывод. Весь алфавит, мощность которого равна 8 можно закодировать на машинном языке с помощью трёх символов двоичного алфавита (рисунок 4).

- Как вы думаете, каков информационный объём каждого символа восьмизначного алфавита?

Каждый символ восьмизначного алфавита весит 3 бита.

3). Закодируйте с помощью двоичного кода каждый символ алфавита, мощность которого равна 16.

- Какой можно сделать вывод?

Алфавит из шестнадцати символов можно закодировать с помощью четырёхзначного двоичного кода.

- Решите задачу.

Задача: Какой объём информации содержат 3 символа 16 – символьного алфавита?

Решение:

Так как каждый символ алфавита мощностью 16 знаков можно закодировать с помощью четырёхзначного двоичного кода, каждый символ исходного алфавита весит 4 бита.

Так как всего использовали 3 символа алфавита мощностью 16 символов, следовательно: 4 бит • 3 = 12 бит

Ответ: объём информации записанный 3 знаками алфавита мощностью 16 символов равен 12 бит.

Запишем таблицу соответствия мощности алфавита (N) и количеством знаков в коде (b) - разрядностью двоичного кода.

- Найдите закономерность (рисунок 5)!

- Какой вывод можно сделать?

Вывод.

Информационный вес каждого символа, выраженный в битах (b), и мощность алфавита (N) связаны между собой формулой: N = 2b

Алфавит, из которого составляется на компьютере текст (документ) состоит из 256 символов.

Этот алфавит содержит символы: строчные и прописные латинские и русские буквы, цифры, знаки арифметических операций, всевозможные скобки, знаки препинания и другие символы.

- Узнайте, какой объём информации содержится в одном символе алфавита, мощность которого равна 256.

Решение. Из формулы N = 2b следует 256 = 28.

Вывод. Значит, каждый символ алфавита используемого в компьютере для печати документов весит 8 бит.

Эту величину приняли так же за единицу измерения информации и дали название байт.

8 бит = 1 байт

Задача. Статья содержит 30 страниц, на каждой странице - 40 строк, в каждой строке 50 символов. Какой объём информации содержит статья?

Ход решения.

1) На каждой странице 50 • 40 = 2000 символов;

2) во всей статье 2000 • 30 = 60000 символов;

3) т.к. вес каждого символа равен 1 байту, следовательно, информационный объём всей статьи 60000 • 1 = 60000 байт или 60000 • 8 = 480000 бит.

- Как видно из задачи байт “мелкая” единица измерения информационного объёма текста, поэтому для измерения больших объёмов информации используются более крупные единицы.

Единицы измерения информационного объёма:

1 килобайт = 1 Кб = 210 байт = 1024 байт

1 мегабайт = 1 Мб = 210 Кб = 1024 Кб

1 гигабайт = 1 Гб = 210 Мб = 1024 Мб

- Попробуйте перевести результат задачи, в более крупные единицы измерения:

    60000 байт • 58,59375 Кб

    60000 байт • 0,057 Мб

IV. Закрепление изученного.

Задачник-практикум № 1. С. 19 № 19, 20, 22, 23, 25.

V. Подведение итогов.

VI. Домашнее задание.

Задачник-практикум № 1. с. 20 № 21, 24, 26.

xn--i1abbnckbmcl9fb.xn--p1ai

Реферат - Содержательный подход к измерению информации

ИНФОРМАТИКА

 

 

Методические рекомендации к лабораторным работам по информатике для студентов специальности «Информационные системы и технологии»

(часть I)

 

Нижний Новгород

 

 

ББК – 32.973 – 018.2

К – 84

 

 

Круподерова Е.П. Информатика: Методические рекомендации к лабораторным работам по информатике для студентов специальности «Информационные системы и технологии» (часть I)– Н. Новгород: Изд-во ВГИПУ, 2009. – 110 с.

 

 

Методические рекомендации предназначены для студентов специальности 230201.65 «Информационные системы и технологии». Изложены цели лабораторных работ, краткие теоретические сведения, задания к лабораторным работам. Методические рекомендации могут быть использованы студентами других специальностей в курсе информатики.

 

 

© Круподерова Е.П., 2009

© ВГИПУ, 2009

 

 

Лабораторная работа «Представление и измерение информации в

компьютере»

Цель работы:

1. Познакомиться с содержательным и алфавитным

подходом к измерению информации

2. Освоить способы кодирования числовой, текстовой,

графической и звуковой информации

3. Научиться определять количество информации в файлах различных

типов

Краткие сведении из теории

Содержательный подход к измерению информации

Попытки количественного измерения информации предпринимались неоднократно, но наиболее глубоко эти вопросы были разработаны и обобщены одним из авторов теории информации, американским инженером К. Шенноном в 1948 г.

В теории информации количеством информации называют числовую характеристику сигнала, не зависящую от его формы и содержания и характеризующую неопределенность, которая исчезает после получения сообщения в виде данного сигнала. В этом случае количество информации зависит от вероятности получения сообщения о том или ином событии.

Предположим, что ожидается поступление некоторого сообщения. До прихода сообщения существует некоторая неопределенность относительно того, что будет содержать это сообщение. Приход сообщения уничтожает эту неопределенность. Чем больше неопределенность, ликвидируемая поступающим сообщением, тем большее количество информации оно содержит.

Р. Хартли предложил информацию (I), приходящуюся на одно сообщение, определять логарифмом общего числа возможных сообщений (N).

I(N) = logN

 

Если множество возможных сообщений состоит из одного (N =1 ), то

I(1) = log 1 = 0,

что соответствует отсутствию информации в этом случае.

В простейшем случае неопределенности выбор делается между двумя взаимоисключающими равновероятными сообщениями. Неопределенность, ликвидируемая приходом такого сообщения, принимается за единицу информации – 1 бит. Поэтому, если в приведенных выше формулах использовать логарифм по основанию два, то количество информации окажется выраженным и битах (например, при двух равновероятных сообщениях):

I(2) = log2 2 = 1 бит

Задача 1:

Какое количество информации несет в себе сообщение о том, что нужная вам программа находится на одной из восьми дискет?

Решение:

Поскольку события равновероятны воспользуемся формулой I = log2N.

I = log28 = 3.

Задача 2:

При игре в кости используется кубик с шестью гранями. Сколько бит информации получает игрок при каждом бросании кубика?

Решение:

Выпадение каждой грани кубика равновероятно. Поэтому I = Iog26.

I = 2,585 бит.

Вышеприведенная формула Р. Хартли позволяет определить количество информации в сообщении только для случая, когда сообщения равновероятны и статистически независимы.

К. Шеннон предложил в качестве меры неопределенности источника сообщений, осуществляющего выбор из N состояний, каждое из которых реализуется с вероятностью рi(i = 1,2,..., N), использовать функцию:

I = — ∑pi log2 pi

Если все сообщения равновероятны, то pi = 1/N и I = log2N= Н max. Если вероятность одного из сообщений равна 1, а всех остальных — 0, то количество информации в этом случае равно 0. Для всех остальных случаев справедливо неравенство:

 

0< I<log2N

Задача 3.

В непрозрачном мешочке хранятся 10 белых, 20 красных, 30 синих и 40 зеленых шариков. Какое количество информации будет содержать зрительное сообщение о цвете вынутого шарика.

Решение:

Так как количество шариков различных цветов неодинаково, то зрительное сообщение о цвете вынутого из мешочка шарика также различаются и равны количеству шариков данного цвета деленному на общее количество шариков: рб = 0,1; рк = 0,2; р3 = 0,3; рс = 0,4.

События не равновероятны, поэтому для определения количества информации, содержащейся в сообщении о цвете шарика, воспользуемся формулой: I = — ∑pi log2 pi

 

I = — (0,1* log 2 0,l +0,2 * log2 0,2 +0,3 * log2 0,3 +0,4* log20,4) бит =

— (0,1 * (-1) + 0,2 * (-0,7) + 0,3 * (-0,5) + 0,4 * ( — 0,4)) = 0,55 бит.

www.ronl.ru


Смотрите также

 

..:::Новинки:::..

Windows Commander 5.11 Свежая версия.

Новая версия
IrfanView 3.75 (рус)

Обновление текстового редактора TextEd, уже 1.75a

System mechanic 3.7f
Новая версия

Обновление плагинов для WC, смотрим :-)

Весь Winamp
Посетите новый сайт.

WinRaR 3.00
Релиз уже здесь

PowerDesk 4.0 free
Просто - напросто сильный upgrade проводника.

..:::Счетчики:::..

 

     

 

 

.