Контрольная работа 1 количество информации: Контрольная работа «Количество информации. Алфавитный подход» 8 Класс, Информатика

Содержание

Контрольная работа «Количество информации. Алфавитный подход» 8 Класс, Информатика

Контрольная работа «Количество информации. Алфавитный подход»
8 класс
  Вариант 1 ФИО____________________________________________

  1. Определить количество информации, получаемой при вытаскивании одной карты из колоды, состоящей из 32 карт. __________

  1. Сколько символов в алфавите, если один символ этого алфавита несет 4 бит информации?____________

  1. Перевести: 16 бит =____ байт? 20 байт=____ бит?

  1. В коробке лежат 32 цветных карандаша. Сообщение о том, что достали белый карандаш, несет 4 бит информации. Сколько белых карандашей ? __________

  1. При составлении сообщения использовали  128-символьный алфавит. Каким будет информационный объём такого сообщения, если оно содержит 2048 символов?_______________

  1. Сообщение занимает  2 страницы. На каждой странице по 80 строк. В каждой строке по 32 символа. Найдите информационный объём такого текста, если при его составлении использовали 256-символьный алфавит. _____________________

  1. Сообщение занимает  4 страницы по 40 строк и содержит 7200 байтов информации. Сколько символов в строке, если при составлении этого сообщения использовали 64-символьный алфавит?___________________________

  1. Информационное сообщение объёмом 3 Кбайта содержит 3072 символов. Каков размер алфавита, с помощью которого оно было составлено?_________________

  1. Переведите из одной единицы измерения в другую:

5 байт = _______________бит

8 килобайт = ___________байт

1 мегабайт = _________________ байт

88 бит = ___________________ байт

5120 терабайт = ___________ гигабайт

  1. Емкость компакт диска CD-R 700 Мб. Какова емкость диска в килобайтах, байтах и битах?_________________________________

  2. Два игрока играют в крестики-нолики на клетчатом поле 5×5 клеток. Какое количество информации при этой игре получит второй игрок после третьего хода первого игрока?_______________________

  3. Количество информации в сообщении, содержащем 2048 символа, составил 1/512 часть Мбайта. Каков размер алфавита, с помощью которого было записано сообщение?___________________________

  4. Для записи текста использовался 16-символьный алфавит. Каждая страница содержит 30 строк по 50 символов в строке. Какое количество информации содержат 6 страниц текста? _________

Контрольная работа «Количество информации. Алфавитный подход» 8 класс 

Вариант 2 ФИО _________________________________________________________

1. При составлении сообщения использовали  64-символьный алфавит. Каким будет информационный объём такого сообщения, если оно содержит 3072 символов?____________

2. Сообщение занимает   3 страницы. На каждой странице по 48 строк. В каждой строке по 64 символа. Найдите информационный объём такого текста, если при его составлении использовали 256-символьный алфавит._____________________________________

3. Дано информационное сообщение объёмом 3 Кбайта.  Сколько  в нем символов, если размеры алфавита, с помощью которого оно было составлено, равен 16?__________________

4. Сообщение занимает  3 страницы и содержит 7875 байтов информации. Сколько строк в тексте, если символов в строке 50 и при составлении этого сообщения использовали 128-символьный  алфавит?_______________________________________________

5. Переведите из одной единицы измерения в другую:

9 байт = _______________бит

18 килобайт = ___________байт

4 мегабайта = ________________ байт

152 бита = ___________________ байт

11264 терабайт = ___________ гигабайт

6. Определить количество информации, получаемой при вытаскивании одного шарика из коробки с 8 шариками; с 64 шариками. ______________________________

7. Сколько различных слов в племени Тумбоюмбо, если нужно всего 5 бит, чтобы закодировать каждое из этих слов?____________________________________

  1. Перевести: 16 байт=____ бит? 32 бит=____ байт?

  1. В корзине лежат 64 шара. Сообщение о том, что достали черный шар несет 4 бит информации. Сколько черных шаров в корзине?____________________________

  2. ЕмкостьUSB-флешки 256 Мбайт. Какова емкость USB-флешки в битах, байтах, килобайтах?______________________

  3. Из непрозрачного мешочка вынимают шарики с номерами и известно, что информационное сообщение о номере шарика несет 6 битов информации. Определите количество шариков в мешочке.___________________________

  4. Количество информации в сообщении, содержащем 4096 символов, составил 1/1024 часть Мбайта. Каков размер алфавита, с помощью которого было записано сообщение?__________

  5. Для записи текста использовался 16-символьный алфавит. Каждая страница содержит 30 строк по 50 символов в строке. Какое количество информации содержат 6 страниц текста? _________

Контрольная работа по Информатике «Информация, количество информации» 8 класс

Контрольная работа №1 «Информация, количество информации»

Цель урока: контроль знаний и умений по теме: «Информация, количество информации»

Ход урока:

  1. Орг. момент.

  2. Выполнение контрольной работы

Вариант 1.

1. Подберите синоним слову информация…

а) объем б) количество с) сведения д) процесс

2. Минимальная единица количества информации..

а) бит б) байт с) килобайт д) бод

3. Выберите верное соотношение

а) 1 кбайт = 1024 Мбайт б) 1 Гбайт = 1024 кбайт с) 1 Тбайт = 1024 Гбайт д) 1 Мбайт = 1024 байт

4. В одну половину замкнутого сосуда поместили газ. Через некоторое время в результате

беспорядочного движения молекулы газа заполнили весь сосуд. При этом…

а) произошел переход из менее вероятного упорядоченного состояния в более вероятное хаотическое состояние

б) информация при этом увеличилась

5. Информация о результате падения монеты приводит к уменьшению неопределенности знания в …
а) 2 раза б) 4 раза с) 5 раз д) в 8 раз

Задачи

  1. Емкость компакт диска CD-R 700 Мб. Какова емкость диска в килобайтах, байтах и битах?

  2. Два игрока играют в крестики-нолики на клетчатом поле 5×5 клеток. Какое количество информации
    при этой игре получит второй игрок после третьего хода первого игрока?

  3. Количество информации в сообщении, содержащем 2048 символа, составил 1/512 часть Мбайта.
    Каков размер алфавита, с помощью которого было записано сообщение?

  4. Для записи текста использовался 16-символьный алфавит. Каждая страница содержит 30 строк по
    50 символов в строке. Какое количество информации содержат 6 страниц текста? Приведите примеры
    систем управления техническими устройствами.

Вариант 2.

  1. Наибольшее количество информации (около 90%) человек получает с помощью…
    а) слуха б)зрения с) осязания д)вкуса

  2. Информационная емкость одного знака двоичной знаковой системы составляет…

    а) 1 бит б) 1 байт с) 1 кбайт д) 1 бод

3.Выберите верное соотношение..

а) 1 бит = 8 байт б) 1 бит = 1 байт с) 1 байт = 8 бит д) 1 байт = 1024 бит

4. Выберите верный ответ:

а) Получение новой информации приводит к уменьшению неопределенности знания

б) Получение новой информации приводит к увеличению неопределенности знания

5. Информационное сообщение несет 3 бита информации. При этом количество возможных
информационных сообщений …

а) 2 6)3 с) 6 д)8

Задачи.

  1. Емкость USB-флешки 256 Мбайт. Какова емкость USB-флешки в битах, байтах, килобайтах?

  2. Из непрозрачного мешочка вынимают шарики с номерами и известно, что информационное

    сообщение о номере шарика несет 6 битов информации. Определите количество шариков в мешочке.

  3. Количество информации в сообщении, содержащем 4096 символов, составил 1/1024 часть Мбайта.
    Каков размер алфавита, с помощью которого было записано сообщение?

  4. Для записи текста использовался 32-символьный алфавит. Каждая страница содержит 30 строк по
    70 символов в строке. Какое количество информации содержат 3 страницы текста? (Подсказываю:
    найдите количество информации, приходящееся на 1 символ)

ОТВЕТЫ:

Вариант 1. 1 с, 2 а, 3 с, 4 а, 5 а; 7-5 бит, 8 — 256 символов, 9 — 4,4 кбайт

Вариант 2. 1 б, 2а, 3 с, 4 а, 5 д, 7 — 64, 8-4 символа, 9-3, 8 кбайт

  1. Итоги.

  2. Д/ з повторить

Контрольная работа по информатике на тему «Количество информации. Единицы измерения информации»

Контрольная работа по информатике на тему

 «Количество информации. Единицы измерения информации»

Карточка №1

 

Памятка

 

Задание 1:

 

Переведите из одних единиц измерения информации в другие.

20Кбайт = …байт                              64 Кбайт = …Мбайт
12 бит = …байт                                9 байт = …бита.

 

Задание 2:

 

Вычислить, сколько байтов содержится в одном мегабайте.

 

Задание 3:

 

Оцените информационный объем следующего предложения:

Тяжело в ученье – легко в бою! (ответ в байтах и битах)

 

Задание 4:

 

 Алфавит состоит из 100 символов. Какое количество информации несет один символ этого алфавита? 


Дано:                                                 Решение: 

Задание 5:

 

Один символ алфавита «весит» 4 бита. Сколько символов в этом алфавите? 


Дано:                                                           Решение: 


Задание 6:

Сообщение, записанное буквами из 64-символьного алфавита, содержит 20 символов. Какой объем информации оно несет? 
        Дано:                                                        Решение: 

 

 

 

Карточка №2

 

Памятка

                                   

 

Задание 1:

Переведите из одних единиц измерения информации в другие.

64 бит = …байт                                            28 Кбайт = …Мбайт
10Кбайт = …байт                                        10байт = …бит.

 

Задание 2.

 

 Вычислите,  сколько килобайтов содержится в  4096 битах.

 

Задание 3:

 

Считая,  что  каждый  символ  кодируется  одним  байтом,  оцените информационный объем сообщения:

Без труда не вытащишь рыбку из пруда! (ответ в байтах и битах)

Задание 4:

Алфавит русского языка иногда оценивают в 32 буквы. Каков информационный вес одной буквы такого сокращенного русского алфавита? 


Дано:                                    Решение: 

 

 

Задание 5:

 

Каждый символ алфавита записан с помощью 8 цифр двоичного кода. Сколько символов в этом алфавите? 

Дано:                                                   Решение: 

 

Задание 6:

Сообщение, записанное буквами из 64-символьного алфавита, содержит 20 символов. Какой объем информации оно несет? 
        Дано:                                                        Решение: 

 

 

 

 

Ключ к заданиям

 

Карточка 1

 

Задание 1:

 

Переведите из одних единиц измерения информации в другие.

20Кбайт =  20480 байт                         64 Кбайт = 0,0625 Мбайт
12 бит = 1,5 байт                                  9 байт = 72 бита.

 

Задание 2:

Вычислить, сколько байтов содержится в одном мегабайте.

Решение: 

мегабайт  *   килобайт  *    байт

1*1024*1024=1048576 байт.

Ответ 1048576 байт.

 

Задание 3:

 

Оцените информационный объем следующего предложения:

Тяжело в ученье – легко в бою!

Так как каждый символ кодируется одним байтом, нам только нужно подсчитать количество символов, но при этом не забываем считать знаки препинания и пробелы. Всего получаем 30 символов. А это означает, что информационный объем данного сообщения составляет 30 байтов или 30 * 8 = 240 битов.

 

Задание 4:

 

 Алфавит состоит из 100 символов. Какое количество информации несет один символ этого алфавита? 
Дано:                                             Решение: 

N=100

По формуле N=2i находим 32=2i, 25=2i,i=5

Найти: i— ?

 

Ответ: 5

Задание 5:

 

 Один символ алфавита «весит» 4 бита. Сколько символов в этом алфавите? 
Дано:                                                Решение: 

i=4

По формуле N=2i находим N=24N=16

Найти: — ?

 

Ответ: 16

 

Задание 6:

 

Сообщение, записанное буквами из 64-символьного алфавита, содержит 20 символов. Какой объем информации оно несет? 
Дано:                                                         Решение: 

N=64, K=20

По формуле N=2i находим 64=2i, 26=2i,i=6.

 По формуле I=K*i I=20*6=120

 

Найти: I— ?

 

 

Ключ к заданиям

 

Карточка 2

 

Задание 1:

 

Переведите из одних единиц измерения информации в другие.

64 бит = 8 байт                                            28 Кбайт = 0,125 Мбайт
10Кбайт = 10240 байт                                        10байт = 80 бит.

Задание 2:

 

Вычислите,  сколько килобайтов содержится в  4096 битах.

Решение:

бит   :     байт  :    килобайт

4096:8=512 байтов.

512:1024=0,5 килобайта

Ответ: 0,5 килобайта.

Задание 3:

 

Считая,  что  каждый  символ  кодируется  одним  байтом,  оцените информационный объем сообщения:

Без труда не вытащишь рыбку из пруда!

РЕШЕНИЕ:

Считаем  количество  символов  в  сообщении  с  учетом  пробелов и  знаков препинания.

 Получаем N=35.  Т.к.  один  символ  кодируется  1  байтом,  то  всё  сообщение  будет  занимать в памяти компьютера 35 байт или 35 байт * 8= 280 бит

Ответ: 35 байт

  Задание 4:

 

Алфавит русского языка иногда оценивают в 32 буквы. Каков информационный вес одной буквы такого сокращенного русского алфавита? 
Дано:                                      Решение: 

N=32

По формуле N=2i находим 32=2i, 25=2i,i=5

Найти: i— ?

 

Ответ: 5

Задание 5:

 

Каждый символ алфавита записан с помощью 8 цифр двоичного кода. Сколько символов в этом алфавите? 
Дано:                                                 Решение:                        

i=8

По формуле N=2i находим N=28N=256

Найти:N— ?

 

Ответ: 256

Задание 6:

 

Сообщение, записанное буквами из 64-символьного алфавита, содержит 20 символов. Какой объем информации оно несет? 
Дано:                                                                Решение: 

N=64, K=20

По формуле N=2i находим 64=2i, 26=2i,i=6.

 По формуле I=K*i I=20*6=120

 

Найти: I— ?

 

 


Контрольная работа по информатике на тему «Количество информации»

Вариант 1.

1. Известно, что в коробке лежат перчатки. Из них 5 – белых пар, 8 – желтых пар и 2 красные пары, а остальные черные. Сообщение о том, что из коробки случайным образом достали пару черных перчаток несет 4 бита информации. Сколько пар перчаток в коробке?

2. В некоторой стране проживает 1000 человек. Индивидуальные номера налогоплательщиков (ИНН) содержат только цифры 0, 1, 2 и 3. Какова должна быть минимальная длина ИНН, если все жители имеют разные номера?

3. Сколько сообщений мог бы передавать светофор, если бы у него одновременно горели сразу три «глаза», и каждый из них мог бы менять цвет и становиться красным, желтым или зеленым?

4. Для регистрации на сайте некоторой страны пользователю необходимо придумать пароль длиной ровно 11 символов. В пароле можно использовать десятичные цифры и 32 различных символа местного алфавита, причем все буквы используются в двух начертаниях – строчные и прописные.

Каждый символ кодируется одинаковым и минимально возможным количеством бит, а каждый пароль – одинаковым и минимально возможным количеством байт. Определите объем памяти, необходимый для хранения 50 паролей.

5. В некоторой стране автомобильный номер длиной 7 символов составляется из заглавных букв (всего используется 22 буквы) и десятичных цифр в любом порядке. Каждый символ кодируется одинаковым и минимально возможным количеством бит, а каждый номер – одинаковым и минимально возможным количеством байт. Определите объем памяти, необходимый для хранения 50 автомобильных номеров.

6. Световое табло состоит из цветных индикаторов. Каждый индикатор может окрашиваться в четыре цвета: белый, черный, желтый и красный. Какое наименьшее количество лампочек должно находиться на табло, чтобы с его помощью можно было передать 300 различных сигналов?

7. За четверть Василий получил 20 оценок. Сообщение о том, что он вчера получил четверку, несет 2 бита информации. Сколько четверок получил Василий за четверть?

8. Мощность алфавита равна 256. Сколько Кбайт памяти потребуется для сохранения 160 страниц текста, содержащего в среднем 192 символа на каждой странице?

Вариант 2.

1. Известно, что в ящике лежат шары. Из них 15 – белых, 9 – синих, 6 – коричневых и 12 зеленых, а остальные красные. Сообщение о том, что из ящика случайным образом достали красный шар несет 3 бита информации. Сколько шаров в ящике?

2. В некоторой стране проживает 200 человек. Индивидуальные номера налогоплательщиков (ИНН) содержат только цифры 2, 4, 6 и 8. Какова должна быть минимальная длина ИНН, если все жители имеют разные номера?

3. Некоторое устройство передает в секунду один из семи сигналов. Сколько различных сообщений длиной в 3с можно передать при помощи этого устройства?

4. Для регистрации на сайте некоторой страны пользователю необходимо придумать пароль длиной ровно 15 символов. В пароле можно использовать десятичные цифры и 11 различных символов местного алфавита, причем все буквы используются в двух начертаниях – строчные и прописные. Каждый символ кодируется одинаковым и минимально возможным количеством бит, а каждый пароль – одинаковым и минимально возможным количеством байт. Определите объем памяти, необходимый для хранения 30 паролей.

5. В некоторой стране автомобильный номер длиной 5 символов составляется из заглавных букв (всего используется 26 букв) и десятичных цифр в любом порядке. Каждый символ кодируется одинаковым и минимально возможным количеством бит, а каждый номер – одинаковым и минимально возможным количеством байт. Определите объем памяти, необходимый для хранения 40 автомобильных номеров.

6. Одна ячейка памяти троичного компьютера (один трит) может принимать одно из трех возможных значений: 0, 1 или –1. Для хранения некоторой величины в памяти такого компьютер отвели 4 ячейки. Сколько разных значений может принимать эта величина?

7. В коробке лежат 64 цветных карандаша. Сообщение о том, что достали белый карандаш, несет 4 бита информации. Сколько белых карандашей было в коробке?

8. Объем сообщения равен 11 Кбайт. Сообщение содержит 11264 символа. Какова мощность алфавита?

Количество информации | Тест по информатике и икт (7 класс):

1* (2 балла). Заполните таблицу                                                                Вариант 1

Бит

Байт

Килобайт

1,25

5120

213

2___

2___

2___

2___

25

2* (1 балл). Считая, что каждый символ кодируется шестнадцатью битами, оцени в байтах информационный объём следующей фразы в байтах:

 

Не бойся, что не знаешь — бойся, что не учишься

3* (1 балл). Для хранения растрового изображения размером 512×256 пикселей отвели 64 Кбайт памяти. Каково максимально возможное число цветов в палитре изображения?

4* (2 балла). Проводилась одноканальная (моно) звукозапись с частотой дискретизации 8 кГц и 24-битным разрешением. В результате был получен файл размером 35 Мбайт, сжатие данных не производилось. Сколько минут (округлить до целых) проводилась запись?

5 (2 балла). В скачках участвуют 35 лошадей. Специальное устройство регистрирует прохождение каждой лошадью финиша, записывая ее номер с использованием минимально возможного количества бит, одинакового для каждой лошади. Каков информационный объём сообщения, записанного устройством, если до финиша добрались только 20 из 35 участвовавших в скачках лошадей? Ответ дайте в байтах.

6 (3 балла). Жесткий диск пуст и имеет объем 500 Гбайт.

 

а) Сколько книг, каждая из которых состоит из 1024 страниц, на каждой странице 512 строк, в каждой строке 64 символа, можно записать на такой жесткий диск (каждый символ кодируется одним байтом)?

 

б) Если учесть, что каждая такая книга 5 см толщиной, то какой высоты в метрах (целое число) будет стопка, если все их сложить друг на друга?

7 (4 балла). USB флеш-накопитель имеет объём 8 Гбайт.

Рукопись автора содержит 4096 страниц. На каждой странице 1024 строк, в каждой строке 128 символов. Каждый символ кодируется 16 битами. Кроме того, рукопись содержит 2520 изображений объёмом 3 Мбайт каждое.

Каков информационный объём рукописи в мегабайтах?

Поместится ли рукопись на USB флеш-накопитель в несжатом виде?

8 (4 балла). Браузер Google Chrome произвел перекодировку информационного сообщения на английском языке, первоначально записанного в 16-битном коде Unicode, в 8-битную кодировку КОИ−8. При этом информационное сообщение уменьшилось на 840 бит. Какова длина сообщения в символах?


1* (2 балла). Заполните таблицу                                                                Вариант 2

Бит

Байт

Килобайт

1,5

3072

211

2___

2___

2___

2___

24

2* (1 балл). Считая, что каждый символ кодируется шестнадцатью битами, оцени в байтах информационный объём следующего предложения:

 

Чем больше знает человек, тем он сильнее!

3* (1 балл). Для хранения растрового изображения размером 128×128 пикселей отвели 8 Кбайт памяти. Каково максимально возможное число цветов в палитре изображения?

4* (2 балла). Проводилась одноканальная (моно) звукозапись с частотой дискретизации 24 кГц и 16-битным разрешением. В результате был получен файл размером 30 Мбайт, сжатие данных не производилось. Сколько минут (округлить до целых) проводилась запись?

5 (2 балла). В национальном парке ведется автоматизированный контроль за популяцией редкого вида оленей на некоторой ограниченной территории. Автоматическое устройство записывает индивидуальные номера животных с использованием минимально возможного количества бит, одинакового для каждого оленя, при выходе животного за пределы этой территории. Каков информационный объем сообщения, записанного устройством, если ограниченную территорию покинуло 10 оленей из 14 обитающих в парке? Ответ дайте в байтах.

6 (3 балла). Жесткий диск пуст и имеет объем 750 Гбайт.

 

а) Сколько книг, каждая из которых состоит из 2048 страниц, на каждой странице 256 строк, в каждой строке 128 символа, можно записать на такой жесткий диск (каждый символ кодируется одним байтом)?

 

б) Если учесть, что каждая такая книга 6 см толщиной, то какой высоты в метрах (целое число) будет стопка, если все их сложить друг на друга?

7 (4 балла). USB флеш-накопитель имеет объём 4 Гбайт.

Рукопись автора содержит 2048 страниц. На каждой странице 512 строк, в каждой строке 256 символов. Каждый символ кодируется 16 битами. Кроме того, рукопись содержит 920 иллюстраций объёмом 4 Мбайт каждая.

 

Каков информационный объём рукописи в мегабайтах?

Поместится ли рукопись на USB флеш-накопитель в несжатом виде?

8 (4 балла). Браузер Internet Explorer произвел перекодировку информационного сообщения на английском языке, первоначально записанного в 16-битном коде Unicode, в 8-битную кодировку КОИ−8. При этом информационное сообщение уменьшилось на 720 бит. Какова длина сообщения в символах?


Вариант 1

Вариант 2

Бит

Байт

Килобайт

10240

1280

1,25

40960

5120

5

213

210

20=1

218

215

25

Бит

Байт

Килобайт

12288

1536

1,5

24576

3072

3

211

28

2-2

217

214

24

2

94 байта

82 байта

3

16 цветов

16 цветов

4

8 мин

11 мин

5

15 байт

5 байт

6

16000 книг

800 метров

12000 книг

750 метров

7

8584 Мб

нет

4192 Мб

нет

8

105 символов

90 символов

Контрольная работа по теме «Алфавитный подход к измерению информации» — Тесты по информатике и ИКТ — Архив тестов — Каталог статей

Контрольная работа по теме «Алфавитный подход к измерению информации»

 

Базовый уровень

Вариант 1

1. Загадано число из промежутка от 1 до 64. Какое количество информации необходимо для угадывания числа из этого промежутка?

2. В корзине лежат 4 красных и 8 черных клубков шерсти. Какое количество информации несут сообщения о том, что достали красный или черный клубок шерсти?

3. При составлении сообщения 128 – символьный алфавит. Каким будет информационный объем такого сообщения, если оно содержит 2048 символов?

4. Сообщение занимает 2 страницы. На каждой странице по 80 строк. В каждой строке по 32 символа. Найдите информационный объем такого текста, если при составлении  использовали 256 – символьный алфавит.

5. Выразите 8 Мбайт в битах.

 

Вариант 2

1. Загадано число из промежутка от 1 до 128. Какое количество информации необходимо для угадывания числа из этого промежутка?

2. В корзине лежат 6 красных и 10 синих кубиков. Какое количество информации несут сообщения о том, что достали красный или желтый кубик?

3. При составлении сообщения использовали 64 – символьный алфавит. Каким будет информационный объем такого сообщения, если оно содержит 3072 символа?

4. Сообщение занимает 3 страницы. На каждой странице по 48 строк. В каждой строке по 64 символов. Найдите информационный объем такого текста, если при его составлении использовали 256 – символьный алфавит.

5. Выразите 9 Мбайт в битах.

 

 

Уровень повышенной сложности

Вариант 1

1. Загадано число из промежутка от 32 до 64. Какое количество вопросов необходимо задать для угадывания числа и какое количество информации при этом получится?

2. В корзине лежат  красные и черные клубки шерсти. Красных клубков 6. Сообщение о том, что достали черный клубок, несет 2 бита информации. Сколько всего клубков в корзине?

3. Информационное сообщение объемом 3 Кбайта содержит 3072 символов. каков размер алфавита, с помощью которого оно было составлено?

4. Сообщение занимает 4 страницы по 40 строк и содержит 7200 байтов информации. Сколько символов в строке, если при составлении этого сообщения использовали 64 – символьный алфавит?

5. Найдите х: 8х бит = 32 Кбайта.

 

Вариант 2.

1. Загадано число из промежутка от 64 до 128. Какое количество вопросов необходимо задать для угадывания числа и какое количество информации при этом получится?

2. В корзине лежат  красные и желтые шары. Всего шаров 16. Сообщение о том, что достали желтый шар, несет 3 бита информации. Сколько красных шаров  в корзине?

3. Информационное сообщение имеет объем 3 Кбайта. Сколько в нем символов, если размер алфавита, с помощью которого оно было составлено, равен 16.

4. Сообщение занимает 3 страницы и содержит 7875 байтов информации. Сколько строк в тексте, если символов в строке 50 и при составлении этого сообщения использовали 128 – символьный алфавит?

5. Найдите х: 16х бит = 128 Кбайта.

 

 

Ответы и решения:

Базовый уровень

Вариант 1

1. Ответ: 69 120 99 101 108.

2. Решение:

    1) Неопределенность знаний N = 64;

    2) Количество информации I = log264 = 6 бит.

3. Решение:

    1) рк = 4/(4+8) = 1/3, рч = 8/12 = 2/3;

    2) I = log2(1/p), Ik = log23 = 1,735, Iч = log21,5 = 0,6 бит.

4. Решение:

    1) I = 7 бит – объем одного символа;

    2) 7*2048 = 14336 бит = 1792 байт = 1,75 Кбайт – объем текста.

 

5. Решение:

    1) 80*32*2 = 5120 символов в тексте;

    2) N = 256, I = 8 бит = 1 байт – объем одного символа;

    3) 5120*1 = 5120 байт = 5 Кбайт – объем всего текста.

6. Решение: 8*1024*1024*8 = 32768 бит.

 

Вариант 2

1. Ответ: 65 99 99 101 115 115.

2. Решение:

    1) Неопределенность знаний N = 128;

    2) Количество информации I = log2128 = 7 бит.

3. Решение:

    1) рк = 6/16 = 3/8, рж = 10/16 = 5/8;

    2) I = log2(1/p), Ik = log2(8/3) = 1,6, Iж = log2(8/5)= 0,7 бит.

4. Решение:

    1) I = 6 бит – объем одного символа;

    2) 6*3072  = 18432 бит = 2304 байт = 2,25 Кбайт – объем текста.

5. Решение:

    1) 3*48*64 = 9216 символов в тексте;

    2) N = 256, I = 8 бит = 1 байт – объем одного символа;

    3) 9216*1 = 9216 байт = 9 Кбайт – объем всего текста.

6. Решение: 9*1024*1024*9 = 147456 бит.

 

Повышенный уровень

Вариант 1

1. Ответ: 104 101 108 112

2. Решение:

    1) Неопределенность знаний N = 64-32 = 32

    2) I = log232 = 5 бит – количество информации;

    3) Количество бит соответствует количеству вопросов.

    Ответ: 5 вопросов.

3. Решение:

    1) I = log2(1/p), 2 = log2(1/pч), 1/pч = 4, pч = ¼;

    2) pч = Кч/N, ¼ = Кч/( Кч+ Кк), Кч = 2;

    3) N = 2+6 = 8 клубков в корзине.

4. Решение:

    1) I = 3*1024*8/3072 = 8 бит – объем одного символа;

    2) N = 28 = 256 символов в алфавите.

5. Решение:

    1) Т.к.  N = 64, то I = 6 бит;

    2) 7200*8/6 = 9600 символов в тексте;

    3) 9600/4/40 = 60 символов в строке.

6. Решение:

    1) Выразим все величины в битах: 2 = 27*21*23 = 220;

    2) Приравняет степени: 4*х = 20

    3) Х = 20/4 = 5

    Ответ: х =5

 

Вариант 2

1. Ответ: 108 105 110 107

2. Решение:

    1) Неопределенность знаний N = 128-64 = 64

    2) I = log264 = 6 бит – количество информации;

    3) Количество бит соответствует количеству вопросов.

    Ответ: 6 вопросов.

3. Решение:

    1) I = log2(1/p), 3 = log2(1/pж), 1/pч = 8, pж = 1/8;

    2) pж = Кж/N, 1/8 = Кж/16, Кж = 16/8 = 2;

    3) Кк = 16-2 = 14 красных шаров.

4. Решение:

    1) I = log2N = log216 = 4 бита – объем одного символа;

    2) К = 3-1024*8/4 = 6144 символов в тексте.

5. Решение:

    1) Т.к.  N = 128, то I = 7 бит;

    2) 7875*8/7 = 9000 символов в тексте;

    3) 9000/3/50 = 60 строк на странице.

6. Решение:

    1) Выразим все величины в битах: 2 = 25*210*23 = 218;

    2) Приравняет степени: 3*х = 18

    3) Х = 18/43 = 6

    Ответ: х =6

 

Вероятностный подход — Виртуальный кабинет информатики 10 класса МБОУ «СОШ №9 имени М.И.Баркова» г.Братск

Мы с вами говорили о том, что в основе нашего мира лежат три составляющие — вещество, энергия и информация. А как много в мире вещества, энергии и информации.

1. Можно ли измерить количество вещества и как именно? 

2. Можно ли определить количество энергии? 

3. Можно ли измерить количество информации и как это сделать?

Оказывается, информацию также можно измерять и находить ее количество. Существуют два подхода к измерению информации.

Один из них называется содержательный или вероятностный. Из названия подхода можно сделать вывод, что количество информации зависит от ее содержания.

Упражнение 1 (устно)

Определите количество информации в следующих сообщениях с позиции «много» или «мало».

1. Столица России — Москва.
2. Сумма квадратов катетов равна квадрату гипотенузы. 
3. Дифракцией света называется совокупность явлений, которые обусловлены волновой природой света и наблюдаются при его распростра­нении в среде с резко выраженной оптической неоднородностью. 
4. Эйфелева башня имеет высоту 300 метров и вес 9000 тонн.

Сообщение несет больше информации, если в нем содержатся новые и понятные сведения. Такое сообщение называется информативным.

Необходимо различать понятия информация и информативность.

— Содержит ли информацию учебник физики за 10 класс? (Да).

— Для кого он будет информативным—для ученика 10 класса или 1 класса? 

Вывод: количество информации зависит от информативности.

Количество информации в некотором сообщении равно нулю, если оно с точ­ки зрения конкретного человека неинформативно. Количество информации в информативном сообщении больше нуля.   

Но информативность сообщения сама по себе не дает точного определе­ния количества информации. По информативности можно судить только о том, много информации или мало.

Рассмотрим понятие информативности с другой стороны. Если некото­рое сообщение является информативным, следовательно, оно пополняет нас знаниями или уменьшает неопределенность наших знаний. Другими словами сообщение содержит информацию, если оно приводит к уменьше­нию неопределенности наших знаний.

Рассмотрим пример.

Мы бросаем монету и пытаемся угадать, какой стороной она упадет на поверхность. Возможен один результат из двух: монета окажется в положении «орел» или «решка». Каждое из этих двух событий окажется равноверо­ятным, т.е. ни одно из них не имеет преимущества перед другим.

Перед броском монеты мы точно не знает, как она упадет. Это событие предсказать невозможно, т.е. перед броском существует неопределенность нашего знания (возможно одно событие из двух). После броска наступает полная определенность знания, т.к. мы получаем зрительное сообщение о положении монеты. Это зрительное сообщение уменьшает неопределен­ность нашего знания в два раза, т.к. из двух равновероятных событий про­изошло одно.

Если мы кидаем шестигранный кубик, то мы также не знаем перед брос­ком, какой стороной он упадет на поверхность. В этом случае, возможно получить один результат из шести равновероятных. Неопределенность знаний равна шести, т.к. именно шесть равновероятных событий может произойти. Когда после броска кубика мы получаем зрительное сообщение о результа­те, то неопределенность наших знаний уменьшается в шесть раз.

Упражнение 2 (устно)

Еще один пример. На экзамен приготовлено 30 билетов.

— Чему равно количество событий, которые могут произойти при вытя­гивании билета? (30)

— Равновероятны эти события или нет? (Равновероятны.)

— Чему равна неопределенность знаний ученика перед тем как он вытя­нет билет? (30)

— Во сколько раз уменьшится неопределенность знания после того как ученик билет вытянул? (В 30раз.)

— Зависит ли этот показатель от номера вытянутого билета? (Нет, т.к. события равновероятны.)

Приведите свои примеры равновероятных событий с указанием величи­ны неопределенности знаний.

Из всех рассмотренных примеров можно сделать следующий вывод:

Чем больше начальное число возможных равновероятных событий, тем в большее количество раз уменьшается неопределенность наших знаний, и тем большее количество информации будет содержать сообщение о резуль­татах опыта.

А каким может быть самое маленькое количество информации? Вернем­ся к примеру с монетой. Предположим, что у монеты обе стороны «орел».

— Существует ли неопределенность знаний пред броском в этом случае? Почему? (Нет, так как мы заранее знаем, что выпадет в любом случае «орел».)

— Получите вы новую информацию после броска? (Нет, так как ответ мы уже знали заранее.)

— Будет ли информативным сообщение о результате броска? (Нет, так оно не принесло новых и полезных знаний.)

— Чему равно количество информации в этом случае? (Нулю, т.к. оно неинформативно.)

Вывод: мы не получаем информации в ситуации, когда происходит одно событие из одного возможного. Количество информации в этом случае равно нулю. Для того чтобы количество информации имело положительное значение, необходимо получить сообщение о том, что произошло событие как минимум из двух равновероятных. Такое количество информации, кото­рое находится в сообщении о том, что произошло одно событие из двух равно­вероятных, принято за единицу измерения информации и равно 1биту.

С понятием «бит» вы уже познакомились на прошлых уроках.

Вспомните его.

Итак, с помощью битов информация кодируется. С точки зрения коди­рования с помощью 1 бита можно закодировать два сообщения, события или два варианта некоторой информации. С точки зрения вероятности 1 бит — это такое количество информации, которое позволяет выбрать одно событие из двух равновероятных. Согласитесь, что эти два определения не противоречат друг другу, а совершено одинаковы, но просто рассмотрены с разных точек зрения.

Еще одно определение 1 бита:

1 бит — это количество информации, уменьшающее неопределенность знаний в два раза.

Игра «Угадай число».

Пояснение: попросите кого-нибудь из учеников загадать число из предло­женного вами интервала и отгадайте его, а затем расскажите, как вы это сделали. Интервал необходимо выбрать такой, чтобы он являлся степенью числа 2. Это условие упрощает объяснение материала; так как в этом слу­чае правильная стратегия строится на получении максимального количест­ва информации. Детям это пояснять пока не надо. В случае возникновения вопросов по поводу выбора интервала пояснить, что это связано с пра­вильной стратегией игры.

Стратегия поиска:

Необходимо на каждом шаге в два раза уменьшать неопределенность зна­ния, т.е. задавать вопросы, делящие числовой интервал на два. Тогда ответ «Да» или «Нет» будет содержать 1 бит информации. Подсчитав общее ко­личество битов (ответов на вопросы), найдем полное количество информа­ции, необходимое для отгадывания числа.

Например, загадано число 5 из интервала от 1 до 16.

Вопрос

Ответ

Неопределенность знаний

Полученное количест­во информации

Число больше 8?

Нет

8

1 бит

Число больше 4?

Да

4

1бит

Число больше 6?

Нет

2

1бит

Число 5?

Да

1

1бит

Итого:

 

 

4 бита

Пояснение: подготовьте таблицу заранее; неопределенность знаний перед угадыванием равна 16.

Вывод: количество информации, необходимое для определения одного из 10 чисел, равно 4 бита.

Упражнение 3 (устно)

Загадайте число (например, 8), сообщите детям интервал (например, от 1 до 32) и попросите их угадать число, воспользовавшись выше приведенной стратегией поиска. При этом объявите детям, что вы знаете, какое количес­тво бит информации получится (5 бит), и запищите это количество где-ни­будь на листе бумаги, чтобы потом показать детям. Пояснение: ваш ответ совпадет с ответом учеников, но вы быстрее его по­лучите, т.к. подсчитаете ответ по формуле.

— Почему я быстрее вас получила ответ? (Наверно есть какая-то формула, по которой можно быстро подсчитать количество информации)

Действительно, существует формула, которая связывает между собой ко­личество возможных событий и количество информации.

N = 2i; где N — количество возможных вариантов,

I — количество информации.

Если из этой формулы выразить количество информации, то получится I = log2N.

Как пользоваться этими формулами для вычислений:

—  если количество возможных вариантов N является целой степенью числа 2, то производить вычисления по формуле N = 21 достаточно легко. Вернемся к примеру: N = 32; → I = 5, т.к. 32 = 25;

— если же количество возможных вариантов информации не является целой степенью числа 2, т.е. если количество информации число ве­щественное, то необходимо воспользоваться калькулятором или сле­дующей таблицей.

 Количество информации в сообщении об одном из N равновероятных событий: I = log2N.

N

I

N

I

N

I

N

I

1   

0,00000

17

4,08746

33

5,04439

49

5,61471

2

1,00000

18

4,16993

34

5,08746

50

5,64386

3

1,58496

19

4,24793

35

5,12928

51

5,67243

4

2,00000

20

4,32193

36

5,16993

52

5,70044

5

2,32193

21

4,39232

37

5,20945

53

5,72792

6

2,58496

22

4,45943

38

5,24793

54

5,75489

7

2,80735

23

4,52356

39

5,28540

55

5,78136

8

3,00000

24

4,58496

40

5,32193

56

5,80735

9

3,16993

25

4,64386

41

5,35755

57

5,83289

10

3,32193

26

4,70044

42

5,39232

58

5#5798

11

3,45943

27

4,75489

43

5,42626

59

5,88264

12

3,58496

28

4,80735

44

5,45943

60

5,90689

13

3,70044

29

4,85798

45

5,49185

61

5,93074

14

3,80735

30

4,90689

46

5,52356

62

5,95420

15

3,90689

31

4,95420

47

5,55459

63

5,97728

16

4,00000

32

5,0000

48

5,58496

64

6,00000

Например: Какое количество информации можно получить при угадыва­нии числа из интервала от 1 до 11? В этом примере N = 11. Чтобы найти I (количество информации), необходимо воспользоваться таблицей. По таб­лице I = 3,45943 бит.

Упражнение 4 (устно)

1. Какое количество информации будет получено при отгадывании чис­ла из интервала:

— от 1 до 64                                — от 1 до 61                                 — от 1 до 20.

2.  Какое количество информации будет получено после первого хода в игре «крестики-нолики» на поле: -3×3  ;    -4×4.

3.  Сколько могло произойти событий, если при реализации одного из них получилось 6 бит информации.

3. Неравновероятные события

На самом деле рассмотренная нами формула является частным случаем, так как применяется только к равновероятным событиям. В жизни же мы сталкиваемся не только с равновероятными событиями, но и событиями, которые имеют разную вероятность реализации.

Например:

1. Когда сообщают прогноз погоды, то сведения о том, что будет дождь, более вероятно летом, а сообщение о снеге — зимой.

2. Если вы — лучший ученик в классе, то вероятность сообщения о том, что за контрольную работу вы получили 5, больше, чем вероятность получения двойки.

3. Если на озере живет 500 уток и 100 гусей, то вероятность подстрелить на охоте утку больше, чем вероятность подстрелить гуся.

4.  Если в мешке лежат 10 белых шаров и 3 черных, то вероятность до­стать черный шар меньше, чем вероятность вытаскивания белого.

5. Если одна из сторон кубика будет более тяжелой, то вероятность вы­падения этой стороны будет меньше, чем других сторон.

Упражнение 5 (устно)

Как вычислить количество информации в сообщении о неравновероятном событии?

Для этого необходимо использовать следующую формулу.

I = log2 (l/p), где I — это количество информации, р — вероятность собы­тия.

Вероятность события выражается в долях единицы и вычисляется по формуле:

р = К / N, где К — величина, показывающая, сколько раз произошло ин­тересующее нас событие, N — общее число возможных исходов какого-то процесса.

Рассмотрим задачи:

 №1 В мешке находятся 20 шаров. Из них 15 белых и 5 красных. Какое количество информации несет сообщение о том, что достали: а) белый шар; б) красный шар. Сравните ответы.

Решение:

1. Найдем вероятность того, что достали белый шар: рб = 15 / 20 = 0,75;

2.  Найдем вероятность того, что достали красный шар: рк= 5 / 20 = 0,25.

3. Найдем количество информации в сообщении о вытаскивании бело­го шара: 1б = log (1/ рб) = log(l/0,75) = log2 1,3 =1,15470 бит.

4. Найдем количество информации в сообщении о вытаскивании крас­ного шара: 1К = log (1/ рк) = log( 1/0,25) = Iog24 = 2 бит.

Ответ: количество информации в сообщении о том, что достали белый шар, равно 1,1547 бит. Количество информации в сообщении о том, что до­стали красный шар, равно 2 бит.

При сравнении ответов получается следующая ситуация: вероятность вытаскивания белого шара была больше, чем вероятность вытаскивания красного шара, а информации при этом получилось меньше. Это не случай­ность, а закономерная, качественная связь между вероятностью события и количеством информации в сообщении об этом событии.

№2 В коробке лежат кубики: 10 красных, 8 зеленых, 5 желтых, 12 синих. Вы­числите вероятность доставания кубика каждого цвета и количество ин­формации, которое при этом будет получено.

— Являются ли события равновероятными? Почему? (Нет, т.к. количество кубиков разное.)

— Какую формулу будем использовать для решения задачи? (I = log2(1/N)

Решение:

1. Всего кубиков в коробке N = 10 + 8 + 5 + 12 = 35.

2. Найдем вероятности: р = 10 / 35 ~ 0,29,

рз = 8/35~0,22,

рс =12 /35~0,34,

рж = 5/35 ~ 0,14.

3. Найдем количество информации:

Iк = Iog2(l/0,29) = Iog23,4 = 1,85695 бит,

Ic = Iog2(l/0,34) = log22,9 = 1,71498 бит,

Iз = Iog2(l/0?22) = Iog24,5 = 2,132007 бит,

Iж = Iog2(l/0,14) = Iog27,l = 2,672612 бит.

Сравните количества информации.

Ответ: наибольшее количество информации мы получим при доставании желтого кубика по причине качественной связи между вероятностью и количеством информации.

Пояснение: напомните суть этой связи еще раз.

№3 В озере обитает 12500 окуней, 25000 пескарей, а карасей и щук по 6250. Сколько информации мы получим, когда поймаем какую-нибудь рыбу.

Решение:

1. Найдем общее количество рыб в озере: К = 12500 + 25000 + 2-6250 = 50000.

2. Найдем вероятность попадания на удочку каждого вида рыб* ро = 12500 / 50000 = 0,25,

рк = 25000 /50000 -0,5, рп = 6250/50000 = 0,125, рщ = 6250/50000 = 0,125.

3. Найдем количество информации:

I = — (0,25*log20,25 + 0,5*log20,5 + 0,125*log20,125 + 0,125*log20,125) = 1,75 бит.

Ответ: мы получим 1,75 бит информации.

Для равновероятных событий pi = 1/N. Поэтому количество информации рассчи­тывается по следующей формуле:


Этот случай рассмотрен в основной части урока.

Для углубления знаний воспользуйтесь ссылкой

Для тренировки воспользуйтесь ссылкой

Клод Э. Шеннон: основатель теории информации

Квантовая информатика — молодая область, ее основы все еще закладываются большим количеством исследователей [см. «Правила сложного квантового мира» Майкла А. Нильсена; Scientific American , ноябрь 2002 г.]. Классическая информатика, напротив, возникла около 50 лет назад из работ одного замечательного человека: Клода Э. Шеннона. В знаменательной статье, написанной в Bell Labs в 1948 году, Шеннон математически определил, что такое информация и как ее можно передавать в условиях шума.То, что считалось совершенно разными способами связи — телеграф, телефон, радио и телевидение — было объединено в единую структуру.

Шеннон родился в 1916 году в Петоски, штат Мичиган, в семье судьи и учителя. Среди других изобретательских усилий, в юности он построил телеграф из своего дома к другу из проволоки для забора. Он окончил Мичиганский университет со степенью в области электротехники и математики в 1936 году и поступил в Массачусетский технологический институт, где работал под руководством пионера компьютерных технологий Ванневара Буша над аналоговым компьютером, называемым дифференциальным анализатором.

Шеннон M.I.T. Магистерская диссертация по электротехнике была названа важнейшей в 20-м веке: в ней 22-летний Шеннон показал, как логическая алгебра математика 19-го века Джорджа Буля может быть реализована с использованием электронных схем реле и переключателей. Это наиболее фундаментальная особенность конструкции цифровых компьютеров — представление «истинных» и «ложных», «0» и «1» в виде открытых или закрытых переключателей, а также использование электронных логических вентилей для принятия решений и выполнения арифметических операций. — можно проследить до идей, содержащихся в тезисе Шеннон.

В 1941 г. защитил кандидатскую диссертацию. Занимаясь математикой под его поясом, Шеннон пошел в Bell Labs, где работал над вопросами, связанными с войной, включая криптографию. Неизвестный для окружающих, он также работал над теорией информации и коммуникаций. В 1948 году эта работа появилась в знаменитой статье, опубликованной в двух частях в исследовательском журнале Bell Labs.

Количественная информация

Шеннон определил количество информации, производимой источником — например, количество в сообщении — по формуле, аналогичной уравнению, которое определяет термодинамическую энтропию в физике.В самом общем виде информационная энтропия Шеннона — это количество двоичных цифр, необходимых для кодирования сообщения. Сегодня это звучит как простой, даже очевидный способ определить, сколько информации содержится в сообщении. В 1948 году, на заре информационной эры, оцифровка информации любого рода была революционным шагом. Его статья, возможно, была первой, в которой использовалось слово «бит», сокращение от двоичной цифры.

Помимо определения информации, Шеннон проанализировал возможность отправки информации по каналу связи.Он обнаружил, что канал имеет определенную максимальную скорость передачи, которая не может быть превышена. Сегодня мы называем это пропускной способностью канала. Шеннон математически продемонстрировал, что даже в зашумленном канале с низкой пропускной способностью по существу идеальная безошибочная связь может быть достигнута за счет сохранения скорости передачи в пределах полосы пропускания канала и использования схем исправления ошибок: передачи дополнительных битов, которые позволят данные, которые должны быть извлечены из зашумленного сигнала.

Сегодня все, от модемов до музыкальных компакт-дисков, для своей работы полагается на исправление ошибок. Основным достижением ученых в области квантовой информации стала разработка методов исправления ошибок, вносимых в квантовую информацию, и определения того, сколько всего можно сделать с зашумленным каналом квантовой связи или с запутанными квантовыми битами (кубитами), запутанность которых была частично нарушена. шумом.

Нерушимый код

Спустя год после того, как он основал и запустил теорию информации, Шеннон опубликовал статью, в которой доказала, что неразрушимая криптография возможна.(Он проделал эту работу в 1945 году, но в то время она была засекречена.) Схема получила название одноразового блокнота или шифра Вернама в честь Гилберта Вернама, который изобрел ее ближе к концу Первой мировой войны. закодировать сообщение случайной серией цифр — ключом — так, чтобы закодированное сообщение само было полностью случайным. Загвоздка в том, что нужен случайный ключ, длина которого равна длине сообщения, которое нужно закодировать, и никогда нельзя использовать какой-либо из ключей дважды. Вклад Шеннона состоял в том, чтобы строго доказать, что этот код нельзя взломать.На сегодняшний день не известно ни о какой другой схеме шифрования, которую можно было бы взломать.

Проблема с одноразовым блокнотом (так называемым, потому что агент будет носить с собой свою копию ключа на блокноте и уничтожать каждую страницу цифр после их использования) заключается в том, что обе стороны связи должны иметь копия ключа, причем ключ должен храниться в секрете от шпионов или подслушивающих устройств. Квантовая криптография решает эту проблему. Этот метод, более правильно называемый квантовым распределением ключей, использует квантовую механику и запутанность для генерации случайного ключа, идентичного на каждом конце квантового канала связи.Квантовая физика гарантирует, что никто не сможет подслушать и узнать что-либо о ключе: любые тайные измерения нарушат тонкие корреляции, которые можно проверить, подобно проверкам с исправлением ошибок данных, передаваемых по зашумленной линии связи.

Шифрование на основе шифра Вернама и квантового распределения ключей совершенно безопасно: квантовая физика гарантирует безопасность ключа, а теорема Шеннона доказывает, что метод шифрования не поддается взлому. [ статей в Scientific American о квантовой криптографии и других разработках квантовой информатики за последние десятилетия, пожалуйста, нажмите здесь.]

Уникальный универсальный гений

Шеннон соответствовал стереотипу эксцентричного гения T. В Bell Labs (а позже в Массачусетском технологическом институте, куда он вернулся в 1958 году до выхода на пенсию в 1978 году) он был известен тем, что ездил по залам на одноколесном велосипеде, а иногда и жонглировал [ см. «Профиль: Клод Э. Шеннон» Джона Хоргана; Scientific American, , январь 1990 г.]. В других случаях он прыгал по коридорам на пого-палке. Он всегда был любителем гаджетов и, среди прочего, создал роботизированную мышь, которая решала лабиринты, и компьютер под названием Throbac («Бережливый компьютер, ориентированный на цифру»), который считал римскими цифрами.В 1950 году он написал статью для Scientific American о принципах программирования компьютеров для игры в шахматы [см. «Шахматная машина» Клода Э. Шеннона; Scientific American , февраль 1950 г.].

В 1990-х годах, по одной из трагических ироний жизни, Шеннон заболел болезнью Альцгеймера, которую можно было описать как коварную потерю информации в мозгу. Канал связи с воспоминаниями — прошлым и самой личностью — постепенно ухудшается до тех пор, пока все усилия по исправлению ошибок не будут подавлены, и никакой значимый сигнал не сможет пройти.Пропускная способность падает до нуля. Необычный образец обработки информации, которым был Клод Шеннон, наконец, поддался хищениям термодинамической энтропии в феврале 2001 года. Но часть сигнала, генерируемого Шенноном, продолжает жить, выражаясь в информационных технологиях, в которые теперь погружена наша собственная жизнь.


Грэм П. Коллинз входит в совет редакции Scientific American.

Рабочая память поддерживает когнитивное развитие, обучение и образование информации, сохраненной в жизни.Рабочая память — один из наиболее широко используемых терминов в психологии. Это часто связано или связано с интеллектом, обработкой информации, исполнительной функцией, пониманием, решением проблем и обучением у людей от младенчества до старости и у всех видов животных. Эта концепция настолько вездесуща в этой области, что требует тщательного изучения как с исторической точки зрения, так и с точки зрения определения, чтобы установить ее ключевые характеристики и границы. Объединив воедино историю, немного философии и эмпирическую работу по психологии, в этом вводном разделе я надеюсь нарисовать четкую картину концепции рабочей памяти.В следующих разделах будет по очереди обсуждаться значение рабочей памяти для когнитивного развития, обучения и образования, хотя для этих широких областей возможно лишь коснуться определенных примеров.

Некоторые исследователи подчеркивают возможность тренировки рабочей памяти для улучшения обучения и воспитания. В этой главе я придерживаюсь дополнительного мнения о том, что мы должны научиться корректировать материалы, чтобы облегчить обучение и обучение с учетом способностей рабочей памяти, которыми обладает учащийся.Например, систематизация знаний снижает нагрузку на память, потому что не нужно запоминать части независимо друг от друга.

Возьмем, к примеру, возможность провести предварительную разведку, чтобы вы знали, о чем эта статья, и облегчили себе задачу чтения. Если вы попытались прочитать заголовки этой статьи, у вас могут возникнуть проблемы с их запоминанием (помещением всех в рабочую память), чтобы предвидеть, как они сочетаются друг с другом. Однако если вы читаете, это попытка помочь вам систематизировать информацию.Если это поможет вам связать идеи друг с другом для построения согласованной структуры, это должно помочь вам в чтении, уменьшив нагрузку на рабочую память, которую вы испытываете при чтении. Поступая таким образом, вы создаете обширную структуру для связывания заголовков друг с другом в долговременной памяти (например, Ericsson & Kintsch, 1995), что сокращает количество идей, которые должны были бы независимо храниться в рабочей памяти для того, чтобы помнить организацию.

Ранняя история исследований рабочей памяти

В 1690 году Джон Локк различал созерцание, или удержание идеи в уме, и память, или способность возродить идею после того, как она исчезла из разума (Logie, 1996).Сохранение в уме ограничивается сразу несколькими концепциями и отражает то, что сейчас называется рабочей памятью, в отличие от, возможно, неограниченного накопления знаний за всю жизнь, которое теперь называется долговременной памятью. Рабочую память можно определить как небольшой объем информации, который может храниться в особенно доступном состоянии и использоваться в когнитивных задачах.

Как отмечает ведущий британский экономист и логик Уильям Стэнли Джевонс, философы давно интересовались пределами того, что можно созерцать.В статье, опубликованной в журнале « Science » в 1871 году, он размышлял (стр. 281): «Хорошо известно, что разум не может через глаз оценивать любое большое количество объектов, не считая их последовательно. Небольшое количество, например три или четыре, он определенно может понять и сосчитать с помощью мгновенного и, по-видимому, единственного акта ментального внимания ». Затем он разработал небольшой эксперимент, чтобы проверить эту гипотезу на себе. На каждом испытании он небрежно залезал в банку, полную бобов, бросал несколько бобов на стол и пытался оценить их количество, не считая.После 1027 испытаний он не сделал ошибок для наборов из 3 или 4 бобов, с небольшими ошибками для наборов из 5 бобов, а затем с увеличением величины ошибки в зависимости от размера набора до 15 бобов. Несмотря на проблемный характер метода (в том смысле, что метатель фасоли также был судьей по фасоли), вывод о том, что нормальные взрослые обычно могут помнить только около 3 или 4 элементов, многократно воспроизводился в современных исследованиях с использованием методов, аналогичных методам Джевонса. (например, Mandler & Shebo, 1982) и с использованием многих других методов (Cowan, 2001).Ограниченное количество, которое можно было сразу запомнить, сыграло важную роль в ранней экспериментальной психологии, например, в ранних экспериментальных работах Германа Эббингауза (1885/1913) и Вильгельма Вундта (1894/1998). На американском фронте Уильям Джеймс (1890) писал о различии между первичной памятью, объектами в сознании и последним краем того, что воспринимается в мире, и вторичной памятью, объектами, хранящимися, но не находящимися в настоящее время в сознании. Недавние исследователи рассмотрели несколько возможных причин, по которым первичная память может быть ограничена всего несколькими объектами одновременно, включая биологические отчеты, основанные на необходимости избежать путаницы между параллельными объектами в памяти, и эволюционные и телеологические отчеты, основанные на представлениях о том, какой объем может быть. идеально подходит для обучения и восстановления памяти (Cowan, 2010; Sweller, 2011), но пока причина неизвестна.

Повсеместность концепции рабочей памяти

Когда мы говорим, что рабочая память содержит небольшой объем информации , этим термином мы можем иметь в виду нечто столь же абстрактное, как идеи, которые можно созерцать, или что-то столь же конкретное, как объекты, которые можно посчитать (например, фасоль). Суть информации заключается в том, что это выбор некоторых вещей из большего набора возможных вещей. Один из захватывающих аспектов рабочей памяти заключается в том, что она может быть важна на очень многих разных уровнях и в самых разных ситуациях.Когда вы слушаете язык, вам нужно запоминать информацию о начале предложения, пока вы не сможете понять его смысл. Если вы услышите Жан хотел бы посетить третье здание слева , вам нужно вспомнить, что актер в предложении — Жан. Затем вам нужно сохранить глагол, пока вы не узнаете, что она хотела бы посетить, и вам нужно сохранить прилагательное «третий», пока вы не узнаете, третий что; и все части должны быть правильно соединены. Без достаточной рабочей памяти информация будет потеряна до того, как вы сможете объединить ее в связную, законченную мысль.В качестве еще одного примера того, как используется рабочая память, при выполнении простых арифметических операций в голове, если вы хотите сложить 24 и 18, вам может потребоваться найти, что 4 + 8 = 12, сохраните 2, перенося 1 в столбец десятков. чтобы сделать 2 + 1 + 1 = 4 в столбце десятков и объединить с столбцами единиц, чтобы получить ответ, 42. В качестве третьего примера, если вы ищете свою машину на стоянке, вы должны помнить расположение автомобилей в регионе, который вы только что искали, чтобы не тратить время на повторный поиск того же региона.В джунглях хищник, который отворачивается от сцены и повторно посещает ее через несколько мгновений, может использовать рабочую память, чтобы обнаружить, что что-то в этой сцене сместилось; это обнаружение изменений может указывать на присутствие добычи.

Таким образом, информация в рабочей памяти может варьироваться от произнесенных слов и печатных цифр до автомобилей и будущих блюд. Он может даже включать абстрактные идеи. Подумайте, может ли маленький ребенок получить хорошее представление о том, что является тигром, а что нет (вопрос понятий категории слов, например.г., Нельсон, 1974; Saltz, Soller, & Sigel, 1972). С точки зрения непрофессионала, это большая кошка в полоску. Он исключает львов, у которых нет полос, и исключает зебр, которые не являются большими кошками. Ребенок должен уметь запоминать понятие кошки и понятие полос одновременно, чтобы правильно усвоить понятие тигра. Если ребенок думает только о полосах, он может неправильно назвать зебру тигром. Предполагается, что концепция зарождается в рабочей памяти и, как только она усвоена, переносится в долговременную память.Сначала неполная концепция может храниться в долговременной памяти, что приводит к неправильным представлениям, которые позже исправляются, когда обнаруживаются несоответствия с дальнейшим вводом, и рабочая память используется для исправления концепции в долговременной памяти. В более абстрактном плане есть более семантические проблемы, которые решаются несколько позже, в детстве (например, Clark & ​​Garnica, 1974). Концепция , приносящего чего-то, похоже, требует нескольких условий: человек, который приносит что-то, должен иметь что-то в месте, отличном от местоположения говорящего (или будущего запланированного местоположения), и должен сопровождать этот предмет до местоположения говорящего.Вы можете попросить человека принести салат к вам домой, но, вероятно, не , чтобы принести салат к вам домой (если вас там нет), и не отправить салат к вам домой (если они не не идет). Эти условия могут вызвать нагрузку на рабочую память. Опять же, первоначальная концепция ребенка, перенесенная из рабочей памяти в долговременную память, может быть неполной и исправляться позже, когда будут замечены расхождения с дальнейшим вводом.

Рабочая память: последние 64 года

Есть несколько современных истоков концепции рабочей памяти.Хебб (1949) имел взгляд на временную память, который был более неврологически обоснованным, чем более ранняя концепция первичной памяти Джеймса (1890). Он говорил об идеях как об опосредованных совокупностями клеток, запускаемых по определенному образцу для каждой идеи или концепции, и только несколько клеточных сборок будут активны с текущим возбуждением нейронов в любой момент. Это видение сыграло важную роль в этой области. Проблема, которая поднимается в этой работе, заключается в том, следует ли отождествлять рабочую память со всей активной информацией, которая может быть использована в немедленных тестах памяти, независимо от того, является ли она сознательной или нет, или ее следует зарезервировать для описания только осознанной информации, подробнее в аромат Джеймса.Учитывая, что рабочая память — это термин, обычно используемый для объяснения поведенческих результатов, а не субъективных отчетов, она обычно не ограничивается осознанной первичной памятью (например, см. Baddeley, 1986; Baddeley & Hitch, 1974; Cowan, 1988). Коуэн явно предположил, что существует два аспекта хранения рабочей памяти: (1) активированная часть долговременной памяти, возможно, соответствующая активным клеточным сборкам Хебба, и (2) внутри этой активированной части меньшее подмножество элементов в фокусе. внимания.Активированная память будет состоять из фрагментированного супа всех видов активированных функций (сенсорных, фонологических, орфографических, пространственных и семантических), тогда как фокус внимания будет содержать всего несколько хорошо интегрированных элементов или фрагментов.

Вклад Джорджа Миллера

Миллер (1956) обсуждал ограничение количества элементов, которые могут храниться в непосредственной памяти. В соответствующей процедуре тестирования список элементов виден или слышен, и сразу после него (то есть без установленного интервала хранения) список должен быть повторен дословно.Было сказано, что возможность сделать это ограничена примерно семью фрагментами, где фрагмент является значимой единицей. Например, список случайных цифр 582931 , возможно, придется изначально закодировать как шесть фрагментов, по одному на цифру, тогда как последовательность 123654 , вероятно, может быть закодирована большинством взрослых только как два фрагмента (восходящий триплет, за которым следует нисходящий триплет. ). Последующая работа показала, что число семь — это практический результат, который возникает на основе стратегий, которые используют участники, и что, когда невозможно использовать фрагменты или скрытую словесную репетицию для повышения производительности, взрослые обычно могут сохранить только 3 или 4 предварительных упражнения. -существующие фрагменты (Chen & Cowan, 2009; Cowan, 2001; Cowan, Rouder, Blume, & Saults, 2012; Luck & Vogel, 1997; Rouder et al., 2008).

Первое упоминание термина рабочая память, которое я нашел, происходит из книги Миллера, Галантера и Прибрама (1960), Планы и структура поведения . Само название и концепция организации напоминают более раннюю работу Хебба (1949), Организация поведения, . Miller et al. заметил, что повседневное функционирование в мире требует иерархии планов. Например, ваш план преуспевания на работе требует наличия дополнительного плана утром, что, в свою очередь, может потребовать дополнительных планов на завтрак, принятие душа, одевание, сбор рабочих материалов и т. Д.У каждого из этих планов также могут быть дополнительные планы, и у вас могут быть конкурирующие планы (например, выбор занятия после работы, звонок матери или приобретение еды на ужин). Говорят, что наша рабочая память — это умственная способность, с помощью которой мы запоминаем планы и подпланы. Мы не можем думать обо всех сразу, но мы могли бы, например, иметь в виду, что сковорода горячая, когда вынимаете нож из ящика, и мы можем постоянно вспоминать приблизительное время, чтобы не опоздать. Говорят, что рабочая память — это средство, которое используется для выполнения одного подплана с учетом необходимых связанных подпланов и генерального плана.

Вклад Дональда Бродбента

В Великобритании книга Бродбента (1958) помогла вывести разговор из эпохи бихевиоризма в эпоху когнитивной психологии. В сноске в книге он набросал грубую диаграмму обработки информации, которая показывала, как информация поступает из хранилища сенсорного типа, кратковременно содержащего большой объем информации, через фильтр внимания, по сути, в рабочую память, в которой хранится только несколько элементов, в долговременная память, которая является хранилищем знаний, накопленных за всю жизнь.Эмпирическая основа модели в значительной степени была получена из его работы с избирательным вниманием, включая множество дихотических исследований слушания, в которых задача заключалась в том, чтобы слушать сообщение одним ухом и игнорировать сообщение другим ухом или сообщить оба сообщения в некотором порядке. Мотивация для такого рода исследований возникла в значительной степени из практических вопросов, спровоцированных Второй мировой войной, например, как помочь пилоту прослушать его собственное сообщение управления воздушным движением, игнорируя сообщения, предназначенные для других пилотов, но представленные в том же канале.Однако важным теоретическим результатом стало открытие разницы между сенсорной памятью большой емкости, но недолговечной, которая формировалась независимо от внимания, и более длительной, но малой абстрактной рабочей памятью, требующей внимания.

Вклады Алана Баддели и Грэма Хитча

Миллер и др. (1960), возможно, придумали термин «рабочая память», но они не были главным инициатором работы, которая впоследствии проводилась в этой области. Google Scholar показывает это с более чем 5600 цитированием.Тем не менее, глава Баддели и Хитча (1974) имеет более 7 400 цитирований, а статья в Science 1992 г., в которой резюмируется этот подход, имеет более 14 500 цитирований. В главе 1974 года термин рабочая память использовался для обозначения системы временной памяти, которая многогранна, в отличие от единственного хранилища, такого как первичная память Джеймса, или соответствующего блока в модели Бродбента (1958), или ее усовершенствованной версии. как в модели Аткинсона и Шиффрина (1968), ни одна из которых не годится. Фактически, многие исследователи в 1960-х годах предлагали варианты моделей обработки информации, которые включали единственное хранилище краткосрочной памяти, и Баддели часто называл их вместе, с юмором, «модальной моделью», давая ее набросок с помощью Ящики сенсорной памяти, кратковременной памяти и долговременной памяти, как в моделях Бродбента и Аткинсона / Шиффрина.(Когда юмор и происхождение фразы «модальная модель» забываются, но эта фраза все еще широко используется, это почему-то кажется печальным.) это, казалось, связано с кратковременной памятью, но не сводится к единственному компоненту. Фонологическая обработка больше всего мешала фонологическому хранению, визуально-пространственная обработка мешала визуально-пространственному хранению, а нагрузка на рабочую память, похоже, не сильно мешала превосходной памяти для конца списка или эффекту новизны.Концептуальное обучение не сильно зависело от типа памяти, которая была восприимчива к эффектам фонологического сходства, и пациент с очень низким объемом памяти все еще был в состоянии узнавать новые факты. Чтобы объяснить все диссоциации, они пришли к выводу, что существует система контроля, связанная с вниманием, и различные системы хранения. Они включали фонологическую систему, которая также включала скрытый процесс вербальной репетиции, и систему визуально-пространственного хранения, которая могла иметь свой собственный тип невербальной репетиции.В версии теории 1974 г. были ограничения внимания как на хранение информации, так и на ее обработку. В книге 1986 года Баддели исключил зависимое от внимания хранилище, но в статье 2000 года был добавлен новый компонент в виде эпизодического буфера. Этот буфер может зависеть или не зависеть от внимания и отвечает за краткосрочное хранение семантической информации, а также за специфическое связывание или ассоциацию между фонологической и визуально-пространственной информацией. Баддели и Хитч назвали сборку или систему хранения и обработки информации в доступной форме рабочей памятью, памятью, которую используют при выполнении различных когнитивных задач (т.э., познавательная работа).

Модель Коуэна (1988)

Спустя годы появилось несколько других предложений, которые меняют вкус предложения о рабочей памяти. Коуэн (1988) интересовался тем, как мы представляем то, что знаем и не знаем об обработке информации. «Модальные модели», о которых говорил Баддели, начались с модели Бродбента (1958), в которой было показано, что доступ к ящикам осуществляется в последовательности, сопоставимой с компьютерной блок-схемой: сначала сенсорная память, затем фильтр внимания, затем кратковременная память. , а затем долговременная память.Аткинсон и Шиффрин (1968) сохранили структуру блок-схемы, но добавили рекурсивный ввод в поля в форме процессов управления. Баддели и Хитч (1974) и Баддели (1986) вместо этого использовали диаграмму обработки, в которой к ящикам можно было обращаться параллельно. Предположительно, можно было бы ввести некоторую информацию в фонологическое хранилище, одновременно вводя другую информацию в визуально-пространственное хранилище, с взаимодействующими модулями и одновременным исполнительным управлением.

Коуэн (1988, 1995, 1999, 2001, 2005) немного отшатнулся от модулей и отдельных ящиков, отчасти потому, что они вполне могут образовывать произвольно неполную таксономию систем мозга.(Куда пойдет пространственная информация о звуке? Куда пойдет информация о прикосновении? Эти типы вопросов без ответа также, возможно, помогли мотивировать эпизодический буфер Baddeley, 2000.) Может быть несколько модулей, но поскольку мы не знаем таксономию, они все были брошены в суп активированной долговременной памяти. Вместо отдельных ящиков я попытался смоделировать на более высоком уровне, на котором неполные различия не были явно включены в модель, а механизмы могли быть встроены в другие механизмы.Таким образом, говорилось, что существует долговременная память, часть которой находилась в активированном состоянии (см. Hebb, 1949), а внутри нее меньшая часть которой находилась в фокусе внимания (см. James, 1890 г.). Диссоциации все еще могут происходить на основе сходства черт; два элемента с фонологическими характеристиками будут мешать друг другу, например, более одного элемента с фонологическими характеристиками и другой элемент только с визуально-пространственными характеристиками. Модель по-прежнему включала центральные исполнительные процессы.

По сравнению с Баддели и Хитчем (1974), Коуэн (1988) также уделял больше внимания сенсорной памяти. Верно, что печатные буквы, как и разговорные, закодированы с речевыми фонологическими особенностями, которые можно спутать друг с другом в рабочей памяти (например, Conrad, 1964). Тем не менее, существует множество других доказательств того, что списки, представленные в устной форме, запоминаются намного лучше, особенно в конце списка, чем устные списки, представленные в печатной форме (например, Murdock & Walker, 1969; Penney, 1989).

Фильтр внимания также был усвоен в модели Коуэна (1988). Вместо того, чтобы информация должна проходить через фильтр, предполагалось, что вся информация в той или иной степени активирует долговременную память. Разум формирует нейронную модель того, что он обработал. Это будет включать сенсорную информацию для всех стимулов, но в фокусе внимания гораздо больше семантической информации, чем можно найти для автоматической информации. Поступающая информация, которая соответствует текущей нейронной модели, становится привычной, но воспринимаемые изменения вызывают дезорганизацию в виде ориентировочных реакций внимания на лишенные привычки стимулы (см.Соколов, 1963). Такая система имеет свойства, аналогичные модели ослабленной фильтрации Трейсмана (1960) или модели релевантности Норма (1968). С этой точки зрения внимание контролируется двояко, часто с борьбой между произвольным исполнительным контролем и непроизвольными ориентировочными реакциями.

Насколько согласуется Коуэн (1988) с моделью Баддели и Хитча? Вклад Роберта Логи

С добавлением эпизодического буфера модель Баддели и Хитча делает прогнозы, часто похожие на предсказания Коуэна (1988).Тем не менее, могут быть важные различия. Открытый вопрос заключается в том, служит ли активированная часть долговременной памяти Коуэна (1988) функционально той же цели, что и фонологические и зрительно-пространственные буферы Баддели и Хитча (1974) и Баддели (1986). Роберт Логи и его коллеги утверждают, что этого не может быть, поскольку зрительные образы и кратковременная визуальная память диссоциированы (Borst, Niven, & Logie, 2012; Logie & van der Meulen, 2009; van der Meulen, Logie, & Della Sala, 2009 г.).Нерелевантные визуальные материалы мешают формированию визуальных образов, но не визуальному хранению, тогда как нажатие на пространственный образец мешает визуальному хранению, но не создает визуальные образы. Согласно модели, предложенной этими источниками, визуальные образы включают активацию репрезентаций долговременной памяти, тогда как кратковременное визуальное хранилище представляет собой отдельный буфер. Хотя это возможность требует дальнейших исследований, я еще не уверен. Могли быть и другие причины разобщения.Например, в исследовании van der Meulen et al. Задача визуального образа включала определение качеств представленных букв (изогнутая линия или нет, замкнутое пространство или нет и т. Д.), И эти качества могли больше перекрываться с интерференцией изображения; тогда как задача визуальной памяти заключалась в том, чтобы визуально запоминать буквы в верхнем и нижнем регистре в правильном последовательном порядке, а свойство последовательного порядка может испытывать больше помех от нажатия в последовательном пространственном шаблоне. Требуется проверка общности эффектов для задач с разными функциями.

Другие модели междоменной общности

Одно различие между каркасом Баддели (1986) и каркасом Коуэна (1988) состояло в том, что Коуэн уделял больше внимания возможности интерференции между доменами. Продолжаются споры о том, в какой степени вербальные и невербальные коды в рабочей памяти мешают друг другу (например, Cocchini, Logie, Della Sala, MacPherson, & Baddeley, 2002; Cowan & Morey, 2007; Fougnie & Marois, 2011 ; Morey & Bieler, 2013).Общий взгляд на предметную область распространился на другие типы исследований. Данеман и Карпентер (1980) показали, что чтение и запоминание слов — это задачи, которые мешают друг другу, и успех запоминания при чтении сильно коррелирует со способностью понимания прочитанного. Энгл и его коллеги (например, Engle, Tuholski, Laughlin, & Conway, 1999; Kane et al., 2004) показали, что такого рода эффект возникает не только со словесными материалами, но даже с хранением и обработкой в ​​отдельных областях, таких как как пространственное воспоминание с вербальной памятью.Они объясняли индивидуальные различия в первую очередь задачами обработки и необходимостью держать в уме инструкции и цели задач, подавляя при этом ненужные отвлекающие факторы.

Барруйе и его коллеги (например, Barrouillet, Portrat, & Camos, 2011; Vergauwe, Barrouillet, & Camos, 2010) подчеркнули, что процесс использования внимания для обновления элементов, независимо от того, является ли он вербальным или невербальным по своей природе, требует времени и противодействует разлагаться. Они обеспечивали сложные задачи, связанные с одновременным хранением и обработкой данных, как Дейнеман и Карпентер и как Энгл и его коллеги.Ключевым показателем является когнитивная нагрузка, доля времени, которая занята задачей обработки, а не свободное время, которое участник может использовать для обновления представлений о запоминаемых элементах. Открытие Барруйе и его коллег заключалось в том, что влияние когнитивной нагрузки на длину списка, который можно вспомнить, или объем памяти, является отрицательным линейным (т. Е. Пагубным) эффектом. Они также признают, что существует процесс вербальной репетиции, который отличается от обновления внимания, с возможностью использования любого режима поддержания памяти в зависимости от требований задачи (Camos, Mora, & Oberauer, 2011), но больше внимания уделяется освежает внимание, чем в случае Баддели и его коллег, и поэтому подход кажется более соответствующим Коуэну (1988) с его фокусом внимания (относительно освежения см. также Cowan, 1992).

Продолжающиеся споры о природе ограничений рабочей памяти

Теоретически существует два основных способа, которыми рабочая память может быть более ограниченной, чем долговременная память. Во-первых, он может быть ограничен количеством предметов, которые можно держать одновременно, предел вместимости, который Коуэн (1998, 2001) предварительно приписывает фокусу внимания. Во-вторых, он может быть ограничен количеством времени, в течение которого элемент остается в рабочей памяти, когда он больше не репетируется или не обновляется, предел распада, который Коуэн (1988) приписал активированной части долговременной памяти, практический предел. до 30 секунд в зависимости от задачи.

Оба эти ограничения в настоящее время спорны. Что касается предела емкости, не так много аргументов в пользу того, что в рамках определенного типа кодирования стимула (фонологического, визуально-пространственного и т. Д.) Нормальные взрослые ограничиваются примерно 3 или 4 значимыми единицами или фрагментами. Спор заключается в том, возникает ли предел в фокусе внимания или из-за того, что похожие материалы мешают друг другу (например, Oberauer, Lewandowsky, Farrell, Jarrold, & Greaves, 2012). В моей недавней, еще не опубликованной работе я предлагаю ограничить фокус внимания несколькими фрагментами информации, но эти фрагменты можно выгружать в долговременную память и удерживать там с помощью некоторого освежения внимания. в то время как фокус внимания в первую очередь используется для кодирования дополнительной информации.

Что касается предела потери или распада памяти, некоторые исследования показали отсутствие потери информации для списков печатных словесных материалов в те периоды, когда репетиции и обновление явно не допускались (Lewandowsky, Duncan, & Brown, 2004; Oberauer & Lewandowsky, 2008 ). Тем не менее, для массивов незнакомых символов, за которыми следует маска для устранения сенсорной памяти, Рикер и Коуэн (2010) обнаружили потерю или распад памяти (см. Zhang & Luck, 2009). В дальнейшей работе Ricker et al.(в печати) предположил, что степень распада зависит от того, насколько хорошо информация консолидируется в рабочей памяти (см. Jolicoeur & Dell’Acqua, 1998). Учитывая, что время, доступное для обновления, оказалось обратно пропорционально когнитивной нагрузке, процесс консолидации, который кажется критическим, не прерывается маской, а продолжается после нее. Этот процесс консолидации может быть своего рода усилением следа эпизодической памяти, основанным на обновлении внимания в духе Барруйе и др.(2011). Если это так, то наиболее важным эффектом этого освежения будет не временное устранение эффектов распада, как Barrouillet et al. предложено, а скорее изменить скорость самого распада. В наши планы на будущее входит изучение этих возможностей.

Долговременная рабочая память

Совершенно очевидно, что люди достаточно хорошо функционируют в сложных средах, в которых подробные знания должны использоваться с умением, несмотря на жесткое ограничение рабочей памяти несколькими идеями или элементами одновременно.Что важно для понимания этого парадокса человеческой деятельности, так это то, что каждый слот в рабочей памяти может быть заполнен концепцией большой сложности при условии, что у человека есть необходимые знания в долговременной памяти. Этот момент был отмечен Миллером (1956) в его концепции объединения элементов для формирования более крупных фрагментов информации с ограничением в рабочей памяти, определяемым количеством фрагментов, а не количеством отдельных элементов, представленных для запоминания. Эрикссон и Кинч (1995) развили эту концепцию, расширив определение рабочей памяти, включив в нее релевантную информацию в долговременной памяти.

Хотя мы можем спорить о лучшем определении рабочей памяти, кажется бесспорным, что долговременная память часто используется, как предлагают Эрикссон и Кинтч (1995). Примером может служить то, что происходит, когда разговор с посетителем прерывается телефонным звонком. Во время разговора личный разговор с посетителем обычно выходит за рамки сознательной рабочей памяти. Однако после звонка, когда посетитель служит яркой репликой, часто можно восстановить воспоминания о разговоре как о недавнем эпизоде ​​и вспомнить, где этот разговор остановился.Через несколько дней это может стать невозможным. Такое использование долговременной памяти для выполнения функций, аналогичных традиционной рабочей памяти, таким образом расширяя возможности человека, было названо Эрикссоном и Кинчем долговременной рабочей памятью. Коуэн (1995) намекал на аналогичное использование долговременной памяти для этой цели, но, не желая расширять определение рабочей памяти, назвал функцию виртуальной кратковременной памятью, что означает использование долговременной памяти таким образом, чтобы обычно используется кратковременная память.Это очень похоже на использование памяти компьютера, которое позволяет выключить компьютер в режиме гибернации, а затем вернуть его в прежнее состояние при извлечении памяти.

Учитывая способность людей так умело использовать долговременную память, можно спросить, почему мы вообще заботимся о серьезном ограничении объема рабочей памяти. Ответ заключается в том, что это очень важно, когда есть ограниченное долгосрочное знание темы. В таких обстоятельствах объем рабочей памяти может определять, сколько элементов можно удерживать в памяти одновременно, чтобы использовать элементы вместе, или связать их, чтобы сформировать новую концепцию в долговременной памяти.Так бывает во многих ситуациях, которые важны для обучения и понимания. Один простой пример совместного использования предметов — это выполнение набора инструкций, например, для дошкольника положите свой рисунок в свой уголок, а затем сядьте в круг . Часть этого наставления можно забыть до того, как оно будет выполнено, и учителя должны учитывать такую ​​возможность. Простой пример связывания элементов вместе — это чтение романа, когда человек слушает описание персонажа и объединяет части описания, чтобы получить общий набросок личности, который может быть сформирован в долговременной памяти.Неадекватное использование рабочей памяти во время чтения может привести к тому, что набросок будет неполным, так как некоторые описательные черты непреднамеренно игнорируются. Знание этого предела рабочей памяти можно использовать для улучшения письма, облегчая его запоминание и понимание.

Паас и Свеллер (2012) подчеркивают различие между биологически первичными и вторичными знаниями (Geary, 2008) и предполагают (стр. 29), что «люди легко могут приобретать огромное количество первичных биологических знаний вне образовательного контекста и без заметная нагрузка на рабочую память.«Примерами, которые они предложили, были изучение лиц и умение говорить. Вполне может быть, что отдельные лица или произнесенные слова быстро становятся интегрированными фрагментами долговременной памяти (и, я бы добавил, то же самое, кажется, верно для объектов в областях усвоенных знаний, например, письменных слов у взрослых). Тем не менее, биологически первичные компоненты используются во многих ситуациях, когда действительно применяются жесткие ограничения производительности. В этих ситуациях потребность в дополнительной памяти считается биологически вторичной.Примером может служить обучение, какое лицо должно быть связано с каким именем. Если на экране отображаются четыре новых лица и их имена озвучиваются голосом, эти пары имя-лицо не могут храниться в рабочей памяти одновременно, поэтому сложно сохранить информацию, и часто требуется дополнительное изучение одной пары за раз. чтобы запомнить сочетание имени и лица.

Конкретные математические модели

Здесь я выборочно исследовал модели рабочей памяти, которые являются довольно всеобъемлющими и конкретизируются устно.Ограничивая область применимости и добавляя некоторые допущения при обработке, другие исследователи на протяжении многих лет смогли сформулировать модели, которые делают математические прогнозы производительности в конкретных ситуациях. Мы многому у них научились, но они по существу выходят за рамки этого обзора, учитывая ограниченное пространство и мои собственные ограничения. Примеры таких моделей см. В Brown, Neath, & Chater, 2007; Берджесс и Хитч, 1999; Cowan et al., 2012; Фаррелл и Левандовски, 2002; Hensen, 1998; Мердок, 1982; Оберауэр и Левандовски, 2011).Важность этих моделей состоит в том, что они проясняют последствия наших теоретических предположений. Чтобы делать количественные прогнозы, каждое математическое предположение должно быть явным. Иногда обнаруживается, что эффекты некоторых предложенных механизмов, взятых вместе, не соответствуют тому, что можно было бы предположить из чисто словесной теории. Конечно, некоторые из допущений, которые необходимо сделать для получения количественных прогнозов, могут быть неподтвержденными, поэтому я считаю, что лучший способ продвинуться в этой области — это иногда использовать общее вербальное, пропозициональное мышление, а в других случаях — конкретное количественное моделирование. работает над сближением этих методов к общей теории.

Что такое контроллер данных или процессор данных?

Ответ

Контроллер данных определяет цели , для которых, а означает , с помощью которых обрабатываются личные данные. Итак, если ваша компания / организация решает, «почему» и «как» следует обрабатывать персональные данные, это ее контролер. Сотрудники, обрабатывающие персональные данные в вашей организации, делают это для выполнения ваших задач в качестве контроллера данных.

Ваша компания / организация является совместным контролером , когда вместе с одной или несколькими организациями она совместно определяет, «почему» и «как» следует обрабатывать персональные данные.Совместные контролеры должны заключить соглашение, определяющее их соответствующие обязанности по соблюдению правил GDPR. Основные аспекты договоренности должны быть доведены до сведения лиц, данные которых обрабатываются.

Процессор данных обрабатывает только персональные данные от имени контроллера . Обработчик данных обычно является третьей стороной, не связанной с компанией. Однако в случае групп предприятий одно предприятие может выступать в качестве обработчика для другого предприятия.

Обязанности обработчика по отношению к контролеру должны быть указаны в контракте или другом правовом акте. Например, в контракте должно быть указано, что происходит с личными данными после расторжения контракта. Типичным видом деятельности процессоров является предложение ИТ-решений, в том числе облачных хранилищ. Обработчик данных может передать часть своей задачи другому обработчику или назначить совместного обработчика только после получения предварительного письменного разрешения от контролера данных.

Бывают ситуации, когда объект может быть контроллером данных или обработчиком данных, или и тем, и другим.

Примеры

Контроллер и процессор

На пивоварне работает много сотрудников. Он подписывает контракт с зарплатной компанией на выплату заработной платы. Пивоварня сообщает компании по начислению заработной платы, когда должна быть выплачена заработная плата, когда сотрудник увольняется или ему повышается заработная плата, а также предоставляет все другие детали для ведомости заработной платы и выплаты. Компания по начислению заработной платы предоставляет ИТ-систему и хранит данные о сотрудниках. Пивоварня является контролером данных, а компания по начислению заработной платы — обработчиком данных.

Совместные контроллеры

Ваша компания / организация предлагает услуги няни через онлайн-платформу. В то же время ваша компания / организация имеет контракт с другой компанией, позволяющий вам предлагать услуги с добавленной стоимостью. Эти услуги включают в себя возможность для родителей не только выбрать няню, но и взять напрокат игры и DVD-диски, которые няня может принести. Обе компании участвуют в технической настройке веб-сайта. В этом случае две компании решили использовать платформу для обеих целей (услуги няни и прокат DVD / игр) и очень часто будут использовать имена клиентов.Таким образом, две компании являются совместными контролерами, потому что они не только соглашаются предложить возможность «комбинированных услуг», но также проектируют и используют общую платформу.

Список литературы

Большие данные: революция в управлении

Работа: Тамар Коэн, Happy Motoring, 2010, шелкография на старинной дорожной карте, 26 ″ x 18 ″

«Вы не можете управлять тем, что не измеряете».

В этом высказывании много мудрости, которое приписывают У.Эдвардса Деминга и Питера Друкера, и это объясняет, почему недавний взрыв цифровых данных так важен. Проще говоря, благодаря большим данным менеджеры могут измерять и, следовательно, знать радикально больше о своем бизнесе и напрямую преобразовывать эти знания в улучшение процесса принятия решений и повышения производительности.

Рассмотрим розничную торговлю. Продавцы книг в обычных магазинах всегда могли отслеживать, какие книги были проданы, а какие нет. Если бы у них была программа лояльности, они могли бы привязать некоторые из этих покупок к отдельным клиентам.Вот и все. Однако после того, как покупки переместились в Интернет, понимание клиентов резко возросло. Интернет-магазины могли отслеживать не только то, что покупали клиенты, но и то, что еще они смотрели; как они перемещались по сайту; насколько на них повлияли акции, обзоры и макеты страниц; и сходство между людьми и группами. Вскоре они разработали алгоритмы для прогнозирования того, какие книги отдельные клиенты хотели бы прочитать дальше, — алгоритмы, которые работали лучше каждый раз, когда покупатель отвечал на рекомендацию или игнорировал ее.Традиционные розничные торговцы просто не могли получить доступ к такой информации, не говоря уже о своевременных действиях. Неудивительно, что Amazon закрыла так много обычных книжных магазинов.

Известность истории Amazon почти скрывает ее силу. Мы ожидаем, что компании, рожденные цифровыми технологиями, смогут добиться того, о чем руководители предприятий могли только мечтать поколение назад. Но на самом деле использование больших данных может изменить и традиционный бизнес. Это может предложить им еще большие возможности для получения конкурентного преимущества (онлайн-компании всегда знали, что они конкурируют, исходя из того, насколько хорошо они понимают свои данные).Как мы обсудим более подробно, большие данные этой революции намного мощнее, чем аналитика, которая использовалась в прошлом. Мы можем измерять и, следовательно, управлять более точно, чем когда-либо прежде. Мы можем делать более точные прогнозы и более разумные решения. Мы можем нацелить более эффективные вмешательства и сделать это в тех областях, в которых до сих пор преобладали интуиция и интуиция, а не данные и строгость.

По мере распространения инструментов и философии больших данных они изменят устоявшиеся представления о ценности опыта, природе знаний и практике управления.Умные лидеры во всех отраслях увидят, что использование больших данных является тем, чем они являются: революцией в управлении. Но, как и в случае с любыми другими серьезными изменениями в бизнесе, проблемы превращения в организацию, работающую с большими данными, могут быть огромными и потребовать практического — или, в некоторых случаях, невмешательства — руководства. Тем не менее, это переходный период, в котором руководители должны участвовать сегодня.

Что здесь нового?

Руководители предприятий иногда спрашивают нас: «Разве« большие данные »не являются еще одним словом« аналитика »?» Это правда, что они связаны: движение больших данных, как и предшествующая аналитика, стремится извлечь из данных информацию и превратить ее в преимущества для бизнеса.Однако есть три ключевых отличия:

Объем.

По состоянию на 2012 год около 2,5 эксабайт данных создается каждый день, и это число удваивается каждые 40 месяцев или около того. Каждую секунду через Интернет передается больше данных, чем было сохранено во всем Интернете всего 20 лет назад. Это дает компаниям возможность работать с большим количеством петабайтов данных в одном наборе данных — и не только из Интернета. Например, согласно оценкам, Walmart собирает более 2,5 петабайт данных каждый час в результате транзакций своих клиентов.Петабайт — это один квадриллион байтов, или эквивалент текста объемом около 20 миллионов картотек. Эксабайт в 1000 раз больше, или один миллиард гигабайт.

Скорость.

Для многих приложений скорость создания данных даже важнее, чем объем. Информация в реальном времени или почти в реальном времени позволяет компании быть более гибкой, чем ее конкуренты. Например, наш коллега Алекс «Сэнди» Пентланд и его группа в MIT Media Lab использовали данные о местоположении с мобильных телефонов, чтобы определить, сколько людей было на стоянках Macy’s в Черную пятницу — начало сезона рождественских покупок в Соединенных Штатах.Это позволяло оценить объем продаж ритейлера в этот критический день еще до того, как Macy’s зафиксировал эти продажи. Подобные быстрые выводы могут предоставить очевидное конкурентное преимущество аналитикам с Уолл-стрит и менеджерам с главной улицы.

Сорт.

Большие данные принимают форму сообщений, обновлений и изображений, размещаемых в социальных сетях; показания с датчиков; GPS-сигналы от сотовых телефонов и многое другое. Многие из наиболее важных источников больших данных относительно новы.Например, огромное количество информации из социальных сетей ровно столько же, сколько и сами сети; Facebook был запущен в 2004 году, Twitter — в 2006 году. То же самое касается смартфонов и других мобильных устройств, которые теперь предоставляют огромные потоки данных, связанных с людьми, действиями и местоположениями. Поскольку эти устройства распространены повсеместно, легко забыть, что iPhone был представлен всего пять лет назад, а iPad — в 2010 году. Таким образом, структурированные базы данных, в которых хранилась большая часть корпоративной информации до недавнего времени, плохо подходят для хранения и обработки больших данных.В то же время неуклонное снижение затрат на все элементы вычислений — хранилище, память, обработку, пропускную способность и т. Д. — означает, что ранее дорогостоящие подходы с интенсивным использованием данных быстро становятся экономичными.

По мере того, как все больше и больше деловой активности переводится в цифровую форму, новые источники информации и все более дешевое оборудование объединяются, чтобы ввести нас в новую эру: эру, в которой существуют большие объемы цифровой информации практически по любой теме, представляющей интерес для бизнеса. Мобильные телефоны, интернет-магазины, социальные сети, электронная связь, GPS и оборудование с инструментами — все это создает потоки данных как побочный продукт своей обычной деятельности.Теперь каждый из нас — ходячий генератор данных. Доступные данные часто неструктурированы — не организованы в базу данных — и громоздки, но в шуме присутствует огромное количество сигнала, просто ожидающего своего выхода. Аналитика привнесла строгие методы в принятие решений; большие данные одновременно проще и мощнее. Как сказал директор по исследованиям Google Питер Норвиг: «У нас нет алгоритмов лучше. У нас просто больше данных ».

Как работают компании, управляемые данными

Второй вопрос, который могут задать скептики, звучит так: «Где доказательства того, что разумное использование больших данных улучшит эффективность бизнеса?» Деловая пресса изобилует анекдотами и тематическими исследованиями, которые якобы демонстрируют ценность управления данными.Но правда, как мы недавно поняли, заключается в том, что никто не решал этот вопрос строго. Чтобы восполнить этот досадный пробел, мы возглавили группу в Центре цифрового бизнеса Массачусетского технологического института, работая в партнерстве с отделом бизнес-технологий McKinsey, нашим коллегой Лорином Хиттом из Wharton и докторантом Массачусетского технологического института Хикьюнгом Кимом. Мы решили проверить гипотезу о том, что компании, управляемые данными, будут лучше работать. Мы провели структурированные интервью с руководителями 330 публичных североамериканских компаний об их практике организации и управления технологиями, а также собрали данные об эффективности из их годовых отчетов и независимых источников.

Не все поддерживали принятие решений на основе данных. Фактически, мы обнаружили широкий спектр взглядов и подходов в каждой отрасли. Но во всех проведенных нами анализах выделялась одна взаимосвязь: чем больше компаний характеризовали себя как ориентированные на данные, тем лучше они добивались объективных показателей финансовых и операционных результатов. В частности, компании, входящие в верхнюю треть своей отрасли по использованию принятия решений на основе данных, были в среднем на 5% продуктивнее и на 6% прибыльнее, чем их конкуренты.Эта разница в производительности оставалась значительной после учета вклада рабочей силы, капитала, приобретенных услуг и традиционных инвестиций в ИТ. Это было статистически значимым и экономически важным, и это нашло отражение в измеримом повышении стоимости акций на фондовом рынке.

Так как же менеджеры используют большие данные? Давайте подробно рассмотрим две компании, которые далеки от выскочки из Кремниевой долины. Один использует большие данные для создания новых предприятий, другой — для увеличения продаж.

Улучшенное расчетное время прибытия авиакомпаний

Минуты имеют значение в аэропортах.То же самое и с точной информацией о времени прибытия рейса: если самолет приземляется до того, как наземный персонал готов к нему, пассажиры и экипаж фактически оказываются в ловушке, а если он появляется позже, чем ожидалось, персонал бездействует, увеличивая расходы. Поэтому, когда крупная американская авиакомпания узнала из внутреннего исследования, что около 10% рейсов в ее крупный хаб имеют как минимум 10-минутный разрыв между расчетным временем прибытия и фактическим временем прибытия, а у 30% разрыв составляет около 10 минут. минимум пять минут — решено действовать.

В то время авиакомпания полагалась на многолетнюю практику авиационной отрасли по использованию ETA, предоставляемых пилотами. Эти оценки пилоты сделали во время последнего захода на посадку в аэропорту, когда у них было много других требований к своему времени и вниманию. В поисках лучшего решения авиакомпания обратилась к PASSUR Aerospace, поставщику технологий поддержки принятия решений для авиационной отрасли. В 2001 году PASSUR начал предлагать собственные оценки прибытия в качестве услуги под названием RightETA.Он рассчитал это время, объединив общедоступные данные о погоде, расписании рейсов и других факторах с собственными данными, собранными самой компанией, включая данные из сети пассивных радиолокационных станций, которые она установила возле аэропортов для сбора данных о каждом самолете в местном небе. .

PASSUR начинался с нескольких таких установок, но к 2012 году их было более 155. Каждые 4,6 секунды он собирает широкий спектр информации о каждом самолете, который он «видит». Это приводит к огромному и постоянному потоку цифровых данных.Более того, компания хранит все данные, которые она собрала с течением времени, поэтому у нее есть огромный объем многомерной информации, охватывающий более десяти лет. Это позволяет проводить сложный анализ и сопоставление с образцом. RightETA, по сути, работает, задавая себе вопрос: «Что происходило все предыдущие раз, когда самолет приближался к этому аэропорту в таких условиях?» Когда он на самом деле приземлился? »

После перехода на RightETA авиакомпания практически устранила пробелы между расчетным и фактическим временем прибытия.PASSUR считает, что предоставление авиакомпаниям информации о том, когда их самолеты собираются приземлиться, и соответствующего планирования стоит несколько миллионов долларов в год в каждом аэропорту. Это простая формула: использование больших данных позволяет делать более точные прогнозы, а более точные прогнозы позволяют принимать более правильные решения.

Более быстрые и персонализированные рекламные акции

Пару лет назад Sears Holdings пришла к выводу, что ей необходимо создавать большую ценность из огромного количества данных о клиентах, продуктах и ​​рекламных акциях, которые она собирала у своих брендов Sears, Craftsman и Lands ’End.Очевидно, было бы полезно объединить и использовать все эти данные для адаптации рекламных акций и других предложений для клиентов, а также для персонализации предложений, чтобы воспользоваться преимуществами местных условий. Ценно, но сложно: Sears потребовалось около восьми недель для создания персонализированных рекламных акций, после чего многие из них перестали быть оптимальными для компании. Это заняло так много времени, главным образом потому, что данные, необходимые для этого крупномасштабного анализа, были объемными и сильно фрагментированными — хранились во многих базах данных и «хранилищах данных», поддерживаемых различными брендами.

В поисках более быстрого и дешевого способа выполнения аналитической работы Sears Holdings обратилась к технологиям и методам работы с большими данными. В качестве одного из первых шагов он создал кластер Hadoop. Это просто группа недорогих обычных серверов, деятельность которых координируется новой программной средой под названием Hadoop (названной в честь игрушечного слона в доме одного из разработчиков Дуга Каттинга).

Sears начала использовать кластер для хранения входящих данных от всех своих брендов и для хранения данных из существующих хранилищ данных.Затем он провел анализ непосредственно в кластере, избегая трудоемких трудностей, связанных с извлечением данных из различных источников и их объединением, чтобы их можно было проанализировать. Это изменение позволило компании намного быстрее и точнее проводить рекламные акции. По словам технического директора компании Фила Шелли, время, необходимое для создания комплексного набора рекламных акций, сократилось с восьми недель до одной и все еще сокращается. И эти рекламные акции более качественные, потому что они более своевременны, детализированы и более персонализированы.Кластер Sears Hadoop хранит и обрабатывает несколько петабайт данных за небольшую часть стоимости сопоставимого стандартного хранилища данных.

Шелли говорит, что удивлен тем, насколько легко он смог перейти от старых подходов к новым подходам к управлению данными и высокопроизводительной аналитике. Поскольку в 2010 году навыки и знания, связанные с новыми технологиями обработки данных, были настолько редки, когда Sears начала переход, она поручила часть работы компании Cloudera. Но со временем старая гвардия ИТ-специалистов и аналитиков привыкла к новым инструментам и подходам.

Примеры PASSUR и Sears Holding демонстрируют мощь больших данных, которые позволяют делать более точные прогнозы, принимать более обоснованные решения и проводить точные вмешательства, а также позволяют реализовать эти возможности в, казалось бы, безграничных масштабах. Мы видели большие данные, используемые в управлении цепочкой поставок, чтобы понять, почему количество брака у автопроизводителей внезапно увеличилось, в службе поддержки клиентов, чтобы постоянно сканировать и вмешиваться в практику здравоохранения миллионов людей, в планировании и прогнозировании, чтобы лучше предвидеть онлайн продажи на основе набора данных о характеристиках продукта и т. д.Мы видели аналогичные результаты во многих других отраслях и сферах деятельности, от финансов до маркетинга, отелей и игр, от управления персоналом до ремонта машин.

Наш статистический анализ показывает, что мы наблюдаем не просто несколько ярких примеров, а более фундаментальную трансформацию экономики. Мы убедились, что практически ни одна сфера деловой активности не останется без внимания этого движения.

Новая культура принятия решений

Технические проблемы использования больших данных вполне реальны.Но управленческие проблемы еще больше — начиная с роли высшего руководства.

Отключение HiPPO.

Одним из наиболее важных аспектов больших данных является их влияние на то, как принимаются решения и кто их принимает. Когда данных мало, их получение дорого или недоступно в цифровой форме, имеет смысл позволить хорошо подготовленным людям принимать решения, которые они делают на основе накопленного ими опыта, моделей и отношений, которые они наблюдали, и интернализованный.«Интуиция» — это ярлык, который дается этому стилю умозаключений и принятия решений. Люди высказывают свое мнение о том, что нас ждет в будущем — что произойдет, насколько хорошо что-то будет работать и т. Д. — а затем соответственно планируют. (См. «Истинные критерии успеха» Майкла Дж. Мобуссена в этом выпуске.)

Сила больших данных не отменяет потребности в видении или человеческом понимании.

Для принятия особо важных решений эти люди обычно занимают высокие должности в организации или являются дорогостоящими посторонними, привлеченными из-за их опыта и послужного списка.Многие в сообществе больших данных утверждают, что компании часто принимают большинство своих важных решений, полагаясь на «HiPPO» — мнение самого высокооплачиваемого человека.

Безусловно, ряд руководителей высшего звена действительно руководствуются данными и готовы отвергнуть собственную интуицию, когда данные не согласуются с ней. Но мы считаем, что сегодня во всем мире бизнеса люди слишком полагаются на опыт и интуицию, а не на данные. Для нашего исследования мы построили 5-балльную составную шкалу, которая отражает общую степень, в которой компания ориентирована на данные.32% наших респондентов оценили свои компании на уровне 3 или ниже по этой шкале.

Новые роли.

Руководители, заинтересованные в переходе на большие объемы данных, могут начать с двух простых приемов. Во-первых, они могут иметь привычку спрашивать: «Что говорят данные?» когда мы сталкиваемся с важным решением и последующими более конкретными вопросами, такими как «Откуда взялись данные?», «Какие виды анализа были проведены?» и «Насколько мы уверены в результатах?» (Люди быстро поймут сообщение, если руководители разовьют эту дисциплину.) Во-вторых, они могут позволить себе быть отвергнутыми данными; Мало что может быть более действенным для изменения культуры принятия решений, чем то, что высшее руководство уступает, когда данные опровергают догадки.

Конечно, когда дело доходит до определения того, какие проблемы следует решать, критически важным является знание предметной области. Традиционные эксперты в предметной области — те, кто хорошо знаком с областью, — это те, кто знает, в чем заключаются самые большие возможности и проблемы. PASSUR, например, пытается нанять как можно больше людей, обладающих обширными знаниями о работе в крупных аэропортах Америки.Они будут неоценимы, поскольку помогут компании выяснить, какие предложения и рынки ей следует продвигать дальше.

По мере развития движения больших данных роль экспертов в предметной области будет меняться. Их будут ценить не за их ответы в стиле HiPPO, а за то, что они знают, какие вопросы задавать. Пабло Пикассо мог думать об экспертах в предметной области, когда сказал: «Компьютеры бесполезны. Они могут дать вам только ответы ».

Пять задач управления

Компании не смогут воспользоваться всеми преимуществами перехода к использованию больших данных, если они не смогут эффективно управлять изменениями.В этом процессе особенно важны пять областей.

Лидерство.

Компании преуспевают в эпоху больших данных не просто потому, что у них больше или лучше данных, а потому, что у них есть руководящие группы, которые ставят четкие цели, определяют, как выглядит успех, и задают правильные вопросы. Сила больших данных не отменяет потребности в видении или человеческом понимании. Напротив, у нас по-прежнему должны быть бизнес-лидеры, которые могут определить отличные возможности, понять, как развивается рынок, мыслить творчески и предложить действительно новые предложения, сформулировать убедительное видение, убедить людей принять его и упорно трудиться, чтобы его реализовать, и эффективно взаимодействовать с клиентами, сотрудниками, акционерами и другими заинтересованными сторонами.Успешные компании следующего десятилетия будут теми, чьи лидеры смогут сделать все это, изменив при этом способы принятия их организациями многих решений.

Управление талантами.

По мере того, как данные становятся дешевле, их дополнения становятся более ценными. Некоторые из наиболее важных из них — специалисты по обработке данных и другие специалисты, умеющие работать с большими объемами информации. Статистика важна, но многие ключевые методы использования больших данных редко преподаются на традиционных курсах статистики.Возможно, даже более важны навыки очистки и организации больших наборов данных; новые виды данных редко поступают в структурированных форматах. Инструменты и методы визуализации также становятся все более ценными. Наряду с специалистами по обработке данных новое поколение специалистов по информатике внедряет методы работы с очень большими наборами данных. Опыт в разработке экспериментов может помочь преодолеть разрыв между корреляцией и причинно-следственной связью. Лучшие специалисты по обработке данных также могут свободно говорить на языке бизнеса и помогать руководителям переформулировать свои задачи таким образом, чтобы их можно было решить с помощью больших данных.Неудивительно, что людей с такими навыками сложно найти и они пользуются большим спросом. (См. В этом выпуске «Специалист по анализу данных: Самая сексуальная работа 21 века» Томаса Х. Давенпорта и Д. Дж. Патила.)

Технология.

Инструменты, доступные для обработки объема, скорости и разнообразия больших данных, за последние годы значительно улучшились. В целом эти технологии не слишком дороги, и большая часть программного обеспечения имеет открытый исходный код. Hadoop, наиболее часто используемый фреймворк, сочетает в себе обычное оборудование и программное обеспечение с открытым исходным кодом.Принимает входящие потоки данных и распределяет их на дешевые диски; он также предоставляет инструменты для анализа данных. Однако эти технологии требуют набора навыков, который является новым для большинства ИТ-отделов, которым необходимо будет много работать, чтобы интегрировать все соответствующие внутренние и внешние источники данных. Хотя внимания к технологиям недостаточно, это всегда необходимый компонент стратегии больших данных.

Принятие решения.

Эффективная организация размещает информацию и соответствующие права на принятие решений в одном месте.В эпоху больших данных информация создается и передается, а экспертиза часто оказывается не там, где раньше. Искусный лидер создаст организацию, достаточно гибкую, чтобы минимизировать синдром «изобретено не здесь» и максимизировать межфункциональное сотрудничество. Людей, которые понимают проблемы, необходимо объединить с помощью правильных данных, но также и с людьми, у которых есть методы решения проблем, которые могут эффективно их использовать.

Культура компании.

Первый вопрос, который задает себе организация, основанная на данных, не «Что мы думаем?» но «Что мы знаем?» Это требует отказа от действий исключительно на основе интуиции и инстинкта.Это также требует избавления от вредной привычки, которую мы заметили во многих организациях: притворяться, будто мы больше ориентируемся на данные, чем они есть на самом деле. Слишком часто мы видели руководителей, которые добавляли в свои отчеты большое количество данных, подтверждающих решения, которые они уже приняли с использованием традиционного подхода HiPPO. Только после этого были отправлены подчиненные, чтобы найти цифры, которые оправдали бы это решение. Без сомнения, многие препятствия на пути к успеху остаются. Слишком мало специалистов по данным, чтобы их обойти. Технологии новые и в некоторых случаях экзотические.Слишком легко принять корреляцию за причинно-следственную связь и найти в данных вводящие в заблуждение закономерности. Культурные проблемы огромны, и, конечно же, проблемы с конфиденциальностью станут только более значительными. Но основные тенденции, как в технологиях, так и в прибылях бизнеса, безошибочны.

Доказательства очевидны: решения, основанные на данных, обычно являются более правильными. Лидеры либо примут этот факт, либо будут заменены другими, которые согласны. В секторе за сектором компании, которые выясняют, как объединить опыт в предметной области с наукой о данных, отойдут от своих конкурентов.Нельзя сказать, что все победители будут использовать большие данные для преобразования процесса принятия решений. Но данные говорят нам, что это самая верная ставка.

Версия этой статьи появилась в октябрьском номере журнала Harvard Business Review за 2012 год.

Что такое большие данные и почему они важны?

Большие данные — это комбинация структурированных, полуструктурированных и неструктурированных данных, собранных организациями, которые могут быть добыты для получения информации и использованы в проектах машинного обучения, прогнозного моделирования и других приложений расширенной аналитики.

Системы, обрабатывающие и хранящие большие данные, стали обычным компонентом архитектур управления данными в организациях в сочетании с инструментами, поддерживающими использование аналитики больших данных. Большие данные часто характеризуются тремя буквами V:

  • большой объем данных во многих средах;
  • широкий спектр различных типов данных , часто хранимых в системах больших данных; и
  • скорость , с которой большая часть данных генерируется, собирается и обрабатывается.

Эти характеристики были впервые определены в 2001 году Дугом Лэйни, тогдашним аналитиком консалтинговой фирмы Meta Group Inc .; Gartner еще больше популяризировал их после приобретения Meta Group в 2005 году. Совсем недавно к различным описаниям больших данных были добавлены несколько других V, в том числе достоверность , значение и изменчивость .

Хотя большие данные не приравниваются к какому-либо конкретному объему данных, развертывание больших данных часто включает терабайты, петабайты и даже эксабайты данных, создаваемых и собираемых с течением времени.

Важность больших данных

Компании используют большие данные в своих системах, чтобы улучшить операции, улучшить обслуживание клиентов, создать персонализированные маркетинговые кампании и предпринять другие действия, которые, в конечном итоге, могут увеличить доход и прибыль. Компании, которые его эффективно используют, имеют потенциальное конкурентное преимущество перед теми, кто этого не делает, потому что они могут принимать более быстрые и обоснованные бизнес-решения.

Например, большие данные предоставляют ценную информацию о клиентах, которую компании могут использовать для уточнения своего маркетинга, рекламы и рекламных акций, чтобы повысить вовлеченность клиентов и коэффициент конверсии.Как исторические данные, так и данные в реальном времени могут быть проанализированы для оценки меняющихся предпочтений потребителей или корпоративных покупателей, что позволяет предприятиям лучше реагировать на желания и потребности клиентов.

Большие данные также используются медицинскими исследователями для выявления признаков болезней и факторов риска, а врачами — для диагностики заболеваний и состояний у пациентов. Кроме того, сочетание данных из электронных медицинских карт, сайтов социальных сетей, Интернета и других источников дает организациям здравоохранения и правительственным учреждениям самую свежую информацию об угрозах или вспышках инфекционных заболеваний.

Вот еще несколько примеров того, как большие данные используются организациями:

  • В энергетической отрасли большие данные помогают нефтегазовым компаниям определять потенциальные места бурения и контролировать работу трубопроводов; Аналогичным образом, коммунальные предприятия используют его для отслеживания электрических сетей.
  • Финансовые компании используют системы больших данных для управления рисками и анализа рыночных данных в реальном времени.
  • Производители и транспортные компании полагаются на большие данные для управления цепочками поставок и оптимизации маршрутов доставки.
  • Другое государственное использование включает реагирование на чрезвычайные ситуации, предупреждение преступности и инициативы «умного города».
Вот некоторые из бизнес-преимуществ, которые организации могут получить, используя большие данные.

Примеры больших данных

Большие данные поступают из множества источников — некоторыми примерами являются системы обработки транзакций, клиентские базы данных, документы, электронные письма, медицинские записи, журналы посещений в Интернете, мобильные приложения и социальные сети. Он также включает данные, созданные машинами, такие как файлы журналов сети и сервера, а также данные датчиков на производственных машинах, промышленном оборудовании и устройствах Интернета вещей.

Помимо данных из внутренних систем, среды больших данных часто включают внешние данные о потребителях, финансовых рынках, погодных условиях и условиях дорожного движения, географическую информацию, научные исследования и многое другое. Изображения, видео и аудиофайлы также являются формами больших данных, и многие приложения для работы с большими данными включают потоковые данные, которые обрабатываются и собираются на постоянной основе.

Разбивка больших данных по буквам

Объем — это наиболее часто упоминаемая характеристика больших данных.Среда больших данных не обязательно должна содержать большой объем данных, но в большинстве случаев это происходит из-за характера данных, которые собираются и хранятся в них. Клики-потоки, системные журналы и системы потоковой обработки являются одними из источников, которые обычно производят огромные объемы данных на постоянной основе.

Большие данные также включают в себя широкий спектр типов данных, включая следующие:

  • структурированные данные, такие как транзакции и финансовые записи;
  • неструктурированных данных, таких как текст, документы и мультимедийные файлы; и
  • полуструктурированных данных, таких как журналы веб-сервера и потоковые данные с датчиков.

В системах больших данных может потребоваться совместное хранение и управление различными типами данных. Кроме того, приложения для работы с большими данными часто включают в себя несколько наборов данных, которые нельзя интегрировать заранее. Например, проект по анализу больших данных может попытаться спрогнозировать продажи продукта путем сопоставления данных о прошлых продажах, возвратах, онлайн-обзорах и обращениях в службу поддержки.

Скорость — это скорость, с которой генерируются данные, которые должны обрабатываться и анализироваться. Во многих случаях наборы больших данных обновляются в режиме реального или почти в реальном времени вместо ежедневных, еженедельных или ежемесячных обновлений, выполняемых во многих традиционных хранилищах данных.Управление скоростью передачи данных также важно, поскольку анализ больших данных расширяется до машинного обучения и искусственного интеллекта (ИИ), где аналитические процессы автоматически находят закономерности в данных и используют их для получения информации.

Дополнительные характеристики больших данных

Помимо исходных трех V, вот подробности о некоторых других, которые сейчас часто ассоциируются с большими данными:

  • Под достоверностью понимается степень точности наборов данных и их достоверность.Необработанные данные, собранные из различных источников, могут вызвать проблемы с качеством данных, которые может быть трудно определить. Если их не исправить с помощью процессов очистки данных, неверные данные приводят к ошибкам анализа, которые могут подорвать ценность инициатив бизнес-аналитики. Команды управления данными и аналитики также должны убедиться, что у них есть достаточно точных данных для получения достоверных результатов.
  • Некоторые специалисты по данным и консультанты также повышают ценность списка характеристик больших данных. Не все собранные данные имеют реальную ценность для бизнеса или выгоды.В результате организациям необходимо подтвердить, что данные относятся к актуальным бизнес-задачам, прежде чем они будут использоваться в проектах по анализу больших данных.
  • Вариабельность также часто применяется к наборам больших данных, которые могут иметь несколько значений или по-разному форматироваться в отдельных источниках данных — факторы, которые еще больше усложняют управление большими данными и аналитику.

Некоторые люди еще больше приписывают большим данным; были созданы различные списки от семи до 10.

Характеристики больших данных обычно описываются словами, начинающимися с «v», включая эти шесть.

Как хранятся и обрабатываются большие данные

Большие данные часто хранятся в озере данных. Хотя хранилища данных обычно строятся на основе реляционных баз данных и содержат только структурированные данные, озера данных могут поддерживать различные типы данных и обычно основаны на кластерах Hadoop, службах хранения облачных объектов, базах данных NoSQL или других платформах больших данных.

Многие среды больших данных объединяют несколько систем в распределенную архитектуру; например, центральное озеро данных может быть интегрировано с другими платформами, включая реляционные базы данных или хранилище данных.Данные в системах больших данных можно оставить в необработанном виде, а затем отфильтровать и упорядочить по мере необходимости для конкретных аналитических целей. В других случаях он предварительно обрабатывается с помощью инструментов интеллектуального анализа данных и программного обеспечения для подготовки данных, поэтому он готов для приложений, которые запускаются регулярно.

Обработка больших данных предъявляет высокие требования к базовой вычислительной инфраструктуре. Требуемая вычислительная мощность часто обеспечивается кластерными системами, которые распределяют рабочие нагрузки обработки между сотнями или тысячами обычных серверов с использованием таких технологий, как Hadoop и механизм обработки Spark.

Получение такой вычислительной мощности рентабельным способом — непростая задача. В результате облако является популярным местом для систем больших данных. Организации могут развертывать свои собственные облачные системы или использовать управляемые предложения «большие данные как услуга» от поставщиков облачных услуг. Пользователи облака могут масштабировать необходимое количество серверов на время, достаточное для выполнения проектов по анализу больших данных. Компания платит только за используемое хранилище и время вычислений, а облачные экземпляры можно отключить до тех пор, пока они снова не понадобятся.

Как работает аналитика больших данных

Чтобы получать достоверные и релевантные результаты от приложений для анализа больших данных, специалисты по обработке данных и другие аналитики данных должны хорошо разбираться в доступных данных и понимать, что они в них ищут. Это делает подготовку данных, которая включает профилирование, очистку, проверку и преобразование наборов данных, важным первым шагом в процессе аналитики.

После того, как данные собраны и подготовлены для анализа, можно применять различные дисциплины науки о данных и расширенной аналитики для запуска различных приложений с использованием инструментов, которые предоставляют функции и возможности анализа больших данных.Эти дисциплины включают машинное обучение и его ответвление глубокого обучения, прогнозное моделирование, интеллектуальный анализ данных, статистический анализ, потоковую аналитику, интеллектуальный анализ текста и многое другое.

Используя данные о клиентах в качестве примера, можно сказать, что различные отрасли аналитики, которые могут быть выполнены с наборами больших данных, включают следующее:

  • Сравнительный анализ. Здесь изучаются показатели поведения клиентов и взаимодействие с клиентами в режиме реального времени, чтобы сравнить продукты, услуги и брендинг компании с продуктами, услугами и брендом ее конкурентов.
  • Прослушивание в социальных сетях . Это анализирует, что люди говорят в социальных сетях о компании или продукте, что может помочь выявить потенциальные проблемы и целевую аудиторию для маркетинговых кампаний.
  • Маркетинговая аналитика . Это предоставляет информацию, которую можно использовать для улучшения маркетинговых кампаний и рекламных предложений для продуктов, услуг и бизнес-инициатив.
  • Анализ настроений. Все собранные данные о клиентах можно проанализировать, чтобы выявить их отношение к компании или бренду, уровень удовлетворенности клиентов, потенциальные проблемы и способы улучшения обслуживания клиентов.

Технологии управления большими данными

Hadoop, среда распределенной обработки с открытым исходным кодом, выпущенная в 2006 году, изначально была в центре большинства архитектур больших данных. Развитие Spark и других механизмов обработки отодвинуло MapReduce, движок, встроенный в Hadoop, в сторону. Результатом является экосистема технологий больших данных, которые могут использоваться для разных приложений, но часто развертываются вместе.

Платформы больших данных и управляемые услуги, предлагаемые поставщиками ИТ, объединяют многие из этих технологий в одном пакете, в основном для использования в облаке.В настоящее время это включает следующие предложения, перечисленные в алфавитном порядке:

  • Amazon EMR (ранее Elastic MapReduce)
  • Платформа данных Cloudera
  • Google Cloud Dataproc
  • HPE Ezmeral Data Fabric (ранее MapR Data Platform)
  • Microsoft Azure HDInsight

Для организаций, которые хотят самостоятельно развернуть системы больших данных, локально или в облаке, технологии, доступные им в дополнение к Hadoop и Spark, включают следующие категории инструментов:

  • хранилищ репозиториев, таких как распределенная файловая система Hadoop (HDFS) и облачные службы хранения объектов, которые включают Amazon Simple Storage Service (S3), Google Cloud Storage и Azure Blob Storage;
  • Фреймворки управления кластером
  • , такие как Kubernetes, Mesos и YARN, встроенный диспетчер ресурсов и планировщик заданий Hadoop, что означает еще один согласователь ресурсов, но широко известен только по аббревиатуре;
  • движков потоковой обработки, таких как Flink, Hudi, Kafka, Samza, Storm и модули потоковой передачи Spark и структурированной потоковой передачи, встроенные в Spark;
  • баз данных NoSQL, которые включают Cassandra, Couchbase, CouchDB, HBase, MarkLogic Data Hub, MongoDB, Neo4j, Redis и другие различные технологии;
  • платформ для озера данных и хранилищ данных, в том числе Amazon Redshift, Delta Lake, Google BigQuery, Kylin и Snowflake; и
  • механизмов запросов SQL, таких как Drill, Hive, Impala, Presto и Trino.

Проблемы с большими данными

В связи с проблемами вычислительной мощности разработка архитектуры больших данных является общей проблемой для пользователей. Системы больших данных должны быть адаптированы к конкретным потребностям организации, что требует самостоятельной работы, которая требует, чтобы ИТ-отделы и группы управления данными собрали индивидуальный набор технологий и инструментов. Развертывание систем больших данных и управление ими также требует новых навыков по сравнению с теми, которыми обычно обладают администраторы баз данных и разработчики, специализирующиеся на реляционном программном обеспечении.

Обе эти проблемы можно решить с помощью управляемой облачной службы, но ИТ-менеджерам необходимо внимательно следить за использованием облака, чтобы гарантировать, что расходы не выйдут из-под контроля. Кроме того, перенос локальных наборов данных и обработка рабочих нагрузок в облако часто является сложным процессом.

Другие проблемы при управлении системами больших данных включают обеспечение доступа к данным для специалистов по данным и аналитиков, особенно в распределенных средах, которые включают сочетание различных платформ и хранилищ данных.Чтобы помочь аналитикам найти нужные данные, группы управления данными и аналитики все чаще создают каталоги данных, которые включают в себя функции управления метаданными и передачи данных. Процесс интеграции наборов больших данных также часто бывает сложным, особенно когда факторами являются разнообразие и скорость данных.

Ключи к эффективной стратегии больших данных

В организации разработка стратегии больших данных требует понимания бизнес-целей и данных, которые в настоящее время доступны для использования, а также оценки потребности в дополнительных данных для достижения целей.Следующие шаги, которые необходимо предпринять, включают следующее:

  • приоритезация запланированных вариантов использования и приложений;
  • определение необходимых новых систем и инструментов;
  • создание дорожной карты развертывания; и
  • оценка внутренних навыков, чтобы выяснить, требуется ли переподготовка или прием на работу.

Чтобы наборы больших данных были чистыми, непротиворечивыми и использовались должным образом, программа управления данными и связанные с ними процессы управления качеством данных также должны быть приоритетными.Другие передовые методы управления и анализа больших данных включают сосредоточение внимания на потребностях бизнеса в информации по доступным технологиям и использование визуализации данных для помощи в обнаружении и анализе данных.

Практика и правила сбора больших данных

По мере роста сбора и использования больших данных возрастает вероятность неправильного использования данных. Общественный резонанс по поводу утечки данных и других нарушений конфиденциальности данных привел к тому, что Европейский Союз утвердил Общие правила защиты данных (GDPR), закон о конфиденциальности данных, который вступил в силу в мае 2018 года.GDPR ограничивает типы данных, которые могут собирать организации, и требует согласия отдельных лиц или соблюдения других указанных причин для сбора личных данных. Он также включает положение о праве на забвение, которое позволяет резидентам ЕС просить компании удалить их данные.

Хотя в США нет аналогичных федеральных законов, Закон Калифорнии о конфиденциальности потребителей (CCPA) направлен на предоставление жителям Калифорнии большего контроля над сбором и использованием их личной информации компаниями, ведущими бизнес в штате.CCPA был подписан в 2018 году и вступил в силу 1 января 2020 года.

Чтобы обеспечить соблюдение таких законов, предприятиям необходимо тщательно управлять процессом сбора больших данных. Необходимо ввести средства контроля для выявления регулируемых данных и предотвращения доступа к ним неуполномоченных сотрудников.

Человеческая сторона управления большими данными и аналитики

В конечном итоге бизнес-ценность и преимущества инициатив по работе с большими данными зависят от сотрудников, которым поручено управлять и анализировать данные.Некоторые инструменты для работы с большими данными позволяют менее техническим пользователям запускать приложения для прогнозной аналитики или помогают предприятиям развернуть подходящую инфраструктуру для проектов с большими данными, сводя к минимуму потребность в оборудовании и распределенном программном обеспечении.

Большие данные можно противопоставить небольшим данным — термин, который иногда используется для описания наборов данных, которые можно легко использовать для самостоятельной бизнес-аналитики и аналитики. Часто цитируемая аксиома гласит: «Большие данные предназначены для машин, небольшие данные — для людей».

Что такое пропускная способность? — Определение и детали

Пропускная способность измеряется как объем данных, которые могут быть переданы из одной точки в другую в сети за определенный промежуток времени.Обычно полоса пропускания выражается как битрейт и измеряется в битах в секунду (бит / с).

Термин «полоса пропускания» относится к пропускной способности соединения и является важным фактором при определении качества и скорости сети или интернет-соединения.

Есть несколько различных способов измерения пропускной способности. Некоторые измерения используются для расчета текущего потока данных, в то время как другие измеряют максимальный поток, типичный поток или то, что считается хорошим потоком.

Полоса пропускания также является ключевым понятием в нескольких других технологических областях. Например, при обработке сигналов он используется для описания разницы между верхними и нижними частотами в передаче, такой как радиосигнал, и обычно измеряется в герцах (Гц).

Пропускную способность можно сравнить с протеканием воды по трубе. Пропускная способность — это скорость, с которой вода (данные) протекает через трубу (соединение) при различных обстоятельствах. Вместо бит в секунду мы можем измерять галлоны в минуту.Количество воды, которое, возможно, может протекать через трубу, представляет максимальную полосу пропускания, в то время как количество воды, которое в настоящее время протекает через через трубу, представляет текущую полосу пропускания.


Пропускная способность первоначально измерялась в битах в секунду и выражалась в битах в секунду. Однако современные сети обычно имеют гораздо более высокую пропускную способность, чем можно удобно выразить с помощью таких небольших устройств. Теперь часто встречаются более высокие числа, обозначенные метрическими префиксами, такими как Мбит / с (мегабит в секунду), Гбит / с (гигабит в секунду) или Тбит / с (терабит в секунду).

 K = кило = 1000 бит 

M = мега = 1000 кило = 1000000 бит

G = гига = 1000 мега = 1000000000 бит

T = тера = 1000 гига = 10000000000 бит

После терабит петабит, эксабит, зеттабит и йоттабит, каждый из которых представляет дополнительную мощность 10.

Пропускная способность также может быть выражена в байтах в секунду. Обычно это обозначается с заглавной буквы B. Например, 10 мегабайт в секунду будет выражено как 10 МБ / с или 10 МБ / с.

Один байт равен восьми битам.

Таким образом, 10 МБ / с = 80 МБ / с.

С байтами могут использоваться те же префиксы метрики, что и с битами. Таким образом, 1 ТБ / с — это один терабайт в секунду.

Получаете ли вы полную пропускную способность? Узнайте с PRTG Network Monitor!


Предоставляют ли ваши поставщики услуг полную пропускную способность? Стабильна ли ваша пропускная способность? Есть ли какие-нибудь проблемы с пропускной способностью? Узнайте с помощью профессионального инструмента мониторинга пропускной способности PRTG.

  • Безлимитная версия PRTG на 30 дней
  • Через 30 дней PRTG возвращается к бесплатной версии
  • Или вы можете перейти на платную лицензию в любое время


Измерение пропускной способности обычно выполняется с помощью программного обеспечения или микропрограмм, а также сетевого интерфейса. К распространенным утилитам измерения пропускной способности относятся, например, утилита Test TCP (TTCP) и PRTG Network Monitor.

TTCP измеряет пропускную способность в IP-сети между двумя хостами. Один хост — получатель, другой — отправитель.На каждой стороне отображается количество переданных байтов и время завершения одностороннего пути для каждого пакета.

PRTG предоставляет графический интерфейс и диаграммы для измерения тенденций полосы пропускания за более длительные периоды времени, а также может измерять трафик между различными интерфейсами.

Обычно для измерения пропускной способности подсчитывается общий объем отправленного и полученного трафика за определенный период времени. Результирующие измерения затем выражаются в секундах.

Другой метод измерения пропускной способности — передать файл или несколько файлов известного размера и подсчитать, сколько времени занимает передача. Результат конвертируется в бит / с путем деления размера файлов на время, необходимое для передачи. Большинство тестов скорости Интернета используют этот метод для расчета скорости подключения компьютера пользователя к Интернету.

Хотя нет возможности измерить общую доступную полосу пропускания, существует множество способов ее определения в зависимости от потребности.

Теоретический максимум — Самая высокая скорость передачи в идеальных условиях. Теоретическая максимальная скорость передачи не может быть достигнута в реальных установках. Обычно теоретический максимум используется только для сравнения, чтобы определить, насколько хорошо соединение функционирует по сравнению с его теоретическим максимальным потенциалом.

Эффективная полоса пропускания — Самая высокая надежная скорость передачи. Всегда ниже теоретического максимума. Иногда считается лучшей используемой пропускной способностью.Это необходимо для понимания объема трафика, который может поддерживать соединение.

Пропускная способность — Средняя скорость успешной передачи данных; полезно для понимания типичной или обычной скорости соединения. Пропускная способность — это размер передачи, деленный на время, необходимое для ее завершения. Пропускную способность, измеряемую в байтах в секунду, можно сравнить с эффективной пропускной способностью и теоретическим максимумом, чтобы определить, насколько хорошо работает соединение.

Goodput — Измеряет объем передаваемых полезных данных, исключая нежелательные данные, такие как повторные передачи пакетов или служебные данные протокола. Эффективность вычисляется путем деления размера переданного файла на количество времени, которое потребовалось для передачи.

Общий метод передачи — подсчитывает весь трафик за заданный период времени, обычно за месяц. Это наиболее полезно для выставления счетов в зависимости от используемой полосы пропускания.

Метод 95-го процентиля — Чтобы избежать искажения измерений полосы пропускания из-за скачков использования, операторы часто используют метод 95-го процентиля.Идея состоит в том, чтобы постоянно измерять использование полосы пропускания с течением времени, а затем удалять первые 5 процентов использования. Это полезно для выставления счетов на основе того, какая пропускная способность «обычно» используется в установленный период.

В реальных сетях полоса пропускания меняется со временем в зависимости от использования и сетевых подключений. В результате одно измерение пропускной способности очень мало говорит о фактическом использовании пропускной способности. Серия измерений может быть более полезной при определении средних значений или тенденций.

Пропускная способность vs.скорость в зависимости от пропускной способности


Есть много способов представить себе поток данных в сети. Скорость сети определяется как битрейт схемы, определяемый скоростью физического сигнала среды.

Пропускная способность — это то, какая часть пропускной способности физического канала может использоваться для передачи данных, и определяется тем, какая часть пропускной способности сети доступна в зависимости от соединения. В то время как сетевое соединение Gigabit Ethernet обеспечивает скорость 1 Гбит / с, пропускная способность, доступная компьютеру, подключенному с помощью карты Fast Ethernet, составляет всего 100 Мбит / с.

Пропускная способность — это скорость успешной передачи, а пропускная способность — это расчет количества данных, которые проходят через сетевой интерфейс, независимо от того, приводят ли данные к успешной передаче. Таким образом, пропускная способность всегда ниже, чем пропускная способность.


Есть несколько причин для измерения пропускной способности. Низкая полезная полоса пропускания по сравнению с теоретической максимальной пропускной способностью может указывать на проблемы в сети, особенно если из разных частей сети, которые спроектированы для работы одинаково, используются сильно различающиеся полосы пропускания.

Кроме того, необходимо измерить пропускную способность, чтобы убедиться, что любые платные соединения соответствуют обещаниям. Домашние пользователи могут запустить онлайн-тест пропускной способности, такой как тест скорости DSLReports, чтобы увидеть, сколько из этого соединения «до 40 Мбит / с» взимает с них их интернет-провайдер (ISP), за который они фактически могут использовать. Корпоративные соединения можно было бы лучше обслуживать, измеряя пропускную способность между офисами, соединенными арендованной линией связи.

Управление полосой пропускания

Для реализации надлежащего управления полосой пропускания или контроля качества обслуживания (QoS) необходимо сначала понять, какая полоса пропускания используется.После определения непрерывное измерение гарантирует, что все пользователи получат необходимую пропускную способность.

Регулирование полосы пропускания

После того, как будут изучены модели использования полосы пропускания, и если определенные пользователи или приложения ухудшают производительность сети для других, можно использовать инструменты для ограничения объема используемой полосы пропускания.

Максимум пропускной способности

Некоторые типы соединений имеют максимальную определенную пропускную способность. Фактическая пропускная способность зависит от многих факторов, включая среду, кабели и использование, и обычно меньше теоретического максимума.

Стандарты пропускной способности проводной сети для соединений

E1 Gigabit Ethernet Gigabit Ethernet
Модем коммутируемого доступа 56 кбит / с
T1 (цифровое арендованное стационарное соединение) 1,544 Мбит / с
2,048 Мбит / с
Асинхронный DSL 4 Мбит / с
Ethernet 10 Мбит / с
T3 (цифровое выделенное стационарное соединение) 44.763 Мбит / с
VDSL 55 Мбит / с
VDSL 2 100 Мбит / с
Fast Ethernet 100 Мбит / с
OC3, выделенное 9067 Мбит / с, оптическое подключение 9067 Мбит / с OC 12 (стационарное соединение с арендованной оптикой Ficer) 622 Мбит / с
Gigabit Ethernet 1000 Мбит / с или 1 Гбит / с
VSDL 2 Vplus 300 Мбит / с
100 Gigabit Ethernet 100 Гбит / с

Стандартные максимальные скорости загрузки беспроводной сети

Скорость подключения к беспроводной сети сильно различается в зависимости от условий подключения.Цифры ниже — это максимальные скорости полосы пропускания в соответствии со стандартом или спецификацией.

802.11b 11 Мбит / с
802.11g 54 Мбит / с
802.11n 600 Мбит / с
3G7 600 Мбит / с HSP 7,2 Мбит / с
3G — HSPA + 21 Мбит / с
3G — DC-HSPA + 42 Мбит / с
4G — LTE 100 Мбит / с
Gps (предлагается) 1 или выше)


Полоса пропускания чаще всего покупается у телекоммуникационных компаний.Большая часть полосы пропускания потребителя продается как «до», что означает, что клиент может получить до 40 МБ / с, но не всегда имеет такую ​​скорость при использовании соединения. Скорости могут быть выше или ниже в разное время дня или при разных обстоятельствах. Корпоративная полоса пропускания также обычно покупается у телекоммуникационных компаний. Тем не менее, многие корпоративные соглашения содержат договорные показатели производительности, которые необходимо соблюдать, включая минимальную используемую полосу пропускания, минимальное время безотказной работы и другие показатели.

Кроме того, измерение полосы пропускания может использоваться для взимания платы за конкретное использование, а не за полное соединение.Например, владелец веб-сайта может платить хосту веб-сайта только за объем полосы пропускания, используемый этим конкретным веб-сайтом в течение определенного периода времени, например, за ежемесячный расчетный период.


Слишком малая полоса пропускания

Хотя современные протоколы довольно хорошо умеют не терять пакеты, ограниченная полоса пропускания может привести к тому, что операции будут слишком долгими для завершения, что приведет к тайм-аутам или другим проблемам. Эти проблемы могут вызвать ошибки приложения или ошибки базы данных. При резервном копировании или копировании данных по сети слишком малая пропускная способность может привести к тому, что резервное копирование займет слишком много времени, часто выполняя другие пакетные процессы или даже в основное рабочее время.

Кроме того, пользователи, использующие соединение со слишком малой пропускной способностью, могут заметить длительную задержку между тем, когда они что-то делают, например, щелчком кнопки, и ответом на это действие. В случае ожидания загрузки информации или других данных слишком малая полоса пропускания может привести к тому, что операции займут много времени или даже заставят пользователей отказаться от ожидания.

Для пользователей, пытающихся совершать телефонные звонки по сети, например по протоколу передачи голоса по Интернет-протоколу (VoIP), слишком малая пропускная способность приводит к снижению качества звонков.Большинство систем VoIP снижают точность вызова в зависимости от доступной полосы пропускания. Если пропускной способности недостаточно, вызов может звучать «жестко» или «эхо». Если качество достаточно низкое, в разговоре могут быть настоящие перерывы, из-за которых пропущены части разговора.

Видеозвонки требуют еще большей полосы пропускания. Видеозвонки, совершаемые без необходимой полосы пропускания, приводят не только к плохому качеству звука, но также к низкому качеству или дрожанию видео.

Для пользователей Интернета Федеральная комиссия по связи США (FCC) рекомендует минимальную пропускную способность 4 Мбит / с для адекватной производительности при потоковой передаче видео с качеством HD.Многие видеопроигрыватели будут работать с меньшей пропускной способностью за счет «буферизации» или загрузки данных до их фактического отображения. Если соединение слишком медленное, пользователям придется либо долго ждать, прежде чем начнется воспроизведение видео, пока система буферизует большой объем данных, либо видео может внезапно остановиться, когда в системе закончится буферизованное видео для воспроизведения.

Геймеров также часто разочаровывает ограниченная пропускная способность. Играя против других игроков онлайн, игроки с более быстрым подключением быстрее видят, что происходит, и данные об их реакциях передаются и принимаются быстрее.FCC рекомендует минимальную скорость загрузки 4 Мбит / с для сетевых многопользовательских игр в формате HD.

4 Мбит / с

1 Мбит / с

Электронная почта

0,5 Мбит / с

Просмотр веб-страниц

0,5–1,0 Мбит / с

9675
9675

Телефонные звонки (VoIP)

0,5 Мбит / с

Потоковое видео

0.7 Мбит / с

Потоковое видео (не HD)

1,5 Мбит / с

Потоковое видео в HD качестве

4 Мбит / с

HD-видеоконференцсвязь

4 Мбит / с

Игровая консоль с подключением к Интернету

1 Мбит / с


Таблица минимально необходимой скорости загрузки FCC

Слишком большая пропускная способность

Есть несколько технических проблем, вызванных слишком большой пропускной способностью.Однако более высокая пропускная способность обычно стоит дороже. Таким образом, слишком большая пропускная способность может оказаться нерентабельной.

Задержка

Дизайн сети и инфраструктура также могут создавать проблемы с пропускной способностью. Задержка измеряет задержки в сети, которые могут приводить к снижению пропускной способности или полезной производительности. Сеть с низкой задержкой имеет короткие задержки, в то время как сеть с высокой задержкой имеет более длительные задержки. Высокая задержка не позволяет данным полностью использовать возможности сети, что снижает пропускную способность.

Устранение проблем с пропускной способностью


Обнаружение и устранение проблем с пропускной способностью помогает повысить производительность сети без дорогостоящих обновлений.

Ping и traceroute

Инструменты, такие как Ping и traceroute, могут помочь в устранении основных проблем.
Пинг тестового сервера, например, вернет информацию о том, как быстро данные могут быть отправлены и получены, а также среднее время приема-передачи. Большое время пинга указывает на более высокую задержку в сети.
Инструмент traceroute может помочь определить, не слишком ли много отдельных сетевых подключений или переходов на пути подключения.Кроме того, traceroute возвращает время, затраченное на каждый переход. Более длительное время на одном прыжке может определить источник проблемы.

TTCP

TTCP измеряет время, необходимое для передачи данных от одного сетевого интерфейса к другому с приемником на другом конце. Это исключает обратный путь из расчета и может помочь быстро выявить проблемы. Если измеренная полоса пропускания меньше ожидаемой, дальнейшие измерения могут выявить проблему. Работает ли измерение на другом интерфейсе в той же сети быстрее? Если да, то в чем разница между двумя системами? Постоянно измеряя пропускную способность, администраторы могут найти узкие места в сети.

PRTG Network Monitor

Благодаря интерфейсу для сбора данных и построения графиков PRTG также может помочь в устранении проблем с пропускной способностью, не связанных с дизайном. Например, измеряя использование полосы пропускания с течением времени, можно определить, что определенные пользователи или приложения иногда используют более высокие объемы полосы пропускания и вызывают перегрузку сети и замедляют реакцию сети и скорость интернета для других пользователей.

Узнайте больше о мониторинге пропускной способности с помощью PRTG>

Получаете ли вы полную пропускную способность? Узнайте с PRTG Network Monitor!


Предоставляют ли ваши поставщики услуг полную пропускную способность? Стабильна ли ваша пропускная способность? Есть ли какие-нибудь проблемы с пропускной способностью? Узнайте с помощью профессионального инструмента мониторинга пропускной способности PRTG.

  • Безлимитная версия PRTG на 30 дней
  • Через 30 дней PRTG возвращается к бесплатной версии
  • Или вы можете перейти на платную лицензию в любое время

Это короткое видео о мониторинге пропускной способности

Артрит | CDC

В США 23% взрослого населения или более 54 миллионов человек страдают артритом. Это основная причина нетрудоспособности с ежегодными расходами на медицинское обслуживание и упущенным заработком в размере 303 долларов.5 миллиардов.

Самая распространенная форма артрита — остеоартрит. Другие формы включают подагру, ревматоидный артрит и волчанку. Симптомами артрита являются боль, ломота, скованность и припухлость в суставах или вокруг них. Ревматоидный артрит и волчанка могут поражать несколько органов и вызывать широко распространенные симптомы.

Шестьдесят процентов взрослых людей с артритом в США — люди трудоспособного возраста (от 18 до 64 лет). Артрит может ограничивать тип работы, которую они могут выполнять, или вообще мешать им работать. Фактически, 8 миллионов взрослых трудоспособного возраста сообщают, что их трудоспособность ограничена из-за артрита.Например, им может быть трудно подняться по лестнице или пройти с парковки на свое рабочее место.

CDC проводит исследования и поддерживает программы для людей с артритом, чтобы они могли работать и заниматься другими повседневными делами, меньше болеть, управлять своим лечением и предотвращать или отсрочивать инвалидность.

Измерение количества людей, страдающих артритом

Система наблюдения за поведенческими факторами риска

CDC и Национальное опросное исследование по вопросам здоровья собирают данные о количестве и процентном соотношении взрослых, страдающих артритом, независимо от того, увеличиваются ли эти цифры или процентное соотношение, и как болезнь влияет на качество жизни людей.Программа CDC по лечению артрита использует эти данные, чтобы помочь общественному здравоохранению принимать решения о том, как лучше всего помочь взрослым с артритом.

Содействие вмешательствам, уменьшающим боль при артрите

CDC признает несколько проверенных подходов к уменьшению симптомов артрита:

  • Примите участие в образовательной программе самоуправления , такой как Программа самоконтроля при хронических заболеваниях, которая учит навыкам и уверенности, чтобы жить с артритом каждый день.
  • Будьте активны. Физическая активность, такая как ходьба, езда на велосипеде и плавание, уменьшает боль при артрите и улучшает функции, настроение и качество жизни. Взрослые с артритом должны больше двигаться и меньше сидеть в течение дня. Рекомендуется как минимум 150 минут физической активности средней интенсивности в неделю. Однако любая физическая активность лучше, чем никакой. Программы физической активности, рекомендованные CDC, могут улучшить здоровье участников с артритом.
  • Поддерживайте здоровый вес. Люди могут снизить риск остеоартрита коленного сустава, контролируя свой вес.
  • Защитите свои суставы. Люди могут помочь предотвратить остеоартрит, избегая занятий, которые с большей вероятностью могут вызвать травмы суставов.
  • Поговорите с врачом. Рекомендации поставщиков медицинских услуг могут мотивировать людей быть физически активными и присоединиться к программе обучения самоуправлению. Люди с воспалительным артритом, таким как ревматоидный артрит, имеют лучшее качество жизни, если им поставят диагноз на ранней стадии, получат лечение и научатся управлять своим состоянием.
Leave a Reply

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *