Реферат: Реферат по информатике что такое «реферат». Реферат по госту по информатике


Реферат - Защита информации от несанкционированного доступа методом криптопреобразования ГОСТ

--PAGE_BREAK--  . Таким

образом, общий объем таблицы замен равен: 8 узлов ґ 16 элементов/узел ґ 4

бита/элемент = 512 бит или 64 байта.

Основной шаг криптопреобразования.

Основной шаг криптопреобразования по своей сути является оператором,

определяющим преобразование 64-битового блока данных. Дополнительным параметром

этого оператора является 32-битовый блок, в качестве которого используется

какой-либо элемент ключа. Схема алгоритма основного шага приведена на рисунке 1.

Ниже даны пояснения к алгоритму основного шага:   Определяет исходные данные для основного шага криптопреобразования:     N–преобразуемый 64-битовый блок данных, в ходе выполнения шага его младшая

    (N1) и старшая (N2) части обрабатываются как отдельные 32-битовые целые

    числа без знака. Таким образом, можно записать N=(N1,N2).

    X–32-битовый элемент ключа;

  Сложение с ключом. Младшая половина преобразуемого блока складывается по

  модулю 232 с используемым на шаге элементом ключа, результат передается на

  следующий шаг;

  Поблочная замена. 32-битовое значение, полученное на предыдущем шаге,

  интерпретируется как массив из восьми 4-битовых блоков кода:

  S=(S0,S1,S2,S3,S4,S5,S6,S7).

  значение каждого из восьми блоков заменяется на новое, которое выбирается по

  таблице замен следующим образом: значение блока Si заменяется на Si-тый по

  порядку элемент (нумерация с нуля) i-того узла замен (т.е. i-той строки

  таблицы замен, нумерация также с нуля). Другими словами, в качестве замены для

  значения блока выбирается элемент из таблицы замен с номером строки, равным

  номеру заменяемого блока, и номером столбца, равным значению заменяемого блока

  как 4-битового целого неотрицательного числа. Теперь становится понятным

  размер таблицы замен: число строк в ней равно числу 4-битных элементов в

  32-битном блоке данных, то есть восьми, а число столбцов равно числу различных

  значений 4-битного блока данных, равному как известно 24, шестнадцати.   Циклический сдвиг на 11 бит влево. Результат предыдущего шага сдвигается

  циклически на 11 бит в сторону старших разрядов и передается на следующий шаг.

  На схеме алгоритма символом ?11 обозначена функция циклического сдвига своего

  аргумента на 11 бит в сторону старших разрядов.   Побитовое сложение: значение, полученное на шаге 3, побитно складывается по

  модулю 2 со старшей половиной преобразуемого блока.   Сдвиг по цепочке: младшая часть преобразуемого блока сдвигается на место

  старшей, а на ее место помещается результат выполнения предыдущего шага.   Полученное значение преобразуемого блока возвращается как результат выполнения

  алгоритма основного шага криптопреобразования. Базовые циклы криптографических преобразований. Как отмечено в начале настоящей статьи, ГОСТ относится к классу блочных шифров,

то есть единицей обработки информации в нем является блок данных. Следовательно,

вполне логично ожидать, что в нем будут определены алгоритмы для

криптографических преобразований, то есть для зашифрования, расшифрования и

«учета» в контрольной комбинации одного блока данных. Именно эти алгоритмы и

называются базовыми циклами ГОСТа, что подчеркивает их фундаментальное значение

для построения этого шифра. Базовые циклы построены из основных шагов криптографического преобразования,

рассмотренного в предыдущем разделе. В процессе выполнения основного шага

используется только один элемент ключа, в то время как ключ ГОСТ содержит восемь

таких элементов. Следовательно, чтобы ключ был использован полностью, каждый из

базовых циклов должен многократно выполнять основной шаг с различными его

элементами. Вместе с тем кажется вполне естественным, что в каждом базовом цикле

все элементы ключа должны быть использованы одинаковое число раз, по

соображениям стойкости шифра это число должно быть больше одного. Все сделанные выше предположения, опирающиеся просто на здравый смысл, оказались

верными. Базовые циклы заключаются в многократном выполнении основного шага с

использованием разных элементов ключа и отличаются друг от друга только числом

повторения шага и порядком использования ключевых элементов. Ниже приведен этот

порядок для различных циклов.   Цикл зашифрования 32-З:

  K0,K1,K2,K3,K4,K5,K6,K7,K0,K1,K2,K3,K4,K5,K6,K7,K0,K1,K2,K3,K4,K5,K6,K7,K7,K6,K5,K4,K3,K2,K1,K0.   Цикл расшифрования 32-Р:

  K0,K1,K2,K3,K4,K5,K6,K7,K7,K6,K5,K4,K3,K2,K1,K0,K7,K6,K5,K4,K3,K2,K1,K0,K7,K6,K5,K4,K3,K2,K1,K0.   Цикл выработки имитовставки 16-З:

  K0,K1,K2,K3,K4,K5,K6,K7,K0,K1,K2,K3,K4,K5,K6,K7. Каждый из циклов имеет собственное буквенно-цифровое обозначение,

соответствующее шаблону «n-X», где первый элемент обозначения (n), задает число

повторений основного шага в цикле, а второй элемент обозначения (X), буква,

задает порядок зашифрования («З») или расшифрования («Р») в использовании

ключевых элементов. Этот порядок нуждается в дополнительном пояснении: Цикл расшифрования должен быть обратным циклу зашифрования, то есть

последовательное применение этих двух циклов к произвольному блоку должно дать в

итоге исходный блок, что отражается следующим соотношением: Ц32-Р(Ц32-З(T))=T,

где T – произвольный 64-битный блок данных, ЦX(T) – результат выполнения цикла X

над блоком данных T. Для выполнения этого условия для алгоритмов, подобных

ГОСТу, необходимо и достаточно, чтобы порядок использования ключевых элементов

соответствующими циклами был взаимно обратным. В справедливости записанного

условия для рассматриваемого случая легко убедиться, сравнив приведенные выше

последовательности для циклов 32-З и 32-Р. Из сказанного вытекает одно

интересное следствие: свойство цикла быть обратным другому циклу является

взаимным, то есть цикл 32-З является обратным по отношению к циклу 32-Р. Другими

словами, зашифрование блока данных теоретически может быть выполнено с помощью

цикла расшифрования, в этом случае расшифрование блока данных должно быть

выполнено циклом зашифрования. Из двух взаимно обратных циклов любой может быть

использован для зашифрования, тогда второй должен быть использован для

расшифрования данных, однако стандарт ГОСТ28147-89 закрепляет роли за циклами и

не предоставляет пользователю права выбора в этом вопросе. Цикл выработки имитовставки вдвое короче циклов шифрования, порядок

использования ключевых элементов в нем такой же, как в первых 16 шагах цикла

зашифрования, в чем нетрудно убедиться, рассмотрев приведенные выше

последовательности, поэтому этот порядок в обозначении цикла кодируется той же

самой буквой «З». Схемы базовых циклов приведены на рисунках 2а-в. Каждый из них принимает в

качестве аргумента и возвращает в качестве результата 64-битный блок данных,

обозначенный на схемах N. Символ Шaг(N,X) обозначает выполнение основного шага

криптопреобразования для блока N с использованием ключевого элемента X. Между

циклами шифрования и вычисления имитовставки есть еще одно отличие, не

упомянутое выше: в конце базовых циклов шифрования старшая и младшая часть блока

результата меняются местами, это необходимо для их взаимной обратимости. Основные режимы шифрования.

ГОСТ 28147-89 предусматривает три следующих режима шифрования данных:   простая замена,   гаммирование,   гаммирование с обратной связью, и один дополнительный режим выработки имитовставки. В любом из этих режимов данные обрабатываются блоками по 64 бита, на которые

разбивается массив, подвергаемый криптографическому преобразованию, именно

поэтому ГОСТ относится к блочным шифрам. Однако в двух режимах гаммирования есть

возможность обработки неполного блока данных размером меньше 8 байт, что

существенно при шифровании массивов данных с произвольным размером, который

может быть не кратным 8 байтам.

Прежде чем перейти к рассмотрению конкретных алгоритмов криптографических

преобразований, необходимо пояснить обозначения, используемые на схемах в

следующих разделах: Tо,Tш– массивы соответственно открытых и зашифрованных данных;

 ,  – i-тые по порядку 64-битные блоки соответственно открытых и зашифрованных

данных:  , ??i?n, последний блок может быть неполным:  ;

n –число 64-битных блоков в массиве данных;

ЦX– функция преобразования 64-битного блока данных по алгоритму базового цикла

«X»; Теперь опишем основные режимы шифрования:

Простая замена.

Зашифрование в данном режиме заключается в применении цикла 32-З к блокам

открытых данных, расшифрование – цикла 32-Р к блокам зашифрованных данных. Это

наиболее простой из режимов, 64-битовые блоки данных обрабатываются в нем

независимо друг от друга. Схемы алгоритмов зашифрования и расшифрования в режиме

простой замены приведены на рисунках 3а и б соответственно, они тривиальны и не

нуждаются в комментариях.

Размер массива открытых или зашифрованных данных, подвергающийся соответственно

зашифрованию или расшифрованию, должен быть кратен 64 битам: Tо=Tш=64·n, после

выполнения операции размер полученного массива данных не изменяется. Режим шифрования простой заменой имеет следующие особенности:   Так как блоки данных шифруются независимо друг от друга и от их позиции в

  массиве, при зашифровании двух одинаковых блоков открытого текста получаются

  одинаковые блоки шифротекста и наоборот. Отмеченное свойство позволит

  криптоаналитику сделать заключение о тождественности блоков исходных данных,

  если в массиве зашифрованных данных ему встретились идентичные блоки, что

  является недопустимым для серьезного шифра.   Если длина шифруемого массива данных не кратна 8 байтам или 64 битам,

  возникает проблема, чем и как дополнять последний неполный блок данных массива

  до полных 64 бит. Эта задача не так проста, как кажется на первый взгляд,

  поскольку очевидные решения типа «дополнить неполный блок нулевыми битами»

  или, более обще, «дополнить неполный блок фиксированной комбинацией нулевых и

  единичных битов» могут при определенных условиях дать в руки криптоаналитика

  возможность методами перебора определить содержимое этого самого неполного

  блока, и этот факт означает снижение стойкости шифра. Кроме того, длина

  шифротекста при этом изменится, увеличившись до ближайшего целого, кратного 64

  битам, что часто бывает нежелательным.   первый взгляд, перечисленные выше особенности делают практически невозможным

  использование режима простой замены, ведь он может применяться только для

  шифрования массивов данных с размером кратным 64 битам, не содержащим

  повторяющихся 64-битных блоков. Кажется, что для любых реальных данных

  гарантировать выполнение указанных условий невозможно. Это почти так, но есть

  одно очень важное исключение: вспомните, что размер ключа составляет 32 байта,

  а размер таблицы замен – 64 байта. Кроме того, наличие повторяющихся

  8-байтовых блоков в ключе или таблице замен будет говорить об их весьма плохом

  качестве, поэтому в реальных ключевых элементах такого повторения быть не

  может. Таким образом мы выяснили, что режим простой замены вполне подходит для

  шифрования ключевой информации, тем более, что прочие режимы для этой цели

  менее удобны, поскольку требуют наличия дополнительного синхронизирующего

  элемента данных – синхропосылки (см. следующий раздел). Наша догадка верна,

  ГОСТ предписывает использовать режим простой замены исключительно для

  шифрования ключевых данных. Гаммирование. Как же можно избавиться от недостатков режима простой замены? Для этого

необходимо сделать возможным шифрование блоков с размером менее 64 бит и

обеспечить зависимость блока шифротекста от его номера, иными словами,

рандомизировать процесс шифрования. В ГОСТе это достигается двумя различными

способами в двух режимах шифрования, предусматривающих гаммирование.

Гаммирование – это наложение (снятие) на открытые (зашифрованные) данные

криптографической гаммы, то есть последовательности элементов данных,

вырабатываемых с помощью некоторого криптографического алгоритма, для получения

зашифрованных (открытых) данных. Для наложения гаммы при зашифровании и ее

снятия при расшифровании должны использоваться взаимно обратные бинарные

операции, например, сложение и вычитание по модулю 264 для 64-битных блоков

данных. В ГОСТе для этой цели используется операция побитного сложения по модулю

2, поскольку она является обратной самой себе и к тому же наиболее просто

реализуется. Гаммирование решает обе упомянутые проблемы; во первых, все

элементы гаммы различны для реальных шифруемых массивов и, следовательно,

результат зашифрования даже двух одинаковых блоков в одном массиве данных будет

различным. Во вторых, хотя элементы гаммы и вырабатываются одинаковыми порциями

в 64 бита, использоваться может и часть такого блока с размером, равным размеру

шифруемого блока. Теперь перейдем непосредственно к описанию режима гаммирования. Гамма для этого

режима получается следующим образом: с помощью некоторого алгоритмического

рекуррентного генератора последовательности чисел (РГПЧ) вырабатываются

64-битные блоки данных, которые далее подвергаются преобразованию по циклу 32-З,

то есть зашифрованию в режиме простой замены, в результате получаются блоки

гаммы. Благодаря тому, что наложение и снятие гаммы осуществляется при помощи

одной и той же операции побитового исключающего или, алгоритмы зашифрования и

расшифрования в режиме гаммирования идентичны, их общая схема приведена на

рисунке 5. РГПЧ, используемый для выработки гаммы, является рекуррентной функцией:

?i+1=f(?i), где ?i – элементы рекуррентной последовательности, f – функция

преобразования. Следовательно, неизбежно возникает вопрос о его инициализации,

то есть об элементе ?0. В действительности, этот элемент данных является

параметром алгоритма для режимов гаммирования, на схемах он обозначен как S, и

называется в криптографии синхропосылкой, а в нашем ГОСТе – начальным

заполнением одного из регистров шифрователя. По определенным соображениям

разработчики ГОСТа решили использовать для инициализации РГПЧ не непосредственно

синхропосылку, а результат ее преобразования по циклу 32-З: ?0=Ц32-З(S).

Последовательность элементов, вырабатываемых РГПЧ, целиком зависит от его

начального заполнения, то есть элементы этой последовательности являются

функцией своего номера и начального заполнения РГПЧ: ?i=fi(?0), где

fi(X)=f(fi–1(X)), f0(X)=X. С учетом преобразования по алгоритму простой замены

добавляется еще и зависимость от ключа:

Гi=Ц32-З(?i)=Ц32-З(fi(?0))=Ц32-З(fi(Ц32-З(S)))=?i(S,K), где Гi – i-тый элемент

гаммы, K – ключ.

Таким образом, последовательность элементов гаммы для использования в режиме

гаммирования однозначно определяется ключевыми данными и синхропосылкой.

Естественно, для обратимости процедуры шифрования в процессах за- и

расшифрования должна использоваться одна и та же синхропосылка. Из требования

уникальности гаммы, невыполнение которого приводит к катастрофическому снижению

стойкости шифра, следует, что для шифрования двух различных массивов данных на

одном ключе необходимо обеспечить использование различных синхропосылок. Это

приводит к необходимости хранить или передавать синхропосылку по каналам связи

вместе с зашифрованными данными, хотя в отдельных особых случаях она может быть

предопределена или вычисляться особым образом, если исключается шифрование двух

массивов на одном ключе. Теперь подробно рассмотрим РГПЧ, используемый в ГОСТе для генерации элементов

гаммы. Прежде всего надо отметить, что к нему не предъявляются требования

обеспечения каких-либо статистических характеристик вырабатываемой

последовательности чисел. РГПЧ спроектирован разработчиками ГОСТа исходя из

необходимости выполнения следующих условий:   период повторения последовательности чисел, вырабатываемой РГПЧ, не должен

  сильно (в процентном отношении) отличаться от максимально возможного при

  заданном размере блока значения 264;   соседние значения, вырабатываемые РГПЧ, должны отличаться друг от друга в

  каждом байте, иначе задача криптоаналитика будет упрощена;   РГПЧ должен быть достаточно просто реализуем как аппаратно, так и программно

  на наиболее распространенных типах процессоров, большинство из которых, как

  известно, имеют разрядность 32 бита.   Исходя из перечисленных принципов создатели ГОСТа спроектировали весьма

  удачный РГПЧ, имеющий следующие характеристики:   64-битовом блоке старшая и младшая части обрабатываются независимо друг от

  друга:  , фактически, существуют два независимых РГПЧ для старшей и младшей

  частей блока.   рекуррентные соотношения для старшей и младшей частей следующие:

  , где        C1=101010116;

  , где        C2=101010416;   Нижний индекс в записи числа означает его систему счисления, таким образом,

  константы, используемые на данном шаге, записаны в 16-ричной системе

счисления.

  Второе выражение нуждается в комментариях, так как в тексте ГОСТа приведено

  нечто другое:  , с тем же значением константы C2. Но далее в тексте стандарта

  дается комментарий, что, оказывается, под операцией взятия остатка по модулю

  232–1 там понимается не то же самое, что и в математике. Отличие заключается в

  том, что согласно ГОСТу (232–1)mod(232–1)=(232–1), а не 0. На самом деле, это

  упрощает реализацию формулы, а математически корректное выражение для нее

  приведено выше.   период повторения последовательности для младшей части составляет 232, для

  старшей части 232–1, для всей последовательности период составляет

  232?(232–1), доказательство этого факта, весьма несложное, получите сами.

  Первая формула из двух реализуется за одну команду, вторая, несмотря на ее

  кажущуюся громоздкость, за две команды на всех современных 32-разрядных

  процессорах.   алгоритма шифрования в режиме гаммирования приведена на рисунке 4, ниже

  изложены пояснения к схеме:   0.Определяет исходные данные для основного шага криптопреобразования:     Tо(ш) – массив открытых (зашифрованных) данных произвольного размера,

    подвергаемый процедуре зашифрования (расшифрования), по ходу процедуры

    массив подвергается преобразованию порциями по 64 бита;     S– синхропосылка, 64-битный элемент данных, необходимый для инициализации

    генератора гаммы;   1.Начальное преобразование синхропосылки, выполняемое для ее «рандомизации»,

  то есть для устранения статистических закономерностей, присутствующих в ней,

  результат используется как начальное заполнение РГПЧ;

  2.Один шаг работы РГПЧ, реализующий его рекуррентный алгоритм. В ходе данного

  шага старшая (S1) и младшая (S0) части последовательности данных

  вырабатываются независимо друг от друга;

  3.Гаммирование. Очередной 64-битный элемент, выработанный РГПЧ, подвергается

  процедуре зашифрования по циклу 32–З, результат используется как элемент гаммы

  для зашифрования (расшифрования) очередного блока открытых (зашифрованных)

  данных того же размера.

  4.Результат работы алгоритма – зашифрованный (расшифрованный) массив данных.   Ниже перечислены особенности гаммирования как режима шифрования.

  1.        Одинаковые блоки в открытом массиве данных дадут при зашифровании

  различные блоки шифротекста, что позволит скрыть факт их идентичности.

  2.        Поскольку наложение гаммы выполняется побитно, шифрование неполного

  блока данных легко выполнимо как шифрование битов этого неполного блока, для

  чего используется соответствующие биты блока гаммы. Так, для зашифрования

  неполного блока в 1 бит можно использовать любой бит из блока гаммы.

  3.        Синхропосылка, использованная при зашифровании, каким-то образом     продолжение --PAGE_BREAK--   должна быть передана для использования при расшифровании. Это может быть

  достигнуто следующими путями:

  хранить или передавать синхропосылку вместе с зашифрованным массивом данных,

  что приведет к увеличению размера массива данных при зашифровании на размер

  синхропосылки, то есть на 8 байт;

  использовать предопределенное значение синхропосылки или вырабатывать ее

  синхронно источником и приемником по определенному закону, в этом случае

  изменение размера передаваемого или хранимого массива данных отсутствует;   Оба способа дополняют друг друга, и в тех редких случаях, где не работает

  первый, наиболее употребительный из них, может быть использован второй, более

  экзотический. Второйспособ имеет гораздо меньшее применение, поскольку сделать

  синхропосылку предопределенной можно только в том случае, если на данном

  комплекте ключевой информации шифруется заведомо не более одного массива

  данных, что бывает в редких случаях. Генерировать синхропосылку синхронно у

  источника и получателя массива данных также не всегда представляется

  возможным, поскольку требует жесткой привязки к чему-либо в системе. Так,

  здравая на первый взгляд идея использовать в качестве синхропосылки в системе

  передачи зашифрованных сообщений номер передаваемого сообщения не подходит,

  поскольку сообщение может потеряться и не дойти до адресата, в этом случае

  произойдет десинхронизация систем шифрования источника и приемника. Поэтому в

  рассмотренном случае нет альтернативы передаче синхропосылки вместе с

  зашифрованным сообщением.   С другой стороны, можно привести и обратный пример. Допустим, шифрование

  данных используется для защиты информации на диске, и реализовано оно на

  низком уровне, для обеспечения независимого доступа данные шифруются по

  секторам. В этом случае невозможно хранить синхропосылку вместе с

  зашифрованными данными, поскольку размер сектора нельзя изменить, однако ее

  можно вычислять как некоторую функцию от номера считывающей головки диска,

  номера дорожки (цилиндра) и номера сектора на дорожке. В этом случае

  синхропосылка привязывается к положению сектора на диске, которое вряд ли

  может измениться без переформатирования диска, то есть без уничтожения данных

  на нем.   Режим гаммирования имеет еще одну интересную особенность. В этом режиме биты

  массива данных шифруются независимо друг от друга. Таким образом, каждый бит

  шифротекста зависит от соответствующего бита открытого текста и, естественно,

  порядкового номера бита в массиве:  . Из этого вытекает, что изменение бита

  шифротекста на противоположное значение приведет к аналогичному изменению бита

  открытого текста на противоположный:

  , где обозначает инвертированное по отношению к t значение бита ( ).   Данное свойство дает злоумышленнику возможность воздействуя на биты

  шифротекста вносить предсказуемые и даже целенаправленные изменения в

  соответствующий открытый текст, получаемый после его расшифрования, не обладая

  при этом секретным ключом. Это иллюстрирует хорошо известный в криптологии

  факт, что «секретность и аутентичность суть различные свойства шифров». Иными

  словами, свойства шифров обеспечивать защиту от несанкционированного

  ознакомления с содержимым сообщения и от несанкционированного внесения

  изменений в сообщение являются независимыми и лишь в отдельных случаях могут

  пересекаться. Сказанное означает, что существуют криптографические алгоритмы,

  обеспечивающие определенную секретность зашифрованных данных и при этом никак

  не защищающие от внесения изменений и наоборот, обеспечивающие аутентичность

  данных и никак не ограничивающие возможность ознакомления с ними. По этой

  причине рассматриваемое свойство режима гаммирования не должно рассматриваться

  как его недостаток.   Гаммирование с обратной связью.   Данный режим очень похож на режим гаммирования и отличается от него только

  способом выработки элементов гаммы – очередной элемент гаммы вырабатывается

  как результат преобразования по циклу 32-З предыдущего блока зашифрованных

  данных, а для зашифрования первого блока массива данных элемент гаммы

  вырабатывается как результат преобразования по тому же циклу синхропосылки.

  Этим достигается зацепление блоков – каждый блок шифротекста в этом режиме

  зависит от соответствующего и всех предыдущих блоков открытого текста. Поэтому

  данный режим иногда называется гаммированием с зацеплением блоков. На

  стойкость шифра факт зацепления блоков не оказывает никакого влияния.   Схема алгоритмов за- и расшифрования в режиме гаммирования с обратной связью

  приведена на рисунке 5 и ввиду своей простоты в комментариях не нуждается.

  Шифрование в режиме гаммирования с обратной связью обладает теми же

  особенностями, что и шифрование в режиме обычного гаммирования, за исключением

  влияния искажений шифротекста на соответствующий открытый текст. Для сравнения

  запишем функции расшифрования блока для обоих упомянутых режимов:

  , гаммирование;

  , гаммирование с обратной связью;

  Если в режиме обычного гаммирования изменения в определенных битах шифротекста

  влияют только на соответствующие биты открытого текста, то в режиме

  гаммирования с обратной связью картина несколько сложнее. Как видно из

  соответствующего уравнения, при расшифровании блока данных в режиме

  гаммирования с обратной связью, блок открытых данных зависит от

  соответствующего и предыдущего блоков зашифрованных данных. Поэтому, если

  внести искажения в зашифрованный блок, то после расшифрования искаженными

  окажутся два блока открытых данных – соответствующий и следующий за ним,

  причем искажения в первом случае будут носить тот же характер, что и в режиме

  гаммирования, а во втором случае – как в режиме простой замены. Другими

  словами, в соответствующем блоке открытых данных искаженными окажутся те же

  самые биты, что и в блоке шифрованных данных, а в следующем блоке открытых

  данных все биты независимо друг от друга с вероятностью 1/2 изменят свои

  значения.   Выработка имитовставки к массиву данных.   В предыдущих разделах мы обсудили влияние искажения шифрованных данных на

  соответствующие открытые данные. Мы установили, что при расшифровании в режиме

  простой замены соответствующий блок открытых данных оказывается искаженным

  непредсказуемым образом, а при расшифровании блока в режиме гаммирования

  изменения предсказуемы. В режиме гаммирования с обратной связью искаженными

  оказываются два блока, один предсказуемым, а другой непредсказуемым образом.

  Значит ли это, что с точки зрения защиты от навязывания ложных данных режим

  гаммирования является плохим, а режимы простой замены и гаммирования с

  обратной связью хорошими? Ни в коем случае. При анализе данной ситуации

  необходимо учесть то, что непредсказуемые изменения в расшифрованном блоке

  данных могут быть обнаружены только в случае избыточности этих самых данных,

  причем чем больше степень избыточности, тем вероятнее обнаружение искажения.

  Очень большая избыточность имеет место, например, для текстов на естественных

  и искусственных языках, в этом случае факт искажения обнаруживается

  практически неизбежно. Однако в других случаях, например, при искажении сжатых

  звуковых образов, мы получим просто другой образ, который сможет воспринять

  наше ухо. Искажение в этом случае останется необнаруженным, если, конечно, нет

  априорной информации о характере звука. Вывод здесь такой: поскольку

  способность некоторых режимов шифрования обнаруживать искажения, внесенные в

  шифрованные данные, существенным образом опирается на наличие и степень

  избыточности шифруемых данных, эта способность не является имманентным

  свойством соответствующих режимов и не может рассматриваться как их

  достоинство.

     Для решения задачи обнаружения искажений в зашифрованном массиве данных с

  заданной вероятностью в ГОСТе предусмотрен дополнительный режим

  криптографического преобразования – выработка имитовставки. Имитовставка – это

  контрольная комбинация, зависящая от открытых данных и секретной ключевой

  информации. Целью использования имитовставки является обнаружение всех

  случайных или преднамеренных изменений в массиве информации. Проблема,

  изложенная в предыдущем пункте, может быть успешно решена с помощью добавления

  к шифрованным данным имитовставки. Для потенциального злоумышленника две

  следующие задачи практически неразрешимы, если он не владеет ключевой

  информацией:     вычисление имитовставки для заданного открытого массива информации;     подбор открытых данных под заданную имитовставку;   Cхема алгоритма выработки имитовставки приведена на рисунке 6. В качестве

  имитовставки берется часть блока, полученного на выходе, обычно 32 его младших

  бита. При выборе размера имитовставки надо принимать во внимание, что

  вероятность успешного навязывания ложных данных равна величине 2–И на одну

  попытку подбора. При использовании имитовставки размером 32 бита эта

  вероятность равна 2–32?0.23·10–9.   Криптографическая стойкость ГОСТа.   При выборе криптографического алгоритма для использования в конкретной

  разработке одним из определяющих факторов является его стойкость, то есть

  устойчивость к попыткам противоположной стороны его раскрыть. Вопрос о

  стойкости шифра при ближайшем рассмотрении сводится к двум взаимосвязанным

  вопросам:     можно ли вообще раскрыть данный шифр;     если да, то насколько это трудно сделать практически;   Шифры, которые вообще невозможно раскрыть, называются абсолютно или

  теоретически стойкими. Существование подобных шифров доказывается теоремой

  Шеннона, однако ценой этой стойкости является необходимость использования для

  шифрования каждого сообщения ключа, не меньшего по размеру самого сообщения.

  Во всех случаях за исключением ряда особых эта цена чрезмерна, поэтому на

  практике в основном используются шифры, не обладающие абсолютной стойкостью.

  Таким образом, наиболее употребительные схемы шифрования могут быть раскрыты

  за конечное время или, что точнее, за конечное число шагов, каждый из которых

  является некоторой операцией над числами. Для них наиважнейшее значение имеет

  понятие практической стойкости, выражающее практическую трудность их

  раскрытия. Количественной мерой этой трудности может служить число

  элементарных арифметических и логических операций, которые необходимо

  выполнить, чтобы раскрыть шифр, то есть чтобы для заданного шифротекста с

  вероятностью, не меньшей заданной величины, определить соответствующий

  открытый текст. При этом в дополнении к дешифруемому массиву данных

  криптоаналитик может располагать блоками открытых данных и соответствующих им

  зашифрованных данных или даже возможностью получить для любых выбранных им

  открытых данных соответствующие зашифрованные данные – в зависимости от

  перечисленных и многих других неуказанных условий различают отдельные виды

  криптоанализа.

  современные криптосистемы построены по принципу Кирхгоффа, то есть секретность

  зашифрованных сообщений определяется секретностью ключа. Это значит, что даже

  если сам алгоритм шифрования известен криптоаналитику, тот тем не менее не в

  состоянии расшифровать сообщение, если не располагает соответствующим ключом.

  Все классические блочные шифры, в том числе DES и ГОСТ, соответствуют этому

  принципу и спроектированы таким образом, чтобы не было пути вскрыть их более

  эффективным способом, чем полным перебором по всему ключевому пространству,

  т.е. по всем возможным значениям ключа. Ясно, что стойкость таких шифров

  определяется размером используемого в них ключа.

  шифре ГОСТ используется 256-битовый ключ и объем ключевого пространства

  составляет 2256. Ни на одной из существующих в настоящее время или

  предполагаемых к реализации в недалеком будущем ЭВМ общего применения нельзя

  подобрать ключ за время, меньшее многих сотен лет. Российский стандарт

  проектировался с большим запасом и по стойкости на много порядков превосходит

  американский стандарт DES с его реальным размером ключа в 56 бит и объемом

  ключевого пространства всего 256. В свете прогресса современных вычислительных

  средств этого явно недостаточно. В этой связи DES может представлять скорее

  исследовательский или научный, чем практический интерес. Как ожидается, в 1998

  году он перестанет быть стандартом США на шифрование.   Замечания по архитектуре ГОСТа.   Общеизвестно, что шифр ГОСТ 28147-89 является представителем целого семейства

  шифров, построенных на одних и тех же принципах. Самым известным его

  «родственником» является американский стандарт шифрования, алгоритм DES. Все

  эти шифры, подобно ГОСТу, содержат алгоритмы трех уровней. В основе всегда

  лежит некий «основной шаг», на базе которого сходным образом строятся «базовые

  циклы», и уже на их основе построены практические процедуры шифрования и

  выработки имитовставки. Таким образом, специфика каждого из шифров этого

  семейства заключена именно в его основном шаге, точнее даже в его части. Хотя

  архитектура классических блочных шифров, к которым относится ГОСТ, лежит

  далеко за пределами темы настоящей статьи, все же стоит сказать несколько слов

  по ее поводу.   Алгоритмы «основных шагов криптопреобразования» для шифров, подобных ГОСТу,

  построены идентичным образом. Их общая схема приведена на рисунке 7. На вход

  основного шага подается блок четного размера, старшая и младшая половины

  которого обрабатываются отдельно друг от друга. В ходе преобразования младшая

  половина блока помещается на место старшей, а старшая, скомбинированная с

  помощью операции побитного исключающего или с результатом вычисления некоторой

  функции, на место младшей. Эта функция, принимающая в качестве аргумента

  младшую половину блока и некоторый элемент ключевой информации (X), является

  содержательной частью шифра и называется его функцией шифрования. Соображения

  стойкости шифра требуют, чтобы размеры всех перечисленных элементов блоков

  были равны: N1=N2=X, в ГОСТе и DESе они равны 32 битам.   Если применить сказанное к схеме основного шага алгоритма ГОСТ, станет

  очевидным, что блоки 1,2,3 алгоритма определяют вычисление его функции

  шифрования, а блоки 4 и 5 задают формирование выходного блока основного шага

  исходя из содержимого входного блока и значения функции шифрования.   В предыдущем разделе мы уже сравнили DES и ГОСТ по стойкости, теперь мы

  сравним их по функциональному содержанию и удобству реализации. В циклах

  шифрования ГОСТа основной шаг повторяется 32 раза, для DESа эта величина равна

  16. Однако сама функция шифрования ГОСТа существенно проще аналогичной функции

  DESа, в которой присутствует множество перекодировок по таблицам с изменением

  размера перекодируемых элементов. Кроме того, между основными шагами в циклах

  шифрования DESа необходимо выполнять битовые перестановки в блоках данных. Все

  эти операции чрезвычайно неэффективно реализуются на современных

  неспециализированных процессорах. ГОСТ не содержит подобных операций, поэтому

  он значительно удобней для программной реализации. Ни одна из рассмотренных

  автором реализаций DESа для платформы Intel x86 не достигает даже половины

  производительности предложенной вашему вниманию в настоящей статье реализации

  ГОСТа, несмотря на вдвое более короткий цикл. Все сказанное выше

  свидетельствует о том, что разработчики ГОСТа учли как положительные, так и

  отрицательные стороны DESа, а также более реально оценили текущие и

  перспективные возможности криптоанализа.   Требования к качеству ключевой информации и источники ключей.   Не все ключи и таблицы замен обеспечивают максимальную стойкость шифра. Для

  каждого алгоритма шифрования существуют свои критерии оценки ключевой

  информации. Так, для алгоритма DES известно существование так называемых

  «слабых ключей», при использовании которых связь между открытыми и

  зашифрованными данными не маскируется достаточным образом, и шифр сравнительно

  просто вскрывается.

  Исчерпывающий ответ на вопрос о критериях качества ключей и таблиц замен ГОСТа

  если и можно вообще где-либо получить, то только у разработчиков алгоритма.

  Соответствующие данные не были опубликованы в открытой печати. Однако согласно

  установленному порядку, для шифрования информации, имеющей гриф, должны быть

  использованы ключевые данные, полученные от уполномоченной организации.

  Косвенным образом это может свидетельствовать о наличии методик проверки

  ключевых данных на «вшивость». Сам факт существования слабых ключевых данных в

  Российском стандарте шифрования не вызывает сомнения. Очевидно, нулевой ключ и

  тривиальная таблица замен, по которой любое значение заменяется но него

  самого, являются слабыми, при использовании хотя бы одного из них шифр

  достаточно просто взламывается, каков бы ни был второй ключевой элемент.   Как уже было отмечено выше, критерии оценки ключевой информации недоступны,

  однако на их счет все же можно высказать некоторые соображения:   1.        Ключ должен являться массивом статистически независимых битов,

  принимающих с равной вероятностью значения 0 и 1. При этом некоторые

  конкретные значения ключа могут оказаться «слабыми», то есть шифр может не

  обеспечивать заданный уровень стойкости в случае их использования. Однако,

  предположительно, доля таких значений в общей массе всех возможных ключей

  ничтожно мала. Поэтому ключи, выработанные с помощью некоторого датчика

  истинно случайных чисел, будут качественными с вероятностью, отличающейся от

  единицы на ничтожно малую величину. Если же ключи вырабатываются с помощью

  генератора псевдослучайных чисел, то используемый генератор должен

  обеспечивать указанные выше статистические характеристики, и, кроме того,

  обладать высокой криптостойкостью, не меньшей, чем у самого ГОСТа. Иными

  словами, задача определения отсутствующих членов вырабатываемой генератором

  последовательности элементов не должна быть проще, чем задача вскрытия шифра.

  Кроме того, для отбраковки ключей с плохими статистическими характеристиками     продолжение --PAGE_BREAK--   могут быть использованы различные статистические критерии. На практике обычно

  хватает двух критериев, – для проверки равновероятного распределения битов

  ключа между значениями 0 и 1 обычно используется критерий Пирсона («хи

  квадрат»), а для проверки независимости битов ключа – критерий серий. Об

  упомянутых критериях можно прочитать в учебниках или справочниках по

  математической статистике.   2.        Таблица замен является долговременным ключевым элементом, то есть

  действует в течение гораздо более длительного срока, чем отдельный ключ.

  Предполагается, что она является общей для всех узлов шифрования в рамках

  одной системы криптографической защиты. Даже при нарушении конфиденциальности

  таблицы замен стойкость шифра остается чрезвычайно высокой и не снижается ниже

  допустимого предела. К качеству отдельных узлов замен можно предъявить

  приведенное ниже требование. Каждый узел замен может быть описан четверкой

  логических функций, каждая из которых имеет четыре логических аргумента.

  Необходимо, чтобы эти функции были достаточно сложными. Это требование

  сложности невозможно выразить формально, однако в качестве необходимого

  условия можно потребовать, чтобы соответствующие логические функции,

  записанные в минимальной форме (т.е. с минимально возможной длиной выражения)

  с использованием основных логических операций, не были короче некоторого

  необходимого минимума. В первом и очень грубом приближении это условие может

  сойти и за достаточное. Кроме того, отдельные функции в пределах всей таблицы

  замен должны отличаться друг от друга в достаточной степени. На практике

  бывает достаточно получить узлы замен как независимые случайные перестановки

  чисел от 0 до 15, это может быть практически реализовано, например, с помощью

  перемешивания колоды из шестнадцати карт, за каждой из которых закреплено одно

  из значений указанного диапазона.   Необходимо отметить еще один интересный факт относительно таблицы замен. Для

  обратимости циклов шифрования 32–З и 32–Р не требуется, чтобы узлы замен были

  перестановками чисел от 0 до 15. Все работает даже в том случае, если в узле

  замен есть повторяющиеся элементы, и замена, определяемая таким узлом,

  необратима, однако в этом случае снижается стойкость шифра. Почему это именно

  так, не рассматривается в настоящей статье, однако в самом факте убедиться

  несложно. Для этого достаточно, используя демонстрационную программу

  шифрования файлов данных, прилагающуюся к настоящей статье, зашифровать а

  затем расшифровать файл данных, использовав для этой процедуры «неполноценную»

  таблицу замен, узлы которой содержат повторяющиеся значения.   Если вы разрабатываете программы, использующие криптографические алгоритмы,

  вам необходимо позаботиться об утилитах, вырабатывающих ключевую информацию, а

  для таких утилит необходим источник случайных чисел (СЧ) высокого

  статистического качества и криптостойкости. Наилучшим подходом здесь было бы

  использование аппаратных датчиков СЧ, однако это не всегда приемлемо по

  экономическим соображениям. В качестве разумной альтернативы возможно (и очень

  широко распространено) использование различных программных датчиков СЧ. При

  генерации небольшого по объему массива ключевой информации широко применяется

  метод «электронной рулетки», когда очередная получаемая с такогодатчика порция

  случайных битов зависит от момента времени нажатия оператором некоторой

  клавиши на клавиатуре компьютера.   Этот подход использован в программе генерации одного ключа, исходный текст

  которой на языке Си с ассемблерными вкраплениями прилагается к настоящей

  статье в файле make1key.c. Для выработки случайных чисел из заданного

  диапазона используется канал 2 системного таймера, информация считывается с

  него при нажатии оператором какой-либо клавиши на клавиатуре дисплея. За одно

  нажатие генерируется один байт ключа и на экран выводится точка. Чтобы было

  невозможно генерировать байты ключа удержанием клавиши в нажатом состоянии,

  между циклами генерации введена временная задержка и в начале каждого цикла

  проверяется, было ли во время паузы нажатие клавиши. Если таковое имело место,

  выдается звуковой сигнал и нажатие игнорируется. Программу целесообразно

  запускать только из «голого» DOSа, в DOS-сеансе Windows 3.x/95 она также

  работает, но нет уверенности в обеспечении нужных статистических

  характеристик, а под Windows NT программа по вполне понятным причинам (лезет

  напрямую в порты) вообще не работает корректно.   В реализации алгоритмов были использованы изложенные ниже подходы, позволившие

  достигнуть максимальной производительности. Первые два из них достаточно

  очевидны, настолько, что встречаются практически в каждой реализации ГОСТа.     Базовые циклы ГОСТа содержат вложенные циклы (звучит коряво, но по-другому

    не скажешь), причем во внутреннем цикле порядок использования восьми

    32-битных элементов ключа может быть прямой или обратный. Существенно

    упростить реализацию и повысить эффективность базовых циклов можно, если

    избежать использования вложенных циклов и просматривать последовательность

    элементов ключа только один раз. Для этого необходимо предварительно

    сформировать последовательность элементов ключа в том порядке, в котором они

    используются в соответствующем базовом цикле.     В основном шаге криптопреобразования 8 раз выполняется подстановка 4-битных

    групп данных. Целевой процессор реализации не имеет команды замены 4-битных

    групп, однако имеет удобную команду байтовой замены (xlat). Ее использование

    дает следующие выгоды:     за одну команду выполняются сразу две замены;     исчезает необходимость выделять полубайты из двойных слов для выполнения

    замены, а затем из 4-битовых результатов замен вновь формировать двойное

    слово.   достигается значительное увеличение быстродействия кода, однако мир устроен

  так, что за все приходится платить, и в данном случае платой является

  необходимость преобразования таблицы замен. Каждая из четырех пар 4-разрядных

  узлов замен заменяется одним 8-разрядным узлом, который, говоря языком

  математики, представляет собой прямое произведение узлов, входящих в пару.

  Пара 4-разрядных узлов требует для своего представления 16 байтов, один

  8-разрядный – 256 байтов. Таким образом, размер таблицы замен, которая должна

  храниться в памяти компьютера, увеличивается до 4·256=1024 байтов, или до

  одного килобайта. Конечно, такая плата за существенное увеличение

  эффективности реализации вполне приемлема.

  После выполнения подстановок кода по таблице замен основной шаг

  криптопреобразования предполагает циклический сдвиг двойного слова влево на 11

  бит. В силу 16-разрядной архитектуры рассматриваемых процессоров вращение

  32-разрядного блока даже на 1 бит невозможно реализовать менее, чем за три

  ассемблерные команды, а вращение на большее число разрядов только как

  последовательность отдельных вращений на 1 разряд. К счастью, вращение на 11

  бит влево можно представить как вращение на 8 бит, а затем еще на 3 бита

  влево. Думаю, для всех очевидно, что первое вращение реализуется тремя

  командами обмена байтовых регистров (xchg). Но секрет третьей оптимизации даже

  не в этом. Замена одного байта по таблице замен осуществляется командой xlat,

  которая выполняет операцию над аргументом в регистре AL, для того, чтобы

  заменить все байты двойного слова, их надо последовательно помещать в этот

  регистр. Секрет третьей оптимизации заключается в том, что эти перестановки

  можно организовать так, что в результате двойное слово окажется повернутым на

  8 бит влево, то есть в совмещении замены по таблице и во вращении на байт

  влево. Еще один момент, на который стоит обратить внимание, это оптимальное

  кодирование трех последовательных вращений на 1 бит, это может быть

  реализовано по-разному и важно было выбрать оптимальный способ, который

  оказался вовсе не очевидным, поскольку потребовал выхода за пределы логики

  битовых сдвигов и использования команды суммирования с битами переноса (adc),

  то есть бит помещается на свою позицию не командой сдвига, а командой

  суммирования!   Описание функций и особенности реализации.   С учетом изложенных выше принципов созданы две реализации ГОСТа для

  процессоров семейства Intel x86, близкие по быстродействию к возможному

  оптимуму – соответственно для 16-и и 32-х битовых процессоров. Код для

  32-разрядных процессоров примерно в полтора раза быстрее соответствующего кода

  для 16-разрядных процессоров. Ядром является подпрограмма, реализующая

  универсальный базовый цикл ГОСТа. Исходные тексты всех подпрограмм приведены в

  качестве приложений к настоящей статье в отдельных файлах, они перечислены в

  следующей ниже таблице 1. Все функции являются самодокументированными, каждая

  описана в соответствующем файле с ее исходным текстом.   Таблица 1. Перечень файлов.№Функция модуля

        1.Универсальный базовый цикл ГОСТаgost$.asm

        2.Функция за- и расшифрования данных в режиме простой заменыsimple$.asm

        3.Функция за- и расшифрования данных в режиме гаммированияgamma$.asm

        4.Функция зашифрования данных в режиме гаммирования с обратной

        связьюgammale$.asm

        5.Функция расшифрования данных в режиме гаммирования с обратной

        связьюgammald$.asm

        6.Функция вычисления имитовставки для массива данныхimito$.asm

        7.Функция построения расширенного ключаexpkey$.asm

        8.Функция построения расширенной (1Кбайт) формы таблицы замен из обычной

        формы (128 байт)Expcht.asm

        9.Функция проверки, является ли процессор, на котором исполняется

        приложение, 32-битовым.expkey$.asm

        10.Заголовочный файл для использования криптографических функций в

        программах на языке СиGost.h

  Комплект модулей включает функции для основных режимов шифрования, а также две

  вспомогательные функции, предназначенные для построения расширенных

  соответственно ключа и таблицы замен. Ниже изложены принципы построения

  программных модулей.       Все функции шифрования и вычисления имитовставки обрабатывают (т.е.

      шифруют или вычисляют имитовставку) области с размером, кратным восьми.

      Длина обрабатываемой области при вызове упомянутых функций задается в

      восьмибайтных блоках. В реальных ситуациях это не приводит к неудобству по

      следующим причинам:       при шифровании простой заменой размер шифруемой области обязан быть

      кратным восьми байтам;       при шифровании гаммированием (с или без обратной связи) массива данных с

      размером, не кратным восьми, будет также шифроваться и «мусор»,

      содержащийся в последнем восьмибайтовом блоке за пределами значащих

      данных, однако его содержимое не оказывает никакого влияния на значащие

      данные и может не приниматься во внимание;

      при вычислении имитовставки для массивов данных их размер должен быть

      приведен к значению, кратному восьми, добавлением какого-либо

      фиксированного кода (обычно нулевых битов).       Криптографические функции шифрования и вычисления имитовставки позволяют

      выполнять обработку массивов данных по частям. Это означает, что при

      вызове соответствующей функции один раз для некоторой области данных и при

      нескольких вызовах этой же самой функции для последовательных фрагментов

      этой же области (естественно их размер должен быть кратным восьми байтам,

      см. предыдущее замечание) будет получен один и тот же результат. Это

      позволяет обрабатывать данные порциями, используя буфер размером всего 8

      байтов.       Для за- и расшифрования массива данных в режиме простой замены

      используется одна и та же функция. Выбор одной из двух указанных операций

      осуществляется заданием соответствующего расширенного ключа. Порядок

      следования элементов ключа должен быть взаимно обратным для указанных

      операций.       Для за- и расшифрования блока данных в режиме гаммирования используется

      одна и та же функция, поскольку в данном режиме зашифрование и

      расшифрование данных идентичны. Функция, реализующая шифрование

      гаммированием не осуществляет начальное преобразование синхропосылки (см.

      схему алгоритма на рис.5, блок 1), это необходимо выполнить с помощью

      явного вызова функции шифрования в режиме простой замены для

      синхропосылки, – это плата за возможность шифровать массив по частям.       Ради универсальности кода все указатели на области обрабатываемых данных

      сделаны дальними. Если сделать свой код для каждой модели памяти,

      возможно, будет достигнута некоторая ненулевая (но очень маленькая!)

      экономияпамяти и времени выполнения, но по моему мнению, эта игра не стоит

      свеч.       Для ассемблирования (компиляции) и сборки приложенных модулей мной

      использовались средства разработки фирмы Borland – TASM 2.5 и выше,

      Borland C/C++ 2.0 и выше. При использовании других средств разработки

      возможно потребуется внесение изменений в исходные тексты программ.       Для иллюстрации использования представленных криптографических функций к

      настоящей статье приложены также текст программы шифрования файлов данных

      на языке Си и соответствующие файлы проекта. Эти файлы следующие:   cryptor.c        Исходные тексты программы шифрования файлов;

  gost386.mak        Файл проекта для 32-разрядной версии программы шифрования

  файлов.   Описание построения и синтаксиса вызова (командной строки) программы

  шифрования файлов также прилагается.   Вопрос быстродействия.   После разработки новой программной реализации было измерено ее быстродействие,

  для чего был разработан комплект простых модулей, предназначенных для

  построения измерительной задачи. Эта задача фиксирует и выводит на дисплей

  время (в тактах генератора тактовой частоты таймера, 1193180 Герц),

  затраченное тестируемой подпрограммой на выполнение. По измеренному времени

  работы подпрограммы затем вычисляется (вручную) ее быстродействие как

  отношение количества работы ко времени ее выполнения.   Максимальная измеряемая программой длительность процесса равна

  232/1193180?3599.6 секунд, то есть примерно одному часу. Программа работает

  корректно и дает правильные результаты, только если запущена из ДОСа.   Для модулей ГОСТа измерялась длительность шифрования одного мегабайта данных,

  которое моделировалось 32-кратным шифрованием 32-Килобайтной области памяти.

  Измерения проводились на машинах различных классов, результаты измерения

  приведены ниже в таблице 2. Для 32-битовых процессоров также приведено

  быстродействие 32-битовых реализаций криптографических модулей (нижнее число в

  соответствующей ячейке). Для сравнения также приведены измерения

  быстродействия реализации американского стандарта шифрования DES,

  опубликованной в журнале «Монитор» №7/1994. Результаты тестов показали, что

  быстродействие модулей для всех режимов шифрования ГОСТа примерно одинаково, а

  быстродействие модуля вычисления имитовставки приблизительно вдвое превышает

  быстродействие шифрования – что, собственно, и ожидалось. Реализация

  шифрования по ГОСТ существенно (более чем в два раза) превышает исследованную

  реализацию DES по быстродействию.   Таблица 2. Результаты измерения быстродействия модулей шифрования       

        Марка компьютера, т.ч., Быстродействие криптографических модулей

        тип процессораМГцgammagammaLDgammaLEsimpleImitoDES

        Искра 1031, К1810ВМ884.528.48.68.78.716.9нет данных

        AMI 286 Intel 802861020.420.720.820.840.811.2

        Prolinea 325 Intel 386SX-252548.0 66.048.6 71.148.8 67.448.0 71.593.7

        13922.0

        Неизв.модель Intel 386SX-333363.8 87.664.5 94.564.7 89.563.8 95.0124

        18525.9

        BYTEX Intel 386DX-404089 12090 13591 12291 135177 26439.3

        Acer Intel486SX3333114 150113 161114 151114 162226 32141.2

        Presario 460 Intel486SX2-6666225 298222 319229 303227 324451 63782.2

        Acer Pentium-6666302 351296 397307 355293 405601 77788.7   Теперь оценим достигнутые показатели с качественной точки зрения. Предельные

  скорости шифрования намного превышают скорость работы платы аппаратного

  шифрования «Криптон–3» (до 70 Кбайт/с) и примерно соответствуют быстродействию

  платы «Криптон–4» (около 400 Кбайт/с). Достигнутой производительности не

  достаточно для действительно прозрачного шифрования данных, хранимых на

  жестких дисках или передаваемых через быструю сеть. Вместе с тем,

  быстродействия реализации вполне хватает для шифрования данных в коммутируемых

  каналах связи идля многих других случаев.   Можно ли еще увеличить быстродействие реализации ГОСТа? Можно, но ненамного,

  если оставаться в рамках формальной спецификации ГОСТа. Для этого необходимо

  отказаться от цикла в подпрограмме «gost», продублировав тело цикла 32 раза,

  как это сделал автор программного эмулятора платы «Криптон». При этом можно не

  разворачивать ключ в линейную последовательность элементов, но тогда для

  каждого базового цикла криптографического преобразования придется сделать свой

  программный модуль и код основного шага будет присутствовать в кодах

  криптографических процедур в 32+32+16=80 экземплярах. Такой способ повышения

  эффективности приводит к многократному разбуханию кода при более чем скромном

  выигрыше в производительности, поэтому вряд ли его можно считать хорошим.   Надежность реализации.   Вопрос надежности программного средства криптографической защиты это не только

  вопрос стойкости использованного алгоритма. Использование стойкого шифра само

  по себе не может сделать вашу систему надежной, хотя и является необходимым

  условием. Весьма важную роль играет и способ применения криптографического

  алгоритма. Так, в приложение к настоящей программе шифрования файлов, хранение

  ключевой информации на дисках в открытом виде делает систему, которая была бы     продолжение --PAGE_BREAK--

www.ronl.ru

Реферат - Понятие информация - Информатика

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ ФЕДЕРАЛЬНОЕ АГЕНСТВО ПО ОБРАЗОВАНИЮ РОСТОВСКИЙ ГОСУДАРСТВЕННЫЙ ЭКОНОМИСЧЕСКИЙ УНИВЕРСИТЕТ

Кафедра Информатики

РЕФЕРАТ

на тему: «Понятие информация»

Выполнил студент:

Алексашин Сергей

Факультета

Экономика и управление на

предприятии

Группы 111 – зк

Номер зачётной книжки 00110

Научный руководитель:

Ростов – на – Дону – 2011г.

План:

Стр.

Введение 3

1. Понятие «информация» 4-5

2. Архивация информации. Программы-архиваторы. 6-7

3. Текстовый процессор 8

Заключение 9

Литература 10

Введение

Революция в автоматизации делопроизводства в офисе в 80-е годы прошлого века стала реально возможна в связи с созданием и широким распространением персональных компьютеров. Персональные компьютеры в первую очередь вытеснили из обращения печатающие машинки, составляющие основу технических средств подготовки печатных документов. Преимущества компьютера, оснащенного специальным текстовым процессором (редактором), перед печатающей машинкой были явными и заключались в том, что обеспечивали значительное повышение удобства, производительности выполнения работ и, самое главное, повышение качества получаемых при этом документов. Разделение во времени этапов подготовки документа, таких, как ввод, редактирование, оформление, подготовка к печати и собственно сама печать сделали процесс создания документа более простым и технологичным.

Понятие «информация»

Слово «информация» происходит от латинского слова informatio, что в переводе означает сведение, разъяснение, ознакомление.

Информация может существовать в виде:

· текстов, рисунков, чертежей, фотографий;

· световых или звуковых сигналов;

· радиоволн;

· электрических и нервных импульсов;

· магнитных записей;

· жестов и мимики;

· запахов и вкусовых ощущений;

· хромосом, посредством которых передаются по наследству признаки и свойства организмов и т.д.

Современные компьютеры могут работать с пятью видами информации:

o числовой;

o текстовой;

o графической;

o звуковой;

o видеоинформацией.

Понятие «информация» является базовым в курсе информатики, невозможно дать его определение через другие, более «простые» понятия. Данное понятие используется в различных науках (информатике, кибернетике, биологии, физике и др.), при этом в каждой науке понятие «информация» связано с различными системами понятий.

Информация в физике. В физике мерой беспорядка, хаоса для термодинамической системы является энтропия системы, тогда как информация (антиэнтропия) является мерой упорядоченности и сложности системы. По мере увеличения сложности системы величина энтропии уменьшается, и величина информации увеличивается. Процесс увеличения информации характерен для открытых, обменивающихся веществом и энергией с окружающей средой, саморазвивающихся систем живой природы (белковых молекул, организмов, популяций животных и так далее).

Таким образом, в физике информация рассматривается как антиэнтропия или энтропия с обратным знаком.

Информация в биологии. В биологии понятие «информация» связывается с целесообразным поведением живых организмов. Такое поведение строится на основе получения и использования организмом информации об окружающей среде.

Понятие «информация» в биологии используется также в связи с исследованиями механизмов наследственности. Генетическая информация передается по наследству и хранится во всех клетках живых организмов. Гены представляют собой сложные молекулярные структуры, содержащие информацию о строении живых организмов. Последнее обстоятельство позволило проводить научные эксперименты по клонированию, то есть созданию точных копий организмов из одной клетки.

Информация в кибернетике. В кибернетике (наука об управлении) понятие «информация» связано с процессами управления в сложных системах (в живых организмах или технических устройствах). Жизнедеятельность любого организма или нормальное функционирование технического устройства зависит от процессов управления, благодаря которым поддерживаются в необходимых пределах значения их параметров. Процессы управления включают в себя получение, хранение, преобразования и передачу информации.[1]

Архивация информации

Возможность уплотнения данных основана на том, что информация часто обладает избыточностью, которая зависит от вида информации. Случайная потеря 10% фотографии, скорее всего, не повлияет на ее информативность. Если на странице книги отсутствует 10% строк, то понять ее содержание уже трудно. Если взять программный код, в котором утрачено 10% информации, то восстановить его, скорее всего, уже не удастся. У этих видов данных разная избыточность. Несмотря на то, что объемы внешней памяти ЭВМ постоянно растут, потребность в архивации не уменьшается. Это объясняется тем, что архивация необходима не только для экономии места в памяти, но и для надежного хранения копий ценной информации, а также для быстрой передачи информации по сети на другие ЭВМ. Кроме того, возможность отказа магнитных носителей информации, разрушающее действие вирусов заставляет пользователей делать резервное копирование ценной информации на другие (запасные) носители информации.

Процесс записи файла в архивный файл называется архивированием (упаковкой, сжатием), а извлечение файла из архива – разархивированием (распаковкой).

Упакованный (сжатый) файл называется архивом. Архив содержит оглавление, позволяющее узнать, какие файлы содержатся в архиве.

Программы-архиваторы.

Различными разработчиками были созданы специальные программы для архивации файлов. Часть из них распространяется бесплатно, часть — на коммерческой основе (за плату), но большинство программ такого рода распространяются как “Shareware”. т.е. они могут быть получены бесплатно, но если Вы хотите их использовать постоянно, то должны выслать авторам или распространителям указанное (обычно небольшое, до 50 дол.) вознаграждение.

Как правило, программы для архивации файлов позволяют помещать копии файлов на диске в сжатом виде в архивный файл, извлекать файлы из архива, просматривать оглавление архива и т.д. Разные программы отличаются форматом архивных файлов, скоростью работы, степенью сжатия файлов при помещении в архив, удобством использования.

Наиболее распространенные программы-архиваторы имеют приблизительно одинаковые возможности и ни одна из них не превосходит другие по всем параметрам: одни программы работают быстрее, другие обеспечивают лучшую степень сжатия файлов. Даже если сравнивать программы только по степени сжатия, то среди них нет лидера: разные файлы лучше сжимаются разными программами.

Принцип работы архиваторов основан на поиске в файле «избыточной» информации и последующем ее кодировании с целью получения минимального объема. Самым известным методом архивации файлов является сжатие последовательностей одинаковых символов.

Текстовый процессор

Текстовый процессор — вид прикладной компьютерной программы, предназначенной для производства (включая набор, редактирование, форматирование, иногда печать) любого вида печатной информации. Иногда текстовый процессор называют текстовым редактором второго рода.

Текстовыми процессорами в 1970-е — 1980-е годы называли предназначенные для набора и печати текстов машины индивидуального и офисного использования, состоящие из клавиатуры, встроенного компьютера для простейшего редактирования текста, а также электрического печатного устройства. Позднее наименование «текстовый процессор» стало использоваться для компьютерных программ, предназначенных для аналогичного использования.

Текстовые процессоры, в отличие от текстовых редакторов, имеют больше возможностей для форматирования текста, внедрения в него графики, формул, таблиц и других объектов. Поэтому они могут быть использованы не только для набора текстов, но и для создания различного рода документов, в том числе официальных. Классическим примером текстового процессора является Microsoft Word.

Заключение

Передача информации – очень необходимая вещь для каждого человека и всего человечества в целом. Информатизация общества в настоящее время достигает новых вершин. Это связано с возникновением новых современных информационных технологий, позволяющих человеку увеличивать объемы обрабатываемой и передаваемой информации. Главным предметом обработки и передачи информации является персональный компьютер. Все чаще передача информации между различными организациями или юридическими лицами осуществляется через локальные или глобальные компьютерные сети, что заставляет общество все глубже изучать этапы и способы передачи информации.

Таким образом, тема передачи информации остается актуальной и в современном мире.

Список используемой литературы:

1. Н.Угринович «Информатика и информационные технологии», Москва, 2003 года издания.

2. С.Симонович, Г.Евсеев «Занимательный компьютер», Москва, 2002 года издания.

3. Леонтьев В.П., «Новейшая энциклопедия персонального компьютера», Москва, 2003 года издания.

4. Фигурнов В.А., «ПК для начинающих», Москва, 1995 года издания.

Большеви́зм (от большевик) — революционное марксистское течение политической мысли и политическое движение, связанное с формированием партии социальной революции, как авангарда рабочего класса, последовательным интернационализмом и постановкой социального эксперимента: взятием власти до созревания всех необходимых предпосылок[1]. Зародилось в начале XX века и было связанно с РСДРП(б). Большевизм существует, как течение политической мысли и как политическая партия, с 1903 года.

— Ленин В.И. Детская болезнь «левизны» в коммунизме // Ленин В.И.: Полн.собр.соч. — Т. 41. — С. 6.[2] текст

Основным теоретиком большевизма был Ленин, кроме него к теоретикам большевизма относятся Николай Бухарин, Евгений Преображенский, Лев Троцкий и Роза Люксембург[1].

Некоторые исследователи[3] к большевистской теории относят и деятельность И. В. Сталина, возглавлявшего Всесоюзную коммунистическую партию (большевиков) и одновременно обладавшего всей полнотой государственной власти в СССР. Однако другие (как современники Сталина, так и более поздние) не смешивают собственно «большевизм» и «сталинизм», считая их разнонаправленными (революционным и термидорианским) явлениями[4].

Выражение «большевизм» как и впоследствии «коммунизм» устоялось в западной историографии как взгляд на совокупность особенностей советского режима в определенный политический период. В настоящее время самоназвание «большевики» активно используют различные группы сталинистов и троцкистов.

[1] Н.Угринович «Информатика и информационные технологии», М.: 2003г.-с.58

www.ronl.ru

РЕФЕРАТ. Основные требования к оформлению

Приложение 3

Примеры библиографического описанияаппарата литературы и источников (на основании ГОСТ 7.1.- 84)

Если источник имеет автора, то сначала пишется его фамилия, а затем инициалы, причем фамилия и инициалы выделяются, например, разрядкой:

Клименко В. В. Как воспитывать вундеркинда. - Харьков, 1996

Если авторов два или три, то указываются в той же последовательности, как и в источнике, все фамилии авторов с инициалами, например:

Кан-Калик В. А., Никандров В. А. Педагогическое творчество - М., 1990

Если авторов более трех, указываются только фамилия первого автора с добавлением слов «и др.», например:

Маркова А. К. и д.р. Диагностика и коррекция умственного развития в школьном и дошкольном возрасте. - Петрозаводск, 1992

Если название источника содержит дополнительные сведения (пособие, учебник, сборник трудов, обзор, учебные записки), то после основного названия ставится двоеточие, а затем даются дополнительные сведения с прописной буквы, например:

Крапивинский С.Э. Социальная философия: Учебник для студентов вузов. - М., 1998

В случае выхода источника под общей редакцией (под редакцией) после наименования источника ставится одна косая линия (/) и с прописной буквы пишется:/Под общ.ред. или /Под ред. Затем приводятся инициалы и фамилия редактора в родительном падеже.

Психологические диагностические методы в комплексном лонгитюдном исследовании студентов /Под ред. А.А. Бодалева - Л., 1976

Если же указывается редактор или составитель, то после источника также ставится одна косая линия (/) и с прописной буквы пишется:/Ред. или /Сост. Затем приводятся инициалы и фамилия редактора в родительном падеже, например:

Реклама за рубежом /Ред. Б.Г. Карпова; Сост. И.С. Синельников. М., 1979

Если ссылка дается на какую-либо статью (рассказ), изданную среди других произведений этого же автора и объединенных в одной книге, то после фамилии с инициалами дается название статьи (рассказа), затем ставятся две косые линии (//) и приводятся библиографические данные источника, например:

Розанов В.В. Декаденты// Розанов В.В. Мысли о литературе. - М., 1998. С.211-215

Коменский Я.А. Великая дидактика// Коменский Я.А. Соч.: В 2 т. - М., 1982 - Т.1. - с.242 - 446

При описании многотомных изданий после фамилии и инициалов автора пишется: Собр. соч. или Соч. и ставится двоеточие и указывается количество томов: В 3 т., В 10 т., например:

Сухомлинский В.А. Избр. пед. соч.: В 3 т. - М., 1980

Место издания - обязательный библиографический элемент - приводятся в именительном падеже.

Принятые сокращения:

Москва - М.; Ленинград - Л.; Санкт - Петербург - СПб.; Нижний Новгород - Н. Новгород; Ростов - на - Дону - Ростов н/Д.

Год издания указывается полностью без буквы «г». при отсутствии года издания пишутся прописные «Б.Г.»

При ссылке на тома, части, разделы, главы (в зависимости от построения источника) и страницы соблюдаются следующие правила:

Все сведения даются арабскими цифрами, так как эти данные являются дополнительной информацией, они отделяются друг от друга тире и пишутся в сокращении:

Том 4 - Т. 4

Книга 2 -Кн. 2

Раздел 3 -Разд. 3

Выпуск 5 - Вып. 5

Глава 40 - Гл. 40

Страница 200 - 210 или С. 10, например:

Есенин С.А. Собр. соч.: В 5 т. - М., 1970 - Т.2. - Гл.7. -С.51 - 81.

Библиографическое описание источников, взятых из газет и журналов делается так: дается фамилия и инициалы автора, название статьи, затем ставятся две косые линии (//), приводится название журнала или газеты, далее идут точка, тире, год, точка, тире, номер журнала (для газеты - дата выпуска), точка, например:

Букатов В.М. Учителю о режиссуре настойчивого поведения// Педагогика. - 1996. - №3.

Щербина Т. Энциклопедия литературных героев// Лит. Газ. - 1997. - 18 июня.

www.metod-kopilka.ru

Реферат - Данные понятие, виды

1 Данные

1.1 Введение

Информатика рассматривает информацию как концептуально связанные между собой сведения, данные, понятия, изменяющие наши представления о явлении или объекте окружающего мира. Наряду с информацией в информатике часто употребляется понятие данные.

Данные могут рассматриваться как признаки или записанные наблюдения, которые по каким-то причинам не используются, а только хранятся. В том случае, если появляется возможность использовать эти данные для уменьшения неопределенности о чем-либо, данные превращаются в информацию. Поэтому можно утверждать, что информацией являются используемые данные.

Информация — это отображение реального мира с помощью сведений (сообщений).Наряду с термином «информация» в информатике используется понятие «данные». Это понятие уже, чем информация, т.к. представляет отрывочные, не связанные между собой сведения. Однако в работе с компьютерными программами чаще употребляется термин «данные».

В технологическом процессе обработки данных можно выделить 4 этапа:

1. Формирование первичных данных — первичные сообщения о хозяйственных операциях, документы, содержащие нормативные и юридические акты, результаты экспериментов, например, параметры новой модели самолета или автомобиля и т.д.

2. Накопление и систематизация данных, т.е. организация такого размещения данных, которое обеспечило бы быстрый поиск и отбор нужных сведений, методическое обновление данных, защиту от искажений и т.д.

3. Обработка данных — процессы, в результате которых на основе ранее накопленных данных формируются новые виды данных — обобщающие, аналитические, рекомендательные, прогнозные и т.д. Эти данные вторичной обработки могут быть подвергнуты следующей обработке и принести более глубокие, точные обобщения.

4. Отображение данных — представление данных в форме, удобной для человека. Это вывод на печать, графические изображения (иллюстрации, графики, диаграммы и т.д.), звук и т.д.

Сообщения, формируемые на первом этапе, могут иметь разный вид: обычный бумажный документ, звук, видео, числовые данные на каком-то носителе. Как правило, носители первичной информации (физические носители, полученные от аналоговых устройств) — бумага, пластинки, кассеты, видеокассеты очень недолговечны.

Компьютерные технологии предлагают принципиально новый подход — цифровое (дискретное) представление информации на магнитных и лазерных носителях.

Посредством технических и программных средств ЭВМ первичные данные преобразуются в машинный код.

Итак, подводя итог можно сказать что же такое данные.Данные — диалектическая составная часть информации. Они представляют собой зарегистрированные сигналы. При этом физический метод регистрации может быть любым: механическое перемещение физических тел, изменение их формы или параметров качества поверхности, изменение электрических, магнитных, оптических характеристик, химического состава и (или) характера химических связей, изменение состояния электронной системы и многое другое. В соответствии с методом регистрации данные могут храниться и транспортироваться на носителях различных видов.

1.2 Носители данных

Данные — диалектическая составная часть информации. Они представляют собой зарегистрированные сигналы. При этом физический метод регистрации может быть любым: механическое перемещение физических тел, изменение их формы или параметров качества поверхности, изменение электрических, магнитных, оптических характеристик, химического состава и (или) характера химических связей, изменение состояния электронной системы и многое другое. В соответствии с методом регистрации данные могут храниться и транспортироваться на носителях различных видов.

Самым распространенным носителем данных, хотя и не самым экономичным, по-видимому, является бумага. На бумаге данные регистрируются путем изменения оптических характеристик ее поверхности. Изменение оптических свойств (изменение коэффициента отражения поверхности в определенном диапазоне длин волн) используется также в устройствах, осуществляющих запись лазерным лучом на пластмассовых носителях с отражающим покрытием ( CDROM ). В качестве носителей, использующих изменение магнитных свойств, можно назвать магнитные ленты и диски. Регистрация данных путем изменения химического состава поверхностных веществ носителя широко используется в фотографии. На биохимическом уровне происходит накопление и передача данных в живой природе.

Носители данных интересуют нас не сами по себе, а постольку, поскольку свойства информации весьма тесно связаны со свойствами ее носителей. Любой носитель можно характеризовать параметром разрешающей способности (количеством данных, записанных в принятой для носителя единице измерения) и динамическим диапазоном (логарифмическим отношением интенсивности амплитуд максимального и минимального регистрируемого сигналов). От этих свойств носителя нередко зависят такие свойства информации, как полнота, доступность и достоверность. Так, например, мы можем рассчитывать на то, что в базе данных, размещаемой на компакт-диске, проще обеспечить полноту информации, чем в аналогичной по назначению базе данных, размещенной на гибком магнитном диске, поскольку в первом случае плотность записи данных на единице длины дорожки намного выше. Для обычного потребителя доступность информации в книге заметно выше, чем той же информации на компакт-диске, поскольку не все потребители обладают необходимым оборудованием. И, наконец, известно, что визуальный эффект от просмотра слайдов проекторе намного больше, чем от просмотра аналогичной иллюстрации, напечатанной на бумаге, поскольку диапазон яркостных сигналов в проходящем свете на два три порядка больше, чем в отраженном.

Задача преобразования данных с целью смены носителя относится к одной из важнейших задач информатики. В структуре стоимости вычислительных систем устройства для ввода и вывода данных, работающие с носителями информации, составляют до половины стоимости аппаратных средств.

Замечательным запоминающим устройством и носителем данных является человеческий мозг, содержащий около (10—15)–109 нейронов — ячеек, совмещающих функции памяти и логической обработки информации.

Объём мозга в среднем 1,5 дм3, масса 1,2 кг, потребляемая мощность около 2,5 вт. Лучшие современные электронные запоминающие устройства при такой же ёмкости занимают объём в несколько м3 при массе в десятки и сотни кг, а потребляемая мощность достигает несколько квт.

Научно обоснованные прогнозы утверждают, что совершенствование электронной техники и применение новых высокоэффективных накопительных сред в сочетании с широким использованием методов бионики при решении проблем, связанных с синтезом запоминающих устройств, позволят создавать запоминающие устройства, близкие по параметрам памяти человека.

1.3 Операции с данными

Данные характеризуются своим типом и множеством операций над ними. Данные в компьютере условно делятся на простые и сложные.

Примеры простых данных, которые может обрабатывать компьютер:

Таблица 1

Типы данных Операции
1 Числа (числовые данные) Все арифметические операции
2 Тексты (символьные данные) Замещение, вставка, удаление символов, сравнение, конкатенация строк
3 Логические (бинарные) данные Все логические операции (конъюнкция, дизъюнкция, отрицание и др.)
4 Изображения: рисунки, графика, анимация (графические данные) Операции над пикселями, из которых состоит изображение: яркость, цвет, контрастность
5 Видео данные Удаление фрагмента, вставка фрагмента, работа с кадрами
6 Аудио данные Усиление, уменьшение, удаление фрагмента, вставка фрагмента

К сложным данным относятся: массивы и списки (однотипные), структуры, записи, таблицы (разнотипные).В ходе информационного процесса данные преобразуются из одного вида в другой с помощью методов. Обработка данных включает в себя множество различных операций. По мере развития научно-технического прогресса и общего усложнения связей в человеческом обществе трудозатраты на обработку данных неуклонно возрастают. Прежде всего, это связано с постоянным усложнением условий управления производством и обществом. Вторвй фактор, также вызывающий общее увеличение объемов обрабатываемых данных, тоже связан с научно-техническим прогрессом, а именно с быстрыми темпами появления и внедрения новых носителей данных, средств их хранения и доставки.

В структуре возможных операций с данными можно выделить следующие основные:

• сбор данных—накопление информации с целью обеспечения достаточной полноты для принятия решений;

• формализация данных — приведение данных, поступающих из разных источ­

ников, к одинаковой форме, чтобы сделать их сопоставимыми между собой, то

есть повысить их уровень доступности;

• фильтрация данных — отсеивание «лишних» данных, в которых нет необходимости для принятия решений; при этом должен уменьшаться уровень «шума», а достоверность и адекватность данных должны возрастать;

• сортировка данных — упорядочение данных по заданному признаку с целью

удобства использования; повышает доступность информации;

• архивация данных — организация хранения данных в удобной и легкодоступной форме; служит для снижения экономических затрат по хранению данных и повышает общую надежность информационного процесса в целом;

• защита данных—комплекс мер, направленных на предотвращение утраты, воспроизведения и модификации данных;

• транспортировка данных—прием и передача (доставка и поставка) данных между удаленными участниками информационного процесса; при этом источник данных в информатике принято называть сервером, а потребителя — клиентом;

• преобразование данных — перевод данных из одной формы в другую или из

одной структуры в другую. Преобразование данных часто связано с изменением

типа носителя, например книги можно хранить в обычной бумажной форме,

но можно использовать для этого и электронную форму, и микрофотопленку.

Необходимость в многократном преобразовании данных возникает также при

их транспортировке, особенно если она осуществляется средствами, не пред­

назначенными для транспортировки данного вида данных. В качестве примера

можно упомянуть, что для транспортировки цифровых потоков данных по каналам

телефонных сетей (которые изначально были ориентированы только на пере­

дачу аналоговых сигналов в узком диапазоне частот) необходимо преобразова­

ние цифровых данных в некое подобие звуковых сигналов, чем и занимаются

специальные устройства — телефонные модемы.

1.4 Кодирование данных

1.4.1 Кодирование данных двоичным кодом

Для автоматизации работы с данными, относящимися к различным типам, очень важно унифицировать их форму представления — для этого обычно используется прием кодирования, то есть выражение данных одного типа через данные другого типа. Естественные человеческие языки — это не что иное, как системы кодирования понятий для выражения мыслей посредством речи. К языкам близко примыкают азбуки (системы кодирования компонентов языка с помощью графических символов). История знает интересные, хотя и безуспешные попытки создания «универсальных» языков и азбук. По-видимому, безуспешность попыток их внедрения связана с тем, что национальные и социальные образования естественным образом понимают, что изменение системы кодирования общественных данных непременно приводит к изменению общественных методов (то есть норм права и морали), а это может быть связано с социальными потрясениями.

Та же проблема универсального средства кодирования достаточно успешно реализуется в отдельных отраслях техники, науки и культуры. В качестве примеров можно привести систему записи математических выражений, телеграфную азбуку, морскую флажковую азбуку, систему Брайля для слепых и многое другое.

Своя система существует и в вычислительной технике — она называется двоичным кодированием и основана на представлении данных последовательностью всего двух знаков: 0 и 1.Эти знаки называются двоичными цифрами, по-английски — binary digit или сокращенно bit (бит).

Одним битом могут быть выражены два понятия: 0 или 1 (да или нет, черное или белое, истина или ложь и т. п.). Если количество битов увеличить до двух, то уже можно выразить четыре различных понятия:

00 01 10 11

Тремя битами можно закодировать восемь различных значений: 000 001 010 011 100 101 ПО 111

Увеличивая на единицу количество разрядов в системе двоичного кодирования, мы увеличиваем в два раза количество значений, которое может быть выражено в данной системе, то есть общая формула имеет вид:

N=, где N— количество независимых кодируемых значений;

m — разрядность двоичного кодирования, принятая в данной системе.

1.4.2 Кодирование целых и действительных чисел

Целые числа кодируются двоичным кодом достаточно просто — достаточно взять целое число и делить его пополам до тех пор, пока частное не будет равно единице. Совокупность остатков от каждого деления, записанная справа налево вместе с последним частным, и образует двоичный аналог десятичного числа.

19:2 = 9 + 1

9:2=4+1

4: 2 = 2 +-0

2:2=1+0

Таким образом, 1910= 100112.

Для кодирования целых чисел от 0 до 255 достаточно иметь 8 разрядов двоичного кода (8 бит). Шестнадцать бит позволяют закодировать целые числа от 0 до 65 535, а 24 бита — уже более 16,5 миллионов разных значений.

Для кодирования действительных чисел используют 80-разрядное кодирование. При этом число предварительно преобразуется в нормализованную форму:

3,1415926 = 0,31415926 • 101 300 000 = 0,3 • 106

123 456 789 — 0,123456789 • 1010

Первая часть числа называется мантиссой, а вторая — характеристикой. Большую часть из 80 бит отводят для хранения мантиссы (вместе со знаком) и некоторое фиксированное количество разрядов отводят для хранения характеристики (тоже со знаком).

1.4.3 Кодирование текстовых данных

Если каждому символу алфавита сопоставить определенное целое число (например, порядковый номер), то с помощью двоичного кода можно кодировать и текстовую информацию. Восьми двоичных разрядов достаточно для кодирования 256 различных символов. Этого хватит, чтобы выразить различными комбинациями восьми битов все символы английского и русского языков, как строчные, так и прописные, а также знаки препинания, символы основных арифметических действий и некоторые общепринятые специальные символы, например символ «§».

Технически это выглядит очень просто, однако всегда существовали достаточно веские организационные сложности. В первые годы развития вычислительной техники они были связаны с отсутствием необходимых стандартов, а в настоящее время вызваны, наоборот, изобилием одновременно действующих и противоречивых стандартов. Для того чтобы весь мир одинаково кодировал текстовые данные, нужны единые таблицы кодирования, а это пока невозможно из-за противоречий между символами национальных алфавитов, а также противоречий корпоративного характера.

Для английского языка, захватившего де-факто нишу международного средства общения, противоречия уже сняты. Институт стандартизации США (ANSI — American National Standard Institute) ввел в действие систему кодирования ASCII (American Standard Code for Information Interchange — стандартный код информационного обмена США). В системе ASCII закреплены две таблицы кодирования — базовая к расширенная. Базовая таблица закрепляет значения кодов от 0 до 127, а расширенная относится к символам с номерами от 128 до 255.

Первые .32 кода базовой таблицы, начиная с нулевого, отданы производителям аппаратных средств (в первую очередь производителям компьютеров и печатающих устройств). В этой области размещаются так называемые управляющие коды, которым не соответствуют никакие символы языков, и, соответственно, эти коды не выводятся ни на экран, ни на устройства печати, но ими можно управлять тем, как производится вывод прочих данных.

Начиная с кода 32 по код 127 размещены коды символов английского алфавита, знаков препинания, цифр, арифметических действий и некоторых вспомогательных символов. Базовая таблица кодиуовки ASCII приведена в таблице 1.1. Аналогичные системы кодирования текстовых данных были разработаны и в других странах. Так, например, в СССР в этой области действовала система кодирования КОИ-7 (код обмена информацией, семизначный). Однако поддержка производителей оборудования и программ вывела американский код ASCII на уровень международного стандарта, и национальным системам кодирования пришлось «отступить» во вторую, расширенную часть системы кодирования, определяющую значения кодов со 128 по 255. Отсутствие единого стандарта в этой области привело к множественности одновременно действующих кодировок. Только в России можно указать три действующих стандарта кодировки и еще два устаревших.

Так, например, кодировка символов русского языка, известная как кодировка Windows-1251, была введена «извне» — компанией Microsoft, но, учитывая широкое

распространение операционных систем и других продуктов этой компании в России, она глубоко закрепилась и нашла широкое распространение (таблица 1.2). Эта кодировка используется на большинстве локальных компьютеров, работающих на платформе Windows.

Другая распространенная кодировка носит название КОИ-8 (код обмена информацией, восьмизначный) — ее происхождение относится ко временам действия Совета Экономической Взаимопомощи государств Восточной Европы (таблица1.3). Сегодня кодировка КОИ-8 имеет широкое распространение в компьютерных сетях на территории России и в российском секторе Интернет».

Международный стандарт, в котором предусмотрена кодировка символов русского алфавита, носит название кодировки /50 (International Standard Organization — Международный институт стандартизации). На практике данная кодировка используется редко (таблица 1.4).

На компьютерах, работающих в операционных системах MS-DOS, могут действовать еще две кодировки (кодировка ГОСТ и кодировка ГОСТ-альтернативная). Первая из них считалась устаревшей даже в первые годы появления персональной вычислительной техники, но вторая используется и по сей день (см. таблицу 1.5).

В связи с изобилием систем кодирования текстовых данных, действующих в России, возникает задача межсистемного преобразования данных — это одна из распространенных задач информатики.

1.4.4 Универсальная система кодирования текстовых данных

Если проанализировать организационные трудности, связанные с созданием единой системш кодирования текстовых данных, то можно прийти к выводу, что они вызваны ограниченным набором кодов (256). В то же время очевидно, что если, например, кодировать символы не восьмиразрядными двоичными числами, а числами с большим количеством разрядов, то и диапазон возможных значений кодов станет намного больше. Такая система, основанная на 16-разрядном кодировании символов, получила название универсальной — UNICODE.Unicode (Юникод или Уникод, англ. Unicode) — стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков. Юникод имеет несколько форм представления: UTF-8, UTF-16 (UTF-16BE, UTF-16LE) и UTF-32 (UTF-32BE, UTF-32LE). Была разработана также форма представления UTF-7 для передачи по семибитным каналам, но из-за несовместимости с ASCII она не получила распространения и не включена в стандарт. В MicrosoftWindows NT и основанных на ней системах Windows 2000 и Windows XP в основном используется форма UTF-16LE. В UNIX-подобных операционных системах GNU/Linux, BSD и Mac OS X принята форма UTF-8 для файлов и UTF-32 или UTF-8 для обработки символов в оперативной памяти.

Стандарт предложен в 1991 году некоммерческой организацией «Консорциум Юникода» (англ. Unicode Consortium), объединяющей крупнейшие IT-корпорации. Применение этого стандарта позволяет закодировать очень большое число символов из разных письменностей: в документах Unicode могут соседствовать китайские иероглифы, математические символы, буквы греческого алфавита и кириллицы, при этом становятся ненужными кодовые страницы.

Коды в стандарте Unicode разделены на несколько областей. Область с кодами от U+0000 до U+007F содержит символы набора ASCII с соответствующими кодами. Далее расположены области знаков различных письменностей, знаки пунктуации и технические символы. Часть кодов зарезервирована для использования в будущем. Под символы кириллицы выделены коды от U+0400 до U+052F.Шестнадцать разрядов позволяют обеспечить уникальные коды для 65 536 различных символов — этого поля достаточно для размещения в одной таблице символов большинства языков планеты.

Несмотря на тривиальную очевидность такого подхода, простой механический переход на данную систему долгое время сдерживался из-за недостаточных ресурсов средств вычислительной техники (в системе кодирования UNICODE все текстовые документы автоматически становятся вдвое длиннее). Во второй половине 90-х годов технические средства достигли необходимого уровня обеспеченности ресурсами, и сегодня мы наблюдаем постепенный перевод документов и программных средств на универсальную систему кодирования. Для индивидуальных пользователей это еще больше добавило забот по согласованию документов, выполненных в разных системах кодирования, с программными средствами, но это надо понимать как трудности переходного периода.

1.4.5 Кодирование графических данных

Если рассмотреть с помощью увеличительного стекла черно-белое графическое изображение, напечатанное в газете или книге, то можно увидеть, что оно состоит из мельчайших точек, образующих характерный узор, называемый растром (рисунок. 1.3).

Поскольку линейные координаты и индивидуальные свойства каждой точки (яркость) можно выразить с помощью целых чисел, то можно сказать, что растровое кодирование позволяет использовать двоичный код для представления графических данных. Общепринятым на сегодняшний день считается представление черно-белых иллюстраций в виде комбинации точек с 256 градациями серого цвета, и, таким образом, для кодирования яркости любой точки обычно достаточно восьмиразрядного двоичного числа.

Для кодирования цветных графических изображений применяется принцип декомпозиции произвольного цвета на основные составляющие. В качестве таких составляющих используют три основные цвета: красный (Red, R), зеленый (Green, G) и синий (Blue, В). На практике считаемся (хотя теоретически это не совсем так), что любой цвет, видимый человеческим глазом, можно получить путем механического смешения этих трех основных цветов. Такая система кодирования называется системой RGB по первым буквам названий основных цветов.

Если для кодирования яркости каждой из основных составляющих использовать по 256 значений (восемь двоичных разрядов), как это принято для полутоновых черно-белых изображений, то на кодирование цвета одной точки надо затратить 24 разряда. При этом система кодирования обеспечивает однозначное определение 16,5 млн различных цветов, что на самом деле близко к чувствительности человеческого глаза. Режим представления цветной графики с использованием 24 двоичных разрядов называется полноцветным (True Color).

Каждому из основных цветов можно поставить в соответствие дополнительный цвет, то есть цвет, дополняющий основной цвет до белого. Нетрудно заметить, что для любого из основных цветов дополнительным будет цвет, образованный суммой пары остальных основных цветов. Соответственно, дополнительными цветами являются: голубой (Cyan, С), пурпурный (Magenta., М) и желтый (yellow, Y). Принцип декомпозиции произвольного цвета на составляющие компоненты можно применять не только для основных цветов, но и для дополнительных, то есть любой цвет можно представить в виде суммы голубой, пурпурной и желтой составляющей. Такой метод кодирования цвета принят в полиграфии, но в полиграфии используется еще и четвертая краска — черная (Black, К). Поэтому данная система кодирования обозначается четырьмя буквами CMYK (черный цвет обозначается буквой К, потому, что буква В уже занята синим цветом), и для представления цветной графики в этой системе надо иметь 32 двоичных разряда. Такой режим тоже называется полноцветным (True Color).

Если уменьшить количество двоичных разрядов, используемых для кодирования цвета каждой точки, то можно сократить объем данных, но при этом диапазон кодируемых цветов заметно сокращается. Кодирование цветной графики 16-разрядными двоичными числами называется режимом High Color.

При кодировании информации о цвете с помощью восьми бит данных можно передать только 256 цветовых оттенков. Такой метод кодирования цвета называется индексным. Смысл названия в том, что, поскольку 256 значений совершенно недостаточно, чтобы передать весь диапазон цветов, доступный человеческому глазу, код каждой точки растра выражает не цвет сам по себе, а только его номер (индекс) в некоей справочной таблице, называемой палитрой. Разумеется, эта палитра должна прикладываться к графическим данным — без нее нельзя воспользоваться методами воспроизведения информации на экране или бумаге (то есть, воспользоваться, конечно, можно, но из-за неполноты данных полученная информация не будет адекватной: листва на деревьях может оказаться красной, а небо — зеленым).

1.4.6 Кодирование звуковой информации

Приемы и методы работы со звуковой информацией пришли в вычислительную технику наиболее поздно. К тому же, в отличие от числовых, текстовых и графических данных, у звукозаписей не было столь же длительной и проверенной истории кодирования. В итоге методы кодирования звуковой информации двоичным кодом далеки от стандартизации. Множество отдельных компаний разработали свои корпоративные стандарты, но если говорить обобщенно, то можно выделить два основных направления.

Метод FM (Frequency Modulation) основан на том, что теоретически любой сложный звук можно разложить на последовательность простейших гармонических сигналов разных частот, каждый из которых представляет собой правильную синусоиду, а следовательно, может быть описан числовыми параметрами, то есть кодом. В природе звуковые сигналы имеют непрерывный спектр, то есть являются аналоговыми. Их разложение в гармонические ряды и представление в виде дискретных цифровых сигналов выполняют специальные устройства — аналогово-цифровые преобразователи (АЦП). Обратное преобразование для воспроизведения звука, закодированного числовым кодом, выполняют цифро-аналоговые преобразователи (ЦАП). При таких преобразованиях неизбежны потери информации, связанные с методом кодирования, поэтому качество звукозаписи обычно получается не вполне удовлетворительным и соответствует качеству звучания простейших электромузыкальных инструментов с окрасом, характерным для электронной музыки. В то же время данный метод кодирования обеспечивает весьма компактный код, и потому он нашел применение еще в те годы, когда ресурсы средств вычислительной техники были явно недостаточны.

Метод таблично-волнового ( Wave-Table) синтеза лучше соответствует современному уровню развития техники. Если говорить упрощенно, то можно сказать, что где-то в заранее подготовленных таблицах хранятся образцы звуков для множества различных музыкальных инструментов (хотя не только для них). В технике такие образцы называют сэмплами. Числовые коды выражают тип инструмента, номер его модели, высоту тона, продолжительность и интенсивность звука, динамику его изменения, некоторые параметры среды, в которой происходит звучание, а также прочие параметры, характеризующие особенности звука. Поскольку в качестве образцов используются «реальные» звуки, то качество звука, полученного в результате синтеза, получается очень высоким и приближается к качеству звучания реальных музыкальных инструментов.

1.5 Основные структуры данных

Работа с большими наборами данных автоматизируется проще, когда данные упорядочены, то есть образуют заданную структуру. Существует три основных типа структур данных: линейная, иерархическая и табличная. Их можно рассмотреть на примере обычной книги.

Если разобрать книгу на отдельные листы и перемешать их, книга потеряет свое назначение. Она по-прежнему будет представлять набор данных, но подобрать адекватный метод для получения из нее информации весьма непросто. (Еще хуже дело будет обстоять, если из книги вырезать каждую букву отдельно — в этом случае вряд ли вообще найдется адекватный метод для ее прочтения.) Если же собрать все листы книги в правильной последовательности, мы получим простейшую структуру данных — линейную. Такую книгу уже можно читать, хотя для поиска нужных данных ее придется прочитать подряд, начиная с самого начала, что не.всегда удобно. Для быстрого поиска данных существует иерархическая структура. Так, например, книги разбивают на части, разделы, главы, параграфы и т. п. Элементы структуры низкого уровня входят в элементы структуры более высокого уровня: разделы состоят из глав, главы из параграфов и т. д. Для больших массивов поиск данных в иерархической структуре намного проще, чем в линейной, однако и здесь необходима навигаиия, связанная с необходимостью просмотра. На практике задачу упрощают тем, что в большинстве книг есть вспомогательная перекрестная таблица, связывающая элементы иерархической структуры с элементами линейной структуры, то есть связывающая разделы, главы и параграфы с номерами страниц. В книгах с простой иерархической структурой, рассчитанных на последовательное чтение, эту таблицу принято называть оглавлением, а в книгах со сложной структурой, допускающей выборочное чтение, ее называют содержанием.

1.5.1 Линейные структуры (списки данных, векторы данных)

Линейные структуры — это хорошо знакомые нам списки. Список — это простейшая структура данных, отличающаяся тем, что каждый элемент данных однозначно определяется своим номером в массиве. Проставляя номера на отдельных страницах рассыпанной книги, мы создаем структуру списка. Обычный журнал посещаемости занятий, например, имеет структуру списка, поскольку все студенты группы зарегистрированы в нем под своими уникальными номерами. Мы называем номера уникальными потому, что в одной группе не могут быть зарегистрированы два студента с одним и тем же номером.

При создании любой структуры данных надо решить два вопроса: как разделять элементы данных между собой и как разыскивать нужные элементы. В журнале посещаемости, например, это решается так: каждый новый элемент списка зано- сится с новой строки, то есть разделителем является конец строки. Тогда нужный элемент можно разыскать по номеру строки.

N п/п Фамилия, Имя, Отчество

1 Аистов Александр Алексеевич

2 Бобров Борис Борисович

3 Воробьева Валентина Владиславовна

27 Сорокин Сергей Семенович

Разделителем может быть и какой-нибудь специальный символ. Нам хорошо известны разделители между словами — это пробелы. В русском и во многих европейских языках общепринятым разделителем предложений является точка. В рассмотренном нами классном журнале в качестве разделителя можно использовать любой символ, который не встречается в самих данных, например символ «*». Тогда наш список выглядел бы так:

Аистов Александр Алексеевич * Бобров Борис Борисович * Воробьева Валентина Владиславовна *… * Сорокин Сергей Семенович

В этом случае для розыска элемента с номером га надо просмотреть список начиная с самого начала и пересчитать встретившиеся разделители. Когда будет отсчитано я-1 разделителей, начнется нужный элемент. Он закончится, когда будет встречен следующий разделитель.

Еще проще можно действовать, если все элементы списка имеют равную длину. В этом случае разделители в списке вообще не нужны. Для розыска элемента с номером п надо просмотреть список с самого начала и отсчитать а(га-1) символ, где а — длина одного элемента. Со следующего символа начнется нужный элемент. Его длина тоже равна а, поэтому его конец определить нетрудно. Такие упрощенные списки, состоящие из элементов равной длины, называют векторами данных. Работать с ними особенно удобно.Таким образом, линейные структуры данных (списки) — это упорядоченные структуры, в которых адрес элемента однозначно определяется его номером.

1.5.1 Табличные структуры (таблицы данных, матрицы данных)

С таблицами данных мы тоже хорошо знакомы, достаточно вспомнить всем известную таблицу умножения. Табличные структуры отличаются от списочных тем, что элементы данных определяются адресом ячейки, который состоит не из одного параметра, как в списках, а из нескольких. Для таблицы умножения, например, адрес ячейки определяется номерами строки и столбца. Нужная ячейка находится на их пересечении, а элемент выбирается из ячейки. При хранении табличных данных количество разделителей должно быть больше, чем для данных, имеющих структуру списка. Например, когда таблицы печатают в книгах, строки и столбцы разделяют графическими элементами — линиями вертикальной и горизонтальной разметки (рисунок. 1.4)

Планета Расстояние Относительная Количество до а.е. Солнца, масса спутников

Меркурий 0,39 0,056 0

Венера 0,67 0,88 0

Земля 1,0 1,0 1

Марс 1,51 0,1 2

Юпитер 5,2 318 16

Рисунок. 1.4. В двумерных таблицах, которые печатают в книгах, применяется два типа разделителей — вертикальные и горизонтальные

Если нужно сохранить таблицу в виде длинной символьной строки, используют один символ-разделитель между элементами, принадлежащими одной строке, и другой разделитель для отделения строк, например так:

Меркурий*0,39*0,056*0#Венера*0167*0,88*0#Земля*110*1,0*1#Марс*1,51*0,1*2#...

Для розыска элемента, имеющего адрес ячейки (т, и), надо просмотреть набор данных с самого начала и пересчитать внешние разделители. Когда будет отсчитан тп-1 разделитель, надо пересчитывать внутренние разделители. После того как будет найден п-\ разделитель, начнется нужный элемент. Он закончится, когда будет встречен любой очередной разделитель.

Еще проще можно действовать, если все элементы таблицы имеют равную длину. Такие таблицы называют матрицами. В данном случае разделители не нужны, поскольку все элементы имеют равную длину и количество их известно. Для розыска элемента с адресом (т, п) в матрице, имеющей М строк и N столбцов, надо просмотреть ее с самого начала и отсчитать a [N(m -1) + (п -1)] символ, где а — длина одного элемента. Со следующего символа начнется нужный элемент. Его длина тоже равна а, поэтому его конец определить нетрудно.Таким образом, табличные структуры данных (матрицы) — это упорядоченные структуры, в которых адрес элемента определяется номером строки и номером столбца, на пересечении которых находится ячейка, содержащая искомый элемент.

Многомерные таблицы. Выше мы рассмотрели пример таблицы, имеющей два измерения (строка и столбец), но в жизни нередко приходится иметь дело с таблицами, у которых количество измерений больше. Вот пример таблицы, с помощью которой может быть организован учет учащихся.

Номер факультета: 3

Номер курса (на факультете): 2

Номер специальности (на курсе): 2

Номер группы в потоке одной специальности: 1

Номер учащегося в группе: 19

Размерность такой таблицы равна пяти, и для однозначного отыскания данных об учащемся в подобной структуре надо знать все пять параметров (координат).

1.5.2 Иерархические структуры данных

Нерегулярные данные, которые трудно представить в виде списка или таблицы, часто представляют в виде иерархических структур. С подобными структурами мы очень хорошо знакомы по обыденной жизни. Иерархическую структуру имеет система почтовых адресов. Подобные структуры также широко применяют в научных систематизации и всевозможных классификациях (рисунок. 1.5).

Рисунок 1.5 Пример иерархической структуры данных

В иерархической структуре адрес каждого элемента определяется путем доступа (маршрутом), ведущим от вершины структуры к данному элементу. Вот, например, как выглядит путь доступа к команде, запускающей программу Калькулятор (стандартная программа компьютеров, работающих в операционной системе Windows 98):

Пуск > Программы > Стандартные > Калькулятор.

Дихотомия данных. Основным недостатком иерархических структур данных является увеличенный размер пути доступа. Очень часто бывает так, что длина маршрута оказывается больше, чем длина самих данных, к которым он ведет. Поэтому в информатике применяют методы для регуляризации иерархических структур с тем, чтобы сделать путь доступа компактным. Один из методов получил название дихотомии. Его суть понятна из примера, представленного на (рисунок. 1.6).

В иерархической структуре, построенной методом дихотомии, путь доступа к любому элементу можно представить как путь через рациональный лабиринт с поворотами налево (0) или направо (1) и, таким образом, выразить путь доступа в виде компактной двоичной записи. В нашем примере путь доступа к текстовому процессору Word 2000 выразится следующим двоичным числом: 1010.

Рисунок. 1.6. Пример, поясняющий принцип действия метода дихотомии

1.5.3 Упорядочение структур данных

Списочные и табличные структуры являются простыми. Ими легко пользоваться, поскольку адрес каждого элемента задается числом (для списка), двумя числами (для двумерной таблицы) или несколькими числами для многомерной таблицы. Они также легко упорядочиваются. Основным методом упорядочения является сортировка. Данные можно сортировать по любому избранному критерию, например: по алфавиту, по возрастанию порядкового номера или по возрастанию какого-либо параметра.

Несмотря на многочисленные удобства, у простых структур данных есть и недостаток — их трудно обновлять. Если, например, перевести студента из одной группы в другую, изменения надо вносить сразу в два журнала посещаемости; при этом в обоих журналах будет нарушена списочная структура. Если переведенного студента вписать в конец списка группы, нарушится упорядочение по алфавиту, а если его вписать в соответствии с алфавитом, то изменятся порядковые номера всех студентов, которые следуют за ним.

Таким образом, при добавлении произвольного элемента в упорядоченную стрщтуру списка может происходить изменение адресных данныху других элементов. В журналах успеваемости это пережить нетрудно, но в системах, выполняющих автоматическую обработку данных, нужны специальные методы для решения этой проблемы.

Иерархические структуры данных по форме сложнее, чем линейные и табличные, но они не создают проблем с обновлением данных. Их легко развивать путем создания новых уровней. Даже если в учебном заведении будет создан новый факультет, это никак не отразится на пути доступа к сведениям об учащихся прочих факультетов.

Недостатком иерархических структур является относительная трудоемкость записи адреса элемента данных и сложность упорядочения. Часто методы упорядочения в таких структурах основывают на предварительной индексации, которая заключается в том, что каждому элементу данных присваивается свой уникальный индекс, который можно использовать при поиске, сортировке и т. п. Ранее рассмотренный принцип дихотомии на самом деле является одним из методов индексации данных в иерархических структурах. После такой индексации данные легко разыскиваются по двоичному коду связанного с ними индекса.

Адресные данные. Если данные хранятся не как попало, а в организованной структуре (причем любой), то каждый элемент данных приобретает новое свойство (параметр), который можно назвать адресом. Конечно, работать с упорядоченными данными удобнее, но за это приходится платить их размножением, поскольку адреса элементов данных — это тоже данные, и их тоже надо хранить и обрабатывать.

Заключение

Данные являются незаменимой частью в развитии человечества так к

www.ronl.ru

Реферат - Реферат по информатике что такое «реферат»

Добрые советы: КАК НАПИСАТЬ РЕФЕРАТ ПО ИНФОРМАТИКЕ

Что такое «реферат», и зачем он нужен?

РЕФЕРАТ – краткое изложение в письменном виде результатов какого-либо научного исследования, книги или статьи. Как правило, в учебном процессе используется обзорный или тематический реферат, который строится на изложении теоретических положений по поставленной преподавателем или выбранной самостоятельно теме. Реферат является подготовительным этапом, приучая вас, ребята, к самостоятельной работе с различными источниками информации. В том случае, если тема реферата особенно актуальна и интересна для широких ученических и педагогических масс, то на его основе в дальнейшем, при более глубоком изучении, может быть построена исследовательская работа и (или) создана мультимедийная презентация, и уже с этим всем можно будет потягаться в знаниях на «Фестивале проектов» с другими учащимися.

Сразу хочу предостеречь всех, кто пожелает скачать готовую работу из интернета: я тоже знаю, где находятся эти сайты с рефератами и знакома с содержанием большинства работ! Как правило, подобные работы я даже не рассматриваю! А еще есть программа «Антиплагиат»! В общем, любителям «халявы» – просьба не беспокоиться!

«Из чего же, из чего же, из чего же…?»

Как правило, реферат состоит из трех частей – это введение, основная часть и заключение. Так же реферат должен содержать в своей структуре содержание (оглавление) и список используемых источников и литературы. Необязательным (но порой очень нужным и наглядным!) элементом является приложение (а может быть и не одно!).

«С какого конца подойти?»

Подходить нужно с начала, а не с конца! А началом в данном случае будет вовсе не написание введения к вашему реферату!

При написании реферата перед вами встают следующие задачи:

1. Уяснить тему (то есть понять ее смысл!) и определить основные направления ее изучения.

2. Подобрать список источников и литературы, на базе которых будет строиться изучение темы.

3. Сделать краткий конспект изучаемых источников и литературы (можно сделать ксерокопии и уже в них отметить основные моменты).

4. Выявить проблему рассматриваемой темы.

5. Составить план работы, то есть определить содержание основных глав или пунктов в основной части работы (обычно 2-х-4-х глав (пунктов) бывает достаточно).

6. Подобрать материал на основе составленных конспектов, скомпоновать черновой вариант реферата. Мой личный опыт: если я использую ксерокопии книг, то беспощадно режу их ножницами, отбрасывая ненужное. Всё остальное (нужное!) приклеиваю на лист в нужном мне порядке, как аппликацию. Получается толсто и лохмато, зато потом очень помогает!

^ А вот теперь заходим «с конца»:

7. Подготовить введение к реферату, в котором необходимо отметить актуальность темы, проблему, цель и задачи. Сам текст введения может быть построен по-разному, в зависимости от темы, изучаемого предмета и имеющегося в распоряжении материала.

Так, введение может быть построено «от себя», то есть по принципу «мною было изучено то-то …». Введение может носить историко-описательный характер, то есть рассматриваться вопрос возникновения и динамики событий, на основе которых раскрывается актуальность темы реферата. Также может быть сделан обзор библиографической базы исследования, проведена дискуссия по изучаемой теме, или какому-либо одному вопросу, с указанием мнений авторов, используемых источников – в данном случае актуальность будет обусловлена спорностью суждений по предмету и объекту исследования. Вариантов  множество, поэтому ваши возможности в выборе стиля написания введения не ограничены.

8. На основе изученного материала составляется заключение, которое является выводом по проделанной работе. В заключении должно быть отмечено решение обозначенной проблемы и даны ответы на все поставленные во введении вопросы (вопросами, рассматриваемыми в работе, являются цель и задачи).

9. Весь найденный и написанный материал переносится в компьютер либо при помощи сканера, либо простым набором в текстовом редакторе. Главное, соблюдайте требования ГОСТа для оформления документа!

10. Текст реферата тщательно проверяется, устраняются орфографические и синтаксические ошибки, корректируются смысловые неточности, расставляются сноски на источники и используемую литературу.

^ Советы:

Проблема, заявленная вами для исследования в реферате, должна занять свое почетное место во введении. Как правило, проблема определяет и актуальность темы. Цель работы определяется, исходя из направления исследования и является основным вопросом, на который необходимо получить ответ и сделать выводы в заключении. То есть, проблема и цель исследования должны протянуться сквозь всю работу тоненькой красной ниточкой – ненавязчиво, но четко удерживать логику и порядок изложения материала.

После подготовки введения необходимо отредактировать текст работы, начиная от опечаток и заканчивая стилистическими ошибками. Текст работы должен быть написан в одном стиле, с логическими переходами между пунктами и подпунктами. После каждого пункта (главы) нужно сделать выводы – это, во-первых, приведет в восторг меня, вашего преподавателя, и, во-вторых, станет базой для подготовки заключения.

Теперь пришло время для окончательной расстановки и корректировки ссылок на источники и используемую литературу.

На основе выводов по главам (пунктам) составляется заключение в соответствии с задачами работы и заключительной фразой в конце заключения, являющейся итогом проделанной работы и отвечающей на вопрос, определенный целью работы.

Теперь остается распечатать работу. Не забудьте обязательно сделать титульный лист для работы – ведь это ваше лицо! Аккуратно сшейте работу с помощью брошюратора (или мультифор и скоросшивателя). Работа готова – можно сдавать!  Желаю успеха!

www.ronl.ru

Информатика Реферат

КОНТРОЛЬНАЯ РАБОТА по информатике

Отчет по контрольной работе предоставляется в печатном и электронном виде.

Оформление реферата в редакторе Word

1. Набрать русский текст или взять готовым из любого документа, объем текста – не менее 10 страниц. Содержание реферата - по индивидуальной теме по своему варианту.

2.Оформить титульный лист по требованиям высшего учебного заведения.

3.Отформатировать текст с использованием стилей по заданным параметрам:

Абзац – Times New Roman, 12, правый и левый край абзацев - ровный, красная строка – 10 мм, межстрочный интервал – 1,5. Если слово не помещается в конце строки, то оно автоматически должно переносится на следующую строку (автопереносы слов в абзацах дол жны быть включены).

Параметры страницы: Формат – А4, по ля сверху – 20 мм, снизу – 20 мм, справа – 20 мм, слева – 25 мм. Вставить номера страниц – внизу по центру. Слева и справа от номера страницы – короткое тире.

4. Создать стили на все типы используемых абзацев и отформатировать текст по абзацам в соответствии с созданными стилями. Например, стиль «Основной текст» - это все абзацы, оформленные по требованиям пункта 3, ст или «Заголовок1», «Заголовок2», «Заголовок3» - это абзацы названий глав, параграфов и подпараграфов для пункта 9, стиль «Название таблицы» - это оформление названия таблиц для пункта 5, стиль «Подпись рисунка» - это оформление названий рисунков для пунктов 7 и 8, стиль «Литература» - это оформление списка литературы для пункта 11 и т.п.

5. В тексте должна присутствовать таблица, отформатировать и заполнить (не менее 5 колонок и не менее 10 строк ). В структуре таблицы должны быть объединенные ячейки. Уметь располагать текст в таблице по вертикали.

6. Набрать матем атические и х имические формулы в разных частях текста . Формулы дол ж- ны быть достаточно сложные, например:

ì

 

 

 

 

 

 

 

ï

 

 

 

 

 

 

 

ïòòòx 2 dx,

 

 

 

для x £ 0,

ï

 

~

 

 

 

 

ï

x

 

 

 

для x Î(0,5),

y = ícos(x ),

 

 

 

ï

 

x

+ 5

x

 

,

для x ³ 5.

ï

 

 

 

 

 

 

n

 

 

ï

 

 

 

 

 

x - å fi

(x)

 

 

ï

 

 

î

 

i=1

 

 

 

 

7. В работе должна присутствовать хотя бы одна страница, повернутая горизонтально (ал ь- бомная), на которой расположена таблица, и одна страница, также повернутая горизонтал ьно, на которой расположен р исунок.

8. Вставить в текст рисунки (рисунки должны быть пронумерованы и иметь название и нумерацию).

9. Создать автоматическое оглавление (содержание) для 2 -3уровней, используя стандартные стили. Разместить содержание в нач ало текста.

Заголовки первого уровня начинаются с новой страницы ( Arial 14, прописные, полужи рные, по центру, интервал после заголовка 12 пт). Заголовки вт орого и третьего уровня – Arial 13, по левому краю, полужирные, Интервал до заголовка – 12 пт, интервал после заголовка 6 пт). Если слово не помещается в конце заголовка, то оно не должно автоматически должно перен осится на следующую строку (автоперено сы слов в заголовках должны быть выключены).

Пример заполнения содержания:

Введение (Заголовок 1 уровня, стиль – Заголовок 1)

1. Простейшие операции в WORD (Заголовок 1 уровня, стиль – Заголовок 1) 1. 1. Открытие документов (Заголовок 2 уровня, стиль – Заголовок 2)

1. 1. 1. Открытие док умента (Заголовок 3 уровня, стиль – Заголовок 3) 1. 1. 2. От ображение списка последних докуме нтов

1. 2. Создание нового документа (Заголовок 2 уровня, стиль – Заголовок 2) 1. 2. 1 . Создание нового документа

1.2. 2. Создание шаблона

1.3. Сохранение и закрыти е документов

2.Форматирование

2.1. Форматирование символов

2.2. Форматирование абзацев

3.Работа с таблицами

Заключение (Заголовок 1 уровня, стиль – Заголовок 1) Список указателей (Заголовок 1 уровня, ст иль – Заголовок 1) Список литературы (Заголовок 1 уровня, стиль – Заголовок 1)

10.Создать не менее пяти сносок (примечаний) внизу страницы , которые встречаются на нескольких страницах текста.

11.В конце текста р асположить список указателей наиболее ч асто встречающихся терминов

втексте и автоматически нумерующийся сп исок литературы.

studfiles.net


Смотрите также