Реферат: Семантические основы социальной информатики. Реферат семантическая информация


Реферат - Семантические основы социальной информатики

Тема 2

Семантические основы социальной информатики

Информология- общая теория информации. Часто понятие «информация» используют, не задумываясь о глубине его содержания, отождествляя понятия знание, данные, информация. Очевидно, что «обиходное» употребление термина «информация» совершенно неуместно, когда речь идет о теории или теориях информации. Нередко в этих теоретических построениях термин «информация» наполнен разным смыслом, а следовательно, сами теории высвечивают лишь часть граней некоторой системы знаний, которую можно назвать общей теорией информации или «информологией» — наукой о процессах и задачах передачи, распределения, обработки и преобразования информации.

Возникновение информологии как науки можно отнести к концу 50-х годов нашего столетия, когда американским инженером Р. Хартли была сделана попытка ввести количественную меру информации, передаваемой по каналам связи. Рассмотрим простую игровую ситуацию. До получения сообщения о результате подбрасывания монеты человек находится в состоянии неопределенности относительно исхода очередного броска. Сообщение партнера дает информацию, снимающее эту неопределенность. Заметим, что число возможных исходов в описанной ситуации равно 2, они равноправны (равновероятны) и каждый раз передаваемая информация полностью снимала возникавшую неопределенность. Хартли принял «количество информации», передаваемое по каналу связи относительно двух равноправных исходов и снимающее неопределенность путем оказания на один из них, за единицу информации, получившую название «бит».

Создатель статистической теории информации К. Шеннон обобщил результат Хартли и его предшественников. Его труды явились ответом на бурное развитие в середине века средств связи: радио, телефона, телеграфа, телевидения. Теория информации Шеннона позволяла ставить и решать задачи об оптимальном кодировании передаваемых сигналов с целью повышения пропускной способности каналов связи, подсказывала пути борьбы с помехами на линиях и т.д.

В работах Хартли и Шеннона информация возникает перед нами лишь в своей внешней оболочке, которая представлена отношениями сигналов, знаков, сообщений друг к другу — синтаксическими отношениями. Количественная мера Хартли-Шеннона не претендует на оценку содержательной (семантической) или ценностной, полезной (прагматической) сторон передаваемого сообщения.

Новый этап теоретического расширения понятия информации связан с кибернетикой — наукой об управлении и связи в живых организмах, обществе и машинах. Оставаясь на позициях шенноновского подхода, кибернетика формулирует принцип единства информации и управления, который особенно важен для анализа сути процессов, протекающих в самоуправляющихся, самоорганизующихся биологических и социальных системах. Развитая в работах Н. Винера концепция предполагает, что процесс управления в упомянутых системах является процессом переработки (преобразования) некоторым центральным устройством информации, получаемой от источников первичной информации (сенсорных рецепторов) и передачи ее в те участки системы, где она воспринимается ее элементами как приказ для выполнения того или иного действия. По совершении самого действия сенсорные рецепторы готовы к передаче информации об изменившейся ситуации для выполнения нового цикла управления. Так организуется циклический алгоритм (последовательность действий) управления и циркуляции информации в системе. При этом важно, что главную роль играет здесь содержание информации, передаваемой рецепторами и центральным устройством. Информация, по Винеру — это «обозначение содержания, полученного из внешнего мира в процессе нашего приспособления к нему и приспособления к нему наших чувств» .

Таким образом, кибернетическая концепция подводит к необходимости оценить информацию как некоторое знание, имеющее одну ценностную меру по отношению к внешнему миру (семантический аспект) и другую по отношению к получателю, накопленному им знанию, познавательным целям и задачам (прагматический аспект).

Попытки построить модели понятия информации, охватывающие семантический аспект знания, содержащегося в некотором высказывании относительно обозначаемого объекта, привели к созданию ряда так называемых логико-семантических теорий (Р. Карнап, И. Бар-Хиллел, Дж. Г. Кемени, Е.К. Войшвилло и др.). В них информация рассматривается как уменьшение или устранение неопределенности. Естественно предположить, что средствами какого-либо языка с помощью создаваемых в нем высказываний можно описать некоторую совокупность возможных ситуаций, состояний, альтернатив. Семантическая информация, содержащаяся в каком-либо высказывании, исключает некоторые альтернативы. Чем больше альтернатив исключает высказывание, тем большую семантическую информацию оно несет. Так, например, одна из возможных совокупностей ситуаций может быть описана следующим образом: «все тела при нагревании расширяются». Высказывание «металлы при нагревании расширяются» исключает все альтернативы в которых речь может идти о неметаллах. Семантическая сила высказывания может быть оценена отношением все тела(все металлы). Еще более информативным будет высказывание «железо при нагревании расширяется», так как оно исключает все альтернативы, кроме одной.

При всем многообразии логико-семантических теорий им присущи общие черты, они указывают путь решения трех связанных друг с другом проблем: определения совокупности возможных альтернатив средствами выбранного языка, количественной оценки альтернатив, их относительного сопоставления (взвешивания), введения меры семантической информации.

В рассмотренных теоретических конструкциях — статистической и семантической информации — речь шла о потенциальной возможности извлечь из передаваемого сообщения какие-либо сведения. Вместе с тем в процессах информационного обмена очень часто складываются ситуации, в которых мощность или качество информации, воспринимаемое приемником, зависит от того, насколько он подготовлен к ее восприятию.

Понятие тезауруса является фундаментальным в теоретической модели семантической теории информации, предложенной Ю.А. Шрейдером и учитывающей в явной форме роль приемника. Согласно этой модели, тезаурус — это знания приемника информации о внешнем мире, его способность воспринимать те или иные сообщения. Представим себе, что до получения телеграммы «Встречай завтра рейс СУ172» мы из вчерашнего разговора по междугороднему телефону уже знали о предстоящем приезде своего родственника или друга, а наведя справки, узнали и номер авиарейса, с которым он может прибыть в город. Наш тезаурус уже содержал информацию, заключенную в телеграмме. Следовательно он не изменился с ее получением и семантическая ценность этой информации оказалась нулевой.

Очевидно, что к подобной оценке семантического содержания информации примешивается семантический аспект, скрытый в изначальной «установке» тезауруса на осмысление принимаемого сообщения.

В прагматических концепциях информации этот аспект является центральным, что приводит к необходимости учитывать ценность, полезность, эффективность, экономичность информации, т.е. те ее качества, которые определяющим образом влияют на поведение самоорганизующихся, самоуправляющихся, целенаправленных кибернетических систем (биологических, социальных, человеко-машинных).

Одним из ярких представителей прагматических теорий информации является поведенческая модель коммуникации — бихевиористская модель Акоффа-Майлса. Исходным в этой модели является целевая устремленность получателя информации на решение конкретной проблемы. Получатель находится в «целеустремленном состоянии», если он стремится к чему-нибудь и имеет альтернативные пути неодинаковой эффективности для достижения цели. Сообщение, переданное получателю иформативно, если оно изменяет его «целеустремленное состояние».

Так как «целеустремленное состояние» характеризуется последовательностью возможных действий (альтернатив), эффективностью действия и значимостью результата, то передаваемое получателю сообщение может оказывать воздействие на все три компонента в различной степени. В соответствии с этим передаваемая информация различается по типам на «информирующую», «инструктирующую» и «мотивирующую». Таким образом, для получателя прагматическая ценность сообщения состоит в том, что оно позволяет ему наметить стратегию поведения при достижении цели построением ответов на вопросы: что, как и почему делать на каждом очередном шаге? Для каждого типа информации бихевиористская модель предлагает

свою меру, а общая прагматическая ценность информации определяется как функция разности этих количеств в «целеустремленном состоянии» до и после его изменения на новое «целеустремленное состояние».

Следующим этапом в развитии прагматических теорий информации явились работы американского логика Д. Харраха, построившего логико-прагматическую модель коммуникации. Одной из слабостей бихевиористской модели является ее неподготовленность к оценке ложных сообщений. Модель Харраха предполагает учет общественного характера человеческой коммуникации. В соответствии с ней получаемые сообщения должны быть сначала подвергнуты обработке, после которой выделяются сообщения «годные к употреблению». Именно с совокупности годных к употреблению сообщений должны быть применены критерии прагматической ценности.

Теория информации «в смысле Шеннона» возникла как средство решения конкретных прикладных задач в области передачи сигналов по каналам связи. Поэтому, по-существу, она являлась и является прикладной информационной наукой. Семейство таких наук, специально изучающих информационные процессы в том или ином их специфическом содержании и форме, во второй половине нашего века растет довольно быстро. Это — кибернетика, теория систем, документалистика, лингвистика, символическая логика и др. Стержнем, объединяющим все эти исследования, служит общая теория информации -«информология», в основу которой и положены синтаксические, семантические и прагматические концепции информации.

Формализация знаний: методы и приемы. Их эффективность, сравнительный анализ[1]. При поиске наиболее удобных, рациональных средств и форм информационного обмена человек чаще всего сталкивается с проблемой компактного и однозначного представления знаний.

Представление знаний это процесс, конечная цель которого поместить некоторый объем знаний в своеобразную " упаковку" в которой он может начать движение по каналам информационного обмена, дойти до получателя, или задержаться в пунктах хранения знаний. Такой упаковкой может быть фраза устной речи, письмо, книга, справочник, географическая карта, кроссворд, картина и т.п.

Каждый вид упаковки имеет свои особенности, но всем им присуще одно качество, хотя и не в одинаковой степени: упаковка призвана обеспечить сохранность вложенного знания. Причем не только и не столько физическую, сколько смысловую (семантическую). Для этого необходимо, чтобы отправитель и получатель информации упакованных знаний пользовались некоторой общей системой правил для их представления и восприятия. Назовем такую систему правил формализмом представления знаний.

Самым естественным, подходящим для человека формализмом является язык ( устная речь и письменность). Без знаний, без постоянной работы по их упаковке в языковые конструкции язык мертв. Он живет и развивается благодаря творческой энергии человека, благодаря тому, что человеческая мысль постоянно и настойчиво ищет выхода в выраженную в языке форму. Всякую ли мысль или знание можно выразить в языковой форме? По-видимому, нет. Например, существуют десятки различных определений понятий здоровье, интеллект, мышление, информация и т.п. Отмечая эту ограниченность выразительных средств языка, Ф. Энгельс писал:" Дефиниции не имеют значения для науки, потому что они всегда оказываются недостаточными". Мысль, которую нельзя выразить в языковой конструкции, не может быть включена в информационный обмен. Общение людей, таким образом, осуществляется с помощью языка как формы представления знаний. Одному и тому же содержательному

знанию можно придать различную словесную или текстовую форму. Это очень сильно проявляется, например, в художественной прозе, поэзии и т.д. Богатство языка это и богатство культуры того или иного народа.

Вместе с тем, в некоторых областях деятельности людей это богатство и разнообразие выразительных средств естественного языка становится скорее недостатком, чем достоинством. Например, слова команды должны быть короткими, резкими, иметь однозначный смысл, иначе не получится согласованных и четких совместных действий подчиненных. В специальных отраслях науки формируются специфические языковые системы, являющиеся как бы " сужением " естественного языка. Особо выделяется язык математики, как некоторая основа изложения системы знаний в точных, естественных науках. Свой язык имеют химия, физика, философия и т.д.

Целесообразность применения таких суженных языковых систем (диалектов), позволяет повысить надежность процессов информационного обмена, т.к. возможность неправильного истолкования передаваемой информации снижается. При этом, конечно, сужается и круг получателей, поскольку для восприятия информации необходимо владеть соответствующим диалектом. Главные достоинства суженного языка — возможность создавать и использовать типовые, «стандартные » упаковки знаний, а также в значительной мере снять полисемию ( смысловую многозначность), присутс

твующую в естественном языке.

Полисемия — враг информационного обмена, фактор внесения искажения и ошибок ( семантического шума) на пути передачи информации. Поэтому устранение многозначности является одним из наиболее важных направлений в разработке формальных приемов представления знаний. Создание языка науки или языка деловой прозы, называемого часто " концеляритом ", является естественным шагом на этом пути, огромной работой общества на протяжении ряда столетий. Сопоставление этой подсистемы естественного языка с литературным языком показывает насколько они различны по характеристикам, определяющим их выразительную способность.

Так «канцелярит» предназначен для объективизации изложения информации, использует, как правило, переводимые категории и языковые формы, лишен синонимии, оперирует конкретными фактами и понятиями, информативен (в противоположность информационной избыточности), ему присуща логичность, он по характеру алгебраичен (мысль, информация, знание развернуты в последовательность слов и предложений, постепенно формируясь в полном, законченном виде к завершению текста). Все эти свойства не являются обязательными для языка литературы, которому свойственна субъективность форм, возможность применения непереводимых конструкций, бесконечно богатая синонимия, образность (геометричность) высказываний и т.д.

Дальнейшее продвижение в сторону формализации знаний приводит к понятиям класс и классификация. Классификация — распределение предметов, объектов и понятий по группам (классам) по обнаруженным свойствам. В любой складывающейся науке одним из первых принципов являлся принцип систематизации знаний. Поэтому классификация как метод научной систематики сразу же стала играть важную роль в формировании ядра знаний того или иного научного направления. Достаточно вспомнить классификационную систему К. Линнея в ботанике, систематику живых организмов и т.п. Классификационные системы такого типа имеют выраженную иерархическую структуру, в силу которой все объекты (понятия, факты) разделены на уровни, связанные между собой отношением «старший — младший»: тип, класс, отряд, семейство, род, вид.

Примером классификации такого типа где родо-видовые отношения пронизывают всю структуру соответствующих знаний может служить известная «табель о рангах», введенная Петром 1 в 1722 г. Табель о рангах подразделяла чины на 14 рангов. Каждому чину соответствовала определенная должность. Первые 6 рангов статской и придворной служб и первый обер-офицерский чин в армии давали право на получение потомственного дворянства, что способствовало формированию дворянской бюрократии.

Мы видим на этом примере, что классификация может проявить себя не только как инструмент организации научных знаний, но и как фактор социального порядка. Поэтому существующие системы тарифов и ставок, ученых степеней и званий, структура должностей и служебных постов в гражданской службе и армии играют не только организующую, но и стимулирующую роль. Подобная модель знаний получила в науке и практике название " иерархической". Ее достоинства в том, что она проста в освоении, легко поддерживается в рабочем состоянии (легко пополняется и «чистится»), эффективно решает задачу разнесения новых понятий по иерархическим уровням.

Недостатки иерархической модели знаний: — прямые связи между понятиями соседних уровней обозначены слабо, или вовсе отсутствуют; — иерархическая классификация наиболее эффективна в тех случаях, когда при переходе от уровня к уровню работает один и тот же тип отношений, например, родо-видовой.

Систематика, лежащая в основе классификации может применяться как сильное средство направленного исследовательского поиска. Так, иногда оказывается полезным при рассмотрении группы объектов несколько каких-либо характерных для них признаков выделить в качестве определяющих и ввести некоторую меру степени проявления данных признаков. Такой подход называется морфологическим, так как использует идею разложения некоего объекта на его части (признаки). Часто подобная группировка приводит к выявлению закономерностей связывающих объекты каждой группы, которые до этого не были известны.

Благодаря такому подходу Д.И.Менделеев открыл знаменитый периодический закон. Подчеркивая доминирующую роль выделенного им признака он писал: "… по смыслу всех точных сведений о явлениях природы масса вещества есть именно такое свойство его, от которого должны находиться в зависимости все остальные свойства… Поэтому ближе или естественнее всего искать зависимости между свойствами и сходствами элементов, с одной стороны, и атомными их весами, с другой " .

Морфологический метод осуществляет как бы анатомическое исследование объектов, понятий, значений путем расчленения целого на характерные, существенные части. Его цель — выяснение роли частного в целостной картине, систематизация знаний о данной реальности, составление гипотез о возможных вариантах новых (еще не данных) знаний. Упомянутые выше недостатки иерархической модели данных свойственны и морфологическим моделям. Их удается устранить используя так называемые ветвящиеся (древовидные) структуры (модели) представления знаний. Отдельные понятия, факты, знания, связаны между собой отношениями, выражающими суть имеющихся между ними связей. Как в иерархической модели это могут быть родо-видовые отношения, но так же и другие типы отношений: «быть представителем», «иметь», «наследовать» и т.п. Однозначность связей в древовидной структуре и разнообразие охватываемых ею отношений позволяет повысить «динамизм» системы знаний. Действительно, система знаний, представленных иерархической или морфологической моделями статична, или, как говорят, декларативна.

В древовидной структуре можно прослеживать восходящие и нисходящие ветви связей получая формулы дедуктивного (от частного к общему), индуктивного (от общего к частному) и индуктивно-дедуктивного выводов.

Например: " растение может быть цветком по имени роза"; «роза — цветок, часть растения»; «роза — цветок, имеющий лепестки».

Благодаря такой организации представленные знания получают как дополнение к декларативности процедуральность, т.е. способность к выводу общих знаний из структуры отношений и понятий. Древовидная структура знаний, несмотря на простоту и распространенность в обиходе информационного обмена, все-таки довольно специфична. В ней, как и в предыдущей модели знаний, заложена парадигма иерархичности. В тоже время внутреннее «мироустройство» некоторой системы знаний может не соответствовать этой парадигме.

Рассмотрим в качестве примера понятие «трудовой коллектив». Совокупность знаний, описывающих конкретный трудовой коллектив, чрезвычайно разнообразна, или, как говорят, многоаспектна. Между аспектами часто не удается установить отношений иерархии (род-вид), хотя связь между ними имеет место. Вот один из возможных аспектов: все представители трудового коллектива могут быть включены по алфавиту в список с указанием против фамилии и имени каждого работника табельного номера, года рождения, образования, специальности, разряда, стажа работы и т.п. Назовем этот список — «Список 1».

Другой аспект: все члены коллектива работают на условиях сдельной оплаты и величина их заработка определяется на основе т.н. тарифной сетки. Поэтому, составив список специальностей и разрядов с указанием стоимости одного часа рабочего времени, мы формируем некоторое представление знаний о системе оплаты труда членов данного коллектива. Назовем этот список — «Список 2».

Третий аспект: при начислении зарплаты каждому работнику мы должны учитывать его фактическую выработку на протяжении некоторого периода работы (например за месяц). Значит третий список, составляемый, скажем, мастером участка это список, состоящий из табельных номеров и фактически проработанного работником времени. Это — «Список 3».

Понятно, что все три списка содержат необходимый объем знаний о трудовом коллективе, если речь идет о начислении заработной платы. Подобные модели представления знаний, состоящие из связанных друг с другом списочных структур, получили название реляционных.

В реляционных моделях удается представить более сложные области знаний. В них каждый из аспектов может рассматриваться как некоторый автономный блок внутри которого допускается производить изменения, не затрагивая других областей и не внося при этом противоречий в общую картину знаний. Удобным средством является комбинация устойчивых и изменяемых знаний. Так знания, выраженные Списком 2 длительно устойчивы.

В Списке 1 представлены знания, которые могут меняться с течением времени- текучесть кадров, изменение квалификации и т.п. Список 3 обновляется каждый раз, когда возникает необходимость очередного расчета.

Не вызывает принципиальных трудностей задача пополнения реляционной модели новыми знаниями путем расширения уже имеющихся списков и добавления новых списочных структур.

В приведенном примере мы рассмотрели лишь задачу определения величины заработка. Но, по-видимому ясно, что реляционные модели включа

ющие достаточное по содержанию и количеству число списочных структур

создают возможность для решения большого количества разнообразных задач каждая из которых является по существу задачей извлечения из общей суммы вложенных в модель знаний нужного конкретного знания по интере

сующему получателя вопросу.

Существуют и другие формализмы представления знаний, кроме перечисленных выше иерархических, морфологических, древовидных и реляционных моделей. Так, например, промежуточным между древовидной и реляционной моделью являются так называемые семантические сети. С их помощью между понятиями, фактами, знаниями устанавливаются связи — отношения.

Они как бы являются обобщением древовидных моделей т.к. отличаются от последних снятием требований иерархичности. В то же время семантические сети могут считаться частным случаем реляционных моделей, т.к.

именно из них могут быть построены связанные списочные структуры, когда понятие являющееся узлом семантической сети расширяется в список, а соответствующее отношение с другим списком из единичного становится групповым.

Все описанные приемы формализации знаний направлены на создание некоторой устойчивой «несущей конструкции» на которую может быть одета оболочка системы конкретных знаний. В случае, если между отправителем и получателем знаний достигнуто понимание, взаимная договоренность относительно этой несущей конструкции, то информационный обмен приобретает необходимую регламентирующую основу, что решающим образом повышает его эффективность.

Информационная технология. Под традиционной информационной технологией, как правило, понимается информационная технология на базе «жестских алгоритмов». Под новой информационной технологией, как правило, понимается информационная технология на базе «мягких алгоритмов», с использованием достижений искусственного интеллекта.

Материя, энергия, информация, знания — связь понятий(2). Исходной посылкой является утверждение, что информация является семантической сущностью материи. Понятие «материя» отождествляется с понятием «система», в которую входят составными элементами — вещество, энергия, знания и информация. Эти элементы в соответствии с законом сохранения материи поддерживают систему в равновесном состоянии путем взаимных переходов из одной в другую субстанцию системы(рис. ниже). При взаимодействии этих элементов системы вещество выступает носителем знания, а энергия — носителем информации.

М А Т Е Р И Я

Вещество Энергия

Знания Информация

Информация, данные, знания — соотношение понятий. Информация — всеобщее свойство материи, проявляющееся в кибернетических коммуникативных процессах. Данные — это сведения, служащие для какого-либо вывода и возможного решения. Они могут храниться, передаваться, но не выступать в качестве информации. Знания — это результат познавательной деятельности, система приобретенных с ее помощью понятий о действительности.

Соотношение понятий информация, данные, знания. Может быть предложена следующая соответствующая логической связи указанных понятий образная цепочка[3] — зерно, мука, хлеб. Информация всегда носит «транспортный» оттенок передачи знания по сетям связи, знание же всегда связано с личностью его создателя.

Проблематика искусственного интеллекта. Массовая информатизация общества невозможна без ЭВМ с интеллектуальным(дружественным) интерфейсом, базирующемся на достижениях искусственного интеллекта (ИИ).

От исследований в области ИИ отделилось направление инженерии знаний

— выявление, структурирование, формализация знаний для разработки интеллектуальных систем, систем, основанных на знаниях, или экспертных систем(ЭС). ЭС — это компьютерные системы, аккумулирующие знания экспертов и фундаментальные знания в той или иной предметной области, обладающие способностью к логическим выводам и выступающие в качестве электронных консультантов для лиц, принимающих решения. Системы, базирующиеся на знаниях различных предметных областей (базы знаний), сегодня пользуются огромным спросом в мире. Так объем их продаж в 1990 г. составил 30-40 млн.$, а 1993 г. — 207 млн.$ и продолжает стремительно расти. Что же осталось в области исследований И.И., так сказать, в узком смысле слова? 1. «Мягкие» вычисления. «Жесткие» вычисления — это работа по алгоритмам, «мягкие» же вычисления — это вычисления, при которых могут быть и новые задачи, и случайное нахождение того, что нужно. Таким образом, речь идет об эволюционных алгоритмах, моделировании эволюционных процессов. 2. Когнитивная графика(пифограм

ма). Это не иллюстративная графика, а графика, порождающая новые решения(познавательная графика). Глаз оператора фиксирует некоторую закономерность светового пятна — это снимается далее с ЭВМ как заготовка будущего решения, т.е. когнитивная графика является визуальным изображением математики. 3. Виртуальная реальность. Средства информационной технологии и, в частности, человеко-машинного интерфейса, позволяют создать «виртуальный мир» — искусственное трехмерное пространство.

Первой фирмой виртуальной реальности явилась VPL Research(США), основанная в 1984 г. Джероном Леньером, автором самого термина «виртуальная реальность». 4. Моделирование человеческих рассуждений(прикладные семиотические системы). Основная проблема в том, что человеческие рассуждения не есть система.

В данной теме были рассмотрены категории и понятия теоретической информатики, без которых невозможен анализ информационных процессов в обществе, в дальнейших темах будут рассмотрены категории и понятия собственно социальной информатики.

Литература:

1. Дубровский Е.Н. Информационно-обменные процессы как факторы эволюции общества. М.: МГСУ, 1996. 2. Шемакин Ю.И. Теоретическая информатика. М.: МГСУ, 1995. 3. Соколов А.В. Феномен информатики и псевдофеномен информации // Вестник ВОИВТ, 1990, ј 3, с.45-51.

www.ronl.ru

Семантические основы социальной информатики - реферат

Тема 2

Семантические основы социальной информатики

Информология- общая теория информации. Часто понятие "информация" используют, не задумываясь о глубине его содержания, отождествляя понятия знание, данные, информация. Очевидно, что "обиходное" употребление термина "информация" совершенно неуместно, когда речь идет о теории или теориях информации. Нередко в этих теоретических построениях термин "информация" наполнен разным смыслом, а следовательно, сами теории высвечивают лишь часть граней некоторой системы знаний, которую можно назвать общей теорией информации или "информологией" - наукой о процессах и задачах передачи, распределения, обработки и преобразования информации.

Возникновение информологии как науки можно отнести к концу 50-х годов нашего столетия, когда американским инженером Р. Хартли была сделана попытка ввести количественную меру информации, передаваемой по каналам связи. Рассмотрим простую игровую ситуацию. До получения сообщения о результате подбрасывания монеты человек находится в состоянии неопределенности относительно исхода очередного броска. Сообщение партнера дает информацию, снимающее эту неопределенность. Заметим, что число возможных исходов в описанной ситуации равно 2, они равноправны (равновероятны) и каждый раз передаваемая информация полностью снимала возникавшую неопределенность. Хартли принял "количество информации", передаваемое по каналу связи относительно двух равноправных исходов и снимающее неопределенность путем оказания на один из них, за единицу информации, получившую название "бит".

Создатель статистической теории информации К. Шеннон обобщил результат Хартли и его предшественников. Его труды явились ответом на бурное развитие в середине века средств связи: радио, телефона, телеграфа, телевидения. Теория информации Шеннона позволяла ставить и решать задачи об оптимальном кодировании передаваемых сигналов с целью повышения пропускной способности каналов связи, подсказывала пути борьбы с помехами на линиях и т.д.

В работах Хартли и Шеннона информация возникает перед нами лишь в своей внешней оболочке, которая представлена отношениями сигналов, знаков, сообщений друг к другу - синтаксическими отношениями. Количественная мера Хартли-Шеннона не претендует на оценку содержательной (семантической) или ценностной, полезной (прагматической) сторон передаваемого сообщения.

Новый этап теоретического расширения понятия информации связан с кибернетикой - наукой об управлении и связи в живых организмах, обществе и машинах. Оставаясь на позициях шенноновского подхода, кибернетика формулирует принцип единства информации и управления, который особенно важен для анализа сути процессов, протекающих в самоуправляющихся, самоорганизующихся биологических и социальных системах. Развитая в работах Н. Винера концепция предполагает, что процесс управления в упомянутых системах является процессом переработки (преобразования) некоторым центральным устройством информации, получаемой от источников первичной информации (сенсорных рецепторов) и передачи ее в те участки системы, где она воспринимается ее элементами как приказ для выполнения того или иного действия. По совершении самого действия сенсорные рецепторы готовы к передаче информации об изменившейся ситуации для выполнения нового цикла управления. Так организуется циклический алгоритм (последовательность действий) управления и циркуляции информации в системе. При этом важно, что главную роль играет здесь содержание информации, передаваемой рецепторами и центральным устройством. Информация, по Винеру - это "обозначение содержания, полученного из внешнего мира в процессе нашего приспособления к нему и приспособления к нему наших чувств" .

Таким образом, кибернетическая концепция подводит к необходимости оценить информацию как некоторое знание, имеющее одну ценностную меру по отношению к внешнему миру (семантический аспект) и другую по отношению к получателю, накопленному им знанию, познавательным целям и задачам (прагматический аспект).

Попытки построить модели понятия информации, охватывающие семантический аспект знания, содержащегося в некотором высказывании относительно обозначаемого объекта, привели к созданию ряда так называемых логико-семантических теорий (Р. Карнап, И. Бар-Хиллел, Дж. Г. Кемени, Е.К. Войшвилло и др.). В них информация рассматривается как уменьшение или устранение неопределенности. Естественно предположить, что средствами какого-либо языка с помощью создаваемых в нем высказываний можно описать некоторую совокупность возможных ситуаций, состояний, альтернатив. Семантическая информация, содержащаяся в каком-либо высказывании, исключает некоторые альтернативы. Чем больше альтернатив исключает высказывание, тем большую семантическую информацию оно несет. Так, например, одна из возможных совокупностей ситуаций может быть описана следующим образом: "все тела при нагревании расширяются". Высказывание "металлы при нагревании расширяются" исключает все альтернативы в которых речь может идти о неметаллах. Семантическая сила высказывания может быть оценена отношением все тела(все металлы). Еще более информативным будет высказывание "железо при нагревании расширяется", так как оно исключает все альтернативы, кроме одной.

При всем многообразии логико-семантических теорий им присущи общие черты, они указывают путь решения трех связанных друг с другом проблем: определения совокупности возможных альтернатив средствами выбранного языка, количественной оценки альтернатив, их относительного сопоставления (взвешивания), введения меры семантической информации.

В рассмотренных теоретических конструкциях - статистической и семантической информации - речь шла о потенциальной возможности извлечь из передаваемого сообщения какие-либо сведения. Вместе с тем в процессах информационного обмена очень часто складываются ситуации, в которых мощность или качество информации, воспринимаемое приемником, зависит от того, насколько он подготовлен к ее восприятию.

Понятие тезауруса является фундаментальным в теоретической модели семантической теории информации, предложенной Ю.А. Шрейдером и учитывающей в явной форме роль приемника. Согласно этой модели, тезаурус - это знания приемника информации о внешнем мире, его способность воспринимать те или иные сообщения. Представим себе, что до получения телеграммы "Встречай завтра рейс СУ172" мы из вчерашнего разговора по междугороднему телефону уже знали о предстоящем приезде своего родственника или друга, а наведя справки, узнали и номер авиарейса, с которым он может прибыть в город. Наш тезаурус уже содержал информацию, заключенную в телеграмме. Следовательно он не изменился с ее получением и семантическая ценность этой информации оказалась нулевой.

Очевидно, что к подобной оценке семантического содержания информации примешивается семантический аспект, скрытый в изначальной "установке" тезауруса на осмысление принимаемого сообщения.

В прагматических концепциях информации этот аспект является центральным, что приводит к необходимости учитывать ценность, полезность, эффективность, экономичность информации, т.е. те ее качества, которые определяющим образом влияют на поведение самоорганизующихся, самоуправляющихся, целенаправленных кибернетических систем (биологических, социальных, человеко-машинных).

Одним из ярких представителей прагматических теорий информации является поведенческая модель коммуникации - бихевиористская модель Акоффа-Майлса. Исходным в этой модели является целевая устремленность получателя информации на решение конкретной проблемы. Получатель находится в "целеустремленном состоянии", если он стремится к чему-нибудь и имеет альтернативные пути неодинаковой эффективности для достижения цели. Сообщение, переданное получателю иформативно, если оно изменяет его "целеустремленное состояние".

Так как "целеустремленное состояние" характеризуется последовательностью возможных действий (альтернатив), эффективностью действия и значимостью результата, то передаваемое получателю сообщение может оказывать воздействие на все три компонента в различной степени. В соответствии с этим передаваемая информация различается по типам на "информирующую", "инструктирующую" и "мотивирующую". Таким образом, для получателя прагматическая ценность сообщения состоит в том, что оно позволяет ему наметить стратегию поведения при достижении цели построением ответов на вопросы: что, как и почему делать на каждом очередном шаге? Для каждого типа информации бихевиористская модель предлагает

свою меру, а общая прагматическая ценность информации определяется как функция разности этих количеств в "целеустремленном состоянии" до и после его изменения на новое "целеустремленное состояние".

Следующим этапом в развитии прагматических теорий информации явились работы американского логика Д. Харраха, построившего логико-прагматическую модель коммуникации. Одной из слабостей бихевиористской модели является ее неподготовленность к оценке ложных сообщений. Модель Харраха предполагает учет общественного характера человеческой коммуникации. В соответствии с ней получаемые сообщения должны быть сначала подвергнуты обработке, после которой выделяются сообщения "годные к употреблению". Именно с совокупности годных к употреблению сообщений должны быть применены критерии прагматической ценности.

Теория информации "в смысле Шеннона" возникла как средство решения конкретных прикладных задач в области передачи сигналов по каналам связи. Поэтому, по-существу, она являлась и является прикладной информационной наукой. Семейство таких наук, специально изучающих информационные процессы в том или ином их специфическом содержании и форме, во второй половине нашего века растет довольно быстро. Это - кибернетика, теория систем, документалистика, лингвистика, символическая логика и др. Стержнем, объединяющим все эти исследования, служит общая теория информации -"информология", в основу которой и положены синтаксические, семантические и прагматические концепции информации.

Формализация знаний: методы и приемы. Их эффективность, сравнительный анализ[1]. При поиске наиболее удобных, рациональных средств и форм информационного обмена человек чаще всего сталкивается с проблемой компактного и однозначного представления знаний.

Представление знаний это процесс, конечная цель которого поместить некоторый объем знаний в своеобразную " упаковку" в которой он может начать движение по каналам информационного обмена, дойти до получателя, или задержаться в пунктах хранения знаний. Такой упаковкой может быть фраза устной речи, письмо, книга, справочник, географическая карта, кроссворд, картина и т.п.

Каждый вид упаковки имеет свои особенности, но всем им присуще одно качество, хотя и не в одинаковой степени: упаковка призвана обеспечить сохранность вложенного знания. Причем не только и не столько физическую, сколько смысловую (семантическую). Для этого необходимо, чтобы отправитель и получатель информации упакованных знаний пользовались некоторой общей системой правил для их представления и восприятия. Назовем такую систему правил формализмом представления знаний.

Самым естественным, подходящим для человека формализмом является язык ( устная речь и письменность). Без знаний, без постоянной работы по их упаковке в языковые конструкции язык мертв. Он живет и развивается благодаря творческой энергии человека, благодаря тому, что человеческая мысль постоянно и настойчиво ищет выхода в выраженную в языке форму. Всякую ли мысль или знание можно выразить в языковой форме? По-видимому, нет. Например, существуют десятки различных определений понятий здоровье, интеллект, мышление, информация и т.п. Отмечая эту ограниченность выразительных средств языка, Ф. Энгельс писал:" Дефиниции не имеют значения для науки, потому что они всегда оказываются недостаточными". Мысль, которую нельзя выразить в языковой конструкции, не может быть включена в информационный обмен. Общение людей, таким образом, осуществляется с помощью языка как формы представления знаний. Одному и тому же содержательному

знанию можно придать различную словесную или текстовую форму. Это очень сильно проявляется, например, в художественной прозе, поэзии и т.д. Богатство языка это и богатство культуры того или иного народа.

Вместе с тем, в некоторых областях деятельности людей это богатство и разнообразие выразительных средств естественного языка становится скорее недостатком, чем достоинством. Например, слова команды должны быть короткими, резкими, иметь однозначный смысл, иначе не получится согласованных и четких совместных действий подчиненных. В специальных отраслях науки формируются специфические языковые системы, являющиеся как бы " сужением " естественного языка. Особо выделяется язык математики, как некоторая основа изложения системы знаний в точных, естественных науках. Свой язык имеют химия, физика, философия и т.д.

Целесообразность применения таких суженных языковых систем (диалектов), позволяет повысить надежность процессов информационного обмена, т.к. возможность неправильного истолкования передаваемой информации снижается. При этом , конечно, сужается и круг получателей, поскольку для восприятия информации необходимо владеть соответствующим диалектом. Главные достоинства суженного языка - возможность создавать и использовать типовые, "стандартные " упаковки знаний, а также в значительной мере снять полисемию ( смысловую многозначность), присутс

твующую в естественном языке.

Полисемия - враг информационного обмена, фактор внесения искажения и ошибок ( семантического шума) на пути передачи информации. Поэтому устранение многозначности является одним из наиболее важных направлений в разработке формальных приемов представления знаний. Создание языка науки или языка деловой прозы, называемого часто " концеляритом " , является естественным шагом на этом пути, огромной работой общества на протяжении ряда столетий. Сопоставление этой подсистемы естественного языка с литературным языком показывает насколько они различны по характеристикам, определяющим их выразительную способность.

Так "канцелярит" предназначен для объективизации изложения информации, использует, как правило, переводимые категории и языковые формы, лишен синонимии, оперирует конкретными фактами и понятиями, информативен (в противоположность информационной избыточности), ему присуща логичность, он по характеру алгебраичен (мысль, информация, знание развернуты в последовательность слов и предложений, постепенно формируясь в полном, законченном виде к завершению текста). Все эти свойства не являются обязательными для языка литературы, которому свойственна субъективность форм, возможность применения непереводимых конструкций, бесконечно богатая синонимия, образность (геометричность) высказываний и т.д.

Дальнейшее продвижение в сторону формализации знаний приводит к понятиям класс и классификация. Классификация - распределение предметов, объектов и понятий по группам (классам) по обнаруженным свойствам. В любой складывающейся науке одним из первых принципов являлся принцип систематизации знаний. Поэтому классификация как метод научной систематики сразу же стала играть важную роль в формировании ядра знаний того или иного научного направления. Достаточно вспомнить классификационную систему К. Линнея в ботанике, систематику живых организмов и т.п. Классификационные системы такого типа имеют выраженную иерархическую структуру, в силу которой все объекты (понятия, факты) разделены на уровни, связанные между собой отношением "старший - младший": тип, класс, отряд, семейство, род, вид.

Примером классификации такого типа где родо-видовые отношения пронизывают всю структуру соответствующих знаний может служить известная "табель о рангах", введенная Петром 1 в 1722 г. Табель о рангах подразделяла чины на 14 рангов. Каждому чину соответствовала определенная должность. Первые 6 рангов статской и придворной служб и первый обер-офицерский чин в армии давали право на получение потомственного дворянства, что способствовало формированию дворянской бюрократии.

Мы видим на этом примере, что классификация может проявить себя не только как инструмент организации научных знаний, но и как фактор социального порядка. Поэтому существующие системы тарифов и ставок, ученых степеней и званий, структура должностей и служебных постов в гражданской службе и армии играют не только организующую, но и стимулирующую роль. Подобная модель знаний получила в науке и практике название " иерархической". Ее достоинства в том, что она проста в освоении, легко поддерживается в рабочем состоянии (легко пополняется и "чистится"), эффективно решает задачу разнесения новых понятий по иерархическим уровням.

Недостатки иерархической модели знаний: - прямые связи между понятиями соседних уровней обозначены слабо, или вовсе отсутствуют; - иерархическая классификация наиболее эффективна в тех случаях, когда при переходе от уровня к уровню работает один и тот же тип отношений, например, родо-видовой.

Систематика, лежащая в основе классификации может применяться как сильное средство направленного исследовательского поиска. Так, иногда оказывается полезным при рассмотрении группы объектов несколько каких-либо характерных для них признаков выделить в качестве определяющих и ввести некоторую меру степени проявления данных признаков. Такой подход называется морфологическим, так как использует идею разложения некоего объекта на его части (признаки). Часто подобная группировка приводит к выявлению закономерностей связывающих объекты каждой группы, которые до этого не были известны.

Благодаря такому подходу Д.И.Менделеев открыл знаменитый периодический закон. Подчеркивая доминирующую роль выделенного им признака он писал: "...по смыслу всех точных сведений о явлениях природы масса вещества есть именно такое свойство его, от которого должны находиться в зависимости все остальные свойства ... Поэтому ближе или естественнее всего искать зависимости между свойствами и сходствами элементов, с одной стороны, и атомными их весами, с другой " .

Морфологический метод осуществляет как бы анатомическое исследование объектов, понятий, значений путем расчленения целого на характерные, существенные части. Его цель - выяснение роли частного в целостной картине, систематизация знаний о данной реальности, составление гипотез о возможных вариантах новых (еще не данных) знаний. Упомянутые выше недостатки иерархической модели данных свойственны и морфологическим моделям. Их удается устранить используя так называемые ветвящиеся (древовидные) структуры (модели) представления знаний. Отдельные понятия, факты, знания, связаны между собой отношениями, выражающими суть имеющихся между ними связей. Как в иерархической модели это могут быть родо-видовые отношения, но так же и другие типы отношений: "быть представителем", "иметь", "наследовать" и т.п. Однозначность связей в древовидной структуре и разнообразие охватываемых ею отношений позволяет повысить "динамизм" системы знаний. Действительно, система знаний, представленных иерархической или морфологической моделями статична, или, как говорят, декларативна.

В древовидной структуре можно прослеживать восходящие и нисходящие ветви связей получая формулы дедуктивного (от частного к общему), индуктивного (от общего к частному) и индуктивно-дедуктивного выводов.

Например: " растение может быть цветком по имени роза"; "роза - цветок, часть растения"; "роза - цветок, имеющий лепестки".

Благодаря такой организации представленные знания получают как дополнение к декларативности процедуральность, т.е. способность к выводу общих знаний из структуры отношений и понятий. Древовидная структура знаний, несмотря на простоту и распространенность в обиходе информационного обмена, все-таки довольно специфична. В ней, как и в предыдущей модели знаний, заложена парадигма иерархичности. В тоже время внутреннее "мироустройство" некоторой системы знаний может не соответствовать этой парадигме.

Рассмотрим в качестве примера понятие "трудовой коллектив". Совокупность знаний, описывающих конкретный трудовой коллектив, чрезвычайно разнообразна, или, как говорят, многоаспектна. Между аспектами часто не удается установить отношений иерархии (род-вид), хотя связь между ними имеет место. Вот один из возможных аспектов: все представители трудового коллектива могут быть включены по алфавиту в список с указанием против фамилии и имени каждого работника табельного номера, года рождения, образования, специальности, разряда, стажа работы и т.п. Назовем этот список - "Список 1".

Другой аспект: все члены коллектива работают на условиях сдельной оплаты и величина их заработка определяется на основе т.н. тарифной сетки. Поэтому, составив список специальностей и разрядов с указанием стоимости одного часа рабочего времени, мы формируем некоторое представление знаний о системе оплаты труда членов данного коллектива. Назовем этот список - "Список 2".

Третий аспект: при начислении зарплаты каждому работнику мы должны учитывать его фактическую выработку на протяжении некоторого периода работы (например за месяц). Значит третий список, составляемый, скажем, мастером участка это список, состоящий из табельных номеров и фактически проработанного работником времени. Это - "Список 3".

Понятно, что все три списка содержат необходимый объем знаний о трудовом коллективе, если речь идет о начислении заработной платы. Подобные модели представления знаний, состоящие из связанных друг с другом списочных структур, получили название реляционных.

В реляционных моделях удается представить более сложные области знаний. В них каждый из аспектов может рассматриваться как некоторый автономный блок внутри которого допускается производить изменения, не затрагивая других областей и не внося при этом противоречий в общую картину знаний. Удобным средством является комбинация устойчивых и изменяемых знаний. Так знания, выраженные Списком 2 длительно устойчивы.

В Списке 1 представлены знания, которые могут меняться с течением времени- текучесть кадров, изменение квалификации и т.п. Список 3 обновляется каждый раз, когда возникает необходимость очередного расчета.

Не вызывает принципиальных трудностей задача пополнения реляционной модели новыми знаниями путем расширения уже имеющихся списков и добавления новых списочных структур.

В приведенном примере мы рассмотрели лишь задачу определения величины заработка. Но, по-видимому ясно, что реляционные модели включа

ющие достаточное по содержанию и количеству число списочных структур

создают возможность для решения большого количества разнообразных задач каждая из которых является по существу задачей извлечения из общей суммы вложенных в модель знаний нужного конкретного знания по интере

сующему получателя вопросу.

Существуют и другие формализмы представления знаний, кроме перечисленных выше иерархических, морфологических, древовидных и реляционных моделей. Так, например, промежуточным между древовидной и реляционной моделью являются так называемые семантические сети. С их помощью между понятиями, фактами, знаниями устанавливаются связи - отношения.

Они как бы являются обобщением древовидных моделей т.к. отличаются от последних снятием требований иерархичности. В то же время семантические сети могут считаться частным случаем реляционных моделей, т.к.

именно из них могут быть построены связанные списочные структуры, когда понятие являющееся узлом семантической сети расширяется в список, а соответствующее отношение с другим списком из единичного становится групповым.

Все описанные приемы формализации знаний направлены на создание некоторой устойчивой "несущей конструкции" на которую может быть одета оболочка системы конкретных знаний. В случае, если между отправителем и получателем знаний достигнуто понимание, взаимная договоренность относительно этой несущей конструкции, то информационный обмен приобретает необходимую регламентирующую основу, что решающим образом повышает его эффективность.

Информационная технология. Под традиционной информационной технологией, как правило, понимается информационная технология на базе "жестских алгоритмов". Под новой информационной технологией , как правило, понимается информационная технология на базе "мягких алгоритмов", с использованием достижений искусственного интеллекта.

Материя, энергия, информация, знания - связь понятий(2). Исходной посылкой является утверждение, что информация является семантической сущностью материи. Понятие "материя" отождествляется с понятием "система", в которую входят составными элементами - вещество, энергия, знания и информация. Эти элементы в соответствии с законом сохранения материи поддерживают систему в равновесном состоянии путем взаимных переходов из одной в другую субстанцию системы(рис. ниже). При взаимодействии этих элементов системы вещество выступает носителем знания, а энергия - носителем информации.

М А Т Е Р И Я

Вещество Энергия

Знания Информация

Информация, данные, знания - соотношение понятий. Информация - всеобщее свойство материи, проявляющееся в кибернетических коммуникативных процессах. Данные - это сведения, служащие для какого-либо вывода и возможного решения. Они могут храниться, передаваться, но не выступать в качестве информации. Знания - это результат познавательной деятельности, система приобретенных с ее помощью понятий о действительности.

Соотношение понятий информация, данные, знания. Может быть предложена следующая соответствующая логической связи указанных понятий образная цепочка[3] - зерно, мука, хлеб. Информация всегда носит "транспортный" оттенок передачи знания по сетям связи , знание же всегда связано с личностью его создателя.

Проблематика искусственного интеллекта. Массовая информатизация общества невозможна без ЭВМ с интеллектуальным(дружественным) интерфейсом, базирующемся на достижениях искусственного интеллекта (ИИ).

От исследований в области ИИ отделилось направление инженерии знаний

- выявление, структурирование, формализация знаний для разработки интеллектуальных систем, систем, основанных на знаниях, или экспертных систем(ЭС). ЭС - это компьютерные системы, аккумулирующие знания экспертов и фундаментальные знания в той или иной предметной области, обладающие способностью к логическим выводам и выступающие в качестве электронных консультантов для лиц, принимающих решения. Системы, базирующиеся на знаниях различных предметных областей (базы знаний), сегодня пользуются огромным спросом в мире. Так объем их продаж в 1990 г. составил 30-40 млн.$, а 1993 г. - 207 млн.$ и продолжает стремительно расти. Что же осталось в области исследований И.И., так сказать, в узком смысле слова? 1. "Мягкие" вычисления. "Жесткие" вычисления - это работа по алгоритмам, "мягкие" же вычисления - это вычисления, при которых могут быть и новые задачи, и случайное нахождение того, что нужно. Таким образом, речь идет об эволюционных алгоритмах, моделировании эволюционных процессов. 2. Когнитивная графика(пифограм

ма). Это не иллюстративная графика, а графика, порождающая новые решения(познавательная графика). Глаз оператора фиксирует некоторую закономерность светового пятна - это снимается далее с ЭВМ как заготовка будущего решения, т.е. когнитивная графика является визуальным изображением математики. 3. Виртуальная реальность. Средства информационной технологии и, в частности, человеко-машинного интерфейса, позволяют создать "виртуальный мир" - искусственное трехмерное пространство.

Первой фирмой виртуальной реальности явилась VPL Research(США), основанная в 1984 г. Джероном Леньером, автором самого термина "виртуальная реальность". 4. Моделирование человеческих рассуждений(прикладные семиотические системы). Основная проблема в том, что человеческие рассуждения не есть система.

В данной теме были рассмотрены категории и понятия теоретической информатики, без которых невозможен анализ информационных процессов в обществе, в дальнейших темах будут рассмотрены категории и понятия собственно социальной информатики.

Литература:

1. Дубровский Е.Н. Информационно-обменные процессы как факторы эволюции общества. М.: МГСУ, 1996. 2. Шемакин Ю.И. Теоретическая информатика. М.: МГСУ, 1995. 3. Соколов А.В. Феномен информатики и псевдофеномен информации // Вестник ВОИВТ, 1990, ј 3, с.45-51.

2dip.su

Реферат: Семантические основы социальной информатики

Тема 2

Семантические основы социальной информатики

Информология- общая теория информации. Часто понятие "информация" используют, не задумываясь о глубине его содержания, отождествляя понятия знание, данные, информация. Очевидно, что "обиходное" употребление термина "информация" совершенно неуместно, когда речь идет о теории или теориях информации. Нередко в этих теоретических построениях термин "информация" наполнен разным смыслом, а следовательно, сами теории высвечивают лишь часть граней некоторой системы знаний, которую можно назвать общей теорией информации или "информологией" - наукой о процессах и задачах передачи, распределения, обработки и преобразования информации.

Возникновение информологии как науки можно отнести к концу 50-х годов нашего столетия, когда американским инженером Р. Хартли была сделана попытка ввести количественную меру информации, передаваемой по каналам связи. Рассмотрим простую игровую ситуацию. До получения сообщения о результате подбрасывания монеты человек находится в состоянии неопределенности относительно исхода очередного броска. Сообщение партнера дает информацию, снимающее эту неопределенность. Заметим, что число возможных исходов в описанной ситуации равно 2, они равноправны (равновероятны) и каждый раз передаваемая информация полностью снимала возникавшую неопределенность. Хартли принял "количество информации", передаваемое по каналу связи относительно двух равноправных исходов и снимающее неопределенность путем оказания на один из них, за единицу информации, получившую название "бит".

Создатель статистической теории информации К. Шеннон обобщил результат Хартли и его предшественников. Его труды явились ответом на бурное развитие в середине века средств связи: радио, телефона, телеграфа, телевидения. Теория информации Шеннона позволяла ставить и решать задачи об оптимальном кодировании передаваемых сигналов с целью повышения пропускной способности каналов связи, подсказывала пути борьбы с помехами на линиях и т.д.

В работах Хартли и Шеннона информация возникает перед нами лишь в своей внешней оболочке, которая представлена отношениями сигналов, знаков, сообщений друг к другу - синтаксическими отношениями. Количественная мера Хартли-Шеннона не претендует на оценку содержательной (семантической) или ценностной, полезной (прагматической) сторон передаваемого сообщения.

Новый этап теоретического расширения понятия информации связан с кибернетикой - наукой об управлении и связи в живых организмах, обществе и машинах. Оставаясь на позициях шенноновского подхода, кибернетика формулирует принцип единства информации и управления, который особенно важен для анализа сути процессов, протекающих в самоуправляющихся, самоорганизующихся биологических и социальных системах. Развитая в работах Н. Винера концепция предполагает, что процесс управления в упомянутых системах является процессом переработки (преобразования) некоторым центральным устройством информации, получаемой от источников первичной информации (сенсорных рецепторов) и передачи ее в те участки системы, где она воспринимается ее элементами как приказ для выполнения того или иного действия. По совершении самого действия сенсорные рецепторы готовы к передаче информации об изменившейся ситуации для выполнения нового цикла управления. Так организуется циклический алгоритм (последовательность действий) управления и циркуляции информации в системе. При этом важно, что главную роль играет здесь содержание информации, передаваемой рецепторами и центральным устройством. Информация, по Винеру - это "обозначение содержания, полученного из внешнего мира в процессе нашего приспособления к нему и приспособления к нему наших чувств" .

Таким образом, кибернетическая концепция подводит к необходимости оценить информацию как некоторое знание, имеющее одну ценностную меру по отношению к внешнему миру (семантический аспект) и другую по отношению к получателю, накопленному им знанию, познавательным целям и задачам (прагматический аспект).

Попытки построить модели понятия информации, охватывающие семантический аспект знания, содержащегося в некотором высказывании относительно обозначаемого объекта, привели к созданию ряда так называемых логико-семантических теорий (Р. Карнап, И. Бар-Хиллел, Дж. Г. Кемени, Е.К. Войшвилло и др.). В них информация рассматривается как уменьшение или устранение неопределенности. Естественно предположить, что средствами какого-либо языка с помощью создаваемых в нем высказываний можно описать некоторую совокупность возможных ситуаций, состояний, альтернатив. Семантическая информация, содержащаяся в каком-либо высказывании, исключает некоторые альтернативы. Чем больше альтернатив исключает высказывание, тем большую семантическую информацию оно несет. Так, например, одна из возможных совокупностей ситуаций может быть описана следующим образом: "все тела при нагревании расширяются". Высказывание "металлы при нагревании расширяются" исключает все альтернативы в которых речь может идти о неметаллах. Семантическая сила высказывания может быть оценена отношением все тела(все металлы). Еще более информативным будет высказывание "железо при нагревании расширяется", так как оно исключает все альтернативы, кроме одной.

При всем многообразии логико-семантических теорий им присущи общие черты, они указывают путь решения трех связанных друг с другом проблем: определения совокупности возможных альтернатив средствами выбранного языка, количественной оценки альтернатив, их относительного сопоставления (взвешивания), введения меры семантической информации.

В рассмотренных теоретических конструкциях - статистической и семантической информации - речь шла о потенциальной возможности извлечь из передаваемого сообщения какие-либо сведения. Вместе с тем в процессах информационного обмена очень часто складываются ситуации, в которых мощность или качество информации, воспринимаемое приемником, зависит от того, насколько он подготовлен к ее восприятию.

Понятие тезауруса является фундаментальным в теоретической модели семантической теории информации, предложенной Ю.А. Шрейдером и учитывающей в явной форме роль приемника. Согласно этой модели, тезаурус - это знания приемника информации о внешнем мире, его способность воспринимать те или иные сообщения. Представим себе, что до получения телеграммы "Встречай завтра рейс СУ172" мы из вчерашнего разговора по междугороднему телефону уже знали о предстоящем приезде своего родственника или друга, а наведя справки, узнали и номер авиарейса, с которым он может прибыть в город. Наш тезаурус уже содержал информацию, заключенную в телеграмме. Следовательно он не изменился с ее получением и семантическая ценность этой информации оказалась нулевой.

Очевидно, что к подобной оценке семантического содержания информации примешивается семантический аспект, скрытый в изначальной "установке" тезауруса на осмысление принимаемого сообщения.

В прагматических концепциях информации этот аспект является центральным, что приводит к необходимости учитывать ценность, полезность, эффективность, экономичность информации, т.е. те ее качества, которые определяющим образом влияют на поведение самоорганизующихся, самоуправляющихся, целенаправленных кибернетических систем (биологических, социальных, человеко-машинных).

Одним из ярких представителей прагматических теорий информации является поведенческая модель коммуникации - бихевиористская модель Акоффа-Майлса. Исходным в этой модели является целевая устремленность получателя информации на решение конкретной проблемы. Получатель находится в "целеустремленном состоянии", если он стремится к чему-нибудь и имеет альтернативные пути неодинаковой эффективности для достижения цели. Сообщение, переданное получателю иформативно, если оно изменяет его "целеустремленное состояние".

Так как "целеустремленное состояние" характеризуется последовательностью возможных действий (альтернатив), эффективностью действия и значимостью результата, то передаваемое получателю сообщение может оказывать воздействие на все три компонента в различной степени. В соответствии с этим передаваемая информация различается по типам на "информирующую", "инструктирующую" и "мотивирующую". Таким образом, для получателя прагматическая ценность сообщения состоит в том, что оно позволяет ему наметить стратегию поведения при достижении цели построением ответов на вопросы: что, как и почему делать на каждом очередном шаге? Для каждого типа информации бихевиористская модель предлагает

свою меру, а общая прагматическая ценность информации определяется как функция разности этих количеств в "целеустремленном состоянии" до и после его изменения на новое "целеустремленное состояние".

Следующим этапом в развитии прагматических теорий информации явились работы американского логика Д. Харраха, построившего логико-прагматическую модель коммуникации. Одной из слабостей бихевиористской модели является ее неподготовленность к оценке ложных сообщений. Модель Харраха предполагает учет общественного характера человеческой коммуникации. В соответствии с ней получаемые сообщения должны быть сначала подвергнуты обработке, после которой выделяются сообщения "годные к употреблению". Именно с совокупности годных к употреблению сообщений должны быть применены критерии прагматической ценности.

Теория информации "в смысле Шеннона" возникла как средство решения конкретных прикладных задач в области передачи сигналов по каналам связи. Поэтому, по-существу, она являлась и является прикладной информационной наукой. Семейство таких наук, специально изучающих информационные процессы в том или ином их специфическом содержании и форме, во второй половине нашего века растет довольно быстро. Это - кибернетика, теория систем, документалистика, лингвистика, символическая логика и др. Стержнем, объединяющим все эти исследования, служит общая теория информации -"информология", в основу которой и положены синтаксические, семантические и прагматические концепции информации.

Формализация знаний: методы и приемы. Их эффективность, сравнительный анализ[1]. При поиске наиболее удобных, рациональных средств и форм информационного обмена человек чаще всего сталкивается с проблемой компактного и однозначного представления знаний.

Представление знаний это процесс, конечная цель которого поместить некоторый объем знаний в своеобразную " упаковку" в которой он может начать движение по каналам информационного обмена, дойти до получателя, или задержаться в пунктах хранения знаний. Такой упаковкой может быть фраза устной речи, письмо, книга, справочник, географическая карта, кроссворд, картина и т.п.

Каждый вид упаковки имеет свои особенности, но всем им присуще одно качество, хотя и не в одинаковой степени: упаковка призвана обеспечить сохранность вложенного знания. Причем не только и не столько физическую, сколько смысловую (семантическую). Для этого необходимо, чтобы отправитель и получатель информации упакованных знаний пользовались некоторой общей системой правил для их представления и восприятия. Назовем такую систему правил формализмом представления знаний.

Самым естественным, подходящим для человека формализмом является язык ( устная речь и письменность). Без знаний, без постоянной работы по их упаковке в языковые конструкции язык мертв. Он живет и развивается благодаря творческой энергии человека, благодаря тому, что человеческая мысль постоянно и настойчиво ищет выхода в выраженную в языке форму. Всякую ли мысль или знание можно выразить в языковой форме? По-видимому, нет. Например, существуют десятки различных определений понятий здоровье, интеллект, мышление, информация и т.п. Отмечая эту ограниченность выразительных средств языка, Ф. Энгельс писал:" Дефиниции не имеют значения для науки, потому что они всегда оказываются недостаточными". Мысль, которую нельзя выразить в языковой конструкции, не может быть включена в информационный обмен. Общение людей, таким образом, осуществляется с помощью языка как формы представления знаний. Одному и тому же содержательному

знанию можно придать различную словесную или текстовую форму. Это очень сильно проявляется, например, в художественной прозе, поэзии и т.д. Богатство языка это и богатство культуры того или иного народа.

Вместе с тем, в некоторых областях деятельности людей это богатство и разнообразие выразительных средств естественного языка становится скорее недостатком, чем достоинством. Например, слова команды должны быть короткими, резкими, иметь однозначный смысл, иначе не получится согласованных и четких совместных действий подчиненных. В специальных отраслях науки формируются специфические языковые системы, являющиеся как бы " сужением " естественного языка. Особо выделяется язык математики, как некоторая основа изложения системы знаний в точных, естественных науках. Свой язык имеют химия, физика, философия и т.д.

Целесообразность применения таких суженных языковых систем (диалектов), позволяет повысить надежность процессов информационного обмена, т.к. возможность неправильного истолкования передаваемой информации снижается. При этом , конечно, сужается и круг получателей, поскольку для восприятия информации необходимо владеть соответствующим диалектом. Главные достоинства суженного языка - возможность создавать и использовать типовые, "стандартные " упаковки знаний, а также в значительной мере снять полисемию ( смысловую многозначность), присутс

твующую в естественном языке.

Полисемия - враг информационного обмена, фактор внесения искажения и ошибок ( семантического шума) на пути передачи информации. Поэтому устранение многозначности является одним из наиболее важных направлений в разработке формальных приемов представления знаний. Создание языка науки или языка деловой прозы, называемого часто " концеляритом " , является естественным шагом на этом пути, огромной работой общества на протяжении ряда столетий. Сопоставление этой подсистемы естественного языка с литературным языком показывает насколько они различны по характеристикам, определяющим их выразительную способность.

Так "канцелярит" предназначен для объективизации изложения информации, использует, как правило, переводимые категории и языковые формы, лишен синонимии, оперирует конкретными фактами и понятиями, информативен (в противоположность информационной избыточности), ему присуща логичность, он по характеру алгебраичен (мысль, информация, знание развернуты в последовательность слов и предложений, постепенно формируясь в полном, законченном виде к завершению текста). Все эти свойства не являются обязательными для языка литературы, которому свойственна субъективность форм, возможность применения непереводимых конструкций, бесконечно богатая синонимия, образность (геометричность) высказываний и т.д.

Дальнейшее продвижение в сторону формализации знаний приводит к понятиям класс и классификация. Классификация - распределение предметов, объектов и понятий по группам (классам) по обнаруженным свойствам. В любой складывающейся науке одним из первых принципов являлся принцип систематизации знаний. Поэтому классификация как метод научной систематики сразу же стала играть важную роль в формировании ядра знаний того или иного научного направления. Достаточно вспомнить классификационную систему К. Линнея в ботанике, систематику живых организмов и т.п. Классификационные системы такого типа имеют выраженную иерархическую структуру, в силу которой все объекты (понятия, факты) разделены на уровни, связанные между собой отношением "старший - младший": тип, класс, отряд, семейство, род, вид.

Примером классификации такого типа где родо-видовые отношения пронизывают всю структуру соответствующих знаний может служить известная "табель о рангах", введенная Петром 1 в 1722 г. Табель о рангах подразделяла чины на 14 рангов. Каждому чину соответствовала определенная должность. Первые 6 рангов статской и придворной служб и первый обер-офицерский чин в армии давали право на получение потомственного дворянства, что способствовало формированию дворянской бюрократии.

Мы видим на этом примере, что классификация может проявить себя не только как инструмент организации научных знаний, но и как фактор социального порядка. Поэтому существующие системы тарифов и ставок, ученых степеней и званий, структура должностей и служебных постов в гражданской службе и армии играют не только организующую, но и стимулирующую роль. Подобная модель знаний получила в науке и практике название " иерархической". Ее достоинства в том, что она проста в освоении, легко поддерживается в рабочем состоянии (легко пополняется и "чистится"), эффективно решает задачу разнесения новых понятий по иерархическим уровням.

Недостатки иерархической модели знаний: - прямые связи между понятиями соседних уровней обозначены слабо, или вовсе отсутствуют; - иерархическая классификация наиболее эффективна в тех случаях, когда при переходе от уровня к уровню работает один и тот же тип отношений, например, родо-видовой.

Систематика, лежащая в основе классификации может применяться как сильное средство направленного исследовательского поиска. Так, иногда оказывается полезным при рассмотрении группы объектов несколько каких-либо характерных для них признаков выделить в качестве определяющих и ввести некоторую меру степени проявления данных признаков. Такой подход называется морфологическим, так как использует идею разложения некоего объекта на его части (признаки). Часто подобная группировка приводит к выявлению закономерностей связывающих объекты каждой группы, которые до этого не были известны.

Благодаря такому подходу Д.И.Менделеев открыл знаменитый периодический закон. Подчеркивая доминирующую роль выделенного им признака он писал: "...по смыслу всех точных сведений о явлениях природы масса вещества есть именно такое свойство его, от которого должны находиться в зависимости все остальные свойства ... Поэтому ближе или естественнее всего искать зависимости между свойствами и сходствами элементов, с одной стороны, и атомными их весами, с другой " .

Морфологический метод осуществляет как бы анатомическое исследование объектов, понятий, значений путем расчленения целого на характерные, существенные части. Его цель - выяснение роли частного в целостной картине, систематизация знаний о данной реальности, составление гипотез о возможных вариантах новых (еще не данных) знаний. Упомянутые выше недостатки иерархической модели данных свойственны и морфологическим моделям. Их удается устранить используя так называемые ветвящиеся (древовидные) структуры (модели) представления знаний. Отдельные понятия, факты, знания, связаны между собой отношениями, выражающими суть имеющихся между ними связей. Как в иерархической модели это могут быть родо-видовые отношения, но так же и другие типы отношений: "быть представителем", "иметь", "наследовать" и т.п. Однозначность связей в древовидной структуре и разнообразие охватываемых ею отношений позволяет повысить "динамизм" системы знаний. Действительно, система знаний, представленных иерархической или морфологической моделями статична, или, как говорят, декларативна.

В древовидной структуре можно прослеживать восходящие и нисходящие ветви связей получая формулы дедуктивного (от частного к общему), индуктивного (от общего к частному) и индуктивно-дедуктивного выводов.

Например: " растение может быть цветком по имени роза"; "роза - цветок, часть растения"; "роза - цветок, имеющий лепестки".

Благодаря такой организации представленные знания получают как дополнение к декларативности процедуральность, т.е. способность к выводу общих знаний из структуры отношений и понятий. Древовидная структура знаний, несмотря на простоту и распространенность в обиходе информационного обмена, все-таки довольно специфична. В ней, как и в предыдущей модели знаний, заложена парадигма иерархичности. В тоже время внутреннее "мироустройство" некоторой системы знаний может не соответствовать этой парадигме.

Рассмотрим в качестве примера понятие "трудовой коллектив". Совокупность знаний, описывающих конкретный трудовой коллектив, чрезвычайно разнообразна, или, как говорят, многоаспектна. Между аспектами часто не удается установить отношений иерархии (род-вид), хотя связь между ними имеет место. Вот один из возможных аспектов: все представители трудового коллектива могут быть включены по алфавиту в список с указанием против фамилии и имени каждого работника табельного номера, года рождения, образования, специальности, разряда, стажа работы и т.п. Назовем этот список - "Список 1".

Другой аспект: все члены коллектива работают на условиях сдельной оплаты и величина их заработка определяется на основе т.н. тарифной сетки. Поэтому, составив список специальностей и разрядов с указанием стоимости одного часа рабочего времени, мы формируем некоторое представление знаний о системе оплаты труда членов данного коллектива. Назовем этот список - "Список 2".

Третий аспект: при начислении зарплаты каждому работнику мы должны учитывать его фактическую выработку на протяжении некоторого периода работы (например за месяц). Значит третий список, составляемый, скажем, мастером участка это список, состоящий из табельных номеров и фактически проработанного работником времени. Это - "Список 3".

Понятно, что все три списка содержат необходимый объем знаний о трудовом коллективе, если речь идет о начислении заработной платы. Подобные модели представления знаний, состоящие из связанных друг с другом списочных структур, получили название реляционных.

В реляционных моделях удается представить более сложные области знаний. В них каждый из аспектов может рассматриваться как некоторый автономный блок внутри которого допускается производить изменения, не затрагивая других областей и не внося при этом противоречий в общую картину знаний. Удобным средством является комбинация устойчивых и изменяемых знаний. Так знания, выраженные Списком 2 длительно устойчивы.

В Списке 1 представлены знания, которые могут меняться с течением времени- текучесть кадров, изменение квалификации и т.п. Список 3 обновляется каждый раз, когда возникает необходимость очередного расчета.

Не вызывает принципиальных трудностей задача пополнения реляционной модели новыми знаниями путем расширения уже имеющихся списков и добавления новых списочных структур.

В приведенном примере мы рассмотрели лишь задачу определения величины заработка. Но, по-видимому ясно, что реляционные модели включа

ющие достаточное по содержанию и количеству число списочных структур

создают возможность для решения большого количества разнообразных задач каждая из которых является по существу задачей извлечения из общей суммы вложенных в модель знаний нужного конкретного знания по интере

сующему получателя вопросу.

Существуют и другие формализмы представления знаний, кроме перечисленных выше иерархических, морфологических, древовидных и реляционных моделей. Так, например, промежуточным между древовидной и реляционной моделью являются так называемые семантические сети. С их помощью между понятиями, фактами, знаниями устанавливаются связи - отношения.

Они как бы являются обобщением древовидных моделей т.к. отличаются от последних снятием требований иерархичности. В то же время семантические сети могут считаться частным случаем реляционных моделей, т.к.

именно из них могут быть построены связанные списочные структуры, когда понятие являющееся узлом семантической сети расширяется в список, а соответствующее отношение с другим списком из единичного становится групповым.

Все описанные приемы формализации знаний направлены на создание некоторой устойчивой "несущей конструкции" на которую может быть одета оболочка системы конкретных знаний. В случае, если между отправителем и получателем знаний достигнуто понимание, взаимная договоренность относительно этой несущей конструкции, то информационный обмен приобретает необходимую регламентирующую основу, что решающим образом повышает его эффективность.

Информационная технология. Под традиционной информационной технологией, как правило, понимается информационная технология на базе "жестских алгоритмов". Под новой информационной технологией , как правило, понимается информационная технология на базе "мягких алгоритмов", с использованием достижений искусственного интеллекта.

Материя, энергия, информация, знания - связь понятий(2). Исходной посылкой является утверждение, что информация является семантической сущностью материи. Понятие "материя" отождествляется с понятием "система", в которую входят составными элементами - вещество, энергия, знания и информация. Эти элементы в соответствии с законом сохранения материи поддерживают систему в равновесном состоянии путем взаимных переходов из одной в другую субстанцию системы(рис. ниже). При взаимодействии этих элементов системы вещество выступает носителем знания, а энергия - носителем информации.

М А Т Е Р И Я

Вещество Энергия

Знания Информация

Информация, данные, знания - соотношение понятий. Информация - всеобщее свойство материи, проявляющееся в кибернетических коммуникативных процессах. Данные - это сведения, служащие для какого-либо вывода и возможного решения. Они могут храниться, передаваться, но не выступать в качестве информации. Знания - это результат познавательной деятельности, система приобретенных с ее помощью понятий о действительности.

Соотношение понятий информация, данные, знания. Может быть предложена следующая соответствующая логической связи указанных понятий образная цепочка[3] - зерно, мука, хлеб. Информация всегда носит "транспортный" оттенок передачи знания по сетям связи , знание же всегда связано с личностью его создателя.

Проблематика искусственного интеллекта. Массовая информатизация общества невозможна без ЭВМ с интеллектуальным(дружественным) интерфейсом, базирующемся на достижениях искусственного интеллекта (ИИ).

От исследований в области ИИ отделилось направление инженерии знаний

- выявление, структурирование, формализация знаний для разработки интеллектуальных систем, систем, основанных на знаниях, или экспертных систем(ЭС). ЭС - это компьютерные системы, аккумулирующие знания экспертов и фундаментальные знания в той или иной предметной области, обладающие способностью к логическим выводам и выступающие в качестве электронных консультантов для лиц, принимающих решения. Системы, базирующиеся на знаниях различных предметных областей (базы знаний), сегодня пользуются огромным спросом в мире. Так объем их продаж в 1990 г. составил 30-40 млн.$, а 1993 г. - 207 млн.$ и продолжает стремительно расти. Что же осталось в области исследований И.И., так сказать, в узком смысле слова? 1. "Мягкие" вычисления. "Жесткие" вычисления - это работа по алгоритмам, "мягкие" же вычисления - это вычисления, при которых могут быть и новые задачи, и случайное нахождение того, что нужно. Таким образом, речь идет об эволюционных алгоритмах, моделировании эволюционных процессов. 2. Когнитивная графика(пифограм

ма). Это не иллюстративная графика, а графика, порождающая новые решения(познавательная графика). Глаз оператора фиксирует некоторую закономерность светового пятна - это снимается далее с ЭВМ как заготовка будущего решения, т.е. когнитивная графика является визуальным изображением математики. 3. Виртуальная реальность. Средства информационной технологии и, в частности, человеко-машинного интерфейса, позволяют создать "виртуальный мир" - искусственное трехмерное пространство.

Первой фирмой виртуальной реальности явилась VPL Research(США), основанная в 1984 г. Джероном Леньером, автором самого термина "виртуальная реальность". 4. Моделирование человеческих рассуждений(прикладные семиотические системы). Основная проблема в том, что человеческие рассуждения не есть система.

В данной теме были рассмотрены категории и понятия теоретической информатики, без которых невозможен анализ информационных процессов в обществе, в дальнейших темах будут рассмотрены категории и понятия собственно социальной информатики.

Литература:

1. Дубровский Е.Н. Информационно-обменные процессы как факторы эволюции общества. М.: МГСУ, 1996. 2. Шемакин Ю.И. Теоретическая информатика. М.: МГСУ, 1995. 3. Соколов А.В. Феномен информатики и псевдофеномен информации // Вестник ВОИВТ, 1990, ј 3, с.45-51.

superbotanik.net

Доклад - Семантические основы социальной информатики

Тема 2

Семантические основы социальной информатики

Информология- общая теория информации. Часто понятие «информация» используют, не задумываясь о глубине его содержания, отождествляя понятия знание, данные, информация. Очевидно, что «обиходное» употребление термина «информация» совершенно неуместно, когда речь идет о теории или теориях информации. Нередко в этих теоретических построениях термин «информация» наполнен разным смыслом, а следовательно, сами теории высвечивают лишь часть граней некоторой системы знаний, которую можно назвать общей теорией информации или «информологией» — наукой о процессах и задачах передачи, распределения, обработки и преобразования информации.

Возникновение информологии как науки можно отнести к концу 50-х годов нашего столетия, когда американским инженером Р. Хартли была сделана попытка ввести количественную меру информации, передаваемой по каналам связи. Рассмотрим простую игровую ситуацию. До получения сообщения о результате подбрасывания монеты человек находится в состоянии неопределенности относительно исхода очередного броска. Сообщение партнера дает информацию, снимающее эту неопределенность. Заметим, что число возможных исходов в описанной ситуации равно 2, они равноправны (равновероятны) и каждый раз передаваемая информация полностью снимала возникавшую неопределенность. Хартли принял «количество информации», передаваемое по каналу связи относительно двух равноправных исходов и снимающее неопределенность путем оказания на один из них, за единицу информации, получившую название «бит».

Создатель статистической теории информации К. Шеннон обобщил результат Хартли и его предшественников. Его труды явились ответом на бурное развитие в середине века средств связи: радио, телефона, телеграфа, телевидения. Теория информации Шеннона позволяла ставить и решать задачи об оптимальном кодировании передаваемых сигналов с целью повышения пропускной способности каналов связи, подсказывала пути борьбы с помехами на линиях и т.д.

В работах Хартли и Шеннона информация возникает перед нами лишь в своей внешней оболочке, которая представлена отношениями сигналов, знаков, сообщений друг к другу — синтаксическими отношениями. Количественная мера Хартли-Шеннона не претендует на оценку содержательной (семантической) или ценностной, полезной (прагматической) сторон передаваемого сообщения.

Новый этап теоретического расширения понятия информации связан с кибернетикой — наукой об управлении и связи в живых организмах, обществе и машинах. Оставаясь на позициях шенноновского подхода, кибернетика формулирует принцип единства информации и управления, который особенно важен для анализа сути процессов, протекающих в самоуправляющихся, самоорганизующихся биологических и социальных системах. Развитая в работах Н. Винера концепция предполагает, что процесс управления в упомянутых системах является процессом переработки (преобразования) некоторым центральным устройством информации, получаемой от источников первичной информации (сенсорных рецепторов) и передачи ее в те участки системы, где она воспринимается ее элементами как приказ для выполнения того или иного действия. По совершении самого действия сенсорные рецепторы готовы к передаче информации об изменившейся ситуации для выполнения нового цикла управления. Так организуется циклический алгоритм (последовательность действий) управления и циркуляции информации в системе. При этом важно, что главную роль играет здесь содержание информации, передаваемой рецепторами и центральным устройством. Информация, по Винеру — это «обозначение содержания, полученного из внешнего мира в процессе нашего приспособления к нему и приспособления к нему наших чувств» .

Таким образом, кибернетическая концепция подводит к необходимости оценить информацию как некоторое знание, имеющее одну ценностную меру по отношению к внешнему миру (семантический аспект) и другую по отношению к получателю, накопленному им знанию, познавательным целям и задачам (прагматический аспект).

Попытки построить модели понятия информации, охватывающие семантический аспект знания, содержащегося в некотором высказывании относительно обозначаемого объекта, привели к созданию ряда так называемых логико-семантических теорий (Р. Карнап, И. Бар-Хиллел, Дж. Г. Кемени, Е.К. Войшвилло и др.). В них информация рассматривается как уменьшение или устранение неопределенности. Естественно предположить, что средствами какого-либо языка с помощью создаваемых в нем высказываний можно описать некоторую совокупность возможных ситуаций, состояний, альтернатив. Семантическая информация, содержащаяся в каком-либо высказывании, исключает некоторые альтернативы. Чем больше альтернатив исключает высказывание, тем большую семантическую информацию оно несет. Так, например, одна из возможных совокупностей ситуаций может быть описана следующим образом: «все тела при нагревании расширяются». Высказывание «металлы при нагревании расширяются» исключает все альтернативы в которых речь может идти о неметаллах. Семантическая сила высказывания может быть оценена отношением все тела(все металлы). Еще более информативным будет высказывание «железо при нагревании расширяется», так как оно исключает все альтернативы, кроме одной.

При всем многообразии логико-семантических теорий им присущи общие черты, они указывают путь решения трех связанных друг с другом проблем: определения совокупности возможных альтернатив средствами выбранного языка, количественной оценки альтернатив, их относительного сопоставления (взвешивания), введения меры семантической информации.

В рассмотренных теоретических конструкциях — статистической и семантической информации — речь шла о потенциальной возможности извлечь из передаваемого сообщения какие-либо сведения. Вместе с тем в процессах информационного обмена очень часто складываются ситуации, в которых мощность или качество информации, воспринимаемое приемником, зависит от того, насколько он подготовлен к ее восприятию.

Понятие тезауруса является фундаментальным в теоретической модели семантической теории информации, предложенной Ю.А. Шрейдером и учитывающей в явной форме роль приемника. Согласно этой модели, тезаурус — это знания приемника информации о внешнем мире, его способность воспринимать те или иные сообщения. Представим себе, что до получения телеграммы «Встречай завтра рейс СУ172» мы из вчерашнего разговора по междугороднему телефону уже знали о предстоящем приезде своего родственника или друга, а наведя справки, узнали и номер авиарейса, с которым он может прибыть в город. Наш тезаурус уже содержал информацию, заключенную в телеграмме. Следовательно он не изменился с ее получением и семантическая ценность этой информации оказалась нулевой.

Очевидно, что к подобной оценке семантического содержания информации примешивается семантический аспект, скрытый в изначальной «установке» тезауруса на осмысление принимаемого сообщения.

В прагматических концепциях информации этот аспект является центральным, что приводит к необходимости учитывать ценность, полезность, эффективность, экономичность информации, т.е. те ее качества, которые определяющим образом влияют на поведение самоорганизующихся, самоуправляющихся, целенаправленных кибернетических систем (биологических, социальных, человеко-машинных).

Одним из ярких представителей прагматических теорий информации является поведенческая модель коммуникации — бихевиористская модель Акоффа-Майлса. Исходным в этой модели является целевая устремленность получателя информации на решение конкретной проблемы. Получатель находится в «целеустремленном состоянии», если он стремится к чему-нибудь и имеет альтернативные пути неодинаковой эффективности для достижения цели. Сообщение, переданное получателю иформативно, если оно изменяет его «целеустремленное состояние».

Так как «целеустремленное состояние» характеризуется последовательностью возможных действий (альтернатив), эффективностью действия и значимостью результата, то передаваемое получателю сообщение может оказывать воздействие на все три компонента в различной степени. В соответствии с этим передаваемая информация различается по типам на «информирующую», «инструктирующую» и «мотивирующую». Таким образом, для получателя прагматическая ценность сообщения состоит в том, что оно позволяет ему наметить стратегию поведения при достижении цели построением ответов на вопросы: что, как и почему делать на каждом очередном шаге? Для каждого типа информации бихевиористская модель предлагает

свою меру, а общая прагматическая ценность информации определяется как функция разности этих количеств в «целеустремленном состоянии» до и после его изменения на новое «целеустремленное состояние».

Следующим этапом в развитии прагматических теорий информации явились работы американского логика Д. Харраха, построившего логико-прагматическую модель коммуникации. Одной из слабостей бихевиористской модели является ее неподготовленность к оценке ложных сообщений. Модель Харраха предполагает учет общественного характера человеческой коммуникации. В соответствии с ней получаемые сообщения должны быть сначала подвергнуты обработке, после которой выделяются сообщения «годные к употреблению». Именно с совокупности годных к употреблению сообщений должны быть применены критерии прагматической ценности.

Теория информации «в смысле Шеннона» возникла как средство решения конкретных прикладных задач в области передачи сигналов по каналам связи. Поэтому, по-существу, она являлась и является прикладной информационной наукой. Семейство таких наук, специально изучающих информационные процессы в том или ином их специфическом содержании и форме, во второй половине нашего века растет довольно быстро. Это — кибернетика, теория систем, документалистика, лингвистика, символическая логика и др. Стержнем, объединяющим все эти исследования, служит общая теория информации -«информология», в основу которой и положены синтаксические, семантические и прагматические концепции информации.

Формализация знаний: методы и приемы. Их эффективность, сравнительный анализ[1]. При поиске наиболее удобных, рациональных средств и форм информационного обмена человек чаще всего сталкивается с проблемой компактного и однозначного представления знаний.

Представление знаний это процесс, конечная цель которого поместить некоторый объем знаний в своеобразную " упаковку" в которой он может начать движение по каналам информационного обмена, дойти до получателя, или задержаться в пунктах хранения знаний. Такой упаковкой может быть фраза устной речи, письмо, книга, справочник, географическая карта, кроссворд, картина и т.п.

Каждый вид упаковки имеет свои особенности, но всем им присуще одно качество, хотя и не в одинаковой степени: упаковка призвана обеспечить сохранность вложенного знания. Причем не только и не столько физическую, сколько смысловую (семантическую). Для этого необходимо, чтобы отправитель и получатель информации упакованных знаний пользовались некоторой общей системой правил для их представления и восприятия. Назовем такую систему правил формализмом представления знаний.

Самым естественным, подходящим для человека формализмом является язык ( устная речь и письменность). Без знаний, без постоянной работы по их упаковке в языковые конструкции язык мертв. Он живет и развивается благодаря творческой энергии человека, благодаря тому, что человеческая мысль постоянно и настойчиво ищет выхода в выраженную в языке форму. Всякую ли мысль или знание можно выразить в языковой форме? По-видимому, нет. Например, существуют десятки различных определений понятий здоровье, интеллект, мышление, информация и т.п. Отмечая эту ограниченность выразительных средств языка, Ф. Энгельс писал:" Дефиниции не имеют значения для науки, потому что они всегда оказываются недостаточными". Мысль, которую нельзя выразить в языковой конструкции, не может быть включена в информационный обмен. Общение людей, таким образом, осуществляется с помощью языка как формы представления знаний. Одному и тому же содержательному

знанию можно придать различную словесную или текстовую форму. Это очень сильно проявляется, например, в художественной прозе, поэзии и т.д. Богатство языка это и богатство культуры того или иного народа.

Вместе с тем, в некоторых областях деятельности людей это богатство и разнообразие выразительных средств естественного языка становится скорее недостатком, чем достоинством. Например, слова команды должны быть короткими, резкими, иметь однозначный смысл, иначе не получится согласованных и четких совместных действий подчиненных. В специальных отраслях науки формируются специфические языковые системы, являющиеся как бы " сужением " естественного языка. Особо выделяется язык математики, как некоторая основа изложения системы знаний в точных, естественных науках. Свой язык имеют химия, физика, философия и т.д.

Целесообразность применения таких суженных языковых систем (диалектов), позволяет повысить надежность процессов информационного обмена, т.к. возможность неправильного истолкования передаваемой информации снижается. При этом, конечно, сужается и круг получателей, поскольку для восприятия информации необходимо владеть соответствующим диалектом. Главные достоинства суженного языка — возможность создавать и использовать типовые, «стандартные » упаковки знаний, а также в значительной мере снять полисемию ( смысловую многозначность), присутс

твующую в естественном языке.

Полисемия — враг информационного обмена, фактор внесения искажения и ошибок ( семантического шума) на пути передачи информации. Поэтому устранение многозначности является одним из наиболее важных направлений в разработке формальных приемов представления знаний. Создание языка науки или языка деловой прозы, называемого часто " концеляритом ", является естественным шагом на этом пути, огромной работой общества на протяжении ряда столетий. Сопоставление этой подсистемы естественного языка с литературным языком показывает насколько они различны по характеристикам, определяющим их выразительную способность.

Так «канцелярит» предназначен для объективизации изложения информации, использует, как правило, переводимые категории и языковые формы, лишен синонимии, оперирует конкретными фактами и понятиями, информативен (в противоположность информационной избыточности), ему присуща логичность, он по характеру алгебраичен (мысль, информация, знание развернуты в последовательность слов и предложений, постепенно формируясь в полном, законченном виде к завершению текста). Все эти свойства не являются обязательными для языка литературы, которому свойственна субъективность форм, возможность применения непереводимых конструкций, бесконечно богатая синонимия, образность (геометричность) высказываний и т.д.

Дальнейшее продвижение в сторону формализации знаний приводит к понятиям класс и классификация. Классификация — распределение предметов, объектов и понятий по группам (классам) по обнаруженным свойствам. В любой складывающейся науке одним из первых принципов являлся принцип систематизации знаний. Поэтому классификация как метод научной систематики сразу же стала играть важную роль в формировании ядра знаний того или иного научного направления. Достаточно вспомнить классификационную систему К. Линнея в ботанике, систематику живых организмов и т.п. Классификационные системы такого типа имеют выраженную иерархическую структуру, в силу которой все объекты (понятия, факты) разделены на уровни, связанные между собой отношением «старший — младший»: тип, класс, отряд, семейство, род, вид.

Примером классификации такого типа где родо-видовые отношения пронизывают всю структуру соответствующих знаний может служить известная «табель о рангах», введенная Петром 1 в 1722 г. Табель о рангах подразделяла чины на 14 рангов. Каждому чину соответствовала определенная должность. Первые 6 рангов статской и придворной служб и первый обер-офицерский чин в армии давали право на получение потомственного дворянства, что способствовало формированию дворянской бюрократии.

Мы видим на этом примере, что классификация может проявить себя не только как инструмент организации научных знаний, но и как фактор социального порядка. Поэтому существующие системы тарифов и ставок, ученых степеней и званий, структура должностей и служебных постов в гражданской службе и армии играют не только организующую, но и стимулирующую роль. Подобная модель знаний получила в науке и практике название " иерархической". Ее достоинства в том, что она проста в освоении, легко поддерживается в рабочем состоянии (легко пополняется и «чистится»), эффективно решает задачу разнесения новых понятий по иерархическим уровням.

Недостатки иерархической модели знаний: — прямые связи между понятиями соседних уровней обозначены слабо, или вовсе отсутствуют; — иерархическая классификация наиболее эффективна в тех случаях, когда при переходе от уровня к уровню работает один и тот же тип отношений, например, родо-видовой.

Систематика, лежащая в основе классификации может применяться как сильное средство направленного исследовательского поиска. Так, иногда оказывается полезным при рассмотрении группы объектов несколько каких-либо характерных для них признаков выделить в качестве определяющих и ввести некоторую меру степени проявления данных признаков. Такой подход называется морфологическим, так как использует идею разложения некоего объекта на его части (признаки). Часто подобная группировка приводит к выявлению закономерностей связывающих объекты каждой группы, которые до этого не были известны.

Благодаря такому подходу Д.И.Менделеев открыл знаменитый периодический закон. Подчеркивая доминирующую роль выделенного им признака он писал: "… по смыслу всех точных сведений о явлениях природы масса вещества есть именно такое свойство его, от которого должны находиться в зависимости все остальные свойства… Поэтому ближе или естественнее всего искать зависимости между свойствами и сходствами элементов, с одной стороны, и атомными их весами, с другой " .

Морфологический метод осуществляет как бы анатомическое исследование объектов, понятий, значений путем расчленения целого на характерные, существенные части. Его цель — выяснение роли частного в целостной картине, систематизация знаний о данной реальности, составление гипотез о возможных вариантах новых (еще не данных) знаний. Упомянутые выше недостатки иерархической модели данных свойственны и морфологическим моделям. Их удается устранить используя так называемые ветвящиеся (древовидные) структуры (модели) представления знаний. Отдельные понятия, факты, знания, связаны между собой отношениями, выражающими суть имеющихся между ними связей. Как в иерархической модели это могут быть родо-видовые отношения, но так же и другие типы отношений: «быть представителем», «иметь», «наследовать» и т.п. Однозначность связей в древовидной структуре и разнообразие охватываемых ею отношений позволяет повысить «динамизм» системы знаний. Действительно, система знаний, представленных иерархической или морфологической моделями статична, или, как говорят, декларативна.

В древовидной структуре можно прослеживать восходящие и нисходящие ветви связей получая формулы дедуктивного (от частного к общему), индуктивного (от общего к частному) и индуктивно-дедуктивного выводов.

Например: " растение может быть цветком по имени роза"; «роза — цветок, часть растения»; «роза — цветок, имеющий лепестки».

Благодаря такой организации представленные знания получают как дополнение к декларативности процедуральность, т.е. способность к выводу общих знаний из структуры отношений и понятий. Древовидная структура знаний, несмотря на простоту и распространенность в обиходе информационного обмена, все-таки довольно специфична. В ней, как и в предыдущей модели знаний, заложена парадигма иерархичности. В тоже время внутреннее «мироустройство» некоторой системы знаний может не соответствовать этой парадигме.

Рассмотрим в качестве примера понятие «трудовой коллектив». Совокупность знаний, описывающих конкретный трудовой коллектив, чрезвычайно разнообразна, или, как говорят, многоаспектна. Между аспектами часто не удается установить отношений иерархии (род-вид), хотя связь между ними имеет место. Вот один из возможных аспектов: все представители трудового коллектива могут быть включены по алфавиту в список с указанием против фамилии и имени каждого работника табельного номера, года рождения, образования, специальности, разряда, стажа работы и т.п. Назовем этот список — «Список 1».

Другой аспект: все члены коллектива работают на условиях сдельной оплаты и величина их заработка определяется на основе т.н. тарифной сетки. Поэтому, составив список специальностей и разрядов с указанием стоимости одного часа рабочего времени, мы формируем некоторое представление знаний о системе оплаты труда членов данного коллектива. Назовем этот список — «Список 2».

Третий аспект: при начислении зарплаты каждому работнику мы должны учитывать его фактическую выработку на протяжении некоторого периода работы (например за месяц). Значит третий список, составляемый, скажем, мастером участка это список, состоящий из табельных номеров и фактически проработанного работником времени. Это — «Список 3».

Понятно, что все три списка содержат необходимый объем знаний о трудовом коллективе, если речь идет о начислении заработной платы. Подобные модели представления знаний, состоящие из связанных друг с другом списочных структур, получили название реляционных.

В реляционных моделях удается представить более сложные области знаний. В них каждый из аспектов может рассматриваться как некоторый автономный блок внутри которого допускается производить изменения, не затрагивая других областей и не внося при этом противоречий в общую картину знаний. Удобным средством является комбинация устойчивых и изменяемых знаний. Так знания, выраженные Списком 2 длительно устойчивы.

В Списке 1 представлены знания, которые могут меняться с течением времени- текучесть кадров, изменение квалификации и т.п. Список 3 обновляется каждый раз, когда возникает необходимость очередного расчета.

Не вызывает принципиальных трудностей задача пополнения реляционной модели новыми знаниями путем расширения уже имеющихся списков и добавления новых списочных структур.

В приведенном примере мы рассмотрели лишь задачу определения величины заработка. Но, по-видимому ясно, что реляционные модели включа

ющие достаточное по содержанию и количеству число списочных структур

создают возможность для решения большого количества разнообразных задач каждая из которых является по существу задачей извлечения из общей суммы вложенных в модель знаний нужного конкретного знания по интере

сующему получателя вопросу.

Существуют и другие формализмы представления знаний, кроме перечисленных выше иерархических, морфологических, древовидных и реляционных моделей. Так, например, промежуточным между древовидной и реляционной моделью являются так называемые семантические сети. С их помощью между понятиями, фактами, знаниями устанавливаются связи — отношения.

Они как бы являются обобщением древовидных моделей т.к. отличаются от последних снятием требований иерархичности. В то же время семантические сети могут считаться частным случаем реляционных моделей, т.к.

именно из них могут быть построены связанные списочные структуры, когда понятие являющееся узлом семантической сети расширяется в список, а соответствующее отношение с другим списком из единичного становится групповым.

Все описанные приемы формализации знаний направлены на создание некоторой устойчивой «несущей конструкции» на которую может быть одета оболочка системы конкретных знаний. В случае, если между отправителем и получателем знаний достигнуто понимание, взаимная договоренность относительно этой несущей конструкции, то информационный обмен приобретает необходимую регламентирующую основу, что решающим образом повышает его эффективность.

Информационная технология. Под традиционной информационной технологией, как правило, понимается информационная технология на базе «жестских алгоритмов». Под новой информационной технологией, как правило, понимается информационная технология на базе «мягких алгоритмов», с использованием достижений искусственного интеллекта.

Материя, энергия, информация, знания — связь понятий(2). Исходной посылкой является утверждение, что информация является семантической сущностью материи. Понятие «материя» отождествляется с понятием «система», в которую входят составными элементами — вещество, энергия, знания и информация. Эти элементы в соответствии с законом сохранения материи поддерживают систему в равновесном состоянии путем взаимных переходов из одной в другую субстанцию системы(рис. ниже). При взаимодействии этих элементов системы вещество выступает носителем знания, а энергия — носителем информации.

М А Т Е Р И Я

Вещество Энергия

Знания Информация

Информация, данные, знания — соотношение понятий. Информация — всеобщее свойство материи, проявляющееся в кибернетических коммуникативных процессах. Данные — это сведения, служащие для какого-либо вывода и возможного решения. Они могут храниться, передаваться, но не выступать в качестве информации. Знания — это результат познавательной деятельности, система приобретенных с ее помощью понятий о действительности.

Соотношение понятий информация, данные, знания. Может быть предложена следующая соответствующая логической связи указанных понятий образная цепочка[3] — зерно, мука, хлеб. Информация всегда носит «транспортный» оттенок передачи знания по сетям связи, знание же всегда связано с личностью его создателя.

Проблематика искусственного интеллекта. Массовая информатизация общества невозможна без ЭВМ с интеллектуальным(дружественным) интерфейсом, базирующемся на достижениях искусственного интеллекта (ИИ).

От исследований в области ИИ отделилось направление инженерии знаний

— выявление, структурирование, формализация знаний для разработки интеллектуальных систем, систем, основанных на знаниях, или экспертных систем(ЭС). ЭС — это компьютерные системы, аккумулирующие знания экспертов и фундаментальные знания в той или иной предметной области, обладающие способностью к логическим выводам и выступающие в качестве электронных консультантов для лиц, принимающих решения. Системы, базирующиеся на знаниях различных предметных областей (базы знаний), сегодня пользуются огромным спросом в мире. Так объем их продаж в 1990 г. составил 30-40 млн.$, а 1993 г. — 207 млн.$ и продолжает стремительно расти. Что же осталось в области исследований И.И., так сказать, в узком смысле слова? 1. «Мягкие» вычисления. «Жесткие» вычисления — это работа по алгоритмам, «мягкие» же вычисления — это вычисления, при которых могут быть и новые задачи, и случайное нахождение того, что нужно. Таким образом, речь идет об эволюционных алгоритмах, моделировании эволюционных процессов. 2. Когнитивная графика(пифограм

ма). Это не иллюстративная графика, а графика, порождающая новые решения(познавательная графика). Глаз оператора фиксирует некоторую закономерность светового пятна — это снимается далее с ЭВМ как заготовка будущего решения, т.е. когнитивная графика является визуальным изображением математики. 3. Виртуальная реальность. Средства информационной технологии и, в частности, человеко-машинного интерфейса, позволяют создать «виртуальный мир» — искусственное трехмерное пространство.

Первой фирмой виртуальной реальности явилась VPL Research(США), основанная в 1984 г. Джероном Леньером, автором самого термина «виртуальная реальность». 4. Моделирование человеческих рассуждений(прикладные семиотические системы). Основная проблема в том, что человеческие рассуждения не есть система.

В данной теме были рассмотрены категории и понятия теоретической информатики, без которых невозможен анализ информационных процессов в обществе, в дальнейших темах будут рассмотрены категории и понятия собственно социальной информатики.

Литература:

1. Дубровский Е.Н. Информационно-обменные процессы как факторы эволюции общества. М.: МГСУ, 1996. 2. Шемакин Ю.И. Теоретическая информатика. М.: МГСУ, 1995. 3. Соколов А.В. Феномен информатики и псевдофеномен информации // Вестник ВОИВТ, 1990, ј 3, с.45-51.

www.ronl.ru

Реферат Семантический веб

скачать

Реферат на тему:

План:

Введение

Не следует путать с Семантическая сеть.

Семанти́ческая паути́на (англ. Semantic Web) — это направление развития Всемирной паутины, целью которого является представление информации в виде, пригодном для машинной обработки.

В обычной Паутине, основанной на HTML-страницах, информация заложена в тексте страниц и извлекается человеком с помощью браузера. Семантическая же паутина предполагает запись информации в виде семантической сети с помощью онтологий. Таким образом программа-клиент может непосредственно извлекать из паутины факты и делать из них логические заключения. Семантическая паутина работает параллельно с обычной Паутиной и на её основе, используя протокол HTTP и идентификаторы ресурсов URI.

Термин «семантическая паутина» был впервые введён сэром Тимом Бернерсом-Ли (изобретателем Всемирной паутины) в мае 2001 года в журнале «Scientific American»[1], и называется им «следующим шагом в развитии Всемирной паутины». Эта концепция была принята и продвигается Консорциумом Всемирной паутины[2].

1. Основная идея

Семантическая паутина — это надстройка над существующей Всемирной паутиной, которая призвана сделать размещённую в ней информацию более понятной для компьютеров. Машинная обработка возможна в семантической паутине благодаря двум её важнейшим характеристикам.

Граф визитной карточки основателя Википедии в формате RDF. Элементы этого графа — как узлы, так и дуги (кроме литерала, изображённого в оранжевом прямоугольнике[3]) — являются URI.

2. Критика

2.1. Практическая нереализуемость

В 2006 году журнал «IEEE Intelligent Systems» опубликовал новую статью Тима Бернерса-Ли «Semantic Web Revisited» («Семантическая паутина: пересмотр»)[5], в которой автор называет описанный подход к организации информации в вебе «простой идеей, до сих пор в большой степени нереализованной». Несмотря на все преимущества, предоставляемые семантической паутиной в случае её внедрения, другие авторы также высказывают сомнения в возможности её полной реализации.

Комментаторы указывают на различные причины, которые могут быть препятствием к этому, начиная с человеческого фактора[6] (люди склонны избегать работы по поддержке документов с метаданными, открытыми остаются проблемы истинности метаданных, и т. д.), и заканчивая косвенным указанием Аристотеля на отсутствие очевидного способа деления мира на различимые концепты. Это ставит под сомнение возможность существования онтологии верхнего уровня, критической для семантической паутины. Аристотель в «Топике» использует понятие differentia specifica, или наличие у понятий различимого качества, как основу для группировки понятий в классы. Философ уверен в наличии бесконечного числа понятий, из чего следует бесконечность числа классов, в которые их можно объединить. Для выделения такого количества классов необходимо бесконечно много различимых качеств, наличие которых Аристотель подвергает сомнению.

2.2. Дублирование информации

Необходимость описания метаданных так или иначе приводит к дублированию информации. Каждый документ должен быть создан в двух экземплярах: размеченным для чтения людьми, а также в машинно-ориентированном формате. Этот недостаток семантической паутины был главным толчком к созданию так называемых микроформатов[7] и языка RDFа[8]. Последний является вариантом языка RDF и отличается от него тем, что не определяет собственного синтаксиса, а предназначен для внедрения в XML-атрибуты XHTML-страниц.

2.3. Невозможность получения коммерческой выгоды

Известно, что основное финансирование современных интернет-ресурсов (за исключением строго некоммерческих проектов) обеспечивают рекламодатели. Главный критерий, от которого зависит стоимость рекламного места — посещаемость сайта. Однако в случае реализации семантических поисковых систем, которые будут сами отбирать и сразу предоставлять нужную пользователю информацию, отпадает необходимость посещать сайт — источник материала, а значит пользователь не увидит рекламу, и как следствие прекратится финансирование интернет-проектов.[9]

3. Реализация

3.1. Языки описания

Стек понятий семантической паутины

Техническую часть семантической паутины составляет семейство стандартов на языки описания, включающее XML, XML Schema, RDF, RDF Schema, OWL, а также некоторые другие. Располагая их в порядке повышения уровня абстракции, реализуемого тем или иным языком, получаем:

3.2. Логический вывод

Форматы описания метаданных в семантической паутине предполагают проведение логического вывода на этих метаданных, и разрабатывались с оглядкой на существующие математические формализмы в этой области. Формализм, лежащий в основе формата, даёт возможность делать заключения о свойствах программ, обрабатывающих данные в этом формате.

Особенно сильно это относится к языку OWL. Базовым формализмом для него являются дескрипционные логики, а сам язык разбит на три вложенных подмножества (в порядке вложенности): OWL Lite, OWL DL и OWL Full[10]. Доказано[11], что логический вывод на метаданных с выразительностью OWL Lite выполняется за полиномиальное время (другими словами, задача вывода принадлежит к классу P). OWL DL описывает максимальное разрешимое в данный момент подмножество дескрипционных логик, но некоторые запросы по таким данным могут требовать экспоненциального времени выполнения. OWL Full реализует все существующие конструкторы дескрипционных логик, но не каждый запрос в этом подмножестве языка может быть разрешён (слово «разрешён» здесь употребляется в значении, основанном на корне «решать»).

Простая структура предикатов языка RDF, в свою очередь, позволяет использовать при его обработке опыт из теорий логических баз данных, логики предикатов и т. д.

4. Проекты

4.1. Дублинское ядро

Одним из первых серьёзных и популярных проектов, основанных на принципах семантической паутины, стал проект «Дублинское ядро» (англ. Dublin Core), реализуемый инициативной организацией Dublin Core Metadata Initiative (DCMI). Это открытый проект, цель которого — разработать стандарты метаданных, которые были бы независимы от платформ и подходили бы для широкого спектра задач. Конкретнее, DCMI занимается разработкой словарей метаданных общего назначения, стандартизирующих описания ресурсов в формате RDF.[12]

4.2. RSS (версий 0.90 и 1.0)

Версии 0.90 и 1.0 формата RSS основаны на RDF. Информация в нём представляется как и в RDF, тройками субъект-отношение-объект. Необходимо отметить, что несмотря на то, что ему присущи многие недостатки семантической паутины (дублирование информации, например), этот простейший формат быстро стал чрезвычайно популярным за счёт узкой категоризации подмножества используемых метаданных. Отличие RSS от RDF состоит в том, что субъектом тройки всегда является сайт-источник RSS-файла, а в качестве отношений используются самые очевидные свойства документов, имеющие отношение к часто обновляющимся источникам информации: дата написания, автор, постоянная ссылка, и т. д. Другими словами, RSS — узкоспециализированное подмножество RDF.[13]

Заметим, что формат RSS версии 2.0, хотя и не является форматом, основанным на RDF, позволяет внедрение произвольного XML-содержимого, находящегося в собственных пространствах имён XML. Это позволяет использовать RDF-описания также и в нём (используя пространство имён rdf).[14]

4.3. FOAF

Проект «Friend of a Friend» («Друг друга») позволяет описывать отношение знакомства с помощью RDF. Любой его участник может идентифицировать себя уникальным образом с помощью URI (например, mailto-адресом электронной почты, адресом блога, и т. п.), создать свой профиль, используя предопределённые для FOAF отношения на языке RDF, и перечислить идентификаторы людей, которых этот участник знает. Это описание может обрабатываться автоматически; на его основе можно строить сети доверия, анализировать структуру социальных групп, и т. д.[15]

4.4. DBpedia

DBpedia — проект, направленный на извлечение структурированной информации из данных, созданных в рамках проекта Wikipedia. DBpedia позволяет пользователям запрашивать информацию, основанную на отношениях и свойствах ресурсов Википедии, в том числе ссылки на соответствующие базы данных. Начат группой добровольцев из Свободного университета Берлина и Лейпцигского университета, в сотрудничестве с OpenLink Software, и впервые был опубликован в 2007 году. Проект DBpedia использует Resource Description Framework (RDF) для представления извлеченной информации. По состоянию на апрель 2010, базы данных DBpedia состоят из более чем 1 млрд единиц информации, из которых 257 млн были взяты из английской версии Википедии и 766 млн извлечены из версий на других языках[16].

Примечания

  1. The Semantic Web. - www.scientificamerican.com/article.cfm?articleID=00048144-10D2-1C70-84A9809EC588EF21 Scientific American, 17 мая 2001, русский перевод: Семантическая Сеть - ezolin.pisem.net/logic/semantic_web_rus.html
  2. Раздел о Семантической паутине на сайте W3C - www.w3.org/standards/semanticweb/  (англ.)
  3. Resource Description Framework (RDF): Concepts and Abstract Syntax - www.w3.org/TR/2004/REC-rdf-concepts-20040210/  (англ.). Консорциум Всемирной паутины (10 февраля 2004 года). — W3C Recommendation.
  4. Cool URIs for the Semantic Web - www.w3.org/TR/cooluris/  (англ.). Консорциум Всемирной паутины (3 декабря 2008 года). — W3C Interest Group Note.
  5. Semantic Web Revisited - eprints.ecs.soton.ac.uk/12614/1/Semantic_Web_Revisted.pdf, IEEE Intelligent Systems, июнь 2006
  6. Cory Doctorow, Metacrap: Putting the torch to seven straw-men of the meta-utopia, - www.well.com/~doctorow/metacrap.htm август 2001
  7. Rohit Khare, Tantek Çelik, Microformats: A Pragmatic Path to the Semantic Web, - www.commercenet.com/images/e/ea/CN-TR-06-01.pdf январь 2006
  8. RDFa Primer - www.w3.org/TR/xhtml-rdfa-primer/
  9. Ахиллесова пята Семантического Веба - www.computerra.ru/magazine/362912/, Компьютерра
  10. The Species of OWL in OWL Language Guide - www.w3.org/TR/owl-guide/#OwlVarieties
  11. OWL Full, OWL DL and OWL Lite in OWL Language Reference - www.w3.org/TR/owl-ref/#Sublanguage-def
  12. Dublin Core Metadata Initiative (DCMI) - dublincore.org/
  13. RSS 1.0 Specification - web.resource.org/rss/1.0/spec
  14. RSS 2.0 Specification - cyber.law.harvard.edu/rss/rss.html#extendingRss
  15. Friend of a Friend - www.link14
  16. DBpedia Mappings - mappings.link15

Литература

wreferat.baza-referat.ru

Семантическая информация. Большая советская энциклопедия. понятие

Словарь

загрузка...

Большая советская энциклопедия

        в логике, характеристика содержания, которая передаётся в некотором сообщении. Существуют разные подходы к измерению С. и. В концепции И. Бар-Хиллела (США) и Р. Карнапа (Австрия) сообщение понимается как пропозициональная формула (Высказывание), а С. и. измеряется числом состоянии Универсума, при которых эта формула ложна. Это реализация идеи Г. В. Лейбница о том, что логически истинные предложения, верные во всех возможных мирах, не могут нести фактической информации. А. А. Харкевич предложил измерять ценность информации через изменение вероятности достижения определённой цели, возникающее под воздействием данного сообщения. С. и. сообщения любой природы можно оценивать как степень изменения системы знаний (Тезауруса) адресата в результате восприятия данного сообщения. Эта мера одновременно оценивает новизну и доступность сообщения относительно данного адресата, тем самым такая трактовка С. и. является в значительной мере прагматической ( Отправитель сообщения тоже получает С. и., которая характеризуется возникшим у него новым знанием о состояниях тезаурусов адресатов.

         Лит.: Bar-HillieI Y., Carnap R., Semantic information, «The British Journal for the Philosophy Science», 1953, v. 4, № 14; Харкевич А. А., О ценности информации, «Проблемы кибернетики», 1960, в. 4; Шрейдер Ю. А., Об одной модели семантической теории информации, там же, 1965, в. 13; Финн В. К., О семантической информации, в кн.: Джордж Ф., Мозг как вычислительная машина, М., 1963, с. 479—485; Information and inference, ed. by I. Hintikka and P. Suppes, Dordrecht, 1970.

         Ю. А. Шрейдер.

Прагматика (от греч. prágma, родительный падеж prágmatos — дело, действие)         раздел (точнее, аспект) семиотики (см. Семиотика), посвященный рассмотрению и изучению отношения субъектов, воспринимающих и использующих какую-либо знаковую систему (её «интерпретаторов»), к самой знаковой системе. Основополагающие идеи П. идут от Ч. Пирса, в дальнейшем существенный вклад в неё внесли Ч. Моррис (которому принадлежит и сам термин «П.») и др. учёные. В отличие от синтактики (см. Синтактика), изучающей чисто структурные отношения между правильно построенными выражениями знаковой системы (безотносительно к их возможным интерпретациям, хотя, быть может, и имея их в виду), и семантики (см. Семантика), внимание которой сосредоточено как раз на этих интерпретациях, П. изучает свойства и отношения какой-либо знаковой системы невыразимыми средствами самой этой знаковой системы; к ним относятся, например, стилистические характеристики языка, обеспечивающие наиболее успешное («адекватное») восприятие сообщений, характеристики допустимой сжимаемости текста, сохраняющей его понятность, критерии оптимальности структуры такого сжатого текста («реферата» на исходный текст), индивидуальные «разрешающие» способности интерпретаторов. Т. о., П. предполагает максимальный учёт свойств и возможностей человеческого интеллекта и сама претендует на выявление условий, обеспечивающих успешную работу по моделированию этих свойств и возможностей. Конкретизируя это, можно упомянуть о направлениях и научных исследованиях, в которых приложение прагматических представлений и идей представляется весьма перспективным, а зачастую приводит и к непосредственным практическим выходам. Это относится к проблемам эвристического программирования, машинного перевода (см. Машинный перевод) (с очень трудной задачей автоматического распознавания омонимии (см. Омонимия)), автоматического реферирования, разработки информационно-поисковых систем и специальных языков для них, разработки языков для космических коммуникаций (т. н. Lincos — lingua cosmica голландского математика Х. Фройденталя) и ко всему разнообразному кругу задач, встающих при проектировании и построении всякого рода «роботов», — задач, для решения которых оказывается явно недостаточно привлечения (помимо средств конкретных наук) одних лишь синтаксических и семантических соображений. Прагматические соображения широко привлекаются и в такой типично «умозрительной» области, как разработка оснований математики и математической логики (см. Логика) (работы голландских математиков Г. Маннури и Д. ван Данцига, а также т. н. ультраинтуиционизм; см. Аксиоматический метод). В то же время П. широко пользуется материалом, почерпнутым из данных психологии (в частности, инженерной психологии), этологии (науки о поведении животных), социальной психологии (см. Социальная психология), лингвистики и др. наук (и, в свою очередь, оказывает на них воздействие).

         Лит.: Карнап Р., Значение и необходимость, пер. с англ., М., 1959; Логика и методология науки. IV Всес. симпозиум, Киев, июнь 1965, М., 1967, с. 56—67; Вычислительные машины и мышление, пер. с англ., М., 1967; Интегральные роботы. Сб. ст., пер. с англ., М., 1973; Нильсон Н., Искусственный интеллект, пер. с англ., М., 1973: Ajdukiewicz К., Logika pragmatyczna, Warsz., 1965; Morris Ch. W., Foundations of the theory of signs, ChL, 1938; Russell B., An inquiry into meaning and truth, N. Y., [1940]; Martin R. М., Toward a systematic pragmatics, Arnst., 1959; Peirce Ch. S., Collected papers, 2 ed., v. 5, 6, Camb. (Mass.), 1960.

Другие понятия:Семантическая информация, философская энциклопедияМодель Семантическая, Словарь терминов логикиАфазия семантическая, большой медицинский словарьСемантическая Категория, Словарь терминов логикиСтупенчатая семантическая система, математическая энциклопедияСемантическая Функция Речи, психологический словарьИнформация, современная энциклопедияИнформация, физическая энциклопедияИнформация, математическая энциклопедия

Другой материал:Реферат - Телекоммуникация и информацияСтатья - Сущность термина информацияДоклад - Понятие системности словаря

загрузка...

Словари:

• медицинская энциклопедия• большой медицинский словарь• медицинские термины• психологическая энциклопедия• психотерапевтическая энциклопедия

slovare.coolreferat.com

Реферат Семантическая паутина

скачать

Реферат на тему:

План:

Введение

Не следует путать с Семантическая сеть.

Семанти́ческая паути́на (англ. Semantic Web) — это направление развития Всемирной паутины, целью которого является представление информации в виде, пригодном для машинной обработки.

В обычной Паутине, основанной на HTML-страницах, информация заложена в тексте страниц и извлекается человеком с помощью браузера. Семантическая же паутина предполагает запись информации в виде семантической сети с помощью онтологий. Таким образом программа-клиент может непосредственно извлекать из паутины факты и делать из них логические заключения. Семантическая паутина работает параллельно с обычной Паутиной и на её основе, используя протокол HTTP и идентификаторы ресурсов URI.

Термин «семантическая паутина» был впервые введён сэром Тимом Бернерсом-Ли (изобретателем Всемирной паутины) в мае 2001 года в журнале «Scientific American»[1], и называется им «следующим шагом в развитии Всемирной паутины». Эта концепция была принята и продвигается Консорциумом Всемирной паутины[2].

1. Основная идея

Семантическая паутина — это надстройка над существующей Всемирной паутиной, которая призвана сделать размещённую в ней информацию более понятной для компьютеров. Машинная обработка возможна в семантической паутине благодаря двум её важнейшим характеристикам.

Граф визитной карточки основателя Википедии в формате RDF. Элементы этого графа — как узлы, так и дуги (кроме литерала, изображённого в оранжевом прямоугольнике[3]) — являются URI.

2. Критика

2.1. Практическая нереализуемость

В 2006 году журнал «IEEE Intelligent Systems» опубликовал новую статью Тима Бернерса-Ли «Semantic Web Revisited» («Семантическая паутина: пересмотр»)[5], в которой автор называет описанный подход к организации информации в вебе «простой идеей, до сих пор в большой степени нереализованной». Несмотря на все преимущества, предоставляемые семантической паутиной в случае её внедрения, другие авторы также высказывают сомнения в возможности её полной реализации.

Комментаторы указывают на различные причины, которые могут быть препятствием к этому, начиная с человеческого фактора[6] (люди склонны избегать работы по поддержке документов с метаданными, открытыми остаются проблемы истинности метаданных, и т. д.), и заканчивая косвенным указанием Аристотеля на отсутствие очевидного способа деления мира на различимые концепты. Это ставит под сомнение возможность существования онтологии верхнего уровня, критической для семантической паутины. Аристотель в «Топике» использует понятие differentia specifica, или наличие у понятий различимого качества, как основу для группировки понятий в классы. Философ уверен в наличии бесконечного числа понятий, из чего следует бесконечность числа классов, в которые их можно объединить. Для выделения такого количества классов необходимо бесконечно много различимых качеств, наличие которых Аристотель подвергает сомнению.

2.2. Дублирование информации

Необходимость описания метаданных так или иначе приводит к дублированию информации. Каждый документ должен быть создан в двух экземплярах: размеченным для чтения людьми, а также в машинно-ориентированном формате. Этот недостаток семантической паутины был главным толчком к созданию так называемых микроформатов[7] и языка RDFа[8]. Последний является вариантом языка RDF и отличается от него тем, что не определяет собственного синтаксиса, а предназначен для внедрения в XML-атрибуты XHTML-страниц.

2.3. Невозможность получения коммерческой выгоды

Известно, что основное финансирование современных интернет-ресурсов (за исключением строго некоммерческих проектов) обеспечивают рекламодатели. Главный критерий, от которого зависит стоимость рекламного места — посещаемость сайта. Однако в случае реализации семантических поисковых систем, которые будут сами отбирать и сразу предоставлять нужную пользователю информацию, отпадает необходимость посещать сайт — источник материала, а значит пользователь не увидит рекламу, и как следствие прекратится финансирование интернет-проектов.[9]

3. Реализация

3.1. Языки описания

Стек понятий семантической паутины

Техническую часть семантической паутины составляет семейство стандартов на языки описания, включающее XML, XML Schema, RDF, RDF Schema, OWL, а также некоторые другие. Располагая их в порядке повышения уровня абстракции, реализуемого тем или иным языком, получаем:

3.2. Логический вывод

Форматы описания метаданных в семантической паутине предполагают проведение логического вывода на этих метаданных, и разрабатывались с оглядкой на существующие математические формализмы в этой области. Формализм, лежащий в основе формата, даёт возможность делать заключения о свойствах программ, обрабатывающих данные в этом формате.

Особенно сильно это относится к языку OWL. Базовым формализмом для него являются дескрипционные логики, а сам язык разбит на три вложенных подмножества (в порядке вложенности): OWL Lite, OWL DL и OWL Full[10]. Доказано[11], что логический вывод на метаданных с выразительностью OWL Lite выполняется за полиномиальное время (другими словами, задача вывода принадлежит к классу P). OWL DL описывает максимальное разрешимое в данный момент подмножество дескрипционных логик, но некоторые запросы по таким данным могут требовать экспоненциального времени выполнения. OWL Full реализует все существующие конструкторы дескрипционных логик, но не каждый запрос в этом подмножестве языка может быть разрешён (слово «разрешён» здесь употребляется в значении, основанном на корне «решать»).

Простая структура предикатов языка RDF, в свою очередь, позволяет использовать при его обработке опыт из теорий логических баз данных, логики предикатов и т. д.

4. Проекты

4.1. Дублинское ядро

Одним из первых серьёзных и популярных проектов, основанных на принципах семантической паутины, стал проект «Дублинское ядро» (англ. Dublin Core), реализуемый инициативной организацией Dublin Core Metadata Initiative (DCMI). Это открытый проект, цель которого — разработать стандарты метаданных, которые были бы независимы от платформ и подходили бы для широкого спектра задач. Конкретнее, DCMI занимается разработкой словарей метаданных общего назначения, стандартизирующих описания ресурсов в формате RDF.[12]

4.2. RSS (версий 0.90 и 1.0)

Версии 0.90 и 1.0 формата RSS основаны на RDF. Информация в нём представляется как и в RDF, тройками субъект-отношение-объект. Необходимо отметить, что несмотря на то, что ему присущи многие недостатки семантической паутины (дублирование информации, например), этот простейший формат быстро стал чрезвычайно популярным за счёт узкой категоризации подмножества используемых метаданных. Отличие RSS от RDF состоит в том, что субъектом тройки всегда является сайт-источник RSS-файла, а в качестве отношений используются самые очевидные свойства документов, имеющие отношение к часто обновляющимся источникам информации: дата написания, автор, постоянная ссылка, и т. д. Другими словами, RSS — узкоспециализированное подмножество RDF.[13]

Заметим, что формат RSS версии 2.0, хотя и не является форматом, основанным на RDF, позволяет внедрение произвольного XML-содержимого, находящегося в собственных пространствах имён XML. Это позволяет использовать RDF-описания также и в нём (используя пространство имён rdf).[14]

4.3. FOAF

Проект «Friend of a Friend» («Друг друга») позволяет описывать отношение знакомства с помощью RDF. Любой его участник может идентифицировать себя уникальным образом с помощью URI (например, mailto-адресом электронной почты, адресом блога, и т. п.), создать свой профиль, используя предопределённые для FOAF отношения на языке RDF, и перечислить идентификаторы людей, которых этот участник знает. Это описание может обрабатываться автоматически; на его основе можно строить сети доверия, анализировать структуру социальных групп, и т. д.[15]

4.4. DBpedia

DBpedia — проект, направленный на извлечение структурированной информации из данных, созданных в рамках проекта Wikipedia. DBpedia позволяет пользователям запрашивать информацию, основанную на отношениях и свойствах ресурсов Википедии, в том числе ссылки на соответствующие базы данных. Начат группой добровольцев из Свободного университета Берлина и Лейпцигского университета, в сотрудничестве с OpenLink Software, и впервые был опубликован в 2007 году. Проект DBpedia использует Resource Description Framework (RDF) для представления извлеченной информации. По состоянию на апрель 2010, базы данных DBpedia состоят из более чем 1 млрд единиц информации, из которых 257 млн были взяты из английской версии Википедии и 766 млн извлечены из версий на других языках[16].

Примечания

  1. The Semantic Web. - www.scientificamerican.com/article.cfm?articleID=00048144-10D2-1C70-84A9809EC588EF21 Scientific American, 17 мая 2001, русский перевод: Семантическая Сеть - ezolin.pisem.net/logic/semantic_web_rus.html
  2. Раздел о Семантической паутине на сайте W3C - www.w3.org/standards/semanticweb/  (англ.)
  3. Resource Description Framework (RDF): Concepts and Abstract Syntax - www.w3.org/TR/2004/REC-rdf-concepts-20040210/  (англ.). Консорциум Всемирной паутины (10 февраля 2004 года). — W3C Recommendation.
  4. Cool URIs for the Semantic Web - www.w3.org/TR/cooluris/  (англ.). Консорциум Всемирной паутины (3 декабря 2008 года). — W3C Interest Group Note.
  5. Semantic Web Revisited - eprints.ecs.soton.ac.uk/12614/1/Semantic_Web_Revisted.pdf, IEEE Intelligent Systems, июнь 2006
  6. Cory Doctorow, Metacrap: Putting the torch to seven straw-men of the meta-utopia, - www.well.com/~doctorow/metacrap.htm август 2001
  7. Rohit Khare, Tantek Çelik, Microformats: A Pragmatic Path to the Semantic Web, - www.commercenet.com/images/e/ea/CN-TR-06-01.pdf январь 2006
  8. RDFa Primer - www.w3.org/TR/xhtml-rdfa-primer/
  9. Ахиллесова пята Семантического Веба - www.computerra.ru/magazine/362912/, Компьютерра
  10. The Species of OWL in OWL Language Guide - www.w3.org/TR/owl-guide/#OwlVarieties
  11. OWL Full, OWL DL and OWL Lite in OWL Language Reference - www.w3.org/TR/owl-ref/#Sublanguage-def
  12. Dublin Core Metadata Initiative (DCMI) - dublincore.org/
  13. RSS 1.0 Specification - web.resource.org/rss/1.0/spec
  14. RSS 2.0 Specification - cyber.law.harvard.edu/rss/rss.html#extendingRss
  15. Friend of a Friend - www.link14
  16. DBpedia Mappings - mappings.link15

Литература

wreferat.baza-referat.ru


Смотрите также