Реферат многоядерные процессоры


Многоядерные Процессоры Реферат - nixvacation

Многоядерный процессор имеет два или больше "исполнительных ядер". Операционная система рассматривает каждое из. Увеличение производительности за счёт многоядерности. Нужны ли многоядерные процессоры? Характеристики многоядерных процессоров. Читать реферат online по теме 'Современные процессоры Intel и AMD '. Высокопроизводительные многоядерные процессоры для встраиваемых приложений. Многоядерные процессоры с низким.

Многоядерные Процессоры Реферат Заключение

Многоядерные Процессоры Реферат Скачать Бесплатно

Будущее многоядерных процессоров фирмы Intel разработчики связали с развитием микроархитектуры Р6. Первым двухъядерным процессором, ядра. История и перспективы развития производства процессоров компьютеров. Основы работы центрального процессора. Характеристика многоядерных.

Современные процессоры Intel и AMD . Читать текст оnline - Министерство Образования и Науки Российской. Федерации. Федеральное Агентство по Образованию Государственное. Общеобразовательное Учреждение Высшего Профиля. Таганрогский Государственный Радиотехнический.

Университет. Рефератна тему. Современные процессоры Intel и AMD. Выполнил: Волощенко А. Э- 2. 5Проверил: Вишневецкий В. Ю. Таганрог 2. 00. ОГЛАВЛЕНИЕВВЕДЕНИЕ. Функции и строение процессора.

В будущем количество ядер в процессорах будет только возрастать, Но есть и оптимизированные под многоядерные процессоры. Плюс сегодня процессор с намного меньшей тактовой частотой может спокойно обойти более быстрого собрата, а многоядерный. Содержание: Введение.Структура многоядерных вычислительных комплексов.1 Структура процессора.2 Структура многоядерных процессоров.

Особенности и различия. Intel и AMD. 9. 64- разрядные процессоры AMD и. Intel. 9Отличия процессоров Pentium и.

Celeron, Athlon и Duron. Основные недостатки.

AMD и Intel. 12. Новые разработки компаний Intel и AMD. Двуядерный процессор. Технологии создания процессора. Сравнениепроцессоров AMD Athlon 6. Pentium 4 Extreme Edition. ЗАКЛЮЧЕНИЕ. 2. 1Список литературы. Процессоры. персональных компьютеров отвечают единому стандарту, который задан фирмой Intel, мировым лидером в производстве.

ПК. В старых компьютерах мы можем найти процессоры типов Pentium. II, Pentium. III, в новейших - Pentium 4. Фирма AMD выпускает процессоры, в общем. K6 (пентиум второй), К7 или Athlon (пентиум третий).

Поэтому AMD приходится. Intel с ее полумиллиардными. Предсказуемо появление новых идей у отстающей компании — для нее это. Но неожиданно то, что иногда эти идеи принимает на вооружение и.

Intel. Речь идет о IBM- совместимых персональных. На нашем рынке, как, впрочем, и в мире, их подавляющее. В расчёте именно на этот стандарт пишутся игры, программы и.

Он является одним из самых важнейших. ПК. Микропроцессор является . Он осуществляет выполнение программ, работающих. Когда. выбирают себе компьютер, первым делом выбирают себе микропроцессор, который. От процессора зависит. Win. RAR, не говоря уже о создании трёхмерной анимации в 3.

D MAX Studio. Из всего выше сказанного, я считаю, что моя тема очень. Осуществляет координацию работы всех остальных устройств, выполняет. Так называется устройство для целочисленных операций. Арифметические. операции, такие как сложение, умножение и деление, а также логические операции. OR, AND, ASL, ROL и др.) обрабатываются при помощи АЛУ.

Эти операции. составляют подавляющее большинство программного кода в большинстве программ. Каждое способно исполнять арифметические. Арифметико- логическое устройствовыполняет. Логические операции делятся на две.

Обычно эти два устройства выделяются чисто условно, конструктивно. Это устройство не менее. АЛУ, т. к. Абсолютная адресация в программах используется только в. Как только берутся массивы данных, в программном коде. AGU. Процессор может содержать несколько.

Каждый из них способен выполнять, по меньшей. АЛУ. Метод конвейерной обработки данных позволяет одному математическому сопроцессору. Сопроцессор поддерживает.

Сопроцессор. работает параллельно с центральным процессором, обеспечивая, таким образом. Система выполняет команды сопроцессора в том. Математический сопроцессор. IBM PC позволяет ему выполнять скоростные. Анализирует. инструкции в целях выделения операндов и адресов, по которым размещаются. Затем следует сообщение другому независимому устройству о том, что. Дешифратор допускает выполнение.

Особая высокоскоростная. Кэш используется в качестве буфера для ускорения обмена. Значения из. кэш- памяти извлекаются напрямую, без обращения к основной памяти. При изучении. особенностей работы программ было обнаружено, что они обращаются к тем или иным. Предположим. что микропроцессор способен хранить копии этих инструкций в своей локальной. В этом случае процессор сможет каждый раз использовать копию этих. Доступ к памяти понадобиться в самом.

Для хранения этих инструкций необходим совсем небольшой объём памяти. Таким образом экономиться время на выполнение. Но для самых быстродействующих микропроцессоров этого недостаточно. Память. внутри микропроцессора может работать со скоростью самого процессора. Она быстрее всех остальных типов.

Хранит совсем недавно использованную информацию. Также находится внутри процессора. Информация. хранящаяся в ней, используется реже, чем информация, хранящаяся в кэш- памяти. Находиться внутри процессора. По. объему больше чем память первого и второго уровней(5. Кб- 2. Мб). Увеличивает. Намного больше по объёму.

Так, если. сократить время доступа к основной памяти на 3. Кэш- память, как. Все. зависит от того, насколько приложение оптимизировано под данную структуру и использует. Такая. кэш- память называется кэшем с обратной записью (write back cache). Её. возможности и принципы работы заметно отличаются от характеристик кэша со сквозной. Шина может. представлять собой набор проводящих линий в печатной плате, провода, припаянные. Информация передается по шине в виде групп битов.

В состав шины для. К шине может быть подключено много приемных. Обычно данные на шине предназначаются только для. Сочетание управляющих и адресных сигналов, определяет для кого.

Управляющая логика возбуждает специальные стробирующие сигналы, чтобы. Получатели и. отправители могут быть однонаправленными (т. Однако самая. быстрая процессорная шина не сильно поможет, если память не сможет доставлять.

Служит для пересылки данных. Эти. данные могут представлять собой как команды микропроцессора, так и информацию. Используется ЦП для выбора. По ней передаются. Эти. сигналы указывают направление передачи данных (в процессор или из него). В этой таблице находятся все адреса.

Процессоры Athlon еще используют. BHT - Branch History Table), которая содержит. Представляют собой ряд специализированных дополнительных ячеек. Регистр. является устройством временного хранения данных, числа или команды и. Основным элементом регистра является. Существует несколько типов регистров, отличающихся видом. Данная технология создавалась.

Возможности EPIC огромны: во- первых, это высокая. Во- вторых, поддержка.

И, в- третьих, благодаря улучшению считывания данных из. Новая технология. В новом процессоре был сделан ряд. Это позволило получить новый. Это приводит к полной совместимости как 3. Intel же стремится показать себя.

Они позволяют расширить адресуемое пространство. Гб, которое. создает ощутимые трудности при построении систем обработки информации. Для. ускорения работы с памятью используется технология NUMA, позволяющая работать напрямую с. Такое нововведение было.

Hyper. Transport и появилось в первом чипсете. Режимы совместимости со старыми. Уменьшение количества ошибок, так.

Главной является EMCA, которая позволяет вести контроль и. И. второстепенная технология ECC. Поддержка многопроцессорности.

Так. как компания Intel ориентировала свой процессор. Процессор был. снабжен рядом микросхем, которые позволяют вести быстрый обмен с памятью. При этом процессор работает с 6.

Гб/сек. В итоге получается, что. IA- 3. 2. Эмуляция есть эмуляция, никакой производительности при этом. Itanium целиком и полностью ориентирован для. Для улучшения производительности со старыми платформами были придуманы. В первом. открываются все достоинства технологии x.

Для полной совместимости над. В режиме Legacy процессор работает. Преимуществом такой системы режимов. Помимо этого существует несколько преимуществ. IA- 6. 4. 1. Быстродействие в обработке. Связано с тем, что после перехода в режим. Этого нет в Itanium, поскольку там все инструкции.

Полная совместимость с. В Itanium подобное реализовано не полностью. Одновременная работа 1. Благодаря введению режимов, становится возможным обрабатывать ряд. Это сказывается на производительности и. Как правило, этот процессор используют на мощных. AMD же ориентировался как нечто среднее между 3.

Причем раньше процессор стоил в три раза дороже: около. Учитывая, сколько будет стоить материнская. Остальные. 6. 4- разрядные процессоры стоят от $3.

Intel. У процессоров Duron по сравнению с Athlon в 4 раза. МHz (2. 66. MHz для Applebred). Так же уже. появились урезанные по кэшу Barton’ы, ядро которых носит название Thorton. Есть. задачи, в которых между обычными и урезанными процессорами почти нет разницы, а. В среднем же, при сравнении.

Зато. урезанные процессоры имеют тенденцию лучше разгоняться из- за меньшего объёма. Необходимо отметить, что процессоры. Celeron работают весьма плохо по сравнению с полноценными P4 - отставание в. Это не касается процессоров Celeron D,в. Celeron) и отставание уже не такое большое.

Основным недостатком недавно считалась температура. Но. последние модели (на ядрах Thoroughbred, Barton и т. По. надёжности процессоры теперь тоже не сильно уступают P4, они хоть и не могут. Athlon. XP на ядре Barton обзавелись похожей функцией Bus. Disconnect - она. Поэтому вероятность повреждения кристалла. А вот у Athlon 6.

Все неполадки приписываемые AMD часто являются следствием. VIA (VIA 4 in 1 Service Pack) или драйверов чипcетов других. AMD, SIS, ALi). Но есть и ряд программ, лучше работающих с.

AXP. В основном это - игры. Для обычного пользователя стоит ориентироваться.

Уже. выпущены процессоры AXP Barton с 4. Mhz шиной и принципиально новые K8. Чтобы использовать несколько. Такой подход позволяет распределить нагрузки по всем. Впрочем, большинство программ. В то же время, одноядерные. AMD просит около $1.

Opteron 2. 75 (2,2 ГГц), в то время как пара одноядерных Opteron 2. Двуядерный. Xeon на 2,8 ГГц стоит около $1. ГГц одноядерных Xeon. Два 3,2- ГГц Xeon стоят около $7. Цена двухпроцессорных. Socket 9. 40 подразумевает, что каждый процессор оснащается. Выбирались самые доступные модули памяти от популярных.

Мбайт для двухпроцессорной конфигурации против 2x 1 Гбайт для двуядерных. CPU). Платформа Intel. Однопроцессорная система. CPUДвухпроцессорная система. CPUДвухпроцессорная система. CPUПлатформа. Intel Pentium Processor.

Extreme Edition 8. ГГц)$1. 00. 0. Intel Xeon Dual Core.

Processor 2,8 ГГц$1. Intel Xeon Processor. ГГц (2 Мбайт кэша)$7. Материнская плата. Гбайт DDR2- 6. 67$2.

Гбайт DDR2- 4. 00. ECC регистровая$2. Гбайт DDR2- 4. 00. ECC регистровая$2.

Суммарная цена$1. Комментарии. Нельзя модернизировать. Pentium D 8. 40 даёт примерно такую же производительность, хотя стоит на $5. Но он не поддерживает Hyper- Threading. Первый заключается в создании тесно связанных двух ядер на едином. Второй способ - сочетать два обычных ядра на едином кристалле.

nixvacation.weebly.com

Многоядерные процессоры, реферат — allRefers.ru

Многоядерные процессоры - раздел Компьютеры, Двухъядерные процессоры Intel и AMD

Основные вехи в истории создания двухъядерных процессоров таковы:

1999 год – анонс первого двухъядерного процессора в мире (IBM Power4 для серверов)2001 год – начало продаж двухъядерного IBM Power42002 год – почти одновременно AMD и Intel объявляют о перспективах создания своих двухъядерных процессоров2002 год – выход процессоров Intel Xeon и Intel Pentium 4 с технологией Hyper-Threading, обеспечивающей виртуальную двухпроцессорность на одном кристалле2004 год – свой двухъядерный процессор выпустила Sun (UltraSPARC IV)2004 год – IBM выпустила второе поколение своих двухъядерных процессоров (IBM Power5). Каждое процессорное ядро Power5 поддерживает аналог технологии Hyper-Threading2005 год, 18 марта – Intel выпустила первый в мире двухъядерный процессор архитектуры x862005 год, 21 марта – AMD анонсировала полную линейку серверных двухъядерных процессоров Opteron, анонсировала десктопные двухъядерные процессоры Athlon 64 X2 и начала поставки двухъядерных Opteron 8xx2005 год, 20-25 мая – AMD начинает поставки двухядерных Opteron 2xx2005 год, 26 мая – Intel выпускает двухъядерные Pentium D для массовых ПК2005 год, 31 мая – AMD начинает поставки Athlon 64 X2

Идея многоядерного процессора выглядит на первый взгляд совершенно тривиальной: просто упаковываем два-три (ну или сколько там влезет) процессора в один корпус - и компьютер получает возможность исполнять несколько программных потоков одновременно. Вроде бы бесхитростная стратегия… но конкретные её реализации в недавно вышедших настольных процессорах AMD и Intel заметно различаются. Различаются настолько, что сугубо «количественные» мелочи в конечном итоге переходят в качественные различия между процессорами этих двух компаний. Поэтому перед тем как переходить собственно к тестам современных двухъядерников, попробуем разобраться в различиях подходов этих микропроцессорных гигантов и, так сказать, «авансом» высказать некоторые предположения об их производительности.

Intel Smithfield: «классика жанра»

При создании многоядерных процессоров для настольных ПК микропроцессорный гигант предпочел пойти на первых порах по пути «наименьшего сопротивления», продолжив традиции создания привычных для себя SMP-систем с общей шиной. Выглядит подобная MP-система чрезвычайно просто: один чипсет, к которому подключается вся оперативная память, и одна процессорная шина, к которой подключены все процессоры:

В случае новеньких двухъядерных процессоров Smithfield два обычных ядра, аналогичных Prescott, просто расположены рядом на одном кристалле кремния и электрически подключены к одной (общей) системной шине. Никакой общей схемотехники у этих ядер нет.

 

У каждого «ядра» Smithfield – свой APIC, вычислительное ядро, кэш-память второго уровня и (что особенно важно) – свой интерфейс процессорной шины (Bus I/F). Последнее обстоятельство означает, что двухъядерный процессор Intel с точки зрения любой внешней логики будет выглядеть в точности как два обыкновенных процессора (типа Intel Xeon).

Сегодняшнее ядро Smithfield является «монолитным» (два ядра образуют единый кристалл процессора), однако следующее поколение настольных процессоров Intel (Presler, изготавливаемый по 65-нм технологии) будет еще тривиальнее – два одинаковых кристалла одноядерных процессоров (Cedar Mill) просто будут упакованы в одном корпусе (см. рис.).

Presler Cedar Mill

Точно таким же будет и первый серверный процессор Intel данной микроархитектуры, известный сейчас под именем Dempsey. Но если у Smithfield на каждое из ядер приходится по 1 Мбайт кэш-памяти второго уровня, то у Presler и Dempsey это будет уже по 2 Мбайт на ядро.

Presler Dempsey

Между тем, позднее у Intel пойдут другие, более сложные в плане микроархитектуры варианты двухъядерных процессоров, среди которых стоит отметить Montecito (двухъядерный Itanium), Yonah (двухъядерный аналог Pentium M) и Paxville для многопроцессорных серверов на базе Intel Xeon MP. Еще в марте этого года Патрик Гелсингер объявил, что в разработке у Intel находятся аж 15 различных многоядерных CPU, и пять из них корпорация даже демонстрировала в работе.

Причем, если еще в середине 2004 года официальные лица Intel отмечали, что многоядерные процессоры – это не «очередная гонка за производительностью», поскольку программная инфраструктура была тогда еще не очень готова поддержать такие процессоры оптимизированными приложениями, то теперь многоядерность у Intel поставлена во главу угла во всех базовых направлениях деятельности, в том числе – в разработке и отладке приложений (ну разве что кроме коммуникаций и сенсорных сетей – пока ;)). И в этом нет ничего удивительного – тактовую частоту процессоров стало наращивать все труднее и труднее, и, стало быть, надо искать что-то на cмену «гонки за мегагерцами». А добавляя ядра, производительность в ряде современных приложений уже можно заметно поднять, не повышая частоты. Да и пресловутый закон Мура (удвоение числа транзисторов на кристаллах) надо бы чем-то поддержать, а многоядерность – чуть ли не самый простой путь для этого… :)

Собственно, мультиядерность в текущем понимании Intel – это один из трех возможных вариантов:

1. Независимые процессорные ядра, каждое со своей кэш-памятью, расположены на одном кристалле и просто используют общую системную шину. Это - 90-нанометровый Pentium D на ядре Smithfield.

2. Похожий вариант – когда несколько одинаковых ядер расположены на разных кристаллах, но объединены вместе с одном корпусе процессора (многочиповый процессор). Таким будет 65-нанометровое поколение процессоров семейств Pentium и Xeon на ядрах Presler и Dempsey.

3. Наконец, ядра могут быть тесно переплетены между собой на одном кристалле и использовать некоторые общие ресурсы кристалла (скажем, шину и кэш-память). Таким является ближайший Itanium на ядре Montecito. А также мобильный Yonah, выход которого обещает наделать очень много шума.

Попутно отметим, что Montecito, изготавливаемый по 90-нм техпроцессу, будет иметь по сравнению с предшественником на 130-нм ядре Madison и ряд других преимуществ: наличие Hyper-Threading (то есть он будет виден в системе как 4 логических процессора), заметно меньшее энергопотребление, более высокую производительность (в 1,5 раза и выше), вчетверо больший размер кэш-памяти (свыше 24 Мбайт: 2x1 Мбайт L2 инструкций, 2x12 Мбайт L3 данных), 1,72 миллиарда транзисторов против 410 миллионов и другое. Выйдет этот процессор в четвертом квартале 2005 года.

 

Не менее интересным ожидается и первый двухъядерный мобильный процессор Yonah, который должен появиться в начале 2006 года в рамках новой мобильной платформы Napa. Yonah будет иметь два вычислительных ядра, использующих общую 2-мегабайтную кэш-память второго уровня и общий же контроллер системной шины QPB с частотой 667 МГц. Он будет выпускаться по 65-нм технологии в форм-факторах PGA 478 и BGA 479, содержать 151,6 млн. транзисторов, поддерживать технологию XD-bit и, судя по предварительной информации, поддерживать некоторые механизмы прямого взаимодействия ядер между собой.

Более того, Intel не исключают и того, что процессоры на «мобильном» ядре Yonah будут использоваться не только в определенных сегментах рынка настольных компьютеров (для этого уже разработаны и демонстрируются соответствующие мини-концепты домашнего и офисного ПК), но даже в компактных экономичных серверах.

allrefers.ru

Многоядерные Процессоры Реферат - dagormontreal

  1. На этой встрече обсуждалась среднесрочная перспектива развития многоядерных процессоров, однако, хотя речь шла о недалеком.
  2. Можно утверждать, что наступила эпоха многоядерных процессоров. На момент написания данного реферата магистерская работа еще не завершена.
Многоядерные Процессоры Реферат

Многоядерные архитектуры современных вычислительных комплексов. Курсовая работа (т). Читать текст оnline - Структура процессора (Рисунок 1). Ядро связано с остальной частью чипа (называемой «упаковка», CPU Package) по технологии «флип- чип» (flip- chip, flip- chip bonding - перевернутое ядро, крепление методом перевернутого кристалла). Эта технология получила такое название потому, что обращенная наружу - видимая - часть ядра на самом деле является его «дном», - чтобы обеспечить прямой контакт с радиатором кулера для лучшей теплоотдачи. С обратной (невидимой) стороны находится сам «интерфейс» - соединение кристалла и упаковки.

Соединение ядра процессора с упаковкой выполнено с помощью столбиковых выводов (Solder Bumps). Ядро расположено на текстолитовой основе, по которой проходят контактные дорожки к «ножкам» (контактным площадкам), залито термическим интерфейсом и закрыто защитной металлической крышкой. Корпорацией Intel. Он содержал 2. 30. Гц и стоил $3. 00. Но если раньше производителям процессоров приходилось постоянно подстраиваться под текущие насущные (вечно растущие!) запросы пользователей ПК, то теперь чипмейкеры идут с бо- о- о- льшим опережением! Однако дальнейшее повышение тактовой частоты (при тактовой частоте более 3,8 ГГц чипы попросту перегреваются!) упирается в ряд фундаментальных физических барьеров (поскольку технологический процесс почти вплотную приблизился к размерам атома: сегодня процессоры выпускаются по 4.

Это ведет к повышению потребляемой мощности и увеличению выброса тепла. При этом возрастают резистивно- емкостные задержки передачи сигналов, что является дополнительным узким местом, связанным с повышением тактовой частоты. Поэтому было решено добиваться дальнейшего повышения производительности микропроцессоров другими средствами.

Самым эффективным направлением была признана концепция многопоточности, зародившаяся в мире суперкомпьютеров, - это одновременная параллельная обработка нескольких потоков команд. Hyper- threading значительно повышает эффективность выполнения ресурсоемких приложений (например, связанных с аудио- и видеоредактированием, 3. D- моделированием), а также работу ОС в многозадачном режиме.

Поиск на сайте MathSolution.ru рефератов, курсовых, дипломных и контрольных работ, презентаций и т.д. Результат поиска. Наименование: реферат Многоядерные процессоры, типы, характеристики. Информация: Тип работы: реферат.

В 2- ядерном чипе параллельно работают два ядра (два процессора!), которые при меньшей тактовой частоте обеспечивают большую производительность, поскольку параллельно (одновременно!) выполняются два независимых потока инструкций. Необходимость в TLP зависит от конкретной ситуации (в некоторых случаях она просто бесполезна!). Так как с оперативной памятью одновременно работают сразу два и более ядра, необходимо «научить» их работать без конфликтов. Возросшее энергопотребление требует применения мощных схем питания. Требуется более мощная система охлаждения.

Количество оптимизированного под многоядерность программного обеспечения ничтожно мало (большинство программ рассчитаны на работу в классическом одноядерном режиме, поэтому они просто не могут задействовать вычислительную мощь дополнительных ядер). Операционные системы, поддерживающие многоядерные процессоры (например, Windows XP SP2 и выше) используют вычислительные ресурсы дополнительных ядер для собственных системных нужд. Кроме того, на практике n- ядерные процессоры не производят вычисления в n раз быстрее одноядерных: хотя прирост быстродействия и оказывается значительным, но при этом он во многом зависит от типа приложения. У программ, которые не рассчитаны на работу с многоядерными процессорами, быстродействие увеличивается всего на 5%. А вот оптимизированные под многоядерные процессоры программы работают быстрее уже на 5.

Очевидно, что для современного покупателя приобретение 4- ядерного процессора для домашних нужд пока почти не имеет смысла по многим причинам. Во- первых, на сегодня практически нет программ, способных эффективно использовать преимущества 4- х одновременно работающих потоков; во- вторых, производители ПК позиционируют 4- ядерные процессоры, как Hi- End- решения, добавляя к оснастке ПК самые современные видеокарты и объемные жесткие диски, - а это в конечном счете еще больше увеличивает стоимость и без того недешевых ПК. Разработчики Intel говорят: «. Программное обеспеченье многоядерных вычислительных комплексов. Расчёт увеличения производительности за счет распараллеливания процессов.

Закон Амдала гласит, что прирост производительности (S) системы зависит от количества процессоров (N) и доли последовательных операций (c) в программе: S. Если лишь 1/1. 0 часть программы выполняется последовательно, то в принципе невозможно ускорение в десять раз вне зависимости от числа используемых процессоров (ядер). Важное следствие закона Амдала состоит в том, что максимальный рост производительности (в N раз при N процессорах) недостижим. В противном случае последовательно исполняемая часть программы должна быть равна нулю, что невозможно. Еще одно следствие закона таково: чем меньше доля последовательно исполняемой части программы, тем больше прирост производительности (рис. Следствия закона Амдала. Сегодня только небольшая часть программного обеспечения может выполняться на многоядерных процессорах, что подтверждают результаты тестов синтетических и предназначенных для конкретных классов приложений (см., например, www.

Реальный рост производительности дают лишь программы, оптимизированные под много поточность, такие как Adobe Premiere Pro 1. DMax. Очень важны разработка и внедрение драйверов устройств, поддерживающих многопоточность. При переходе с одноядерных процессоров на многоядерные приходится принимать во внимание проблему последовательного выполнения. Такая ситуация может возникнуть по разным причинам : блокировка при доступе к ресурсам, необходимость синхронизации процессов или потоков на ядрах, поддержка когерентности кэш- памяти, неравномерность загрузки.

Очень часто параллельные процессы, выполняемые на разных ядрах, нужно синхронизировать в определенные моменты. Например, приложение на одном из ядер должно использовать промежуточные данные, которые получает приложение (поток, процесс) на другом ядре. Первое приложение не может продолжить работу до получения этих данных, то есть находится в состоянии ожидания. В такой ситуации неизбежны накладные расходы на синхронизацию приложений (процессов, потоков), выполняемых на разных ядрах.

В свою очередь, это обусловливает снижение эффективности параллельной работы, что находит отражение в сетевом законе Амдала. Возникает необходимость в поддержке когерентности (согласованности) кэш- памяти для всех ядер при использовании разделяемой памяти.

Специалисты корпорации опытным путем показали эффективность регулирования тактовой частоты асимметричной многопроцессорной системы в зависимости от активности вычислительных ядер. Для обеспечения многопоточности используются различные инструменты. Так, в 2. 00. 5 году Intel выпустила версию 9. C++ и Фортран для платформ Linux и Windows. Этот компилятор позволяет эффективно использовать возможности технологии Hyper- Threading и многоядерных процессоров. Он поддерживает возможность автопараллелизма, то есть автоматического обнаружения в приложениях возможности создания множества параллельных потоков с поддержкой спецификации Open. MP 2. 5. Для этого требуется либо указать параметр компилятора .

С ноября 2. 00. 5 года компилятор gcc для языков Cи, C++ и Фортран 9. Open. MP с помощью опции . Следует упомянуть и набор компиляторов EKOPath компании Path.

Scale, предназначенных для 6. Linux (AMD6. 4 и EM6. T). Программисты хорошо знают, как трудно отлаживать многопоточные приложения. При аварийном завершении программы зачастую требуется проанализировать стек вызовов функций во всех потоках, но обычный отладчик показывает только стек потока, на котором произошло аварийное завершение программы.

Например, стандартные средства gdb плохо приспособлены для отладки многопоточных приложений, поэтому предлагаются специальные версии этого отладчика для конкретных операционных систем: в их ядра включаются дополнительные возможности отладки многопоточных приложений. Он поддерживает многопоточность, MPI, Open. MP, языки программирования Cи/C++ и Фортран, а также смешанные коды с использованием разных языков программирования. Полезным средством оптимизации и отладки параллельных программ является пакет Intel Threading Tools. Он обеспечивает диагностику ошибок и анализ производительности многопоточных приложений, использующих модели потоков Win.

Open. MP. Отладчик позволяет обнаруживать взаимные блокировки (deadlock) и гонки (race condition) между потоками, локализовать проблемы на уровне исходного кода, анализировать эффективность способов повышения производительности Open. MP- программ. Их обеспечивает, например, TRACE3.

Lauterbach. Благодаря полной поддержке встроенных аппаратных блоков управления памятью можно одновременно отлаживать процессы на нескольких виртуальных машинах и даже два варианта одного процесса на разных виртуальных машинах. В частности, Lauterbach объявила о выпуске программного инструментария интегрированной поддержки ядра (kernel awareness) для операционной системы Lynx. OS- 1. 78. Чтобы получить доступ ко всем функциями TRACE3.

Отлаживается именно то приложение, которое будет действовать в конечном продукте, что очень важно для его сертификации. Три основных подхода к реализации этих систем различаются методами взаимодействия параллельных задач. Первый подход базируется на концепции обмена сообщениями, второй - на использовании разделяемой памяти, третий опирается на стандарт POSIX и объединяет эти два подхода. MPI обеспечивает примерно 2. Среди наиболее распространенных ее реализаций библиотека MPICH. Кроме того, предлагаются несколько коммерческих реализаций MPI, например MPI/Pro компании Verari Systems Software. MPI/Pro оптимизирует время работы параллельных приложений и поддерживает их масштабируемость за счет балансировки параметров производительности и использования ресурсов.

Verari предлагает версии MPI/Pro для разных операционных систем, в том числе Windows, Linux, Mac OS X, Lynx. OS, и таких коммуникационных сред, как Gigabit Ethernet, Myrinet и Infini. Band. Ее первая версия (www.

dagormontreal.weebly.com


Смотрите также