Параллельная Обработка Данных, 04 лекция (от 25 сентября)

Материал из eSyr's wiki.

Перейти к: навигация, поиск

Предыдущая лекция | Следующая лекция

Содержание

[править] Коммуникационные среды и технологии

[править] Распространенные коммуникационные технологии

  • FastEthernet. Сейчас на нем кластеры уже почти не делают, но приведем для сравнения.Скорость 100 мегабит(12.5 мегабайт). Это пиковые характеристики. При общении процессоров через MPI обычно удается достичь 6-7 МБ/сек. Латентность зависит от производителя. В среднем 70 мкс. Сейчас он уже считается слишком слабым для построения кластеров.
  • Следующее поколение Gigabit Ethernet . Его достаточно широко используют в кластерах (125 МБайт/сек). В рамках MPI удается получить порядка 45 МБайт/сек. Латентность как правило больше, чем у FastEthernet. В среднем 90-100 мкс, но можно получить и более низкую латентность. Часто используют в клаcтерах, как самое дешевое решение, или используют как вспомогательную сеть, если есть высокопроизводительные коммуникационные среды.

[править] Специализированные коммуникационные среды

  • Myrinet 2000. Пиковая пропускная способность 2 гигабита(250 МБ/сек). В рамках MPI порядка 200 МБ/сек. Латентность 10 мкс. Но это уже другой уровень стоимости. За такую коммуникационную среду надо платить примерно столько же сколько за вычислительные узлы.
  • SCI(Scalable Coherent Intropy). Правда последнее время о ней не слышно. В отличие от остальных сетевых решений не базируется на свитчах, позволяет создавать двух-трехмерные торы, в ней отсутствует понятие коммутатор, вся коммутация ведется специальными платами, вставляемыми в вычислительные узлы. Давала скорость 400 МБ/сек. И латентность 1.2 мкс. Но новых версий не выходит, поэтому популярность она потеряла. Тоже дорогая технология.
  • Сейчас наиболее популярна Infiniband. Популярна в дорогом сегменте. Изначально была рассчитана на скорость 1 ГБ/сек. Сейчас уже продают 20 ГБ/сек. К этому никто из остальных близко не подходит. Ведутся разработки ещё более быстрых. Латентность сначала была порядка 7 мкс, сейчас примерно 1.5 мкс.


Это краткие характеристики 5 основных коммуникационных технологий, используемых в кластерах. Зачастую используются несколько коммуникационных сред.

Есть множество других сетевых решений. Эти -- наиболее распространенные.

Краткий обзорчик кластеров мы на этом закончим. И подойдем к завершению темы компьютеров с распределенной памятью.

[править] Что же влияет на производительность?

-Не забываем закон Амдала, который важен для компьютеров с распределенной памятью.

-латентность и пропускная способность

-возможность асинхронной посылки сообщений -- влияет на то, что процессор не простаивает, когда общается с другими процессорами.

-равномерная загрузка узлов - очень важный фактор. Надо строить задачу таким образом, что бы все процессорам, которые есть, давалась примерно одинаковое количество данных на счет, чтобы процессоры не простаивали. Это относительно легко, когда система однородная, но становится намного сложнее если система неоднородная(узлы с разной производительностью, разной памятью). Далее, если спускаться на более низкий уровень:

-производительность процессора.Каждый процессор может иметь свою архитектуру.


Таких факторов много, это только основные И нужно учитывать, что все эти факторы действую одновременно.


[править] GRID

И как крайнюю точку компьютеров с распределенной памятью рассмотрим ещё один класс. Если мы двигаемся от компьютеров с общей памятью через компьютеры с массивно-параллельной памятью, через кластеры, то крайней точкой можно рассматривать такое понятие, как мета компьютинг, когда в качестве компьютера рассматривают компьютеры хоть как-то умеющие друг с другом общаться(даже через интернет).Это направление очень модное, так как вычислительная мощность такого компьютера потенциально ужасно огромна. GRID технологии.

[править] Весьма известные и распространенные проекты

  • PACX-MPI - расширение MPI. MPI работающий через TCP/IP. Было продемонстрировано использование 2 компьютеров(Германия-США), решающих одну задачу. Это хорошо когда в задаче выделяются большие независимые части. Расширение было разработано в конце 90 годов.
  • Condar. Занимает нерабочее время корпоративных компьютеров на полезную работу. Свободно распространяемое ПО, есть реализации под различные операционные системы.

[править] Проекты решающие конкретные прикладные задачи

  • SETI@home - всем желающим было предложено анализировать данные радиолокаторов и иаскть следы внеземных цивилизаций, но вроде ничего не нашли. Но был один из наиболее известных проектов, привлекший внимание к подобным затеям.
  • distributed.net -- продолжается даже сейчас, решает ряд задач, в первую очередь расшифровки различных шифров.
  • GIMPS - ищут простые числа. В рамках этого проекта найдено максимальное простое число 2^13466917-1.

Проектов последнее очень много, желающие могут найти информацию. Но это -- решение конкретных задач, а что делать если хочется создать более менее универсальный мета компьютер?

[править] Универсальные GRID

Наиболее популярны:

  • Globus. Недостаток - сложность установки и настройки. чтобы подключиться надо проделать много магических движений, что бы настроить прочитать много документации. Это является значительным недостатком.


Параллельная Обработка Данных


01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16


Календарь

вт вт вт вт вт
Сентябрь
04 11 18 25
Октябрь
02 09 16 23 30
Ноябрь
06 13 20 27
Декабрь
04 11 18

Материалы к зачету

Вопросы к зачету по курсу Параллельная обработка данных


Эта статья является конспектом лекции.

Эта статья ещё не вычитана. Пожалуйста, вычитайте её и исправьте ошибки, если они есть.
Личные инструменты
Разделы