fbba21eb

Высокопроизводительные компьютеры

Общие требования предъявляемые к современным компьютерам
Отношение стоимость/производительность
Надежность и отказоустойчивость
Отказоустойчивость
Масштабируемость
Масштабируемость
Совместимость и мобильность программного обеспечения

Классификация компьютеров по областям применения
Персональные компьютеры и рабочие станции
Персональные компьютеры (ПК)
Миникомпьютеры
Xтерминалы
Серверы
Мейнфреймы
Мейнфрейм


Кластерные архитектуры
Разделение ресурсов

Высокая готовность
Высокая пропускная способность
Удобство обслуживания системы
Расширяемость
Оценка производительности вычислительных систем
Общие замечания
MIPS
MFLOPS
Соотношение между реальными и нормализованными операциями с плавающей точкой
SPECint92 SPECfp92

SPECrate_int92 SPECrate_fp92
TPCA TPCB TPCC
Тесты TPC
Тест TPCA
Тест TPCB
Тест TPCC
Будущие тесты TPC
Типовая среда обработки транзакций и соответствующие оценочные тесты TPC
AIM
Основные архитектурные понятия

Определение понятия "архитектура"
Архитектура системы команд Классификация процессоров (CISC и RISC)
Методы адресации и типы данных
Методы адресации
Методы адресации
Частота использования различных методов адресации на программах TeX Spice GCC
Типы команд
Основные типы команд
Команды управления потоком команд
Типы и размеры операндов

Конвейерная организация
Что такое конвейерная обработка
Простейшая организация конвейера и оценка его производительности
Представление о работе конвейера
Диаграмма работы простейшего конвейера
Эффект конвейеризации при выполнении 3х команд четырехкратное ускорение
Структурные конфликты и способы их минимизации
А Пример структурного конфликта при реализации памяти с одним портом
Б Диаграмма работы конвейера при структурном конфликте
Конфликты по данным остановы конвейера и реализация механизма обходов

А Последовательность команд в конвейере и ускоренная пересылка данных
Б Совмещение чтения и записи регистров в одном такте
АЛУ с цепями обхода и ускоренной пересылки
Классификация конфликтов по данным
Конфликты по данным приводящие к приостановке конвейера
Последовательность команд с приостановкой конвейера
Методика планирования компилятора для устранения конфликтов по данным
Конвейерное выполнение оператора А = В + С
Пример устранения конфликтов компилятором
Сокращение потерь на выполнение команд перехода и минимизация конфликтов по управлению

Приостановка конвейера при выполнении команды условного перехода
Снижение потерь на выполнение команд условного перехода
Метод выжидания
Отражал именно такой подход Привлекательность такого решения заключается в его простоте
Метод возврата
Диаграмма работы модернизированного конвейера
Задержанные переходы
А Требования к переставляемым командам при планировании
Б показывает различные ограничения
б

Дает общее представление об эффективности
Частота заполнения одного слота задержки условного перехода
Статическое прогнозирование условных переходов использование технологии компиляторов
Проблемы реализации точного прерывания в конвейере
Причины прерываний в простейшем конвейере
Обработка многотактных операций и механизмы обходов в длинных конвейерах
Конвейер с дополнительными функциональными устройствами
Конвейер с многоступенчатыми функциональными устройствами
Конфликты и ускоренные пересылки в длинных конвейерах
Пример конфликта по записи в регистровый файл

Поддержка точных прерываний
Команда 1
Команда 2 Команда n1
Команда n
Конвейерная и суперскалярная обработка
Параллелизм на уровне выполнения
Параллелизм уровня команд зависимости и конфликты по данным
Зависимости
Параллелизм уровня цикла концепции и методы
Основы планирования загрузки конвейера и разворачивание циклов

Устранение зависимостей по данным и механизмы динамического планирования
Основная идея динамической оптимизации
Динамическая оптимизация с централизованной схемой обнаружения конфликтов
Централизованная схема управления
Регистры состояния централизованной схемы управления
Другой подход к динамическому планированию алгоритм Томасуло
Структура устройства ПТ на основе алгоритма Томасуло
Описывает станции резервирования
Теги станций резервирования и регистров
Состояние станций резервирования регистров и буферов загрузки/записи

Аппаратное прогнозирование направления переходов и снижение потерь на организацию переходов
Буфера прогнозирования условных переходов
Диаграмма состояния двухбитовой схемы прогнозирования
Сравнение качества 2битового прогноза
Буфер прогнозирования переходов (2 2)
Дальнейшее уменьшение приостановок по управлению буфера целевых адресов переходов
Буфер целевых адресов переходов
Точность прогноза для адресов возврата
Одновременная выдача нескольких команд для выполнения и динамическое планирование
Работа суперскалярного конвейера

Архитектура машин с длинным командным словом
Обнаружение и устранение зависимостей компилятором и разворачивание циклов
Обнаружение и устранение зависимостей
Программная конвейеризация символическое разворачивание циклов
Программная конвейеризация
Программная конвейеризация
Фрагмент кода с выбранной трассой
Аппаратные средства поддержки большой степени распараллеливания
Условные команды
Условные команды в современных архитектурах

Выполнение по предположению (speculation)
Расширение устройства ПТ средствами выполнения по предположению
Состояние устройства ПТ для выполнения по предположению
Иерархия памяти
Введение
Организация кэшпамяти
Типовые значения ключевых параметров для кэшпамяти рабочих станций и серверов
Где может размещаться блок в кэшпамяти?
Как найти блок находящийся в кэшпамяти?
Какой блок кэшпамяти должен быть замещен при промахе?

Сравнение долей промахов для алгоритма LRU и случайного алгоритма замещения
Что происходит во время записи?
Увеличение производительности кэшпамяти
Обобщение методов оптимизации кэшпамяти
Принципы организации основной памяти в современных компьютерах
Общие положения
Временные параметры ДЗУПВ (в последней строке приведены ожидаемые параметры)
Увеличение разрядности основной памяти
Память с расслоением
Использование специфических свойств динамических ЗУПВ

Виртуальная память и организация защиты памяти
Концепция виртуальной памяти
Страничная организация памяти
Содержание раздела