Кеш-пам'ять мікропроцесорів фірм Intel і AMD
Визначення поняття і використання об'єму кеш-пам'яті. Принципи просторової та тимчасової локальності. Типи та стратегія розміщення кешу. Недоліки і переваги змішаної та розділеної пам'яті. Новітні версії процесорів та їх порівняльна характеристика.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | курсовая работа |
Язык | украинский |
Дата добавления | 07.06.2010 |
Размер файла | 25,3 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
12
Львівський державний інститут новітніх технологій та управління
ім. В. Чорновола
Курсовий проект
на тему:
Кеш-пам'ять мікропроцесорів фірм Intel і AMD
Виконав:
студ. гр. КІ-31
Митюк Ярослав
Львів-2010
Зміст
Введення
1. Стратегія розміщення.
2. Змішана і розділена кеш-пам'ять.
3. Pentium III
4. Pentium IV
5. AMD-K6 ®-III
6. AMD Athlon.
7. Порівняння деяких Intel і AMD
Введення
В якості елементної бази основної пам'яті в більшості ЕОМ використовуються мікросхеми динамічних ОЗУ, на порядок поступаються за швидкодією центрального процесора. У результаті, процесор змушений простоювати кілька періодів тактової частоти, поки інформація з ІМС пам'яті встановиться на шині даних ЕОМ. Якщо ж ВП виконати на швидких мікросхемах статичної пам'яті, вартість ЕОМ зросте досить істотно.
Економічне прийнятне рішення цієї проблеми можливе при використанні дворівневої пам'яті, коли між основною пам'яттю і процесором розміщується невелика, але швидкодіюча буферна пам'ять або кеш-пам'ять. Разом з основною пам'яттю вона входить в ієрархічну структуру і її дія еквівалентно швидкому доступу до основної пам'яті. Використання кеш-пам'яті дозволяє уникнути повного заповнення всієї машини швидкої RAM пам'яттю. Зазвичай програма використовує пам'ять будь-якої обмеженої області, зберігаючи потрібну інформацію в кеш-пам'яті, робота з якою дозволяє процесору обходитися без всяких циклів очікування. У великих універсальних ЕОМ, основна пам'ять яких має ємність близько 1-32 Гбайт, зазвичай використовується кеш-пам'ять ємність 1-12 Мбайт, тобто ємність кеш-пам'ять складає близько 1/100-1/500 ємності основної пам'яті, а швидкодія в 5-10 разів вище швидкодії основної пам'яті. Вибір об'єму кеш-пам'яті - завжди компроміс між вартісними показниками (в порівнянні з ОП) та її ємністю, яка повинна бути досить великою, щоб середній час доступу в системі, яка складається із основної і кеш-пам'яті, визначалося часом доступу до останньої. Реальна ефективність використання кеш-пам'яті залежить від характеру вирішуваних завдань і неможливо визначити заздалегідь, який обсяг її буде дійсно оптимальним.
Не всяка кеш-пам'ять рівнозначна. Велике значення має той факт, як багато інформації може містити кеш-пам'ять. Чим більше кеш-пам'ять, тим більше інформації може бути в ній розміщене, а отже, тим більше ймовірність, що потрібний байт буде міститися в цій швидкої пам'яті. Очевидно, що найкращий варіант - це коли об'єм кеш-пам'яті відповідає обсягу всієї оперативної пам'яті. У цьому випадку вся інша пам'ять стає не потрібною. Вкрай протилежна ситуація - 1 байт кеш-пам'яті - теж не має практичного значення, тому що ймовірність того, що потрібна інформація виявиться в цьому байті, прямує до нуля.
У процесі роботи такої системи в буферну пам'ять копіюються ті ділянки ВП, до яких проводиться звернення з боку процесора. Виграш досягається за рахунок властивості локальності, зважаючи на велику ймовірність звернення процесором до команд, які лежать в сусідніх комірках пам'яті.
Кеш-пам'ять, що складається з m слів, зберігає копії не менше, ніж m-слів з усіх слів основної пам'яті. Якщо копія, до адресою якої був виконаний доступ ЦП, існує в кеш-пам'яті, то зчитування завершується вже при доступі до кеш-пам'яті. Відзначимо, що використання кеш-пам'яті грунтується на принципах просторової і тимчасової локальності. У разі просторової локальності основна пам'ять розбивається на блоки з фіксованим числом слів і обмін даними між основною пам'яттю та кеш-пам'яттю виконується блоками. При доступі до деякого адресою центральний процесор повинен спочатку визначити чи містить кеш-пам'ять копію блоку з вказаною адресою, і якщо є, то визначити, з якого адреси кеш-пам'яті починається цей блок. Цю інформацію ЦП отримує за допомогою механізму перетворення адрес.
1. Стратегія розміщення.
На складність цього механізму істотний вплив надає стратегія розміщення, що визначає, в яке місце кеш-пам'яті слід помістити кожен блок з основної пам'яті.
Залежно від способу розміщення даних основної пам'яті в кеш-пам'яті існує три типи кеш-пам'яті:
кеш з прямим відображенням (розміщенням);
повністю асоціативний кеш;
множинний асоціативний кеш або частково-асоціативний.
Кеш з прямим відображенням (розміщенням) є найпростішим типом буфера. Адреса пам'яті однозначно визначає рядок кеша, в яку буде поміщений блок інформації. При цьому передбачається, що оперативна пам'ять розбита на блоки і кожному такому блоку в буфері відводиться всього один рядок. Це простий і недорогий у реалізації спосіб відображення. Основний його недолік - жорстке закріплення за певними блоками ВП одного рядка в кеші. Тому, якщо програма по черзі звертається до слів з двох різних блоків, що відображаються на одну й ту ж рядок кеш-пам'яті, постійно буде відбуватися оновлення цього рядка і вірогідність попадання буде низькою.
Кеш з повністю асоціативним відображенням дозволяє подолати недолік прямого, дозволяючи завантаження будь-якого блоку ВП в будь-який рядок кеш-пам'яті. Логіка управління виділяє в адресі ВП два поля: поле тега і поле слова. Поле тега збігається з адресою блоку ВП. Для перевірки наявності копії блоку в кеш-пам'яті, логіка управління кеша повинна одночасно перевірити теги всіх рядків на збіг з полем тега адреси. Асоціативне відображення забезпечує гнучкість при виборі рядка для знову записуваного блоку. Принциповий недолік цього способу - в необхідності використання дорогої асоціативної пам'яті.
Множинне-асоціативний тип або частково-асоціативний тип відображення - це один з можливих компромісів, що поєднує достоїнства прямого та асоціативного способів. Кеш-пам'ять (і тегів і даних) розбивається на деяку кількість модулів. Залежність між модулем і блоками ВП така ж жорстка, як і при прямому відображенні. А ось розміщення блоків по рядках модуля довільне і для пошуку потрібної рядка в межах модуля використовується асоціативний принцип. Цей спосіб відображення найбільш широко поширений в сучасних мікропроцесорах.
Відображення секторів ВП в кеш-пам'яті.
Даний тип відображення застосовується у всіх сучасних ЕОМ і полягає в тому, що вся ВП розбивається на сектори, що складаються з фіксованого числа послідовних блоків. Кеш-пам'ять також розбивається на сектори, що містять таку ж кількість рядків. Розташування блоків в секторі ВП та секторі кешу повністю співпадає. Відображення сектора на кеш-пам'ять здійснюється асоціативно, ті будь-який сектор з ОП може бути поміщений в будь-якій сектор кеша. Таким чином, в процесі роботи АЛУ звертається в пошуках чергової команди до ВП, в результаті чого, в кеш завантажується (у разі відсутності там блоку, що містить цю команду), цілий сектор інформації з ОП, причому за принципом локальності, за рахунок цього досягається значна збільшення швидкодії системи.
2. Змішана і розділена кеш-пам'ять.
Внутрішня кеш-пам'ять використовувалася раніше як для інструкцій (команд), так і для даних. Така пам'ять називалася змішаної, а її архітектура - Прінстонський, в якій в єдиній кеш-пам'яті, відповідно до класичних принципів фон Неймана, зберігалися і команди і дані.
Порівняно недавно стало звичайним розділяти кеш-пам'ять на дві - окремо для інструкцій і окремо для даних.
Перевагою змішаної кеш-пам'яті є те, що при заданому обсязі, їй властива більш висока ймовірність влучень, в порівнянні з розділеною, оскільки в ній автоматично встановлюється оптимальний баланс між інструкціями і даними. Якщо в виконуваному фрагменті програми звернення до пам'яті пов'язані, в основному, з вибіркою інструкцій, а частка звернень до даних відносно мала, кеш-пам'ять має тенденцію заповнення інструкціями і навпаки.
З іншого боку, при роздільному кеш-пам'яті, вибірка інструкцій і даних може відбутися одночасно, при цьому виключаються можливі конфлікти. Останнє особливо істотно в системах, що використовують конвеєризація команд, де процесор витягує команди з випередженням і заповнює ними буфер або конвеєр.
Так, наприклад, в процесорі Intel ® 486 DX2 застосовувалася змішана кеш-пам'ять,
У Intel ® Pentium ® і в AMD Athlon ™ з їх суперскалярна організацією - роздільна. Більш того, в цих процесорах крім кеш-пам'яті інструкцій і кеш-пам'яті даних використовується також і адресна кеш-пам'ять. Цей вид кешу використовується в приладах управління пам'яттю, в тому числі для перетворення віртуальних адрес у фізичні.
Завдяки використанню нанотехнологій, для зниження споживаної потужності, збільшення швидкодії ЕОМ (що досягається скороченням часу обміну даними між процесором і кеш-пам'яттю) існує можливість, а більше того є реальні приклади того, що кеш-пам'ять реалізують в одному кристали з процесором. Така внутрішня кеш-пам'ять реалізується за технологією статичного ОЗП і є найбільш швидкодіючою. Обсяг її зазвичай складає 64-128 Кбайт, причому подальше збільшення її обсягу призводить звичайно до зниження швидкодії через ускладнення схем управління та дешифрування адреси.
Альтернативою, широко застосовується в даний час, є друга (зовнішня) кеш-пам'ять більшого об'єму, розташована між внутрішньою кеш-пам'яттю і ВП. У цій дворівневої системі кеш-пам'яті, внутрішньої пам'яті відводиться роль першого рівня L1, а зовнішньої - другого L2. ємність L2 зазвичай на порядок і більше вище, ніж L1, а швидкодія і вартість нижча. Пам'ять другого рівня також будується зазвичай як статичне ОЗУ. Ємність її може становити від 256 Кбайт до 1 Мбайта і технічно реалізується як у вигляді окремої мікросхеми, однак може розміщуватися і на одному кристалі з процесором.
Найсучасніші процесори від найбільших виробників оснащуються сьогодні кеш-пам'яттю ємністю у Intel Pentium 4 на ядрі Northwood - 512 Кбайт кеш-пам'яті L2, а процесори Prescott будуть випускатися по 0,09-мікронної технології і отримають кеш-пам'ять другого рівня подвоєного обсягу, який складе 1 Мбайт. Intel продовжує широко рекламувати свій "екстремальний" ігровий процесор Pentium 4 Extreme Edition на основі модифікованого серверного ядра Gallatin з тактовою частотою 3,40 ГГц і кеш-пам'яттю третього рівня об'ємом 2 Мбайта. Вона доповнює стандартний нортвудовскій кеш L2 512 Кбайт і теж працює на частоті ядра процесора (правда, з більшою рази в два латентністю). Таким чином, в сумі новий Pentium 4 Extreme Edition має кеш-пам'ять об'ємом 2,5 Мбайт.
Додаткова кеш-пам'ять третього рівня веде початок від серверних процесорів Xeon MP на 0,13-мікронному ядрі Gallatin і не має нічого спільного з прийдешнім 90-нанометрових Prescott, однак цей кристал (ядро) все ж таки трохи переробили з метою підтримки системної шини 800 МГц , зменшення енергоспоживання та ін і спакували в стандартний корпус від поточних Pentium 4. У свою чергу AMD Athlon 64 і AMD Opteron працюють на більш високій частоті 2200 МГц, виробляються по 0,13-мікронної технології (SOI) і містять 105,9 млн. транзисторів і відрізняються від попередніх Athlon XP новим ядром з 64-бітними можливостями обчислень (поряд з поліпшеними 32-бітними на базі колишнього ядра Athlon XP), кеш-пам'яттю другого рівня об'ємом 1 Мбайт (причому кеш у Атлон інклюзивних, тобто повний обсяг з урахуванням 128 Кбайт L1 становить 1152 Кбайт).
При доступі до пам'яті, ЦП спочатку звертається до кеш-пам'яті першого рівня. При промаху проводиться звернення до кеш-пам'яті другого рівня. Якщо інформація відсутня і в L2, проводиться звернення до ВП, і відповідний блок заноситься спочатку в L2, а потім і в L1. Завдяки такій процедурі, часто запитувана інформація може бути легко відновлена з кеш-пам'яті другого рівня.
Потенційна економія за рахунок застосування L2 залежить від імовірності влучень як в L1, так і L2. Однак, досвід Intel і AMD показує, що використання кеш-пам'яті другого рівня суттєво покращує продуктивність. Саме тому в усіх проанонсованих виробниками новітніх версіях процесорів застосовується дворівнева і навіть трирівнева організація кеш-пам'яті.
3. Pentium III
Процесор Intel ® Pentium ® III - процесор архітектури P6, включає в себе: динамічне виконання команд, системну шину з множинними транзакціями і технологію Intel MMX ™ для обробки даних мультимедіа. Технологія виготовлення з роздільною здатністю 0.25 мікрон дозволяє розмістити на кристалі більше 9.5 мільйонів транзисторів. Процесор містить 32 Kб неблокіруемой кеш-пам'яті першого рівня (16Кб/16Кб) та уніфіковану неблокіруемую кеш-пам'ять другого рівня ємністю 512 Кб, що функціонує на вдвічі меншій частоті, ніж ядро. Процесор Intel ® Pentium ® III підтримує кешування пам'яті з об'ємом адресного простору 4 Гб, і дозволяє створювати масштабовані системи з двома процесорами і фізичної пам'яті об'ємом до 64 Гб.
4. Pentium IV
Процесор Pentium 4 встановлює новий рівень продуктивності високопотужних мікропроцесорів.
- Системна шина з частотою 800 Мгц: 3,06 ГГц, 2,80 ГГц, 2,66 ГГц, 2,53 ГГц, 2,40 ГГц B, 2,26 ГГц
- Технологія гіперконвейерной обробки
- Механізм прискореної обробки команд
- Кеш-пам'ять першого рівня з відстеженням виконання команд
- Кеш-пам'ять з покращеною передачею даних
- Покращувана система динамічного виконання команд
- Покращений блок обчислень з плаваючою комою і обробки мультимедіа
- Набір команд потокових SIMD-розширень 2.
- У Intel Pentium 4 на ядрі Northwood - 512 Кбайт кеш-пам'яті L2.
5. AMD-K6 ®-III
Процесор AMD-K6 ®-III, кодове ім'я Sharptooth, в ньому задіяна вбудована швидкодіюча кеш-пам'ять другого рівня (L2). У процесорний кристал інтегровано 256 Кб кеш-пам'яті другого рівня, що працює на повній тактовій частоті процесора.
Процесор AMD-K6 ®-III містить 21.3 мільйона транзисторів і проводиться за 0.25-мікронної технології на тактові частоти 350, 380, 400 і 450 МГц. Об'єм кеш-пам'яті першого рівня (L1), як у всього сімейства K6, дорівнює 64Кб. Процесор AMD-K6 ®-III можна встановлювати в ті ж системні плати Super7 ™, що і AMD-K6 ® -2, при цьому знаходиться на системній платі зовнішня кеш-пам'ять 2 рівня перетворюється на кеш-пам'ять 3 рівня (L3), з якої процесор може спілкуватися з зовнішньої частотою 100 Мгц.
6. AMD Athlon
В даний час процесор AMD Athlon є найшвидшим процесором в світі. Процесор має такі особливості:
Мікроархітектура: Особливість процесора AMD Atlon ™ - це девятипоточная суперскалярна архітектура оптимізовано для високих частот. AMD Athlon ™ містить дев'ять виконуваних потоків: три для адресних операцій, три для цілочисельних обчислень, і три для виконання команд x87.
Архітектура кеш-пам'яті: AMD Athlon ™ має найбільший для платформ x86 кеш L1 (128KB) - у чотири рази перевершує L1 кеш процесора Pentium III (32KB). AMD Athlon ™ також включає високошвидкісний, 64-бітний контролер кеш пам'яті другого рівня (L2), що підтримує об'єм кеш-пам'яті другого рівня від 512Kб до 8Mб.
7. Порівняння деяких Intel і AMD
За утилітам у Pentium 4 Extreme Edition чітко видно кеш-пам'ять третього рівня об'ємом 2 Мбайт, хоча на місці і всі колишні атрибути Northwood.
Аналогічна інформація показана для Athlon 64. Цікаво, що у нового Pentium 4 менший степпінг, ніж у останніх Northwood, - 5 проти 9. За графіком тесту латентності пам'яті для Pentium 4 Extreme Edition можна укласти, що кордон кеш-пам'яті L3 лежить на 2 Мбайт, L2 - на 512 кбайт.
Отже, для двох нових процесорів Intel і AMD характерна перш за все величезна кеш-пам'ять, яка врешті-решт, і має підняти продуктивність кожного з них.
Порівняємо процесори:
-AMD Athlon 64 FX-51 (тактова частота 2200 МГц).
-AMD Athlon XP 3200 + (частота 2200 МГц, FSB 400 МГц).
-Pentium 4 (Northwood) з частотою 3,2 ГГц (FSB 800 МГц).
Pentium 4 Extreme Edition c частотою 3,2 ГГц (FSB 800 МГц).
У даному випадку абсолютна порівняння частот процесорів позбавлена сенсу, оскільки їх мікроархітектури істотно відрізняються (і навіть переслідують різні цілі): в Pentium 4 продуктивність повинна забезпечуватися переважно високою тактовою частотою (для цього і збільшили до двадцяти стадій обчислювальний конвеєр), а в Athlon упор робиться на інші особливості, часом на шкоду тактовій частоті.
Різні підходи в мікроархітектурі не дозволяють адекватно порівнювати процесори на однаковій тактовій частоті.
І приклад тому - різний межа частот при однакових технологічних нормах виробництва: для технології 0,13 мкм масовим межею ядра Pentium 4 є частота 3,2-3,4 ГГц, а в Athlon - 2,2-2,4 ГГц. Тому коректніше порівнювати процесори за межею їх частоти для тієї чи іншої технології виробництва - у даному випадку 3,2 і 2,2 ГГц.
За смузі пропускання двоканальної пам'яті попереду, безумовно, процесор AMD.
Хоча пентіуми відстають від нього помітно менше, ніж Athlon XP 3200 + (всі вони використовують двоканальну DDR400). Athlon 64 FX ближче всіх підійшов до теоретичного межею 6,4 Гбайт / с - на 86%, пентіуми показують приблизно три чверті в штатних режимах роботи (в режимах прискорення чіпсета / пам 'яті ефективність зростає до більш ніж 80%), а Athlon XP утилізує менш половини (з-за вузької системної шини). За швидкістю читання пам'яті Pentium 4 Extreme Edition майже не відрізняється від Northwood (невелике падіння можна пов'язати з вадами методу вимірювання - потоки трохи "застряють" у великому кеші L3), а Athlon 64 FX і тут поза досяжності. Зате по швидкості запису в пам'ять Pentium 4 Extreme Edition на голову випереджає всіх, включаючи Athlon 64 FX.
Список викорастаної літератури
1. Мячев А.А., Степанов В.Н. Персональные ЭВМ и микроЭВМ. Основы организации. - М.: Радио и связь, 1991.
2. Фигурнов В.Э. IBM PC для пользователя. Изд. 4-е, перераб.и доп. - М.: Финансы и статистика, НПО "Информатика и компьютеры", 1994.
3. Холленд Р. Микропроцессоры и операционные системы: Краткое справочное пособие: Пер. с англ. - М.: Энергоатомиздат, 1991.
4. Пятибратов А.П. Вычислительные машины, системы и сети. - М.: Финансы и статистика, 1991.
5. Мячев А.А. Персональные ЭВМ: Краткий энциклопедический справочник. - М.: Финансы и статистика, 1992.
Подобные документы
Історія та технологія виробництва мікропроцесорів, їх види, їх програмне забезпечення та способи використання. Розрядність головної шини як головного чинника при проектуванні системної платні і систем пам'яті. Архітектура корпуса і гнізда мікропроцесорів.
контрольная работа [29,5 K], добавлен 21.10.2009Ознайомлення з історією заснування Intel. Дослідження роботи представництва даної корпорації в Україні. Загальна характеристика комп'ютерних процесорів фірми; структури мікросхем. Опис розвитку процесу кешування. Особливості партнерства з Apple.
курсовая работа [4,7 M], добавлен 27.07.2015Ознайомлення з архітектурою Intel Core i (Nehalem) та її особливостями. Огляд технічних характеристик процесорів сімейства Nehalem. Вивчення організації віртуальної пам’яті у вказаних процесорах. Дослідження переваг використання віртуальної пам'яті.
курсовая работа [3,6 M], добавлен 15.09.2014Типи оперативної пам’яті: DDR, DDR2 і DDR3, їх порівняльна характеристика, оцінка переваг та недоліків, умови використання. Корпуси модулів пам’яті та її технічні характеристики: тип, об'єм, частота. Принципи тестування модулів та оцінка результатів.
контрольная работа [677,7 K], добавлен 08.02.2015Поняття та головні принципи створення системи управління базами даних, їх сутність, основні характеристики та складові елементи, функції та типова структура, типи. Вивчення проблеми та визначення необхідності використання даної системи в економіці.
реферат [14,6 K], добавлен 03.12.2010Архитектура системных плат на основе чипсетов Intel 6 Series и Intel P67 Express. Технологии, используемые в Intel 6 Series: Smart Response, Intel Quick Sync Video, Технология Hyper-Threading, Технология Intel vPro. Ошибка в чипсетах Intel 6-й серии.
реферат [3,3 M], добавлен 11.12.2012Поняття й головні способи персоніфікації користувача. Основи біометричної ідентифікації. Технологія зняття відбитків пальців, типи капілярних візерунків. Дослідження існуючих засобів контролю доступу на основі біометричних даних, їх недоліки та переваги.
курсовая работа [4,7 M], добавлен 30.01.2012Визначення та структура мікропроцесора, алгоритм роботи. Види процесорної пам’яті. Частота системної шини. Огляд мікропроцесорів AMD Phenom. Структура ринку сучасних мікропроцесорів, найбільш поширені архітектури. Охорона праці при роботі з комп'ютером.
курсовая работа [5,9 M], добавлен 03.01.2015Порівняльне тестування відеоадаптерів фірм Nvidia GeForce та AMD Radeon. Призначення та основні типи відеоадаптерів. Використання логічних пробників. Вимірювання номінальної напруги, струму, температури. Основні вимоги безпеки під час експлуатації ЕОМ.
курсовая работа [1,6 M], добавлен 02.11.2014Стратегия развития процессоров Intel. Структурная организация современных универсальных микропроцессоров. Особенности многоядерной процессорной микроархитектуры Intel Core, Intel Nehalem, Intel Westmere. Серверные платформы Intel c использованием Xeon.
реферат [36,5 K], добавлен 07.01.2015