Изберете Страница

Тествахме Bulldozer: FX-8150 и три дънни платки 990FX на тестовия стенд

Тествахме Bulldozer: FX-8150 и три дънни платки 990FX на тестовия стенд

Technológia

Чиповете са направени на 32nm SHP възел на GlobalFoundries. За булдозерите SOI, представен по-рано, е комбиниран с HKMG на Intel (High-K Metal Gate), което може да помогне за борба с тока на утечка. Архитектурата е добре проектирана за постигане на високи тактови честоти (“Speed ​​racer”), което прави моделната гама вероятно напълно лишена от продукти под 3 GHz. Всички централни модули на стария език са Black Edition, поради което сега не са специално маркирани.

На този етап, нека направим малко заобикаляне и да разгледаме и другата страна на монетата. Най-бързият четириядрен процесор Phenom II отчита 3,7 GHz, а 1100T, базиран на шест-ядрения чип Thuban, отчита 3,3 GHz. За сравнение, 32-нанометровият AMD FX-8150 има почти разочароващ базов изстрел и е приемливо само ниво от 4,2 GHz на Turbo Core, което веднага обещава 10-15% излишък на мощност (не). XbitLabs проветри преди година, че Булдозерът пресича часовника от 3,5 GHz, който се събра, но въпреки поредица от подхлъзвания. Изглежда правилно да се предположи, че все още има сериозни проблеми с производството и производството на новото оръдие, което има значително влияние върху производителността.

amd_buldozer_hatekonysag
Второто цяло число само увеличава размера на модула с 12 процента. [+]

Въз основа на дългогодишен опит се ражда дори основна концепция, която се основава на следното: централните звена извършват операции с фиксирана точка със среден процент от над 80 процента. От това се вижда, че изчисленията с плаваща запетая са много по-малко присъстващи в живота на „стоножки“. Следователно в дизайна са свързани две ядра с цели числа, които имат свой собствен кеш от първо ниво, но вече трябва да споделят кеша от второ ниво и модула с плаваща запетая. AMD посочи устройството като модул.

amd_bulldozer_one_module
Един модул [+]

Според вътрешните измервания, второто цяло число увеличава основно размера на модула до незначителна степен, за разлика от това, в идеалния случай може да доведе до увеличаване на производителността до 80%. Частта от основния кеш, отговаряща за данните, е директно свързана с процесорите (размер 16 Kbyte, забавяне 4 часовника), но 64 Kbyte кешът, предназначен за съхраняване на инструкции, вече е споделен между интегралите.

1_module_what_which
Рови по-дълбоко [+]

Въз основа на резултатите от теста кешът за данни L1 е не само твърде малък, но дори бавен и това заедно не е много добра комбинация. Размерът на споделеното в модула хранилище от второ ниво е задоволително, но латентността му е висока, 25-27 цикъла. Лесно е да си представим, че по-големият L1 кеш и по-бързият L2 (12-15 цикъла) ще подобрят производителността на процесора с 10-20%.

Не е изненадващо, че постигането на 8MB L3 също не е със скоростта на светлината (65 цикъла). В обобщение, кеш системата Bulldozer няма да бъде осмото чудо в света.

инструкции
В набор от инструкции лабиринт [+]

Понастоящем Bulldozer има най-широката поддръжка на набор от инструкции: MMX, SSE, SSE2, SSE3, SSE4A, SSSE3, SSE4.1, SSE4.2, AVX, AES, FMA4, XOP, PCLMULQDQ и разбира се 64-битовото разширение. От двете новости (FMA4, XOP), FMA4 е от голямо значение на пазара на HPC, а XOP предлага малко предимство пред мултимедийните приложения. Доколкото знаем, последната версия на x264 вече поддържа новите набори от инструкции. Остаряло 3DСега! поддръжката е прекратена, мисля, че не причинява на много читатели безсънни нощи.

Известно е, че използвате вашия Intel VT за достъп до x86 виртуална памет. IOMMU значително увеличава производителността на виртуализацията на системата, но изненадващо решенията от висок клас на Intel (Core i5-2600K, i7-2600K) не поддържат тази технология и този „черен кръг“ включва текущите решения Sandy Bridge E. Отново, допълнителна услуга в сравнение с пряката конкуренция, въпреки че нейната полезност за обикновения потребител е съмнителна.

40
Turbo Core на теория [+]

Turbo Core също е допълнително разработен, като работи с множество часовникови порти и дори е по-добре адаптиран към различна степен на използване. Ако всички ядра са активни, но в момента не се използват единици с плаваща запетая, часовникът Turbo Core 2.0 ще влезе в сила. Процедурата динамично променя тактовите сигнали на ядрата в зависимост от натоварването, неактивните ресурси, модулите и компонентите вътре в модула могат да бъдат изключени, така че няма да има оплаквания в тази област отпред на корпуса. За съжаление, софтуерната страна на нещата ви хвърля старателно в супата.

на практика
Практическо изпълнение [+]

Планировщикът на Windows 7, меко казано, не е най-ефективният начин за разпределяне на задачи, защото често редува разпределението на задачи между ядра. Следващата версия на операционната система ще реши проблема и скоро ще бъде направена корекция за тази система, така че - в екстремни случаи може да бъде 15-25 процента - скоро ще получим 2-10% повече производителност. Друго много приятно предимство ще бъде, че консумацията на енергия на празен ход може да бъде намалена с 4-5 вата, тъй като модулите могат да останат по-дълго „спестени“.

buldozerwin8_and_bf3
„Не гледайте на зъбите си за подарък за изпълнение“ [+]

булдозерbf3betafx

„Трансформацията“ по време на Battlefield 3 [+]

Battlefield 3 също показва добре доколко оптимизацията помага на процесора. В тази игра най-мощният в момента процесор от серията FX може да постигне производителността на Core i7-2600k.

Процесорите от серията FX се доставят с корпус Socket AM3 + и са поместени в дънните платки на AMD от серия 9 от чипсет. Ориентацията се улеснява и от цвета на гнездото, който е предимно черен. За да приложим безкрайно звуковата платформа Scorpius, се нуждаем от процесор от серия FX, дънна платка с чипсет от 9 серии и видеокарта от серия Radeon HD 6000. Bulldozer има двуканален DDR1866 контролер за памет, който поддържа 3 MHz модули.

феномен_фолулк

AMD FX-8150 с Phenom II X4 970 BE - отгоре [+]

В заключение бихме искали да добавим още едно интересно допълнение. Сериозни противоречия предизвикаха факта, че работата, извършена на час (инструкции на цикъл) от процесори, базирани на Bulldozer, средно е намаляла донякъде в сравнение с предшественика си. Някои веднага предвиждат падането на архитектурата, други изброяват подобни примери от миналото. В тази връзка, както винаги, нека се ограничим до фактите. Днес програмистите все повече осъзнават предимствата на многоядрената оптимизация. С 8-цилиндров двигател, който в основата си осигурява добри характеристики, рядко се замисляме какво може да направи с 1 цилиндър.

феномулк

AMD FX-8150 с Phenom II X4 970 BE - отдолу [+]

Примерът не е най-добрият, но може да хвърли светлина върху въпроса. Не твърдим, че ще използваме оптимално осем целочислени ядра плътно, но Turbo Core 2.0 е насочен към възможно най-високия тактови честоти (4,2 GHz) в този случай. Това, което се предлага само в случая на K10.5 на цената на „кървава пот“, тук се счита за „основен часовник“. Също така няма съмнение, че внедряването на AVX, FMA и XOP е струвало значителен набор от транзистори. Основите на архитектурата се използват в няколко сегмента (сървър, настолен компютър), така че това изглеждаше като задължителна стъпка, но днес виждаме още по-малко от нейните предимства (особено в настолна среда).

socket_2k

Легнал в леглото [+]

В идеалния случай (FMA4 + AVX), Bulldozer наистина се чувства много елементарно, предлага изненадващо представяне и веднага поставя нещата в различна светлина. Според измервания от немския HT4U, по време на приложението за рендиране C-Ray 1.1, AMD FX-8150 се представя за същите 15 секунди като Intel Core i7 990X. Това е точно половината от времето, което процесорът AMD Phenom II X6 1100T отне да свърши работата. В скобите ще отбележим, че претеглихме и другата крайност, Super PI.