CFA LogoCFA Logo Computer
Новости Статьи Магазин Драйвера Контакты
Новости
RSS канал новостей
В конце марта компания ASRock анонсировала фирменную линейку графических ускорителей Phantom Gaming. ...
Компания Huawei продолжает заниматься расширением фирменной линейки смартфонов Y Series. Очередное ...
Компания Antec в своем очередном пресс-релизе анонсировала поставки фирменной серии блоков питания ...
Компания Thermalright отчиталась о готовности нового высокопроизводительного процессорного кулера ...
Компания Biostar сообщает в официальном пресс-релизе о готовности флагманской материнской платы ...
Самое интересное
Программаторы 25 SPI FLASH Адаптеры Optibay HDD Caddy Драйвера nVidia GeForce Драйвера AMD Radeon HD Игры на DVD Сравнение видеокарт Сравнение процессоров

АРХИВ СТАТЕЙ ЖУРНАЛА «МОЙ КОМПЬЮТЕР» ЗА 2002 ГОД

Пни да пни кругом…

Владимир СИРОТА vovsir@km.ru

Сегодня у нас — широкомасштабные смотрины процессоров Pentium 4.

Хотеть не вредно

Здесь кто-нибудь хочет..? Ба, лес рук! Да я не «про это», а в смысле Pentium 4 хотите? Снова лес рук. Не, на шару не раздаются… А вы там чего воздержались? Что вы говорите?! Многие утверждают, что к рожденному Intel процессору Pentium 4 можно применить выражение «в семье не без урода» :-)? Дескать, неудачный проц получился, медленный, и все такое… Попробую вас разубедить. Ну, на счет медленного и «всего такого» никак не могу согласиться. Просто один из конкурентов Intel в кои-то веки выпускает продукцию, способную на равных конкурировать с Intel’овскими процессорами. И вообще, что значит «медленный»? «Ме-ме-…-медленные они…»? Кто это опять там заблеял? Э, да вы, братец, я вижу, весьма несведущи в 4-х пнях. Если вам кажется, что эти процы недостаточно быстрые, так это только от того, что каждому юзеру завсегда хочется чего-то большего, нежели то, до чего могут на данный момент дотянуться его загребущие руки :-). Не нравится вам Pentium 4 1.7 ГГц? Дружище, купите себе чип на 2.53 ГГц, плату на чипсете i850Е, память RDRAM PC1066 и наслаждайтесь скоростью. Кто вам мешает, в конце концов. Ведь сегодня процессора быстрее, чем Pentium 4 2.53 ГГц вы просто не найдете днем с огнем и электрическим фонарем. Поэтому всевозможные утверждения о медленности Pentium 4 — это скорее философская проблема мировоззрения отдельных пользователей, старающихся бежать впереди прогресса. Ну что там еще? Ах, дорог 2.53-ГГц процессор, вы говорите? Ну так для знающих и прилежных любителей «пошевелить» частотами это не проблема — берется обычный «дешевый» Pentium 4 1.6А ГГц и превращается… превращается… в Pentium 4 2.544 ГГц. Дешево и сердито. Причем без применения жидкого азота и прочих выкрутасов, которыми пользуются оверклокеры-извращенцы. Волшебные слова о том, как осуществить необходимое превращение, смотри на: http://www.overclockers.ru/reviews/northwood-overclocking.

Не, ну ты посмотри! Вы настаиваете, будто бы все равно недостаточно быстры эти четвертые пни? Ну вы параноик, приятель. У вас раньше были навязчивые идеи? Конечно, можно, сидя в тени на берегу пруда, вдыхать полной грудью чистый свежий загородный воздух и придаваться мечтам, что, мол, неплохо бы поставить себе систему, с Pentium 4 4 ГГц на чипсете i875, с поддержкой двухканальной DDR II 400 SDRAM. Ведь тогда можно будет наслаждаться точно таким же пейзажем, где колышется ветром каждая камышинка, прямо за экраном собственного монитора. Неужели Intel не под силу создать такие продукты? Уверен, Intel может. Если захочет — хоть через месяц. Но не менее уверен — Intel не захочет. И всех имеет он в виду на том пруду :-). Ибо Intel проводит свою традиционную политику — компания не упустит возможности заработать доллары буквально на каждом «наращенном» мегагерце, на каждом выпущенном чипсете. Вот потому-то она и не торопит события. Всему свое время.

Зато вот другое немаловажное достоинство 4-х пентиумов. Общеизвестно, что они «не горят» (но в воде тонут, так что попрошу без неверных ассоциаций :-)). То бишь в этих процессорах есть встроенная система защиты, которая в случае каких-либо проблем с температурой, например, при выходе из строя кулера, автоматически понижает частоту ЦПУ. Тем самым предотвращая его перегрев и оберегая от выхода из строя. В результате наличия такого приятного достоинства системы на Pentium 4 весьма привлекательны для любителей подрегулировать кое-какие частоты :-), о чем я уже достаточно непрозрачно намекал выше. Хотя и здесь важно не переусердствовать, иначе чрезмерный оверклокинг приведет к результатам, прямо противоположным ожидаемым, — перегревающийся процессор станет «навязчиво» тормозить. Возможна и другая ситуация, ярко иллюстрирующая то, как достоинство чипа может плавно переходить в его недостаток. Как совершено справедливо заметили ребята на Ф-Центре: «…кулер на процессоре может остановиться, а неискушенный пользователь об этом знать не будет, продолжая работать на компьютере, производительность которого явно не соответствует вложенным в него деньгам...». И кто это там ратует за «тихие» кулеры :-)?

Ближе к делу

Но собственно нас сегодня будет интересовать не охлаждение, и даже не разгон. Ибо, как это ни странно звучит, подавляющее большинство пользователей не занимается оверклокингом компьютерного железа. Что ими движет — мне никогда не понять :-). Ну да ладно, в конце концов, мы сегодня затронем другие интересные темы.

Первым делом, конечно же, вспомним саму архитектуру Pentium 4, чтобы разобраться, откуда бысть пошли достоинства и недостатки этих процессоров. Попробуем проанализировать, есть ли основания для ходивших по Сети слухов, будто бы благодаря чудной архитектуре Pentium 4 производительность этих чипов с увеличением тактовой частоты возрастает не линейно (видимо, кому-то больше нравятся экспоненциальные зависимости :-)). Также попытаемся оценить, каковы преимущества от перехода Pentium 4 с ядра Willamette на Northwood. А еще узнаем кое-что о работе процессора в комбинации с разными шинами и типами памяти, а также посмотрим, чем хороша синхронная работа памяти и системной шины. Все это мы сделаем на примере материнской платы Intel с чипсетом i850E, на которой устанавливался один из тестируемых процессоров, память Samsung PC800-45 или Samsung PC1066-32 RDRAM (4 RIMM по 128 Мб для обеих типов памяти), видеокарта Sparkle GeForce 4 MX440 64 Мб DDR, жесткий диск Seagate Barracuda ATA IV 40 Гб 7200 об/мин, ОС — Windows Me.

Итак, сначала, для почину, мы остановимся на особенностях архитектуры процессоров Pentium 4, чтобы узнать, в конце концов, о предмете нашего исследования необходимые подробности.

Конвейер, который придумал не Форд

Как вы знаете, в основе процессора Pentium 4 лежит архитектура, названная NetBurst. Перед новой архитектурой стояла задача обеспечить связь имевшихся наработок Intel в области процессоров шестого поколения с теми новыми задумками в отношении конструкции чипов, которые вызрели в недрах исследовательских центров компании за последнее время. Многие из этих новаций сосредоточились «на уровне» кэша первого уровня. Основополагающим здесь стало появление усовершенствованного механизма динамического исполнения (Advanced Dynamic Execution Engine), составляющими которого являлись увеличенный кэш перехода и удлинившееся «окно команд».

Одной из основных задач ускорения вычислений в процессоре Pentium 4 являлась минимизация ошибочно предсказанных переходов, негативно влияющих на скорость выполнения вычислительных операций. Это оказалось особенно важным с учетом используемой в Pentium 4 гиперконвейерной архитектуры.

Тут самое время вспомнить о конвейере. Для примеру скажем, что Pentium III имеет конвейер длиной в 12 стадий (17 — у FPU), у Athlon его длина составляет 10 стадий (15 — у FPU). По сравнению с этими «скромнягами» Pentium 4 — просто «гигант», его конвейер насчитывает 20 стадий. Хорошо это или плохо? Однозначно сказать нельзя, ибо такая длина конвейера инструкций — палка о двух концах. С одной стороны, этот ход позволяет добиться значительного роста тактовой частоты, с другой — увеличивает задержки при выполнении программного кода. Именно длина конвейера (чем он длиннее, тем легче наращивать тактовую частоту чипа) позволила процессору Pentium 4 заработать на рекордных для своего времени частотах. Однако одновременно с ростом частоты проявился и один неблагоприятный фактор — в длинном конвейере на каждый мегагерц приходится меньше удельной производительности. Ибо чем на большее количество стадий рассчитан конвейер, тем меньше работы выполняется за каждый отдельный такт, хотя этот такт и выполняется быстрее. Не говоря уже о том, что чем длиннее конвейер, тем больше времени отнимет операция его очистки и соответственно увеличивается задержка по загрузке реально необходимых данных.

Кстати, сам пресловутый конвейер в действительности подразделяется на три функциональных блока:

1. входной блок упорядоченной обработки (in-order front end). Отвечает за декодирование и обработку команд;

2. блок исполнения с изменением последовательности (out-of-order core). Именно здесь происходит выполнение команд;

3. блок вывода команд из последовательности (in-order retirement).

Что же было сделано производителем процессора для оптимизации правильного предсказания ветвлений программ, способного существенно уменьшить задержки в работе чипа? Возвращаясь к Advanced Dynamic Execution Engine, отметим, что, во-первых, в Pentium 4 применен очень большой, размером целых 4 Кб (по сравнению с 512 байт у Pentium III), буфер адреса перехода, «помнящий» все совершавшиеся за последние время ветвления. В совокупности с более «интеллектуальным» алгоритмом предсказания переходов, новация дает, согласно данным Intel, весьма ощутимое увеличение точности предвидения ветвлений: вероятность точного предсказания выше 90 % — впечатляющий результат.

А еще окно команд (Instruction Window) в Pentium 4 сделали значительно больше, расширив его до 126 инструкций. В результате чего у процессора появилось больше возможностей при выборе микрокоманд для внеочередного исполнения. Помимо того, применяется такая интересная штука, как трассирующий кэш команд (Execution Trace Cache). Одно из главных его достоинств — микрокоманды («запасенные» в кэше заранее и готовые к применению, что ускоряет вычисления при обработке сложных инструкций) в этом кэше упорядочиваются в соответствии с несколькими предсказанными ветвями исполнения программы, причем подряд кэшируется весьма длинные куски программ — так называемые трассы. Понятно, что благодаря подобному подходу обеспечивается непрерывный поток микрокоманд на исполнение и достигается реальная выгода от «объемного» кэша, вмещающего около 12 тысяч микрокоманд. И так бы все прекрасно…

Однако, к величайшему удивлению многих, в новом процессоре был использован кэш данных первого уровня размером всего 8 Кб (например, даже у VIA C3 такой кэш — 64 Кб). Что подвигло конструкторов процессора на подобный ход «обрезания» кэша данных, сказать трудно. Но многие считают, что именно из-за таких его размеров первые процессоры Pentium 4 демонстрировали не очень впечатляющие показатели быстродействия. Но кто знает — разработчикам всегда виднее. Им, возможно, приходилось искать компромиссы в конструкции ядра, и они решили сэкономить на кэше данных.

Что же касается примененного в Pentium 4 кэша второго уровня (Advanced Transfer Cache), то он имеет размер 256 Кб у чипов на ядре Willamette и 512 Кб — у процессоров с ядром Northwood. Этот кэш, как и у чипов предыдущего поколения, обладает 256-разрядной шиной и работает на тактовой частоте процессора.

Все дело — в паре хороших блоков…

Но главное и, казалось бы, многообещающее нововведение, скрытое в недрах Pentium 4, которое не может не радовать всех ценителей быстрого компьютинга, — в чипе основное арифметико-логическое устройство (ALU) работает на удвоенной частоте процессора. То есть у Pentium 4 1.6 ГГц реальная частота ALU составляет 3.2 ГГц. И можете сами подсчитать, какова реальная частота у чипа с «официальной» частотой 2.53 ГГц. А поскольку блоков ALU у Pentium 4 в действительности два, то в самом благоприятном случае он осуществляет четыре операции с целыми числами за один такт работы (!). Вот тут и возникает главная для меня непонятка по итогам работы этих процессоров. Включая работу в тестах. Неужели так мало бывает тех самых благоприятных случаев?

Что касается блока для работы с числами с плавающей запятой (FPU), то опять же впервые за историю он оказался не таким быстрым, как у основного конкурента. Два модуля этого блока, из которых реальные вычисления выполняет только один, а второй находится в «подсобниках», функционируют на тактовой частоте процессора. Не густо. Ведь у того же Athlon три блока операций с вещественными числами, из которых реально на полную силу «пашут» два, а третий — на «подсобных» ролях (занимается операциями с регистрами). В общем, блок FPU процессора Pentium 4 нельзя назвать удачной разработкой в этом чипе, хотя и ахиллесовой пятой он тоже, в общем-то, не является.

Видимо, вышеописанный недостаток разработчики стремились компенсировать за счет использования блока, рассчитанного на работу с SIMD-инструкциями (Single Instruction — Multiple Data, одна команда — много данных; подобный подход ускоряет работу на порядок, допуская множественные идентичные операции над данными за один такт). SIMD представляют собой обработку 64-битных инструкций для чисел с плавающей запятой и 128-битных для целочисленных операций. Модулей для работы с SIMD у Pentium 4 два. Но опять же один из них используется для регистровых операций, а второй непосредственно для вычислений. В итоге даже в оптимальном случае за такт выполняется только одна SIMD-инструкция, хотя и включающая четыре операции над числами.

Еще одним важным нововведением в процессоре Pentium 4 стало использование «свежих» команд SSE2 (Streaming SIMD Extensions 2), которые поддерживают новые форматы данных и позволяют увеличить производительность при выполнении целочисленных SIMD-операций, применяя 128-разрядные регистры. Набор команд SSE2 включает 144 новые инструкции, 76 из них абсолютно новые. Последние оперируют с разными данными, включая 64-бит (128 бит с упаковкой данных) числа с плавающей запятой и целые числа. Некоторые из инструкций дают возможность программам осуществлять контроль над процедурами кэширования, а также загрузки и хранения данных в регистрах процессора. Другие 68 — это расширенные SIMD-инструкции для работы с целыми числами, которые уже могут использовать 128-бит регистры, чего не было в предыдущих поколениях процессоров.

Не стоит сомневаться, что подобные нововведение позволяют серьезно повысить уровень производительности процессора в ресурсоемких приложениях, таких как кодирование и декодирование звука и видео, рендеринг 3D-графики, научные рассчеты, игры и т. п. Однако это справедливо лишь в случае оптимизации данных задач под новый набор команд.

И еще одна немаловажная деталь, также положительно повлиявшая на производительность, — Pentium 4 рассчитан на использование новой шины Quad Pumped Bus (QPB). (Quad Pumped Bus — это 100-МГц или 133-МГц 64-битная шина, передающая четыре блока данных (эквивалент 400 МГц и 533 МГц соответственно) по 8 байт и два адреса за такт, — лучшая из ныне действующих).

Шаг в Northwood’а

Теперь давайте посмотрим, каким изменениям подвергся процессор Pentium 4 с недавним переходом на новое ядро Northwood. Пожалуй, единственным внешне заметным чисто архитектурным отличием нового ядра от предшественника Willamette стало наличие увеличенного вдвое, до 512 Кб, кэша второго уровня. Однако на самом деле произошедшие изменения в архитектуре процессора оказались более глубинными. Во-первых, новые ядра изготавливались на фабриках, имеющих 0.13-микронную технологию производства, причем с использованием медных соединений. Это нововведение дало Intel возможность нарезать с одной 200-миллиметровой пластины вдвое больше заготовок для чипов, чем при использовании 0.18-микронного производства. Правда, на ценах процессоров Pentium 4 подобные изменения не слишком отразились .

Зато, с другой стороны, выпущенные с применением новой технологии чипы обладают более высокими допустимыми рабочими частотами и пониженной рассеиваемой мощностью, что не может не порадовать как ценителей стабильной работы (в ПК перегревается не только процессор), так и всю оверклокерскую братию. В новом ядре Northwood, площадью 146 мм2 интегрировано 55 миллионов транзисторов. У Willamette было «всего» 42 миллиона.

Остается лишь добавить, что все процессоры Pentium 4 Northwood рассчитаны на установку в разъем Socket 478. От ЦПУ с аналогичной тактовой частотой на ядре Willamette, рассчитанных на инсталляцию в тот же разъем, они отличаются прежде всего маркировкой — им присваивается буковка «А» (как видите, почин VIA в области чипсетов не остался незамеченным :-)). Например, если выше я говорил о процессоре Pentium 4 1.6А ГГц, то это процессор на ядре Northwood, и не стоит его путать с Pentium 4 1.6 ГГц Willamette. Особенно тем, кто любит скорость :-).

Даже пни умеют «летать»

Ну, довольно с нас архитектурных достопримечательностей, перейдем к практическим аспектам работы процессоров Pentium 4. Итак, первый интересующий нас вопрос — как ведет себя производительность чипа с ростом тактовой частоты процессора. Надеюсь, вы не подумали, что она может уменьшаться :-). Но вот по какому закону она увеличивается?

Чтобы оценить тенденцию роста производительности, давайте рассмотрим диаграмму 1, где представлена динамика увеличения быстродействия систем на базе Pentium 4 при различных тестовых задачах в зависимости от возрастания тактовой частоты процессора. (Сведения о процессоре на диаграмме представлены в такой последовательности: тактовая частота/размер кэша 2-го уровня в Кб/частота Диаграмма 1QPB в МГц.)

Что же мы видим на диаграмме 1? Вне зависимости от типа тестового приложения — замеряющего ли «рафинированную» производительность, как SiSoft Sandra 2002, или выполняющего задачи, которые более «практичны», —РС Маrk 2002 и 3D Mark2001, — наблюдаем картину, по которой даже не слишком искушенный в статистическом анализе пользователь с полным правом может заявить, что между тактовой частотой процессора и его производительностью существует линейная связь. На которую даже такие важные факторы, как увеличение кэша вдвое и переход на более быструю 133 (533 QPB) МГц шину, оказывают несущественное влияние. То есть прирост производительности Pentium 4 именно линейно зависит от увеличения тактовой частоты процессора. Причем настолько существенно, что вряд ли кто осмелится это оспорить, даже проведя какие-то дополнительные точные расчеты взаимосвязи этих факторов (мне это делать было просто облом, так как и по приведенному рисунку все ясно). И пусть вас не смущает «впадина» у процессора 1.7 ГГц на практически линейном графике, отражающем рост производительности с увеличением тактовой частоты. Он несколько «выбивается» из ряда по простой причине: большинство процессоров в тесте разделено 200-МГц диапазоном, а Pentium 4 1.7 ГГц отделяет от предыдущего чипа 100 МГц, а от следующего все 300 МГц. Поэтому он и несколько «отличился». Посему всевозможные слухи, что, дескать, благодаря оригинальной архитектуре с ростом тактовой частоты Pentium 4 его производительность растет, как на дрожжах, оказались весьма преувеличены. И на этом мы с данным вопросом покончим. Отметим только, что рост частот и производительности процессоров Pentium 4 с момента их анонса прошел действительно впечатляющую стезю. Как нетрудно заметить, глядя на диаграмму 4, при выполнении обычных офисных задач Р4 2.53 ГГц опережает своего 1.4-ГГц «предка» более чем на 81 % (почти вдвое!). А в играх (диаграмма 6) превосходство нового чипа доходит до 62 %, то есть на каждые 10 кадров, которые «вытягивает» Р4 1.4 ГГц, 2.53-ГГц процессор может выдавать по 16-ть — более чем весомый прирост.

Тест винчестеров в РС Маrk 2002, кстати, неплохо подходит для оценки достоверности оценочных результатов программы, так как используется один и тот же жесткий диск. По диаграмме 4 видим, что минимальное значение показателя HDD в этом тесте составляет 86 % от максимального, а реальный разброс замеренных значений лежит в пределах +/- 7 % от среднего показателя (именно для жесткого диска был отмечен максимальный разброс значений измеряемого параметра). Очень хороший для теста результат.

Наконец, переходим ко второму интересующему нас вопросу — что вызвало увеличение L2 кэша вдвое, осуществленное в процессоре Pentium 4 с переходом от ядра Willamette к Northwood. Чтобы оценить последствия этого изменения, давайте рассмотрим два процессора Pentium 4 с одинаковой тактовой частотой, но разными ядрами —Р41.6 ГГц и Р4 1.6А ГГц. По данным диаграммы 2, где представлены результаты оценки вычислительной мощи чипов пакетом SiSoft Sandra 2002, можно видеть, что производительность ядер обоих процессоров идентична. Этого, в принципе, и следовало ожидать — ведь само вычислительное 0.13-мкм ядро Northwood не претерпело существенных изменений архитектуры по сравнению с Willamette. И даже при работе с памятью увеличения производительности вроде бы незаметно (диаграмма 3), несмотря на вдвое возросший кэш (а его характеристики учитываются в тесте работы с памятью из пакета SiSoft Sandra).

Диаграмма 2   Диаграмма 3   Диаграмма 4

Однако если мы от голой теоретической производительности перейдем к анализу работы на реальных задачах, выполняемых процессором, то разницу в быстродействии между ядрами Northwood и Willamette просто нельзя не заметить — она видна, как говорится, невооруженным глазом. Что касается обыденных офисных задач, то, судя по результатам теста РС Маrk 2002, система на Northwood справляется с обработкой реальных вычислительных задач лучше, нежели такая же на Willamette, в основном за счет выигрыша (до 10.5 % в тестовых баллах) при работе с памятью. Более того, по последнему показателю 1.6-ГГц Northwood «обходит» даже 1.7-ГГц Willamette. Это говорит о весомом преимуществе усовершенствованного чипа, что подтверждено и результатами, показанными процессором на реальных задачах, о чем далее.

Не миновали прироста быстродействия от увеличившегося кэша и игровые приложения. И если в 3D Mark2001 преимущество 1.6А над 1.6-ГГц процессором едва превышает 3 % (диаграмма 5), то в Quake III результат куда более впечатляющ — почти 6 %-ное увеличение количества fps’ов (диаграмма 6), обеспечившее превосходство на более чем 10 кадров/с. На этих же диаграммах хорошо видно, что в игровых приложениях Pentium 4 1.6А ГГц «обгоняет» и 1.7-ГГц процессор на ядре Willamette. Думаю, результат налицо. Из вышесказанного можно сделать однозначный вывод — польза от перехода на ядро Northwood есть, и она очень даже хорошо заметна невооруженным глазом. Вне всяких сомнений, новое ядро способно как сэкономить часть рабочего времени пользователя, занимающегося типичной офисной работой, так и прибавить желанных fps’ов страстным геймерам.

Еще один занимательный вопрос — о пользе от перехода процессоров Pentium 4 на шину QPB 133 (533) МГц. Понятно, что с ростом частоты шины общее быстродействие компьютера просто обязано повышаться. Подробно эта тема была рассмотрена в статье Сергея Толокунского «Pentium 4 — замена шин» (МК, № 21 (192)). Поэтому скажу на этот счет лишь пару актуальных, по моему скромному мнению, словес. Во-первых, с переходом на новую шину существенно возрастает скорость обмена с памятью — от 12 до 30 % по данным разных тестов (диаграммы 3, 4). Итогом общего роста скорости обмена по шине и «ускорения» памяти является ощутимое увеличение быстроты выполнения приложений, для которых скорость-то как раз и особенно актуальна. Полуторапроцентное убыстрение наблюдается в 3D Mark2001 (диаграмма 5), а вот в Quake III результат более впечатляющ — почти 7 %-ный прирост, составивший 16 кадров в секунду (диаграмма 6).

Диаграмма 5   Диаграмма 6

И последняя интересующая нас сегодня тема касается работы с памятью. И что лучше — более быстрая шина или более быстрая память? Что даст установка памяти, синхронно работающей с 533-МГц системной шиной? Уточню, что такая память (RDRAM PC 1066, работающая на 533-МГц) официально не поддерживается чипсетом i850E, но фактически прекрасно с ним «уживается». Попробуем пролить свет ясности на поставленные вопросы.

Итак, обратим наши взоры к диаграммам 7, 8, 9 и 10, где представлены показатели работы процессоров Pentium 4 2.4 ГГц на разной частоте системной шины и с различным типом памяти RDRAM. Практически уже с первого взгляда заметно, что более быстрая системная 133-МГц шина дает куда более весомый прирост быстродействия системы, нежели установка «скоростной» РС1066 памяти на 100-МГц шину. Мы даже видим, что скорость работы компьютера с более медленной РС800 (400 МГц) памятью при 533-МГц QPB-шине оказывается выше, нежели позволяет «выдавить» из РС1066 RDRAM шина 400-МГц QPB. Причем превосходство быстрой шины при работе с памятью РС800 над «медленной» QPB с РС1066 RDRAM значительно. При росте реальной скорости обмена с памятью на 11 %, согласно данным SiSoft Sandra2002 (диаграмма 7), выигрыш при работе с реальными приложениями, зависящий от быстродействия памяти, ориентировочно увеличивается примерно на 2 %, если верить результатам теста РС Маrk 2002 (диаграмма 8).

Диаграмма 7   Диаграмма 8

Теперь касательно синхронности работы памяти и системной шины. Важно ли обеспечить шину памятью, синхронно с ней работающей, или можно мириться с несинхронной работой этих двух компонент системы? Глядя на все те же диаграммы 7 и 8, видим, что при 100-МГц шине замена синхронно работающей с ней 400-МГц памяти RDRAM на более быстродействующую РС1066 обеспечивает, судя по результатам тестов SiSoft Sandra и РС Маrk 2002, прирост быстродействия при обмене с памятью… в 1-2 %. Более чем скромно. В то же время, по результатам тех же тестов, замена при 133-МГц шине несинхронно работающей РС800 на синхронную с шиной РС1066 RDRAM позволяет увеличить быстродействие при работе с памятью на 9-17 %.

Подобным образом изменяется производительность и в одних из самых ресурсоемких приложениях — игровых. Если при 400-МГц QPB установка RIMM’ов РС1066 дает прирост 0.5 % в 3D Mark2001 и 1.6 % — в Quake III, то при использовании 533-МГц шины прирост от инсталляции РС1066 RDRAM достигает 0.9 % в 3D Mark2001 и 5 % — в Quake III (диаграммы 9 и 10).

Диаграмма 9   Диаграмма 10

Таким образом мы можем сделать однозначный вывод — синхронность работы шины и системной памяти в компьютерах, базирующихся на чипсете i850, очень важна. И если при использовании процессоров, рассчитанных на 400-МГц шину, целесообразность приобретения памяти РС1066 RDRAM под большим вопросом, то использование Pentium 4 с 533-МГц шиной без памяти РС1066 выглядеть нонсенсом. При конфигурации такой системы с РС800 RDRAM быстродействие ПК снизится до уровня, едва превышающего по скорости выполнения операций аналогичную систему с 400-МГц шиной, оснащенной модулями памяти RIMM РС1066 (диаграммы 8, 9, 10).

На этом позвольте наше исследование завершить. Всего наилучшего, и 478 ножек вам под процессором :-)!

Выражаю благодарности:

представительству компании Intelв Украине за предоставленные процессоры Pentium 4: 2/2.2/2.4*400/2.4*533/2.53 ГГц, материнскую плату, память Samsung PC800 RDRAM;

фирме «Навигатор» за процессоры Pentium 4: 1.4/1.6/1.6А/1.7 ГГц;

компании «К-Трейд» за видеокарту Sparkle GeForce 4 MX440 64 Мб DDR;

себе любимому за массу потраченного, надеюсь, с пользой для вас, дорогие читатели, времени.

Рекомендуем ещё прочитать:






Данную страницу никто не комментировал. Вы можете стать первым.

Ваше имя:
Ваша почта:

RSS
Комментарий:
Введите символы или вычислите пример: *
captcha
Обновить





Хостинг на серверах в Украине, США и Германии. © sector.biz.ua 2006-2015 design by Vadim Popov