Страница 4 из 5 [ Сообщений: 193 ] Версия для печати [+] | На страницу Пред. 1, 2, 3, 4, 5 След. |
Если мы читаем 64 байта (строка L2) из RAM, то это займет 1 такт (4 пакета) шины DDR2-128 bits (10ns для DDR2-3200).
Через какое время RAM сможет выдать другую строку в двух случаях: 1) строка на той же странице 2) строка на другой странице и если адрес этой второй строки был известен заранее? |
1такт ядра памяти (100MHz), но 2 такта шины (200MHz). Соответственно, никаких дополнительных задержек может и не быть. |
Посмотрел я статейки.
Главное что плохо IMHO --- это подсистема кэшей. L1 (особенно L1D) маленький и с прямой записью, а ширина доступа в L2 всего 8байт/ядро/такт, или, другими словами, не чаще 1раза за 8 тактов. Для множества алгоритмов IMHO, самое узкое место — тут. Даже имея в виду 8 ядер, получаем средний темп: 1 доступ в основной кэш за такт. А частота маленькая. В общем, высокой производительности от Niagara ждать IMHO не стоит по-любому. |
VLev
другими словами, не чаще 1раза за 8 тактовх Почему? |
Я имею в виду, в среднем: строка 64байта, в среднем на ядро — 8байт/такт. итого 1 доступ за 8 тактов. Впрочем, и максимальный темп всего лишь в 2 раза больше: 1 доступ за 4 такта. Возможно, достигается на 4х-ядерной версии. В любом случае, я не учитываю тут проблемы из-за сквозной записи. |
VLev
строка 64байтах The L1 data cache is 8 Kbytes, 4-way setassociative with a line size of 16 bytes |
упс ![]() занятно. В общем, это и не кэш вовсе (в обычном понимании).... |
VLev
занятно. В общем, это и не кэш вовсе (в обычном понимании).... Сегодня ты просто сыплешь сенсациями ![]() ![]() |
VLev
Соответственно, никаких дополнительных задержек может и не быть. Тогда можно посчитать пиковое количество пакетов (запросов) для Athlon 64 X2 2400 GHz и Niagara 1.2 GHz: RAM->L2 Athlon X2: 6.4GB/s / 64B = 100M/s RAM->L2 Niagara: 25.6GB/s / 64B = 400M/s L2->L1 Athlon X2: 2.4G/s / 8 * 2 = 600M/s L2->L1 Niagara: 1.2G/s / 2 * 8 = 4.8G/s L1->reg Athlon X2: 2.4G/s * 2 * 2 = 9.6G/s L1->reg Niagara X2: 1.2G/s * 8 = 9.6G/s Последний раз редактировалось lkj 11:21 29.11.2005, всего редактировалось 1 раз. |
Ага. Только я бы так сравнивал: ... Niagara ... RAM->L2 Athlon X2: 6.4GB/s / 64B = 100M/s RAM->L2 Niagara: 25.6GB/s / 64B = 400M/s L2->L1 Athlon X2: 2.4G/s / 8 * 2 = 600M/s L2->L1 Niagara: 1.2G/s / 2 * 8 = 4.8G/s L1->reg Athlon X2: 2.4G/s * 2*2 = 9.6G/s |
Не, ну кэш конечно, даже возможно, более "классический", чем нынешние. Только я уже отвык от таких кэшей. |
VLev
Размер/поток скорость X2/Niagara ... 9.6G 9.6G 2K 9.6G 9.6G 4K 9.6G 4.8G 8K 9.6G 4.8G 16K 9.6G 4.8G 32K 9.6G 4.8G 64K 9.6G 4.8G 128K 600M 400M 256K 600M 400M 512K 600M 400M 1M 600M 400M 2M 100M 400M ... 100M 400M Т.е. Niagara начинает выигрывать в 4 раза после 1MB. До этого Niagara проигрывает в 1.5 — 2 раза. |
lkj
Т.е. Niagara начинает выигрывать в 4 раза после 1MB. До этого Niagara проигрывает в 1.5 — 2 раза 1МВ здесь что? Размер запроса? |
matik
Размер области, в которую делаем запрос. |
Понял. Странно. Для веб серверов, для которых позиционируют Niagara, характерны скорее небольшие области, я правильно понимаю?
|
lkj VLev
а я бы не сравнивал цифры такие или темболее ватто-мегагерцы... тогда ниагара может даже via C3 и Intel Sonoma порвёт... я бы сравнил флопо-доллары:) |
matik
Для веб серверов, для которых позиционируют Niagara, характерны скорее небольшие области, я правильно понимаю? Не знаю. Мой прогноз на CINT2000 Rates-Base для Niagara: 50 (80% oт Opteron (TM) 280 / 4 cores). |
Больше она проигрывает, учитывая парную нелокальность потоков, --- до 50 раз. Кстати, в одной из статей содержатся прямо противоположные оценки. |
VLev
Кстати, в одной из статей содержатся прямо противоположные оценки Прямо противоположные — это, типа, выигрывает? |
VLev
Кстати, в одной из статей содержатся прямо противоположные оценки. Где? |
"Hardware scout" в High_performance...
![]() |
"Флопо" — в смысле, с плавающей точкой? Ну, это они могут поправить как раз IMHO. Что-то типа Cell получится, кстати. |
VLev
ну зачем же так буквально воспринимат чайника:) Я имел ввиду ОБЩУЮ производительность и конечную стоимость... ![]() А по повоту Cell ~ Niagara, так это даже мне понятно что разные вещи... довод такой: Cell хоть в какой-то области да рвёт всех конкурентов и мы это видим, а вот SUN... ну не помню я такого времени (ещё со времён когда на форзацах журнала "За рулём" красовался слоган "Мошь компьютеров SPARC") чтоб Сан делал что-то адекватное по стоимости-производительности... |
IdeaFix
Cell хоть в какой-то области Объявление: разыскивается полезная область, в которой Cell рвет конкурентов ![]() |
matik ладно, гепотетической полезности существующая область в которой CELL показывает соизмеримую с конкурентами производительность
![]() |
Niagara vs Single Xeon (3.6GHz):
http://ua.sun.com/win/news/events/2005/ ... -07_PA.pdf |
lkj
А рядом (в предыдущей ссылке) лежал еще один сановский док ![]() The RASE (Rapid, Accurate Simulation Environment) for Chip Multiprocessors Niagara vs Single Xeon (3.6GHz) Интересно ![]() |
GNUS inc
>>• Raw = 330mm2, Montecito > 500mm2, Niagara ≈ 340mm2 >Что за Raw? Экспериментальная разработка Массачусетского технологического. Идеи, заложенные в него, весьма интересны, но реальных преимуществ по сравнению с существующими архитектурами немного, посему он так и остался на бумаге. |
|
А-а-а-а-а!
![]() Срочно в номер! © ![]() ![]() ![]() ![]() |
Типа, забейте на эту Ниагару, приходите к нам, ужо мы вам подгоним сервачков на Итанике
![]() |
SUN FIRE T1000 and T2000 SERVER ARCHITECTURE
Sun Fire T1000 and T2000 Servers Benchmarks Все лежать ![]() ![]() |
U2
Бугага ![]() По пунктам: 1. 12/06/05, Sun Fire T1000 Server World Record SPECjbb2005 Performance for Servers with 2-Processors or Less Все бы хорошо, но кроме Сана там практически нет результатов. Какая досада. Победа за неявку конкурентов ![]() Хотя... 51,540 bops у Ниагары против 45124 у Оптеронов... Неизвестен конфиг Сана и Оптеронами никто толком не занимался... 2. 12/06/05, Sun Fire T2000 Server World Record SPECweb2005 Performance Победа за неявкой конкурентов ![]() 3. 12/06/05, Sun Fire T2000 Server World Record SPECjAppServer2004 Two-Node Performance with BEA WebLogic Вполне возможно. 4. 12/06/05, Sun Fire T2000 Server World Record SPECjbb2005 Performance for Servers with 4-Processors or Less Неявка конкурентов. По остальным двум лень регится на сайтах |
GNUS inc
. 12/06/05, Sun Fire T2000 Server World Record SPECweb2005 Performance Победа за неявкой конкурентов Тут ты чуток лукавишь ![]() Какой-то Делл там болтается... Причем на Paxville. И результаты неплохи... Интересно, что будет, если туда приложить 280-ые? |
matik
Какой-то Делл там болтается... Причем на Paxville. И результаты неплохи... Результаты никуда не годятся ![]() Чуть-чуть выше одноядерных процов — даже не смешно. |
GNUS inc
Чуть-чуть выше одноядерных процов — даже не смешно. Ты не забудь, что частота заметно меньше... |
GNUS inc
Победа за неявку конкурентов Так на спек.орг — кто есть, тот есть. Резалты доступны. Неизвестен конфиг Сана и Оптеронами никто толком не занимался... http://www.spec.org/jAppServer2004/resu ... -00023.txt Результаты никуда не годятся Это вы скажите тем, кто уже закупил ![]() Правда, поводов для восторга я бы тоже не находил ![]() |
U2
Это вы скажите тем, кто уже закупил Делл на Пасквилле? http://www.spec.org/jAppServer2004/results/res2005q4/jAppServer2004-20051109-00023.txt Это к SPECjbb2005 не имеет отношения ![]() |
GNUS inc
Делл на Пасквилле? какой хелл? какой пасквиль? ![]() |
U2
какой хелл? какой пасквиль? Не, фраза "Результаты никуда не годятся" была про Делл на Пасквилле. При чем тут Это вы скажите тем, кто уже закупил —> Air France, eBay, NTT, NEC и др.? |
Новая тема Ответить | Страница 4 из 5 |
[ Сообщений: 193 ] | На страницу Пред. 1, 2, 3, 4, 5 След. |
Кто сейчас на конференции |
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 6 |
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения |