Страница 1 из 5 [ Сообщений: 193 ] Версия для печати [+] | На страницу 1, 2, 3, 4, 5 След. |
Есть желающие высказаться по сабжу?
![]() Топовый 8-core, 32-way, single chip, предварительно 1.2GHz, 250W. Отбраковка 6-core, 24-way, single chip. Уже три года его доводят, с момента покупки у Afara Websystems Inc. Кто знает что-нибудь интересное про сей каменный цветок? Прототип процессора ![]() Прототип системы ![]() |
Warrax
Кто знает что-нибудь интересное про сей каменный цветок? Ну, знать про этот цветок еще рано... Предполагать — можно. Предполагаю, что на рынке веб-серверов будет хорош. А вот в остальном.... ![]() |
matik
Предполагаю, что на рынке веб-серверов будет хорош. Ну это говорит и сам SUN, причем не аргументируя. ![]() А вот в остальном.... ![]() Вы про то, что системы более одной Ниагары не масштабируются? Я тут прочитав это, а именно "Niagara-1 «равняется» пятнадцати SPARC III" прикинул: 8-ядерный (32-way) обгонит одно старое ядро SPARC III в 15 раз... То есть производительность одного (4-way) ядра даже не вдвое вырастет в сравнении с SPARC III... Результат SPARC III 1.2GHz в SPECint_rate2000 = 8.38 Но за счет кол-ва ядер имеем 8.38 х 15 = 125,7 (если верить на слово САНу) ![]() Сегодняшние конкуренты (SPECint_rate2000): ProLiant BL45p (4CPU/8core) = 130 PRIMEPOWER650 (2025MHz, 8 cores, 8 chips) = 126 IBM eServer pSeries 690 Turbo (1300 MHz, 16 cores, 8 chips) = 131 Две последних системы достаточно дорогие... ![]() |
Warrax
Вы про то, что системы более одной Ниагары не масштабируются? Не только. Про достаточно слабую (если не путаю) подсистему памяти, про отсутствие масштабируемости, и так далее... То есть там, где много слабеньких потоков, Ниагара хороша. Но палочкой-выручалочкой она не станет — собственно, SUN это подтверждает, базируясь на Оптеронах. Я тут прочитав это, а именно "Niagara-1 «равняется» пятнадцати SPARC III" прикинул: Ой, это ПЕАР ![]() Кэш — общий, память — общая, шина — общая. Все это замедлит реальный процессор. В результате Ваши расчеты кажутся мне излишне оптимистичными.... |
Кстати, в Ниагаре и Джемини вещественных конвейеров нет вовсе, чего не стоит забывать.
Warrax >PRIMEPOWER650 (2025MHz, 8 cores, 8 chips) = 126 Этот на SPARC64 V, скоро обещают выпустить VI с SMT, поэтому ему Ниагара не конкурент. Даже при самом лучшем раскладе. Не говоря уже о том, что далеко на любой реальный код можно распараллелить на 32 потока... А если не удастся, то Ниагара покажет весьма скромную производительность... |
matik
Ой, это ПЕАР ![]() Это не пеар — это попытка развязать полемику ![]() Кэш — общий Но вероятно большой? память — общая но вероятно n-way (может и 8-way) шина — общая. Одна? Это где-то освещалось? В результате Ваши расчеты кажутся мне излишне оптимистичными.... Мне тоже ![]() Walter S. Farrell Кстати, в Ниагаре и Джемини вещественных конвейеров нет вовсе, чего не стоит забывать. Интересно, а SSL, к примеру, использует только целочисленные операции? далеко на любой реальный код можно распараллелить на 32 потока Отсюда видимо и ориентация на WEB — 1000хn запросов красиво ложится на 32 логических процессора, если бы не соответствующие требования к подсистеме памяти... |
Warrax
Это не пеар — это попытка развязать полемику Это пеар со стороны SUN ![]() Но вероятно большой? Ну пусть он будет даже 16МВ. Это по 512КВ на поток. Много это, или мало? Но толку-то? 32 потока требуют хотя бы 32-входового частично-ассоциативного кэша... Сомневаюсь, что он такой. но вероятно n-way (может и 8-way) Максимум 256 бит. Что в реальности будет по ПСП меньше, чем у двух Оптеронов. Одна? Это где-то освещалось? Нет, но я не вижу признаков обратного. А, учитывая, что SUN старательно рекламирует все, что можно — ожидать здесь чего-то особенного было бы чересчур смело. |
Кхм... Господа, а почему вы решили, что там ядро US III...?
![]() Во-вторых, несмотря на внушительное к-во конвейеров и ядер — означенный процессор не обременен адекватной подсистемой памяти, что делает сомнительным достижение теоретического максимума производительности в произвольном случае. А в третьих, действительно, распараллеливание задачи на 32 потока — редкость. Поэтому, скорее всего, этот процессор действительно предназначен для WEB серверов с сотнями параллельных запросов относительно малой сложности. В четвертых, я не слыхал еще о многопроцессорных системах на основе этого процессора, что существенным образом ограничивает его применимость. |
Stranger_NN
Кхм... Господа, а почему вы решили, что там ядро US III...? ![]()
означенный процессор не обременен адекватной подсистемой памяти Про подсистему памяти пока ничего не известно... В четвертых, я не слыхал еще о многопроцессорных системах на основе этого процессора Это потому, что их никогда не будет — Niagara не масштабируется ![]() |
http://www.osp.ru/cw/2005/25/024_1.htm
Кто-нибудь, подскажите разницу между III и IV ![]() |
Warrax
Это потому, что их никогда не будет — Niagara не масштабируется
![]() |
>в Sun могут строить относительно простые многоядерные процессоры, используя в качестве ядер хорошо отработанные процессоры SPARC III и SPARC IV.
Ага, такие они хорошие, белые и пушистые, что даже внеочередного выполнения к ним не прикрутили. Мол, не было необходимости. А теперь уже вся линейка похоронена, вместе с неродившимся US5... А позиционирование исключительно на рынок web-приложений -- это потенциальный провал. На одном этом не выехать. Warrax >Интересно, а SSL, к примеру, использует только целочисленные операции? Вроде, да. Хотя очень любит 64-битную целочисленку. |
GNUS inc
>Кто-нибудь, подскажите разницу между III и IV US4 -- это двухядерный US3, в том же конструктиве и с теми же интерфейсами. Как A64 и A64 X2. |
GNUS inc
![]() Не совсем понял, что так рассмешило? ![]() В готовой системе может стоять только один чип Niagara. И не факт что в такую систему можна будет вместо Niagara установить Rock(который будет видимо на базе двухядерных чипов). Поэтому масштабирования все же нет — смену одной платформы другой я не считаю масштабированием ![]() |
GNUS inc
Walter S. Farrell Давайте не путать UltraSPARC III и SPARC III... Это разные процессоры, насколько я помню |
matik
>Давайте не путать UltraSPARC III и SPARC III... Это разные процессоры, насколько я помню А откуда образовался этот SPARC III? microSPARC, superSPARC, hyperSPARC, turboSPARC -- были. Но они все 32-битные и давно не выпускаются. |
Walter S. Farrell
Возможно, что я спутал — сейчас вот сам засомневался... |
Warrax
Дык эта... При небесконечном количестве ног пропускная способность памяти вряд ли увеличилась в 8 раз, пропорционально увеличению количества ядер. Просто напросто. ![]() ------------------------------------- Walter S. Farrell
Ну, строго говоря, они себя неплохо и без означенного внеочередного выполнения чувствовали, IPC у них огого был (благо были другие "вкусные" механизмы), а пролетели, в основном, из-за того, что по частоте отстали навсегда, да из-за внешнего (медленного) кэша.. ![]() ------------------------------------- ALL Под "SPARC III и SPARC IV" имеются в виду процессоры архитектуры UltraSPARC, потому что те, которые не-Ultra представляют инетерс разве что для историков IT. |
Stranger_NN
>Ну, строго говоря, они себя неплохо и без означенного внеочередного выполнения чувствовали, IPC у них огого был (благо были другие "вкусные" механизмы), а пролетели, в основном, из-за того, что по частоте отстали навсегда, да из-за внешнего (медленного) кэша.. Как сказать... У US3 было 3 целочисленных, 2 вещественных и 1 адресный конвейер. Причём не очень-то и коротких: 14 целочисленных и 16 вещественных стадий. Так что неоткуда тут немерянному IPC взяться. Зрим в SPEC 2000: Sun Netra 20 в составе 2 US3 по 900МГц рубанула в int_rate 12,2 попугая, а в fp_rate -- 14,9 попугаев. Далее, Compaq ES40 на 2 Альфах EV68 по 833МГц. int_rate -- 13,0 на fp_rate в 16,4 тех же попугаев. Пролетел Спарк. И это-то на 8% более высоких частотах... |
Walter S. Farrell, пролетел-то он не очень и сильно, если вспомнить специфику организации кэшей в US3. При работе с GIS, оперирующими многомегабайтными BLOBами та же самая Netra 20 очень даже себя зарекомендовала.
КСТАТИ, а причем здесь тест _rate? По SPEC_INT имеем 475/533 и 511/533 для этих процессоров, а в SPEC_FP 945/1106 на 1200MHz для US3 (или в пересчете 709/829 при 900MHz) против 571/644 для 21264@833.... Так что вполне себе ничего и без внеочередного исполнения. А те самые IPC US3 накручивали, как правило, не на рассчетном, а на коммерческом коде, в основном под Oracle... |
Walter S. Farrell
Пролетел Спарк. И это-то на 8% более высоких частотах... Дык, ведь Альфа — тогда еще многие в сравнении с ней пролетали... По производительности... ![]() |
Warrax
По производительности... И по цене ![]() |
Warrax, да не так уж, как выясняется, и пролетел...
![]() |
Stranger_NN
>КСТАТИ, а причем здесь тест _rate? Дык показатель производительности многопроцессорных систем...
>По SPEC_INT имеем 475/533 и 511/533 для этих процессоров, а в SPEC_FP 945/1106 на 1200MHz для US3 (или в пересчете 709/829 при 900MHz) против 571/644 для 21264@833.... Так что вполне себе ничего и без внеочередного исполнения. Момент, а то я уж потерял ориентацию, где чьи цифры. int_peak/int_base и fp_peak/fp_base: Netra 20 (900MHz) --- 533 / 475 --- 713 / 634 ES40 68/833 --- 565 / 515 --- 777 / 621 Netra 20 (1200 MHz) --- 712 / 637 --- 1106 / 945 ES45 68/1250 --- 928 / 845 --- 1365 / 1019 Может, на каком-то коммерческом коде US3 и был хорош, но и тут дела явно не ах ![]() |
Walter S. Farrell, ну, учитывая с кем сравниваем — так вполне пристойные показатели, в любом случае.
![]() ![]() |
Walter S. Farrell
US4 -- это двухядерный US3, Это я и так знаю ![]() Даже не как Атлон х2, а как PD — два ядра в одном корпусе. Warrax И не факт что в такую систему можна будет вместо Niagara установить Rock(который будет видимо на базе двухядерных чипов). Поэтому масштабирования все же нет — смену одной платформы другой я не считаю масштабированием Сугубо искусственное деление, на фоне того, что Рок — это две Ниагары ![]() |
matik
Предполагаю, что на рынке веб-серверов будет хорош. А вот в остальном.... а вот не факт. Смотри сам: в теплопакет 250 ватт спокойно влазит практически три топовых оптерона. Что явно по быстродействию этот камешек сделают. |
GNUS inc
разве? |
ISA_user
в теплопакет 250 ватт спокойно влазит практически три топовых оптерона. Что явно по быстродействию этот камешек сделают. Не факт (если мы исключаем FP ![]() ![]() ![]() |
Warrax
Не факт (если мы исключаем FP ). а зачем исключать, если он в оптеронах есть? Да и 32-вау — это ж какой мощный инструмент воздействия на эго покупателя а мы им про блейд расскажем:) И про электрически разделенные "партиции" |
ISA_user
а мы им про блейд расскажем:) Так Ниагару SUN позиционирует как раз, "как убийцу блейдов" ![]() |
Warrax
Так Ниагару SUN позиционирует как раз, "как убийцу блейдов ![]() |
Stranger_NN
>ну, учитывая с кем сравниваем — так вполне пристойные показатели, в любом случае. ![]() ![]() Дык не спорю, довольно неплохо смотрится. Но на лидера не тянет, да и никогда УльтраСпарки в эту ипостась не прорывались. Просто шли по обкатанной дорожке, которая постепенно становилась всё более покатой. Ну, а П3 всем РИСКам проигрывал, может быть, кроме как на 32-битной целочисленке -- куда уж со стэковым FPU и [A]GTL[+] шиной переться было, рылом не вышел... |
Walter S. Farrell, дык и говорю, вполне нормальный камешек, и зарубили его развитие совершенно напрасно.
Так вот, возвращаясь к топику: 8-ядерный процессор Niagara пряд-ли, конечно, "в 15 раз мощнее", но, в целом, для МАЛОнагруженных серверов приложений (в силу ограниченной архитектуры памяти) процессор вполне приличный. И в этой ипостаси вполне может изобразить из себя "убийцу блэйдов", потому что на 5U шкафа позволяет установить 40 ядер, что больше чем у подавляющего большинства блэйдов. Но вот только именно при МАЛЫХ нагрузках. ![]() |
Stranger_NN
вполне нормальный камешек, и зарубили его развитие совершенно напрасно Подозреваю, что не столько "зарубили", сколько исчерпала идеи команда разработчиков... |
matik, да ладно! Только за счет проектной нормы можно было поднять частоту до 2-2,5GHz и получить производительность не меньше, а то и больше, чему Opteron'ов, а уж если L2 хотя бы в мегабайт на кристалл внести, то и подавно. Но этого не было сделано.. Зарубили-с..
|
Stranger_NN
Только за счет проектной нормы можно было поднять частоту до 2-2,5GHz и получить производительность не меньше, а то и больше, чему Opteron'ов, а уж если L2 хотя бы в мегабайт на кристалл внести, то и подавно. Но этого не было сделано.. Зарубили-с.. Неее ![]() С 1200МГц на поздних ревизиях 0.18 техпроцесса. Соответственно, обычный рост частоты за счет техпроцесса — не более полутора раз (и то, под вопросом). В случае с П4, где рост больше, наложился эффект от перехода на медные соединения. Да и при условии отсутствия ОоО в архитектуре рост тактовых частот оказывает все меньшее влияние на производительность — все упирается в ожидание из памяти, а внеочередного исполнения, которое могло бы сгладить этот эффект, нет. уж если L2 хотя бы в мегабайт на кристалл внести, то и подавно. Но этого не было сделано.. Зарубили-с.. Увеличить кэш — увеличить кристалл. Ты не забудь, что тираж US гораздо меньше тиража Opteron-ов, отсюда и совсем другая себестоимость. Плюс стоимость R&D... Думаю, речь не о зарубили: просто потенциальных прорывов впереди не было, а содержать отдельную архитектуру — недешевое занятие. Взвесили все факторы, и приняли решение: нафиг. |
matik
>Да и при условии отсутствия ОоО в архитектуре рост тактовых частот оказывает все меньшее влияние на производительность — все упирается в ожидание из памяти, а внеочередного исполнения, которое могло бы сгладить этот эффект, нет. Истинно так ![]() >Увеличить кэш — увеличить кристалл. Ты не забудь, что тираж US гораздо меньше тиража Opteron-ов, отсюда и совсем другая себестоимость. Плюс стоимость R&D... Да, а к тому же, это и не везде поможет. Программы, оперирующие потоковыми данными или просто большими их объёмами, не выиграют почти ничего. Те же оракловые базы данных. |
matik
Неее Извини, но это фантастика. Потому что переход на 0.13 не помог П3 перейти дойти до 2-х гигов — помог дойти до 1.4 — 1.5. С 1200МГц на поздних ревизиях 0.18 техпроцесса. Ну да, сначала до 1500, тем более, что с охлаждением у серверных камней вопросов нет, потом, с медью, потом на 0,09 и 0,065 — как раз, так и получается. ![]() Да и при условии отсутствия ОоО в архитектуре рост тактовых частот оказывает все меньшее влияние на производительность — все упирается в ожидание из памяти, а внеочередного исполнения, которое могло бы сгладить этот эффект, нет. Есть очень некислая софтовая предвыборка и многомегабайтовый внешний кэш. Правда, с ростом частоты его производительность становится недостаточной, но именно об этом я и говорил, когда рассуждал о внесении L2 на кристалл. Кстати, и память у US была одна из самых быстрых.... Увеличить кэш — увеличить кристалл. Ты не забудь, что тираж US гораздо меньше тиража Opteron-ов, отсюда и совсем другая себестоимость. Дык эта.. и цена <маржа тож> не как у Opteron'а... ![]() Думаю, речь не о зарубили: просто потенциальных прорывов впереди не было, а содержать отдельную архитектуру — недешевое занятие. Взвесили все факторы, и приняли решение: нафиг. Дык понятно, что путь "нафиг" и воспользуемся чужими наработками дешевле, но технологического тупика перед USparc не было. |
Stranger_NN
но технологического тупика перед USparc не было Ну, чтобы это сказать, нужно показать, а как именно могло развиваться ядро US? Я лично не вижу других вариантов, кроме как внедрять ОоО. Но это, видимо, было разработчикам либо не под силу, либо слишком сложно. Что можно сделать еще? Все равно, как ни крути, увеличение кэша — лишь полумера. |
Новая тема Ответить | Страница 1 из 5 |
[ Сообщений: 193 ] | На страницу 1, 2, 3, 4, 5 След. |
Кто сейчас на конференции |
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 0 |
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения |