Конференция работает на сервере Netberg

Radeon.ru

Конференция Radeon.ru

Страница 1 из 5 [ Сообщений: 193 ]  Версия для печати [+] На страницу 1, 2, 3, 4, 5  След.
Показать сообщения за  Поле сортировки  

Ваше мнение относительно SUN Niagara?
По производительности SUN Niagara всех "порвет" 0%  0%  [ 0 ]
Скорее SUN себе что-нибудь "порвет" 41%  41%  [ 13 ]
Про водопад Niagara слышал, а в процессорах не разбираюсь 25%  25%  [ 8 ]
Не знаю, поживем — увидим... 34%  34%  [ 11 ]
Всего голосов : 32
Есть желающие высказаться по сабжу? :D
Топовый 8-core, 32-way, single chip, предварительно 1.2GHz, 250W.
Отбраковка 6-core, 24-way, single chip.
Уже три года его доводят, с момента покупки у Afara Websystems Inc.
Кто знает что-нибудь интересное про сей каменный цветок?

Прототип процессора
Изображение

Прототип системы
Изображение
Warrax
Кто знает что-нибудь интересное про сей каменный цветок?
Ну, знать про этот цветок еще рано... Предполагать — можно.
Предполагаю, что на рынке веб-серверов будет хорош. А вот в остальном....:(
matik
Предполагаю, что на рынке веб-серверов будет хорош.
Ну это говорит и сам SUN, причем не аргументируя. ;)

А вот в остальном....:(
Вы про то, что системы более одной Ниагары не масштабируются?

Я тут прочитав это, а именно "Niagara-1 «равняется» пятнадцати SPARC III" прикинул:
8-ядерный (32-way) обгонит одно старое ядро SPARC III в 15 раз...
То есть производительность одного (4-way) ядра даже не вдвое вырастет в сравнении с SPARC III...
Результат SPARC III 1.2GHz в SPECint_rate2000 = 8.38
Но за счет кол-ва ядер имеем 8.38 х 15 = 125,7 (если верить на слово САНу) ;)

Сегодняшние конкуренты (SPECint_rate2000):
ProLiant BL45p (4CPU/8core) = 130
PRIMEPOWER650 (2025MHz, 8 cores, 8 chips) = 126
IBM eServer pSeries 690 Turbo (1300 MHz, 16 cores, 8 chips) = 131
Две последних системы достаточно дорогие... :shuffle:
Warrax
Вы про то, что системы более одной Ниагары не масштабируются?
Не только. Про достаточно слабую (если не путаю) подсистему памяти, про отсутствие масштабируемости, и так далее...
То есть там, где много слабеньких потоков, Ниагара хороша.
Но палочкой-выручалочкой она не станет — собственно, SUN это подтверждает, базируясь на Оптеронах.

Я тут прочитав это, а именно "Niagara-1 «равняется» пятнадцати SPARC III" прикинул:
Ой, это ПЕАР :) Я "обожаю", когда берут число ядер, и умножают на производительность процессора...
Кэш — общий, память — общая, шина — общая. Все это замедлит реальный процессор.
В результате Ваши расчеты кажутся мне излишне оптимистичными....
Кстати, в Ниагаре и Джемини вещественных конвейеров нет вовсе, чего не стоит забывать.

Warrax

>PRIMEPOWER650 (2025MHz, 8 cores, 8 chips) = 126

Этот на SPARC64 V, скоро обещают выпустить VI с SMT, поэтому ему Ниагара не конкурент. Даже при самом лучшем раскладе. Не говоря уже о том, что далеко на любой реальный код можно распараллелить на 32 потока... А если не удастся, то Ниагара покажет весьма скромную производительность...
matik
Ой, это ПЕАР :)
Это не пеар — это попытка развязать полемику ;)

Кэш — общий
Но вероятно большой?

память — общая
но вероятно n-way (может и 8-way)

шина — общая.
Одна? Это где-то освещалось?

В результате Ваши расчеты кажутся мне излишне оптимистичными....
Мне тоже :D, но надо же с чего-то начинать.

Walter S. Farrell
Кстати, в Ниагаре и Джемини вещественных конвейеров нет вовсе, чего не стоит забывать.
Интересно, а SSL, к примеру, использует только целочисленные операции?

далеко на любой реальный код можно распараллелить на 32 потока
Отсюда видимо и ориентация на WEB — 1000хn запросов красиво ложится на 32 логических процессора, если бы не соответствующие требования к подсистеме памяти...
Warrax
Это не пеар — это попытка развязать полемику
Это пеар со стороны SUN ;)

Но вероятно большой?
Ну пусть он будет даже 16МВ. Это по 512КВ на поток. Много это, или мало?
Но толку-то? 32 потока требуют хотя бы 32-входового частично-ассоциативного кэша... Сомневаюсь, что он такой.

но вероятно n-way (может и 8-way)
Максимум 256 бит. Что в реальности будет по ПСП меньше, чем у двух Оптеронов.

Одна? Это где-то освещалось?
Нет, но я не вижу признаков обратного. А, учитывая, что SUN старательно рекламирует все, что можно — ожидать здесь чего-то особенного было бы чересчур смело.
Кхм... Господа, а почему вы решили, что там ядро US III...? :oops: Там, кажется, все-таки US II, потому что у US III — все 6 конвейеров в ядре, а вот у II — как раз 4... Так что расчет производительности относительно US III неверен, по-моему. Нужно брать последний реальный US II, делать поправку на частоту и только потом умножать. Это во-первых.

Во-вторых, несмотря на внушительное к-во конвейеров и ядер — означенный процессор не обременен адекватной подсистемой памяти, что делает сомнительным достижение теоретического максимума производительности в произвольном случае.

А в третьих, действительно, распараллеливание задачи на 32 потока — редкость. Поэтому, скорее всего, этот процессор действительно предназначен для WEB серверов с сотнями параллельных запросов относительно малой сложности.

В четвертых, я не слыхал еще о многопроцессорных системах на основе этого процессора, что существенным образом ограничивает его применимость.
Stranger_NN
Кхм... Господа, а почему вы решили, что там ядро US III...? :oops: Там, кажется, все-таки US II, потому что у US III — все 6 конвейеров в ядре, а вот у II — как раз 4... Так что расчет производительности относительно US III неверен, по-моему. Нужно брать последний реальный US II, делать поправку на частоту и только потом умножать.

Я тут прочитав это, а именно "Niagara-1 «равняется» пятнадцати SPARC III"

означенный процессор не обременен адекватной подсистемой памяти
Про подсистему памяти пока ничего не известно...

В четвертых, я не слыхал еще о многопроцессорных системах на основе этого процессора
Это потому, что их никогда не будет — Niagara не масштабируется :D
http://www.osp.ru/cw/2005/25/024_1.htm

в Sun могут строить относительно простые многоядерные процессоры, используя в качестве ядер хорошо отработанные процессоры SPARC III и SPARC IV.

Кто-нибудь, подскажите разницу между III и IV :spy:
Warrax
Это потому, что их никогда не будет — Niagara не масштабируется

отработанные процессоры SPARC III и SPARC IV. Агрегируя на одном кристалле первые, Sun получает уже практически существующие с 2004 года процессоры Niagara; агрегируя вторые, получит готовящиеся для выпуска в будущем процессоры Rock.

:lol:
>в Sun могут строить относительно простые многоядерные процессоры, используя в качестве ядер хорошо отработанные процессоры SPARC III и SPARC IV.

Ага, такие они хорошие, белые и пушистые, что даже внеочередного выполнения к ним не прикрутили. Мол, не было необходимости. А теперь уже вся линейка похоронена, вместе с неродившимся US5...

А позиционирование исключительно на рынок web-приложений -- это потенциальный провал. На одном этом не выехать.

Warrax

>Интересно, а SSL, к примеру, использует только целочисленные операции?

Вроде, да. Хотя очень любит 64-битную целочисленку.
GNUS inc

>Кто-нибудь, подскажите разницу между III и IV

US4 -- это двухядерный US3, в том же конструктиве и с теми же интерфейсами. Как A64 и A64 X2.
GNUS inc
:lol:
Не совсем понял, что так рассмешило? :spy:
В готовой системе может стоять только один чип Niagara.
И не факт что в такую систему можна будет вместо Niagara установить Rock(который будет видимо на базе двухядерных чипов).
Поэтому масштабирования все же нет — смену одной платформы другой я не считаю масштабированием :)
GNUS inc
Walter S. Farrell
Давайте не путать UltraSPARC III и SPARC III... Это разные процессоры, насколько я помню
matik

>Давайте не путать UltraSPARC III и SPARC III... Это разные процессоры, насколько я помню

А откуда образовался этот SPARC III? microSPARC, superSPARC, hyperSPARC, turboSPARC -- были. Но они все 32-битные и давно не выпускаются.
Walter S. Farrell
Возможно, что я спутал — сейчас вот сам засомневался...
Warrax

Про подсистему памяти пока ничего не известно...

Дык эта... При небесконечном количестве ног пропускная способность памяти вряд ли увеличилась в 8 раз, пропорционально увеличению количества ядер. Просто напросто. :oops:
-------------------------------------

Walter S. Farrell

Ага, такие они хорошие, белые и пушистые, что даже внеочередного выполнения к ним не прикрутили. Мол, не было необходимости. А теперь уже вся линейка похоронена, вместе с неродившимся US5...

Ну, строго говоря, они себя неплохо и без означенного внеочередного выполнения чувствовали, IPC у них огого был (благо были другие "вкусные" механизмы), а пролетели, в основном, из-за того, что по частоте отстали навсегда, да из-за внешнего (медленного) кэша.. :(
-------------------------------------

ALL
Под "SPARC III и SPARC IV" имеются в виду процессоры архитектуры UltraSPARC, потому что те, которые не-Ultra представляют инетерс разве что для историков IT.
Stranger_NN

>Ну, строго говоря, они себя неплохо и без означенного внеочередного выполнения чувствовали, IPC у них огого был (благо были другие "вкусные" механизмы), а пролетели, в основном, из-за того, что по частоте отстали навсегда, да из-за внешнего (медленного) кэша..

Как сказать... У US3 было 3 целочисленных, 2 вещественных и 1 адресный конвейер. Причём не очень-то и коротких: 14 целочисленных и 16 вещественных стадий. Так что неоткуда тут немерянному IPC взяться.

Зрим в SPEC 2000:

Sun Netra 20 в составе 2 US3 по 900МГц рубанула в int_rate 12,2 попугая, а в fp_rate -- 14,9 попугаев.

Далее, Compaq ES40 на 2 Альфах EV68 по 833МГц. int_rate -- 13,0 на fp_rate в 16,4 тех же попугаев.

Пролетел Спарк. И это-то на 8% более высоких частотах...
Walter S. Farrell, пролетел-то он не очень и сильно, если вспомнить специфику организации кэшей в US3. При работе с GIS, оперирующими многомегабайтными BLOBами та же самая Netra 20 очень даже себя зарекомендовала.

КСТАТИ, а причем здесь тест _rate? По SPEC_INT имеем 475/533 и 511/533 для этих процессоров, а в SPEC_FP 945/1106 на 1200MHz для US3 (или в пересчете 709/829 при 900MHz) против 571/644 для 21264@833.... Так что вполне себе ничего и без внеочередного исполнения.

А те самые IPC US3 накручивали, как правило, не на рассчетном, а на коммерческом коде, в основном под Oracle...
Walter S. Farrell
Пролетел Спарк. И это-то на 8% более высоких частотах...
Дык, ведь Альфа — тогда еще многие в сравнении с ней пролетали...
По производительности... ;)
Warrax
По производительности...
И по цене :D
Warrax, да не так уж, как выясняется, и пролетел... :shuffle:
Stranger_NN

>КСТАТИ, а причем здесь тест _rate?

Дык показатель производительности многопроцессорных систем...


Q12: What is the difference between a "rate" and a "non-rate" metric?

A12: There are several different ways to measure computer performance. One way is to measure how fast the computer completes a single task; this is a speed measurement. Another way is to measure how many tasks a computer can accomplish in a certain amount of time; this is called a throughput, capacity or rate measurement.

The SPEC speed metrics, or non-rate metrics, (i.e., SPECint2000) are used for comparing the ability of a computer to complete single tasks. The SPEC rate metrics (i.e., SPECint_rate2000) measure the throughput or rate of a machine carrying out a number of similar tasks. Traditionally, the rate metrics have been used to demonstrate the performance of multi-processor systems


>По SPEC_INT имеем 475/533 и 511/533 для этих процессоров, а в SPEC_FP 945/1106 на 1200MHz для US3 (или в пересчете 709/829 при 900MHz) против 571/644 для 21264@833.... Так что вполне себе ничего и без внеочередного исполнения.

Момент, а то я уж потерял ориентацию, где чьи цифры.

int_peak/int_base и fp_peak/fp_base:

Netra 20 (900MHz) --- 533 / 475 --- 713 / 634
ES40 68/833 --- 565 / 515 --- 777 / 621
Netra 20 (1200 MHz) --- 712 / 637 --- 1106 / 945
ES45 68/1250 --- 928 / 845 --- 1365 / 1019

Может, на каком-то коммерческом коде US3 и был хорош, но и тут дела явно не ах :)
Walter S. Farrell, ну, учитывая с кем сравниваем — так вполне пристойные показатели, в любом случае. :oops: А уж если с одночастотными PIII сравнить, то и тем более. :-p Впрочем, речь не о том. Речь о том, что спекулятивное исполнение не является обязательным условием получения высокой производительности и IPC. Хороший, конечно, инструмент, но не единственный.
Walter S. Farrell
US4 -- это двухядерный US3,
Это я и так знаю ;)
Даже не как Атлон х2, а как PD — два ядра в одном корпусе.

Warrax
И не факт что в такую систему можна будет вместо Niagara установить Rock(который будет видимо на базе двухядерных чипов).
Поэтому масштабирования все же нет — смену одной платформы другой я не считаю масштабированием

Сугубо искусственное деление, на фоне того, что Рок — это две Ниагары :)
matik
Предполагаю, что на рынке веб-серверов будет хорош. А вот в остальном....
а вот не факт. Смотри сам: в теплопакет 250 ватт спокойно влазит практически три топовых оптерона. Что явно по быстродействию этот камешек сделают.
GNUS inc

Рок — это две Ниагары

разве?
ISA_user
в теплопакет 250 ватт спокойно влазит практически три топовых оптерона. Что явно по быстродействию этот камешек сделают.
Не факт (если мы исключаем FP :gigi:). Да и 32-вау — это ж какой мощный инструмент воздействия на эго покупателя :gigi:, ведь не каждый сможет противостоять такому :gigi:
Warrax
Не факт (если мы исключаем FP ).
а зачем исключать, если он в оптеронах есть?
Да и 32-вау — это ж какой мощный инструмент воздействия на эго покупателя
а мы им про блейд расскажем:) И про электрически разделенные "партиции"
ISA_user
а мы им про блейд расскажем:)
Так Ниагару SUN позиционирует как раз, "как убийцу блейдов" :gigi:
Warrax
Так Ниагару SUN позиционирует как раз, "как убийцу блейдов
:lol:
Stranger_NN

>ну, учитывая с кем сравниваем — так вполне пристойные показатели, в любом случае. :oops: А уж если с одночастотными PIII сравнить, то и тем более. :-p

Дык не спорю, довольно неплохо смотрится. Но на лидера не тянет, да и никогда УльтраСпарки в эту ипостась не прорывались. Просто шли по обкатанной дорожке, которая постепенно становилась всё более покатой. Ну, а П3 всем РИСКам проигрывал, может быть, кроме как на 32-битной целочисленке -- куда уж со стэковым FPU и [A]GTL[+] шиной переться было, рылом не вышел...
Walter S. Farrell, дык и говорю, вполне нормальный камешек, и зарубили его развитие совершенно напрасно.

Так вот, возвращаясь к топику: 8-ядерный процессор Niagara пряд-ли, конечно, "в 15 раз мощнее", но, в целом, для МАЛОнагруженных серверов приложений (в силу ограниченной архитектуры памяти) процессор вполне приличный. И в этой ипостаси вполне может изобразить из себя "убийцу блэйдов", потому что на 5U шкафа позволяет установить 40 ядер, что больше чем у подавляющего большинства блэйдов. Но вот только именно при МАЛЫХ нагрузках. :oops:
Stranger_NN
вполне нормальный камешек, и зарубили его развитие совершенно напрасно
Подозреваю, что не столько "зарубили", сколько исчерпала идеи команда разработчиков...
matik, да ладно! Только за счет проектной нормы можно было поднять частоту до 2-2,5GHz и получить производительность не меньше, а то и больше, чему Opteron'ов, а уж если L2 хотя бы в мегабайт на кристалл внести, то и подавно. Но этого не было сделано.. Зарубили-с..
Stranger_NN
Только за счет проектной нормы можно было поднять частоту до 2-2,5GHz и получить производительность не меньше, а то и больше, чему Opteron'ов, а уж если L2 хотя бы в мегабайт на кристалл внести, то и подавно. Но этого не было сделано.. Зарубили-с..
Неее :) Извини, но это фантастика. Потому что переход на 0.13 не помог П3 перейти дойти до 2-х гигов — помог дойти до 1.4 — 1.5.
С 1200МГц на поздних ревизиях 0.18 техпроцесса.

Соответственно, обычный рост частоты за счет техпроцесса — не более полутора раз (и то, под вопросом). В случае с П4, где рост больше, наложился эффект от перехода на медные соединения.

Да и при условии отсутствия ОоО в архитектуре рост тактовых частот оказывает все меньшее влияние на производительность — все упирается в ожидание из памяти, а внеочередного исполнения, которое могло бы сгладить этот эффект, нет.

уж если L2 хотя бы в мегабайт на кристалл внести, то и подавно. Но этого не было сделано.. Зарубили-с..
Увеличить кэш — увеличить кристалл. Ты не забудь, что тираж US гораздо меньше тиража Opteron-ов, отсюда и совсем другая себестоимость.
Плюс стоимость R&D...

Думаю, речь не о зарубили: просто потенциальных прорывов впереди не было, а содержать отдельную архитектуру — недешевое занятие.
Взвесили все факторы, и приняли решение: нафиг.
matik

>Да и при условии отсутствия ОоО в архитектуре рост тактовых частот оказывает все меньшее влияние на производительность — все упирается в ожидание из памяти, а внеочередного исполнения, которое могло бы сгладить этот эффект, нет.

Истинно так :)

>Увеличить кэш — увеличить кристалл. Ты не забудь, что тираж US гораздо меньше тиража Opteron-ов, отсюда и совсем другая себестоимость.
Плюс стоимость R&D...


Да, а к тому же, это и не везде поможет. Программы, оперирующие потоковыми данными или просто большими их объёмами, не выиграют почти ничего. Те же оракловые базы данных.
matik
Неее Извини, но это фантастика. Потому что переход на 0.13 не помог П3 перейти дойти до 2-х гигов — помог дойти до 1.4 — 1.5. С 1200МГц на поздних ревизиях 0.18 техпроцесса.
Ну да, сначала до 1500, тем более, что с охлаждением у серверных камней вопросов нет, потом, с медью, потом на 0,09 и 0,065 — как раз, так и получается. ;) На 900MHz с 1,8-2GHz квадропнем почти вровень бегали станции, так что и оценка производительности верная, в общем..

Да и при условии отсутствия ОоО в архитектуре рост тактовых частот оказывает все меньшее влияние на производительность — все упирается в ожидание из памяти, а внеочередного исполнения, которое могло бы сгладить этот эффект, нет.
Есть очень некислая софтовая предвыборка и многомегабайтовый внешний кэш. Правда, с ростом частоты его производительность становится недостаточной, но именно об этом я и говорил, когда рассуждал о внесении L2 на кристалл. Кстати, и память у US была одна из самых быстрых....

Увеличить кэш — увеличить кристалл. Ты не забудь, что тираж US гораздо меньше тиража Opteron-ов, отсюда и совсем другая себестоимость.
Дык эта.. и цена <маржа тож> не как у Opteron'а... :shuffle: И разработки там не так уж и много, как кажется. Редизайн, да, но это совсем другое дело.

Думаю, речь не о зарубили: просто потенциальных прорывов впереди не было, а содержать отдельную архитектуру — недешевое занятие. Взвесили все факторы, и приняли решение: нафиг.
Дык понятно, что путь "нафиг" и воспользуемся чужими наработками дешевле, но технологического тупика перед USparc не было.
Stranger_NN
но технологического тупика перед USparc не было
Ну, чтобы это сказать, нужно показать, а как именно могло развиваться ядро US? Я лично не вижу других вариантов, кроме как внедрять ОоО.
Но это, видимо, было разработчикам либо не под силу, либо слишком сложно.

Что можно сделать еще? Все равно, как ни крути, увеличение кэша — лишь полумера.
Новая тема    Ответить  [ Сообщений: 193 ]  На страницу 1, 2, 3, 4, 5  След.


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 0


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  

Удалить cookies конференции

Пишите нам | Radeon.ru