Radeon.ru :: Обсуждаем Intel Next Generation Mult-core Platforms

Radeon.ru https://forum.radeon.ru/

Обсуждаем Intel Next Generation Mult-core Platforms https://forum.radeon.ru/viewtopic.php?f=17&t=14427	Страница 1 из 2

Автор:	Ivan Andreevich [ 23:17 24.08.2005 ]
Заголовок сообщения:	Обсуждаем Intel Next Generation Mult-core Platforms
Итак, подолью керосинчика в огонь. Дофига новостей: http://news.google.com/nwshp?hl=en&tab= ... EBIHA1.DTL Цитата: Intel’s Next Generation Micro-architecture • Higher Performance OOO (out of order) Engine –Wider (4 issue); Deeper Buffers; 14 Stage Efficient Pipeline • Advanced Power Capability –Architected for Power Efficiency • MultiMulti-core Enhanced Cache System –Shared & scalable L2 Cache –Direct L1 to L1 cache transfer; Higher relative L2-core BW; • Improved Memory Access –Improved Pre-fetch, Memory Disambiguation Micro-Architecture and Features Names TBD 1) Trace-cache: есть или нет 2) Как в pentium m прикрутили AMD64? 3) Что сулит 4-issue OOO (обошли АМД в этом плане) 4) Общий Л2 vs Отдельный как в К8 5) Частотный потенциал (без Replay, конечно)? 6) Direct L1 to L1 cache transfer — насколько быстрая \ широкая шина? Ядра на подложке отдельные.. И так далее

Автор:	BorisU [ 00:04 25.08.2005 ]
Заголовок сообщения:
2) Почему вы решили, что "прикручивали к Pentium M"?

Автор:	Ivan Andreevich [ 00:17 25.08.2005 ]
Заголовок сообщения:
BorisU Есть альтернативные идеи — излагай ЗЫ у нас тут лучше чем на ixbt, добро пожаловать

Автор:	BorisU [ 00:29 25.08.2005 ]
Заголовок сообщения:
например с нуля делали новую архитектуру, используя опыт предыдущих.

Автор:	VLev [ 00:31 25.08.2005 ]
Заголовок сообщения:
Ivan Andreevich писал(а): 1) Trace-cache: есть или нет IMHO, не нужен 2) Как в pentium m прикрутили AMD64? особых проблем быть не должно 3) Что сулит 4-issue OOO (обошли АМД в этом плане) давно пора, тем более, что у AMD макро-операции, они часто "весомее" микроопераций P6. 4) Общий Л2 vs Отдельный как в К8 Это несомненно лучше. Вообще, L2 кэш и сейчас лучше. 5) Частотный потенциал (без Replay, конечно)? выше K8 6) Direct L1 to L1 cache transfer — насколько быстрая \ широкая шина? Скорость и ширина, вероятно, сравнимы с доступом в L2. Не совсем понятно, зачем делать лучше.

Автор:	VLev [ 00:42 25.08.2005 ]
Заголовок сообщения:
BorisU писал(а): например с нуля делали новую архитектуру, используя опыт предыдущих. P4 (NetBurst) с нуля не делали, за основу была взята микроархитектура P6, к которой был заменен front-end (TraceCacheи т.д. с целью упростить декодер) и исполнительная часть, (RapidExecEngine, с целью повысить рабочую частоту). Именно эти части в настоящий момент как раз неактуальны. Впрочем, обратные "заимствования" (из P4 в P-M) тоже были, но носили фрагментарный характер.

Автор:	Walter S. Farrell [ 01:36 25.08.2005 ]
Заголовок сообщения:
>–Wider (4 issue); Deeper Buffers; 14 Stage Efficient Pipeline Да, похоже на доработку Pentium-M. >3) Что сулит 4-issue OOO (обошли АМД в этом плане) Не знаю, хорошо это или плохо... Декодеры будут ещё более извращёнными, что ограничит частотный потенциал ядра. Эффективность загрузки ФУ тоже под вопросом. Подождём подробностей... >4) Общий Л2 vs Отдельный как в К8 Идея, кстати, неплоха. Если бы D-cache был со сквозной записью, то это бы упростило до максимума обеспечение когерентности. Но вряд ли Интел на это пойдёт. >6) Direct L1 to L1 cache transfer — насколько быстрая \ широкая шина? Ядра на подложке отдельные.. Не меньше 256 бит, скорее всего. Задержки на доступ к чужому D-cache будут на пару тактов выше, но интересно, какова будет политика доступа: последовательная или параллельная. >5) Частотный потенциал (без Replay, конечно)? Кстати, не факт. В некоторой упрощённой форме риплэй может сохраниться. Как у EV6, например.

Автор:	Ivan Andreevich [ 08:07 25.08.2005 ]
Заголовок сообщения:
Walter S. Farrell Не знаю, хорошо это или плохо Ага. АМД думает что больше уже не лучше. Они много раз говорили что больше чем в К7 уже не будет.. последовательная или параллельная. http://theinquirer.net/?article=25674 Тут говорится о последовательном доступе в Л2. Посему, можно предположить последовательный доступ в Л1. В некоторой упрощённой форме риплэй может сохраниться Я, конечно, имел ввиду жуть которая в П4 — её не будет BorisU С нуля ни АМД ни Интел не делают VLev выше K8 Это ясно. А если цифрами? Я думаю что почти 4 ГГц.

Автор:	chavv [ 08:47 25.08.2005 ]
Заголовок сообщения:
Ivan Andreevich писал(а): Walter S. Farrell VLev выше K8 Это ясно. А если цифрами? Я думаю что почти 4 ГГц. А зачем?

Автор:	Ivan Andreevich [ 09:39 25.08.2005 ]
Заголовок сообщения:
chavv Чего зачем?

Автор:	VLev [ 10:06 25.08.2005 ]
Заголовок сообщения:
Ivan Andreevich писал(а): Это ясно. А если цифрами? Я думаю что почти 4 ГГц. Я не возьмусь назвать конкретную цифру. За основу прогноза конечно можно взять современные P-M. В плюс идет "десктопный" редизайн и 65нм техпроцесс, в минус --- 64бит 1-тактовый сумматор и 4-issue планировщики/отставка. Ну и в полном тумане --- новый декодер (сейчас это самая сложная часть P6).

Автор:	BorisU [ 10:18 25.08.2005 ]
Заголовок сообщения:
Может они соберутся выкинуть всякое неиспользуемое старье из системы команд, наконец?

Автор:	VLev [ 10:21 25.08.2005 ]
Заголовок сообщения:
BorisU писал(а): Может они соберутся выкинуть всякое неиспользуемое старье из системы команд, наконец? нет. Изменений в программной модели быть не должно никаких IMHO.

Автор:	chavv [ 16:11 25.08.2005 ]
Заголовок сообщения:
засчет чего "5) Частотный потенциал (без Replay, конечно)?" будет выше ? 14 стадий против 12 у К8 14 против 31 у Прескот..... + 4-issue vs 3 vs 2 ...

Автор:	Walter S. Farrell [ 16:44 25.08.2005 ]
Заголовок сообщения:
Ivan Andreevich >Тут говорится о последовательном доступе в Л2. Посему, можно предположить последовательный доступ в Л1. Так с S-cache оно и понятно, незачем его перегружать лишними запросами. А вот с D-cache возможны варианты. Либо параллельно лезть в оба D-cache, либо в чужой D-cache параллельно с доступом в свой S-cache. Ещё вот что интересно: неужели Интел изменила политику подключения D-cache на невключающую (exclusive)? Ведь если она бы осталась включающей, то есть содержимое обоих D-caches дублировалось бы в едином S-cache, то зачем усложнять дизайн и разводить лишнюю широкую шину между D-caches? Достаточно просто пройтись по тэгам S-cache... BorisU >Может они соберутся выкинуть всякое неиспользуемое старье из системы команд, наконец? Очень маловероятно. Возможность выполнения даже самого древнего кода -- предмет особой гордости Интела. К тому же, всякое старьё в виде BCD-команд, ASCII-коррекции и прочего уже давно отдыхает в микрокоде, куда уж дальше...

Автор:	lefty [ 17:25 25.08.2005 ]
Заголовок сообщения:
Кстати, интересно, получится ли у АМД к концу 2006 года разогнать свои двуядерники до 3Ггц? Насколько я понимаю, Conroe/Merom будут близки к нынешним А64 Х2 по IPC и удельная производительность тоже будет близкой. Отсюда-то для АМД и встанет необходимость подгонять свои двуядерники до близких/больших частот.

Автор:	Ivan Andreevich [ 22:03 25.08.2005 ]
Заголовок сообщения:
Sossoman & Yonah @ Cinebench: http://www.computerbase.de/news/hardwar ... man_yonah/ Гм.. 1 x Dual Sossoman 1.5 GHz это 2 ядра. Примерно равен X2 3800+. Сinebench некритичен к ПСП (кстати, какая подсистема памяти у dual sossoman — 128-bit DDR666?) Можно сравнить числодробительный IPC — у Х2 он немного лучше. В двухпроцессорных системах Оптероны ещё оторвутся т.к. ПСП выше... В общем бояЦЦа только если Интел выпустить что-нить типа 2.5 ГГц DC. Cкриншот CPU-Z показывает бред. 1) FSB 600 x 4 , множитель 2.5 и отсутствие поддержки AMD64. lefty ИМХО АМД реально может выпустить 2 x 2.8 GHz до конца года без смены техпроцесса, или даже 3 ГГц в первом квартале след. года. Хотя, наверное, 2.8 выйдет в Q106 вместе с FX-59.

Автор:	Arie [ 05:17 26.08.2005 ]
Заголовок сообщения:
Ivan Andreevich Цитата: 1 x Dual Sossoman 1.5 GHz это 2 ядра. Это где вы там такое увидели ?

Автор:	Ivan Andreevich [ 05:18 26.08.2005 ]
Заголовок сообщения:
Arie Прошу прощения, я имел ввиду экстраполяцию производительности 2 ГГц "соски"

Автор:	Ivan Andreevich [ 05:23 26.08.2005 ]
Заголовок сообщения:
Всмысле чего увидел?

Автор:	BorisU [ 09:27 26.08.2005 ]
Заголовок сообщения:
Про Sossaman Цитата: Being all about Enterprise, Pat talked about Sossaman — an Intel Xeon processor based on the 65nm Yonah core. Sossaman will be made available at two separate power envelopes: 15W and 30W, both of which are extremely low for what will essentially be a high performance dual core server. Intel will be making Sossaman available in 1U racks as well as other small form factor enterprise offerings. У Yonah нет 64 бит, так что тут наверно их тоже нет.

Автор:	Ivan Andreevich [ 09:36 26.08.2005 ]
Заголовок сообщения:
BorisU У Yonah нет 64 бит, так что тут наверно их тоже нет. А к чему тогда в слайдах написано 64-бита были взяты у П4? Не.. скорее в ноутах они искуственно отключены.

Автор:	BorisU [ 09:44 26.08.2005 ]
Заголовок сообщения:
Ivan Andreevich Цитата: А к чему тогда в слайдах написано 64-бита были взяты у П4 Так Sossaman это не "next generation".

Автор:	Warrax [ 10:49 26.08.2005 ]
Заголовок сообщения:
Ivan Andreevich Sossoman & Yonah @ Cinebench: http://www.computerbase.de/news/hardwar ... man_yonah/ То есть, еще не существующий dual yonah, после своего появления, вероятно, не сможет в топовой версии догнать даже Athlon 64 X2 3800+... Близится ценовая война?

Автор:	BorisU [ 11:41 26.08.2005 ]
Заголовок сообщения:
Какая война? Кто в здравом уме поставит Athlon 64 X2 с TDP 89W в ноутбук, для которых, собственно Yonah и сделан?

Автор:	VLev [ 13:17 26.08.2005 ]
Заголовок сообщения:
BorisU писал(а): Какая война? Кто в здравом уме поставит Athlon 64 X2 с TDP 89W в ноутбук... Уже сейчас есть 2xCore 1.8GHz OpteronX65HE с TDP 55W, что вполне соответствует термопакету буков класса "замена настольного ПК". У меня Mobile A64 с TDP 62W, а сам бук и вовсе поддерживает и процессоры с термопакетом 81.5W. Но вообще, выход мобильных 2xCore A64 вряд ли состоится раньше 2Q06, так что у AMD еще есть достаточно времени уменьшить TDP при одновременном ускорении. IMHO, 2.2-2.4GHz Mobile A64x2 с TDP <~50W вполне возможен.

Автор:	skolSamara [ 13:29 26.08.2005 ]
Заголовок сообщения:
BorisU Дык вроде речь про Sossaman?

Автор:	VLev [ 13:31 26.08.2005 ]
Заголовок сообщения:
Кстати, по поводу 4xIssue Pentium-ов "Next Generation" (P-NG): Я о uops fusion забыл, что на самом деле сближает P-M и K7/8. Кстати, интересно узнать, сколько у ядра P-NG портов запуска, и какие именно. У P-M вроде 5 (по крайней мере 5 reservation stations): 0: IU1; FPU/SSE/MMX (скалярные видимо); MMX1 (первая половинка вектора?) 1: IU2; SSE (вектор?); MMX2 2: Load 3: STA 4: STD По сравнению с K8: меньше IntUnits (2vs3), меньше Load-ов (1vs2), меньше (?) FP (1vs2), зато более продвинутый (асинхронный) Store

Автор:	BorisU [ 13:47 26.08.2005 ]
Заголовок сообщения:
Цитата: Дык вроде речь про Sossaman? Что-то мне кажется, что он от Yonah отличается в основном названием

Автор:	Ivan Andreevich [ 20:14 26.08.2005 ]
Заголовок сообщения:
BorisU Так Sossaman это не "next generation". Не понял? А где и когда тогда будет это "следующее поколение"? В таком случае, что из себя представляют Sossoman / Yonah?

Автор:	BorisU [ 20:47 26.08.2005 ]
Заголовок сообщения:
Next Generation Microarchitecture это Merom, Conroe, Woodcrest и т д. А Yonah (И судя по всему Sossoman) это слегка подрихтованное ядро Pentium M + dual core на техпроцессе 65nm.

Автор:	matik [ 21:16 28.08.2005 ]
Заголовок сообщения:
BorisU А Yonah (И судя по всему Sossoman) это слегка подрихтованное ядро Pentium M + dual core на техпроцессе 65nm. Согласен.

Автор:	Ivan Andreevich [ 21:30 28.08.2005 ]
Заголовок сообщения:
Гм.. а в чём конретно состоит "лёгкая подрихтация" кроме перехода на новый техпроцесс?

Автор:	matik [ 21:36 28.08.2005 ]
Заголовок сообщения:
Ivan Andreevich а в чём конретно состоит "лёгкая подрихтация" кроме перехода на новый техпроцесс? Ну, вариантов может быть много. Начиная от улучшения управления энергопотреблением, и заканчивая переделыванием каких-то блоков. Впрочем, не думаю, что будет что-то существенное: нарастят емкость буферов, улучшат управление энергопотреблением, да и оптимизируют расположение блоков.

Автор:	BorisU [ 21:43 28.08.2005 ]
Заголовок сообщения:
Вроде обещали FPU ускорить. Ну и dualcore + общий кэш.

Автор:	Ivan Andreevich [ 21:49 28.08.2005 ]
Заголовок сообщения:
BorisU Как? Это, помоему, самое слабое место pentium m.

Автор:	matik [ 21:51 28.08.2005 ]
Заголовок сообщения:
BorisU Вроде обещали FPU ускорить Хм... Хорошо бы, но малореально. Потому что потребует, как мне кажется, заметного редизайна процессора.

Автор:	BorisU [ 21:52 28.08.2005 ]
Заголовок сообщения:
Ivan Andreevich Как? Если бы я знал как — я бы давно уже на большой зарплате в интеле сидел

Автор:	matik [ 22:03 28.08.2005 ]
Заголовок сообщения:
BorisU Если бы я знал как — я бы давно уже на большой зарплате в интеле сидел Ну, как бы способы известны. Другое дело, что на голом месте не прилепишь еще один блок FPU, просто чтобы "стало быстрее"...

Автор:	Ivan Andreevich [ 22:19 28.08.2005 ]
Заголовок сообщения:
matik Другое дело, что на голом месте не прилепишь еще один блок FPU, просто чтобы "стало быстрее"... В next-generation они, похоже, так и сделают?

Автор:	matik [ 23:48 28.08.2005 ]
Заголовок сообщения:
Ivan Andreevich Не знаю. Хотелось бы...

Автор:	Ivan Andreevich [ 09:08 29.08.2005 ]
Заголовок сообщения:
matik Так, я вот тут подумал.. как насчёт ассинхронности как в П4 сделано с АЛУ? Только теперь у Pentium M частота низкая, неплохо было бы сделать double-clocked FPU

Автор:	matik [ 10:52 29.08.2005 ]
Заголовок сообщения:
Ivan Andreevich как насчёт ассинхронности как в П4 сделано с АЛУ? Только теперь у Pentium M частота низкая, неплохо было бы сделать double-clocked FPU Не, это слишком сложно будет. Надо ведь будет не только FPU разогнать (что, кстати, не слишком просто). Надо будет разгонять порты запуска, систему выборки микроопераций, очереди — в общем, все то, что в П4 выделено в Rapid Execution Engine. Не думаю, что они будут настолько сильно переделывать П-М.

Автор:

VLev [ 12:41 29.08.2005 ]

Заголовок сообщения:

Ivan Andreevich писал(а):
Так, я вот тут подумал.. как насчёт ассинхронности как в П4 сделано с АЛУ?

Асинхронность в каком смысле? Если в смысле O-o-O, то, судя по обещаниям увеличить кол-во буферов, то, может, и поболее P4 будет, где что-то ~200 in-fly команд было (если не путаю), правда, в основном, за счет длинного конвейера (replay loop точнее). А в P-NG может быть за счет буферов и интеллектуального планировщика (про планировщик, пока, вроде не слышно). Это кстати очень положительно может сказаться на производительности.
Если же "асинхронность" в смысле спекулятивности, то вряд ли что-то существенно изменится по сравнению с P-M IMHO, правда, он уже вобрал лучшие черты P4, насколько я понимаю --- алгоритмы предсказание переходов и раздельная обработка STA/STD.

Цитата:
Только теперь у Pentium M частота низкая, неплохо было бы сделать double-clocked FPU

Не будет этого ни у кого IMHO --- слишком горячий блок будет. Естественно пойти по другому пути --- удвоить кол-во блоков FPU (то же актуально и для K8+) и (из-за ограничений архитектуры P6) портов запуска. Возможно, четверной запуск делается именно для этого.

Автор:	Ivan Andreevich [ 23:17 29.08.2005 ]
Заголовок сообщения:
VLev matik В П4 FPU работает практически на частоте 4 ГГц. Добавив ещё один блок FPU (зачем делать front-end мощнее, если этого не планируется?) и на частоте 3 ГГц, этот next generation только только догонит сегодняшний П4 в пиковой производительности ССЕ2. Или я что-то не так понимаю? В таком случае бояться, помоему, нечего. У кого хорошая память — многие ли догадывались о double-clocked ALU в P4 до его выпуска? Кстати, нужно определится как называть этот next generation вкратце. iP8? VLev Так, я вот тут подумал.. как насчёт ассинхронности как в П4 сделано с АЛУ? Я имел ввиду всего лишь удвоенную частоту то же актуально и для K8+) АМД, помоему, заявлили что они уже back-end шире делать не собираются? Не будет этого ни у кого IMHO --- слишком горячий блок будет Meron @ 2 GHz, FPU @ 4 GHz как сейчас у П4. А их почти до 7 ГГц разгоняли, так что некий запас есть Насколько я понимаю, блоки ССЕ2 итд там почти одинаковое, вот П-М и летит как фанера над парижем в медиакодировании. Возможно, четверной запуск делается именно для этого. Ещё один FPU блок или два? В пентиум М их 2 как в П3, так? matik в общем, все то, что в П4 выделено в Rapid Execution Engine. А мне кажется что эта часть как раз нормально работает в П4 Не думаю, что они будут настолько сильно переделывать П-М. Давайте попробуем составить список логичных переделок — интересно

Автор:	matik [ 23:43 29.08.2005 ]
Заголовок сообщения:
Ivan Andreevich В П4 FPU работает практически на частоте 4 ГГц Допустим, и что? Добавив ещё один блок FPU (зачем делать front-end мощнее, если этого не планируется?) и на частоте 3 ГГц, этот next generation только только догонит сегодняшний П4 в пиковой производительности ССЕ2. Не понял вывода... 2 х 3ГГц ~ 1 х 6ГГц (в пиковой производительности), почему вдруг стало равно 4??? У кого хорошая память — многие ли догадывались о double-clocked ALU в P4 до его выпуска? Дык Интел в презентациях делала на это упор. Да и Инквайр писал, что некоторые блоки работают на удвоенной частоте. Правда, тогда все это было на уровне слухов, конечно — но официальная презентация их подтвердила.

Автор:	VLev [ 23:50 29.08.2005 ]
Заголовок сообщения:
Ivan Andreevich писал(а): В П4 FPU работает практически на частоте 4 ГГц. Насколько мне известно, он проще (уже), чем в P-M (K7/8 ). Где-то ~в 80/64 раз. Более широкий делать собирались, но по каким-то причинам не стали (возможно, как раз из-за перегрева). Добавив ещё один блок FPU (зачем делать front-end мощнее, если этого не планируется?) и на частоте 3 ГГц, этот next generation только только догонит сегодняшний П4 в пиковой производительности ССЕ2. Или я что-то не так понимаю? Да все вроде проще (когда нет ограничений по портам): в iP4 1 64бит MUL и 1 64бит ADD за такт, итого, на 4GHz в пике 8Flops на 1GHz. Если в P-NG будет две пары аналогичных 64бит блоков (вместо одной пары 80-битных), то на частоте 3GHz в пике будет 12GFlops --- вполне достойно. В таком случае бояться, помоему, нечего. У кого хорошая память — многие ли догадывались о double-clocked ALU в P4 до его выпуска? Ну, как раз это было озвучено Intel-ом задолго до..., насколько я помню. Кстати, нужно определится как называть этот next generation вкратце. iP8? Пока не определится сам Intel, я предпочитаю P-NG. АМД, помоему, заявлили что они уже back-end шире делать не собираются? где? Я как раз помню что-то про распределение ресурсов и несимметричные ядра. И то, и другое можно трактовать как уширение IMHO. Насколько я понимаю, блоки ССЕ2 итд там почти одинаковое, вот П-М и летит как фанера над парижем в медиакодировании. Скорее всего разные. Иначе бы x87 код тормозил бы на P-M. Ещё один FPU блок или два? В пентиум М их 2 как в П3, так? Не знаю (не помню). Всегда считал что одна пара (ADD+MUL), как и везде. Остальное --- ограничение портов.

Автор:	Ivan Andreevich [ 23:51 29.08.2005 ]
Заголовок сообщения:
matik Допустим, и что? Прогресс на месте не стоит, значит если сегодня можно 4 ГГц то завтра можно 5 ГГц, а послезавтра — 6 Хотя может действительно дурацкая идея. Мне просто совсем не понятно как подтянуть FPU до производительности которой нужно баяЦЦа Не понял вывода... 2 х 3ГГц ~ 1 х 6ГГц (в пиковой производительности), почему вдруг стало равно 4??? Я не имел ввиду 4 FPU блока, я имел ввиду 3 т.е. 3 GHz x 3 ~ 4 GHz x 2 Мне кажется слишком широкий бэк-энд тоже не нужен? У АМД в этом смысле, помоему, самый лучший компромисс. Хотя фиг знает насколько они перерабатывают свой "Higher Performance OOO" Разве 4 FPU будут намного холоднее 3 FPU на удвоенной частоте? В принципе, Dothan до >4 ГГц уже разгоняли — потенциал есть.

Автор:	VLev [ 00:05 30.08.2005 ]
Заголовок сообщения:
Ivan Andreevich писал(а): Разве 4 FPU будут намного холоднее 3 FPU на удвоенной частоте? Есть подозрение, что да. Более того, 2 на обычной будут холоднее одного на удвоенной. Хоть пример и не очень корректный, но, за неимением лучшего, можно сравнить 64бит RapidExecEng P4 (2int+1logic+2(?)addr --- всего 5 шт) с 64бит ALU/AGU K8 (3int+3logic+3addr ---9шт). Кто холоднее?

Автор:	matik [ 00:12 30.08.2005 ]
Заголовок сообщения:
Ivan Andreevich Разве 4 FPU будут намного холоднее 3 FPU на удвоенной частоте? В принципе, Dothan до >4 ГГц уже разгоняли — потенциал есть. Думаю, да. Поскольку меньшая частота, как правило, достигается при меньшем напряжении питания. А зависимость тепловыделения от напряжения — квадратичная (!).

Автор:	Ivan Andreevich [ 00:33 30.08.2005 ]
Заголовок сообщения:
VLev Кто холоднее? Никто не спорит, но мне кажется что главная проблема лежит в техпроцессе. Если бы AMD SOI + SS + 0.09 сделала, было бы интересно. matik Но, ежели FPU и на 1.2V на 4 ГГц сможет работать при частоте остального ядра в 2 ГГц, это хорошая альтернатива. Возвращаемся к вопросу раздельного питания блоков в iP8. 1) Реально? 2) Нужно ли? matik VLev Уговорили.. хотя всё равно 2 на удвоенной будут быстрее 4 обычных т.к. не все задачи легко разложить аж на 4 шт. x86 это не Итаниум и получится опять как с П4 — нужно оптимизировать, иначе будет работать не так хорошо как могло бы.

Автор:	U2 [ 02:24 30.08.2005 ]
Заголовок сообщения:
VLev 5) Частотный потенциал (без Replay, конечно)? выше K8 Это почему? Ivan Andreevich неплохо было бы сделать double-clocked FPU VLev прав, это маловероятно — горячая область выйдет, а это уже противоречит их заявленному плану = PPW (power performance per watt) Ivan Andreevich Давайте попробуем составить список логичных переделок — интересно Тогда надо понять, что берется за основу. ИМХО, на базе РМ они делают = mop fusion/stack manager/optimised sbus/adv. branch prediction. Непонятно, что они от нетберста желают взять? прикрутки VT, AMT, 64-bit, но причем здесь нетберст? Разве 4 FPU будут намного холоднее 3 FPU на удвоенной частоте? Кажись так и есть Возвращаемся к вопросу раздельного питания блоков в iP8. 1) Реально? 2) Нужно ли? Рельнее некуда, т.к. 1) интел этим путем как раз и идет 2) еще как нужно

Автор:	Ivan Andreevich [ 03:33 30.08.2005 ]
Заголовок сообщения:
U2 1) интел этим путем как раз и идет 2) еще как нужно Это интересно. Линк есть? Силовая обвязка процессора будет по крайней мере в 2 раза сложнее?

Автор:	VLev [ 10:20 30.08.2005 ]
Заголовок сообщения:
U2 писал(а): Это почему? При прочих равных --- из-за более дотошного дизайна. Из неравного --- у Intel есть наработки по динамическому регулированию напряжения и частоты вплоть до отдельных блоков. По нормам техпроцесса Intel традиционно опережает AMD на год-полтора.

Автор:	VLev [ 10:29 30.08.2005 ]
Заголовок сообщения:
Ivan Andreevich писал(а): Уговорили.. хотя всё равно 2 на удвоенной будут быстрее 4 обычных т.к. не все задачи легко разложить аж на 4 шт. Опять нет (два раза): и не быстрее (даже медленнее), и легко (речь, напомню о FP). Это связано с тем, что латентность основных операций в FPU даже нормальной (неудвоенной) частоты гораздо больше 1 такта (3-5-20-50+). Высокий темп достигается только за счет конвейеризации операций (в частности, операции должны быть независимы). Но последнее обычно сделать очень просто, т.к. искусственных зависимостей (например, из-за вычисления адресов), в отличие от IU, не возникает. Соответственно, остаются только алгоритмические зависимости, но абсолютное большинство актуальных алгоритмов допускают огромную степень распараллеливания.

Автор:	U2 [ 00:24 31.08.2005 ]
Заголовок сообщения:
Ivan Andreevich Это интересно. Линк есть? Силовая обвязка процессора будет по крайней мере в 2 раза сложнее? На IDF много презентационных материалов. И после беглого просмотра сложилось впечатление, что интел идет по этому пути. Точно, конечно, не уверен, что именно на новой микро-архитектуре внедрят, но на ассиметричных процах уж наверняка. ИМХО. VLev При прочих равных --- из-за более дотошного дизайна. Из неравного --- у Intel есть наработки по динамическому регулированию напряжения и частоты вплоть до отдельных блоков. По нормам техпроцесса Intel традиционно опережает AMD на год-полтора. 1. Это если исходить из общей логики. Вообще. Но совсем и необязательно. Да и частота уже перестала быть неким фетишем. Насколько дизайн "дотошен" у интела еще неизвестно и что на выходе выйдет пока тоже. 2. DBS — фича хорошая. А вы уверены, что при этом речь идет до отдельных блоков? 3. По нм интел опережал амд ранее год-полтора, теперь разрыв вроде уменьшился

Автор:	U2 [ 00:32 31.08.2005 ]
Заголовок сообщения:
Интервью (на англ. — автоперевод с японского) с Stephen L. Smith (Director of Intel Desktop Platform Operations) 1 и 2 Цитата: A: It means without being NetBurst Architecture. там есть и др. инт. моменты

Автор:	matik [ 15:05 31.08.2005 ]
Заголовок сообщения:
Ivan Andreevich bess написал интересный постинг по интересующей Вас теме... Почти мини-статья

Автор:	U2 [ 00:08 01.09.2005 ]
Заголовок сообщения:
А кто-нибудь в курсе, когда официально презентация архитектуры у интел намечается?

Автор:	matik [ 00:22 01.09.2005 ]
Заголовок сообщения:
U2 увы, никаких данных у меня нет.

Автор:	U2 [ 01:51 01.09.2005 ]
Заголовок сообщения:
matik увы, никаких данных у меня нет. А представление нетберста как происходило? Не помните случаем? На IDF или отдельная презентация была?

Автор:	matik [ 01:52 01.09.2005 ]
Заголовок сообщения:
U2 На IDF или отдельная презентация была? Вроде и то и то. Да еще и отдельных документов (вроде Кармеановских PDF, которые сильно помогли при написании статьи) хватало...

Автор:	U2 [ 02:07 01.09.2005 ]
Заголовок сообщения:
matik Да речь не про документацию вообще, а в разрезе мероприятия. Хотелось бы понять, есть что-нибудь общее между подходами в представлении нетберста и нового сабжа. Или все было совсем по-другому? Мне этот момент очень интересен.

Автор:	matik [ 10:50 01.09.2005 ]
Заголовок сообщения:
U2 Хм... Начало примерно такое же: пара интригующих подробностей, и никакой конкретики. Впрочем, это закон жанра

Автор:	C@t [ 13:09 01.09.2005 ]
Заголовок сообщения:
matik надо полагать, у нас появился автоцензор, и ты хочешь его протестировать?

Автор:	Ivan Andreevich [ 06:18 09.03.2006 ]
Заголовок сообщения:
Продолжаем тут? Похоже придётся Conroe купить

Автор:	Ntag [ 09:11 09.03.2006 ]
Заголовок сообщения:
Ivan Andreevich Ещё не ясно.До конца 2006-го есть время и у АМД;)

Автор:	Ivan Andreevich [ 10:06 09.03.2006 ]
Заголовок сообщения:
Ntag Помоему Conroe уже через 3 месяца будут

Автор:	Ntag [ 10:11 09.03.2006 ]
Заголовок сообщения:
Ivan AndreevichНет, просто он выйдет как раз к этому сроку

Автор:	matik [ 10:46 09.03.2006 ]
Заголовок сообщения:
Ivan Andreevich Похоже придётся Conroe купить Есть нюанс. Похоже, производительность Conroe сильно зависит от объема кэша. Старший, 2.67, будет быстрым, но дорогим. А вот будут ли быстрыми младшие, с уполовиненным кэшем — это еще посмотреть надо.

Автор:	BorisU [ 10:59 09.03.2006 ]
Заголовок сообщения:
Цитата: Похоже, производительность Conroe сильно зависит от объема кэша. откуда такой вывод?

Автор:	matik [ 11:07 09.03.2006 ]
Заголовок сообщения:
BorisU откуда такой вывод? Пока косвенные данные. В частности, Conroe выиграл именно в тех же играх, которые прибавили больше всего производительности при появлении Pentium 4 XE, с 2МВ кэшем. Другими словами, похоже, есть заметная зависимость от объема кэша. Пока это предположение, конечно.

Автор:	BorisU [ 11:15 09.03.2006 ]
Заголовок сообщения:
Цитата: Другими словами, похоже, есть заметная зависимость от объема кэша. Или от его эффективности, котораая не только от объема зависит. Одним из ключевых именений является "memory disambiguation"

Автор:	Warrax [ 11:38 09.03.2006 ]
Заголовок сообщения:
matik Старший, 2.67, будет быстрым, но дорогим. А что, цены уже где-то "засветились"?

Автор:	Ntag [ 11:41 09.03.2006 ]
Заголовок сообщения:
Кстати, а понятие "Целерон" будет присутствовать, или позиционирование будет 1\2 ядра? ЗЫ И мел ввиду "Целерон" не как торговая марка, а как бюджетный процессор.

Автор:	matik [ 12:16 09.03.2006 ]
Заголовок сообщения:
BorisU Или от его эффективности, котораая не только от объема зависит Есть впечатление, что из-за совместного арбитража кэш Conroe никаких чудес производительности демонстрировать не будет. Будет неплохим, но не более того. Одним из ключевых именений является "memory disambiguation" Что именно Вы имеете в виду? Warrax А что, цены уже где-то "засветились"? Не встречал пока. Ntag Кстати, а понятие "Целерон" будет присутствовать, или позиционирование будет 1\2 ядра? ЗЫ И мел ввиду "Целерон" не как торговая марка, а как бюджетный процессор. Позднее, думаю, будет и Celeron. Изначально ядро Conroe будет использоваться в процессорах среднего и высокого уровней, это логично.

Автор:	Ntag [ 12:27 09.03.2006 ]
Заголовок сообщения:
matik Тогда бюджетный сектор, скорее всего, будут кормить "последышами" Нетбёрста?

Автор:	BorisU [ 12:38 09.03.2006 ]
Заголовок сообщения:
Цитата: Одним из ключевых именений является "memory disambiguation" Что именно Вы имеете в виду? Насколько я понял, теперь есть возможность начинать чтение из памяти не дожидаясь предыдущей записи если процессор определит, что чтение не зависит от записи.

Автор:	matik [ 13:04 09.03.2006 ]
Заголовок сообщения:
Ntag Тогда бюджетный сектор, скорее всего, будут кормить "последышами" Нетбёрста? Разумееется! Не выбрасывать же их BorisU Насколько я понял, теперь есть возможность начинать чтение из памяти не дожидаясь предыдущей записи если процессор определит, что чтение не зависит от записи. А, это да. Собственно, это давно просилось. Правда, я не знаю, насколько часто это встречается.

Автор:	Ivan Andreevich [ 20:41 09.03.2006 ]
Заголовок сообщения:
matik Так будет, наверное, 2 ГГц с нормальным кэшем. 2@3

Автор:	U2 [ 03:12 10.03.2006 ]
Заголовок сообщения:
Так, вернемся к нашим баранам В игрушки не играю. Но смотрю на рез-ты ананда в Half Life 2 и сравниваю с увиденным здесь, с конфигом FX-60 (2,6GHz) RD480 @ X1900XT CF, прихожу ПОКА к выводу, что-то у интел здесь не так. Если в режиме 1280 x 1024 амд-платформа выдает 122.51 при 2,6ггц, то логично предположить, что при 2,8ггц (как у ананда) должно выйти к 130, но у него, точнее у интел, вынь да полож — 113 !!! Точнее, 112.8. Во как ! Далее UT2004. У ананда = 191.8. (Ну уж эти десятые доли ), а у тома пабста еще летом прошлого года сан-диего @ 2,8 GHz выдало 183 в том же разрешении. Что здесь не так?

Автор:	Ivan Andreevich [ 04:12 10.03.2006 ]
Заголовок сообщения:
U2 Демки, я думаю, разные.

Автор:	IdeaFix [ 10:20 10.03.2006 ]
Заголовок сообщения:
Что здесь не так?

Автор:	Ntag [ 10:40 10.03.2006 ]
Заголовок сообщения:
matik Цитата: Ivan Andreevich Похоже придётся Conroe купить Есть нюанс. Немного запоздало, но есть такая мысля..Несомненно, процессор должен быть очень хорошим.Но вот ежли предыдущая политика Интель "каждому новому степпингу — новый чипсет" не изменится, я ещё ооочень подумаю наЩёт смены платформы.

Автор:	matik [ 15:02 10.03.2006 ]
Заголовок сообщения:
Ntag Но вот ежли предыдущая политика Интель "каждому новому степпингу — новый чипсет" не изменится, я ещё ооочень подумаю наЩёт смены платформы. Она совершенно точно не изменится. IdeaFix Что здесь не так? Здесь не так то, что были выбраны очень сомнительные условия. После обновления БИОС и изменения разрешения 41% превратился в 20%, что несколько меняет дело. И еще не факт, что это последнее изменение. Очень уж странные системы выбраны для "честного сравнительного тестирования"

Автор:	McZag [ 15:37 10.03.2006 ]
Заголовок сообщения:
matik Очень уж странные системы выбраны для "честного сравнительного тестирования" Кто сказал "честное"? Была поставлена задача — любыми средствами остановить экпансию АМД. Интел пошла на не очень красивые шаги сравнивая в прямом смысле неизвестно что с неизвестно чем, чтобы все издания напечатали (копи-пабстнули) скриншоты с IDF, на которых огромными буквами написано — НЕ ПОКУПАЙТЕ ПРОЦЕССОРЫ АМД, НАШИ будущие НАМНОГО КРУЧЕ. К сожалению, в погоне за сенсацией даже такие уважаемые товарисчи, как Ананд, простите, обосрались при всем честном народе. Бомба взорвалась, причем в непосредственной близости к самой Интел. Обратная волна PR уже пошла. Но основной эффект, я думаю, все же достигнут, и задачу можно считать выполненной. Сомнительно, что новостные сайты станут также активно признавать свои ошибки, печатать опровержения и новости с извинениями Интел, тем более что их не будет А в головах людей, интересующиеся процессорами, зафиксировались картинки с результами огромного превосходства Интел. Я уже говорил, что сравнивают в основном топ-решения. И на основе этих тестов делается "вывод" о превосходстве той или иной платформы/компании. Но я никак не ожидал, что уважаемая лавочка (к которой я, правда, уже практически растерял все уважение — ее методы борьбы на рынке иначе как грязными не назовешь), будет публично сравнивать несуществующие процессоры, подбирая настройки, конфигурацию и софт так, чтобы откровенно дискредитировать продукт конкурента. :down: Жаль. А ведь Конро, скорее всего, действительно быстрый процессор. Но такие "показательные выступления" не делают чести ни Интел, ни ее новому детищу.

Автор:	BorisU [ 15:41 10.03.2006 ]
Заголовок сообщения:
McZag Какой пафос. Вот только Intel не показывал этих цифр на IDF — их опубликовал Anand.

Автор:	B.R@ven [ 16:07 10.03.2006 ]
Заголовок сообщения:
BorisU до следующего айдифа месяц-полтора — посмотрим вполне и не такое скажут и покажут оч позабавило в октябре когда они на разных бета-прототайп- системах показывали как два мультикорных зеона делали всех правда для сравнения на всех стендах ничего окромя уверености демонстрирующих ничего не было, зато графики аляповато красивые и их все видели

Автор:	matik [ 16:12 10.03.2006 ]
Заголовок сообщения:
BorisU Вот только Intel не показывал этих цифр на IDF — их опубликовал Anand До IDF эти цифры Интел получил, и рекламировал среди "некоторых партнеров". Так что скидки на то, что "это говорил не Интел", не будет. Интеловские инженеры подготовили системы, и пригласили журналистов. Извините, сделать вид, что они здесь не при чем, не выйдет McZag Жаль. А ведь Конро, скорее всего, действительно быстрый процессор. Но такие "показательные выступления" не делают чести ни Интел, ни ее новому детищу. Да, Конро действительно ничего процессор получился. А то, что такие методы не делают чести Интелу, говорилось уже давно Как ты думаешь, что меня больше всего бесило, когда я писал "Особое мнение — 1"? Ровно те же методы в отношении новых платформ.

Автор:	BorisU [ 16:19 10.03.2006 ]
Заголовок сообщения:
Цитата: Извините, сделать вид, что они здесь не при чем, не выйдет Несомненно. Но в презентациях на IDF сравнения с presler, yonah — никаких AMD. Но как на них наехали — сразу BIOS сменили и дали перемерить

Автор:	matik [ 16:23 10.03.2006 ]
Заголовок сообщения:
BorisU Но в презентациях на IDF сравнения с presler, yonah — никаких AMD Ну, это их "фирменная фишка" Вроде никакого прямого сравнения, гораздо проще нелицеприятные комментарии о конкуренте дать в перерывах. Неофициально, так сказать. Что поделаешь, последних пару лет были для них не слишком удачными (в плане доли рынка). Поэтому методы у них грязноваты, это да. Не факт, конечно, что АМД на их месте вела бы себя по-другому — но пока мы имеем то, что имеем. Честной конкуренцией в этом бизнесе давно уже даже не пахнет.

Автор:	McZag [ 17:40 10.03.2006 ]
Заголовок сообщения:
BorisU Какой пафос. Вот только Intel не показывал этих цифр на IDF — их опубликовал Anand. Да. Немного пафосно. Но, извините, задело. А кто купился и опубликовал результаты — неважно. Важно какие это результаты и как они получены. Птичка сидела в клетке. Никто и не разглядел поналу, что пела она с набитым зобом

Автор:	BorisU [ 17:52 10.03.2006 ]
Заголовок сообщения:
McZag Птичка сидела в клетке Думаете нехороший Intel 20% спер? Тогда чего же это AMD в суд не подает?

Автор:	matik [ 17:55 10.03.2006 ]
Заголовок сообщения:
BorisU Тогда чего же это AMD в суд не подает? Что-то Вы припоздали Уже подали, рассматривают. Небыстрое это дело.

Автор:	BorisU [ 18:04 10.03.2006 ]
Заголовок сообщения:
Ну я в курсе. речь про конкретный случай

Автор:	U2 [ 19:52 12.03.2006 ]
Заголовок сообщения:
BorisU Какой пафос. Вот только Intel не показывал этих цифр на IDF — их опубликовал Anand. Тогда чего же это AMD в суд не подает? На кого на Ананда? Интел сам не дал бенчмарков, чтобы условно говоря юридически быть защищенным, короче чтобы не придрались, а то что дали третьей стороне потестировать, так и с нее спрос тогда, а не с чипмейкера.

Автор:	Alex P [ 20:59 12.03.2006 ]
Заголовок сообщения:
Да дождемся реальных бенчмарков, а не заказанных PR отделом интела, тогда и можно будет спорить. Как нынешний владелен прототипа конро- дотана , так сказать, целерона конро, боюсь, что все окажется еще хуже, чем эти пресловутые 20% для процессора с 4-х Мб кешем, а для 2-х Мб кеша и вовсе туго, ну да я писал уже об этом. Всегда можно найти нечто оптимизированное для конкретного проца и выдать обобщить его результат в превосходных степенях слова лучший, например, запустить на 4-х Мб конро пожатие винраром с 4-х Мб же словарем и поругать то же на 1Мб оптероне Если бы все было так шоколадно, я не сомневаюсь, что соответствующие результаты интелом бы подавались в гораздо менее завуалированном виде. А густой туман лишь значит наше будущее разочарование

Автор:	matik [ 21:57 12.03.2006 ]
Заголовок сообщения:
Alex P Как нынешний владелен прототипа конро- дотана , так сказать, целерона конро, боюсь, что все окажется еще хуже, чем эти пресловутые 20% для процессора с 4-х Мб кешем Ну, это Вы уже тоже зря (надо же — я защищаю Конро от владельца Дотана ) Ядро ведь там другое, в этом сомнения нет.

Автор:	Ivan Andreevich [ 22:01 12.03.2006 ]
Заголовок сообщения:
Помоему зря интела в мухлевании обвиняют Это было бы очень 'близорукое' решение.

Автор:	matik [ 22:08 12.03.2006 ]
Заголовок сообщения:
Ivan Andreevich Помоему зря интела в мухлевании обвиняют Скажем так: "мухлевание" там точно есть Весь вопрос, насколько сильное. Уже то, что не дают провести произвольные тесты, а только заранее согласованный список — уже это достаточно красноречиво.

Автор:	VLev [ 22:44 12.03.2006 ]
Заголовок сообщения:
IMHO, сами результаты вполне согласующиеся со всеми прочими оценками производительностии P8. Другое дело, что раньше, насколько я помню, Intel вообще не сравнивал свои процессоры с процессорами AMD. Ну и сравнение существующих процессоров с теми, что выйдут только через квартал --- не слишком продуктивно.

Автор:	Ivan Andreevich [ 22:48 12.03.2006 ]
Заголовок сообщения:
matik Ну ладно, посмотрим Но вообще они молодцы — сравнивают с FX-62 Вот ещё тесты Merom vs Yonah: http://www.computerbase.de/news/hardwar ... tel_merom/ VLev Да, помоему интел в первый раз с АМД меряется напрямую.

Автор:	Alex P [ 22:55 12.03.2006 ]
Заголовок сообщения:
В отличие от многих присутствующих, я не забыл тот шум и пиар, который сопутствовал выходу Р4. И тесты которые подбирались под него. Получается- тогда мы не доверяли, а уж сейчас должны? Также как и не забуду соседа, который купил себе компьютер на базе новомодного тогда и широко разрекламированного Р4 1700 ГГц и был шокирован- в играх этот процессор (да и почти везде, по моему)с треском сливал моему тогдашнему туалатину 1100@1550, но стоил чуть не в разы больше

Автор:	matik [ 23:01 12.03.2006 ]
Заголовок сообщения:
Alex P Получается- тогда мы не доверяли, а уж сейчас должны? Нет-нет, я не против Вашей позиции Просто посмеиваюсь над тем, что теперь отстаиваю Интел

Автор:	Alex P [ 23:15 12.03.2006 ]
Заголовок сообщения:
matik Я исхожу из того, что и сейчас имеющийся дотан на равных с оптероном частотах частенько выигрывает у него в играх (не во всех). Если дотану расширить его частотный диапазон, увеличив число стадий конвейеров, то это вряд ли благотворно повлияет на его производительность- надо наращивать кеш, что интел и сделал. Еще раз мое имхо- 2-х Мб конро должен сливать равночастотному дотану или оптерону, но будет иметь задел до 3.3-3.5 ГГц. 4-х Мб конро конечно будет более производителен, нежели чем равночастотный оптерон, но- в достаточно определенном круге приложений, тех, кто интенсивно будет требовать использовани яэтого кеша но, поскольку я не специалист, разумеется, могу и ошибаться

Автор:	matik [ 23:18 12.03.2006 ]
Заголовок сообщения:
Alex P Ну, собственно, мы все ждем нормальных тестов производительности. Что до уступания в производительности, то это вовсе не факт. Думаю, скорее должен несколько опережать: все же 4 конвейера против 3 у Дотана и К8, некоторый запас производительности архитектура имеет.

Автор:	VLev [ 23:24 12.03.2006 ]
Заголовок сообщения:
Alex P писал(а): Я исхожу из того, что и сейчас имеющийся дотан... По сравнению с дотаном, у P8 много изменений, способствующих улучшению производительности (Не только частота и кэш). Именно из их анализа и были сделаны те оценки, которые сейчас и подтверждаются первыми тестами. Если интересно про изменения почитайте сами.

Автор:	Alex P [ 23:35 12.03.2006 ]
Заголовок сообщения:
VLev Спасибо за ссылку. может быть, я и не прав. в общем то, я исходил из той предпосылки, что все то, что улучшает частотный предел работы процессора, одновременно сильно ухудшает его производительность. а выпустить новейший процессор с частотным диапазоном до 3-х ГГц было бы неразумно. посему я рассчитывал, что интел будет бить оптерон частотами до достижения превосходства в каком бы то нибыло приложении кстати, а у интела разве есть в разработках что то нечто новое, что быстро придет на смену конро, если он производителен, но ограничен в частотах?

Автор:	matik [ 23:41 12.03.2006 ]
Заголовок сообщения:
Alex P кстати, а у интела разве есть в разработках что то нечто новое, что быстро придет на смену конро, если он производителен, но ограничен в частотах? Сомнительно. Далее у них во всех планах многоядерность.

Автор:	paska [ 00:14 13.03.2006 ]
Заголовок сообщения:
matik Цитата: Сомнительно. Далее у них во всех планах многоядерность. В ноябре HKE PC писал про 100 ядер, однако стандартые 8миядерники должны увидеть свет )) Возможно ли что-то подобное изображенному на этой картинке Там некое главное ядро с интегрированным контроллером памяти, GART, сетеым контроллером управляет исполнителными ядрами, так сказать раздает куски кода, приказы

Автор:	matik [ 00:53 13.03.2006 ]
Заголовок сообщения:
paska Возможно ли что-то подобное изображенному на этой картинке Вполне возможно. Вопрос, насколько такая конструкция эффективна на нынешнем и ожидаемом вскоре ПО. Имхо, весьма неэффективна.

Автор:	paska [ 01:12 13.03.2006 ]
Заголовок сообщения:
matik Согласен, при нынешнем это действительно неэфективно. Даже если уйтив будущее, то это как минимум 2012-15 год. значит в ближайшие годы мы будем видеть клонирование ядер, эх опять та же песня, что с частотой ведь будет

Автор:	chavv [ 11:09 13.03.2006 ]
Заголовок сообщения:
matik писал(а): Alex P кстати, а у интела разве есть в разработках что то нечто новое, что быстро придет на смену конро, если он производителен, но ограничен в частотах? Сомнительно. Далее у них во всех планах многоядерность. да и зачем?! Конро выглядит очень хорошо.... 2 х 128-бит ФПУ, 3х 128-бит ССЕ ...

Автор:	zurzic [ 12:09 13.03.2006 ]
Заголовок сообщения:
chavv Цитата: 2 х 128-бит ФПУ,3х 128-бит ССЕ SSE и FPU команды исполняются на одних и тех же блоках 1. FP mul/SSE mul 2. FP add/SSE add 3. FP move/SSE move

Автор:	chavv [ 13:30 13.03.2006 ]
Заголовок сообщения:
я смотрю здесь: http://realworldtech.com/page.cfm?Artic ... 143144&p=6 или порт2 зарезервирован для "муув" и на диаграмму забыли добавить что он может делать ФПУ-муув?

Автор:	BorisU [ 13:50 13.03.2006 ]
Заголовок сообщения:
На диаграме из интеловского pdf нарисовано, что 3 порта умеют fpmove

Автор:	zurzic [ 15:20 13.03.2006 ]
Заголовок сообщения:
BorisU Да, нарисовано 3. Но лично моё IMHO, что это может быть опечатка в PDF, так как наличе целых 3-х fpmove кажется избыточным. Но в принципе, если действительно это не опечатка, значит неподписанный ппервый блок на диаграмме в PDF играет роль FP_MISC . chavv Да, там не подписан. Либо это FP_MOVE либо FP_MISC. Появится оптимизационый мануал , узнаем точно (я надеюсь).

Автор:	U2 [ 22:25 13.03.2006 ]
Заголовок сообщения:
Ну вот еще один обзор игровой платформы. И есть хотя бы минимальное разрешение. http://www.pcper.com/article.php?aid=219

Автор:	U2 [ 22:40 13.03.2006 ]
Заголовок сообщения:
И все-таки, если судить по результатам тома, то выходит, что ати-чипсет при переходе с 480 до 580 дает неслабый прирост, но отстает от нвидиа-сли-чипа. Т.е. подобрав платформу можно разрыв и сократить, правда следует ожидать (по логике, хотя бы пока) и адекватный прирост по всем вариантам и на конро-платформе. Впрочем все равно надо дождаться полноценного тестирования, чтобы расставить точки над i.

Автор:	zurzic [ 22:41 13.03.2006 ]
Заголовок сообщения:
U2 Да, тяжело АМД будет.

Автор:	U2 [ 22:52 13.03.2006 ]
Заголовок сообщения:
Yury_Malich Да, тяжело АМД будет. Тем лучше для потребителей! А как у конро с имплементацией AMD64? Как под Vista будет себя вести? А как с расширением инструкций АМД64 в сл. году?

Автор:	Ivan Andreevich [ 21:22 14.03.2006 ]
Заголовок сообщения:
U2 писал(а): Ну вот еще один обзор игровой платформы. И есть хотя бы минимальное разрешение. http://www.pcper.com/article.php?aid=219 Ещё раз удивляюсь результатам. В HL2 где всё упирается традиционно в процессор отрыв Conroe небольшой. В FEAR где всё упирается в видеокарту отрыв у Conroe огромный

Автор:	BorisU [ 21:26 14.03.2006 ]
Заголовок сообщения:
Ivan Andreevich Цитата: В FEAR где всё упирается в видеокарту отрыв у Conroe огромный пара 1900XT без AA не ограничивает IMHO. Да и тени мягкие они вырубали

Автор:	paska [ 23:06 14.03.2006 ]
Заголовок сообщения:
Ivan Andreevich Цитата: В FEAR где всё упирается в видеокарту отрыв у Conroe огромный Ну как сказать, был временным обладателем X1900 XTX не жаловался на "медленность".

Автор:	MickeMM [ 00:30 15.03.2006 ]
Заголовок сообщения:
Ivan Andreevich Цитата: Ещё раз удивляюсь результатам. В HL2 где всё упирается традиционно в процессор отрыв Conroe небольшой. В FEAR где всё упирается в видеокарту отрыв у Conroe огромный Эээ... что там интеловцы говорили? Маленькая оптимизация драйверов ATi под Conroe?

Автор:	matik [ 02:41 15.03.2006 ]
Заголовок сообщения:
MickeMM Эээ... что там интеловцы говорили? Маленькая оптимизация драйверов ATi под Conroe? Именно

Автор:	Ivan Andreevich [ 03:49 15.03.2006 ]
Заголовок сообщения:
BorisU Опять таки, в HL2 должно быть ЕЩЁ более процессоро-зависимым. paska В любом случае упирается в проц слабее чем ХЛ2 matik MickeMM Гм а можно поподробнее? Не совсем пойму как в случае видеокарто-зависимости быстрый проц может помочь видеокарте с надлежащей оптимизацией в дровах.

Автор:	matik [ 09:41 15.03.2006 ]
Заголовок сообщения:
Ivan Andreevich Гм а можно поподробнее? Не совсем пойму как в случае видеокарто-зависимости быстрый проц может помочь видеокарте с надлежащей оптимизацией в дровах. Мммм... Давайте представим себе, что дрова для платформы Intel имеют некую специфическую оптимизацию (не суть важно, какую). В этом случае код, отрабатываемый процессором, исполняется меньше времени. Это оставляет больше времени (в каждом кадре) для работы видеокарты. Это раз. Во-вторых, геометрическая информация, насколько я помню, подготавливается процессором. Соответственно, более тщательно оптимизированные драйверы — больше подготовленной к употреблению информации. Если у процессора есть некоторый невостребованный запас прочности, можно переложить на процессор еще часть работы. Тогда видеокарте станет полегче. В общем и целом, мест для оптимизации много. Сложность только в том, что сравнивать оптимизированную платформу с неоптимизированной платформой конкурента — мягко скажем, не камильфо.

Автор:	McZag [ 09:53 15.03.2006 ]
Заголовок сообщения:
Ivan Andreevich Гм а можно поподробнее? Не совсем пойму как в случае видеокарто-зависимости быстрый проц может помочь видеокарте с надлежащей оптимизацией в дровах. Перекомпиляция дров с нужным ключом может добавить прыти (или по крайней мере не ухудшить показатели) платформы на Конро, и существенно замедлить платформы на Оптерон. Нельзя исключать даже таких классических гадостей, как выполнение отдельной процессорозависимой ветки кода. Очеидно, что с NVidia у Интел такой трюк не прошел бы — слишком близки отношения первой с АМД. Даже элементарная перезаливка БИОС резко изменила картину. И судя по нестыкующимся результам более ранних тестов Оптерон, антитвикинг имел место быть. Впрочем, даже "плохие тесты" принципиально не меняют картины. БОльшая часть заявленных ранне фич, и даже сверх того, в Конро присутствуют. Какие из дают такой мощный эффект сказать пока сложно. Думаю, что основа — это большой и быстрый кэш L2 (~10%). Далее примерно в равной пропорции измененная микроархитектура и навороты с памятью (~ по 5%). Чтобы архитектурное преимущество сказалось сильнее нужна перекомпиляция. Тогда из 5% можно сделать и все 20%. Отсутствие результатов SPEC — скорее всего отсутствие стабильного компилятора, который бы выжал максимум из Конро как в однопоточных тестах, так и в рэйтах. Впрочем, Интел особо спешить некуда. Хоть сообщество и волнуется "а покажите", маркетинговый отдел задачу выполнил. АМД больше не лидер. Чем можно ответить на Конро и какое реальное соотношение сил нас ждет к концу 2006 года, до появления твикнутых К8 ревизии G(?) по технологии 0.065? 1. Небольшой плюс будет достикнут за счет DDR2. 2. Сильно неясно, что в реалии будет представлять собой серверный многоядерный Конро. Так ли он будет хорош, как нам показывают? 3. Расторопность инженеров и технологов АМД возможно позволит воткнуть L3 уже в ревизию F+ и сохранить статус кво как минимум на серверном рынке. Но до появления нового ядра K8, уже очевидно — Конро будет доминироать на рынке десктопов, а возможно и сохранит свое преимущество в целочисленке даже после выхода новых ревизий К8. Основными недостатками текущего К8 мне видятся относительно слабый предсказатель ветвлений и посредственная работа с памятью (отсутствие агрессивного префетча по прямой и косвенной адресации). Эксклюзивный кэш — это карма, ее лучше не обсуждать. Так ли все плохо для АМД? Имхо, нет. Задел, который они создали, должен дать им возможность с нормальными показателями завершить 2006 год. А дальше... будем надеятся, что будет достойный ответ, и мы все-таки будем иметь конкурентные решения, которые позволят нам покупать очень быстрые процессоры по очень гуманной цене

Автор:	Ivan Andreevich [ 10:58 16.03.2006 ]
Заголовок сообщения:
matik Это оставляет больше времени (в каждом кадре) для работы видеокарты. Это раз. Тяжёлая ситуация в графическом плане это когда это время обработки несоизмеримо мало посравнению с временем которое занимает обработка самой картой. Посему в тяжёлой ситуации 3000+ ~ FX-60 Во-вторых, геометрическая информация, насколько я помню, подготавливается процессором. Соответственно, более тщательно оптимизированные драйверы — больше подготовленной к употреблению информации. Опять таки, тут непонятно. Им нужно было в FX-60 vs Conroe включить что-то типа Venice 3000+ для сравнения. Тогда было бы понятно в чём дело: Conroe настолько быстрее (если 3000+ сильно от FX-62 отстаёт), или тут какие-то оптимизации специальные Вообще там что — SSE4? Что там конкретно можно так заоптимизировать сильно? McZag Перекомпиляция дров с нужным ключом может добавить прыти (или по крайней мере не ухудшить показатели) платформы на Конро, и существенно замедлить платформы на Оптерон. Не верю что ATI будет замедлять свои карты на процессорах АМД. Люди просто будут покупать нвидия т.к. ~100% людей которые покупают X1900XTX Crossfire используют их на АМД. Ну и 90% без Crossfire, наверное. И судя по нестыкующимся результам более ранних тестов Оптерон, антитвикинг имел место быть. А где они? Чтобы архитектурное преимущество сказалось сильнее нужна перекомпиляция. Гм, а какая оптимизация там нужна: под архитектуру, или под ССЕ4 (или чего там)? Вообще странно что нет SPEC — ведь там должен быть самый большой прирост (ничего в видеокарту не упирается). Кстати, про компилятор неготовый что-то не очень верится. У интел с этим делом обычно всё хорошо и заранее. Сильно неясно, что в реалии будет представлять собой серверный многоядерный Конро. Так ли он будет хорош, как нам показывают? На IDF говорят о performance/watt преемуществе. Только. Расторопность инженеров и технологов АМД возможно позволит воткнуть L3 уже в ревизию F+ и сохранить статус кво как минимум на серверном рынке. По 0.09? Неее я думаю в этом нет смысла. Но до появления нового ядра K8, уже очевидно — Конро будет доминироать на рынке десктопов, а возможно и сохранит свое преимущество в целочисленке даже после выхода новых ревизий К8. АМД вроде обещает integer performance тоже поднять. Правда конечно не так сильно как расширение FPU в _2_ раза. А дальше... будем надеятся, что будет достойный ответ, и мы все-таки будем иметь конкурентные решения, которые позволят нам покупать очень быстрые процессоры по очень гуманной цене Вроде бы слухи о К8L материализируются потихоньку. Вообще он должен порвать в FP Conroe как тузик грелку если частота не будет снижена Ну а пока придётся купить дешёвый Conroe с нормальный кэшем ALL Есть достоверная информация о дате появления Conroe на рынке?

Автор:	Lev Dymchenko [ 14:24 16.03.2006 ]
Заголовок сообщения:
Ivan Andreevich Цитата: Ну а пока придётся купить дешёвый Conroe с нормальный кэшем Купите, тогда протестируете. Ок?

Автор:	matik [ 14:35 16.03.2006 ]
Заголовок сообщения:
Ivan Andreevich Вообще там что — SSE4? Что там конкретно можно так заоптимизировать сильно? Достаточно одной часто используемой тригонометрической операции По 0.09? Неее я думаю в этом нет смысла. Согласен. Слишком большая площадь получится. Это имеет смысл делать на 65нм. Есть достоверная информация о дате появления Conroe на рынке? С достаточно высокой достоверностью не ранее августа.

Автор:	McZag [ 21:32 16.03.2006 ]
Заголовок сообщения:
Ivan Andreevich Не верю что ATI будет замедлять свои карты на процессорах АМД. Люди просто будут покупать нвидия т.к. ~100% людей которые покупают X1900XTX Crossfire используют их на АМД. Ну и 90% без Crossfire, наверное. Дело не в ATI. Они ничего не замедляли. Тем более они никому эту версию дров не будут отдавать И судя по нестыкующимся результам более ранних тестов Оптерон, антитвикинг имел место быть. А где они? Я имел ввиду другие тесты X1900XTX Crossfire с Оптеронами. За ссылками, если честно лазить лень. Гм, а какая оптимизация там нужна: под архитектуру, или под ССЕ4 (или чего там)? Вообще странно что нет SPEC — ведь там должен быть самый большой прирост (ничего в видеокарту не упирается). Кстати, про компилятор неготовый что-то не очень верится. У интел с этим делом обычно всё хорошо и заранее. В первую очередь под SSE. Если повар нам не врет © он теперь чудовищно быстрый. В компиляторе нужно убрать все обходные маневры по работе с SEE. SSE4 на спек мало что даст. Опять же грамотно нагрузить 4 пайпа это вам не бабу Дусю в кегли обыгрывать. Какой бы ни был умный планировщик, ему надо помогать. "Заранее", это когда есть готовый процессор (эмулятор, точное описание микроархитектуры, латентностей, пропускной способности) хотя бы несколько месяцев. Откуда их взять? Да и с вашим тезисом "все хорошо", я не соглашусь. Компилятор от Интел один из самых глючных компиляторов в мире. Вся оптимизация на грани фола. Возьмите сырой процессор, сырой компилятор, и с большой степенью вероятности, он не сможет откомпилировать все тесты SPEC. Расторопность инженеров и технологов АМД возможно позволит воткнуть L3 уже в ревизию F+ и сохранить статус кво как минимум на серверном рынке. По 0.09? Неее я думаю в этом нет смысла. matik Согласен. Слишком большая площадь получится. Это имеет смысл делать на 65нм. Я наверно что-то пропустил. АМД собирается делать L3 на той же вафле? Дороговато получится. АМД вроде обещает integer performance тоже поднять. Вроде бы слухи о К8L материализируются потихоньку. Мне понравилась фраза "слухи материализуются". надо запомнить

Автор:	Ivan Andreevich [ 21:45 16.03.2006 ]
Заголовок сообщения:
Lev Dymchenko Конечно. Только когда он ещё будет доступен matik Достаточно одной часто используемой тригонометрической операции Можно поподробней?

Автор:	matik [ 00:07 17.03.2006 ]
Заголовок сообщения:
McZag Мне понравилась фраза "слухи материализуются". надо запомнить А какие это открывает возможности по влиянию на будущую микроархитектуру!

Автор:	matik [ 00:10 17.03.2006 ]
Заголовок сообщения:
Ivan Andreevich Можно поподробней? Поподробнее нельзя, ибо я не писатель драйверов Но давайте рассуждать: 1. Видеокарта занимается отрисовыванием проекции трехмерных объектов на плоскость экрана. 2. Значит, для всех объектов и полигонов необходимо подсчитывать углы и их тригонометрические функции 3. Достаточно резко ускорить вычисление одной из часто используемых тригонометрических функций, чтобы выиграли абсолютно все операции с объектами.

Автор:	BorisU [ 00:12 17.03.2006 ]
Заголовок сообщения:
вообще-то всем этим давно занимается видеокарточка. Причем не драйвер, а именно сам чип.

Автор:	matik [ 00:15 17.03.2006 ]
Заголовок сообщения:
BorisU Причем не драйвер, а именно сам чип. А вот в этом месте позвольте Вам слегка не поверить Объекты и полигоны подготавливает для видеочипа явно процессор. В конце концов, координаты полигонов, и вообще саму расстановку полигонов в сцене явно делает не видеочип. Ибо он, по идее, хороший исполнитель — но логика и физика игры ему неизвестна.

Автор:	Lev Dymchenko [ 00:20 17.03.2006 ]
Заголовок сообщения:
Цитата: 2. Значит, для всех объектов и полигонов необходимо подсчитывать углы и их тригонометрические функции Не совсем так. Скорее всего, нет там тригонометрических функций. чтобы понять, что может ускорить SSE4, надо примерно знать, что оно из себя представляет?

Автор:	BorisU [ 00:21 17.03.2006 ]
Заголовок сообщения:
Вы про hardware TNL слышали? Так вот это именно оно — Transformation and Lighting. Подготавливает полигоны несомненно процессор и шлет их в карточку.

Автор:	matik [ 02:52 17.03.2006 ]
Заголовок сообщения:
Lev Dymchenko чтобы понять, что может ускорить SSE4, надо примерно знать, что оно из себя представляет? Про SSE4 я еще ничего не говорил, ровно потому, что не знаю, чего это. BorisU Вы про hardware TNL слышали? Доводилось пару раз Насколько я понимаю, несмотря на название "hardware", в плане подготовки данных оно ничем особым не выделяется. Разве что действительно простые функции делает в железе. Только вот вопрос, каким образом видеодвижок готовит данные. Более чем уверен, что там куча тригонометрических функций.

Автор:	Walter S. Farrell [ 03:35 17.03.2006 ]
Заголовок сообщения:
matik >Насколько я понимаю, несмотря на название "hardware", в плане подготовки данных оно ничем особым не выделяется. Разве что действительно простые функции делает в железе. Только вот вопрос, каким образом видеодвижок готовит данные. В принципе, теперь графкамень делает всё. Динамическую балансировку нагрузки между графкамнем и камнем уже похоронили, так как из-за относительной тормознутости последнего накладные издержки не оправдывают себя. Единственное, что остаётся камню, так это дать начальные координаты вертексов сцены, а эта задачка не суть напряжная и больше зависит от ПСП, так как кэш тут мало чем поможет. Текстуры, рендеринг и растеризация -- забота графпроцессора. Карты освещения теперь не актуальны, им с Hardware T&L не тягаться.

Автор:	matik [ 09:50 17.03.2006 ]
Заголовок сообщения:
Walter S. Farrell Карты освещения теперь не актуальны, им с Hardware T&L не тягаться. Ага, зато есть карты рельефа. В принципе, теперь графкамень делает всё Будь это так, современные видеокарты совершенно не зависели бы от скорости процессоров. Однако это вовсе не так.

Автор:	BorisU [ 09:59 17.03.2006 ]
Заголовок сообщения:
Цитата: Более чем уверен, что там куча тригонометрических функций. Ну возьмите исходники Q3, скажем, и посмотрите.

Автор:	matik [ 10:10 17.03.2006 ]
Заголовок сообщения:
BorisU Ну возьмите исходники Q3, скажем, и посмотрите. И что, если в исходниках (!) нет тригонометрии, ее нигде в игре не будет? Что-то весьма сомнительный аргумент Ладно, давайте сворачивать офтоп. Я четко помню одну из статей по 3D графике на иксбите. Там было написано, что какой-бы умный ни был трехмерный акселератор, работу по созданию сцены выполняет процессор.

Автор:	BorisU [ 10:26 17.03.2006 ]
Заголовок сообщения:
В подготовке сцены нет большой тригонометрии тоже Там есть матрицы, описывающие повороты и проекции, так вот их применяет GPU

Автор:	matik [ 10:51 17.03.2006 ]
Заголовок сообщения:
BorisU Там есть матрицы, описывающие повороты и проекции, так вот их применяет GPU ОК Тогда достаточно ускорить одну часто используемую операцию с матрицами. Вы же прекрасно поняли основную идею, что за интерес спорить?

Автор:	BorisU [ 11:02 17.03.2006 ]
Заголовок сообщения:
Ну теоретически что-то там ускорить можно. Только там везде float, а не double и все давно на SSE ускорено

Автор:	BorisU [ 11:05 17.03.2006 ]
Заголовок сообщения:
Цитата: что за интерес спорить? Мне кажется вы не там все-таки ищете причину таких результатов.

Автор:	matik [ 11:26 17.03.2006 ]
Заголовок сообщения:
BorisU Мне кажется вы не там все-таки ищете причину таких результатов. Может быть. Поскольку Конро довольно долго еще будет недоступен, все равно будем гадать пока

Автор:	BorisU [ 11:37 17.03.2006 ]
Заголовок сообщения:
Я подозреваю, что семплы пойдут широко пораньше, чем начнется продажа. Впрочем до Q3 не так уж и долго ждать.

Автор:	McZag [ 12:12 17.03.2006 ]
Заголовок сообщения:
BorisU Мне кажется вы не там все-таки ищете причину таких результатов. КАКИХ результатов? Если бы Интел не устроил показательного сравнения, а вместо этого привел бы результаты в классических тестах (SPEC, OLP, TPC, SAP, 3D-mark, VeiwPerf и т.д.) ВОПРОСОВ и СПРОРОВ бы НЕВОЗНИКЛО. Возможно, для большинства ламеров эти результаты были менее информативны. Но никто ведь не мешает рядом подрисовать зеленый столбик с уже намерянными (и подтвержденными) результатами. Зачем сравнивать себя с виртуальным процессором, который возможно даже никогда не выйдет ? (Лично я бы уже прекратил бы выпуск eXtreme процессоров на DDR. Но чтобы поставить точку, я бы выпустил FX-62, дав ему персональное имя, на памяти DDR500, продавая его вместе с парой сертифицированных модулей по 512МВ и 1ГВ). Интел обвиняют не в том, что он сделал новый и быстрый процессор, а в выбранной сколькой дорожке для доказательства превосходства нового процессора. Я подозреваю, что семплы пойдут широко пораньше, чем начнется продажа. Разумеется. Так было и, наверно, будет всегда. Даже если в "продаже" будут только строчки в прайс-листах.

Автор:	IdeaFix [ 13:01 17.03.2006 ]
Заголовок сообщения:
McZag Цитата: Лично я бы уже прекратил бы выпуск eXtreme процессоров на DDR. Но чтобы поставить точку, я бы выпустил FX-62, дав ему персональное имя, на памяти DDR500, продавая его вместе с парой сертифицированных модулей по 512МВ и 1ГВ) Ннуу... и стоило бы это едло дорого-дорого.... и купили бы его в размере сотой доли процента от остальных процов... и зачем? Что юзеру хорошо, то капиталисту смерть!:) Сокет М2 намного выгоднее (для амдэ)... Вы ведь не будете переплачивать 100 (а лучше 200) процентов за А64-FX62 и пару палок памяти?:) А если не будете, то хорошо будет от такого решения только Вам, но не конторе.

Автор:	IdeaFix [ 13:02 17.03.2006 ]
Заголовок сообщения:
... так-то и щас можно купить VooDoo PC с процом, разогнаным вдвое и 8-ю терабайтами дискового пространства... там всё сертифицировано, и всё в комплекте... правда стоит дорого...

Автор:

BorisU [ 13:02 17.03.2006 ]

Заголовок сообщения:

Цитата:
КАКИХ результатов?

Тех, что есть. Были выбраны именно те тесты в которых всякие ананды тестируют процессоры и где раньше AMD были значительно лучше.

Цитата:
Даже если в "продаже" будут только строчки в прайс-листах.

Зря вы на это надеетесь

Автор:	Lev Dymchenko [ 14:14 17.03.2006 ]
Заголовок сообщения:
BorisU Эх, опять пошел спор. По этому поводу уже выссказывался. Вот скажите, нафига Intel делать подозрительные тесты и скрывать spec? Найдите лучше мне Prescott2M.

Автор:

BorisU [ 14:38 17.03.2006 ]

Заголовок сообщения:

Lev Dymchenko

Цитата:
Вот скажите, нафига Intel делать подозрительные тесты

чего подозрительного вы там нашли?

Цитата:
и скрывать spec

А кто скрывает? сказали вам +40% к P4D 950 про specint. В specfp прирост послабее наверно будет -его особо не рекламируют.

Автор:	Lev Dymchenko [ 14:57 17.03.2006 ]
Заголовок сообщения:
Цитата: чего подозрительного вы там нашли? Опять начинается. Факт в том, что они подозрительны, люди массово обсуждают их достоверность. Не только в России. Достоверность многих других тестов не обсуждается. Вы не можете поручиться за их результаты, например. Есть разные объяснения, может, действительно, компилятор не готов, они хотят выжать максимум из двойного fpu. Потом как предъявят великолепные результаты specfp. Типа, Империя наносит ответный удар, и такой, что мало не покажеться. А, может, что-то соптимизировали с драйверами ati, выдали пиар, потом подробности забудутся, а впечатление останется. Помните, один товарищ любит часто повторять, процессор, это плод компромисса. КЭШ увеличили, и латентность могла увеличиться, конвейер удлинился, ну и все в таком духе. Это пусто занятие, по некоторым характеристикам пытаться строить догадки о производительность.

Автор:	BorisU [ 15:12 17.03.2006 ]
Заголовок сообщения:
Lev Dymchenko Так может проблемы не в тестах, а в тех, кто им не верит?

Автор:	Lev Dymchenko [ 15:20 17.03.2006 ]
Заголовок сообщения:
BorisU Ну конечно, всему надо верить. На самом деле, заинтересовнная сторона провела тесты, как вы думаете, что бы было бы если бы волшебным образом сэмпл Conroe оказался у AMD для сравнения с её процессорами? Вы бы поверили результатам?

Автор:	Lev Dymchenko [ 15:22 17.03.2006 ]
Заголовок сообщения:
AMD провела как-то тесты, и нашла, что от HT нет прироста производительности. Теперь сама пострадала.

Автор:	BorisU [ 15:23 17.03.2006 ]
Заголовок сообщения:
Lev Dymchenko "Вы не в церкви, вас не обманут" ©

Автор:	Lev Dymchenko [ 15:28 17.03.2006 ]
Заголовок сообщения:
Так вы уже ручаетесь за эти интелловские результаты, что на других драйверах, демках будет аналогичная картина?

Автор:	BorisU [ 15:32 17.03.2006 ]
Заголовок сообщения:
Я ни за что не ручаюсь. Но оснований не верить не вижу. Насчет драйверов — тесты в разрешении 640x480 вы пропустили? Там все уж точно от видео не зависит. Смена одной из демок на анандовскую привела к росту отрыва Conroe И тесты кодирования от видео ну никак не зависят.

Автор:	Lev Dymchenko [ 15:41 17.03.2006 ]
Заголовок сообщения:
BorisU Про тесты кодирования — согласен. Некоторые кодировщики показали хорошие рузельтаты. Тесты в разрешении 640x480 я не пропустил. А, может, и пропустил, если там были тесты в более чем одной игре? Видел только в одной. Это так? Цитата: Там все уж точно от видео не зависит. От видео может и не зависит, но, зато, так же зависит от драйверов. Потом, треугольников количество-то сохраняется.

Автор:	McZag [ 15:44 17.03.2006 ]
Заголовок сообщения:
BorisU Тех, что есть. Были выбраны именно те тесты в которых всякие ананды тестируют процессоры и где раньше AMD были значительно лучше. Давайте попробуем без шелухи. Речь идет о новой платформе? Новой микроархитектуре? Новом наборе команд? Вы предлагаете оценить все ее достоинства по Quake и FEAR? Это, наверно, новый процессор для гейм-бокса? "Тестирование" выполняло строго определенную задачу. Это часть IDF. Если не считать некоторых огрехов "в методике", задача выполнена на "отлично". Тот факт, что мы с вами тратим время на обсуждение данного факта, и есть наглядный результат работы маркетингов. Зря вы на это надеетесь Я просто напомнил, что у Интел отлично получается запуск бумажных тигров. Никакой "надежды" на тот или иной исход у меня нет. Но специльно ждать выхода Конро лично я точно не буду. На моих ближайших планах закупки железа анонс Интел никак не отразился. Будущее преимущество Интел в мид-эндных дектопах вилами на воде писано, а в серверном сегменте пока вообще полный туман. Будет доступен процессор, будут результаты интересных мне тестов — будет и разговор.

Автор:	BorisU [ 15:53 17.03.2006 ]
Заголовок сообщения:
McZag Вы предлагаете оценить все ее достоинства по Quake и FEAR? Я — нет. Но некоторые достоинства видны. Это, наверно, новый процессор для гейм-бокса? в том числе. Легкий такой щелчок по носу AMD, которые рекламировали свои изделия как идеальные для геймера.

Автор:	Walter S. Farrell [ 17:07 17.03.2006 ]
Заголовок сообщения:
matik >Будь это так, современные видеокарты совершенно не зависели бы от скорости процессоров. Однако это вовсе не так. А карты и мало зависят. В процессе работы современных игрушек наличествует множество задач, которые всё ещё входят в компетенцию камня. Естественно предположить, что они и могут сделать из камня "узкое место" системы, так как скорость отрисовки сцен будет ими ограничиваться. Я неоднократно убеждался в том, что камень и [в особенности] память легко могут сыграть такую шутку: стоят две системы, на синтетике количество попугаев отличается не так уж и значительно, а как скормить им творения из реального мира (при максимально одинаковой конфигурации), то разница легко улавливается невооружённым глазом. Порой весьма существенная разница. Ладно, это действительно оффтоп.

Автор:	matik [ 17:18 17.03.2006 ]
Заголовок сообщения:
Walter S. Farrell А карты и мало зависят. В процессе работы современных игрушек наличествует множество задач, которые всё ещё входят в компетенцию камня И вот любят некоторые спорить... http://overclockers.ru/hardnews/21723.shtml

Автор:	Walter S. Farrell [ 17:42 17.03.2006 ]
Заголовок сообщения:
matik А то Хотя я к попугаям уже давно отношусь скептически, как и к мипсам, флопсам и прочим подобным.

Автор:	TeoAX [ 18:24 17.03.2006 ]
Заголовок сообщения:
Не донимайте человека. Это уже все из области фанатской слепой веры. Если хочет человек верить источнику, у которого имеются все поводы для искажения результата — чтож, пусть верит. Его право.

Автор:	BorisU [ 18:25 17.03.2006 ]
Заголовок сообщения:
TeoAX Насчет слепой веры это вы точно. Кое-кому религия просто мешает понять что процессор от Intel вполне может быть быстрее.

Автор:	TeoAX [ 19:29 17.03.2006 ]
Заголовок сообщения:
BorisU Ну это их личные проблемы. Однако в Вашу беспристрастность, чистоту помыслов и побуждений я не верю. Уж слишком велико "рвение". Все-таки две принципиально разные вещи: объяснение другим их заблуждений и отыгрывание собственного фанатства посредством "оппозиционеров". Самое забавное, что новая инкарнация процессорных технологий Intel скорее всего (в кои-то веки) действительно быстрее предшественника, и местами — даже и конкурента. Другое дело, что заявленных цифр в 80% мы не увидим. А то, что увидим — будет проявляться отнюдь не везде. Увы, реальность обычно куда приземленней PR-материалов.

Автор:	BorisU [ 19:42 17.03.2006 ]
Заголовок сообщения:
TeoAX Цитата: Другое дело, что заявленных цифр в 80% мы не увидим. Это где вы такое увидели? Intel обещал 20% в среднем.

Автор:	TeoAX [ 19:55 17.03.2006 ]
Заголовок сообщения:

Автор:	BorisU [ 20:01 17.03.2006 ]
Заголовок сообщения:
Там для кого написано относительно чего 80%? и в каком тесте?

Автор:	TeoAX [ 20:08 17.03.2006 ]
Заголовок сообщения:
BorisU: Там для кого написано относительно чего 80% Риторический вопрос — для сидящих в первом ряду (в который "неправильных" людей наверняка не пустят). Для всех остальных это будет выглядеть примерно так:

Автор:	BorisU [ 20:16 17.03.2006 ]
Заголовок сообщения:
не волнуйтесь, я думаю, там были достаточно большие экраны, чтобы разглядеть. Кроме того можно ведь еще и слушать, что выступающие говорят

Автор:	TeoAX [ 20:24 17.03.2006 ]
Заголовок сообщения:
Ага, так и вижу, как представители компании прямо так со сцены и вещали, что мол, вы знаете, 80% — это только для отвода глаз, а так наш новый процессор не обеспечивает достаточного прироста для того, чтобы обновлять ваш парк машин. Хотите поспорить, как работает маркетинг? Как работают * мелкие приписки со звездочкой на фоне больших и толстых стрелок во весь экран? Давайте!

Автор:	BorisU [ 20:25 17.03.2006 ]
Заголовок сообщения:
TeoAX Вам мало того прироста что показано? А не зажрались ли вы?

Автор:	TeoAX [ 20:34 17.03.2006 ]
Заголовок сообщения:
Мало или много это для меня я уж как-нибудь сам решу. :—\ Речь, если Вы подзабыли, об адекватности результатов от Intel, соответствии заявленных цифр и реальной производительности. Если обещанные цифры в 40-80% будут прикрываться приписками вроде: * рост в цифрах производительности на ватт для Exteme Edition версии * только для Khirbi Bench **** при условии сравнения с платформой предыдущего поколения (DDR1 и AGP) то грошь цена таким заявлениям.

Автор:	BorisU [ 20:48 17.03.2006 ]
Заголовок сообщения:
TeoAX Давайте отличать ваши глобальные фантазии про маркетинг вообще от реальности. Что вы имеете против тестов spec?

Автор:	Lev Dymchenko [ 21:01 17.03.2006 ]
Заголовок сообщения:
BorisU Ведь Intel раньше не занималась такими прямыми сопоставлениями с продукцией конкурента. Вас это не тревожит?

Автор:	Lev Dymchenko [ 21:02 17.03.2006 ]
Заголовок сообщения:
Меня это расстроило.

Автор:	BorisU [ 21:04 17.03.2006 ]
Заголовок сообщения:
Lev Dymchenko Цитата: Ведь Intel раньше не занималась такими прямыми сопоставлениями с продукцией конкурента. Вас это не тревожит? Почему меня должно это тревожить?

Автор:	Lev Dymchenko [ 21:15 17.03.2006 ]
Заголовок сообщения:
Не знаю, кто вы, просто это говорит в пользу того, что вместо новых прогрессивных процессоров они могли ступить на скольский путь.

Автор:	Lev Dymchenko [ 21:24 17.03.2006 ]
Заголовок сообщения:
Вот, ссылка на статью в соседней ветке тому подтверждение. Меня вообще, когда у меня плохое настроение, в пинципе раздражает реклама процессоров, Intel и AMD.

Автор:	BorisU [ 21:26 17.03.2006 ]
Заголовок сообщения:
Lev Dymchenko не вижу никакой логической связи

Автор:	Lev Dymchenko [ 21:54 17.03.2006 ]
Заголовок сообщения:
Ну они занялись по сути, обыкновенной рекламой. Взяли приятные результаты, и распиарили их. А не приятные, возможно, скрыли.

Автор:	U2 [ 22:10 17.03.2006 ]
Заголовок сообщения:
McZag Я наверно что-то пропустил. АМД собирается делать L3 на той же вафле? Дороговато получится. L3 на какой той вафле? 200мм? Вообще-то картина пока вырисовывается следующая: — Rev. F = 90nm\|200mm — Rev. G (L3) = 65nm\|300mm BorisU Легкий такой щелчок по носу AMD, которые рекламировали свои изделия как идеальные для геймера. Вот именно что легкий щелчок Что значит рекламировали? АМД-решения и сейчас для геймеров являются вне конкуренции и будут являться пока конро не выйдет, в нормальных объемах и соот. рядом. Уже в прошедшем времени говорим, похоронили амд? Напрасно

Автор:	Volodimir [ 22:15 17.03.2006 ]
Заголовок сообщения:
Новая архитектура Intel просто обязана работать быстрее устаревшей на минимум два года AMD. Следует из заявленных расширенных арифметических блоков процессора Intel, да и частоты не ниже, чем у AMD.

Автор:	Lev Dymchenko [ 22:44 17.03.2006 ]
Заголовок сообщения:
Volodimir То, что вы сказали, это вообще не в тему, и никто никому ничего не обязан.

Автор:	BorisU [ 01:02 18.03.2006 ]
Заголовок сообщения:
U2 Цитата: Уже в прошедшем времени говорим, похоронили амд? Напрасно Почему же. у них все неплохо. Пока...

Автор:	BorisU [ 01:04 18.03.2006 ]
Заголовок сообщения:
Lev Dymchenko Цитата: А не приятные, возможно, скрыли. Расскажите, какие неприятные результаты вы ожидаете и почему?

Автор:	TeoAX [ 01:33 18.03.2006 ]
Заголовок сообщения:
BorisU: Давайте отличать ваши глобальные фантазии про маркетинг вообще от реальности Давайте без давайте. Хотите доказывать, что среднестатистический человек сперва смотрит на мелкий текст, а потом на крупный — пожалуйста! Я погляжу при этом на Вашу аргументацию. :—\ > Что вы имеете против тестов spec? Совершенно ничего я не имею. Я лично — только за, и очень поддерживаю идею! Только вот видите ли, тестов, то есть конкретных показателей производительности по конкретным конфигурациям (как требуют этого условия SPEC) Intel не привел. Вместо этого были даны какие-то очередные абстрактные попугаи, где за исходных 100% могло быть взято все, что угодно. Значит, увы, хвастаться в этой сфере пока нечем. Но пиарить продукт необходимо, посему рисуем стрелочки, звездочки, воскицательные знаки с колоссальными приростами и мелкими уточняющими подписями. (На самом деле я почти уверен, откуда у этой заявленной цифры в 80% ноги растут. Видимо, Intel хотела похвастаться, что индивидуальные шины 1066\1333МГц лучше одной старой 800МГц в многопроцессорниках. Это все, конечно, очень и очень неплохо, только вот отношения к микроархитектурному уровню не имеет никакого, равно как и не говорит ничего в пользу производительности отдельного ядра) Volodimir: Новая архитектура Intel просто обязана работать быстрее устаревшей на минимум два года AMD Уважаемый, не нужно считать, что если Вашу клоунаду терпят в ветке "AMD vs Intel", то ее можно себе позволять во всех остальных. В "AMD vs Intel" все-таки негласный ценз пониже, здесь же с вас спросят за каждое необоснованное утверждение.

Автор:	BorisU [ 01:43 18.03.2006 ]
Заголовок сообщения:
Цитата: Вместо этого были даны какие-то очередные абстрактные попугаи, где за исходных 100% могло быть взято все, что угодно. Это ваши фантазии — на картинке ясно написано, что берется за 100%

Автор:	TeoAX [ 01:56 18.03.2006 ]
Заголовок сообщения:
BorisU: Это ваши фантазии — на картинке ясно написано, что берется за 100% Ну конечно же фантазии! Ведь русским по белому написан чипсет, тип, объем и число каналов памяти, дисковая подсистема и компилятор. "Это мои фантазии" ©, что всего этого нет.

Автор:	Lev Dymchenko [ 02:02 18.03.2006 ]
Заголовок сообщения:
BorisU Цитата: Расскажите, какие неприятные результаты вы ожидаете и почему? Не то, чтобы ожидаю, предполагаю возможность. Сходные с топовым Pentium4 результаты specfp, потому, что они не обнародованы вообще. Не такие однозначные результаты по совокупности игр, потому, что одним из факторов преимущества в играх есть контроллер памяти, а увеличение частоты шины с 200 до 266 может быть не полностью достаточным. В том же specint ожидаю несколько не однородную производительность, где-то серьезный рост, там, где на увеличение КЭШ и шину сильно реагируют, а где-то и нет. Вообщем, возможно, большое приемущество будет там и только там, где важно увеличение КЭШ и шины, плюс архитектурное предпочтение. А там, где это не очень важно, может быть некоторое падение. То есть, у процессора сменится профиль производительности. И ещё один непонятный факт, на сколько более младшие модели будут хуже. То есть, может быть, преимущество в основном, за счет КЭШ и шины. может, для этого specint шикарного нужен вынь до полож 4MB КЭШ. То есть, дифференцация моделей будет сильно больше, чем у Athlon64.

Автор:	Lev Dymchenko [ 02:03 18.03.2006 ]
Заголовок сообщения:
BorisU Читали статью у тома? Тут была в соседней ветки ссылка, там как раз эти картинки.

Автор:	BorisU [ 02:05 18.03.2006 ]
Заголовок сообщения:
TeoAX чипсет А что, есть заметная разница между чипсетами? тип, объем и число каналов памятих Что, кто-то ставит P4D на 1 канал? или не на максимальную штатную частоту памяти? дисковая подсистема О да, она радикально влияет на результат компилятор Интеловский очевидно.

Автор:	Lev Dymchenko [ 02:06 18.03.2006 ]
Заголовок сообщения:
http://thg.ru/cpu/idf_2006_core/idf_2006_core-01.html

Автор:	Lev Dymchenko [ 02:07 18.03.2006 ]
Заголовок сообщения:
Вот проценты, обыкновенная реклама.

Автор:	Lev Dymchenko [ 02:14 18.03.2006 ]
Заголовок сообщения:
Вот меня несколько огорчило, что соренование между различными процессорами превращается в соревнование по вталкиванию их ламерам. Вот, может быть, по этому мы пришли постепенно к просто застою в процессоростроении для настольных компьютеров.

Автор:

BorisU [ 02:23 18.03.2006 ]

Заголовок сообщения:

Цитата:
Сходные с топовым Pentium4 результаты specfp, потому, что они не обнародованы вообще.

Забавно, улучшения FPU ничего не дадут по вашему?

Цитата:
А там, где это не очень важно, может быть некоторое падение.

За счет чего?

Цитата:
То есть, может быть, преимущество в основном, за счет КЭШ и шины. может, для этого specint шикарного нужен вынь до полож 4MB КЭШ.

Там вообще-то много чего изменилось помимо кэша и шины. Почему вы решили приписывать весь рост этим факторам?

Автор:

Lev Dymchenko [ 03:40 18.03.2006 ]

Заголовок сообщения:

Цитата:
Забавно, улучшения FPU ничего не дадут по вашему?

Дадут, но недостаточно.

Цитата:
За счет чего?

Несколько более низкой частоты. Хотя более честно с архитектурной точки зрения сравнивать с EE с четырьмя потоками, потому что Pentium4 без HT, ясное дело, не очень хорош в стандартных тестах. Все-таки, архитектура унаследовала черты PentiumIII, а он проигрывал Athlon в вычислительных задачах с вещественными числами. Это по поводу проигрыша Athlon64.

Цитата:
Там вообще-то много чего изменилось помимо кэша и шины. Почему вы решили приписывать весь рост этим факторам?

Весь рост нельзя приписать только этим факторам, но, видимо, прирост в specint существенно больше, чем в specfp, а specint относительно больше зависит от КЭШ и шины. Мы просто не знаем, насолько сильно улучшено ядро. Может, работа была заставить его работать на такой частоте, вон, там конвейер в полтора раза увеличили. Усовершенствовали слабй блок fpu, но без этого, если чито отмасштабировать результат PentiumIII, то он будет некондиционен в задачах типа Specfp.

Автор:	BorisU [ 11:19 18.03.2006 ]
Заголовок сообщения:
Цитата: Мы просто не знаем, насолько сильно улучшено ядро. Так может вам почитать про улучшения сначала?

Автор:	Lev Dymchenko [ 14:43 18.03.2006 ]
Заголовок сообщения:
Цитата: Так может вам почитать про улучшения сначала? Ну я читал, но вычислить количественный эффект затруднительно. Потом, это же все приблизительно. Они улучшили FPU, это должно улучшить результаты specfp, в которых на еденицу частоты PentiumIII довольно значительно уступал Athlon. То есть, теперь можно ожидать более высокго specfp. Дайте свою оценку specfp. Благодаря Intel мы занимаемся гаданием. На сколько более высокого, раз не говорят, значит, скорее всего, сильно меньше, чем в int.

Автор:	Lev Dymchenko [ 14:53 18.03.2006 ]
Заголовок сообщения:
Кстати, если читать по поводу улучшений, а можно табличку латентностей инструкций?

Автор:	BorisU [ 15:28 18.03.2006 ]
Заголовок сообщения:
Lev Dymchenko Насчет оценок — читайте статью bess'а. Слух про specfp был 2500. И оставьте в покое P3 — От P3 оно IMHO отличается существенно больше, чем K8 от K7.

Автор:	Lev Dymchenko [ 16:06 18.03.2006 ]
Заголовок сообщения:
Цитата: И оставьте в покое P3 — От P3 оно IMHO отличается существенно больше, чем K8 от K7. Конечно, больше. Ну что с того, что больше. У K8 и K7 вообще отличия такого сорта, как сказать, приделали что-то к процессору. Вообщем, это секретный процессор. Ну это похоже на анекдот про овец. Летит физик и математик на самолете, и они видят внизу черную овцу. Физик написал, тут водятся черные овцы, а математик — видели одну овцу, черную сверху.

Автор:	Lev Dymchenko [ 16:09 18.03.2006 ]
Заголовок сообщения:
У AMD сейчас specfp_peek, если не ошибаюсь, где-то 2300.

Автор:	BorisU [ 16:10 18.03.2006 ]
Заголовок сообщения:
Цитата: Вообщем, это секретный процессор. Прочитайте хоть интеловский pdf и статью на RWT.

Автор:	Lev Dymchenko [ 16:25 18.03.2006 ]
Заголовок сообщения:
Ну читал статью, а pdf — какой? Там сказано, какие усовершенствования проведены, добавлены технологии, как, например, предсказания отсутвия зависимостей чтения по памяти. Это замечательно. Я лично очень это приветствую. Но, как говорил один товарищ, на которого вы недавно ссылались, процессор — плод компромисса. Там могут быть и компромиссные решения.

Автор:	Lev Dymchenko [ 16:27 18.03.2006 ]
Заголовок сообщения:
Видите, они превратили все в маркетинг и рекламу. Там завеса секретности сумасшедшая. Станут они обнародовать, то, что там может ухудшиться?

Автор:	BorisU [ 16:38 18.03.2006 ]
Заголовок сообщения:
Lev Dymchenko Что ж вы так нервничаете

Автор:	U2 [ 21:23 18.03.2006 ]
Заголовок сообщения:
BorisU Почему же. у них все неплохо. Пока... Типа надо понимать пока гром (конро) не грянет ... Картина в бл. обозримом будущем для интел не измениться к лучшему, будет только больнее, ИМО.

Автор:	TeoAX [ 21:28 18.03.2006 ]
Заголовок сообщения:
BorisU: А что, есть заметная разница между чипсетами? А что, 17.1GB/s (Blackford) и 6.4GB/s (Lindenhurst) ПС шины для шинного процессора, который вечно в нее упирается в многопроцессорных конфигурациях — это незаметная разница? > Что, кто-то ставит P4D на 1 канал? Ответ в Вашем стиле: А откуда Вы знаете, что никто не ставит? > Интеловский очевидно. Это совершенно неочевидно, потому что это нигде не написано. > Забавно, улучшения FPU ничего не дадут по вашему? А откуда Вы знаете, что дадут? Откуда Вы знаете, что этот прирост будет заметен? > Так может вам почитать про улучшения сначала? А что, из официальной информации было что-то кроме простого общего перечисления? Lev Dymchenko: http://thg.ru/cpu/idf_2006_core/idf_2006_core-01.html Ха, у Тома вообще не указаны эти приписки! Просто 80 и 40 процентов. "Прелестно! Просто прекрасно!" © Судя по качеству и перпендикулярному углу, это картинки из pdf-ки по материалам IDF? > У AMD сейчас specfp_peek, если не ошибаюсь, где-то 2300. [Уже пол-года как более 2500]

Автор:	Lev Dymchenko [ 21:39 18.03.2006 ]
Заголовок сообщения:
Цитата: Судя по качеству и перпендикулярному углу, это картинки из pdf-ки по материалам IDF? У Тома надо спросить. Очень похожи на сокращенные фотографии с экрана.

Автор:	Lev Dymchenko [ 21:52 18.03.2006 ]
Заголовок сообщения:
Цитата: > У AMD сейчас specfp_peek, если не ошибаюсь, где-то 2300. Там дофига резульаттов этого opteron. В данном конкреном sun что-ли как-то что-то распараллелила, видимо. Видел и 2000 результат.

Автор:	TeoAX [ 21:57 18.03.2006 ]
Заголовок сообщения:
Lev Dymchenko: Там дофига резульаттов этого opteron. В данном конкреном sun что-ли как-то что-то распараллелила, видимо. Ответ, ИМХО, куда проще — используется кеш второго ядра.

Автор:	Lev Dymchenko [ 22:08 18.03.2006 ]
Заголовок сообщения:
А, там рядом такой же с отключенным одним ядром. Я уже жаловался на сайт spec, что там все в одной куче. Мне трудно что-либо найти. Я даже Pentium950 не нашел не rates, по-моему, там его и нет. Кстати, кто скажет, какой у него наилучший результат, от чего эти проценты считать? Кстати, у той системы от sun зато ниже результат specint, процентов на 10 base и peek. Там в случае specfp_peek такая уйма ключей, что они прямо твикнули, думаю, конкретно. Тем более, у sun есть большой опят возни со спек. Может, теперь и Intel пойдет по стопам sun в твиканьи spec. У Intel, считаю, больше шансов преуспеть в этом деле.

Автор:

BorisU [ 22:26 18.03.2006 ]

Заголовок сообщения:

TeoAX

Цитата:
А что, 17.1GB/s (Blackford) и 6.4GB/s (Lindenhurst)

О чем вы? речь о десктопных Pentium D.

Цитата:
Ответ в Вашем стиле: А откуда Вы знаете, что никто не ставит?

Идиоты в другом месте

Цитата:
А откуда Вы знаете, что дадут? Откуда Вы знаете, что этот прирост будет заметен?

Смотрите тесты кодирования.

Цитата:
А что, из официальной информации было что-то кроме простого общего перечисления?

вообще-то кое-какие детали стали известны. Читайте статью на RWT.

Цитата:
[Уже пол-года как более 2500]

С двумя-то ядрами в параллель :no:

Автор:	U2 [ 22:27 18.03.2006 ]
Заголовок сообщения:
Lev Dymchenko Благодаря Intel мы занимаемся гаданием. На сколько более высокого, раз не говорят, значит, скорее всего, сильно меньше, чем в int. Ну а як же. Иначе бы выдали на гора. Рост д.б. скромный, отсюда уход по-английски, с ИДФ, в части specfp. Я даже Pentium950 не нашел не rates, по-моему, там его и нет. Да, в Q1 данные только пока для Pentium D 940 и ниже. Кстати, кто скажет, какой у него наилучший результат, от чего эти проценты считать? http://www.spec.org/cpu2000/results/res ... 05429.html от них и считать.

Автор:	Lev Dymchenko [ 22:31 18.03.2006 ]
Заголовок сообщения:
U2 Спасибо. А с чем его надо сранивать, из AMD, видимо, с athlonX2 4800+ А у него какой максимальный, только не rates? Что они, rates считали? вроде, речь шла о specint одного ядра.

Автор:	Lev Dymchenko [ 22:37 18.03.2006 ]
Заголовок сообщения:
BorisU А вы-то знаете, какой spec имеется в виду, когда речь идет о 40%? Откуда пошел слух о 2800? Это 40% от топового одноядерного Pentium4 3800, правильно?

Автор:	U2 [ 22:37 18.03.2006 ]
Заголовок сообщения:
Lev Dymchenko А с чем его надо сранивать, из AMD, видимо, с athlonX2 4800+ Интел дает сравнение будущей микроархитектуры с текущей, со своей, а не конкурента. Цитата: ¹ As compared to today's high end Presler 950. Based on estimated SPECint_rate_base2000. ² As compared to today's Paxville DP 2.8/800. Based on estimated SPECint_rate_base2000. Именно rates

Автор:	Lev Dymchenko [ 22:38 18.03.2006 ]
Заголовок сообщения:
U2 А, да, не запомнил сразу rates. Ну, конечно, в rates поможет шина, КЭШ, наверное, так.

Автор:	Lev Dymchenko [ 22:39 18.03.2006 ]
Заголовок сообщения:
Тогда что с непосредственно spec int и spec fp непонятно. Кстати, rates Pentium950 есть.

Автор:	Lev Dymchenko [ 22:48 18.03.2006 ]
Заголовок сообщения:
В итоге, я совсем запутался.

Автор:	Lev Dymchenko [ 22:52 18.03.2006 ]
Заголовок сообщения:
Вообще, по spec у Intel по сравнению с AMD совсем не плохо. PentiumD, даже самые дешевые, совсем не сильно уступают двуядерным процессорам AMD. То же самое касается и одноядерных. А теперь, видимо, будет наоборот в том смысле, что преимущество, если будет, в specfp и specint будет не самым большим среди приложений.

Автор:	TeoAX [ 23:15 18.03.2006 ]
Заголовок сообщения:
BorisU: О чем вы? речь о десктопных Pentium D. Ответ неверный, вы не следите за дискуссией. Речь о заявлениях Intel о приросте производительнсти P8, в т.ч. о громкой цифре в 80% для серверного варианта. Речь о цифрах SPEC, в т.ч. о rates. > Идиоты в другом месте Другими словами, здесь и сейчас, Вы готовы мне дать письменные гарантии того, что Intel использовала двухканальную конфигурацию для Pentium D, когда готовила цифры прироста? > Смотрите тесты кодирования. И где я могу посмотреть независимые тесты, где происходило бы сравнение с предыдущим поколением процессоров Intel? (ведь мы именно прирост хотим узнать) > вообще-то кое-какие детали стали известны. Читайте статью на RWT. RWT — это, видимо, RealWorldTech? С каких пор RealWorldTech стал подразделением корпорации Intel? > С двумя-то ядрами в параллель Ага, и IBM (тут и тут) и HP с компилятором PathScale мухлюют, получая прирост от двухядерника в однопоточном тесте! Просто какой-то про-AMD-шный заговор! U2: Based on estimated Порадовало. Больше вопросов не имею.

Автор:	Lev Dymchenko [ 23:24 18.03.2006 ]
Заголовок сообщения:
А есть какой-нибудь сайт, где тестируют на регулярной основе тестами spec?

Автор:	BorisU [ 23:32 18.03.2006 ]
Заголовок сообщения:
Цитата: Другими словами, здесь и сейчас, Вы готовы мне дать письменные гарантии того, что Intel использовала двухканальную конфигурацию для Pentium D, когда готовила цифры прироста? легко. а что вы с ними будете делать?

Автор:	Lev Dymchenko [ 23:48 18.03.2006 ]
Заголовок сообщения:
Наверное, не до такой степени, чтобы одноканальную конфигурацию ставить. Просто, может, не супер твикнутая. Там, смотрите, разброс большой от платы, памяти, и т.п. 10% легко получить. Кстати, раньше Intel позволял себе весьма консервативные конфигурации постить на spec, можно было не плохо увеличить результат процессоров. Лучше давать абсолютные результаты, или нет?

Автор:	Lev Dymchenko [ 23:52 18.03.2006 ]
Заголовок сообщения:
BorisU Кстати, а ваше версия specfp от AMD в сегменте настольных процессоров какой? Мне этот результат от sun кажется несколько непонятным. Вообще, когда что-то скрывают, это вызывает подозрения. А вы так и не сказали, почему скрывают.

Автор:	Lev Dymchenko [ 23:54 18.03.2006 ]
Заголовок сообщения:
ко мне пришли опять непрятные мысли, что снова в этом году прироста производительности не будет. Мне даже не на что сменить мой процессор 2400С. Разьве только двуядерный, но я уже жаловался, что PentiumD без HT не есть удвоенный Pentium4.

Автор:	U2 [ 00:06 19.03.2006 ]
Заголовок сообщения:
TeoAX Порадовало. Не понял. В каком смысле? Что здесь не так? Lev Dymchenko А есть какой-нибудь сайт, где тестируют на регулярной основе тестами spec? Вам нужен сайт, где можно выловить спеки по заданным параметрам? ко мне пришли опять непрятные мысли, что снова в этом году прироста производительности не будет. Мне даже не на что сменить мой процессор 2400С. "Хорошо сидим" © Хмм ... сегодня полная луна

Автор:	TeoAX [ 00:45 19.03.2006 ]
Заголовок сообщения:
BorisU: легко. а что вы с ними будете делать? Если сумею доказать факт использования сознательно замедленной конфигурации (что не должно быть очень сложным, учитывая, что Intel неоднократно в прошлом в сравнениях процессоров занимался именно сравнением платформ) — в судебном порядке затребую с Вас кругленькую сумму с целью профилактики избыточной самоуверенности и фанатской веры. U2: Не понял. В каком смысле? Что здесь не так? Estimate! Соответственно к техническим характеристикам эти цифры никакого отношения не имеют. Другими словами предмета разговора (процессора, для которого даны цифры в 40% и 80%) вообще нет, а мы тут рассуждаем о сферических конях в вакууме, о продукте труда маркетолога, который вырисовывал эти цифры исходя из предпосылки из серии "а вот если бы у нас был Конро, и работал бы он на частоте 3.33ГГц, и на 1333Мгц шине, да и был бы приправлен кешем на 4Мб, да еще б при этом работал, да еще б корректно и без ошибок бы... ... ..."

Автор:

Lev Dymchenko [ 00:47 19.03.2006 ]

Заголовок сообщения:

Цитата:
Вам нужен сайт, где можно выловить спеки по заданным параметрам?

Это было бы не плохо, потому что у меня поиск по spec не работает. Ничего путного никогда не выводит. И дело в том, что там процессоры вечно в непонятных конфигурациях. Если видишь результат, то заренее не знаешь, толковый ли он. Ну вот если взять какой-нибудь Athlon64 x2, каков у него разброс результатов? Там ведь и системы тестируют. Какой-нибудь производитель хочет похвастаться, как его плата хорошо работает с ECC Registered, что-то такое, и постит результаты. Там полно мусора с точки зрения процессоротестирования.

Цитата:
Не понял. В каком смысле? Что здесь не так?

Видимо, слово estimated. Не понятно, наверное, даже Intel не простетировал собственнй процессор. или ждет компилятора.

Автор:	Lev Dymchenko [ 01:00 19.03.2006 ]
Заголовок сообщения:
BorisU проясните, плиз, эти 40% относительно Pentium950 относятся к Conroe XE или к 2.66/1066/4?

Автор:	U2 [ 01:24 19.03.2006 ]
Заголовок сообщения:
TeoAX Estimate! Соответственно к техническим характеристикам эти цифры никакого отношения не имеют. Другими словами предмета разговора (процессора, для которого даны цифры в 40% и 80%) вообще нет Ясно, что ничего не ясно. В данном случае, =based on estimated= согласно оценкам spec, кот-ое адресуется не к конро, а к преслеру и т.п. Lev Dymchenko Это было бы не плохо, потому что у меня поиск по spec не работает. Ничего путного никогда не выводит. Единственное, что можно посоветовать тогда, то разве что сюда зайти и отчекить имеющиеся параметры. http://www.aceshardware.com/SPECmine/ проясните, плиз, эти 40% относительно Pentium950 относятся к Conroe XE или к 2.66/1066/4? Можно я за BorisU отвечу? А то он видимо шас на прямой линии с Хайфа, согласовывает то, сё ... ;) Это должно относится, по логике вещей, к конро 2,6 ггц, т.к. этот силикон стоял в тест-системе

Автор:	Lev Dymchenko [ 01:42 19.03.2006 ]
Заголовок сообщения:
Цитата: В данном случае, =based on estimated= согласно оценкам spec, кот-ое адресуется не к конро, а к преслеру и т.п. Наверное, estimated относится к оценке spec для conore. Типа, ещё система сыровата и т.п. Если к 2.66, то можно порадоваться.

Автор:	McZag [ 21:43 20.03.2006 ]
Заголовок сообщения:
U2 McZag Я наверно что-то пропустил. АМД собирается делать L3 на той же вафле? Дороговато получится. L3 на какой той вафле? 200мм? Вообще-то картина пока вырисовывается следующая: — Rev. F = 90nm\|200mm — Rev. G (L3) = 65nm\|300mm Я полагал (и пока меня никто не разубедил в обратном), что L3 производится отдельно. И в процессор врезается уже на стадии упаковки (или как отдельная стадия). Только таким способом можно достичь разумной цены и достаточного объема (это многослойная, более дешевая память, чем внутрипроцессорный SRAM). Еще один плюс L3 в том, что его можно заказывать на стороне. Это не очень верно стратегически, но финансово это намного выгоднее.

Автор:	matik [ 22:28 20.03.2006 ]
Заголовок сообщения:
McZag Я полагал (и пока меня никто не разубедил в обратном), что L3 производится отдельно Так было во времена Pentium Pro. Сейчас L3 находится на том же кристалле, что и ядро. Собственно, это легко заметно на тех же фотках Итаниума. Еще один плюс L3 в том, что его можно заказывать на стороне. Это не очень верно стратегически, но финансово это намного выгоднее. Как правило, сторонний L3 не обладает нужными скоростными характеристиками.

Автор:	U2 [ 22:57 20.03.2006 ]
Заголовок сообщения:
McZag Я полагал (и пока меня никто не разубедил в обратном), что L3 производится отдельно. И в процессор врезается уже на стадии упаковки (или как отдельная стадия). Это если допустить вариант, что L3 будет у амд вне кристалла, собственно matik уже ответил. Только таким способом можно достичь разумной цены Как раз "врезка" должна значительно удорожать конечную стоимость продукта. Еще один плюс L3 в том, что его можно заказывать на стороне. Это не очень верно стратегически, но финансово это намного выгоднее. Так на стороне делать это приведет к еще большему удорожанию. matik Как правило, сторонний L3 не обладает нужными скоростными характеристиками. А реально какой L3 рассматривать можно, ну кроме озвученного ранее Z-RAM? SRAM 6T/1T? eDRAM? А если все-таки вне чипа?

Автор:	matik [ 23:33 20.03.2006 ]
Заголовок сообщения:
U2 А реально какой L3 рассматривать можно SRAM 6T/1T — только этот. Остальные на 3ГГц не работают просто. А делать его полускоростным уже не очень осмысленно.

Автор:	Ivan Andreevich [ 05:45 21.03.2006 ]
Заголовок сообщения:
McZag Мне понравилась фраза "слухи материализуются". надо запомнить В 2 часа ночи ещё и не такое напишу Дело не в ATI. Они ничего не замедляли. Тем более они никому эту версию дров не будут отдавать Там помоему было сказано что дрова одинаковые. matik Думаю придётся просто подождать несколько месяцев и посмотреть про дрова Нужно всего-то увидеть X2 3800+ vs FX-60 vs Conroe чтобы сделать выводы

Автор:	McZag [ 09:02 21.03.2006 ]
Заголовок сообщения:
matik SRAM 6T/1T Не убедительно. Вы хотите делать L3 по технологии L2. Какой в этом смысл? 1. Блины под процессоры вещь несравнимо более дорогая, чем под память. 2. Площадь большого L3 (например, 6-8МВ), сделанного по "плоской" процессорной технологии, будет слишком большой, и банально "съест" с фафли пару процессоров. 3. Зачем АМД технологии Рамбас? За что платятся деньги? Явно не только за возможность использовать XDRAM. 4. Itanium не аргумент: это процессор из другого ценового диапазона. Разработчикам была дана карт-бланш, они делали (до поры до времени), что хотели. 5. L3, имхо, будет работать через кросс-бар и часть контроллера памяти так же, как и обычная память, и рассматриваться другими процессорами как обычная память (иначе вы утонете в поддержке когерентности ЧЕТЫРЕХуровневой памяти) 6. U2 на стороне делать это приведет к еще большему удорожанию. Чтобы это действительно было дешевле, АМД нужно: а) наладить массовое производство L3 по нестандартной (т.е. ЕЩЕ не производимой массово) технологии. Иначе затраты на R&D + запуск технологии + задействованные производственные мощности = многократно превысят стоимость готовых (даже очень дорогих) решений не только на сегодня но и в перспективе 2-3 лет. б) Отказаться от производства L3 на той же пластине, что сам CPU (см. п. 2) 7. Вы сильно преувеличиваете скоростные требования к L3. Если L3 обеспечит вдвое большую ПСП и вдвое меньшую латентность (для такого кэша не нужно SRAM 6T/1T), чем обычная память, то при достаточных объемах (те же 6-8МВ) он на 100% удовлетворит требованиям многопроцессорных систем. Для того чтобы поднять скорость одного ядра надо менять микроархитектуру. Много ли получает К8 от увеличения кэша L2 вдвое? А вы хотите за счет L3 достичь каких-то невороятных результатов... Докажите обратное Ivan Andreevich Там помоему было сказано что дрова одинаковые Именно. Те самые, которые были оптимизированные Интел.

Автор:	Ivan Andreevich [ 09:08 21.03.2006 ]
Заголовок сообщения:
McZag Почти на 100% уверен что ананд переустановил бы дрова. Проверю.

Автор:	McZag [ 10:12 21.03.2006 ]
Заголовок сообщения:
Ivan Andreevich Почти на 100% уверен что ананд переустановил бы дрова. Проверю. Не понял фразы. У вас там опять 2 ночи? Он их НЕ переустановил С точки зрения методики тестирования это правильно

Автор:	matik [ 10:19 21.03.2006 ]
Заголовок сообщения:
McZag Не убедительно. Вы хотите делать L3 по технологии L2. Какой в этом смысл? При чем здесь я? Его сейчас так и делают. ВСЕ, кроме НР, которая в свое время использовала 1Т-SRAM на половинной частоте в НР8700 (или 8800, уже не очень точно помню). Дык это были 300MHz. А не вдесятеро (!) большая частота. Пока из альтернатив — разве что Z-RAM, и то не очень понятно, когда это будет использоваться, и будет ли. Де-факто сейчас L3 делают так же, как и L2. Поэтому Xeon-ы МР дорогие. Точнее, в том числе и поэтому. Блины под процессоры вещь несравнимо более дорогая, чем под память. Блины — примерно той же стоимости. Дорогое там, думаю, производство, а не сам блин. Площадь большого L3 (например, 6-8МВ), сделанного по "плоской" процессорной технологии, будет слишком большой, и банально "съест" с фафли пару процессоров Так и есть (с поправкой на то, что кэш несколько лучше упаковывается). Посмотри на площадь процессоров с L3 кэшем (того же Gallatin-а, или Itanium-а) Зачем АМД технологии Рамбас? За что платятся деньги? Явно не только за возможность использовать XDRAM У Rambus есть очень неплохой работающий контроллер PCI-Е, а так же контроллеры DDR2. Думаю, их и лицензировали. Если бы отнять у них юридический отдел, замечательная компания получилась бы L3, имхо, будет работать через кросс-бар и часть контроллера памяти так же, как и обычная память, и рассматриваться другими процессорами как обычная память (иначе вы утонете в поддержке когерентности ЧЕТЫРЕХуровневой памяти) Зачем? Все можно сделать еще проще. Контроллер памяти присоединен к L3. В результате L3 для процессора — просто очень быстрая память. Собственно, везде, где есть L3, именно так и сделано. Коггерентность поддерживать в этом случае никак специально не надо. Много ли получает К8 от увеличения кэша L2 вдвое? Кстати, довольно много. На оверклокерсах была статья Гаврика про тестирование ядер с разным объемом кэша. Так вот, там была довольно заметная разница (5 — 15%) в тех же игрушках. Думаю, в серверных приложениях, которые характерны еще большими областями локальности, зависимость будет больше. Если L3 обеспечит вдвое большую ПСП и вдвое меньшую латентность (для такого кэша не нужно SRAM 6T/1T), чем обычная память, то при достаточных объемах (те же 6-8МВ) он на 100% удовлетворит требованиям многопроцессорных систем. Осталось понять, на какой технологии ты предлагаешь делать этот самый кэш. Итак?

Автор:	McZag [ 11:38 21.03.2006 ]
Заголовок сообщения:
matik Блины — примерно той же стоимости. Дорогое там, думаю, производство, а не сам блин. Нет. Я не располагаю точными данными, но разница, имхо, примерно раза в 3. SOI, другое по технологии легирование, другая поверхностная обработка, более жесткие нормы атомарного слоя кремния. На подложке для памяти современный процессор изготовить нельзя. АМД, кстати, полностью не производит сама процессорные вафли. У Rambus есть очень неплохой работающий контроллер PCI-Е, а так же контроллеры DDR2 75 млн. за эти побрякушки? Хочу работать в Рамбас Лично я почти не сомневаюсь, что АМД выпустит процессор с поддержкой XDR или XDR2 Коггерентность поддерживать в этом случае никак специально не надо Я примерно об этом же. На оверклокерсах была статья Гаврика про тестирование ядер с разным объемом кэша. Так вот, там была довольно заметная разница (5 — 15%) в тех же игрушках. Именно. Если бы ты (Гаврик) показал 10-20%, то увеличение кэша любой ценой имело бы смысл. Дальнейшее удвоение L2 (при большей латентности!) дополнительно даст еще меньше — оптимистично 0-10%. L3 неизбежно имеет еще более худшие характеристики. Он ценен в многопроцессорных конфигурациях и для небольшого количества кэшелюбивых приложений. Осталось понять, на какой технологии ты предлагаешь делать этот самый кэш. Итак? Технологий внешней SRAM-подобной памяти много. Например, Micron RLDRAM II (доступна); Samsung QDRII (доступна), QDRII+(июнь 2006) и др.; SRAM от IBM и т.д. Не исключаю возможности даже появления XDR в качестве кэш-памяти. Это убийство двух зайцев — и контроллер приделают, и прибавку получат. А когда производство XDR(II) станет по настоящему массовым... Ну это домыслы...

Автор:	matik [ 12:23 21.03.2006 ]
Заголовок сообщения:
McZag Нет. Я не располагаю точными данными, но разница, имхо, примерно раза в 3. Не Навскидку соотношение примерно такое: блин 300мм для 90нм технологии стоит порядка 3К. Блин 300мм с SOI + напряженный кремний стоит около 5К. А 200мм SOI + strained silicon стоят тех же 3К. АМД, кстати, полностью не производит сама процессорные вафли Покупает у Soitek, в этом нет секрета. 75 млн. за эти побрякушки? Хочу работать в Рамбас Это добряки Правда, думаю, 75 лимонов стоит весь пакет их патентов. Включая SDRAM, DDR, XDR, DDR2, и так далее. Если бы ты (Гаврик) показал 10-20%, то увеличение кэша любой ценой имело бы смысл. Дык он и показал. По крайней мере, в Quake III. Micron RLDRAM II В качестве кэша — не годится. Reduced Latency она по сравнению с обычной DRAM, со SRAM ей не сравниться. Да и частота работы — около 1ГГц. До трех ее не дотянуть. ; Samsung QDRII Извини, но это обычная DRAM, просто с более навороченным внешним интерфейсом. Не хватит скорости и частоты работы SRAM от IBM Этого не понял. Что ты имеешь в виду? Не исключаю возможности даже появления XDR в качестве кэш-памяти. Это убийство двух зайцев — и контроллер приделают, и прибавку получат. А когда производство XDR(II) станет по настоящему массовым... Ну это домыслы... Совершенно исключаю такую возможность. Это убийство производительности, а не двух зайцев. Ячейки XDR — это обычные ячейки DRAM. Они в принципе соперничать со SRAM в производительности не могут.

Автор:	McZag [ 15:01 21.03.2006 ]
Заголовок сообщения:
matik Дык он и показал. По крайней мере, в Quake III. Движок Quake III очень охотлив до кэшей. И очень любит агрессивный префетч. Помнишь, когда был К7, он откровенно сливал в Quake и PIII и PIV? При этом явного превосходства по кэшам не было (если сравнивать с Бартоном). Имхо, проблема работы с такими приложениями, не только и не столько в размере и скоросте кэшей, сколько в своевременном подтаскивании в этот кэш необходимых данных (ну либо обладание ОЧЕНЬ большим кэшем). Все примеры памяти я привел, как потенциально удовлетворяющие моим запросам к L3. Я уже привел свои оценки — латентность доступа к третьему уровню (т.е. L1+L2+L3) как минимум в два раза ниже, чем к L1+L2+RAM и ПСП не менее чем в 2 раза выше. Кстати, частоты там не 1ГГц 300-500МНz. Но ты не прав, что это обычная DRAM. Мне что-то не попадалась обычная память с латентностью 5ns как у QDRII SRAM SRAM от IBM Этого не понял. Что ты имеешь в виду? 500МНz, 1Gbpp

Автор:	matik [ 19:43 21.03.2006 ]
Заголовок сообщения:
McZag Но ты не прав, что это обычная DRAM. Мне что-то не попадалась обычная память с латентностью 5ns как у QDRII SRAM Тебе точно попадалась такая DRAM. Это DDR400. Что-то мне подсказывает, что они "слегка перепутали", какую задержку указывать. Если не согласен, укажи, какова, по твоему мнению, ячейка памяти в QDRII.

Автор:	U2 [ 22:55 21.03.2006 ]
Заголовок сообщения:
McZag 1. Блины под процессоры вещь несравнимо более дорогая, чем под память. 2. Площадь большого L3 (например, 6-8МВ), сделанного по "плоской" процессорной технологии, будет слишком большой, и банально "съест" с фафли пару процессоров. Ну так напрямую нет смысла особого сравнивать — другой порядок там все же, объемы, прибыли, производство и т.д. L3, сделанный на одной вафле, конечно съест дополнительную площадь, ну и что? Если правильно понимаю, те коры, кот-ые вроде как бы планируются с Л3 пойдут не на десктоп, а на высокорентабельный сектор — серверный, где уже свои законы и маржа, т.е. подобные шаги уже будут оправданы. 4. Itanium не аргумент: это процессор из другого ценового диапазона. Разработчикам была дана карт-бланш, они делали (до поры до времени), что хотели. Да у всех хай-енд процессорах, точнее у их дизайнеров размер кристалла далеко не первая необходимость в отл. от масс-продукции. а) наладить массовое производство L3 по нестандартной (т.е. ЕЩЕ не производимой массово) технологии. Иначе затраты на R&D + запуск технологии + задействованные производственные мощности = многократно превысят стоимость готовых (даже очень дорогих) решений не только на сегодня но и в перспективе 2-3 лет. б) Отказаться от производства L3 на той же пластине, что сам CPU (см. п. 2) Подождите о какой массовости продукции может идти речь? Речь может идти только об одном секторе, и очень сладком пироге. Сколько продаются камней в год для мобильного/десктопного, а сколько для серверного? R&D и технологии? А что тут принципиально нового для чипмейкеров, это их профильный бизнес, тут крайне узкой специализации им и не требуется, все идет широким фронтом, и затратов космического масштаба не предвидится. Ну а мощности, скажем в случае с амд, думаю — не проблема, с постепенным переходом на 65нм на ФАБ36 высвобождаются ресурсы ФАБ30, которую чем-то можно и заполнить. 7. Вы сильно преувеличиваете скоростные требования к L3. Если L3 обеспечит вдвое большую ПСП и вдвое меньшую латентность (для такого кэша не нужно SRAM 6T/1T), чем обычная память, то при достаточных объемах (те же 6-8МВ) он на 100% удовлетворит требованиям многопроцессорных систем. Для того чтобы поднять скорость одного ядра надо менять микроархитектуру. Много ли получает К8 от увеличения кэша L2 вдвое? А вы хотите за счет L3 достичь каких-то невороятных результатов... Вопрос — каким видите Л3 применительно к К8? Вне чипа? На кристалле? Никто вроде и не спорит, что Л3 как раз в MP-конфигах и найдет, и проявит себя. Ну если перекроить организацию кэша в К8, то с увеличением объема наверно можно должный прирост и получить, а в текущем варианте — вряд ли. Про Рамбус вообще понял. Причем он здесь? При любом случае вот же любят и помянуть, и пнуть "Как? Опять Гуськов? Почему Гуськов?" © L3 неизбежно имеет еще более худшие характеристики. Он ценен в многопроцессорных конфигурациях и для небольшого количества кэшелюбивых приложений. Ну вы же сами отвечате, куда нацеливается Л3-продукт, за себестоимость тут особо за сердце хвататься не надо Samsung QDRII (доступна), QDRII+(июнь 2006) и др.; SRAM от IBM и т.д. Так у этих типов памяти на сегодня технологический потолок в 500мгц. А когда производство XDR(II) станет по настоящему массовым... ХДР станет более массовым, когда к нему все-таки проявят интерес процессоро-строители, а не наоборот И не исключено, что Интел как раз первым и вернется к некогда брошенной половинке Летом, надеюсь, будет ясно.

Автор:	U2 [ 23:36 21.03.2006 ]
Заголовок сообщения:
McZag matik У сана спарк4+ Л3 есть на кристалле (L3 cache tags), а данные (L3 data cache) вынесены за чип, внешний SRAM. Такой вариант для амд не прокатит?

Автор:	matik [ 03:53 22.03.2006 ]
Заголовок сообщения:
U2 У сана спарк4+ Л3 есть на кристалле (L3 cache tags), а данные (L3 data cache) вынесены за чип, внешний SRAM. Такой вариант для амд не прокатит? Слишком медленно. Для медленных спарков вполне годится (тем более, что объемы кэшей там давно большие, делать такой накристальный кэш — самоубийство с точки зрения себестоимости процессора). А вот для быстрых современных процессоров это плохой вариант. И не исключено, что Интел как раз первым и вернется к некогда брошенной половинке What's?! Again?!

Автор:	McZag [ 09:53 22.03.2006 ]
Заголовок сообщения:
U2 У сана спарк4+ Л3 есть на кристалле (L3 cache tags), а данные (L3 data cache) вынесены за чип, внешний SRAM. Ровно это я и "предлагаю". Технологические ограничения на монокристальный L3 примерно 6-8МВ. Иначе получим коня, которого не прокормить. Даже с учетом его очень высокой цены. 2МВ L2 съедают примерно половину кристалла. +6МВ L3 съедят еще 3/2. Существенно ухудшится выход годных процессоров. Нерациональное размещение на вафле еще более ухудшит ситуацию. Внешний SRAM, хоть и более медленный, позволит: а) Более гибко выпускать процессоры. Кристалл один, объем кэша L3 может достаточно сильно варьироваться б) Говорить не о 6МВ в пределе, а о нескольких десятках МВ, при этом получая более дешевый по себестоимости процессор (я настаиваю!) Если сравнивать скорость монокристального и внешнего SRAM, то здесь все не так плохо. За счет октав, интерливинга и большей разрядности можно нивелировать частотные различия и получить удовлетворительную ПСП. Суммарная латентность доступа в L3, скорее всего будет скрадываться накладными расходами доступа в L1/L2/контроллер. Поэтому если предположить, что латентность внешнего L3 +5ns (т.е. порядка 10-15 тактов процессора), то СУММАРНАЯ латентность окажется в соотношении 2:3-3:4 или около того. Но еще раз повторюсь. До тех пор, пока АМД не доработал предсказатель переходов, и не получил высокоэффективного агрессивного префетча, никакой L3 ему не поможет. matik Тебе точно попадалась такая DRAM. Это DDR400. Что-то мне подсказывает, что они "слегка перепутали", какую задержку указывать. Если не согласен, укажи, какова, по твоему мнению, ячейка памяти в QDRII. Ну и зараза ты, Витя А самому лениво посмотреть? 5ns — это Clock Cycle Time. Access time — 2ns http://samsung.com/Products/Semiconduct ... _rev00.pdf Я в этом мало что понимаю, поэтому делай выводы сам. Ну и поделись с друзьями

Автор:	matik [ 22:18 22.03.2006 ]
Заголовок сообщения:
5ns — это Clock Cycle Time. Access time — 2ns Сlock Cycle Time = 5нс, говоришь? А теперь объясни мне, как у тебя время доступа получилось меньше (!), чем один такт? :D:D Да еще и в 2.5 раза? поэтому делай выводы сам Посмотрю этот документ после 7 апреля, когда вернусь.

Автор:	U2 [ 22:22 22.03.2006 ]
Заголовок сообщения:
matik Слишком медленно. А разве они медленные именно из-за подобной организации кэша? (тем более, что объемы кэшей там давно большие, делать такой накристальный кэш — самоубийство с точки зрения себестоимости процессора) Ну если наращивать до 32 метров как у спарков, то само собой с/б к небесам возвыситься, а нужен ли такой метраж для К8+? What's?! Again?! Так летом истекает 5-летний контракт у интел с рамбусом. Забавно будет посмотреть чем все закончиться у них

Автор:	U2 [ 22:32 22.03.2006 ]
Заголовок сообщения:
McZag Ровно это я и "предлагаю". Слишком медленно, сказал бы я словами одного одессита А L2 что делать? Тоже как у спарка, общий для ядер?

Автор:	McZag [ 09:05 23.03.2006 ]
Заголовок сообщения:
matik А теперь объясни мне, как у тебя время доступа получилось меньше (!), чем один такт? Не у меня, а у Самсунга. В pdf есть диаграммы и расшифровки, что эти термины означают Посмотрю этот документ после 7 апреля, когда вернусь. Вялые отмазки U2 Ну если наращивать до 32 метров как у спарков, то само собой с/б к небесам возвыситься, а нужен ли такой метраж для К8+? Имхо, для SMP систем мало кэша не бывает. 32 может по началу и не стОит, но выпустить, скажем, 2 модификации по 8 и 16МВ — самое то. Сложно сказать, окажется ли в 4+ системах 8МВ внешнего кэша быстрее 3-4МВ внутреннего. Но уж сопоставимо по скорости и дешевле в приготовлении — точно. Для десктопов и рабочих станций, где 2 сокета, 4 ядра — предел, более предпочтительно смотрится монокристальный кэш. Всякие квэйки и хафлайфы летать будут. Такой кэш можно делать хотя бы из тех соображений, что где-то, начиная с осени, на Конро в потребительском сегменте ответить будет особо нечем. Но тогда мы получим 2 разных кристалла — серверный и дестопный. В принципе, ничего страшного. U2 А L2 что делать? Тоже как у спарка, общий для ядер? Смысл? 2 уровня внутренней кэш-памяти для ядра это хороший подход. Теоретически, в десктопах, чтобы съэкономить пластину, L2 можно сократить рабочий объем до 512К (его в любом случае придется наращивать физический объем, чтобы разместить тэги L3. Впрочем, если посмотреть внимательно на кэш L2 K8... ). При относительно большом и быстром L3 (особенно, если параллелить запросы в L2 и L3) необходимость в большом L2 отпадает. Для серверов тэги L3 могут съесть еще больше, поэтому кристалл хочешь-не-хочешь получится достаточно большим. Я предполагал, что дискуссия зайдет в тупик. Мы ведь друг друга не убедили Время рассудит...

Автор:	McZag [ 09:17 24.03.2006 ]
Заголовок сообщения:
McZag Я предполагал, что дискуссия зайдет в тупик. Сказал, как отрезал. Так и ветка правильная загнется. На самом деле рассуждения про L3 в К8 в данной ветке полный оффтоп. Предлагаю вернуться к сабжу. Есть что-нибудь новенькое?

Автор:	U2 [ 18:50 24.03.2006 ]
Заголовок сообщения:
McZag Согласен в принципе. Мне непонятно тогда в этой ситуации явление в виде чипсета Horus. Я предполагал, что дискуссия зайдет в тупик. Если в течение суток тишина, значит тупик? Или в надежде на 24/7 саппорт на поднятый сабж? Есть что-нибудь новенькое? NGMA в виде конро либо имеет пока "плохую" имплементацию 64b, либо дезактивирован, если судить по прошедшему ИДФ. Ну это так, типа хоть что-нибудь добавить к сабжу

Автор:	BorisU [ 20:32 24.03.2006 ]
Заголовок сообщения:
Цитата: NGMA в виде конро либо имеет пока "плохую" имплементацию 64b, либо дезактивирован, если судить по прошедшему ИДФ. Откуда такой вывод?

Автор:	U2 [ 22:35 24.03.2006 ]
Заголовок сообщения:
BorisU Откуда такой вывод? А подумать? Где результаты, протестированные в 64б среде? Как там со совместимостью с АМД64? Некогда? Незачем? А вы типа докажите обратное (риторика)? ИДФ — это все-таки не сухой и очередной пресс-релиз. На мероприятиях подобного масштаба можно было бы и считаю даже очень уместным хотя бы из маркетинговых и пр. движущих факторов продемонстрировать работоспособность в выне х64. И это было бы логичным ходом в свете приближающейся оси Виста, кот-ая правда успела намедни задержаться на один квартал-другой. Интелу ничего не стоило бы заявить, показать, что угодно, но дать знать каким-то образом, что все в этом плане у них ОК. А ведь можно было бы не то что до кучи, а прям бить на поле амд, выдав результаты Half-Life 2/64bit, Far Cry/64bit, UT2004/64bit, раскрыв тем самым полностью потенциал. Ведь все равно был бы по идее быстрее в играх, коли в 32б (бумажный пока) лидер. Нет? И почему сервер НР DL380 имеет на борту только 2гига памяти, кот-ый усиленно противопоставлялся сановскому серверу? Вопросы ... вопросы ...

Автор:	Warrax [ 12:48 25.03.2006 ]
Заголовок сообщения:
U2 И почему сервер НР DL380 имеет на борту только 2гига памяти, кот-ый усиленно противопоставлялся сановскому серверу? С таким мосчным процессором ему и двух хватало Больше для 32-битных тестов видимо и не надо было, да и FB-память могла на тот момент еще быть в дефиците... А на спеке НР DL380 G5 в конфигурации c 8x2GB PC2-5300F — http://www.spec.org/osg/cpu2000/results ... 05753.html . Интересно порог ли это для него?

Автор:	Lev Dymchenko [ 22:51 27.03.2006 ]
Заголовок сообщения:
Думаю, что 64битный режим — не проблема сама по себе. Я вообще не ценю и не считаю это сложным, добавление 64 битности. Другое дело, что, например, увеличение размера кода и данных может негативно сказаться на процессорах с небольшим L1 КЭШ несколько сильнее, чем на процессорах с большим КЭШ.

Автор:	Lev Dymchenko [ 22:58 27.03.2006 ]
Заголовок сообщения:
Но вот что известно, это что топовый Сonore 2.66 будет несколько медленне топового Pentium4 в specfp.

Автор:	BorisU [ 23:35 27.03.2006 ]
Заголовок сообщения:
Откуда это известно?

Автор:	Lev Dymchenko [ 23:53 27.03.2006 ]
Заголовок сообщения:
BorisU От Бориса. Вы сами сказали, оперируя различными утечками информации.

Автор:	BorisU [ 23:57 27.03.2006 ]
Заголовок сообщения:
Я такого не говорил

Автор:	Lev Dymchenko [ 00:01 28.03.2006 ]
Заголовок сообщения:
Ну вы сказали, что соотношение specint specfp для conroe какой-то серверный EE, составляет 2800/2500 и conroe 2.66 на 40% быстрее в rates чем Pentium950 3400. Берём калькулятор и считаем, можно обосновнно предположить, что соотношение будет у conroe 2.66 налогичное, по крайне мере, это наилучшая оценка.

Автор:	BorisU [ 00:03 28.03.2006 ]
Заголовок сообщения:
вы с потолка взяли частоты. Неизвестно для какой частоты этои слухи, и для одной ли частоты int и fp

Автор:	Lev Dymchenko [ 00:06 28.03.2006 ]
Заголовок сообщения:
Цитата: вы с потолка взяли частоты. Кто взял с потолка частоты? , это вы взяли. Я взял лучший случай, что слухи для conroe 2.66 если эти слухи для XE, то это не смешно. А 2800/2500 это не так вожно, какой частоты. Один товариш заявил, что вроде из текста точно для топового серверного процессора. А то, что для одной частоты specint и specfp, это понятно. Иначе это будет чушью.

Автор:	BorisU [ 00:19 28.03.2006 ]
Заголовок сообщения:
У вас странные требования к слухам. Да, они могут быть чушью. На то они и слухи.

Автор:	Lev Dymchenko [ 00:22 28.03.2006 ]
Заголовок сообщения:
Цитата: У вас странные требования к слухам. Да, они могут быть чушью. На то они и слухи. Тогда вообще ничего неизвестно, кроме тучи пиара. Хотя, вы доверяете вообще тому, что была сказано на слайдах IDF?

Автор:	Lev Dymchenko [ 00:23 28.03.2006 ]
Заголовок сообщения:
про 40% приемущества в spec int rates?

Автор:	BorisU [ 00:25 28.03.2006 ]
Заголовок сообщения:
Lev Dymchenko Тому, что написано на слайдах — да. Нет никаких оснований считать, что интел будет рисковать своей деловой репутацией.

Автор:	Lev Dymchenko [ 00:29 28.03.2006 ]
Заголовок сообщения:
Ну вот, там результаты очевидно Conroe 2.66 и серверного с 1333 шиной частоты 3000. В осетании со статьей Inquare получаем требуемое.

Автор:	BorisU [ 00:34 28.03.2006 ]
Заголовок сообщения:
Я не знаю, что у вас требуемое, но аргумент слаб насколько я помню, на официальных слайдах про specFP вообще ничего не было.

Автор:	Lev Dymchenko [ 00:37 28.03.2006 ]
Заголовок сообщения:
Требуемое, это оценка specfp для conroe 2.66 значит, вы не верите слуху, который сами распутили про specfp 2500? И той статье в inquare?

Автор:	BorisU [ 00:48 28.03.2006 ]
Заголовок сообщения:
Я слухов не распускал, я их цитировал и не выдавал за абсолютную истину.

Автор:	Lev Dymchenko [ 00:51 28.03.2006 ]
Заголовок сообщения:
Хорошо, тогда можно сказать, что слухи и Inquare это заявляют.

Автор:	U2 [ 17:52 28.03.2006 ]
Заголовок сообщения:
Lev Dymchenko А 2800/2500 это не так вожно, какой частоты. Это цифры скорее всего для Woodcrest = 3GHz

Автор:	Lev Dymchenko [ 19:02 28.03.2006 ]
Заголовок сообщения:
Цитата: Это цифры скорее всего для Woodcrest = 3GHz Вероятно. Надо вспомнить specint/specfp для Pentium2800E. Тогда можно легко дать хорошую оценку specfp для Conroe 2.66

Автор:	Alex P [ 09:55 02.04.2006 ]
Заголовок сообщения:
Некоторые мысли про конро получают некоторое подтверждение http://www.overclockers.ru/hardnews/21827.shtml Цитата: Мы уже слышали о возможности разгона процессоров Conroe до 4.0 ГГц с использованием воздушного охлаждения, и наши единомышленники с указанного форума частично подтверждают эти данные. Заметим, что работающий на такой частоте процессор Conroe способен демонстрировать уверенное преимущество над многими собратьями и конкурентами. Номинальные частоты процессоров Conroe не превысят 3.33 ГГц. Значит, конро будет иметь значительный частотный потенциал со всеми вытекающими Если так, то со значительной долей уверенности можно продолжать настаивать на том, что равночастотный с оптероном конро с кешем 2 Мб будет либо несколько его медленнее либо на уровне (имеется ввиду обобщенный рейтинг по всем приложениям), а конро с кешм 4Мб будет несколько его опережать — процентов на 10, опять таки в виде усредненного итога по запуску набора приложений

Автор:	BorisU [ 10:03 02.04.2006 ]
Заголовок сообщения:
Alex P Цитата: то со значительной долей уверенности Высосанной из пальца?

Автор:	Alex P [ 10:35 02.04.2006 ]
Заголовок сообщения:
BorisU Высосанной из пальца? Высосанной из пальца может быть лишь уверенность в суперском преовсходстве конро во всех приложениях на корню скорее всего будет где то быстрее, где то медленнее. Конро- существенно более ВЧ процессор, нежели чем дотан, одно это уже дает основание сомневаться в безоговорочном превосходстве

Автор:	BorisU [ 10:41 02.04.2006 ]
Заголовок сообщения:
для выводов нужны факты. У вас их нет.

Автор:	Alex P [ 10:44 02.04.2006 ]
Заголовок сообщения:
BorisU У меня есть дотан и результаты его ставнительных тестов на частотах 2.6-2.8 ГГц сравнительно с равночастотными оптеронами. конро лучше, но это даст эффект далеко не во всех приложениях.

Автор:	BorisU [ 10:53 02.04.2006 ]
Заголовок сообщения:
Alex P Цитата: конро лучше, но это даст эффект далеко не во всех приложениях. Вот как? Ну расскажите на каких не даст, по-вашему. И почему.

Автор:	Alex P [ 11:19 02.04.2006 ]
Заголовок сообщения:
BorisU Подождем немного результатов независимых тестов- вы считаете, что можно делать выводы на основании результатов, подготовленных PR отделм интела? я не уверен касательно конроя во многом, включая уже имеющиеся некоторые результаты тестов, (пройдите по ссылкам этой темы) касательно кодирования и декодирования. Те же результаты превосходства при запуске соответствующих оптитмизированных приложений можно получить и на Р4

Автор:	BorisU [ 11:28 02.04.2006 ]
Заголовок сообщения:
Цитата: касательно кодирования и декодирования. Те же результаты превосходства при запуске соответствующих оптитмизированных приложений можно получить и на Р4 чего-то не получается у ананда такие же получить http://www.anandtech.com/cpuchipsets/sh ... =2725&p=10

Автор:	Alex P [ 11:36 02.04.2006 ]
Заголовок сообщения:
Там только три приложения с неизвестно какими настройками, кое где в этих приложениях, как всегда по версии интела, Р4 обгоняет атлон фх

Автор:

BorisU [ 11:40 02.04.2006 ]

Заголовок сообщения:

Alex P

Цитата:
с неизвестно какими настройками

С одинаковыми очевидно

Цитата:
Р4 обгоняет атлон фх

А Conroe обгоняет P4. 128bit FPU не просто так сделали

Автор:	Alex P [ 17:40 02.04.2006 ]
Заголовок сообщения:
BorisU С одинаковыми оче И что? запустите на 4 Мб конро винрар с 4 Мб словарем и очевидно что оптерон с кешем 1 Мб гарантированно будет повержен 128bit FPU не просто так сдела FPU абстрактное понятие в зависмости от используемого приложения. не везде даст эффект превосходства, т.е. не на любых приложениях

Автор:

BorisU [ 17:45 02.04.2006 ]

Заголовок сообщения:

Alex P

Цитата:
И что? запустите на 4 Мб конро винрар с 4 Мб словарем и очевидно что оптерон с кешем 1 Мб гарантированно будет повержен

Думаете только от кэша зависит? сравните P4 и K8.

Цитата:
FPU абстрактное понятие в зависмости от используемого приложения. не везде даст эффект превосходства, т.е. не на любых приложениях

Мы о кодировании или как? В кодировании IMHO играет именно вполне конкретное улучшение FPU. Но это не единственное улучшение в NGMA.

Автор:	paska [ 18:57 02.04.2006 ]
Заголовок сообщения:
Alex P Цитата: И что? запустите на 4 Мб конро винрар с 4 Мб словарем и очевидно что оптерон с кешем 1 Мб гарантированно будет повержен А почему мы сравниваем Conroу с K8, давайте сравнивать с K8L В дополнении. Может 7Zip или WinACE приплетем разные алгоритмы, совершенно разные результаты на разных платформах.

Автор:	Alex P [ 19:44 02.04.2006 ]
Заголовок сообщения:
paska А почему мы сравниваем Conroу с K8, давайте сравнивать с K8L Дело в том, что архитектуру К8 АМД создавала и оттачивала без перерыва много лет, и я не верю, что вот пришел Интел и за пару лет или меньше сваял подобную архитектуру, в полтора раза более эффективную. Другое дело, что во времена проектирования К8 было еще дороговато и нецелесообразно делать на кристалле громадный кеш, и сейчас на базе новых технологий и техпроцессов интел пытается извлечь из этого максимальную пользу, ну дак и выигрыш будет тоже имхо так сказать специфичен (наверное, имхо легко заметить, что упор в новой архитектуре интел делает именно на громадный для бытовых процессоров кеш, превышающий используемый в аналогичной архитектуре даже не для настольных процессоров конкурента в 4 раза!) Может 7Zip или WinACE приплетем разные алгоритмы, совершенно разные результаты на разных платформах. Вот вот. осталось ждать совсем немного, посмотрим, придется ли мне есть свою шляпу

Автор:	Alex P [ 19:53 02.04.2006 ]
Заголовок сообщения:
BorisU Думаете только от кэша зависит? сравните P4 и K8. выше я написал про кеш. очевидно, без огромного кеша новая архитектура неработоспособна относительно конкурента, несмотря на схожесть. ну а кеш у Р4 с К8 сравнивать бессмысленно- слишком разные архитектуры Мы о кодировании или как? В кодировании IMHO играет именно вполне конкретное улучшение FPU я имел ввиду, что хотелось бы получить подпробные деталировки тестов, а не просто их некие результаты

Автор:	BorisU [ 19:54 02.04.2006 ]
Заголовок сообщения:
Цитата: и я не верю понятно, имеет место религиозная вера в AMD.

Автор:	BorisU [ 19:55 02.04.2006 ]
Заголовок сообщения:
Цитата: очевидно, без огромного кеша новая архитектура неработоспособна относительно конкурента Откуда это очевидно?

Автор:	Alex P [ 20:00 02.04.2006 ]
Заголовок сообщения:
BorisU Откуда это очевидно? Это очевидно из самого размера кеша надеюсь, вы не будете оспаривать то, что интел умеет считать деньги, и если бы новая архитектура была великолепна, то интел бы не разбрасывался площадью своих подложек?

Автор:	Alex P [ 20:03 02.04.2006 ]
Заголовок сообщения:
BorisU и я не верю — понятно, имеет место религиозная вера в AMD. Видите, вы выхватили кусок из текста и его комментируете там еще кое что было добавлено в некоторое обоснование, кроме слов о вере, вы не находите? Я могу развлечься намного интереснее, чем вы, если сейчас начну выхватывать куски фраз из того, что вы написали, несмотря на всю их краткость

Автор:

BorisU [ 20:08 02.04.2006 ]

Заголовок сообщения:

Alex P

Цитата:
Это очевидно из самого размера кеша надеюсь, вы не будете оспаривать то, что интел умеет считать деньги, и если бы новая архитектура была великолепна, то интел бы не разбрасывался площадью своих подложек?

Несомненно, но кто вам вам сказал, что увеличение кэша это единственная причина роста скорости. У них более тонкий техпроцесс, чем у конкурента, и более плотный кэш. Они могут себе позволить такой размер.

Цитата:
Видите, вы выхватили кусок из текста и его комментируете там еще кое что было добавлено в некоторое обоснование, кроме слов о вере, вы не находите?

Аргументов не вижу.

Автор:	Alex P [ 20:25 02.04.2006 ]
Заголовок сообщения:
BorisU но кто вам вам сказал, что увеличение кэша это единственная причина роста скорости все остальное присутствует у АМД в оттточенном за много лет виде. кстати, а где я говорил, что "кеш это это единственная причина роста скорости"? это ваши слова, а у меня было "без огромного кеша новая архитектура неработоспособна относительно конкурента" или если хотите, неконкурентоспособна У них более тонкий техпроцесс, чем у конкурента, и более плотный кэш. Они могут себе позволить такой размер. я об этом писал чуть выше Аргументов не вижу. И я ваших, в таком случае

Автор:	BorisU [ 20:33 02.04.2006 ]
Заголовок сообщения:
Цитата: все остальное присутствует у АМД в оттточенном за много лет виде. да? Покажите мне, где у AMD есть 4х кратный запуск, macrofusion, 128bit fpu, memory disambiguation.

Автор:	McZag [ 09:37 04.04.2006 ]
Заголовок сообщения:
BorisU Покажите мне, где у AMD есть 4х кратный запуск, macrofusion, 128bit fpu, memory disambiguation. 1. 4х кратный запуск — чего нет, того нет 2. macrofusion — пока это не более чем термин. OoO планировщик создает оптимальную [с его точки зрения] последовательность инструкций, которую с неменьшим успехом можно назвать macrofusion. Сдваивание некоторых простейших операций давно напрашивающийся эволюционный этап развития микроархитектур. И дополнительная лазейка оптимизирующим под конкретную архитектуру компиляторам. 3. 128bit fpu — ? Не знаю, как именно это звучало на презентации Интел, но однотактный SSE блок это не 128bit fpu. Причем нигде не указывалось (или я пропустил ), какая именно характеристика длительности операции имеется ввиду. 4. memory disambiguation — Интел всегда выжимал максимум из предсказаний, кэшей и агрессивных префетчей (читай при работе с памятью). Сейчас, по косвенной информации убедившись в том что конкурент будет использовать аналогичную технологию, дал маркетинговое название. Имхо. Очень хочется увидеть тесты Conroe с 2МВ кэшем, чтобы увидеть что именно и на каких приложениях дают перечисленные вами новшества Conroe

Автор:

BorisU [ 10:10 04.04.2006 ]

Заголовок сообщения:

Цитата:
И дополнительная лазейка оптимизирующим под конкретную архитектуру компиляторам.

Причем тут компилятор? что на других компиляторах не будет cmp+jmp?

Цитата:
Не знаю, как именно это звучало на презентации Интел, но однотактный SSE блок это не 128bit fpu

А может вам все-таки посмотреть?

NGMA запускает каждый такт 2 128bit SSE команды — не считая move.

Цитата:
Сейчас, по косвенной информации убедившись в том что конкурент будет использовать аналогичную технологию, дал маркетинговое название.

У конкурента есть что-то борющееся с проблемой load after store?

Автор:	Ivan Andreevich [ 08:42 05.04.2006 ]
Заголовок сообщения:
http://www.xtremesystems.org/forums/sho ... hp?t=95021 :up::up:

Автор:	Warrax [ 09:00 05.04.2006 ]
Заголовок сообщения:
Ivan Andreevich http://www.xtremesystems.org/forums/showthread.php?t=95021 :up::up: Voltage 3.072v??? Integer/SSE4 быстрая (L2 4M), а вот в Floating-Point уступает даже Х2 4000+

Автор:	BorisU [ 09:10 05.04.2006 ]
Заголовок сообщения:
Warrax Цитата: а вот в Floating-Point уступает даже Х2 4000+ Это по сандре что-ли?

Автор:	Ivan Andreevich [ 09:23 05.04.2006 ]
Заголовок сообщения:
Warrax Voltage 3.072v??? Сандра не знает материнку. В SuperPi 1M он = Athlon FX-57 @ 3.8 GHz

Автор:	McZag [ 10:00 05.04.2006 ]
Заголовок сообщения:
BorisU Причем тут компилятор? что на других компиляторах не будет cmp+jmp? Я не имел ввиду конкретную реализацию в Conroe. Я даже использовал слово ПОКА, чтобы подчеркнуть, что текущая реализация первая ласточка и macrofusion пока только красивое слово, за которым, надо признать, есть будущее развитие микроархитектур с определенными последствиями А может вам все-таки посмотреть? NGMA запускает каждый такт 2 128bit SSE команды — не считая move. А может ВАМ все-таки посмотреть? x86 процессоры имеют throughput 1ой 128бит [атомарной] инструкции за 2 такта, а Conroe 2 за 1 такт? В 4 раза быстрее любых других x86... Или вы имели ввиду, что в одном такте стартуют 2 64битные половинки некоторых 128битных инструкций SSE (кстати, вопрос — каких?). Или 2 инструкции с двух ядер? Или просто удвоили производительность (чего-то)? Может быть все-таки речь идет о новом исполнительном блоке, висящем на пайпе FPU, который отвечает за выполнение некоторых 128bit SSE команд с пропускной способностью 1 инструкция за 1 такт? У конкурента есть что-то борющееся с проблемой load after store? Это было ИМХО. Технология определения ложных зависимостей чтения/записи, использования агрессивных префетчей, в том числе при косвенной адресации, — закрытые от глаз технологии. О них мало говорят и еще меньше пишут. Если Интел счел нужным публично заявить и даже "нарисовать" принципиальную схему работы НОВОЙ, как вы утверждаете, технологии, значит она либо а) не такая уж она и новая, б) конкурент обладает соответствующими патентами и близок к тому чтобы реализовать это в своих процессорах. ИМХО.

Автор:

BorisU [ 10:13 05.04.2006 ]

Заголовок сообщения:

McZag

Цитата:
x86 процессоры имеют throughput 1ой 128бит [атомарной] инструкции за 2 такта

Вдвое выше.

Цитата:
В 4 раза быстрее любых других x86...

в 2

Ну посмотрите, наконец, статью на RWT и интеловский pdf.

Автор:	vadiml [ 10:53 05.04.2006 ]
Заголовок сообщения:
вот тоже на оверах — расчет Super PI mod 1.4 для Conroe http://www.overclockers.ru/hardnews/21883.shtml если тут никакой брехни нет, то становится очень интересно

Автор:	McZag [ 13:28 05.04.2006 ]
Заголовок сообщения:
BorisU Вдвое выше. ОК. Я понял, что мы говорим о разных вещах. Впрочем, посыпаю голову пеплом — внимательно поизучав таблицы латентностей инструкций для разных архитектур, обнаружил, что параллелящихся 128битных инструкций с пропускной способность 1/1 значительно больше, чем я ожидал. в 2 Допустим. (Это означает, что я принял вашу мысль к сведению, но так не считаю — наличие возможности запустить 2 определенные 128битные инструкции в одном такте не означает 4 DP инструкции за такт в реальной жизни). Заметьте, я исходно возразил против понятия 128-битного FPU, основываясь, кстати, не на собственных догадках, а на официальной информации (маркетинговых терминах и кратком описаний нововведений) от Интел. Ну посмотрите, наконец, статью на RWT и интеловский pdf. Посмотрел. Статья предствляет собой очень сомнительное чтиво, которое правится по сходу пьесы. К выходу Конро, наверно, она будет почти соответствовать предмету описания. Интеловский pdf посмотрю, если ссылкой одарите. Впрочем, я почитал достоточно много пост-IDF-документов от Интел (может среди них и ваш pdf попадался). Борис, я не интелофоб, как это может показаться из моих постингов. Это просто попытка критически оценить происходящее.

Автор:

BorisU [ 14:01 05.04.2006 ]

Заголовок сообщения:

McZag

Цитата:
наличие возможности запустить 2 определенные 128битные инструкции в одном такте не означает 4 DP инструкции за такт в реальной жизни

Несомненно — это peak на хорошем коде. Точно так же как для предыдущих архитектур peak это 2. Инструкции вполне определенные — ADD и MUL поровну.

Цитата:
я исходно возразил против понятия 128-битного FPU, основываясь, кстати, не на собственных догадках, а на официальной информации

В PS_MATS001_278703_125-1_FIN_v1.pdf на странице 29 написано про 128 bit

Автор:	McZag [ 08:40 07.04.2006 ]
Заголовок сообщения:
BorisU Несомненно — это peak на хорошем коде. Возможно в медиакодировании и можно получить цифру близкую к 2 (я плохо знаком с алгоритмамами медиакодирования, поэтому допускаю, что именно там это возможно). Но не любом реальном вычислительном коде. Там будет очень хорошо, если вы в среднем превзойдете 1, и совсем замечательно, если самые плотные циклы будут работать 1.2-1.5. Это не означает, что нельзя получить еще бОльшую IPC. Но потратить жизнь на написание нескольких сверхплотных циклов, заточенных под конкретную архитектуру, согласитесь, не очень умно. Инструкции вполне определенные — ADD и MUL поровну. Вы видимо имели ввиду одновременный запуск на FADD и FMUL. Причем не умножения, а простейших операций (например, побитных). Даже при условии запуска на каждом такте, умножение имеет большую латентность и даже в теории процессор не сможет создать исходящий поток 2 инструкции за такт. Есть и другие физические ограничения. Например, для Conroe, если верить статье на RWT, используется 128 битная двунаправленная шина L1D. Это достаточно много, чтобы почти всегда хватало. Но именно тогда, когда вам покажется, что заветные 4DP на каком-то участке кода у вас в кормане, вы упретесь именно в нее. Или еще куда-нибудь Пока нет нормального мануала по Conroe, трудно давать какие-то оценки возможностей этого процессора. То что он быстрее всех предшественников x86 не вызывает сомнения. Но вот насколько, это вопрос.

Автор:	Lev Dymchenko [ 00:34 08.04.2006 ]
Заголовок сообщения:
а как Boris_U прокомментирет тесты в super_pi, где, якобы был выбран 1M, который весь может помещаться в КЭШ, а на дрегих процессорах-нет, что может дать любое ускорение. Что будет, если выбрать 32? Аналогичное соотношение производительности?

Автор:	BorisU [ 01:03 08.04.2006 ]
Заголовок сообщения:
Lev Dymchenko А может вам пойти и посмотреть самому, а не искать фигу в кармане? Там есть и 32.

Автор:	Lev Dymchenko [ 02:18 08.04.2006 ]
Заголовок сообщения:
BorisU Да? А я тему соседнюю читал, там ничего про это не было. Просто, интересно, заодно, если известен характер требований к памяти у super_pi, можно оценить кэше зависимость. Я вообще не понимаю, откуда взялся этот тест.

Автор:	BorisU [ 11:38 08.04.2006 ]
Заголовок сообщения:
Читать надо оригинал. Там на первой же странице результаты в super_pi. А что за тест — фиг знает, оверклокеры его любят

Автор:	Lev Dymchenko [ 13:03 08.04.2006 ]
Заголовок сообщения:
В оригинале сравнения с Athlon в super_Pi 32 не нашел, надо, видимо, дополнительно знать результат наизусть. А, например, в пресловутом ScienceMark в 4 тестах из 6 Conroe 2.4 несколько проигрывает Athlon 2.7 (вроде, у того athlon такая частота) Зато в других двух выигрывает сильно и средний бал несколько выше.

Автор:	BorisU [ 13:05 08.04.2006 ]
Заголовок сообщения:
пресловутый sciencemark не использует SSE

Автор:	Lev Dymchenko [ 13:05 08.04.2006 ]
Заголовок сообщения:
Какая была бы картина, если бы на IDF сравнили в ScienceMark? 2.66 против чего там было? 2.8? Где-то уверенный выигрыш, где-то небольшой проигрыш или равенство.

Автор:	Lev Dymchenko [ 13:06 08.04.2006 ]
Заголовок сообщения:
Цитата: пресловутый sciencemark не использует SSE Наверняка, но не все программы его используют, SSE. Думаю, кстати, дело не в этом.

Автор:	Lev Dymchenko [ 13:07 08.04.2006 ]
Заголовок сообщения:
Ну и что, что не использует? Что, для двойного умножения и сложения за такт нужны только упакованные SSE? А просто скалярные не будут, странно, если так.

Автор:

BorisU [ 13:10 08.04.2006 ]

Заголовок сообщения:

Цитата:
Наверняка, но не все программы его используют, SSE

Если хотеть выжать из процессора максимум — надо использовать.

Цитата:
Думаю, кстати, дело не в этом.

А я вот думаю что именно в этом. x87 код вообще не использует половину FPU у Conrое.

Автор:	Lev Dymchenko [ 13:10 08.04.2006 ]
Заголовок сообщения:
Была, конечно, оптимизированная версия ScinceMark от Intel, интересно и на ней сравнить. Но необязательно, что относительный результат будет в пользу controe.

Автор:	BorisU [ 13:11 08.04.2006 ]
Заголовок сообщения:
Цитата: Что, для двойного умножения и сложения за такт нужны только упакованные SSE? А как вы хотели? порт-то один

Автор:

Lev Dymchenko [ 13:12 08.04.2006 ]

Заголовок сообщения:

Цитата:
А я вот думаю что именно в этом. x87 код вообще не использует половину FPU у Conrое.

А что вы понимаете под x87 кодом? А что SM не откомпилирован в скалярном SSE?

Цитата:
Если хотеть выжать из процессора максимум — надо использовать.

Не везде это возможно в принципе, оправдано и т.п. если говорить о векторном SSE.

Автор:	Lev Dymchenko [ 13:14 08.04.2006 ]
Заголовок сообщения:
Цитата: А как вы хотели? порт-то один Это я не понял, плохо, если так, как вы говорите. Скорее, все-таки нет. Ну какая ему разница, addps mulps или addss mulss?

Автор:

BorisU [ 13:21 08.04.2006 ]

Заголовок сообщения:

Цитата:
А что вы понимаете под x87 кодом? А что SM не откомпилирован в скалярном SSE?

Нет. AFAIK он откомпилирован древним VC6 под X87. SSE используется только в BLAS вроде — там asm.

Цитата:
Не везде это возможно в принципе, оправдано и т.п. если говорить о векторном SSE.

Дать компилятору ключик сложно?

Цитата:
Скорее, все-таки нет

Порт к FADD один. и к FMUL один.

Автор:

Lev Dymchenko [ 13:26 08.04.2006 ]

Заголовок сообщения:

Цитата:
Дать компилятору ключик сложно?

Для векторизации это почти не поможет. Говорилось-то о векторном SSE.

Цитата:
Порт к FADD один. и к FMUL один.

Причем тут это? Так или иначе, если вы правы, и addps mulps "спариваются", а addss mulss — нет, то на скалярном коде controe будет показывать относительно худшие результаты, чем на векторном. А его, этого скалярного кода, полно. Например, в specfp.

Автор:	Lev Dymchenko [ 13:30 08.04.2006 ]
Заголовок сообщения:
Цитата: Нет. AFAIK он откомпилирован древним VC6 под X87. SSE используется только в BLAS вроде — там asm. Это не хорошо, если это — правда. Даже не верится, уже же версия 2.0.

Автор:

BorisU [ 13:34 08.04.2006 ]

Заголовок сообщения:

Цитата:
Для векторизации это почти не поможет. Говорилось-то о векторном SSE.

Еще как поможет. Только компилятор надо правильный

Цитата:
Причем тут это?

при том, что за такт можно запустить 1 умножение и 1 сложение. неважно скалярные или векторные.

Цитата:
его, этого скалярного кода, полно. Например, в specfp.

в specfp код на с и fortran. что из него сделает компилятор — то и будет.

Автор:

Lev Dymchenko [ 13:43 08.04.2006 ]

Заголовок сообщения:

Цитата:
при том, что за такт можно запустить 1 умножение и 1 сложение. неважно скалярные или векторные.

Теперь вы повторили мою мысль. Ваша изначальная была, что или, а не и, и поэтому такие результаты на скалярном коде.

Цитата:
в specfp код на с и fortran. что из него сделает компилятор — то и будет.

В specfp ускорение от SSE2 есть, но не сказать, что очень очень большое и на всех тестах. Собственно, оно известно. Половина, как минимум, тестов не поддается.

Автор:	BorisU [ 13:48 08.04.2006 ]
Заголовок сообщения:
Цитата: Ваша изначальная была, что или, а не и у меня такого не было. Это ваша неправильная интепретация.

Автор:	Lev Dymchenko [ 13:50 08.04.2006 ]
Заголовок сообщения:
Цитата: Цитата: -------------------------------------------------------------------------------- Что, для двойного умножения и сложения за такт нужны только упакованные SSE? -------------------------------------------------------------------------------- А как вы хотели? порт-то один Как это ещё интерпретировать?

Автор:	Lev Dymchenko [ 13:52 08.04.2006 ]
Заголовок сообщения:
Вообщем, ваша версия того, что в SM на четырех из 6 тестов выигрывает Athlon заключается в том, что в SM нет скалярного SSE, а x87 Conroe почему-то хуже обрабатывает, чем athlon.

Автор:	BorisU [ 13:59 08.04.2006 ]
Заголовок сообщения:
Lev Dymchenko Цитата: а x87 Conroe почему-то хуже обрабатывает, чем athlon. примерно одинаково, но частота у conroe меньше.

Автор:	Lev Dymchenko [ 14:00 08.04.2006 ]
Заголовок сообщения:
Цитата: примерно одинаково, но частота у conroe меньше. То есть, выигрыш от упакованного SSE на Conroe больше почему-то, чем у Athlon? И почему?

Автор:	Lev Dymchenko [ 14:01 08.04.2006 ]
Заголовок сообщения:
Цитата: примерно одинаково, но частота у conroe меньше. Имелось в виду, относительные величины. Частота и на скалярном SSE сказывается.

Автор:	BorisU [ 14:07 08.04.2006 ]
Заголовок сообщения:
Цитата: То есть, выигрыш от упакованного SSE на Conroe больше почему-то, чем у Athlon? У меня складывается ощущение, что вы не умеете читать Сколько раз надо написать, что у Conroe FPU 128 bit?

Автор:	Lev Dymchenko [ 14:10 08.04.2006 ]
Заголовок сообщения:
Цитата: Сколько раз надо написать, что у Conroe FPU 128 bit? Хотелось уточнить. Тогда на скалярном коде conroe будет показывает относительно меньший прирост, чем на векторном. Вот видны предпочтительные и не очень задачи.

Автор:	Lev Dymchenko [ 14:14 08.04.2006 ]
Заголовок сообщения:
Наверное, на моей рейтрейсерной программе будет быстро работать, там сплошное SSE. В RM тоже векторное SSE.

Автор:	chavv [ 09:11 10.04.2006 ]
Заголовок сообщения:
http://sharikou.blogspot.com/ этого видели? Пожалуй стоит научить какие бинарники юзались

Автор:	GNUS inc [ 09:42 10.04.2006 ]
Заголовок сообщения:
Cache does matter

Автор:	matik [ 10:26 10.04.2006 ]
Заголовок сообщения:
chavv этого видели? Нет, не видели. Интересно. Уже хочется самому сравнить два процессора

Автор:	McZag [ 11:06 10.04.2006 ]
Заголовок сообщения:
chavv Этот парень очень зло настроен. Я читал его восклицания еще во время IDF. Надо осторожно относится к его расчетам и выводам. Впрочем, уже только ленивый не сказал про 4МВ кэш Conroe. Надо дождаться официальных цен, 2МВ-версии и делать какие-то выводы. matik Уже хочется самому сравнить два процессора С возвращением Каких два процессора?

Автор:	chavv [ 11:54 10.04.2006 ]
Заголовок сообщения:
Цитата: Intel has about a dozen production FABs, however, most of Intel's FABs are oudated. Only four Intel production FABs are capable of running at 90nm or 65nm*. To be more specific, Intel has only two 65nm production FABs and two 90nm production FABs взято с того же сайта, дата 30.03.2006 Кто-то может подтвердить/опровергнуть это?

Автор:	Lev Dymchenko [ 12:19 10.04.2006 ]
Заголовок сообщения:
Интересно, что сторонники conroe и незвависимые наблюдатели скажут по поводу Intel-optimized версии scienceMark? я помню, на сайт Intel была оптимизированная версия SM, но это, вроде, не она. А то, что athlon в некоторых приложениях будет все равно быстрее, это очевидно безо всякого блога, просто КЭШ не может полностью нивелировать отсутствие контроллера памяти. Там, где важна латентность досупа к не локальным данным.

Автор:	GNUS inc [ 12:49 10.04.2006 ]
Заголовок сообщения:
chavv http://www.intel.com/pressroom/archive/ ... 02corp.htm Intel’s other facilities that manufacture using 300mm wafers are Fab 11X in New Mexico, D1D and D1C in Oregon, and Fab 24 in Ireland. + Fab 12 Итого 5 фабрик по современным техпроцессам (0.09 и ниже). Остальные — по 0.18 и выше.

Автор:	BorisU [ 15:32 10.04.2006 ]
Заголовок сообщения:
Цитата: Интересно, что сторонники conroe и незвависимые наблюдатели скажут по поводу Intel-optimized версии scienceMark? Для начала надо знать, что там оптимизировано. А то версий дофига, чем отличаются — непонятно.

Автор:	Lev Dymchenko [ 15:42 10.04.2006 ]
Заголовок сообщения:
Точно. Интересно, в этой оптимизированной якобы версии откомпилировано с соответствующими ключами? Думаю, это и есть оптимизация.

Автор:	TyyOx91 [ 19:27 10.04.2006 ]
Заголовок сообщения:
Lev Dymchenko Цитата: Точно. Интересно, в этой оптимизированной якобы версии откомпилировано с соответствующими ключами? Думаю, это и есть оптимизация. Коментарии автора программы: http://www.aceshardware.com/forums/read ... &forumid=1 Интересно, что MolDyn использует х87 код, а BLAS — SSE код. В обоих случаях Conroe выигрывает с хорошим отрывом.

Автор:	Lev Dymchenko [ 20:36 10.04.2006 ]
Заголовок сообщения:
Так интересно там, где Conroe проигрывает. Какой там код? И какая версия тестилась.

Автор:	Lev Dymchenko [ 20:40 10.04.2006 ]
Заголовок сообщения:
Хотя те синтетические тесты памяти можно не считать, конечно. проигрывает почему-то в некотой криптографии, хотя там нет SSE вообще.

Автор:	Lev Dymchenko [ 20:41 10.04.2006 ]
Заголовок сообщения:
А больше я не понял, в чем он проигрывает, там 6 разноплановых тестов. Смесь всех тестов, какие есть.

Автор:	Lev Dymchenko [ 20:42 10.04.2006 ]
Заголовок сообщения:
Но приемущество conroe не оосбенно велико в некоторых вычислительных под тестах.

Автор:	Lev Dymchenko [ 20:43 10.04.2006 ]
Заголовок сообщения:
Как обяъснили, потому, что там нет полного SSE, которое по сравнению со скалярным лучше реализовано, чем на athlon.

Автор:	matik [ 22:00 10.04.2006 ]
Заголовок сообщения:
Lev Dymchenko проигрывает почему-то в некотой криптографии, хотя там нет SSE вообще. Зато там есть множество операций с целыми числами высокой разрядности, которые А64 делает весьма быстро. Потому, имхо, Conroe и проигрывает.

Автор:	Lev Dymchenko [ 22:31 10.04.2006 ]
Заголовок сообщения:
Видимо, так. А это была не 64 битная версия? значит, какие-то особенности более эффективной реализации этих операций.

Автор:	Sikambr [ 22:56 10.04.2006 ]
Заголовок сообщения:
Lev Dymchenko, чтобы добавить фразу в сообщение, можно воспользоватся функцией "изменить".

Автор:	TyyOx91 [ 05:52 11.04.2006 ]
Заголовок сообщения:
Lev Dymchenko Цитата: Так интересно там, где Conroe проигрывает. Какой там код? И какая версия тестилась Ссылка на оригинал: http://vic.expreview.com/read.php?4&part=5 Я бы не сказал что Conroe проигрывает, так как процент проигрыша примерно соответствует процентной разнице в частоте относительно референсного Athlon64 Х2. Кроме того инженерный экземпляр Conroe тестился на инженерном экземпляре мат. платы с не самой быстрой памятью при том что как минимум 3 из 4 проигранных тестов сильно зависят от скорости (латентности?) памяти.

Автор:	Lev Dymchenko [ 15:07 11.04.2006 ]
Заголовок сообщения:
Значит, возможно проигрывает из-за памати и или не лучшей настройке памяти. а по поводу разницы в частоте, надо скорее равноценовые процессоры сравнивать. Ну вот какой Athlon будет стоить, как 2.4/4M/2066? Не очень понятен запас частоты у conroe по отношению к Athlon. Есть ощущение, что цены на более выскочастотные модели растут быстрее, чем у Athlon. Так это или нет?

Автор:	Ivan Andreevich [ 08:55 15.05.2006 ]
Заголовок сообщения:
http://www.xtremesystems.org/forums/sho ... hp?t=99466 Conroe vs Merom.

Автор:	paska [ 09:32 15.05.2006 ]
Заголовок сообщения:
http://www.x86-secret.com/?option=newsd&nid=941 о какой разнице в количестве транзисторов говорят французы?

Автор:	Ivan Andreevich [ 20:00 15.05.2006 ]
Заголовок сообщения:
ссылка У ёнах нет ECC L2?

Автор:	matik [ 20:30 15.05.2006 ]
Заголовок сообщения:
У ёнах нет ECC L2? Похоже, что нет. С другой стороны, на том рынке, куда он позиционируется, это вполне допустимо: все равно действительно ответственные приложения никто на ноутах не гоняет.

Автор:	TyyOx91 [ 21:01 15.05.2006 ]
Заголовок сообщения:
Ivan Andreevich Цитата: У ёнах нет ECC L2? Бред сивой кобылы. Посчитали количество транзисторов в кэше, вычли из общего количества и поделили на два — не сошлось — решили что нет ECC . Кто нибудь там догадался подсчитать, например, количество транзисторов в BIU (Bus Interface Unit — не маленький такой), который там теперь общий на два ядра. А сколько транзистров в I/O, которое тоже не сильно изменилось? Вобщем в сад...

Автор:	paska [ 21:09 15.05.2006 ]
Заголовок сообщения:
TyyOx91 на самом деле у этого ресурса очень хорошие контакты внутри корпораций

Автор:	matik [ 21:36 15.05.2006 ]
Заголовок сообщения:
TyyOx91 Кто нибудь там догадался подсчитать, например, количество транзисторов в BIU (Bus Interface Unit — не маленький такой), который там теперь общий на два ядра. А сколько транзистров в I/O, которое тоже не сильно изменилось? Вобщем в сад... А чем, простите, отличается BIU в Dothan-е и Yonah-е, если оба этих процессора используют одну и ту же шину? Сумеете найти отличий на десяток миллионов транзисторов? Извините, пока французы выглядят убедительней Вашей критики.

Автор:

TyyOx91 [ 07:08 16.05.2006 ]

Заголовок сообщения:

matik

Цитата:
А чем, простите, отличается BIU в Dothan-е и Yonah-е, если оба этих процессора используют одну и ту же шину?

В том то и дело, что практически ничем (только арбитражной логикой). В своих подсчётах они исходили, что Yonah имеет по BIU на ядро, но на самом деле он то один

Цитата:
Извините, пока французы выглядят убедительней Вашей критики.

Ну ладно, рассмотрм это более внимательно.
1. Подсчёт ECC.
a) Французы почему-то решили, что каждый байт в кэше имеет дополнительный бит ECC, хотя ECC "ставят" только на сигнальные линии. То есть код ECC вычисляется перед отправкой пакета и посылается вместе с пакетом, а на "той стороне" декодируется и используется для верификации пакета.
б) Допустим, что кэш имеет дополнительные ячейки для хранения ECC информации. Тогда не понятно почему французы решили что на каждый байт информации приходится бит ECC. Это было бы верно, если бы шина кэша была бы 64-битной, но она 128-битная (256?), а на 128 бит необходимо "всего лишь" 9 бит ECC — опять у французов не сходится

.

2. Подсчёт количества транзисторов ядра.
Французы получили 26.8М для ядра Dothan. Что мы имеем на самом деле:
Banias 1M cache = 77M transistors.
Dothan 2M cache = 140M transistors.
Простейший подсчёт показывает, что на ядро (без L2) приходится порядка 14М транзисторов. Прибавте это число к 140М Дотана и отнимит 2-3М общего BIU и вы получите число транзисторов в Yonah (151.6М)

Автор:	TyyOx91 [ 07:38 16.05.2006 ]
Заголовок сообщения:
Кстати, по рассчётам французов получается, что кэш состоит только из ячеек памяти + ячейка ECC . Про тэги, таймеры, read/write buffers на каждый cache line и всякую другую логику они почему-то забыли.

Автор:	matik [ 23:36 27.05.2006 ]
Заголовок сообщения:
Мда. Оказывается, Интел "немножко" мухлюет в сравнении с Оптеронами In fact, not only the Woodcrest was running 64 bit OS, it costs $158,000 or 47% more than the Opteron system. The Woodcrest system has 64GB RAM and 48 MSA 60 StorageWorks with 576 SAS drives at 15K RPM. The Opteron system has 32GB ram and 18 MSA 30 StorageWorks wtih 380 SCSI drives. There is a huge difference in storage performance between the two. TPC-C is a database benchmark. A database reads data from disk to memory and write data from memory to disk И почему я не слишком удивлен? Однако откровенное паскудство

Автор:	BorisU [ 00:22 28.05.2006 ]
Заголовок сообщения:
А на SPECint тоже диски влияют?

Автор:	matik [ 00:25 28.05.2006 ]
Заголовок сообщения:
BorisU А на SPECint тоже диски влияют? А разве там о SPECintе речь? К тому же Вы не хуже меня знаете, что уж кто-то, а SPECint очень сильно зависит от объема кэша. Там речь как раз о недавней презентации Xeon 5000, где красивые такие столбики... Впрочем, зачем я пересказываю, Вы вроде и сами в состоянии прочитать. TPC-C — один из известнейших тестов БД, и читерство в нем есть показатель полнейшего отчаяния. А ничем подобным, кроме читерства, объяснить такое "сравнение" нельзя.

Автор:	BorisU [ 00:32 28.05.2006 ]
Заголовок сообщения:
matik А разве там о SPECintе речь? А там нашли один тест к которому можно придраться, и придрались. Начисто "забыв" что есть другие. SPECint очень сильно зависит от объема кэша. Многие реальные программы тоже. TPC-C — один из известнейших тестов БД Это один из известнейших полигонов для рекламных манипуляций Кстати это тест не процессоров, а систем. И там в описание входит цена системы.

Автор:	matik [ 00:49 28.05.2006 ]
Заголовок сообщения:
BorisU А там нашли один тест к которому можно придраться, и придрались. Начисто "забыв" что есть другие. Такое впечатление, будто для Вас внове, что достаточно одному тесту из серии оказаться "притянутым за уши", как доверие к остальным тоже исчезает. Наверное, все же, не внове, правда? По крайней мере, если мы говорим о нормальной научной методике. Это один из известнейших полигонов для рекламных манипуляций Кстати это тест не процессоров, а систем. И там в описание входит цена системы. Рекламные манипуляции там, безусловно, есть (в том плане, что все изо всех сил стараются там победить). Но нагло стараются не врать. Здесь именно наглое манипулирование цифрами. После этого можно долго рассказывать о "репутации". Насчет теста систем — спасибо за пояснение, я знаю Многие реальные программы тоже В той же степени, как и SPECint?

Автор:	Ivan Andreevich [ 01:07 28.05.2006 ]
Заголовок сообщения:
http://www.tecchannel.de/specials/english/439566/

Автор:	BorisU [ 01:07 28.05.2006 ]
Заголовок сообщения:
matik В той же степени, как и SPECint? Все зависит от задачи. Где-то кэш вообще не важен, где-то может дать разы. Вот только у Intel большой кэш уже есть, а у AMD нет. И чьи это проблемы?

Автор:	matik [ 01:10 28.05.2006 ]
Заголовок сообщения:
BorisU Вот только у Intel большой кэш уже есть, а у AMD нет. И чьи это проблемы? Да ничьи это не проблемы Всего лишь разные методы добиваться большой производительности А покупатель пусть решает, что ему важнее. Но для этого ему нужны независимые и непредвзятые тесты. С которыми у Intel нынче туго. Собственно, мне не самих тестов жаль. Появятся платформы широко — померяют многие уважаемые обозреватели. Меня очень настораживает, что новую платформу приходится пиарить вот такими вот дешевыми приемами. Это настораживает в том плане, что, похоже, все будет не так радостно, как ожидалось.

Автор:	TyyOx91 [ 16:22 28.05.2006 ]
Заголовок сообщения:
matik Цитата: Однако откровенное паскудство Поробуйте найти на tpc.org лучший результат для любой двухпроцессорной системы от АМД (с двухядерным процессором). Тогда и можно будет обсуждать "паскудство" Интел . Советую, так же зайти на сайт АМД и посмотреть на бенчмарки местного производства. Там вообще идёт сравнение, только с тем, с чем "удобно" сравнивать. Например Itanium "выплывает" только в тех тестах, где слегка уступает Оптерону.

Автор:	BorisU [ 16:27 28.05.2006 ]
Заголовок сообщения:
Врядли Intel сам тестировал Opteron — наверняка взяли опубликованные результаты.

Автор:	TyyOx91 [ 16:29 28.05.2006 ]
Заголовок сообщения:
BorisU Цитата: Врядли Intel сам тестировал Opteron — наверняка взяли опубликованные результаты. Естественно. И это лучший результат для двухсокетной системы от АМД.

Автор:	TyyOx91 [ 16:44 28.05.2006 ]
Заголовок сообщения:
Кстати на двух-сокетную систему от АМД кажется больше 32Гиг не поставишь. Ну а вот лучший результат 4-ядерной системы от АМД (4 процессора, 2.8Ггц, 64Гиг памяти): http://www.tpc.org/tpcc/results/tpcc_re ... =105100104 Всё равно уступает Вудкресту 22%.

Автор:	matik [ 18:53 28.05.2006 ]
Заголовок сообщения:
TyyOx91 Кстати на двух-сокетную систему от АМД кажется больше 32Гиг не поставишь Iwill DK88 — и опля, 16 разъемов для памяти. Берем 4GB модули, и, о чудо, 64GB. Поробуйте найти на tpc.org лучший результат для любой двухпроцессорной системы от АМД (с двухядерным процессором). Тогда и можно будет обсуждать "паскудство" Интел Не притворяйтесь, что перестали понимать, о чем речь. Паскудство Интел не в том, что взяли лучший результат для Оптерона — это как раз нормально. А в том, что, сравнивая свою систему, ИЗНАЧАЛЬНО поставили ее в лучшие условия, поставив больше памяти и дисковых полок. И здесь не надо изображать "чуть-чуть девственниц". Раз взялись делать прямое сравнение с конкурентом, делайте его честно. Советую, так же зайти на сайт АМД и посмотреть на бенчмарки местного производства Их, кстати, уже обсмеяли все, кому не лень. И, кстати сказать, обычно АМД такой откровенной лажи не допускает (хотя и у них бывают сомнительные сравнения).

Автор:	paska [ 19:16 28.05.2006 ]
Заголовок сообщения:
И здесь не надо изображать "чуть-чуть девственниц". Раз взялись делать прямое сравнение с конкурентом, делайте его честно. Первый раз слышу, чтоб matik так ругался. PS фраза звучит чуть-чуть по-другому, а именно "чуть-чуть беременна"

Автор:	TyyOx91 [ 19:37 28.05.2006 ]
Заголовок сообщения:
matik Цитата: А в том, что, сравнивая свою систему, ИЗНАЧАЛЬНО поставили ее в лучшие условия, поставив больше памяти и дисковых полок. Ээ... Это какую такую "свою систему" ? С каких это пор Интел выпускает серверные системы? Система эта от НР, а Интел лишь разместил на своём сайте результаты, которые предоставил НР и которые вы можете увидеть на tpc.org, а заодно и сравнить с другими результатами. http://www.tpc.org/tpcc/results/tpcc_re ... =106052202 Так что все претензии по тестам к НР. Так же все претензии о неравенстве конфигураци тоже к НР (Интел же не виноват, что НР не выпускает системы под оптерон на IWILL DK88 ).

Автор:	TyyOx91 [ 20:20 28.05.2006 ]
Заголовок сообщения:
Кстати вот: http://www.amd.com/us-en/Processors/Pro ... 73,00.html Хочу услышать как вы повозмущаетесь — системы на зионах по 16Гиг памяти, системы на Оптеронах — по 32 Гиг память (кроме самой отсталой). Дисковые массивы на оптеронах тоже побольше. Но самое прикольное, что они сравнил 2 ядра Зиона с 4 ядрами Оптерона (тот который 144% ). На диаграме это кстати не отражено .

Автор:	matik [ 20:53 28.05.2006 ]
Заголовок сообщения:
TyyOx91 С каких это пор Интел выпускает серверные системы? Ой вэй? А что, не выпускает? Хи, а что же они продают в канале?! Система эта от НР, а Интел лишь разместил на своём сайте результаты Ага. А сделал это просто вебмастер без одобрения начальства. Вам интересно заниматься этим словоблудием? Что означает все претензии по тестам к НР? Типа, Интел "случайно мимо проходил, глянь, НР систему на Woodcrest-ах тестирует"? Извините, мне неинтересно обсуждать такие гипотезы. Если Вам охота верить в поголовную дебилизацию всех сплошь сотрудников Интел и НР, дело Ваше. Интел же не виноват, что НР не выпускает системы под оптерон на IWILL DK88 Плохо понимаете, да? Представляете, Интел в этом не виноват. Ага. А еще "Интел не виноват в том, что НР на интеловскую систему поставила 64GB памяти", а не 32GB. Тоже не виновата, да? Поздней ночью в офис НР вломились некие неизвестные злоумышленники, которые и доставили злополучную память в систему. А НР и Интел, они не при чем, они хотели честно померять! Не знаю, кого как, но меня откровенно бесит, когда меня считают идиотозм. А этот вот "маркетинг для идиотов" — это и есть пример великолепного маркетинга от Интел? Тьфу. Хочу услышать как вы повозмущаетесь А в свое время надо было читать форум. Возмущался точно так же, кстати говоря. Эти сравнения не делают АМД чести. И этого никто не скрывал. Написать, что ли, "Особое мнение — 3" про тестовые сравнения?

Автор:	GNUS inc [ 09:34 29.05.2006 ]
Заголовок сообщения:
matik Цитата: Написать, что ли, "Особое мнение — 3" про тестовые сравнения? Ты так давно грозишься, что в это никто не верит

Автор:	VLev [ 09:47 29.05.2006 ]
Заголовок сообщения:
matik писал(а): Написать, что ли, "Особое мнение — 3" про тестовые сравнения? Не, в данном конкретном случае сравнение исключительно корректно произведено. Почему --- тут уже все сказали, но я еще раз соберу все вместе: 1. tpc --- это тест не процессоров, а систем, RAM и диски --- неотъемлимая часть системы, их оптимальный подбор полностью определяется тем, кто проводит тестирование. Основным требованием (ограничением) на конфигурацию системы является лишь наличие в прайсах. В частности, размер памяти и количество дисков --- очень важные составляющие общего результата, потому, вполне естественно, что, для достижения максимального результата их ставят по максимуму. 2. Обе сравниваемые системы --- это системы HP, и именно HP определяет для чего именно использовать результаты своих тестов. Было бы странно, если бы одна из систем вдруг начала конкурировать с другой вместо того, чтобы, дополняя друг друга конкурировать с системами прямых конкурентов HP. Если есть подозрения в неправильной конфигурации Opteron-овой системы, то это вопрос к SUN, к IBM, к Etegro, наконец. В данном конеретном случае одна из систем старая, а другая — новая. Вполне естественно, что новая существенно быстрее старой. 3. Сравнение с другими системами на Opteron показывает, что общий результат для Opteron-ов "упирается" в относительно небольшой кэш, потому увеличение памяти и/или кол-ва дисков существенно увеличат только общую стоимость системы, а не общий результат. Xeon-овая же система при прекрасной производительности имеет вполне пристойную стоимость, что отражается и на дешевом tpc. В общем, и сам результат вполне закономерен, и использован Intel-ом вполне корректно. IMHO

Автор:	matik [ 11:04 29.05.2006 ]
Заголовок сообщения:
GNUS inc Ты так давно грозишься, что в это никто не верит Меня подначивают, или мне показалось? VLev бе сравниваемые системы --- это системы HP, и именно HP определяет В этом месте мне смешно Извини, ты действительно думаешь, что перед НР поставили задачу "корректно сравнить две конфигурации"? Перед инженерами НР поставили задачу "гарантированно выиграть с большим преимуществом". Это чуток другое, правда? Было бы странно, если бы одна из систем вдруг начала конкурировать с другой вместо того, чтобы, дополняя друг друга конкурировать с системами прямых конкурентов HP Прошу прощения, но с НР как раз все понятно. Ей прямая конкуренция между собственными моделями не нужна. Весь вопрос в том, насколько корректно со стороны Интел пользоваться этим результатом. Если у них такая чудесная платформа, никаких проблем быть не должно: берем максимально близкие по конфигурации системы, и демонстрируем, что "наш феншуй — самый правильный феншуй". Если же публично сравнивают столь разные системы — выглядит это откровенно некорректно. Основным требованием (ограничением) на конфигурацию системы является лишь наличие в прайсах Гы Не покажешь мне систему на Woodcrest-ах в прайсе? Если есть подозрения в неправильной конфигурации Opteron-овой системы, то это вопрос к SUN, к IBM, к Etegro, наконец Хе-хе Намек понял "Если Вы такие умные, почему строем не ходите?" (с) Но за ТРС-С мы пока не возьмемся. Малы еще.

Автор:

VLev [ 14:29 29.05.2006 ]

Заголовок сообщения:

matik писал(а):
Перед инженерами НР поставили задачу "гарантированно выиграть с большим преимуществом". Это чуток другое, правда?

Не было такой задачи у HP.
Была задача выжать максимальный результат из разрабатываемой системы.
Причем та жа задача стояла и при тестировании Opteron-овой системы.

matik писал(а):
Весь вопрос в том, насколько корректно со стороны Интел пользоваться этим результатом. Если у них такая чудесная платформа, никаких проблем быть не должно: берем максимально близкие по конфигурации системы, и демонстрируем, что "наш феншуй — самый правильный феншуй".

В контексте теста tpc --- это и есть "максимально близкие по конфигурации системы". Ближе просто не бывает.

Если же публично сравнивают столь разные системы — выглядит это откровенно некорректно.
Основная разница в этих системах --- дата доступности. В принципе, это единственное, за что можно "поругать" Intel в данном случае.

Гы Не покажешь мне систему на Woodcrest-ах в прайсе?
Я не партнер HP, потому мне ноябрьские прайсы эотго года пока недоступны. Но это не значит, что их нет.

Автор:	matik [ 14:38 29.05.2006 ]
Заголовок сообщения:
VLev Не было такой задачи у HP. Была задача выжать максимальный результат из разрабатываемой системы. Причем та жа задача стояла и при тестировании Opteron-овой системы. И для этого поставили втрое больше дисковых полок, да? Долго они их "разрабатывали"? А долго длилась "разработка" 64GB памяти вместо 32GB? Много ли народу было брошено на "исследования"? Я не партнер HP, потому мне ноябрьские прайсы эотго года пока недоступны Я тоже не партнер НР Но что-то мне подсказывает, что сейчас еще МАЙ. Ладно, комитет SPEC допускает упреждение до трех месяцев. Но все равно ноябрь не получается. В контексте теста tpc --- это и есть "максимально близкие по конфигурации системы". Ближе просто не бывает. Это, может быть, у НР более близких систем не бывает. Но давай вспоминать, что именно Интел сравнивает: производительность своей платформы по сравнению с платформой конкурента. Не производительность СИСТЕМ, а производительность ПЛАТФОРМ. Это означает, что ВСЕ ОСТАЛЬНОЕ должно быть ОДИНАКОВО. Этот тезис очевиден?

Автор:	BorisU [ 14:45 29.05.2006 ]
Заголовок сообщения:
matik И для этого поставили втрое больше дисковых полок, да? Вопрос в том, помогут ли они системе на AMD, если она уже уперлась в процессор (предположение высосанное из пальца ). А долго длилась "разработка" 64GB памяти вместо 32GB? А можно ли в ту AMDшную систему вообще поставить столько памяти?

Автор:	matik [ 14:50 29.05.2006 ]
Заголовок сообщения:
BorisU Вопрос в том, помогут ли они системе на AMD, если она уже уперлась в процессор (предположение высосанное из пальца ) Согласен Высосанное Потому что всем остальным системам оно помогло Если Вы обратите внимание, то в ТРС-С среди двух близких систем всегда побеждает та, в которой больше шпинделей. Это же база данных, им чем больше производительность дисковой, тем лучше. А можно ли в ту AMDшную систему вообще поставить столько памяти? Не знаю. Зато ТОЧНО знаю , что в систему на Woodcrest-е поставить 32GB памяти вместо 64GB точно можно.

Автор:	BorisU [ 14:58 29.05.2006 ]
Заголовок сообщения:
matik Потому что всем остальным системам оно помогло я не особо ковырялся в результатах TPC, но подозреваю, что увеличение числа шпинделей до бесконечности не приведет к бесконечному увеличению результатов. Потому как упрется во что-то другое. Следовательно есть некий оптимум числа шпинделей, скажем, определяемый по критерию стоимости одной транзакции. Достаточно очевидно, что этот оптимум разный в зависимости от скорости процессора. Зато ТОЧНО знаю , что в систему на Woodcrest-е поставить 32GB памяти вместо 64GB точно можно. да. но зачем Intel занижать свои результаты только потому, что конкурент не сумел поставить 64Gb? Может им и кэш урезать?

Автор:	Warrax [ 15:15 29.05.2006 ]
Заголовок сообщения:
matik в ТРС-С среди двух близких систем всегда* побеждает та, в которой больше шпинделей.* Фигли , систему в которой вдвое больше дисков... побеждает та в которой вдвое больше памяти! http://www.tpc.org/results/individual_r ... DB2_ES.PDF (да — это снова DL585 ) http://www.tpc.org/results/individual_r ... 105.es.pdf Виктор, здавайтесь — Вы в меньшенстве

Автор:	matik [ 16:04 29.05.2006 ]
Заголовок сообщения:
Warrax Фигли , систему в которой вдвое больше дисков... побеждает та в которой вдвое больше памяти! Гы 1. Я писал, среди двух близких систем. Разумеется, с одинаковым количеством памяти 2. В нашем случае Интел для уверенности поднял вдвое количество памяти и втрое — количество дисков. Кому-то все еще кажется, что это "честное сравнение"? Виктор, здавайтесь — Вы в меньшенстве Ха Если бы я сдавался, когда я в меньшинстве — никаких статей не было бы Правота в этих вещах не определяется голосованием

Автор:	TyyOx91 [ 16:36 29.05.2006 ]
Заголовок сообщения:
matik Цитата: Кому-то все еще кажется, что это "честное сравнение"? Конечно. Мне кажется вы забываете, что TPC-C это не тест процессоров, а тест готовых систем (причём не абстрактных, а вполне реальных и доступных на рынке (сейчас или в будущем)). Если подходить к этим тестам с вашими критериями, то до сих пор пришлось бы ставить по 64 Мега памяти и 40 Гига хард-диск что-бы не дай бог не "обскакать" какую нибудь старенькую системку, которую выставили на tpc.org ещё в прошлом веке.

Автор:	matik [ 17:10 29.05.2006 ]
Заголовок сообщения:
TyyOx91 Конечно. Мне кажется вы забываете, что TPC-C это не тест процессоров, а тест готовых систем (причём не абстрактных, а вполне реальных и доступных на рынке (сейчас или в будущем)) 1. Почему бы Вам не объяснить это Интел? Они почему-то уверены (вот глупцы!), что они таким образом продвигают новую платформу. 2. Готовых, говорите, систем? Где купить? 3. Ах, в БУДУЩЕМ? Приходите завтра. Тогда и поговорим. КОГДА будет доступна. А пока это всего лишь обещания. А обещать жениться — не значит жениться © Если подходить к этим тестам с вашими критериями, то до сих пор пришлось бы ставить по 64 Мега памяти и 40 Гига хард-диск что-бы не дай бог не "обскакать" какую нибудь старенькую системку, которую выставили на tpc.org ещё в прошлом веке Не надо выдумывать полную чушь от моего имени. Вот просто не надо.

Автор:

VLev [ 17:58 29.05.2006 ]

Заголовок сообщения:

matik писал(а):
И для этого поставили втрое больше дисковых полок, да?

Да, для этого. Причем если тот же массив поставить Opteron-у, то толку особого бы не было.
Наоборот, я считаю, Opteron-у надо было ставить в два раза мЕньший массив, тогда и по стоимость tpc он бы выиграл у старого Xeon-а. Ну а сейчас время упущено. Впрочем, возможно, HP теперь именно по такому пути и пойдет...

matik писал(а):
А долго длилась "разработка" 64GB памяти вместо 32GB?

Долго. Я уже, кстати, писал, что, на мой взгляд, задержка с выходом некоторых конфигураций серверов связана с некоторыми проблемами FB-DIMM. В рассматриваемой система используются по 4 модуля FB-DIMM на канал.
Кстати говоря, и у Opteron-ового контроллера тоже есть проблемы с большим кол-вом планок большого объема.

Я тоже не партнер НР Но что-то мне подсказывает, что сейчас еще МАЙ. Ладно, комитет SPEC допускает упреждение до трех месяцев. Но все равно ноябрь не получается.
tpc со SPEC-ом никак не связан. Там свои правила, тут — свои.

matik писал(а):
Это, может быть, у НР более близких систем не бывает.
Но давай вспоминать, что именно Интел сравнивает: производительность своей платформы по сравнению с платформой конкурента. Не производительность СИСТЕМ, а производительность ПЛАТФОРМ.
Это означает, что ВСЕ ОСТАЛЬНОЕ должно быть ОДИНАКОВО.
Этот тезис очевиден?

Нет, не очевиден. Это не просто платформа, а платформа серверная. И сравнивается во вполне конкретных серверных тестах, стандартных для платформ данного типа. По всем правилам.
Где в правилах tpc записано, что "ВСЕ ОСТАЛЬНОЕ должно быть ОДИНАКОВО"?

Автор:	matik [ 18:15 29.05.2006 ]
Заголовок сообщения:
VLev Причем если тот же массив поставить Opteron-у, то толку особого бы не было. Извини, а откуда такой вывод? До сих пор с ростом количества шпинделей производительность росла чуть ли не линейно. И тут ты говоришь "этого достаточно". Вывод весьма непонятен. Долго. Я уже, кстати, писал, что, на мой взгляд, задержка с выходом некоторых конфигураций серверов связана с некоторыми проблемами FB-DIMM. В рассматриваемой система используются по 4 модуля FB-DIMM на канал. Извини, но я нигде не видел сообщений о проблемах с FBDIMM. Ты действительно знаешь о таковых проблемах, или это просто "вольное предположение"? Складывается впечатление, что второе. Заметим, что ты делаешь уже второе смелое допущение ради того, чтобы объяснить это "сравнение". Не слишком ли много допущений? Кстати говоря, и у Opteron-ового контроллера тоже есть проблемы с большим кол-вом планок большого объема. Кроме снижения скорости — никаких особых проблем. Нет, не очевиден. Это не просто платформа, а платформа серверная. И сравнивается во вполне конкретных серверных тестах, стандартных для платформ данного типа. По всем правилам. Где в правилах tpc записано, что "ВСЕ ОСТАЛЬНОЕ должно быть ОДИНАКОВО"? Странно. Я вроде простым и понятным языком пишу, ан нет. С точки зрения НР, все нормально: они показали две СИСТЕМЫ. Для Интел это НЕ является корректным. Если они хотят продемонстрировать преимущество своей платформы над платформой конкурента, их надо поставить в РАВНЫЕ условия, и сказать: "вот, посмотрите, насколько мы быстрее". Сейчас платформы в РАЗНЫХ условиях. Я НИКАКИМ СПОСОБОМ не могу сказать, какой вклад в нынешнем преимуществе платформы на Woodcrest-е вносит вдвое большая ОЗУ и втрое большее количество шпинделей, а какой вклад — самой платформы. Ты можешь это сказать, раз сравнение с твоей точки зрения корректно? Если да, давай оценки, будем обсуждать. Тебе дали некую "систему", причем в реальной жизни ты НИКОГДА не будешь покупать платформу этой конфигурации. Вот и объясни мне, как их корректно сравнить, чтобы не обмануть потенциального покупателя.

Автор:	VLev [ 19:00 29.05.2006 ]
Заголовок сообщения:
matik писал(а): Извини, а откуда такой вывод? До сих пор с ростом количества шпинделей производительность росла чуть ли не линейно. И тут ты говоришь "этого достаточно". Вывод весьма непонятен. Вывод --- из изучения доступных отчетов по tpc -- я уже это писал. Насчет "чуть ли не линейно" --- ты серьезно погорячился (или просто не смотрел эти результаты). Даже чисто теоретически: система не может обработать больше транзакций в секунду, чем может пропустить через себя процессоры, потому, начиная с какого-то уровня результата, увеличение числа дисков не будет приводить к адекватному увеличению результата. Также полезно сравнить результаты SC и DC Opteron-ов с одинаковым объемом памяти и числом шпинделей. Ну а самое простое --- смотрим на стоимость tpc, а не на результат. У оптимальной системы стоимость tpc меньше. Извини, но я нигде не видел сообщений о проблемах с FBDIMM. Ты действительно знаешь о таковых проблемах, или это просто "вольное предположение"? Складывается впечатление, что второе. Да, вольное предположение, основанное на том, что чем больше у сервера модулей FB-DIMM на канал --- тем позже объявлена его доступность (один модуль — июнь, два — июль, 4 — ноябрь). Заметим, что ты делаешь уже второе смелое допущение ради того, чтобы объяснить это "сравнение". Не слишком ли много допущений? Не понял, как это "второе смелое допущение" (спасибо за оценку:) ) поможет объяснить "это сравнение"? И вообще в какую именно мою логическую цепочку, которую ты хочешь опровергнуть, это допущение входит, а то я не в курсе . Я лишь отвчал на твой вопрос о том долго ли разрабатывали 64GB для 2xCPU системы. Заодно: что именно ты называешь "первым смелым допущением"? Кроме снижения скорости — никаких особых проблем. Этого недостаточно? Снижение-то в 1.5 раза по частоте, с 400 до 266.(6)MHz. Странно. Я вроде простым и понятным языком пишу, ан нет. С точки зрения НР, все нормально: они показали две СИСТЕМЫ. Для Интел это НЕ является корректным. Если они хотят продемонстрировать преимущество своей платформы над платформой конкурента, их надо поставить в РАВНЫЕ условия, и сказать: "вот, посмотрите, насколько мы быстрее". Сейчас платформы в РАЗНЫХ условиях. Я НИКАКИМ СПОСОБОМ не могу сказать, какой вклад в нынешнем преимуществе платформы на Woodcrest-е вносит вдвое большая ОЗУ и втрое большее количество шпинделей, а какой вклад — самой платформы. Прежде чем столь патетически обличать Inteу, ты мне скажи где ты увидел "втрое большее количество шпинделей"? Ты можешь это сказать, раз сравнение с твоей точки зрения корректно?Если да, давай оценки, будем обсуждать. Все результаты доступны на сайте tpc. бери и смотри. Там ты обнаружишь системы на Opteron, у которых результат в том числе и уменьшается при увеличении числа шпинделей. Тебе дали некую "систему", причем в реальной жизни ты НИКОГДА не будешь покупать платформу этой конфигурации. Вот и объясни мне, как их корректно сравнить, чтобы не обмануть потенциального покупателя. Я уже давным-давно предлагал тестировать в tpc системы, актуальные для нашего рынка. А и у HP с IBM задачи немного другие. Но при чем тут Intel, я не понял? Данный процессор прекрасно подходит для обсуждаемых задач --- что тут спорить? Нет никаких причин "подтасовывать" результаты --- и Intel их тут вполне корректно использует.

Автор:	U2 [ 15:17 02.06.2006 ]
Заголовок сообщения:
А какие мнения есть насчет этого: http://www.aceshardware.com/forums/read ... &forumid=1

Автор:	Lev Dymchenko [ 15:32 02.06.2006 ]
Заголовок сообщения:
У них кое-что не совсем аккуратно. Посмотрите тему на ixbt тестирование инженерного образца conroe. В той реализации mulps+addps более быстро работает, чем тут. Как и в теории, tp 1 такт.

Автор:	Ivan Andreevich [ 21:24 03.06.2006 ]
Заголовок сообщения:
http://dev2dev.bea.com/blog/hstahl/arch ... ase_1.html

Автор:	U2 [ 00:10 05.06.2006 ]
Заголовок сообщения:
Вот и начались тест-драйвы Core 2 Duo E6700 http://www.computerbase.de/artikel/hard ... stdrive/3/ http://tomshardware.thgweb.de/2006/06/0 ... enchmarks/

Автор:	VLev [ 00:42 05.06.2006 ]
Заголовок сообщения:
U2 писал(а): Вот и начались тест-драйвы Core 2 Duo... http://www.ixbt.com/cpu/rmma-conroe.shtml Между прочим, максимальная ПСП еще меньше, чем у 2GHz AM2, как я и ожидал. А вот prefetch сделан знатно.

Автор:	amdfan [ 05:29 05.06.2006 ]
Заголовок сообщения:
U2 Цитата: Вот и начались тест-драйвы Core 2 Duo E6700 Пожалуйста прокоментируйте их ? что можно сказать неплохо ,хорошо ,или отлично? Что вы думаете по поводу использования ддр2 800 в дефолте глупость ведь реальная ПСП 6000МБ/сек меньше чем теортеическая ПСП ддр2 533!!! или всё же в использовании ддр2 800 есть какой-то смысл?

Автор:	TyyOx91 [ 09:36 05.06.2006 ]
Заголовок сообщения:
Кстати, Интел выложила результаты для 3 Vehicle Collision (LS-DNYA) для 4,8,16,32,64 — ядерных серверов. AMD Opteron 3GHz уступает в 4,8 и16 -ядерных конфигурациях (для большего числа ядер нет результатов). http://www.topcrunch.org/benchmark_results_search.sfe

Автор:	amdfan [ 10:08 05.06.2006 ]
Заголовок сообщения:
TyyOx91 Цитата: AMD Opteron 3GHz уступает в 4,8 и16 -ядерных конфигурациях Интел выложила было бы удивитетильно если бы интел выложила бы тесты такие в которых оптерон рвёт в клочки ксионы не правда ли?

Автор:	TyyOx91 [ 10:17 05.06.2006 ]
Заголовок сообщения:
amdfan Может быть. Но дело это не меняет. Как оказалось Woodcrest далеко не так плох в многопроцессорных конфигурациях. http://www.topcrunch.org/benchmark_resu ... =16&type=5 http://www.topcrunch.org/benchmark_resu ... =32&type=5

Автор:	BorisU [ 10:59 05.06.2006 ]
Заголовок сообщения:
это кластеры

Автор:	amdfan [ 11:04 05.06.2006 ]
Заголовок сообщения:
Цитата: Как оказалось Woodcrest далеко не так плох в многопроцессорных конфигурациях. TyyOx91 Так там ведь везде по два!! процессора вот он и не плох

Автор:	TyyOx91 [ 11:13 05.06.2006 ]
Заголовок сообщения:
amdfan Цитата: TyyOx91 Так там ведь везде по два!! процессора вот он и не плох Не понял что вы имели в виду. Я привёл результаты для одинакового количества ядер. В первом случае 16 ядер, во втором — 32 ядра.

Автор:	amdfan [ 12:05 05.06.2006 ]
Заголовок сообщения:
"#Nodes x #Processors per Node x #Cores Per Processor = Total #CPU Time" в одном узле два сокета а вовсе не 8 ты смотри результаты где будет х, 8 ,2 = 16 или 32 вот тогда и можно будет сделать вывод хорош ли Вуди в многопроцессорных(более 4-х сокетов в одном узле) системмах или нет. Может я сам конечно что-то путаю...

Автор:	TyyOx91 [ 13:01 05.06.2006 ]
Заголовок сообщения:
amdfan Цитата: ты смотри результаты где будет х, 8 ,2 = 16 или 32 вот тогда и можно будет сделать вывод хорош ли Вуди в многопроцессорных(более 4-х сокетов в одном узле) системмах или нет. Может я сам конечно что-то путаю... Там только ИБМы и SGI на Итаниумах имеют конфигурации с более чем двумя соккетами на node. Все остальные это кластеры с одно-двухсокетными узлами. Тем более, что более чем 4-х соккетов на узел для АМД всё равно эффективно не реализуется. Так что сравнени равноценное. Что интерсно конфигурации типа 8х2х1 быстрее чем 4х2х2 как в случае с Интел, так и в случе с АМД.

Автор:	amdfan [ 13:25 05.06.2006 ]
Заголовок сообщения:
TyyOx91 Ну что в двухсокетных машинах Вуди будет быстрее 28х опетронов как бы и не оспаривалось никем. Цитата: Тем более, что более чем 4-х соккетов на узел для АМД всё равно эффективно не реализуется Это почему же ? это как раз на интеле оно не реализутеся эффективно гипретраспорта-то нема

Автор:	TyyOx91 [ 14:18 05.06.2006 ]
Заголовок сообщения:
amdfan Цитата: Это почему же ? это как раз на интеле оно не реализутеся эффективно гипретраспорта-то нема Зато есть InfiniBand для межузловых соединений. Пропускная способность в теории до 120 ГБит/с. (на практике уже давно существуют адаптеры на 60 ГБит/с. Это чуть меньше пропускной способности 16-битного HT 2.0, но всё лучше чем 8-сокетная НТ конфигурация даже для Оптерона.

Автор:	Warrax [ 14:46 05.06.2006 ]
Заголовок сообщения:
TyyOx91 Зато есть InfiniBand для межузловых соединений. Пропускная способность в теории до 120 ГБит/с. (на практике уже давно существуют адаптеры на 60 ГБит/с. Это чуть меньше пропускной способности 16-битного HT 2.0, но всё лучше чем 8-сокетная НТ конфигурация даже для Оптерона. Внешняя шина лучше межпроцессорного соединения? А как с латентностью? В сравнении с НТ, а не айзернетом...

Автор:	matik [ 15:28 05.06.2006 ]
Заголовок сообщения:
TyyOx91 Зато есть InfiniBand для межузловых соединений. Пропускная способность в теории до 120 ГБит/с. (на практике уже давно существуют адаптеры на 60 ГБит/с. Это чуть меньше пропускной способности 16-битного HT 2.0, но всё лучше чем 8-сокетная НТ конфигурация даже для Оптерона Это что еще за новости?! 1. Infiniband — 10Gbit, а не 120, насколько я помню. 2. С какой радости оно лучше, чем 8-ми сокетная конфигурация? 3. Что там с общей памятью? 4. А что с латетностью?!

Автор:

TyyOx91 [ 16:11 05.06.2006 ]

Заголовок сообщения:

matik

Цитата:
1. Infiniband — 10Gbit, а не 120, насколько я помню.

60 GBit/s.
120 Gbit/s. в теории в конфигурации 12х + QDR.

Цитата:
2.С какой радости оно лучше, чем 8-ми сокетная конфигурация?

Меньше перекрёстного снуппинга памяти (на 8 сокетах — снуппинг через три процессора).

Цитата:
3. Что там с общей памятью?

А что с общей памятью?

Цитата:
4. А что с латетностью?!

Приводились данные в 180 нс. А что там у Оптерона на НТ через 3 процессора?

Автор:	matik [ 16:54 05.06.2006 ]
Заголовок сообщения:
TyyOx91 Меньше перекрёстного снуппинга памяти (на 8 сокетах — снуппинг через три процессора). Вот интересно А запрос к соседней ноде через сколько узлов пройдет? 60 GBit/s. 120 Gbit/s. в теории в конфигурации 12х + QDR. Посмотрю. Что-то я таких в продаже не видел, ежели честно. А что с общей памятью? А ее НЕТ. В отличиет от восьмерки, кластер на Инфинибенде не будет машиной с общей памятью. На нем одну ОС не запустишь. И, соответственно, годится кластер далеко не по всем процессорам. Приводились данные в 180 нс. А что там у Оптерона на НТ через 3 процессора? 180нс — это время передачи пакета? Не верю ©. У Оптерона 110нс в худшем случае (пишу на память, но порядок этот).

Автор:	Warrax [ 17:17 05.06.2006 ]
Заголовок сообщения:
TyyOx91 Приводились данные в 180 нс. это задержка только на свитче :lol: InfiniBand Switch Latency is 160 ns. Real data latencies in a system are about 6 us (depending on software/firmware).

Автор:	amdfan [ 21:32 07.06.2006 ]
Заголовок сообщения:
Поскльку в серверных тестах а не очень разбираюсь ,то прошу "спецов" прокоментировать вот это сравнение Вуди и Оптера от Ананада http://anandtech.com/IT/showdoc.aspx?i=2772 кто есть ху?

Автор:	Ivan Andreevich [ 08:44 08.06.2006 ]
Заголовок сообщения:
amdfan А чего непонятного? На двухсокетных системах Оптерон труп в подавляющем большинстве приложений.

Автор:	amdfan [ 15:57 08.06.2006 ]
Заголовок сообщения:
Ivan Andreevich Ну как бы это совсем не сюрприз(насчёт двухсокетных машин то предполагалось что Вудкрест будет посильнее) ну и частота была у Вуди выше, вот если учесть это ,то велик ли выигрыш? Потом опять же фб димм дорогая память и пока только начинает развиваться(вспоминается ддр2 400 чего-то )

Автор:	Stranger_NN [ 16:08 08.06.2006 ]
Заголовок сообщения:
ПСП сыграла в чистейшем виде...

Автор:	Ivan Andreevich [ 21:06 08.06.2006 ]
Заголовок сообщения:
amdfan частота была у Вуди выше, вот если учесть это ,то велик ли выигрыш? Довольно велик даже с коррекцией на частоту. Stranger_NN Всмысле?

Автор:	Ntag [ 08:45 09.06.2006 ]
Заголовок сообщения:
Ivan Andreevich Цитата: Всмысле? Разница в ПСП DDR и FB-DIMM. Довольно нехилый плюс для Вуди.

Автор:	amdfan [ 08:50 09.06.2006 ]
Заголовок сообщения:
Цитата: Разница в ПСП DDR Оптероны на сокет Ф будудт работать с ддр2 и они и будут соперничать с Вуди а вовсе не ветеран оптерон

Автор:	VLev [ 13:50 09.06.2006 ]
Заголовок сообщения:
Ntag писал(а): Разница в ПСП DDR и FB-DIMM. Довольно нехилый плюс для Вуди. Пока что этот "плюс" только потенциальный. В тестах, чувствительных к ПСП, результаты Woodcrest хуже даже старых Opteron.

Автор:	Warrax [ 15:45 09.06.2006 ]
Заголовок сообщения:
VLev В тестах, чувствительных к ПСП, результаты Woodcrest хуже даже старых Opteron. Если не сложно, просветите в каких именно?

Автор:	VLev [ 16:15 09.06.2006 ]
Заголовок сообщения:
Warrax писал(а): Если не сложно, просветите в каких именно? SPEC fp swim, mgrid например. Да и синтетика то же примерно показывает.

Автор:	matik [ 17:12 09.06.2006 ]
Заголовок сообщения:
VLev Имхо, проблема все же с латентностью. Мне трудно представить, чтобы 17GB\sec было меньше, чем 12.8GB\sec....

Автор:	U2 [ 17:17 09.06.2006 ]
Заголовок сообщения:
Из серии конро, если еще актуально: http://www.hardwareluxx.de/cms/artikel. ... how&id=391 http://www.tecchannel.de/technologie/pr ... en/440320/ amdfan писал(а): Поскльку в серверных тестах а не очень разбираюсь ,то прошу "спецов" прокоментировать вот это сравнение Вуди и Оптера от Ананада http://anandtech.com/IT/showdoc.aspx?i=2772 кто есть ху? Когда S-F выйдет с рев. F, тогда ху из ху и прояснится. У Xeon 5160 3GHz RAM (ns) = ~ 117.3. Учитывая, что FBD ECC выходит не так то уж и плохо, а то помнится кто-то, когда-то , 200нс и далее по грядкам "обещал".

Автор:	matik [ 17:20 09.06.2006 ]
Заголовок сообщения:
U2 У Xeon 5160 3GHz RAM (ns) = ~ 117.3. Учитывая, что FBD ECC выходит не так то уж и плохо, а то помнится кто-то, когда-то , 200нс и далее по грядкам "обещал". Да, было дело Кстати, как измерены эти 117 нс — это еще вопрос. Надо будет посмотреть. А то у Беседина тоже при латентности ЕСС Registered модулей больше 100 нс "средняя" 43нс получается

Автор:	U2 [ 17:23 09.06.2006 ]
Заголовок сообщения:
matik Кстати, как измерены эти 117 нс — это еще вопрос. Надо будет посмотреть. В смысле? LMBench 3.0a-5, в статье речь идет об этой проге. Не берусь судить, насколь прога адекватная, но пока за некий ориентир можно придерживаться этих цифр.

Автор:	matik [ 18:38 09.06.2006 ]
Заголовок сообщения:
U2 В смысле? LMBench 3.0a-5, в статье речь идет об этой проге. Не берусь судить, насколь прога адекватная, но пока за некий ориентир можно придерживаться этих цифр. Я в том смысле, что, измеряя латентность различными алгоритмами, можно получить принципиально разные результаты. И что в этом случае будем считать латентностью? Мы же не меряем чистое время поступления данных. Мы измеряем сложную систему с префетчами, причем не самыми худшими. Думаю, они крайне существенно меняют результирующую латентность.

Автор:	VLev [ 20:35 09.06.2006 ]
Заголовок сообщения:
matik писал(а): Имхо, проблема все же с латентностью. Не, латентность непричем вроде.

Автор:	U2 [ 21:10 09.06.2006 ]
Заголовок сообщения:
matik Я в том смысле, что, измеряя латентность различными алгоритмами, можно получить принципиально разные результаты. Так выданные результаты не так уж и вроде далеко ушли от имевшихся ранее предварительных оценках, кот-ые присуждали fbdimm-ам, так что в этом плане цифрам (латентности памяти) можно в принципе доверять, хоть и осторожно пока. Для 4x1024 Reg FB-DIMM2 ECC 4-4-4 очень недурственные результаты, все равно.

Автор:	amdfan [ 04:50 10.06.2006 ]
Заголовок сообщения:
Силикон не выбирает больше Оптерон http://www.theinquirer.net/?article=32317 кто ,что скажет?

Автор:	MickeMM [ 08:50 10.06.2006 ]
Заголовок сообщения:
amdfan писал(а): Силикон не выбирает больше Оптерон http://www.theinquirer.net/?article=32317 кто ,что скажет? Что-то много в последнее время новостей от Силиконовцев — даже подозрительно . Вот например ещё свежая: SGI объявила о своем банкротстве...

Автор:	matik [ 17:15 10.06.2006 ]
Заголовок сообщения:
U2 Так выданные результаты не так уж и вроде далеко ушли от имевшихся ранее предварительных оценках, кот-ые присуждали fbdimm-ам, так что в этом плане цифрам (латентности памяти) можно в принципе доверять, хоть и осторожно пока Угу. А где же тогда латентность собственно контроллера? Не, не верю я в чудеса

Автор:	U2 [ 22:08 10.06.2006 ]
Заголовок сообщения:
matik Угу. А где же тогда латентность собственно контроллера? Что-то перестаю понимать, к чему клоните? У кого пришиты, а у кого и зашиты. Что с того? Не, не верю я в чудеса Зато мы сильно верим в 200нс и ни нс меньше

Автор:	matik [ 22:42 10.06.2006 ]
Заголовок сообщения:
U2 Что-то перестаю понимать, к чему клоните? У кого пришиты, а у кого и зашиты. Что с того? Это я просто давно бьюсь за изменение алгоритмов измерения латентности случайного доступа. Нынешние префетчеры слишком хороши, к сожалению Зато мы сильно верим в 200нс и ни нс меньше Не, от 200нс придется с сожалением отказаться

Автор:	TeoAX [ 17:50 14.06.2006 ]
Заголовок сообщения:
А вот и ixbt оттестировался: http://www.ixbt.com/cpu/intel-conroe-2-13-ghz.shtml Результаты хорошие, но все-таки хотелось большего. 17% в среднем — это очень и очень неплохо, однако мало коррелируется с тем, что распевали тут некоторые "песняры".

Автор:	U2 [ 23:41 14.06.2006 ]
Заголовок сообщения:
TeoAX Результаты хорошие, но все-таки хотелось большего. 17% в среднем — это очень и очень неплохо, однако мало коррелируется с тем, что распевали тут некоторые "песняры". Непонятно, чего ж вам все-таки больше хочется

Автор:	zurzic [ 08:33 15.06.2006 ]
Заголовок сообщения:
TeoAX Цитата: Результаты хорошие, но все-таки хотелось большего. 17% в среднем — это очень и очень неплохо, однако мало коррелируется с тем, что распевали тут некоторые "песняры". Всё же я не перестаю удивлятся человеческой психологии и неистрибимому оптимизму. 17% в среднем — это две ступени тактовой частоты около двух гигагерц и практически три ступени около 3-х гигагерц. Если АМД после выхода Конро будет продавать свои процессоры по опубликованному ценнику, то сделает их практически неконкуретноспособными. IMHO

Автор:

amdfan [ 08:39 15.06.2006 ]

Заголовок сообщения:

Yury_Malich

Цитата:
Если АМД после выхода Конро будет продавать свои процессоры по опубликованному ценнику, то сделает их практически неконкуретноспособными. IMHO

По какому по тому в котором указаны цены после преполагаемого снижени 24-го числа что-ли? Это они будут неконкурентно способны?
Мы ещё поглядим будет ли интел продавать Конуру

Цитата:
по опубликованному ценнику

Автор:	zurzic [ 08:57 15.06.2006 ]
Заголовок сообщения:
amdfan http://forum.ixbt.com/topic.cgi?id=8:20165-19#534 Например E6400 (2,13ГГц)— 224$ 4200 (2,2ГГц)— 240 $ E6400 стоит меньше и при этом ощутимо быстрее. При таком раскладе, если он сохранится, я возьму осенью Конро.

Автор:

amdfan [ 09:29 15.06.2006 ]

Заголовок сообщения:

Цитата:
E6400 стоит меньше и при этом ощутимо быстрее. При таком раскладе, если он сохранится, я возьму осенью

Да в интеловском предварительном прайсе он стоит дешевле и ощутимо быстрее НО очевидно, что осенью всзять его за эти самые 240 врядли получится

. Интел вон переводит преслеры на новый степпинг , так как доля Конро будет маленькой поначалу. Да и выход годных кристалов с 4мб кеша(>=Е6600) не может быть большим...

Цитата:
я возьму осенью Конро.

Да я сам осенью планирую Е6700 брать, так как Х2 даже со снижеными ценами выглядит хуже чем процы интела(если они таки пойдут в серию по заявленым ценам) а тут ещё и обрезание им сделают...
ЗЫ Я всё ещё сомневаюсь ,что официальные цены на Конро будут теми которые заявлены...

Автор:	zurzic [ 09:40 15.06.2006 ]
Заголовок сообщения:
amdfan Поживём до осени — увидим.

Автор:	matik [ 13:48 15.06.2006 ]
Заголовок сообщения:
Yury_Malich Цены на АМД другими будут, это понятно. Они подождут запуска Conroe, и откорректируют цены. Так что надо ждать.

Автор:	amdfan [ 14:14 15.06.2006 ]
Заголовок сообщения:
Цитата: Так что надо ждать. А потом брать пусть и недорогих но кастратов с 2х512 кеша...

Автор:	TeoAX [ 14:29 15.06.2006 ]
Заголовок сообщения:
U2: Непонятно, чего ж вам все-таки больше хочется Поясняю — я хочу, чтобы AMD не могла просто отделаться переводом К8 на 65нм, придерживая K8L "на потом".

Автор:	U2 [ 19:34 15.06.2006 ]
Заголовок сообщения:
TeoAX Поясняю — я хочу, чтобы AMD не могла просто отделаться переводом К8 на 65нм, придерживая K8L "на потом". В смысле "отделаться"? Они брали на себя какие-то супер-обязательства? Ну даже если и будет чистый шринк К8, что с того? В принципе время еще есть, но и повода для веселья у них также нет. 1. Интел и во 2-ом квартале огрошить общественность своими финансвоыми показателями еще успеет, и в 3-ем "опозориться" не меньше сможет. В условиях когда одна компания сокращает расходы на все что можно — капитальные вложения, R&D и пр., а другая наоборот — наращивает, повода для пессимизма мне пока видно. Тем более, что у АМД уже 5 дизайн-центров стало, когда раньше их было только 2, если правильно помню. 2. Еще не ясно, будет ли на базе К8L десктопные варианты, или исключительно серверные, и не будет ли что-то все-таки раньше, т.к. ранее АМД заявляла, что готовит на рынок 2 микроархитектуры — одна для мобильного, др. — для серверного рынков, при том, что мобильная архитектура, по мнению амд, должна будет служить основой десктопных аналогов.

Автор:	TeoAX [ 19:48 15.06.2006 ]
Заголовок сообщения:
U2: В смысле "отделаться"? Они брали на себя какие-то супер-обязательства? Нет, конечно, но тут я руководствуюсь банальным шкурным интересом — хочу всего, сразу и побольше. 17% производительности — это примерно 20-25% роста по частоте (без учета возможностей наращивания кеша, памяти, шин и т.д.). AMD c внедрением 65нм техпроцесса (с германием) грозилась аж вплоть до 40% увеличить скорость переключения транзисторов. А значит, что K8L может оказаться не так уж нужен для того, чтобы ликвидировать разрыв и чуть выйти вперед.

Автор:	U2 [ 21:04 15.06.2006 ]
Заголовок сообщения:
TeoAX Нет, конечно, но тут я руководствуюсь банальным шкурным интересом — хочу всего, сразу и побольше. Ну тогда вам сразу надо в Кремль Там все эти три вещи исполняются одним щелчком. И к гадалке не ходи. 17% производительности — это примерно 20-25% роста по частоте (без учета возможностей наращивания кеша, памяти, шин и т.д.). AMD c внедрением 65нм техпроцесса (с германием) грозилась аж вплоть до 40% увеличить скорость переключения транзисторов. А значит, что K8L может оказаться не так уж нужен для того, чтобы ликвидировать разрыв и чуть выйти вперед. Помимо вычисленного вами прироста по частоте, необходимо наладить массовый выпуск прежде, с хорошим выходом годных, чтобы заиметь высокочастотный ряд, да с приемлемой ценой. А это требует немало времени и усилий, если амд вообще ставит себе этой целью до конца года осуществить. Следующая микроархитектура по-любому нужна амд, т.к. нынче развиваться ПО-ХОРОШЕМУ оба чипмейкера могут лишь "поедая" друг друга, т.е. направляя потоки в свое русло, а учитывая что общие темпы роста процессорного рынка явно не поспевают за телодвижениями цпу-строителей, вопрос "нужности" очевиден, тем более для амд. Гы, кот-ая также как и вы хочет всего, сразу и побольше.

Автор:	amdfan [ 22:35 15.06.2006 ]
Заголовок сообщения:
Да не будут Брисбен просто шринком К8 будут мелкие архитектрные улучшения кеш там скомпонуют как нить "более оптимально" или ещё чего может уже в нём фпу удвоят,потом транзисторы "ускорят",контроллер памяти усовершенствуют,опять же частотный потенциал и тепловыделение. Всё намана будет только уже без 2х1мб кеша впрочем не велика потеря Брисбен может прилично подобобраться к Конрою а имею большую частоту при равной цене так и вообще догнать...

Автор:	U2 [ 18:19 21.06.2006 ]
Заголовок сообщения:
А Conroe (2.93GHz) идет уже как 75W ...

Автор:	U2 [ 00:39 22.06.2006 ]
Заголовок сообщения:
Core 2 Duo E6600, E6400, E6300 тесты с FX @ 2.8GHz, AM2, nForce SLI, 4-4-4-12 http://www.pcper.com/article.php?aid=26 ... pert&pid=2

Автор:	matik [ 00:59 22.06.2006 ]
Заголовок сообщения:
U2 А Conroe (2.93GHz) идет уже как 75W ... Да. Кстати сказать, интересно, как они измеряли TDP в этом случае Как у Pentium III процессоров, или у Pentium 4? А вообще впечатлил Кентсфилд. Четыре ядра, и разгон на номинале до 3.2ГГц — это впечатляет.

Автор:	Ivan Andreevich [ 04:47 22.06.2006 ]
Заголовок сообщения:
matik Четыре ядра, и разгон на номинале до 3.2ГГц — это впечатляет. Интересно, какое там охлаждение (XS сейчас лежит). Думаю что фреон. 3 ГГц на воздухе с 4 мя ядрами для стартовой частоты ХЕ будет очень реально

Автор:	Warrax [ 11:42 22.06.2006 ]
Заголовок сообщения:
matik А вообще впечатлил Кентсфилд. Четыре ядра, и разгон на номинале до 3.2ГГц — это впечатляет. А где? Я что-то пропустил?

Автор:	BorisU [ 11:58 22.06.2006 ]
Заголовок сообщения:
matik Кстати сказать, интересно, как они измеряли TDP в этом случае А не пофиг ли? оно реально намного холоднее FX-62 http://www.hkepc.com/hwdb/x6800vsfx62-11.htm Warrax А где? На xtremsystems гоняют сэмпл. http://xtremesystems.org/forums/showthread.php?t=103982

Автор:	matik [ 13:31 22.06.2006 ]
Заголовок сообщения:
BorisU А не пофиг ли? оно реально намного холоднее FX-62 Гы Может, им с 840XE сравнить? Вот там и посмотрим, НАМНОГО ли

Автор:	BorisU [ 15:23 22.06.2006 ]
Заголовок сообщения:
matik кому "им"?

Автор:	Warrax [ 17:08 22.06.2006 ]
Заголовок сообщения:
BorisU А не пофиг ли? оно реально намного холоднее FX-62 Но тем не менее замерянные 118W при нагрузке далеки от 75W — так что вероятно не пофигу Все же Конро не такой уж и холодный, как о нем пели, иначе Интел не стала бы под занавес Нетберста — делать подобный термальный пЕар. основные тезисы пЕара: — неважно сколько тепла выделяется — главное насколько эффективно оно отводится — поскольку нагрузка активная — часть энергии возвращается обратно в цепь — не вся энергия выделяется в виде тепла — есть же еще ЭМИ и т.д. На xtremsystems гоняют сэмпл. Хочу терминальный сервер с таким, но серийным по производительности это где-то 2хО285 А сколько ОНО будет стоить, еще нигде хотя бы ориентировочные цифры не светились?

Автор:	BorisU [ 17:23 22.06.2006 ]
Заголовок сообщения:
Warrax Но тем не менее замерянные 118W при нагрузке далеки от 75W читайте внимательнее, 118 это потребление всей системы А сколько ОНО будет стоить, еще нигде хотя бы ориентировочные цифры не светились? Оно выйдет в 2007, рано еще.

Автор:	U2 [ 18:17 22.06.2006 ]
Заголовок сообщения:
matik Да. Кстати сказать, интересно, как они измеряли TDP в этом случае Думаю, в этот раз у интел другая картина. И вряд ли цифры зашкаливают в стрессе и компроматом здесь похоже и не пахнет 75W (если они там не опечатались) уже не 80W (блин, магия чисел ) видимо стало возможным за счет применения новой упаковки, ИМХО. В свое время говорилось что преслеру удалось снизить TDP не то на 5W, не то на 5% только за счет упаковки, не говоря о техпроцессе с новым поколением. Правда справедливо будет давать цифры TDP Intel CPU + NB, чтобы сравнивать адекватно с AMD CPU(NB). Кстати, вышел power design guideline для Core 2. Может там что-то и есть интересное. А вообще впечатлил Кентсфилд. Четыре ядра, и разгон на номинале до 3.2ГГц — это впечатляет. Вот как раз частотный потенциал NGMA видимо всерьез амд не воспринимался (я тоже грешил ), отсюда аврал своего рода у амд и имеется похоже. BorisU читайте внимательнее, 118 это потребление всей системы При задействовании всех 4 ядер?

Автор:	BorisU [ 18:23 22.06.2006 ]
Заголовок сообщения:
U2 При задействовании всех 4 ядер? эээ, цифра относится к Core 2 Extreme X6800 (2.93)

Автор:	Warrax [ 18:23 22.06.2006 ]
Заголовок сообщения:
U2 При задействовании всех 4 ядер? Там всего два — мы про Core 2 Extreme X6800, "CPU Burn x2" — то есть оба А у Kentsfield заявляли TDP 95 Вт, только не понятно за счет чего так мало, учитывая что это два Core 2? И упорно, по прежнему, не понимаю почему АМД не сделать также — два двухядерника в одной упаковке?

Автор:	U2 [ 19:04 22.06.2006 ]
Заголовок сообщения:
BorisU эээ, цифра относится к Core 2 Extreme X6800 (2.93) Аааа ...

Автор:	U2 [ 19:06 22.06.2006 ]
Заголовок сообщения:
Warrax А у Kentsfield заявляли TDP 95 Вт, только не понятно за счет чего так мало, учитывая что это два Core 2? Ну видимо здесь подразумевался 2.4ггц камень + сопряженные энергосберегающие технологии И упорно, по прежнему, не понимаю почему АМД не сделать также — два двухядерника в одной упаковке? Это как?

Автор:	Ivan Andreevich [ 02:02 24.06.2006 ]
Заголовок сообщения:
U2 Это как? Два кристалла на одной подложке

Автор:	U2 [ 11:20 24.06.2006 ]
Заголовок сообщения:
Ivan Andreevich Два кристалла на одной подложке Т.е. хотите сказать, что то, что сделал интел, может применить и амд??? И как вы себе представляете работу таких "двухкоров в одной упаковке"???

Автор:	Ivan Andreevich [ 03:32 25.06.2006 ]
Заголовок сообщения:
U2 Конечно. Работать будет точно так же как два оптерона на плате у которой доступ к памяти только у одного процессора.

Автор:	Stranger_NN [ 11:25 26.06.2006 ]
Заголовок сообщения:
Хмм... Боюсь, что даже использование двух каналов DDR2 800 не поможет... Тут без чего-то наподобие 4 каналов FB-DIMM просто не стоит и пробовать, по-моему...

Автор:	chavv [ 17:16 26.06.2006 ]
Заголовок сообщения:
Stranger_NN писал(а): Хмм... Боюсь, что даже использование двух каналов DDR2 800 не поможет... Тут без чего-то наподобие 4 каналов FB-DIMM просто не стоит и пробовать, по-моему... почему?! Разве сейчас 2х285 не работают используя 4 канала ДДр400 ? Разве 2 канала ДДР2-800 не дадут тот же bandwidth ?!

Автор:	U2 [ 20:51 26.06.2006 ]
Заголовок сообщения:
Ivan Andreevich Конечно. Работать будет точно так же как два оптерона на плате у которой доступ к памяти только у одного процессора. Стоп. Два нативных двукора, каждый со своим МС упаковываются синглом в один цпу. Так? — Все ядра тыкаются и обращаются к памяти через один доступный контроллер? А второй просто так дезактивируете? И зачем все это городить? — Какой в итоге перформанс будет у такого цпу? Если у интел согласование двух упакованных коров идет на уровне чипсета, то как быть в случае с К8?

Автор:	Ivan Andreevich [ 21:40 26.06.2006 ]
Заголовок сообщения:
U2 Стоп. Два нативных двукора, каждый со своим МС упаковываются синглом в один цпу. Так? Ага Все ядра тыкаются и обращаются к памяти через один доступный контроллер? А второй просто так дезактивируете? И зачем все это городить? Дешевле 1 такой процессор чем 2 обычных. Платы проще делать. — Какой в итоге перформанс будет у такого цпу? Ну так посмотрите на разницу производительности дешёвых 2xS940 (ASUS?) с 2 мя каналами vs дорогих Tyan с 4 мя каналами. Там разница минимальная — в худшем случае около 10 процетов в базах данных. Т.е. почти никакой во многих случаях (S754 vs S939 тоже самое). Если у интел согласование двух упакованных коров идет на уровне чипсета, то как быть в случае с К8? Через HT как и у Оптеронов. У 4х4 тоже самое будет, но не на одной подложке.

Автор:	U2 [ 23:13 26.06.2006 ]
Заголовок сообщения:
Ivan Andreevich Дешевле 1 такой процессор чем 2 обычных. Платы проще делать. Дешевле? Проще? Не понимаю. Кому из производителей, будь чипмейкер или комплектующих, выгоден такой подход какйо вы предлагате. Они что сами себе враги? Сколько вы продадите вообще таких вот 1P (2х2) вместо 2Р. Ну так посмотрите на разницу производительности дешёвых 2xS940 (ASUS?) с 2 мя каналами vs дорогих Tyan с 4 мя каналами. Стоп, прежде чем брать имеющиеся варианты построения систем, автоматически их переносить на "появление" 2 спаренных кристаллов и ожидать не худший перформанс надо понять как будет работать вообще такой цпу. И это на существующей инфрастуктуре? А вам сокет новый не потребуется случайно? И какой TDP будет у такого "франкенштейна", тоже удвоенный? И т.д. Через HT как и у Оптеронов. У 4х4 тоже самое будет, но не на одной подложке. Да? С их текущей ПС? Вариант с 4х4 предполагает, если не ошибаюсь, использование камней из новой ревизии, где 4 НТ-линка ожидается.

Автор:	Ivan Andreevich [ 23:22 26.06.2006 ]
Заголовок сообщения:
U2 Кому из производителей, будь чипмейкер или комплектующих, выгоден такой подход какйо вы предлагате Интелу И это на существующей инфрастуктуре? А вам сокет новый не потребуется случайно? И какой TDP будет у такого "франкенштейна", тоже удвоенный? И т.д. 2 x HE чипа 35W = 70W. Ещё несколько сотен Мгц плюс лучше техпроцесс и в тот же самый ТДП легко уложиться. Да? С их текущей ПС? Не понял Если посмотреть на жалкий прирост 2 канала —> 4 канала на DDR400 с оптеронами, прирост будет ЕЩЁ меньше с ДДР2-800 или ДДР2-1066 который сейчас толкают. Вариант с 4х4 предполагает, если не ошибаюсь, использование камней из новой ревизии, где 4 НТ-линка ожидается. А зачем для 2 сокетов 4 канала?

Автор:	U2 [ 00:03 27.06.2006 ]
Заголовок сообщения:
Ivan Andreevich Интелу Интел ваще живет будто "весь мир в кармане" Только причем здесь амд? 2 x HE чипа 35W = 70W. Это исключительно отборные (читай мало) и далеко не самые высокочастотные в своем роде. Если посмотреть на жалкий прирост 2 канала —> 4 канала на DDR400 с оптеронами Давайте посмотрим как все это заработает для начала, прежде чем понять будет ли там равновесие, прирост, а не падение производительности вовсе. — Как собираемся отключать второй МС (пины)? — Насколь надежна будет работа одного МС при работе всех 4 ядер? — Нет ли проблем при синхронизации? — Энергосберегающие технологии? — и т.д. Это камень, если ваще будет нормально работать, в том виде какой вы предлагаете не имеет той степени надежности (RAS), кот-ый предъявляет тот рынок, кот-му такие решения интересны. А зачем для 2 сокетов 4 канала? Блин, это я с серверной версией напутал

Автор:	Stranger_NN [ 09:20 27.06.2006 ]
Заголовок сообщения:
chavv Цитата: Разве сейчас 2х285 не работают используя 4 канала ДДр400 ? Разве 2 канала ДДР2-800 не дадут тот же bandwidth ?! Нет, не дадут. Поскольку удвоение тут чисто бумажное, в реальности увеличение ПСП составит процентов 30, много 50-70.. А тут еще и повышение требований со стороны каждого отдельно взятого ядра (частота + плотность исполнения). Вот и получится, что 4 новых мощных ядра будут простаивать...

Автор:	Ivan Andreevich [ 10:30 27.06.2006 ]
Заголовок сообщения:
Stranger_NN Вот и получится, что 4 новых мощных ядра будут простаивать... Вон 3700+ S754 2.4 GHz на одном канале ДДР400 нормально работает 4 ядра с двухканальной ДДР2-1066 (ЕPP с понтами) =

Автор:	U2 [ 21:59 27.06.2006 ]
Заголовок сообщения:
Ivan Andreevich Вон 3700+ S754 2.4 GHz на одном канале ДДР400 нормально работает Представьте себе двухствольный автомат, кот-ый заряжается либо с двух магазинов, либо с одного. Если сделать дополнение к тем магазинам в виде экстра-обойм, стрелять от этого он лучше станет?

Автор:	Asmodeus [ 01:32 28.06.2006 ]
Заголовок сообщения:
Довольно любопытный обзор — Эволюция многоядерной процессорной архитектуры Intel Core: Conroe, Kentsfield, далее по расписанию...

Автор:	Ivan Andreevich [ 04:09 28.06.2006 ]
Заголовок сообщения:
U2 Представьте себе двухствольный автомат, кот-ый заряжается либо с двух магазинов, либо с одного. Если сделать дополнение к тем магазинам в виде экстра-обойм, стрелять от этого он лучше станет? Не понял аналогии

Автор:	chavv [ 09:09 28.06.2006 ]
Заголовок сообщения:
Stranger_NN писал(а): chavv Цитата: Разве сейчас 2х285 не работают используя 4 канала ДДр400 ? Разве 2 канала ДДР2-800 не дадут тот же bandwidth ?! Нет, не дадут. Поскольку удвоение тут чисто бумажное, в реальности увеличение ПСП составит процентов 30, много 50-70.. А тут еще и повышение требований со стороны каждого отдельно взятого ядра (частота + плотность исполнения). Вот и получится, что 4 новых мощных ядра будут простаивать... Извини, но если не сможешь подтвердить это утверждение какими нибудь данными, это будет просто утверждение типа "I have a dream" Я недавно сделал простенький тест — запустил Cinebench на 2х280 , мать Супермикро Первый раз используя 1х128б@400, во второй раз используя 2х128б@400 Разница была 2-3% Я свои выводы сделал. Что в некоторых задачах 1х128б@400 не ограничивает скорость. Вы (оба с U2) утверждаете что 1х128@800 будет работать медленнее... Фактов у вас есть?

Автор:	Stranger_NN [ 13:58 28.06.2006 ]
Заголовок сообщения:
chavv, Cinebench — это всего лишь один из тестов. Причем как раз не очень чувствительный к памяти. Другое дело, что по результатам этого теста вряд ли стоит судить о перспективах многоядерных систем.. Так, например, при обработке больши БД — использование двухканальной памяти дает до 20-30 процентов прироста. А где-то в форуме я писал об особенностях работы программы LS-DYNA в системах с различно организованным доступом к памяти. В целом же, я, действительно не думаю, что двух каналов DDR2-800 хна нормальную работц 4 ядер в произвольно взятой системе. Нет, скорее всего, будет пошустрее, чем двухядерная (с той же частотой), но отнюдь не в два раза...

Автор:	SLoNiCK [ 16:27 28.06.2006 ]
Заголовок сообщения:
Stranger_NN Если посмотреть этот обзор (жаль, что там 275-е в 4х1 не гоняли — был бы ровно наш случай) http://www.ixbt.com/cpu/amd-cmp-vs-smp.shtml то, на мой взгляд, вполне однозначно обрисовывается круг задач, где этот гипотетический 4х4 мог бы быть весьма эффективен — это 3D, видеообработка, медиакодирование. По сути, типичный процессор для WS. Однозначно более быстрый, чем нынешние двуядерники, и менее дорогой в комплекте с обыной мамкой, чем 2 Opteron 2хх + двухсокетная мамка. Кстати, а что Вы ждете от двухсокетного 4х4? Мамки с разъемами памяти для каждого процессора весьма дороги — Tyan K8WE, Asus K8n-DL. От того, что AMD скажет: "А теперь это массовый продукт!" — они не подешевеют. Вполне возможно, что для более дешевых моделей такой "секвестр" памяти проведут их производители.

Страница 1 из 2	Часовой пояс: UTC + 3 часа
Copyright © 2001 - 2012, Radeon.ru Team Powered by phpBB® Forum Software © phpBB Group http://www.phpbb.com/