Пора обсуждать Prescott!

Страница 1 из 13 [ Сообщений: 507 ]

На страницу 1, 2, 3, 4, 5 ... 13 След.

matik

Штатный мерзавец

Сообщения: 7188
Откуда: Москва\Одесса

Репутация: 5

Добавлено: 19:43 21.01.2004

Ну что, похоже, что страшные предположения оказываются правдой...

Длина конвейера — 32 стадии... Латентность кэша первого уровня, по-видимому, 3 такта...

На одинаковой частоте обычно слегка медленнее Northwood-а...
Правда, думаю, частоту он будет набирать получше...

Жаль... Но чудес по-прежнему не бывает.

GReY

Участник

Сообщения: 381
Откуда: Салават

Репутация: 0

Добавлено: 20:02 21.01.2004

Цитата:
>Латентность кэша первого уровня, по-видимому, 3 такта...\

имеется ввиду дата-кэш? с ним ваапще что-то странное:
http://www.overclockers.ru/images/news/2004/01/20/lga28_06.gif

Сэмпл не светит разыскать вскорости?

matik

Штатный мерзавец

Сообщения: 7188
Откуда: Москва\Одесса

Репутация: 5

Добавлено: 20:06 21.01.2004

GReY
Сэмпл не светит разыскать вскорости?
Наша работает над этим

BEKTOP

Новичок

Сообщения: 95
Откуда: San Francisco Москва

Репутация: 0

Добавлено: 20:36 21.01.2004

Ну и %^$ с ним тогда, с этим Прескоттом.

matik, все-таки NetBurst масштабируется плохо, если приходится переходить на 32 стадии.
Как там не отделяй "мух от котлет"...
Скоро уже и котлеты не останется. Это уже почти чисто сетевой контроллер, а не ЦПУ.

По-моему, Интелу как производителю десктопных чипов будет худо пока он не похоронит гребаную NetBurst.

GReY

Участник

Сообщения: 381
Откуда: Салават

Репутация: 0

Добавлено: 21:34 21.01.2004

BEKTOP

Цитата:
>все-таки NetBurst масштабируется плохо, если приходится переходить на 32 стадии. \

Какая вам разница, сколько там стадий? работает и ладно. а вот КАК работает, нам очень интересно разузнать, так что не надо

Цитата:
>Ну и %^$ с ним тогда, с этим Прескоттом.\

matik

Цитата:
>Наша работает над этим \

Пора свистать наверх команду

matik

Штатный мерзавец

Сообщения: 7188
Откуда: Москва\Одесса

Репутация: 5

Добавлено: 21:46 21.01.2004

BEKTOP
все-таки NetBurst масштабируется плохо, если приходится переходить на 32 стадии.
Мне все же кажется, что это сделано с неким прицелом на будущее — чтобы он не только сейчас, но и позже нормально масштабировался...

По-моему, Интелу как производителю десктопных чипов будет худо пока он не похоронит гребаную NetBurst.
Ну-ну

Весь вопрос в том, чем он ее будет "обклеивать" для нарядности

В принципе, как бы ни был слаб какой-либо блок, но с ростом частоты растет производительность ВСЕГО процессора... А, к примеру, быстрый кэш П4 не раз вытягивал его из беды...

GReY
Какая вам разница, сколько там стадий? работает и ладно. а вот КАК работает, нам очень интересно разузнать, так что не надо
Ну, как-то очень категорично... В любом случае, интересно, как же все-таки оно устроето

Тут соглашусь

matik

Штатный мерзавец

Сообщения: 7188
Откуда: Москва\Одесса

Репутация: 5

Добавлено: 21:51 21.01.2004

GReY
Пора свистать наверх команду
Угу!

Жду решения технических вопросов... Вроде в ближайшее время все должно определиться...

GReY

Участник

Сообщения: 381
Откуда: Салават

Репутация: 0

Добавлено: 23:47 21.01.2004

Ещё интересный момент:
http://www.pconline.com.cn/pchardware/tpylab/cpu/0401/pic/0118_test_4_s.gif
Max Phys/Virt Addr : 40/32
L2 Cache : 16 way

matik

Штатный мерзавец

Сообщения: 7188
Откуда: Москва\Одесса

Репутация: 5

Добавлено: 00:03 22.01.2004

GReY
Max Phys/Virt Addr : 40/32
Однако... Другими словами, готовьте очередные патчи к операционкам.... Наша чудесная РАЕ2 сможет адресовать 1ТВ...

L2 Cache : 16 way
Интересно...

VLev

Активный участник

Сообщения: 1982
Откуда: Moscow

Репутация: 0

Добавлено: 04:00 22.01.2004

<BLOCKQUOTE>цитата:<HR size=22>matik:
Длина конвейера — 32 стадии... Латентность кэша первого уровня, по-видимому, 3 такта...<HR size=22></BLOCKQUOTE>
Ok. Будем исходить пока из этого. Осталось понять зачем это сделано?
1. Обычный вариант --- Потенциал увеличения частоты как-то явно не проходит. Northwood и так разгонялся до 5GHz (и уж не конвейер виноват что эти 5GHz версии не дошли до прилавков). Соответственно, потенцал 32 стадийного конвейера на 90нм д.б. где-то за 10GHz, хотя по роадмап-ам Prescott вряд ли и до 5 дотянет.
2. Новые команды Prescott (PNI), cобственно говоря, не являются настолько новыми, чтобы потребовать удлинения конвейера.
3. Двукратное увеличение кэшей при одновременном утоньшении норм техпроцесса на sqrt(2) IMHO не должно требовать дополнительных тактов даже в латентности, тем более в конвейере.
4. Какие-то существенные изменения в HT в принципе могут потребовать такого. Вопрос: есть ли эти существенные изменения на самом деле, или все ограничивается парой команд из пункта 2.
5. Конечно, главной причиной могут быть "скрытые возможности Prescott". Например, 64-битность. Это да. Более того, Prescott выглядит пока каким-то "гадким утенком", который со временем может стать прекрасным лебедем

Теперь о минусах:
1. При прочих равных, длинный конвейер усложняет сам чип и его разработку. Однако Prescott и так сложен (если сложность оценивать по числу "нерегулярных" транзисторов) с избытком. Длинный конвейер тут видимо o-малое.
2. При малом количестве архитектурных регистров x86, латентность кэша L1 очень важна. 2 такта было огромным достижением Intel в этом плане. Жаль, что от этого вроде пришлось отказаться.
3. Штрафы, приводящие к сбросу конвейера (например, непредсказанный условный переход). Редкое явление в Spec (и совсем невозможное в stream и проч.), однако всякие сложные ветвистые алгоритмы, да еще на ООП реализованные явно в пролете.

Вместо резюме:
Почему-то считается (почему --- для меня загадка), что длинный конвейер должен компенсироваться большим кэшем L2. И как бы для если для 512K оптимум 20 тактов, то для 1M кэша как раз 30 тактов (это из древней презентации Intel).

matik

Штатный мерзавец

Сообщения: 7188
Откуда: Москва\Одесса

Репутация: 5

Добавлено: 04:35 22.01.2004

http://zdnet.com.com/2100-1103_2-5144907.html
Вот опять про 30 стадий.. Осталось понять, что именно они считают

VLev
1. Почему не подходит? Более того, продолжаются слухи, что даже в этом (!) виде варианта 3.4ГГц 2 февраля анонсировано не будет... Видимо, есть некая проблема с ростом частоты...
2. Я не думаю, что это из-за команд...
3. не знаю... надо разбираться...
4. Какие? Пара команд есть, некие буферы для сохранения понадобятся... Но насколько это способно удлинить конвейер? Странно, это скорее в декодере преобразования...
5. Да, тут может быть... Особенно, если они устроили какое-нибудь "торжество разума" вроде 64 битной операции путем 4-х последовательных сдвигов по 16 битовым маскам...

Теперь о минусах:
1. Не знаю... Лишние стадии могут быть сугубо для передачи данных и выравнивания времен.... правда, 10 штук — перебор...
2. Согласен. Но надо ждать пояснений...
3. Согласен.

Почему-то считается (почему --- для меня загадка), что длинный конвейер должен компенсироваться большим кэшем L2.
Думаю, что речь о том, что чем длиннее конвейер, тем больше нужно кэша, чтобы на всякий случай хранить варианты ветвлений... Чтобы при промахе можно было быстро подтащить данные...
ИМХО...

Jordan

Старожил

Сообщения: 2166
Откуда: Россия, Иваново

Репутация: 0

Добавлено: 08:47 22.01.2004

Каждая свежая новость про Prescott "убивает" все больше и больше

Stranger_NN

Администратор

Сообщения: 3997
Откуда: Нижний Новгород

Репутация: 45

Добавлено: 09:32 22.01.2004

А не ждет ли нас "мутант" из HT и CMP? C некоторой т.з. такой рост длины может быть оправдан... Например, меньше вероятность конфликта из-за ресурсов.

ISA_user

Активный участник

Сообщения: 1925
Откуда: Москва, Россия

Репутация: 0

Добавлено: 09:47 22.01.2004

matik

Цитата:
>Однако... Другими словами, готовьте очередные патчи к операционкам.... Наша чудесная РАЕ2 сможет адресовать 1ТВ...\

Вот и понятно КАК потомак сможет адресовать в сервере у ИБМ с 64 процами больше 64 г памяти.

Stranger_NN

Цитата:
>А не ждет ли нас "мутант" из HT и CMP? C\

Или сразу два конвейера на случай неверного предсказания перехода. Причем сейчас это типа выключено — тайное оружие фюрера

???

Stranger_NN

Администратор

Сообщения: 3997
Откуда: Нижний Новгород

Репутация: 45

Добавлено: 09:54 22.01.2004

ISA_user, ну да, примерно так. Потому что просто отказаться от НТ вряд ли возможно при такой длине конвейера, слишком большие штрафы, а с другой стороны — ахиллесова пята HT в виде конфликта из-за ресурсов. Вот и идет проработка решения этой коллизии. Скорее всего именно за счет дублирования наиболее конфликтных ресурсов.

Shurik_ant

Участник

Сообщения: 173
Откуда: Россия, г.Рязань

Репутация: 0

Добавлено: 10:05 22.01.2004

ISA_user

Цитата:
>Или сразу два конвейера на случай неверного предсказания перехода. Причем сейчас это типа выключено — тайное оружие фюрера???\

Ну это уже больше на Итаниум смахивает....

Stranger_NN

Администратор

Сообщения: 3997
Откуда: Нижний Новгород

Репутация: 45

Добавлено: 10:17 22.01.2004

Shurik_ant, да нет, почему? Исполнение альтернативной ветки к EPIC никакого отношения не имеет.

ISA_user

Активный участник

Сообщения: 1925
Откуда: Москва, Россия

Репутация: 0

Добавлено: 10:27 22.01.2004

Shurik_ant

Цитата:
>Ну это уже больше на Итаниум смахивает....\

в том то и дело, что там это уже отработано и в серию пущено самим интелом. Причем действительно, как сказал
Stranger_NN, использование еще одного конвейера не имеет к EPIC как технологии большого отношения.

Stranger_NN

Цитата:
>отказаться от НТ вряд ли возможно при такой длине конвейера\

полностью согласен и тут выход или вешать дополнительные ФУ или сделать вообще паралельную часть конвейера с соответсвующими ФУ.

Кстати, раньше НТ — 2 ветки, теперь 4. Тоесть если тупо смотреть на цифры, так и получается.

VLev

Активный участник

Сообщения: 1982
Откуда: Moscow

Репутация: 0

Добавлено: 11:39 22.01.2004

Цитата:
>ISA_user:Кстати, раньше НТ — 2 ветки, теперь 4\

Откуда данные?

Ivan Andreevich

Активный участник

Сообщения: 1256
Откуда: Ванкувер

Репутация: 0

Добавлено: 11:41 22.01.2004

Кстати, да. Это бы объяснило нафик нужны все эти транзисторы.

Да и тепловыделение — тоже ясно почему такое большое. Хотя.. почему тогда производительность (в предварительных тестах) всё равно отстой? Хотя возможно обвязка слишком сырая.

Shurik_ant

Участник

Сообщения: 173
Откуда: Россия, г.Рязань

Репутация: 0

Добавлено: 11:47 22.01.2004

Stranger_NN

Цитата:
>, да нет, почему? Исполнение альтернативной ветки к EPIC никакого отношения не имеет.\

Возможно, но насколько я помню это называлось, как одно из достоинств EPIC.

Ivan Andreevich

Активный участник

Сообщения: 1256
Откуда: Ванкувер

Репутация: 0

Добавлено: 12:14 22.01.2004

http://www.overclockers.ru/news/newsitem.shtml?category=1&id=1074752005

Архитектурные изменения ядра Tejas в его 0.09 мкм варианте описываются следующим перечнем:

<BLOCKQUOTE>цитата:<HR size=22>Площадь ядра 120-140 кв.мм (в 0.065 мкм версии будет уменьшена до 80-100 кв.мм);
Расширенная версия Hyper-Threading;
Еще более эффективный механизм предсказания ветвлений;
8 новых команд (TNI);
1 Мб кэша второго уровня, 24 Кб кэша первого уровня, 16 К mOps Trace Cache;
Частота шины 800/1066 МГц;
Упаковка LGA 775. <HR size=22></BLOCKQUOTE>

Ага.. типа у Tejas вырос Л1 данных а Trace — 16 uOps. Так что похоже в Prescott будет всё же без имзенений — 12 uOps и утилиты не врут. Или они кэши увеличивают поочерёдно?

Я почему то думал что у Tejas будет 2 мб Л2. И ещё TNI какой то припахался.. дурдом ромашка.

Цитата:
>Кроме того, важным гарантом расширения частотного диапазона 0.09 мкм ядер станет использование новой разновидности технологии SOI при производстве Tejas\

Опаньки.. так всё же на 0.09 уже будут SOI внедрять?? Типа сначала будет обычный 0.09 а потом SOI 0.09. Интересно..

ISA_user

Активный участник

Сообщения: 1925
Откуда: Москва, Россия

Репутация: 0

Добавлено: 12:20 22.01.2004

VLev

Цитата:
>Откуда данные?\

Если честно, то на словах мне сказали. Но только не помню к прескоту или к тильжесу

И где то на форумах читал.

Shurik_ant

Цитата:
>Возможно, но насколько я помню это называлось, как одно из достоинств EPIC.\

это называлось как одно из достоинств итаника

Мне кажеться кто-то из классических рисков что-то такое же имеет (то что мы тут выдумали

)

matik

Штатный мерзавец

Сообщения: 7188
Откуда: Москва\Одесса

Репутация: 5

Добавлено: 12:28 22.01.2004

ISA_user
Мне кажеться кто-то из классических рисков что-то такое же имеет (то что мы тут выдумали
IBM RS64?

ISA_user

Активный участник

Сообщения: 1925
Откуда: Москва, Россия

Репутация: 0

Добавлено: 12:34 22.01.2004

matik

Цитата:
>IBM RS64?\

честно не помню.

судя по названию данного форума и того факта, что инициализировал данную тему матик, думаю что этот подлец все таки выкрал из секретных лабораторий интела экземпляр пресота

Shurik_ant

Участник

Сообщения: 173
Откуда: Россия, г.Рязань

Репутация: 0

Добавлено: 12:48 22.01.2004

ISA_user
<BLOCKQUOTE>цитата:<HR size=22>Возможно, но насколько я помню это называлось, как одно из достоинств EPIC.
это называлось как одно из достоинств итаника

<HR size=22></BLOCKQUOTE>
Насколько я помню, это свойство именно архитектуры, а не реализаии оной в виде Итаниум(кстати, напрасно Вы его Итаником зовёте, не дай бог беду накликаете).

ISA_user

Активный участник

Сообщения: 1925
Откуда: Москва, Россия

Репутация: 0

Добавлено: 13:54 22.01.2004

Shurik_ant
напрасно Вы его Итаником зовёте, не дай бог беду накликаете
Гм? это с чего еще?

ISA_user

Активный участник

Сообщения: 1925
Откуда: Москва, Россия

Репутация: 0

Добавлено: 13:58 22.01.2004

Shurik_ant

Цитата:
>Насколько я помню, это свойство именно архитектуры\

http://osp.admin.tomsk.ru/os/1999/11-12/008.htm

Stranger_NN

Администратор

Сообщения: 3997
Откуда: Нижний Новгород

Репутация: 45

Добавлено: 14:00 22.01.2004

Shurik_ant

Цитата:
>Возможно, но насколько я помню это называлось, как одно из достоинств EPIC.\

Это ВОЗМОЖНОСТЬ, но не неотъемлемое свойство. Скажем так, EPIC процессор можно загрузить одновременным рассчетом вариантов, но почему этого не сделать имеющим параллельные ФУ классическим процессорам я не вижу. Причем, можно менее вероятную ветку исполнять, например, с меньшим приоритетом в рамках HTТ. Без проблем.

Это дело программирования только.

SUN же например, имеет другой механизм — быстрые переход на первые команды альтернативной ветки, что сокращает простои процессора. В общем, все крутятся как умеют.

GReY

Участник

Сообщения: 381
Откуда: Салават

Репутация: 0

Добавлено: 14:10 22.01.2004

matik

Цитата:
>Странно, это скорее в декодере преобразования...\

Насколько я помню суть команд, это изменение в шедьюлере.

ISA_user

Цитата:
>Или сразу два конвейера на случай неверного предсказания перехода. Причем сейчас это типа выключено \

Цитата:
>сделать вообще паралельную часть конвейера с соответсвующими ФУ.\

Напоминаю, что чип-архитекты обнаружили дублирующийся блок целочисленных вычислений.

Цитата:
>Кстати, раньше НТ — 2 ветки, теперь 4. Тоесть если тупо смотреть на цифры, так и получается.\

Не, в Прескотте этого не замечаю. По косвенным признакам

Цитата:
>судя по названию данного форума и того факта, что инициализировал данную тему матик, думаю что этот подлец все таки выкрал из секретных лабораторий интела экземпляр пресота\

Не, это он в преддверии. Скоро будет.

matik

Штатный мерзавец

Сообщения: 7188
Откуда: Москва\Одесса

Репутация: 5

Добавлено: 14:16 22.01.2004

ISA_user
думаю что этот подлец все таки выкрал из секретных лабораторий интела экземпляр пресота
Теджаса

На самом деле без комментариев

GReY

Участник

Сообщения: 381
Откуда: Салават

Репутация: 0

Добавлено: 14:19 22.01.2004

Господа, у меня есть пренеприятнейшее известие! Латентность L1-D кэша 4 такта, L2 — 28! Слава богу хоть не 6, как мне приснилось сегодня ночью.

matik

Штатный мерзавец

Сообщения: 7188
Откуда: Москва\Одесса

Репутация: 5

Добавлено: 14:23 22.01.2004

GReY
Насколько я помню суть команд, это изменение в шедьюлере
Сорри, попутал

Напоминаю, что чип-архитекты обнаружили дублирующийся блок целочисленных вычислений
А вот с этим непонятно... Чип-архитекты делали несколько статей.. В первой они нафантазировали про Прескотт много... Потом вроде стало скромнее, но все равно было весьма наворочено... Не очень понятная ситуация...

Stranger_NN

Администратор

Сообщения: 3997
Откуда: Нижний Новгород

Репутация: 45

Добавлено: 14:30 22.01.2004

GReY

Цитата:
>Латентность L1-D кэша 4 такта, L2 — 28! Слава богу хоть не 6, как мне приснилось сегодня ночью.\

СЕРЬЕЗНО?

Откуда дровишки?

Цитата:
>Напоминаю, что чип-архитекты обнаружили дублирующийся блок целочисленных вычислений.\

ХМ. Тогда все больше и больше становится понятна длина конвейера... Похоже, там все-же обе ветки хором запускать будут. Или уменьшение пробем с HTТ, что тоже очень вероятно.

GReY

Участник

Сообщения: 381
Откуда: Салават

Репутация: 0

Добавлено: 14:34 22.01.2004

Stranger_NN

Цитата:
>Откуда дровишки?\

Сорока на хвосте принесла

matik

Штатный мерзавец

Сообщения: 7188
Откуда: Москва\Одесса

Репутация: 5

Добавлено: 14:38 22.01.2004

GReY
Сорока на хвосте прин
Споймаю "сороку", убью!

Латентность L1-D кэша 4 такта, L2 — 28!
.... мать...мать... мать — привычно отозвалось эхо... © Что ж, надеюсь, Прескотт будет быстро набирать частоту... Это ему теперь НЕОБХОДИМО.

Stranger_NN
Похоже, там все-же обе ветки хором запускать будут
хм... Как ты себе это представляешь?

ISA_user

Активный участник

Сообщения: 1925
Откуда: Москва, Россия

Репутация: 0

Добавлено: 14:42 22.01.2004

GReY

Цитата:
>Напоминаю, что чип-архитекты обнаружили дублирующийся блок целочисленных вычислений\

дай ссылку плиз.

Цитата:
>Не, в Прескотте этого не замечаю. По косвенным признакам \

так могут включиить не в прескоте (или не в первых поставках), а вот обкатать его в массовых партиях смогут запросто — они же скорее всего включают и выключают его с помощью команд флешки.

Stranger_NN

Администратор

Сообщения: 3997
Откуда: Нижний Новгород

Репутация: 45

Добавлено: 14:57 22.01.2004

GReY, а нельзя ли попросить сороку поподробнее?

matik

Цитата:
>хм... Как ты себе это представляешь?\

Да запросто. Если на программном уровне — то вообще просто, в рамках HTT новой, ввести описание на уровне компилятора о параллельном исполнении. Если на аппаратном... Тоже можно, если есть параллельные ФУ — то почему бы и не. Штраф за промах в обоих случаях становится минимален.

matik

Штатный мерзавец

Сообщения: 7188
Откуда: Москва\Одесса

Репутация: 5

Добавлено: 15:02 22.01.2004

Stranger_NN
Тоже можно, если есть параллельные ФУ — то почему бы и не
да нерационально их так использовать... ИМХО...
Достаточно большую часть времени (когда нет ветвлений) чем они будут заниматься?

Shurik_ant

Участник

Сообщения: 173
Откуда: Россия, г.Рязань

Репутация: 0

Добавлено: 15:16 22.01.2004

Stranger_NN
<BLOCKQUOTE>цитата:<HR size=22>Возможно, но насколько я помню это называлось, как одно из достоинств EPIC.
Это ВОЗМОЖНОСТЬ, но не неотъемлемое свойство. Скажем так, EPIC процессор можно загрузить одновременным рассчетом вариантов, но почему этого не сделать имеющим параллельные ФУ классическим процессорам я не вижу. Причем, можно менее вероятную ветку исполнять, например, с меньшим приоритетом в рамках HTТ. Без проблем.

Это дело программирования только. <HR size=22></BLOCKQUOTE>
А я и не говорил, что кроме как в EPIC это нельзя реализовать...

Цитата:
>SUN же например, имеет другой механизм — быстрые переход на первые команды альтернативной ветки, что сокращает простои процессора. В общем, все крутятся как умеют.\

Но они не стали делать для альтернативной ветки полноценный конвейер(который подразумевает ещё один полный набор ФУ) видимо из соображений экономии(площади, кол-ва транзисторов)...

Страница 1 из 13

[ Сообщений: 507 ]

На страницу 1, 2, 3, 4, 5 ... 13 След.

Кто сейчас на конференции