Конференция работает на сервере Netberg

Radeon.ru

Конференция Radeon.ru

Страница 1 из 7 [ Сообщений: 255 ]  Версия для печати [+] На страницу 1, 2, 3, 4, 5 ... 7  След.
Показать сообщения за  Поле сортировки  
http://aceshardware.com/forums/read_pos ... &forumid=1

Comprehensive list of K8L(K10) microarchitectural improvements over K8
By Carfax (Recent posts)
Friday, February 9, 2007 6:38 AM EST
Microarchitectural imporvements of K8L(K10) over K8

--------------------------------------------------------------------------------

Quad-core
— Native quad-core design
— improved crossbar
— improved SRI
Power management — DICE(Dynamic Independent Core Engagement)
— Supports separate CPU core and memory controller power planes to allow CPU to lower its power state while the memory controller is running full bore
— Enhanced AMD's PowerNow allows individual core frequencies to lower while other cores may be running full bore
Dedicated L1 cache
— 256bit 32kB instruction, 32kB data
— 2 x 128bit loads/cycle
— reduced latency
Dedicated L2 cache
— 128bit 512kB
— reduced latency
Comprehensive Upgrades for SSE
— Dual 128-bit SSE dataflow
— Up to 4 dual precision FP OPS/cycle
— Dual 128-bit loads per cycle
— Can perform SSE MOVs in the FP “store” pipe
— Execute two generic SSE ops + SSE MOV each cycle (+ two 128-bit SSE loads)
— FP Scheduler can hold 36 Dedicated x 128-bit ops
— SSE Unaligned Load-Execute mode:
a) Remove alignment requirements for SSE ld-op instructions
b) Eliminate awkward pairs of separate load and compute instructions
c) To improve instruction packing and decoding efficiency
Advanced branch prediction
— Dedicated 512-entry Indirect Predictor
— Double return stacksize
— More branch history bits and improved branch hashing
32B instruction fetch
— Benefits integer code too
— Reduced split-fetch instruction cases
Sideband Stack Optimizer
— Perform stack adjustments for PUSH/POP operations “on the side”
— Stack adjustments don’t occupy functional unit bandwidth
— Breaks serial dependence chains for consecutive PUSH/POPs
Out-of-order load execution
— New technology allows load instructions to bypass:
Other loads
Other stores which are known not to alias with the load
— Significantly mitigates L2 cache latency
TLB Optimisations
— Support for 1G pages
— 48bit physical address
— Larger TLBs key for:
Virtualized workloads
Large-footprint databases and
transaction processing
— DTLB:
Fully-associative 48-way TLB (4K, 2M, 1G)
Backed by L2 TLBs: 512 x 4K, 128 x 2M
— ITLB:
16 x 2M entries
Data-dependent divide latency
More Fastpath instructions
– CALL and RET-Imm instructions
– Data movement between FP & INT
Bit Manipulation extensions
— LZCNT/POPCNT
SSE extensions
— EXTRQ/INSERTQ (SSE4A)
— MOVNTSD/MOVNTSS (SSE4A)
— MWAIT/MONITOR (SSE3)
Independent DRAM controllers
— Concurrency
— More DRAM banks reduces page conflicts
— Longer burst length improves command efficiency
— Dual Channel unbuffered 1066 support(applies to socket AM2+ and s1207+ QFX only)
— Channel Interleaving
Optimized DRAM paging
— Increase page hits
— Decrease page conflicts
History-based pattern predictor
Redesigned northbridge for higher bandwidth
— Increase buffer sizes
— Optimize schedulers
— Ready to support future DRAM technologies
Write bursting
— Minimize Rd/Wr Turnaround
DRAM prefetcher
— Track positive and negative, unit and non-unit strides
— Dedicated buffer for prefetched data
— Aggressively fill idle DRAM cycles
Core prefetchers
— DC Prefetcher fills directly to L1 Cache
— IC Prefetcher more flexible
2 outstanding requests to any address
Shared L3
— Victim-cache architecture maximizes efficiency of cache hierarchy
— Fills from L3 leave likely shared lines in the L3
— Sharing-aware replacement policy
HyperTransport 3
chavv
Мне показалось, что всё это в том или ином виде уже упоминалось. По крайней мере ничего нового (кроме, пожалуй, "Can perform SSE MOVs in the FP “store” pipe") не заметил :)

Кроме того автор подборки повторил старую ошибку: кэш L1 будет 64+64, а не 32+32
chavv
Оно К10 :)
http://anandtech.com/cpuchipsets/showdo ... i=2939&p=1

Опа.. ещё не прочитал :)
Изображение

интересный слайд, показывает что ссе блоки у к10 нагружены лучше чем у коре2

знаю что картинка великовата, но что поделать
лучше бы они бенчмарки показали.
кое-кто бенчи видел и даже мне немного инфы перепало ;)
Ну так поделитесь, если что конкретное есть ;)
ну в общем система 4х4 с двумя К10 на 2300МГц (итого 8 ядер) набрала 7933 попугаев 3dmark06 CPU Score :yes:
видеокарта не знаю какая, возможно 8800жтикс или Х2900
для сравнения Intel Core 2 Quad 4984 MHz у k|ngp|n'а набрал 7052
странное какое-то сравнение: 8 ядер против 4 c разгоном и 2 контроллера пямяти против 1.
ну так блин сравнение экстремальной платформы от амд и экстремальной от интела
а то что интел не может пока предложить 8-ядерной платвормы — явно не проблемы амд
хотя в январе на выставке интл какой-то свой 8-ядерный сервачок показываал
может я чего не понимаю, но тот же HP продает 2х сокетные системы с clovertown. Другой вопрос нафиг оно на десктопе надо?

HP продает 2х сокетные системы с clovertown

формально это сервер

у амд 4х4 — это десктоп

к тому же у интела многосокетные конфиги погань та еще и микроархитектура коре их не спасает — они обогнать К8 толком то не могут, что уж говорить о К10

а своей архитектуры Direct Connect интелу еще больше года ждать
То что AMD вытащили двухсокетный сервер отрезали registered память и назвали его десктопом ничего принципиально не меняет.
меняет цену и скорость — цена уменьшилась, скорость увеличилась
вобщем походу АМД ждали не зря с выходом
типа фора...типа мы ждали достойного конкурента...и не дождались ;)

странное какое-то сравнение: 8 ядер против 4 c разгоном
вы на разгон обратите внимание ;) на его величину 5ггц против 2.3Ггц и это не топовый К10 ...Интересно посмотреть сколько в процессорном тесте это же марка набирает дефолтный 2.66ггц Кентсфилд ??
Нашел 4143
Значит если на 4х4 хорошо масштабируется производительность то 2.3 ггц К10 будет примерно равен куих 6700 2.66 в данном конкретном тесте . Поясню в данном тесте зависимость от количества ядер практически линейная к томуже 4х4 хорошо масштабирует произодительность ,так что результаты показынае 4х4 можно смело делить на два для получения оценки быстродействия в этом тесте одного К10 2.3ГГц :D

для сравнения Intel Core 2 Quad 4984 MHz у k|ngp|n'а набрал 7052

Вполне обнадёживающий результат, учитывая что маштабируемость второго процессора скорее всего не 100%.

Эх, ещё бы точной информации про совместимость AM2 c AM2+ и точную информацию нарыть... а то ЛГА775 не внушает стабильности :). P5B Deluxe будет потом жалко выкидывать :gigi:... лучше наверно сейчас на ASUS M2N32-SLI Deluxe или MSI K9A Platinum заменять :D.

Эх, ещё бы точной информации про совместимость AM2 c AM2+ и точную информацию нарыть...

Всё уже известно давно процессоры АМ2+ будут работать в маплатах АМ2 просто контролле НТ перейдёт в режим НТ 1.0 что практически никак не скажется на производительности. Точно так же сокет Ф 1207+ совместим с текущим сокет Ф 1207
а также возможно будет амд 45нм ам3 (939 ног) воткнуть в мать ам2 (940 ног) — физическая совместимость есть, и цебит 2007 внес ясность

Изображение

так что возможно в современные ам2 платы можно будет даже воткнуть 8-ядерные! ам3 процы от амд
время сокетА возвращается
MAS
к тому же у интела многосокетные конфиги погань та еще и микроархитектура коре их не спасает — они обогнать К8 толком то не могут, что уж говорить о К10
Б-р-е-д... Как раз на 2 сокетах в серверном сегменте текущая платформа от Интел имеет максимальный отрыв от двухсокетных Оптеронов
"AMD shows off 3.0Ghz Barcelona"

Изображение
Как-то слабо верится в 4 ядра на 3 GHz. Ну посмотрим ...
BorisU
Ну, знаете :D
То Вам жемчуг мелок... © :D
ну сами подумайте, если у них 2GHz 95W — сколько должно жрать это чудо?

если у них 2GHz 95W — сколько должно жрать это чудо?
По моему, АМД уже неоднократно доказывали, что любое их решение не выходило по потреблению и тепловыделению за грань разумного. А если вспомнить про Пень4 в самой отвратной его инкарнации...
BorisU
ну сами подумайте, если у них 2GHz 95W — сколько должно жрать это чудо?
Например, 130Вт. Или 150Вт. Ничего сверхестественного для отладки технологии не вижу.
Со временем подкрутят техпроцесс, и все будет хорошо.
Раз сейчас есть процессоры на 3ГГц — значит, через некоторое время их уложат в рамки стандартного тепловыделения.
Все равно что Интел, что АМД непрерывно шлифуют техпроцесс.
matik
"AMD shows off 3.0Ghz Barcelona"
:)
Вот смотрю я на фото и вижу там кажись боксовый кулер. Нехило, если конечно все работает в полноценном режиме и демо-система не чисто для снятия скрина частоты цпу.
matik
ну посмотрим, на какой частоте его реально выпустят. И когда ;)
2ггц Barcelona SPECfp_rate2006 peak Linux = 69.5
2.33ггц Xeon 5345 SPECfp_rate2006 peak Linux = 54
X2
Вот смотрю я на фото и вижу там кажись боксовый кулер.
Вот их хитрый ход с боксовым кулером и попал прямо в цель... :D
А три мощнейших бловера левее все списали на видюхи? ;)

matik
Штатный мерзавец
растешь? :gigi:
Ребят, все наверное обратили внимание на материнскую плату? такая же как на всех выставках референс от АМД... вот объясните зачем у чипсетного кулера провод длиной сантиметров 30, упакован в какую-то прости господи хлорвиниловую трубку и собран в моточек? Причём у всех производителей на компьютексе, которые выставили референс от АМД был точно такой же моточек... :shuffle:
Warrax
А три мощнейших бловера левее все списали на видюхи?
Этот корпус штатно включает эти вентиляторы. Это какой-то модный корпус для оверклокеров :)

растешь?
А что делать? :)
matik
А что в Шанхае АМД улучшила? "Improved IPC", как никак.
X2
Не знаю :)
Какие-то намеки были, но пока непонятно.
matik
Этот корпус штатно включает эти вентиляторы. Это какой-то модный корпус для оверклокеров
Ага, причём это не очень хороший корпус в плане охлаждения как ни странно.

X2
2ггц Barcelona SPECfp_rate2006 peak Linux = 69.5
2.33ггц Xeon 5345 SPECfp_rate2006 peak Linux = 54

А кстати нехило. К8Л получается в 1.5 раза быстрее на той же частоте. Если они подберуться частотой к 3ГГц, Интел фиг догонит.
Ivan Andreevich
1. этот тест на текущей 2S платформе xeon упирается память, а не в процессор.
2. AMD опять соврали хотя и не намного. Лучший результат 5345 — 55.5 причем base, а не peak :)
3. 2GHz 50W 5335 показывает 54.1
4. Нифига он не вырастет пропорционально частоте у AMD
Так что 1.5 раза ну никак не выходит.
Новая тема    Ответить  [ Сообщений: 255 ]  На страницу 1, 2, 3, 4, 5 ... 7  След.


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 4


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  

Удалить cookies конференции

Пишите нам | Radeon.ru