Revisão da AMD FX-8150
Para ser mais exato, comparamos a AMD FX-8150, Phenom II X6 1100T e Core i7-2600 em 3.Frequência de 6 GHz e com apenas dois núcleos computacionais ativos. Para garantir a pureza do experimento, desativamos todas. Usamos um conjunto de benchmarks sintéticos simples na suíte Sisoft Sandra 2011, onde desativamos manualmente todas as instruções além do SSE3, porque a microarquitetura K10 não faz’t Suporte -os.
Resumo
O processador AMD FX-8150 foi comparado aos processadores Phenom II X6 1100T e Core i7-2600. A comparação foi feita com uma frequência de 3.6 GHz e apenas dois núcleos computacionais ativos. Todas. Benchmarks sintéticos na suíte Sisoft Sandra 2011 foram usados, com instruções além do SSE3 com deficiência manualmente.
Pontos chave
1. A comparação incluiu os processadores AMD FX-8150, Phenom II X6 1100T e Core i7-2600.
2. O experimento foi realizado com uma frequência de 3.6 GHz com apenas dois núcleos computacionais ativos.
3. Tecnologias de economia de energia e operação automática foram desativadas para precisão.
4. Benchmarks sintéticos na suíte Sisoft Sandra 2011 foram usados.
5. As instruções além do SSE3 foram desativadas manualmente devido às limitações da microarquitetura K10.
1. Quantos processadores foram comparados na revisão?
A revisão comparou três processadores: o AMD FX-8150, Phenom II X6 1100T e Core i7-2600.
2. Em que frequência os processadores foram comparados?
Os processadores foram comparados a uma frequência de 3.6 GHz.
3. Quantos núcleos computacionais ativos foram usados na comparação?
Apenas dois núcleos computacionais ativos foram usados na comparação.
4. Quais tecnologias foram desativadas para o experimento?
Todas.
5. Qual suíte de benchmark foi usada?
A suíte Sisoft Sandra 2011 foi usada para os benchmarks.
6. Por que as instruções além do SSE3 estavam desativadas?
As instruções além do SSE3 foram desativadas manualmente porque a microarquitetura K10 não as suporta.
7. Quantos núcleos o processador AMD FX-8150 tem?
O processador AMD FX-8150 possui oito núcleos, tornando-o um processador octa-core.
8. Qual é a velocidade do relógio base do núcleo i3-8100?
A velocidade do relógio base do núcleo i3-8100 é 3.6 GHz.
9. Quanto cache o FX-8150 tem?
O FX-8150 tem um total de 8192 kb de cache, com 384 kb de cache L1, 256k de cache L2 por núcleo e 6 MB de cache L3 compartilhado.
10. Qual é a litografia do núcleo i3-8100?
O Core i3-8100 tem uma litografia de 14 nm.
11. Qual é a temperatura máxima para o FX-8150?
A temperatura central máxima para o FX-8150 é 61 ° C.
12. Qual é o tipo de soquete para o núcleo i3-8100?
O tipo de soquete para o núcleo i3-8100 é fclga1151.
13. O Core i3-8100 suporta 64 bits?
Sim, o Core i3-8100 suporta 64 bits.
14. Que extensões conjuntas de instruções o Core i3-8100 suporta?
O Core i3-8100 suporta Intel SSE4.1, Intel SSE4.2, e Intel AVX2 Instruções Conjunto de Extensões.
15. O FX-8150 tem tecnologia Turbo Boost?
Não, o FX-8150 não possui tecnologia Turbo Boost.
Revisão da AMD FX-8150
Para ser mais exato, comparamos a AMD FX-8150, Phenom II X6 1100T e Core i7-2600 em 3.Frequência de 6 GHz e com apenas dois núcleos computacionais ativos. Para garantir a pureza do experimento, desativamos todas. Usamos um conjunto de benchmarks sintéticos simples na suíte Sisoft Sandra 2011, onde desativamos manualmente todas as instruções além do SSE3, porque a microarquitetura K10 não faz’t Suporte -os.
AMD FX-8150 vs Intel Core i3-8100
Comparando o tipo de mercado do processador Core i3-8100 e FX-8150 (Desktop ou Notebook), Arquitetura, Vendas de início e preço.
Lugar na classificação de desempenho | 1163 | 1283 |
Lugar por popularidade | 62 | sem dados |
Custo-benefício | 9.36 | 1.70 |
Segmento de mercado | Processador de desktop | Processador de desktop |
Series | Intel Core i3 | sem dados |
Codinome de arquitetura | Coffee Lake (2017-2019) | Zambeze (2011-2012) |
Data de lançamento | 24 de setembro de 2017 (5 anos) | 12 de outubro de 2011 (11 anos) |
Preço de lançamento (MSRP) | $ 117 | sem dados |
Preço atual | US $ 138 (1.2x msrp) | $ 102 |
Custo-benefício
Desempenho por preço, maior é melhor.
Especificações técnicas
Parâmetros básicos do núcleo i3-8100 e FX-8150, como número de núcleos, número de roscas, frequência base e relógio de impulso turbo, litografia, tamanho do cache e estado de bloqueio multiplicador. Esses parâmetros dizem indiretamente a velocidade da CPU, embora, para uma avaliação mais precisa, você deve considerar os resultados dos testes.
Núcleos físicos | 4 (quad-core) | 8 (octa-core) |
Tópicos | 4 | 8 |
Velocidade do relógio base | 3.6 GHz | 3.6 GHz |
Aumente a velocidade do relógio | 3.6 GHz | 4.2 GHz |
Suporte de ônibus | 4 × 8 gt/s | sem dados |
Cache L1 | 64K (por núcleo) | 384 KB |
L2 Cache | 256k (por núcleo) | 8192 KB |
Cache L3 | 6 MB (compartilhado) | 8192 KB |
Litografia de chip | 14 nm | 32 nm |
Tamanho da matriz | 126 mm 2 | 315 mm 2 |
Temperatura máxima do núcleo | 100 ° C | 61 ° C |
Temperatura máxima do caso (TCase) | 72 ° C | sem dados |
Número de transistores | sem dados | 1.200 milhões |
Suporte de 64 bits | + | + |
Compatibilidade do Windows 11 | + | – |
Multiplicador desbloqueado | – | 1 |
P0 VCORE tensão | sem dados | Min: 1.0125 V – Máx: 1.4125 v |
Compatibilidade
Informações sobre a compatibilidade do núcleo i3-8100 e FX-8150 com outros componentes do computador: placa-mãe (procure tipo de soquete), unidade de fonte de alimentação (procure consumo de energia) etc. Útil ao planejar uma configuração futura de computador ou atualizar um existente. Observe que o consumo de energia de alguns processadores pode muito bem exceder seu TDP nominal, mesmo sem overclock. Alguns podem até dobrar suas térmicas declaradas, uma vez que a placa -mãe permite ajustar os parâmetros de energia da CPU.
Número de CPUs em uma configuração | 1 | 1 |
Soquete | FCLGA1151 | AM3+ |
Consumo de energia (TDP) | 65 watt | 125 watt |
Tecnologias e extensões
Soluções tecnológicas e instruções adicionais suportadas pelo Core i3-8100 e FX-8150. Você provavelmente precisará dessas informações se precisar de alguma tecnologia específica.
Extensões do conjunto de instruções | Intel® SSE4.1, Intel® SSE4.2, Intel® Avx2 | sem dados |
Aes-ni | + | + |
FMA | sem dados | + |
Avx | + | + |
Speedstep aprimorado (EIST) | + | sem dados |
Speedstep aprimorado (EIST) | + | sem dados |
Tecnologia Turbo Boost | – | sem dados |
Tecnologia de hiper-lida | – | sem dados |
TSX | – | sem dados |
Estados ociosos | + | sem dados |
Monitoramento térmico | + | sem dados |
Sipp | – | sem dados |
Tecnologias de segurança
Tecnologias Core i3-8100 e FX-8150 destinadas a melhorar a segurança, por exemplo, protegendo contra hacks.
TXT | – | sem dados |
Edb | + | sem dados |
Chave segura | + | sem dados |
Mpx | + | sem dados |
Proteção de identidade | + | sem dados |
SGX | Sim com Intel® Me | sem dados |
Guarda do sistema operacional | + | sem dados |
Tecnologias de virtualização
As tecnologias de velocidade de máquina virtual suportadas pelo Core i3-8100 e FX-8150 são enumeradas aqui.
AMD-V | sem dados | + |
Vt-d | + | sem dados |
Vt-x | + | sem dados |
Ept | + | sem dados |
Especificações de memória
Tipos, quantidade máxima e quantidade de canal de RAM apoiada pelo Core i3-8100 e FX-8150. Dependendo das placas -mãe, frequências de memória mais altas podem ser suportadas.
Tipos de memória suportados | DDR4-2400 | Ddr3 |
Tamanho máximo da memória | 64 GB | sem dados |
Canais máximos de memória | 2 | sem dados |
Largura de banda de memória máxima | 37.5 GB/s | sem dados |
Suporte à memória ECC | + | sem dados |
Especificações gráficas
Parâmetros gerais de GPUs integradas, se houver.
Placa gráfica integrada | Intel UHD Graphics 630 | sem dados |
Memória do vídeo max | 64 GB | sem dados |
Vídeo de sincronização rápida | + | sem dados |
Vídeo claro | + | sem dados |
Limpar o vídeo HD | + | sem dados |
Frequência máxima de gráficos | 1.1 ghz | sem dados |
Intru 3d | + | sem dados |
Interfaces gráficas
Interfaces e conexões disponíveis do Core i3-8100 e FX-8150 Integrated GPUs.
Número de exibições suportadas | 3 | sem dados |
Qualidade de imagem gráfica
Resoluções máximas de exibição suportadas pelas GPUs integradas Core i3-8100 e FX-8150, incluindo resoluções em diferentes interfaces.
Suporte de resolução em 4K | + | sem dados |
Resolução máxima sobre HDMI 1.4 | 4096×2304@24Hz | sem dados |
Resolução máxima sobre EDP | 4096×2304@60Hz | sem dados |
Resolução máxima sobre o DisplayPort | 4096×2304@60Hz | sem dados |
Suporte da API gráfica
APIs suportadas pelas GPUs integradas do Core i3-8100 e FX-8150, às vezes as versões da API são incluídas.
DirectX | 12 | sem dados |
Opengl | 4.5 | sem dados |
Periféricos
Especificações e conexão de periféricos suportados pelo Core i3-8100 e FX-8150.
Versão do PCIE | 3.0 | n / D |
PCI Express Lanes | 16 | sem dados |
Desempenho de referência sintética
Vários resultados de referência dos processadores em comparação. A pontuação geral é medida em pontos na faixa de 0 a 100, maior é melhor.
Pontuação de referência sintética combinada
Esta é a nossa classificação de desempenho de referência combinada. Estamos melhorando regularmente nossos algoritmos de combinação, mas se você encontrar algumas inconsistências percebidas, fique à vontade para falar na seção de comentários, geralmente corrigimos problemas rapidamente.
Revisão da AMD FX-8150
A espera finalmente acabou
Lá’tem sido muita confusão em torno do escavador desde que ouvimos sobre a nova microarquitetura da CPU em julho de 2007 – fomos informados de que era um design modular da CPU que incorporaria uma GPU. E que haveria apenas dois sabores do processador de fusão-um baseado em Bulldozer para CPUs de alto desempenho e outro design de Bobcat para sistemas de baixa potência.
A maior parte disso acabou sendo verdade, embora lá’S Não há unidade gráfica em uma CPU de escavadeira e temos o design do processador Llano para preencher a lacuna entre Bobcat e Bulldozer.
Mais confuso era se o bulldozer foi feito para uso doméstico. Em um briefing em agosto de 2010, fomos informados explicitamente que, ‘[Bulldozer] oferece 33 % a mais núcleos e um aumento estimado de 50 % na taxa de transferência no mesmo envelope de poder que o Magny-Cours’, AMD’s Design Opteron de ponta atual.
Também houve conversas de que os processadores de bulldozer deveriam entrar nas placas -mãe G34 com uma atualização do BIOS e que um novo processador Llano foi destinado ao uso de mesa. Logo depois, Bulldozer foi confirmado como um desktop, bem como o design da CPU de servidor e estação de trabalho; Após um atraso de vários meses, é’está finalmente à venda.
Agora que temos uma CPU de escavadeira para testar (mais os revisores atendentes’ guias, entrevistas e todo o resto), podemos limpar todos os mitos e rumores que o cercaram. O FX-8150 é o primeiro processador que’Vi isso’s baseado na arquitetura da CPU de escavadeira, e isso’é o pai da nova formação com uma frequência nominal de 3.6GHz (aumentando até 4.2GHz).
O FX-8150 é acompanhado por três outros processadores da marca FX no lançamento, com outros três modelos que chegam a algum momento depois de hoje. Aqui’é uma tabela para resumir os modelos que conhecemos, antes de continuarmos e conversamos sobre eles mais um pouco.
Processadores da série FX da AMD | |||||||||
Nome | Frequência nominal | Frequência do núcleo turbo | Max Turbo Frequency | TDP | Núcleos | Cache de nível 2 | Cache de nível 3 | Frequência de Northbridge | Srp |
FX-8150* | 3.6GHz | 3.9GHz | 4.2GHz | 125W | 8 | 8 MB | 8 MB | 2.2GHz | US $ 245 |
FX-8120* | 3.1 GHz | 3.4GHz | 4GHz | 95W e 125W | 8 | 8 MB | 8 MB | 2.2GHz | $ 205 |
FX-8100 | 2.8GHz | 3.1 GHz | 3.7GHz | 95W | 8 | 8 MB | 8 MB | 2GHz | Desconhecido |
FX-6100* | 3.3GHz | 3.6GHz | 3.9GHz | 95W | 6 | 6 MB | 8 MB | 2GHz | $ 165 |
FX-4170 | 4.2GHz | Nenhum | 4.3GHz | 125W | 4 | 4 MB | 8 MB | 2.2GHz | Desconhecido |
FX-B4150 | 3.8GHz | 3.9GHz | 4GHz | 95W | 4 | 4 MB | 8 MB | 2.2GHz | Desconhecido |
FX-4100* | 3.6GHz | 3.7GHz | 3.8GHz | 95W | 4 | 4 MB | 8 MB | 2GHz | $ 115 |
*Lançar modelos |
Antes de mergulhar nas especificações,’vale a pena notar que todos os processadores FX estão totalmente desbloqueados, o que significa que lá’Não é necessária a marca da edição negra nós’me acostumou a. Nenhuma das faixas de FX possui uma unidade gráfica integrada, que compreensível, por um lado, como a AMD já lançou dois novos projetos de processadores este ano com gráficos integrados, enquanto o Intel muito maior nos deu apenas um. Entregar três APUs radicalmente novos em um ano seria surpreendente. Ainda mais quando você olha para o design da CPU de escavadeira, pois lá’é muito novo trabalho de design radical que entrou nele.
Como na série A e e da série E APUS, lá’Não é a marca além da carta – a AMD planeja matar o maior número possível de nomes de marcas (incluindo ATI) por um tempo, e a empresa fez exatamente isso com este lançamento. No que diz respeito às marcas reais, a AMD agora só tem Vision, Radeon, FirePro e Opteron.
A AMD está chamando o FX-8150 do mundo’s Primeiro processador de oito núcleos, embora para alguma controvérsia-discutimos o que’está em um núcleo? mais tarde, mas seguirá uma visão geral do design da CPU aqui. As CPUs de bulldozer são compostas por módulos, cada um dos quais possui duas unidades de execução e alguns recursos compartilhados, como buscar, decodificar, unidade de ponto flutuante e 2 MB de cache de nível 2. Esses módulos podem então ser aparafusados para formar CPUs de 4, 6 ou 8 núcleos-o bulldozer é um design muito modular, assim como as CPUs Intel têm sido modulares em sua construção há algum tempo (já que a série Core i7-900, com sede em Nehalem, em novembro de 2008).
Um módulo não é’Apenas com um par de núcleos de execução K10 despojados despojados em algumas unidades compartilhadas, no entanto, o escavador é um design completamente novo (e filosofia de design) da AMD. Como tal, este artigo é bastante longo.
Especificações da AMD FX-8150
- Frequência 3.7GHz
- Frequência turbo até 4.2GHz
- Essencial Bulldozer
- Processo de manufatura 32nm
- Número de núcleos oito físicos
- Controlador de memória DDR3 de canal duplo
- Cache Dados de 8 x 16kb L1, 4 x 64kb L1 Instrução, 4 x 2MB L2, 4 x 2MB L3
- Embalagem Socket AM3+
- Potência de projeto térmico (TDP 125W
- Características SSE, SSE2, SSE3, SSE4A, SSE 4.1, SSE 4.2, AVX de 256 bits, aesni, pclmulqdq, amd64, legal’n’Quiet 3.0, AMD-V, MMX, FMA4, XOP
Quero comentar? Por favor entre.
Revisão: AMD Bulldozer FX-8150
Adicione ao meu cofre:
Adeus, fenômeno, olá, FX
K10, uma despedida de despedida
A AMD retirou uma quilometragem significativa de seu Athlon e Phenom CPUs. Rastrear a linhagem até 2003 com o lançamento do Athlon 64, Modificações de arquitetura-K8 para K10-Die encolhe, a longevidade do soquete e o corte de preços ao longo da prancha significa que, oito anos depois, os chips de seis núcleos do Phenom II permanecem sólidos para uma compilação de Mainstram.
Enquanto isso, o concorrente Intel lançou uma série de novas tecnologias e arquiteturas nos mesmos oito anos, culminando com os impressionantes Chips Core de segunda geração lançados em janeiro de 2011. Para desenhar uma analogia tênue de boxe, o Phenom II da AMD é um boxeador cujo passado seu auge e, embora o corte de preços possa mascarar uma ou duas ou duas, não resta muito tempo até que ele atinja a tela e simplesmente não se levanta.
A AMD não ficou parada enquanto a Intel está “tocando” seu caminho para arquiteturas cada vez mais eficientes e magras de CPU-and-GPU. Ele trouxe sua própria fusão para brincar com o novo Llano, empacotando uma quantidade saudável de desempenho da GPU com uma CPU adequada. Agora pronto para levar a luta para a Intel está uma variedade de novas CPUs convencionais que são projetadas para substituir o Phenom II. Entre na família Bulldozer.
FX, o campeão de libra por libra?
Fazendo uma pausa limpa da arquitetura Phenom II derivada do K10, tudo sobre Bulldozer é novo. Há um novo processo de fabricação, arquitetura geral, suporte de ISA, configuração de cache, sistema de entrega de energia e marca: ufa! Vamos ficar sob a pele do escavador examinando cada um por sua vez.
Produção de 32 nm
Seguindo o processo adotado para o CPU e a GPU Llano, a AMD está usando a fabricação de portões de metal alta-k de 32 nm de silicone sobre o alto-k da GlobalFoundries. 32nm é obrigatório no final de 2011 e permite que a AMD espremesse mais transistores do que o processo de 45 nm usado para o fenômeno II.
Mas o Glofo sofreu problemas bem documentados para garantir um suprimento constante de lascas de llano. Como isso se traduzirá em rendimentos de escavadeira é um segredo intimamente guardado por enquanto, embora a máquina de relações públicas da AMD tenha respondido afirmando que haverá ‘suprimento adequado’ no canal, o que quer que isso signifique realmente. A AMD precisa absolutamente apoiar seus parceiros e o canal quando confrontado com a abundância de chips principais voando dos fabs da Intel.
Arquitetura – um novo começo
Aqui é onde fica interessante. A AMD entende agudamente que qualquer nova arquitetura precisa escalar em termos de núcleos, energia e desempenho, permitindo que ele se encaixe em laptops, máquinas de mesa e servidores. E é em resposta a essa escala necessária que, literalmente, uma arquitetura modular foi projetada.
Aqui está Bulldozer como visto em uma visão geral de alto nível. Um rápido olhar mostra que haverá quatro núcleos de execução cercados por muito cache – 16 MB, de fato. Com a memória de memória DDR3 de canal duplo interface com o cache Northbridge, L3 e quatro links para o restante do sistema, não parece haver muito novo aqui. Não escapará sua atenção de que em nenhuma parte da imagem existe referência aos gráficos integrados: Bulldozer é uma CPU pura.
Mas os primeiros olhares podem ser enganosos. Veja bem, embora não haja provisão para gráficos integrados, existem oito núcleos de CPU presentes aqui, mas cada núcleo não se encaixa muito no molde totalmente independente estabelecido por processadores de Yore. Há alguns explicando em andamento, então vamos zoom em um quarto do chip.
Aqui está uma visão geral simples do que está acontecendo em um módulo. É importante entender que Bulldozer é construído através de módulos, onde um chip de oito núcleos possui quatro módulos, um chip de seis núcleos tem três módulos ativos e um quatro núcleos, bem, dois: você recebe a ideia. Colocando em perspectiva, um chip de quatro módulos e oito núcleos pesa com quase dois bilhões de transistores (ahem, 1.2 bilhões, depois que a AMD reconhece o erro de contagem) e tem um tamanho de matriz na região de 315 mm². Curiosamente, esse é o mesmo tamanho de um Phenom II Die, embora seja fabricado no processo maior de 45nm. A Intel, no entanto, consegue embalar quatro núcleos, oito fios e gráficos integrados (Core i7 2600k) em um dado significativamente menor.
A AMD não possui dois núcleos totalmente independentes por módulo, mas também não é tão integrado quanto, por exemplo, os núcleos de hiper-threads encontrados nos mais recentes chips da Intel, onde os recursos são bem e verdadeiramente compartilhados entre os processadores. A razão para esse mishmash do núcleo repousa com o tamanho do diário de equilíbrio – e, portanto, custo de fabricação – contra a taxa de transferência do núcleo. Em um mundo que pouco se importava com o custo econômico, a AMD projetaria uma escavadeira com oito núcleos independentes, juntamente com todo o silício por core necessário que implica.
Tomando Bulldozer para o que é, vamos assumir que dois tópicos estão se movendo através deste módulo, para serem processados em cada núcleo. Eles precisam compartilhar o estágio de configuração – buscar, decodificar – bem como o agendador de ponto flutuante (muito maior) e, trabalhando um ponto importante para entender, isso não aconteceria em núcleos verdadeiramente separados. No entanto, o estágio de decodificação foi aumentado para quatro instruções por ciclo do relógio, acima dos três no fenômeno II (embora por núcleo) e, através de uma técnica chamada Branch Fusion, Bulldozer pode realmente tornar o estágio de decodificação mais amplo.
Avançando, cada núcleo pode lidar com dois ALUS e dois AGUS, embora seja lembrado que o Phenom II tem três cada, e você nos verá falar mais sobre isso durante o desempenho de benchmark de thread único. De volta à pista, cada núcleo tem apenas 16 kb de cache L1 e, embora esperássemos mais, a AMD diz que ter um cache L2 significativo ajuda, onde cada módulo tem 2 MB exclusivo à sua disposição.
Voltando ao agendador do FP, este recurso compartilhado possui um sistema de loopback para informar os núcleos separados que o trabalho foi concluído. E esse trabalho é feito por quatro tubos – dois FMAC de 128 bits e dois de 128 bits – assim como o Phenom II.
Considerado isoladamente, as opções de design da AMD nos dão uma idéia bastante clara da ideologia por trás do Bulldozer. Desempenho de thread único, onde um thread tem todo o módulo para si mesmo, geralmente não é importante aqui, evidenciado pela configuração reduzida de ALU e AGU, e o Phenom II pode muito bem dar uma boa parte em tais circunstâncias, principalmente quando julgado contra aplicativos que usam o código antigo (er). Aumente a carga preenchendo o módulo com dois fios e o compartilhamento inevitável de recursos ocorre, especialmente no topo, mas as degradações de desempenho são melhoradas por ter um decodificador de quatro largura.
É difícil saber o quão potente os módulos de escavadeira são sem conhecimento prévio do tipo de carga de trabalho. Se ele usa código não otimizado para Bulldozer, há um número real de possibilidades será mais baixo complicando as questões, a AMD apresenta um pipeline mais longo antes que os threads possam ser totalmente computados. O processador 101 nos diz que ter esse pipeline abre a possibilidade de barracas caras e malpretes de ramo, caso as questões dão errado. Adam Kozak, da AMD, nos informou que Bulldozer tem lógica e previsão de pré-busca e independentes (divorciadas) ‘muito aprimoradas’.
Completando tudo do ponto de vista da arquitetura básica, o cache L3 controlado por Northbridge é compartilhado entre os núcleos. Isso totaliza 8 MB, independentemente de quantos módulos são implementados, o que significa que os chips com menos núcleos recebem excessivamente mais cache.
O Northbridge também controla os acessos da memória do sistema. Mantendo a tradição e optando por uma configuração de DDR3 de canal duplo, ostensivamente porque há muito cache no chip disponível, a AMD aumenta a velocidade de 1.866mhz de apoio oficial
Bulldozer chegou: AMD FX-8150 Processor Review
A grande revolução sobre a qual a AMD está falando há tanto tempo! Hoje conseguimos encontrar um processador de desktop de oito núcleos baseado na microarquitetura de bulldozer há muito esperada. Descubra em nossa revisão se a AMD conseguiu recuperar a liderança perdida há muito tempo.
Sem dúvida, que novos processadores AMD baseados na microarquitetura de escavadeiras são um dos produtos mais esperados, não apenas do ano, mas pelo menos dos últimos cinco. Existem várias razões para isso e também para o fato de que os produtos da AMD têm tantos fãs. Tenho certeza de que alguns de vocês se lembram dos momentos em que os processadores da AMD eram melhores que os intel em todos os aspectos. Alguns usuários gostam de produtos AMD para a combinação equilibrada de preço e desempenho que eles têm a oferecer. E alguns podem ter sido levados pela paixão, com a qual conversaram sobre as vantagens da nova microarquitetura em que estão trabalhando. Tudo isso combinado com os anos de espera pela nova geração de processadores de escavadeira produziu um resultado bastante lógico: você está lendo esta revisão com grande interesse e emoção.
No entanto, a espera definitivamente valeu a pena. O sucesso da microarquitetura do processador Bulldozer determinará a situação no mercado de processadores nos próximos anos. Neste momento, apenas a Intel possui recursos de engenharia e capacidades de produção suficientes para lançar novas microarquiteturas a cada dois a três anos. Quanto à AMD, eles precisam seguir um ritmo muito mais razoável. Pode causá -lo como um tanto assustador, mas a microarquitetura atualmente usada nos processadores Phenom II e Athlon II remonta a 2003. Só houve menor “Cosmético” mudanças feitas desde então. Portanto, realmente não esperamos que o lançamento de processadores de escavadeira acelere o processo de desenvolvimento da AMD. Sem dúvida, o novo escavador será a base para todos os produtos AMD de alto desempenho nos próximos anos.
A versão atual do roteiro da empresa explora essa microarquitetura até 2014, mas provavelmente continuará sua existência além desse ponto.
AMD’A promessa de entregar pelo menos 10-15% de aumento de desempenho a cada ano é mais uma causa de preocupação do que otimismo. O aumento da frequência do relógio provavelmente será a principal maneira de aumentar o desempenho, com as melhorias microarquitetônicas sendo mais em segundo plano.
Em outras palavras, o sucesso da microarquitetura de bulldozer hoje terá um efeito de mudança de vida na AMD’S Futuro, determinará o quão competitivos seus produtos serão e no final o que acontecerá com o mercado de processadores em geral.
Claro que nós podemos’negar que Bulldozer não é o único produto -chave para a AMD. Atualmente, esta microarquitetura está posicionada para sistemas de desktop e servidor de alto desempenho. Ao mesmo tempo, a AMD tem outros produtos para o restante do mercado. Por exemplo, processadores de baixo custo eficiente de energia na microarquitetura Bobcat lançados no início deste ano ou Llano Apus são igualmente importantes para a empresa. E nossos testes mostraram que esses produtos foram bem -sucedidos que podem se tornar uma excelente plataforma para netbooks e nettops, além de alimentar as plataformas integradas principais.
No entanto, Bulldozer’S sucesso ou fracasso terá um significado muito maior a longo prazo. Primeiro, esta microarquitetura tem como alvo os segmentos de mercado com margem de lucro muito maior-servidores e desktops de alto desempenho. Portanto, pode ter um grande impacto na AMD’s Situação financeira. Segundo, os engenheiros envolvidos em novos projetos e desenvolvimento de microarquitetos não têm nada a ver com o sucesso da AMD’S C, E e A Série Processores. Essas CPUs (ou APUs na AMD’s Termos) devem seu sucesso no mercado aos núcleos gráficos Radeon HD integrados que entraram nos processadores AMD contemporâneos devido à aquisição oportuna da ATI Technologies. Quanto a Bulldozer, é mais um teste de qualificação para a equipe de engenharia que trabalha especificamente na microarquitetura de núcleos computacionais. E terceiro, Bulldozer acabará se tornando a base para toda a linha da AMD CPU, exceto os produtos projetados para plataformas com eficiência energética. Então, um dia, essa microarquitetura também chegará aos segmentos de mercado mais baixos, substituindo completamente o K10 em todos os lugares, mesmo em processadores Llano.
No geral, é difícil superestimar a importância de um lançamento bem -sucedido da microarquitetura de bulldozer. É um produto marco no nível psicológico e prático, é por isso que realmente esperamos ver algo como um novo K7 ou K8.
Mas mesmo antes de chegarmos aos testes de desempenho reais, podemos afirmar que há muito pouca chance de repetir o fenômeno acima mencionado. A última vez que a Intel meio que ajudou a AMD a ganhar a liderança, tentando promover ativamente uma microarquitetura Netburst não muito ideal. Naquela época, os engenheiros da Intel apostam no crescimento das frequências do relógio, que finalmente tropeçaram em correntes de vazamento gigantes. Mas quando a Intel revisou sua estratégia e lançou a nova microarquitetura principal, que também estava tentando processar o maior número possível de instruções por relógio, a AMD teve que voltar para um segundo lugar onde está desde então.
Obviamente, é muito difícil superar os processadores Intel contemporâneos no número de instruções processadas por ciclo do relógio. Hoje’S Sandy Bridge Microarchitecture é o resultado de pelo menos três rodadas de otimizações aplicadas ao design, o que foi eficiente desde o início. Portanto, podemos’T Esperando. Especialmente, já que os engenheiros da AMD não fizeram’até tenho um objetivo como esse.
Bulldozer tem um alvo primário diferente. De acordo com os desenvolvedores, os processadores baseados nessa microarquitetura devem ser executados rapidamente devido a altas frequências de relógio e maior número de núcleos computacionais em comparação com os antecessores e concorrentes. Ao mesmo tempo, eles devem permanecer bastante econômicos, eu.e. Tenha uma pequena morte semicondutora e dissipação de calor por núcleo relativamente baixa.
Segredos da AMD’s design multi-core
É bastante lógico que o aumento no número de núcleos de processador inevitavelmente leve ao aumento do tamanho do processador morto. Como resultado, a complexidade do processo de fabricação e os custos de produção também aumenta. Portanto, os processadores com o maior número de núcleos, por exemplo, são atualmente usados apenas no segmento do servidor, porque os clientes corporativos estão muito mais ansiosos para pagar mais do que os usuários regulares. AMD’A estratégia para aumentar o número de núcleos do processador, mantendo seu preço aceitável, implica que eles precisarão simplificar os núcleos de acordo. No entanto, por outro lado, simplificar os núcleos pode produzir algumas consequências indesejadas, como diminuir o desempenho do sistema em aplicativos que não podem ser paralelos bem, que atualmente ainda são bastante numerosos.
Portanto, os engenheiros da AMD decidiram tomar uma maneira única alternativa. A microarquitetura de núcleos individuais tornou -se mais complexa, aumentando o número de instruções executadas por ciclo de relógio único sempre que possível.
Mas partes dos recursos, que normalmente existem em cada núcleo do processador, mas têm eficiência excessiva, agora são compartilhadas entre pares de núcleos.
As unidades de dual-core resultantes se tornaram os principais blocos de construção para os processadores de escavadeira. AMD refere -se a essas unidades como módulos. Cada um deles possui dois conjuntos totalmente funcionais de unidades de execução inteira. No entanto, a unidade de ponto flutuante, unidades de pré -busca de dados e decodificadores de instruções, bem como o cache L2 são compartilhados entre os dois núcleos. Segundo os desenvolvedores, esses componentes têm potencial suficiente para alimentar os dois núcleos, porque nesses casos em que há um desses conjuntos por núcleo, geralmente está em marcha lenta. Além disso, os atrasos em sua operação sem paralisação não têm nenhum efeito sério no desempenho geral resultante.
De acordo com a AMD, um único módulo projetado como descrito acima pode ser executado na capacidade de 80% de um processador de núcleo duplo totalmente funcional. No entanto, eles economizam cerca de 44% do orçamento do transistor (e consequentemente do tamanho da matriz semicondutores).
Essa abordagem inventiva para aumentar a densidade de núcleos de processador da AMD permitiu à empresa projetar um semicondutor de oito núcleos (ou quatro modulas).
Além disso, uma parte bastante significativa do dado é alocada para a memória de cache. Os caches do processador L2 compartilhados entre pares de núcleos de CPU em um único módulo são 2 MB cada, e a memória de cache L3 compartilhada em todo o processador é de 8 MB grande. Dessa forma, se levarmos em consideração a AMD’s design de cache exclusivo tradicional, podemos afirmar que a quantidade total de memória de cache atinge 16 MB por CPU de oito núcleos. Ao mesmo tempo, o tamanho do morrer de escavadeira permanece dentro dos limites razoáveis, o que significa que os desenvolvedores da AMD realmente atingiram seu objetivo final.
Se falarmos com números absolutos, significa que os processadores de oito núcleos terão uma morte menor de semicondutores do que, digamos, CPUs Thuban de seis núcleos (Fenom II X6) com microarquitetura K10 dentro. No entanto, é importante ter em mente que o processador Bulldozer será fabricado usando um processo de produção mais avançado de 32 nm. E comparado aos processadores contemporâneos de ponte Intel Sandy Bridge, as novas CPUs AMD de oito núcleos terão apenas 45% maior.
No entanto, devido à tecnologia de hiper-linear, o sistema operacional também pode ver os processadores de ponte Intel Sandy Quad-core como os de oito núcleos, assim como o bulldozer. Esse fato pode fazer uma pergunta sobre como é apropriado chamar Bulldozer de um processador de oito núcleos de pleno direito. No entanto, é importante entender que a AMD e a Intel adotaram abordagens diferentes para implementar a execução simultânea de oito threads computacionais. Os desenvolvedores da Intel armaram sua microarquitetura com a capacidade de executar dois threads computacionais em um único núcleo usando apenas um conjunto de unidades de execução. AMD, pelo contrário, removeu tudo “desnecessário” extras de dois núcleos totalmente funcionais, mas mantiveram dois conjuntos de unidades de execução dentro de cada módulo.
Como resultado, Intel’A tecnologia de hiper-threading aumenta o desempenho múltiplo apenas em cerca de 15 a 20%, enquanto a AMD’S Solução produziu um aumento de 80% na transição de 4 para 8 threads.
Embora eu tenha que admitir que o semicondutor morre do processador de oito núcleos se parece mais com um de quatro núcleos por causa de sua estrutura interna modular.
Mais instruções por relógio?
Obviamente, aumentar o número de núcleos não será uma panacéia final. Ficou claro quando a AMD lançou seus processadores Phenom II X6, que eram inferiores à ponte arenosa quad-core na performance. Portanto, os desenvolvedores da AMD não fizeram’T Pare em extensas modificações de design. A microarquitetura básica de escavadeira foi alterada praticamente completamente em comparação com o K10, portanto, há esperança de que os sistemas AMD acelerem não apenas em tarefas multithread, mas também em aplicações menos paralelas. E essas esperanças são apoiadas por algumas evidências muito objetivas. Enquanto as microarquiteturas anteriores da AMD foram projetadas para processar até três instruções por relógio (em um único núcleo), a microarquitetura de escavadeira deve ser capaz de processar quatro instruções por relógio, o que o torna muito próximo ao processador concorrente na microarquitetura do núcleo.
Podemos ver algumas mudanças de qualidade nos primeiros estágios do pipeline de execução: durante a pré -busca e decodificação de instruções. Esses estágios são compartilhados entre os pares de núcleos em um único módulo, então a AMD garantiu que eles não fizessem’T transformar em um gargalo arquitetônico. As instruções a serem decodificadas são pré-procuradas do cache L1i em blocos de 32 bytes-o dobro do que nos processadores baseados em núcleo de segunda geração. O cache L1i real para instruções é 64 kb grande e tem associatividade bidirecional. As instruções a serem decodificadas são pré -carregadas especulativamente nesse cache da memória de cache L2.
As instruções são pré -buscadas pela unidade de previsão de ramificação contendo dois conjuntos de buffers, que monitoram independentemente a atividade de diferentes núcleos. Dessa forma, Bulldozer não’t “se perder” nos tópicos durante a previsão de ramificação. Como a nova microarquitetura foi projetada para funcionar em alta frequência de relógio, a qualidade das previsões de ramificação é extremamente importante. Portanto, a AMD mudou completamente os algoritmos de previsão de ramificação e agora eles esperam que a precisão da previsão do ramo no novo escavador melhore substancialmente.
Bulldozer’O decodificador de instrução s x86 também é compartilhado entre os dois núcleos e é capaz de decodificar até quatro instruções de entrada por ciclo do relógio. No entanto, seu desempenho é limitado por quatro macro-instrução (que são o resultado do processo de decodificação, na AMD’s Termos), enquanto as instruções x86 podem se desintegrar em 1-2 ou ainda mais macro-instrução. Portanto, embora o decodificador tenha se tornado 33% mais eficaz em comparação com a microarquitetura de geração anterior, seu desempenho pode não ser alto o suficiente para carregar o ideal de dois clusters inteiros e um cluster de ponto flutuante.
Devo dizer que eles também usaram algum tipo de tecnologia de fusão no novo bulldozer. Certos grupos de instruções x86 podem se unir e passar pelo decodificador como uma única instrução – a AMD chama isso de ramificação Fusion.
A macro-instrução decodificada é então distribuída a três grupos computacionais, dois dos quais são o restante dos núcleos computacionais de pleno direito e outro, o cluster de ponto flutuante, é compartilhado pelos núcleos. Cada um desses clusters tem suas próprias instruções reordenando lógicas e seu próprio agendador. Obviamente, isso significa que a AMD pode eventualmente substituir ou modificar totalmente alguns desses clusters em seus futuros produtos.
Instruções O processo de reordenação de reordenação em cada cluster é baseado em um arquivo de registro físico. Este arquivo armazena links para registrar o conteúdo e eliminar a necessidade de mover constantemente os dados dentro do processador assim que as instruções do pedido são alterações. Essa abordagem substituiu o buffer de reordenação, porque um arquivo de registro físico é mais eficiente em termos de energia e mais tolerante ao aumento da frequência do relógio.
Os aglomerados inteiros contêm duas unidades de execução aritmética (ALU) e duas unidades para o trabalho com endereços de memória (AGU). Ao contrário da microarquitetura K10, há um ALU e um AGU menos, mas de acordo com a AMD, não deveria’T afeta severamente o desempenho, enquanto permite reduzir significativamente o tamanho da matriz. Eu posso acreditar facilmente nisso: não faz’t Desenhe muito sentido prático ter mais de dois ALU e dois AGU por cluster inteiro, porque o decodificador não pode enviar não mais de quatro macro-instrução por relógio para execução por ambos os clusters.
Ao mesmo tempo, as unidades de execução tornaram -se mais universais e mal diferem na funcionalidade.
A organização do sistema de memória de cache mudou drasticamente. Eles reduziram o tamanho do cache L1D de 64 kb para 16 kb e o tornaram inclusivo com gravação. Ao mesmo tempo eles aumentaram sua associativa para 4 vias e adicionaram um “Way Predictor”. Para compensar a redução séria de tamanho, eles aumentaram a largura de banda do cache de dados L1 de maneira bastante substancial, para que agora possa processar até três operações de 128 bits ao mesmo tempo-duas leituras e uma de gravação.
As mudanças na largura de banda do cache L1D estão obviamente conectadas à necessidade de implementar instruções AVX de 256 bits, que agora são suportadas na unidade FPU compartilhada. No entanto, não’t significa que as unidades de ponto flutuante agora se tornaram 256 bits. Na realidade, existem quatro unidades de 128 bits em um único módulo Bulldozer e as instruções AVX são decodificadas como pares conectados de operações de 128 bits. Portanto, os blocos de multiplicação acumulados (FMAC) de ponto flutuante se unem para executá-los e o desempenho do cluster de ponto flutuante cai em uma instrução AVX por módulo de processador por ciclo de relógio.
FPU não’T tem seu próprio cache L1, por isso esse cluster funciona com dados por meio de unidades inteiras.
Desde que os engenheiros da AMD decidiram implementar a Intel’S AVX-Instructions Suporte em seus processadores de escavadeira, eles também adicionaram suporte para outros conjuntos de instruções atuais, como o SSE4.2 e Aesni para aceleração de criptografia. Além disso, a AMD também introduziu algumas instruções próprias: multiplicação e adição tripla-operando (FMA4) e sua própria visão única do futuro desenvolvimento do AVX-XOP.
Bulldozer’O cache S L2 existe como uma única unidade dentro do módulo do processador e é compartilhada pelos núcleos. É de tamanho impressionante de 2 MB e tem associatividade de 16 vias. No entanto, a latência de um cache como esse aumentou para 18 a 20 relógios, enquanto a largura do ônibus permaneceu a mesma de antes-128 bits. Isso significa que, embora Bulldozer’O cache S L2 é grande, não é particularmente rápido: os concorrentes e predecessores atuais têm caches L2 com cerca de metade da latência. Devo dizer que, juntamente com um pequeno cache L1D com latência de 4 clock (que também é maior do que na microarquitetura K10), não faz’Parece muito bom. No entanto, a AMD insiste que eles aumentaram a latência de sua memória de cache apenas para garantir que a escavadeira seja capaz de executar em velocidades de relógio mais altas.
Além disso, os engenheiros da AMD implementaram uma unidade de pré -busca eficiente de dados capaz de carregar dados especulativos nos caches L1 e L2. Alega -se que essas unidades estão funcionando com muito mais eficiência e devem ser capazes de reconhecer estruturas de dados irregulares.
Teoricamente, Bulldozer parece muito atraente. A AMD revisou completamente sua antiga visão de microarquitetura do processador e criou um design totalmente novo. E devo dizer que esse novo design parece altamente promissor, porque a nova microarquitetura foi otimizada para processar quatro instruções por relógio, em vez de três em um núcleo do processador. Além disso, também suporta a fusão de instruções antes do estágio de decodificação, o que aumenta o desempenho efetivo ainda mais.
Mas tudo parece perfeita apenas quando olhamos para um núcleo e não levamos em consideração o fato de que, na realidade, esses núcleos são combinados em pares. E o módulo de bulldozer de núcleo duplo tem muitas unidades compartilhadas entre os núcleos. Em particular, como um módulo como esse tem apenas uma unidade de pré-busca de instrução e um decodificador, todo o bloco de núcleo duplo ainda pode processar apenas quatro instruções por relógio. E significa que, em termos de desempenho teórico, é um módulo de escavadeira, mas não o núcleo real que seria considerado um equivalente lógico a um único núcleo nos processadores de ponte de areia. Nesse caso, o módulo’A capacidade de executar dois threads parece uma resposta bastante lógica da AMD para a Intel’s Tecnologia de hiper-threading.
Obviamente, nossos testes de desempenho dos novos processadores vão pontual’s, mas mesmo neste momento, podemos’T ajuda a pensar que Bulldozer’S Posicionamento como processador de oito núcleos é mais um movimento de marketing. Na realidade, é o número de módulos que nos dá uma idéia melhor desses processadores’ potencial computacional. Em relação ao desempenho teórico, parece mais lógico comparar esses módulos com núcleos nos termos da microarquitetura intel intel de segunda geração Intel.
Portanto, uma pergunta lógica aparece: por que a AMD decidiu implementar o processamento de dois threads em um único módulo de processador? Por que não podia’Eles simplesmente combinam as unidades de execução em dois núcleos diferentes em um único cluster? Há várias razões para isso.
Primeiro, eles precisam de lógicas inter-processador avançado para poder carregar inúmeras unidades de execução idealmente. AMD, no entanto, não’t Conseguir com a implementação de previsão de ramificação altamente eficiente e previsão de dados e pré -busca. Portanto, é de responsabilidade dos desenvolvedores de software fornecer aplicativos compatíveis com escavadeira que suportam multi-threading, que são bem paralelamente e usam as unidades de execução de maneira ideal.
Segundo, um número maior de threads computacionais processados simultaneamente é uma coisa boa. Enquanto os usuários de desktop e especialmente os jogadores dificilmente se beneficiarão muito de oito núcleos de escavadeira bastante simples, essa microarquitetura deve ser altamente bem -vinda no ambiente do servidor. Portanto, é bem possível que o objetivo principal de Bulldozer esteja recuperando a AMD’s liderança no mercado de servidores, em vez de fazer os entusiastas do computador felizes.
Turbo Core para obter ainda mais turbo
A eficiência energética é uma das características mais importantes dos processadores contemporâneos. A Intel, por exemplo, coloca o objetivo de diminuir o consumo de energia de suas próximas microarquiteturas no topo da lista. AMD tem’ainda chegou lá, e seus engenheiros ainda estão perseguindo principalmente velocidades mais altas. Mas não’t significa que os desenvolvedores não fizeram’T prestar devida atenção ao escavado’S características térmicas e de energia. Pelo contrário, depois de llano, as abordagens principalmente novas para a eficiência energética chegaram aos processadores de escavadeiras. No entanto, neste caso, os desenvolvedores usaram o potencial libertado, não muito para economizar energia, mas para aumentar as frequências do relógio e, assim, melhorar o desempenho ainda mais.
Obviamente, o processo de produção mais refinado teve algum efeito positivo no consumo de energia e nas leituras de dissipação de calor. Bulldozer é fabricado com processo dielétrico de 32 nm de alto K, transistores de portão de metal e tecnologia SOI. Em outras palavras, é o mesmo processo GlobalFoundries que é usado para a Llano Manufacturing. Como resultado, a produção em massa Production Core Bulldozer Processores mantêm 1.4 V Tensão máxima do núcleo.
No entanto, a principal inovação herdada de Llano é o uso de bloqueio de poder, que deve desconectar o poder de partes selecionadas da CPU. Eles permitem o desligamento da energia em módulos de núcleo duplo selecionados e memória de cache em processadores de escavadeiras.
Quando ambos os núcleos computacionais dentro de um módulo alternam para o modo de economia de energia C6, a energia do módulo desliga. Infelizmente, essa tecnologia não pode se aplicar aos núcleos do processador, porque simplesmente não há núcleos individuais dentro de Bulldozer – eles compartilham alguns de seus recursos com os outros núcleos dentro dos mesmos módulos.
Os modos de economia de energia C6 também controlam a tecnologia Turbo Core em processadores de bulldozer. Quando pelo menos metade dos módulos do processador de escavadeira estiver desligado e no modo de economia de energia, sua tensão principal e frequências de relógio aumentam. Este modo forçado é chamado Max Turbo Boost.
No entanto, não há nada de novo no modo Max Turbo Boost, pois a AMD introduziu o mesmo overclock automático em seus processadores Thuban na microarquitetura K10. A coisa mais nova aqui é o modo All Core Boost, quando a frequência do relógio pode aumentar além de seu valor nominal, mesmo quando todos os núcleos do processador estão ativos. A versão aprimorada do Turbo Core implementada nos processadores de escavadeiras permite que eles avaliem com precisão seu consumo real de energia e dissipação de calor a julgar pelo nível de utilização de diferentes unidades. Então, se de acordo com o processador’S Estime O consumo atual de energia e a dissipação de calor estão bem abaixo dos valores do limite, o processador pode aumentar sua tensão e velocidade de relógio, mesmo que nenhum dos núcleos esteja no modo inativo.
Portanto, a frequência do relógio de processadores baseados em escavadeira é um valor extremamente variável. Pode mudar dramaticamente em um intervalo muito grande (até 900 MHz), dependendo do “peso” dos algoritmos executados e no número de núcleos ativos.
Atualização da plataforma de desktop
Com o lançamento da nova microarquitetura AMD, não apenas manteve o design da nova plataforma, mas também manteve a compatibilidade dos novos processadores de bulldozer com a infraestrutura existente. Como resultado, assim como seus antecessores, os novos processadores contêm uma ponte norte integrada com o cache L3, controlador de memória e controlador de barramento de hiper-transportar. Ao mesmo tempo, embora todos os processadores AMD e Intel lançados recentemente também tenham um controlador de barramento de gráficos PCI Express integrado, The New Bulldozer’t tem.
Assim como os processadores baseados na microarquitetura K10, a ponte norte em processadores Bulldozer trabalha em sua própria frequência de relógio, que é definida em 2.0-2.2 GHz para diferentes modelos de CPU. Observe que essa frequência tem algum efeito no desempenho, porque afeta diretamente a velocidade do cache L3. E como já dissemos, os novos processadores têm um cache de 8 MB L3 com associatividade de 64 vias. Por solicitação especial dos usuários corporativos, os dados armazenados nesta memória de cache são protegidos com o Código de Correção de Erros (ECC).
O controlador de memória nos processadores Bulldozer não faz’t Gabar qualquer coisa principalmente nova. Assim como antes, ele suporta DDR3 Sdram, usa design de canal duplo e, de fato, consiste em dois controladores de canal único independentes que podem funcionar como um par ou de forma independente. A única coisa que a AMD adicionou aqui é o suporte para tipos de memória mais rápidos, como DDR3-1867, e compatibilidade com módulos de memória com eficiência energética trabalhando em 1.25 V e 1.35 v.
Falando da modificação da Bulldozer de desktop codinome Zambeze, devemos mencionar que ele foi projetado para a nova plataforma Socket AM3+, também conhecida como Scorpius. Socket AM3+ tem 942 pinos, que é 1 pino mais que o soquete AM3. No entanto, apesar da diferença de pinos, o novo Zambeze será compatível com os quadros antigos do soquete AM3 também. Se você usar um novo processador com a placa principal antiga, você perderá apenas algumas funções selecionadas de gerenciamento de energia. Por exemplo, as frequências mudarão mais devagar com o núcleo turbo ativo e legal’n’Quieto e vdrop não funcionarão.
No entanto, a AMD trabalhou em estreita colaboração com todos os fabricantes de pranchas para garantir que, quando o Zambeze for lançado, haverá vários novos produtos disponíveis com base nos novos chipsets da série 900. O Flow-Chart abaixo mostra um sistema típico construído em torno do processador Zambebezi e o novo chipset:
A característica distintiva do novo AMD 990FX (e suas modificações mais simples – AMD 990X e AMD 970) é basicamente apenas o apoio de peculiaridades elétricas específicas do novo soquete AM3+. Não há novas interfaces de nenhum tipo. Assim como os chipsets da série 800, a nova ponte sul suporta seis portas de 6 Gbps e quatorze USB 2.0 portas. Mesmo que estivéssemos morrendo de vontade de ver coisas como PCI Express 3.0 ou pelo menos USB 3.0 Suporte nos novos chipsets, não há nada assim. É realmente muito estranho porque os chipsets para a plataforma FM1 de soquete inferior adquiriram USB 3.0 suporte.
As únicas diferenças entre as novas modificações de chipset são os tipos de configurações multi-GPU suportadas:
Linha da CPU Zambeze
O lançamento dos processadores Zambeze completa a AMD’s atualização de formação de processador. As CPUs de mesa com base na nova microarquitetura de escavadeira serão o novo produto principal, que se demitirá rapidamente do mercado todos os modelos Phenom II.
Para enfatizar a natureza inovadora de sua nova microarquitetura, a AMD usará um nome de marketing de diferença para seus processadores Zambezi – FX. Por um lado, ele se encaixa perfeitamente no novo sistema de nomenclatura que implica o uso de letras para a marcação da CPU, mas por outro. No entanto, esses tempos se foram há muito tempo, então vamos’s Dê uma olhada mais de perto no que estamos sendo oferecidos hoje.
Em breve, haverá quatro modelos de processador FX disponíveis no mercado: embora os modelos de processador Zambezei diferem não apenas pelas velocidades do relógio, mas também pelo número de núcleos computacionais ativos, todos serão construídos a partir do mesmo semicondutor unificado. Aqui está:
Para construir processadores com menos núcleos que oito, a AMD desativará alguns deles no semicondutor Die. Ainda é uma pergunta, se eles podem ser desbloqueados da mesma maneira que fizemos com os processadores na microarquitetura K10. No entanto, vimos todas as opções correspondentes na configuração do BIOS de várias pranchas construídas em torno dos novos chipsets da série 900, então há definitivamente a esperança do resultado positivo.
A produção de processadores de seis núcleos e quad-core implicará o bloqueio do núcleo por módulo. Isso significa que eles bloquearão todo o módulo de núcleo duplo, em vez de um segundo núcleo em dois módulos como esse, embora a última abordagem possa ser muito mais eficiente da perspectiva de desempenho. No entanto, os processadores Bulldozer seis e quad-core são apenas a maneira de utilizar as matrizes defeituosas, o que pode ser bastante numeroso, pois eles vão usar o novo processo de produção e o dado é bastante grande em tamanho.
Embora a AMD otimizasse a nova microarquitetura para operação em altas velocidades de relógio, podemos’Digo que eles alcançaram qualquer ruptura impressionante. O limiar de 4 GHz ainda não está alcançado e a frequência nominal do processador Top FX é ainda menor que o do Phenom II X4 980. Esperamos que, à medida que dominem o processo de produção, as frequências Zambeze continuem a crescer rapidamente. Embora de acordo com o atual roteiro da AMD, a nova família de processadores deve começar a acelerar assim que no primeiro trimestre de 2012.
Nós Don’Turem vitórias dramáticas em termos de consumo de energia e dissipação de calor. A AMD tem nos prometido há muito tempo que o novo escavador seria mais eficiente em termos de energia do que os antecessores, mas na realidade os modelos de oito principais núcleos têm o mesmo TDP que o Phenom II CPUS superior. Embora muito em breve eles devam adicionar um modelo de 95 W FX-8120, bem como um FX-8100 com o mesmo TDP na sua linha.
Por outro lado, os preços dos novos processadores FX parecem ser mais do que atraentes. AMD não’quero desviar-se de seu plano para continuar oferecendo plataformas a um preço mais baixo do que a concorrência, é por isso que os processadores Zambeze de oito núcleos estão posicionados contra os CPUs principais do Core i5. No geral, a AMD seguirá o seguinte plano de posicionamento:
Em outras palavras, a AMD não tem nenhuma intenção de competir contra o Intel CPUs de seis núcleos e o próximo LGA2011 e pretende se concentrar no segmento convencional.
Ótimas notícias para entusiastas são que todos os processadores FX virão com multiplicadores desbloqueados. Todas as CPUs de Zambebezi podem ser facilmente em overclock não apenas ajustando o multiplicador de relógios base, mas também reconfigurando sua tecnologia Turbo Core. Você também pode overclock o subsistema de memória e a frequência da ponte norte integrada ao processador.
Mais de perto o AMD FX-8150
AMD nos deu a oportunidade de conferir o novo processador Zambeze-FX-8150.
Sua velocidade nominal do relógio é 3.6 GHz e você pode descobrir mais sobre isso a partir da seguinte captura de tela do CPU-Z:
Observe que ele usa um passo do processador B2 e ainda não é a primeira versão. As modificações anteriores do semicondutor morrem não’t Consegui -lo porque eles se recusaram a trabalhar nas velocidades do relógio planejadas originalmente. É realmente por isso.
No entanto, o hoje’s frequência de 3.6 GHz não’T Parece muito impressionante. Tanto a AMD quanto a Intel têm produtos trabalhando em frequências mais altas. No entanto, o FX-8150 suporta a tecnologia Turbo Core muito promissora, capaz de aumentar automaticamente a frequência do relógio da CPU para 4.2 GHz sob baixa carga.
É notável que 3.A frequência de 9 GHz pode ser alcançada, mesmo que todos os núcleos do processador estejam funcionando, mas há margem suficiente para overclock automático sem ir além do consumo de energia e dos limites de dissipação de calor.
No modo ocioso legal’n’A tecnologia tranquila reduz a frequência do relógio do processador FX-8150 para 1.4 GHz. O VCore neste caso cai para 0.85 v.
Configuração de teste
Vamos comparar o novo processador AMD FX-8150 de oito núcleos na microarquitetura Bulldozer contra um de seus antecessores-Phenom II X6 de seis núcleos, bem como contra concorrentes da Intel-Quad-Core Core i5-2500 e Core i7-2600. Além disso, também adicionamos os números de desempenho para as CPUs Core i7-990X de seis núcleos.
Como resultado, nossos leitos de teste foram construídos usando os seguintes componentes de hardware e software:
- Processadores:
- AMD FX-8150 (Zambeze, 8 núcleos, 3.6 GHz, 8 MB L2 + 8 MB L3);
- AMD Phenom II X6 1100T (Thuban, 6 núcleos, 3.3 GHz, 3 MB L2 + 6 MB L3);
- Intel Core i7-2600K (Sandy Bridge, 4 núcleos, 3.4 GHz, 1 MB L2 + 8 MB L3);
- Intel Core i5-2500K (Sandy Bridge, 4 núcleos, 3.3 GHz, 1 MB L2 + 6 MB L3);
- Intel Core i7-990X Extreme Edition (Gulftown, 6 núcleos, 3.46 GHz, 1.5 MB L2 + 12 MB L3).
- Gigabyte 990FXA-UD5 (soquete AM3 +, AMD 990FX + SB950);
- Asus P8Z68-V Pro (LGA1155, Intel Z68 Express);
- Gigabyte x58a-ud5 (LGA1366, Intel x58 Express).
- 2 x 2 GB, DDR3-1600 SDRAM, 9-9-9-27 (Kingston KHX1600C8D3K2/4GX);
- 3 x 2 GB, DDR3-1600 SDRAM, 9-9-9-27 (CRUCIAL BL3KIT25664TG1608).
- Intel Chipset Driver 9.2.0.1030;
- Intel Management Engine Driver 7.1.10.1065;
- Intel Rapid Storage Technology 10.6.0.1022;
- Catalisador da AMD 11.10 driver de exibição.
Observe que executamos todos os testes na versão atual do Windows 7, mas a AMD indica que a tarefa gerencia esse sistema operacional’t distribua os threads computacionais da maneira ideal. O Windows 7 prefere direcionar principalmente todos os threads para núcleos dentro de diferentes módulos. E de fato oferece desempenho relativo mais alto, porque permite reduzir a carga nas unidades compartilhadas dentro de cada módulo. No entanto, essa estratégia impede o uso de turbo-modos, o que poderia começar se alguns dos módulos de processador de núcleo duplo estivessem no modo de economia de energia.
O próximo sistema operacional do Windows 8 funcionará de maneira diferente, atribuindo os threads computacionais a núcleos no mesmo módulo primeiro. Como resultado, a AMD promete que o desempenho de Zambeze pode aumentar em até 10% em alguns aplicativos selecionados.
Desempenho
Eficiência estimada da nova microarquitetura de escavadeira
Antes de chegarmos à parte real de benchmarking, decidimos tentar prever o que poderíamos esperar que a nova microarquitetura de escavadeira seja capaz de ser capaz em geral. Para conseguir isso, comparamos o novo processador com outras CPUs em K10 e as microarquiteturas de Sandy Bridge em ambientes idênticos criados sinteticamente: na mesma frequência do relógio e com o mesmo número de núcleos ativos.
Para ser mais exato, comparamos a AMD FX-8150, Phenom II X6 1100T e Core i7-2600 em 3.Frequência de 6 GHz e com apenas dois núcleos computacionais ativos. Para garantir a pureza do experimento, desativamos todas. Usamos um conjunto de benchmarks sintéticos simples na suíte Sisoft Sandra 2011, onde desativamos manualmente todas as instruções além do SSE3, porque a microarquitetura K10 não faz’t Suporte -os.
Os números nesta tabela falam mais alto que as palavras. O desempenho da microarquitetura de bulldozer tornou-se muito menor do que o dos processadores de geração anterior. A simplificação da microarquitetura de escavadeira combinando um par de núcleos em um único módulo com recursos compartilhados levou a uma queda significativa (25-40%) no desempenho específico em comparação com a microarquitetura AMD de geração anterior. Como resultado, os núcleos de escavadeira não funcionam apenas pela metade da velocidade dos núcleos da ponte arenosa. Além disso, o desempenho do módulo de processador de escavadeira com dois núcleos é ainda menor que o de um único núcleo de ponte arenosa com tecnologia de hiper-threading habilitada. Devemos esperar qualquer registro de desempenho de uma CPU com essa microarquitetura? Esta é mais uma pergunta retórica ..
Ao mesmo tempo deixe’s Dê uma olhada nas características práticas dos caches e do subsistema de memória. Para estimar o desempenho dessas unidades funcionais, recorremos à utilidade Cachemem da AIDA64 Suite. Usamos o DDR3-1600 SDRAM com times 9-9-9-27-1T. Assim como no caso anterior, todos os processadores funcionaram em 3.Frequência de relógio de 6 GHz.
Como podemos ver, as latências práticas de todos os caches e subsistema de memória nos processadores de Zambeze aumentaram. Já discutimos isso no capítulo dedicado à microarquitetura de escavadeira. No entanto, a largura de banda da memória aumentou quase em todos os casos devido a modificações da organização interna de memória de cache.
Ao mesmo tempo, o controlador de memória de canal duplo mais rápido e o subsistema de memória de cache mais rápido são os da ponte Sandy. Embora em termos de tamanho do cache, o bulldozer NE será superior.
Desempenho geral
Como de costume, usamos o BAPCO SYSmark 2012 para estimar o desempenho do processador em tarefas de uso geral. Emula os modelos de uso em aplicativos populares e de criação de conteúdo digital e de conteúdo digital. A idéia por trás deste teste é bastante simples: produz uma única pontuação caracterizada o desempenho médio do computador.
Como você provavelmente se lembra, um pouco de volta e tentou troll sysmark afirmando que não era’t um benchmark objetivo por causa do “injusto” combinação de aplicações usadas. No entanto, em nossa opinião, essa reclamação é injustificada, porque o desempenho foi estimado usando programas amplamente espalhados e realmente populares. A contribuição de cada programa para a pontuação final do teste é apresentada no diagrama a seguir:
Portanto, decidimos não desistir do Sysmark 2012 e continuar usando esta suíte para estimar o desempenho em aplicativos de uso geral.
O primeiro teste acabou sendo uma grande decepção. O processador FX-8150 de oito núcleos é apenas 10% mais rápido que o Phenom II X6 1100T de seis núcleos e, é claro, está muito atrás das CPUs Intel Quad-Core. Então, parece amd’s Decisão de construir um processador com muitos núcleos com baixo desempenho específico em vez de usar um número moderado de núcleos complexos não’T trabalho tão bem quanto eles esperavam que.
Deixar’s Dê uma olhada mais de perto nas pontuações de desempenho SYSmark 2012 gera em diferentes cenários de uso.
O cenário de produtividade do escritório emula tarefas típicas de escritório, como edição de texto, processamento de tabelas eletrônicas, email e navegação na Internet. Este cenário usa as seguintes aplicações: Abbyy FineReader Pro 10.0, Adobe Acrobat Pro 9, Adobe Flash Player 10.1, Microsoft Excel 2010, Microsoft Internet Explorer 9, Microsoft Outlook 2010, Microsoft PowerPoint 2010, Microsoft Word 2010 e Winzip Pro 14.5.
Cenário de criação de mídia emula a criação de um videoclipe usando imagens e vídeos digitais previamente tirados. Aqui eles usam Suites Adobe Popular: Photoshop CS5 Extended, Premiere Pro CS5 e After Effects CS5.
Desenvolvimento da Web é um cenário que impede o design do site. Ele usa as seguintes aplicações: Adobe Photoshop CS5 Extended, Adobe Premiere Pro CS5, Adobe Dreamweaver CS5, Mozilla Firefox 3.6.8 e Microsoft Internet Explorer 9.
O cenário de análise/análise financeira é dedicada à análise estatística e previsão das tendências do mercado realizadas no Microsoft Excel 2010.
O cenário de modelagem 3D é totalmente dedicado a objetos 3D e renderização de cenas estáticas e dinâmicas usando o Adobe Photoshop CS5 estendido, Autodesk 3DS Max 2011, Autodesk AutoCad 2011 e Google Sketchup Pro 8.
O último cenário chamado gerenciamento de sistemas cria backups e instala software e atualizações. Envolve várias versões diferentes do instalador Mozilla Firefox e Winzip Pro 14.5.
O processador baseado em escavadeira demonstra resultados diferentes em diferentes modelos de uso. Em alguns casos, ele é ainda mais lento que o Fenom II x6, mas também existem algumas situações opostas. No geral, a regra geral pode ser definida da seguinte forma: FX-8150 é particularmente eficiente em aplicações com carga multithread e bem paralela, que ao mesmo tempo não é computacionalmente desafiador.
No entanto, mesmo nas situações mais favoráveis FX-8150 fica atrás do núcleo i5-2500. O único cenário em que esses processadores demonstram velocidade comparável é a renderização 3D. Fora isso, o produto Intel é em média 25% mais rápido, o que é meio triste ..
Desempenho de jogos
Como você sabe, é o subsistema gráfico que determina o desempenho de toda a plataforma equipada com processadores de alta velocidade na maioria dos jogos contemporâneos. Portanto, fazemos o possível para garantir que a placa gráfica não seja carregada muito durante a sessão de teste: selecionamos os testes mais dependentes da CPU e todos os testes são realizados sem antialiasing e não são as resoluções de tela mais altas. Em outras palavras, os resultados obtidos nos permitem analisar não tanto a taxa de FPS que pode ser alcançada em sistemas equipados com aceleradores gráficos contemporâneos, mas sim o quão bem os processadores contemporâneos podem lidar com a carga de trabalho de jogo. Portanto, os resultados nos ajudam a determinar como as CPUs testadas se comportarão no futuro mais próximo, quando novos modelos mais rápidos de placas estarão disponíveis.
Os jogos não estão entre as tarefas que criam cargas paralelas multithreads. Portanto, processadores quad-core se adequam aos jogadores’ precisa muito melhor do que a AMD’S Monstros com vários núcleos. Os diagramas acima são um ótimo exemplo disso. O novo FX-8150 de oito núcleos não é mais rápido que seu antecessor de seis núcleos-Fenom II X6.
Quanto à correlação de desempenho de jogos entre Zambebezi e Sandy Bridge, as coisas não são tão otimistas para a AMD. A atual microarquitetura Intel lida muito melhor com a carga de trabalho típica criada pelos jogos 3D e não há absolutamente nenhuma esperança de que a AMD consiga alcançar a competição aqui. Em outras palavras, o único momento em que faz sentido usar Bulldozer para jogos seria a situação em que você tiver certeza absoluta de que o processador especificado será rápido o suficiente no subsistema gráfico específico e em jogos específicos. No entanto, mesmo nesse caso, é importante entender que a próxima atualização da placa gráfica pode realmente ter um efeito adverso e você estará na pior situação do que os usuários que inicialmente preferiram uma plataforma Intel.
Além de nossos testes de jogo, gostaríamos de oferecer os resultados do teste sintético do FutureMark 3Dmark11 com o perfil Extreme Settings.
Adicionamos esses resultados para mostrar a situação ideal para o FX-8150, a saber, quando o subsistema de vídeo não faz’T realmente permite que o processador mostre todo o seu potencial. Nesse caso, a placa gráfica é carregada ao máximo e a CPU executa uma função auxiliar. Nesse caso, podemos afirmar que os processadores Bulldozer e Sandy Bridge são igualmente rápidos, embora isso não seja exatamente verdadeiro.
No entanto, o novo FX-8150 parece muito bom no teste de física 3Dmark11 (especialmente em relação aos antecedentes dos resultados anteriores). O novo processador AMD de oito núcleos tem um desempenho comparativamente com o Intel Core i5-2500 do quadro de núcleo durante o cálculo multithread do modelo de física de jogos.
Desempenho em aplicativos
Devo dizer que o desempenho geral e de jogo do novo bulldozer de desktop ficou mais baixo do que esperávamos. No entanto, não estamos desistindo e estamos prontos para procurar situações em que a nova microarquitetura AMD realmente brilhará.
Para testar o desempenho dos processadores durante o arquivamento de dados, recorremos à utilidade de arquivamento de Winrar. Usando a taxa máxima de compressão, arquivamos uma pasta com vários arquivos 1.4 GB no tamanho total.
O desempenho do FX-8150 fica perto do do Core i5-2500. Winrar não é um desses aplicativos que podem dividir a carga em oito fios paralelos para todos os oito núcleos de escavadeira, mas a memória gigantesca parece estar salvando a situação aqui.
O segundo teste semelhante da velocidade de arquivamento é realizado em 7-ZIP que usa o algoritmo de compressão LZMA2.
FX-8150 é realmente ótimo em 7-zip. Este processador de oito núcleos fica muito perto do quadro de quadro-core i7-2600 com hiper-threading habilitado, que também pode executar oito threads ao mesmo tempo, assim como o novo bulldozer.
O desempenho do processador durante a criptografia é medido com um benchmark integrado a partir de uma utilidade criptográfica popular chamada TrueCrypt. Devo dizer que isso não só pode utilizar efetivamente qualquer número de núcleos de processador, mas também suporta instruções especiais de AES.
Algoritmos inteiros simples bem paralelos são exatamente quais necessidades de microarquitetura de escavadeira. Como podemos ver, o desempenho pode ser bastante impressionante neste caso. Ou seja, o único processador FX-8150 não poderia’t Outperform foi o Core i7-990X de seis núcleos. Quanto a todos os processadores LGA1155, nosso herói estava muito à frente de todos eles.
Usamos o utilitário Apple iTunes para testar a velocidade de transcodificação de áudio. Ele transcodifica o conteúdo de um disco de CD no formato AAC. Observe que a peculiaridade típica dessa utilidade é sua capacidade de utilizar apenas um par de núcleos de processador.
Aplicativos que geram poucos tópicos computacionais não são uma boa combinação para Bulldozer. Os núcleos individuais deste processador são fracos demais para ter um bom desempenho aqui.
Medimos o desempenho no Adobe Photoshop usando nossa própria referência feita de retoques artistas Photoshop Speed Test que foi modificado criativamente. Inclui edição típica de quatro imagens de 10 megapixels de uma câmera de foto digital.
No Photoshop FX-8150’t atuando tão mal quanto os processadores baseados em K10, mas ainda não consegue acompanhar o núcleo i5-2500. Nesse caso. A eficiência e o desempenho específico dos núcleos computacionais ainda são o principal fator.
Também realizamos alguns testes no Programa Adobe Photoshop Lightroom 3. O cenário de teste inclui pós-processamento e exportação para o formato JPEG de cem imagens de 12 megapixels em formato bruto.
O Lightroom é capaz de dividir o processamento da foto entre qualquer número de núcleos, por isso é por isso que oito núcleos FX-8150 se sai muito bem aqui. Embora eu tenha que admitir que “muito bem” pode ser considerado um termo muito relativo neste caso, pois seu desempenho é comparável ao do Core i5-2500. E, portanto, significa que dois núcleos de escavadeira são equivalentes a um núcleo de ponte arenosa sem hiper-threading.
O desempenho no Adobe Premiere Pro é determinado pelo tempo necessário para renderizar um projeto Blu-ray com um vídeo HDV 1080p25 em H.264 formato e aplique diferentes efeitos especiais a ele.
Os processadores AMD de geração anterior lidam muito bem com a transcodificação de vídeo. A microarquitetura de bulldozer se saiu ainda melhor nesse tipo de aplicativo, por isso o FX-8150 se apresenta ainda mais rápido que o Core i5-2500.
Estimamos a velocidade de edição de vídeo em Adobe após os efeitos, medindo o tempo necessário para aplicar uma combinação de filtros e efeitos especiais, como desfoque, protuberância, chave de cor, mistura de molduras, brilho, desbotamento de movimento, desbotamento, manipulação 2D e 3D, sombras, eco, mediano, borlão radial, invertido, etc.
Embora este seja um tipo de carga bem paralela, o FX-8150 fica atrás dos concorrentes da Intel nos efeitos após os efeitos.
Para medir a rapidez com que nossos participantes de teste podem transcodificar um vídeo em H.264 Formato Usamos x264 referência HD. Funciona com um vídeo MPEG-2 original gravado em resolução 720p com taxa de bits de 4 Mbps. Devo dizer que os resultados deste teste são de grande valor prático, porque o codec x264 também faz parte de inúmeros utilitários de transcodificação populares, como Handbrake, Megui, VirtualDub, etc.
Os processadores da AMD sempre tiveram um bom desempenho durante os testes de transcodificação de vídeo x264. Agora que a microarquitetura de oito núcleos está fora, os resultados melhoraram ainda mais. O FX-8150 supera até o Core i7-2600 durante o segundo passe mais faminto de recursos. Então, finalmente, encontramos uma segunda aplicação, além de TrueCrypt, onde os processadores na microarquitetura de escavadeira fazem absolutamente ótimos.
A velocidade de renderização no Autodesk 3DS Max 2011 foi medida usando um teste especial SpecAPC. Começando com esta revisão, vamos usar uma nova versão profissional do specapc para 3ds Max 2011.
A renderização também é uma tarefa, que é bem otimizada para microarquiteturas multi-core. No entanto, apesar desse fato, o FX-8150 ainda funciona mais lento que o Core i5-2500 e o Core i7-2600, sem mencionar o núcleo i7-990x. Por outro lado, o novo processador AMD não faz’Ter para o seu antecessor, então as coisas não estão’t ruim depois de tudo.
Resumindo todos os resultados obtidos em aplicativos individuais, podemos concluir que em nossos testes o novo FX-8150 foi cerca de 14% mais rápido que o Phenom II X6 1100T. Como resultado, não foi mais lento que o núcleo i5-2500 em quase metade de todos os testes. No entanto, o atraso por trás do próximo modo Intel, Core i7-2600, ainda permanece bastante sério e excede 10%.
Consumo de energia
Embora tenhamos conseguido encontrar um conjunto de aplicações em que o desempenho de escavadeiras é bastante bom, as CPUs baseadas nessa nova microarquitetura estão longe de serem consideradas revolucionárias. Nossa única esperança neste momento é o consumo de energia, porque os processadores AMD anteriores estavam muito atrás de seus concorrentes nesse aspecto. Agora, no entanto, a nova microarquitetura promete ser muito mais eficiente em termos de energia. Além disso, o novo processo mais fino de 32 nm deveria ter contribuído para a melhoria das características elétricas dos novos processadores. então deixe’s Confira o desempenho por watt do novo FX-8150.
Os gráficos abaixo mostram o desenho de energia total do computador (sem o monitor) medido após a fonte de alimentação. É o total do consumo de energia de todos os componentes do sistema. O psu’A eficiência de S não é levada em consideração. As CPUs são carregadas executando o Linx 0 de 64 bits.6.4 utilidade. Ativamos todas as tecnologias de economia de energia para uma medição correta do computador’s desenho de energia no modo ocioso: c1e, c6, amd cool’n’Silencioso e aprimorado Intel Speedstep.
No caso de carga de tiro único, o consumo de energia do sistema Socket AM3+ aumenta rapidamente, o que provavelmente acontece porque a tecnologia Turbo Core altamente agressiva. Os sistemas de base da Intel não demonstram nada assim e podem novamente se orgulhar muito melhor de eficiência de energia.
No caso de carga multithread pesada, coisas realmente não mudam muito. A única diferença é que o sistema LGA1366 com o núcleo i7-990x dentro do tracejamento para a frente. Caso contrário, as coisas são exatamente iguais. FX-8150 CAN’t Gabar qualquer sucesso específico para economizar energia. Ele consome um pouco menos que o Phenom II X6 1100T, mas os processadores Intel Sandy Bridge ainda são pelo menos 1.5 vezes mais eficiente em termos de energia.
A AMD usou toda a eficiência energética que eles ganharam com a nova microarquitetura para aumentar as velocidades do relógio. E no final, há melhorias significativas nem em eficiência energética nem em desempenho. Portanto, no aspecto de desempenho por watt, o novo escavador, assim como seus antecessores, ainda está seriamente atrás das microarquiteturas Intel concorrentes.
Para sua referência, aqui estão as leituras de consumo de energia da CPU isolada e dos trilhos de alimentação principal:
O “puro” O consumo de energia dos oito núcleos FX-8150 é duas vezes mais alto do que os processadores de ponte arenosa. Como todos eles são fabricados usando o mesmo processo de produção e têm tensão de núcleo semelhante, torna-se extremamente interessante o que exatamente a AMD quis dizer com a eficiência energética de sua microarquitetura de escavadeira.
Overclocking
Os processadores de plataforma AM3+ do soquete AM3+. Isso segue não apenas pelo fato de que todos os processadores FX desbloquearam multiplicadores, mas também de vários experimentos extremos de overclock suportados pela AMD, em um dos quais eles estabeleceram um recorde mundial de overclock usando um novo processador FX-8150. A empresa’s Declaração sobre a nova microarquitetura bem otimizada para o trabalho em altas frequências também parece muito promissor. Poderia ser uma nova maravilha overclocking? Deixar’s descobrir.
É extremamente fácil overclock qualquer processador de FX: seus estados de logotipo “Desbloqueado” por uma razão. Você pode alterar a frequência do relógio do processador alterando seu multiplicador na configuração do BIOS da placa principal ou por meio de utilitários especiais da AMD (Utilitário Overdrive), bem como dos fornecedores de placa principal. Você também pode fazer overclock a ponte norte integrada e a memória do sistema no sistema AM3+ da mesma maneira.
Durante nossos testes, conseguimos fazer com que nosso FX-8150 funcione de forma estável em 4.6 GHz. Para maior estabilidade, aumentamos a tensão do núcleo do processador para 1.475 V e opção de calibração de linha de carga ativada. Durante nossos testes de estabilidade, a temperatura da CPU nessa frequência não’t excede 85 ° C, de acordo com o diodo sob o soquete e 75 ° C, de acordo com o diodo térmico integrado na própria CPU. Como já dissemos, usamos um refrigerador de ar muito eficiente-NZXT HAVIK 140.
Observe que também tentamos overclock simultaneamente a ponte norte integrada ao processador, porque aumentar sua frequência terá um efeito positivo na memória de cache L3 e no desempenho do controlador de memória. No entanto, infelizmente, não poderíamos’t Passar 2.Frequência de 4 GHz, embora tenhamos tentado aumentar sua tensão também.
De qualquer forma, o resultado do nosso experimento de overclock do FX-8150-4.Frequência de 6 GHz – é um sucesso definitivo, especialmente porque os processadores da AMD Phenom II raramente overclocavam além de 4.0 GHz com resfriamento de ar. Em outras palavras, a microarquitetura de escavadeira realmente conseguiu empurrar os máximos de frequência um pouco mais longe.
No entanto, devemos realmente comparar os resultados de nossos processadores FX overclock com os dos processadores Intel Core i5 e Core i7 para sistemas LGA1155. E esses caras overclock tão bons. Por exemplo, o Core i5-2500K normalmente overclock para 4.7 GHz sob um resfriador de ar e com o vcore aumentou 0.15 v. E nesta comparação, o FX-8150 não’Parece tão vitorioso mais.
Nossa impressão do overclock de Zambeze será estragada ainda mais se compararmos o desempenho do FX-8150 e Core i5-2500K em overclock (o aumento em comparação com o modo nominal é apresentado entre colchetes):
No geral, overclocking não’T realmente muda a situação. No entanto, naquelas aplicações em que o FX-8150 foi mais rápido no modo nominal, a lacuna não é mais tão dramática. E nos testes em que o Core i5-2500 estava à frente, conseguiu fortalecer suas posições ainda mais. De fato, não é surpreendente: a frequência do relógio do nosso processador FX-8150 aumentou 28% durante o overclock, enquanto a frequência do núcleo i5-2500K ficou 42% maior. Além disso, como sabemos pela maneira como a frequência cresceu durante o overclock, a microarquitetura Intel Sandy Bridge é mais sensível ao aumento da frequência. Em outras palavras, mesmo se levarmos em consideração overclock, os novos processadores de escavadeira não’parecer superior a Intel’s, mesmo que eles o overlock muito bem.
Conclusão
Então, é sucesso ou fracasso? Tenho certeza de que a maioria de vocês adoraria ver um veredicto claro e definitivo aqui. No entanto, as coisas não são tão simples desta vez e o Bulldozer da AMD tornou as coisas realmente difíceis para todos os revisores.
O problema é que a AMD revelou uma abordagem totalmente única para o desenvolvimento de novas microarquiteturas. Lembre -se de que o desempenho do processador consiste em três componentes principais, como número de instruções por relógio, frequência do núcleo e número de núcleos, os engenheiros da AMD mudaram suas prioridades para o número de núcleos desta vez. Eles reduziram o desempenho do núcleo específico, mas ao mesmo tempo tiveram a oportunidade de criar processadores baratos de oito núcleos ou ainda mais complexos. Este é um marco muito importante para o mercado de servidores, onde as cargas multithreaded dominam e os processadores de vários núcleos estão em alta demanda. Portanto, a nova microarquitetura de Bulldozer da AMD provavelmente ajudará a empresa a fortalecer suas posições no segmento de servidores de alto desempenho.
No entanto, hoje apresentamos a você um processador FX baseado na nova microarquitetura de escavadeira, mas projetada para o segmento de desktop. E é aqui que observamos um dramático a incompatibilidade entre Bulldozer’S funcionalidade de hardware e as necessidades de aplicativos típicos de desktop. É particularmente frustrante que todo o esforço de marketing tenha como objetivo nos fazer acreditar que Bulldozer será a estrela em ascensão do mercado de desktop. Infelizmente, isso nunca aconteceu.
Os processadores FX baseados na microarquitetura de bulldozer conseguiram mostrar seus pontos fortes apenas em uma pequena variedade de tarefas de usuário comuns. Existem muito poucas aplicações populares, que gerariam carga inteira múltipla simples e esse é o único caso em que o bulldozer realmente executa no seu melhor. Como resultado, em certas aplicações, o novo trator não é apenas mais lento que os concorrentes da Intel, mas é ainda mais lento que o fenômeno da geração anterior II x6. E isso significa que a AMD não’T Consegui lançar uma CPU de desktop revolucionária.
De fato, o FX é apenas mais um fenômeno, que parece muito bom, especialmente em comparação com os antecessores. No geral, os processadores FX são mais rápidos que o Fenom II, eles overclock muito melhor e consomem um pouco menos de energia, por isso serão um bom substituto para as CPUs na microarquitetura antiga K10.
No entanto, gostaria de lembrá -lo de que a AMD está competindo não apenas contra si mesma, mas também contra a Intel. Portanto, temos que tirar essa conclusão indesejável de que os processadores FX serão apenas uma boa escolha para os sistemas de desktop que serão usados principalmente para processamento de vídeo e transcodificação. Em todos os outros casos, os processadores escavadores, infelizmente, não podem competir contra a Sandy Bridge. O mesmo vale para o consumo de energia, bem como para overclock. Eu também gostaria de acrescentar que os processadores AMD FX esperavam uma má escolha para os jogadores, porque os jogos 3D contemporâneos mal usam algoritmos verdadeiros com vários threads. No entanto, tenho certeza de que os fãs dedicados da AMD poderão suportar isso, já que a taxa de FPS nos jogos é, na maioria dos casos, limitada pela placa gráfica, em vez de processador.
Em outras palavras, o sucesso de marketing dos novos processadores de FX dependerá apenas de dois fatores: como numerosos fãs da AMD é e quão inteligente a empresa usará suas estratégias de preços. Mas de qualquer maneira, os processadores de Bulldozer de desktop quase nunca se tornarão verdadeiramente populares.