Ganhando grandes sistemas de energia de ferro com power9 migrações – selva artrite queensland

Os servidores baseados em energia da divisão de sistemas cognitivos da IBM estão sendo lançados ao longo do ano passado, e o grande ferro está em campo somente desde o final do verão, mas talvez tenha tido o maior impacto sobre a receita e o fluxo de lucro. a linha de sistemas de energia, exceto talvez a instalação dos supercomputadores “summit” e “sierra” para o laboratório nacional de crista de carvalho do Departamento de Energia dos EUA e o laboratório lawrence livermore.

Como tem sido o caso desde que a linha AS / 400 estreou em 1988 e mesmo com a combinação dos minicomputadores system / 36 (low-end e midrange) e system / 38 (high-end) anteriores ao AS / 400, em geral o pequeno ferro dá à IBM os volumes necessários para ter uma base de clientes diversificada e grande, enquanto o grande ferro é o que dá grandes quantidades de dinheiro para sistemas mais sofisticados e escaláveis.

O sistema de energia E980, que é uma máquina NUMA de expansão que suporta até 16 processadores de energia9 em uma única imagem do sistema, substitui as máquinas de energia E870 e de energia E880 que possuem uma arquitetura semelhante. Discutimos o sistema E980 “fleetwood” em outubro de 2017, com base em algumas informações internas que recebemos. Nós cobrimos o seu lançamento em agosto deste ano e, em seguida, perfuramos a energia E980 muito mais profundamente. Agora, nos voltamos para os caminhos de atualização que as empresas têm para se deslocar de sistemas de energia mais antigos com base nos processadores power7, power7 + e power8 para a energia “cumulus” 9. Há muitas coisas diferentes a serem consideradas, e eu falei sobre muitos desses dois meses atrás em um recurso chamado equitação do ciclo de atualização, e tive que constantemente me lembrar que a base de sistemas de energia, e especialmente a parte dela rodando o IBM i como a plataforma principal, realmente faz migrações – mudando uma caixa e colocando uma nova – e não faz atualizações. Naquela época, eu disse que estava tentando colocar minhas mãos em comparações de atualização / migração, e a IBM me forneceu alguns dados de ferro e está trabalhando em alguns dados adicionais sobre pouco ferro para a próxima semana.

O ponto sobre os grandes sistemas de energia de ferro é que pelo menos existem caminhos de atualização com preservação do número de série – o que é importante para permitir que a máquina seja depreciada em sua programação original – ao contrário das máquinas de sistemas de energia low-end e midrange. Isso nem sempre foi o caso no passado, quando até mesmo máquinas pequenas do AS / 400 podiam ser atualizadas com um processador e uma troca de memória. Mas as atualizações são um incômodo e só são garantidas quando as máquinas são muito caras e os componentes removidos possuem um valor substancial que não pode ser descartado. Com grandes máquinas elétricas9 custando muitos milhões de dólares, as empresas têm que ser capazes de preservar seus investimentos e não arruinar seus balanços e orçamentos, razão pela qual a IBM ainda oferece atualizações para o grande ferro.

Antes de entrarmos nos caminhos de migração, é provavelmente uma boa ideia falar sobre quais versões e releases do IBM i são suportados em quais processadores de energia. Ter um novo hardware que não pode executar sistemas operacionais mais antigos não é bom para alguns clientes, porque eles não podem ou não (por motivos econômicos ou técnicos) atualizar e recertificar seus aplicativos em versões mais recentes. Todo o ferro brilhante e o estrondo cegante do mundo não conseguem desalojá-los do ferro antigo, a menos que a IBM tenha modos de emulação para os sistemas operacionais mais antigos do i5 / OS e do IBM i nos mais novos. Isso poderia ser feito, e se a IBM pudesse ganhar muito dinheiro apoiando-a, você pode apostar que ela faria isso. Pode ser tecnicamente difícil e economicamente impraticável, e o grande azul ainda é, após três décadas, um pouco tímido após o sistema / 36 e o ​​sistema / 38 clientes ficarem incomodados com o fraco desempenho inicial dos ambientes de emulação nos AS / 400s iniciais. . (isso é algo que vale a pena reconsiderar, eu acho).

Para aqueles que querem atualizar suas máquinas – ou seja, preservar seus números de série e trocar os componentes do sistema power8 para alimentar 9 partes, em vez de instalar uma nova máquina de energia e depois encontrar uma nova casa para o antigo ferro power8 – a IBM está oferecendo essas atualizações, como prometeu fazer o caminho de volta em julho de 2017. Aqui estão os caminhos de atualização:

Desde as grandes máquinas de ferro power5 em 2005, as máquinas de classe empresarial foram construídas usando até quatro nós de servidores NUMA que são ligados em conjunto com interconexões de alta velocidade. O poder 595 baseado no power5 de 2005 e o power 795 baseado no power7 de 2010 foram as duas últimas grandes máquinas NUMA que usaram midplanes de embalagens de livros que foram inspiradas nos mainframes do sistema IBM z, e agora a IBM não tem que empurrar até 32 soquetes usando essas máquinas NUMA tipo mainframe. Os chipsets NUMA que eram externos ao processador com os chips power5 foram puxados para o chip com os chips power7 e foram subseqüentemente aprimorados. O barramento X nos processadores é usado para vincular os chips de energia dentro de um dos gabinetes de classe empresarial entre si, e os links de barramento A são usados ​​para conectar vários gabinetes uns aos outros.

As máquinas de classe empresarial baseadas na arquitetura de quatro nós podem agora, graças ao aumento de desempenho com os chips power8 e power9, fazer muito mais trabalho do que essas grandes caixas ruins com o dobro de tomadas nos dias da potência. e power 795. As interconexões NUMA no chip são particularmente boas com as máquinas E980 de energia de fleetwood baseadas nas variantes cumulus dos processadores power9, como discutimos em agosto. As portas NUMA do barramento X intranode em cada um dos chips cumulus power9 funcionam a 16 gb / s, que é o dobro da largura de banda dos chips power8, e os links A-bus nesses grandes processadores power9 operam a 25 gb / s O mesmo que as portas bluelink e nvlink nos chips power9, porque elas são a mesma eletrônica subjacente), que é quatro vezes a largura de banda dos links A-bus no power8. Qualquer um dos processadores dentro de um gabinete está a apenas um salto de distância no barramento X, e qualquer chip pode se comunicar com qualquer outro chip em um E980 de energia com dois, três ou quatro compartimentos em dois saltos. Acreditamos que a latência seja um pouco menor nos links de barramento A também, mas não vimos dados sobre isso, e isso deve ajudar a suavizar o desempenho do clustering NUMA para máquinas com mais de um gabinete.

Dependendo das contagens de freqüência e núcleo dos chips power9, um único nó do sistema Power E980 fornece de 508.900 cpws a 687.500 cpws, e as máquinas E980 de quatro nós totalmente carregadas têm ao norte de 2 milhões a 2,7 milhões de cpws. O benchmark da CPW pode não estressar os sistemas como aplicativos do mundo real, lembre-se, mas a escalabilidade entre os nós é bem próxima da linear e dentro dos nós também. (Acho que a memória cache L4 embutida nesses chips de buffer de memória “centaur” usados ​​com os processadores cumulus power9 também está ajudando bastante. E é uma maravilha que mais empresas não usem memória em buffer. Mas com a geração DDR5 de memória, os buffers vão se mover para os cartões de memória para toda a indústria e talvez os caches L4 também venham a ocorrer em algum momento.)

Há um monte de maneiras diferentes para qualificar o desempenho do poder E980 em comparação com seus antecessores. Você pode observar o desempenho per-core ao longo do tempo, o que é importante para batch e outros aplicativos single-threaded que ainda são importantes para a maioria das lojas IBM i, e você pode – eu diria que deve – ver a taxa de transferência geral dos sistemas com sua mistura de gerações principais e velocidades de clock. Veja como os núcleos power7, power8 e power9 e os nós únicos com 32 núcleos cada empilham:

O núcleo power7 rodando a 4 ghz oferece 6.384 cpws no sistema 795, e o power7 + core rodando a 4.4ghz entregou 7.719 cpws, o que representa um aumento de 10% na velocidade do clock, mas um aumento de 21% no desempenho graças às mudanças arquitetônicas entre power7 e power7 + processadores. O processador power8 elevou o CPW por núcleo para 10.902 rodando a 4,19 ghz na potência E870 (sistema NUMA de dois nós) e os relógios foram acionados um pouco mais rápido para compensar a escala NUMA da potência E880C (um sistema de quatro nós). Sistema NUMA) para 4,35 ghz a 11.287 cpws. Isso é quase o dobro do poder do chip power7 usado na potência 795. Com o chip power9 rodando a um fio abaixo de 4 ghz, o CPW por núcleo aumenta para 15.903 na potência E980. Isso é 41% mais potência por núcleo, do chip top power8 para o chip top power9.

O resultado disso, explica steve sibley, vice-presidente e gerente de oferta de sistemas cognitivos na IBM, é que um E980 de energia de 24 núcleos oferece o mesmo ou mais desempenho que os sistemas 795 e 770 e 780 de potência totalmente carregados que os substituíram com os chips power7 + e um sistema power9 de 46 núcleos pode substituir a energia E870C e a energia E880C. Aqui está um gráfico que descreve esse fato, alinhando máquinas de 64 núcleos de todas as gerações de sistemas de energia7, power7 +, power8 e power9:

“Temos clientes que certamente aproveitam nossos maiores sistemas com a maioria dos nós, mas provavelmente executam várias partições nesses sistemas, em oposição a uma única partição IBM i de 192 núcleos”, diz sibley. “Fazemos uma otimização de desempenho muito detalhada para clientes desse porte. Nós temos clientes AIX que fazem isso. Não é muito, provavelmente um punhado de clientes que têm uma partição desse tamanho. A maioria desses sistemas está executando com várias partições em um único sistema. Mas eu visitei um cliente outro dia que estava executando o IBM i ao lado do SAP HANA, e eles estão migrando seu warehouse de negócios inicialmente para o HANA e eles estarão olhando para o S / 4 no futuro, e eles podem executá-los no mesmo sistema lado a lado. É a melhor utilização de recursos em seu ambiente, o que você não pode fazer em qualquer outra plataforma com o SAP HANA. ”

A coisa interessante sobre o grande ferro NUMA na linha de sistemas de energia é que a escalabilidade de processamento foi realmente menos impressionante, em alguns aspectos, do que a IBM poderia ter sido capaz de projetar se tivesse impulsionado os sistemas topo de linha no power7 +, power8, ou power9 máquinas para 32 ou até 64 soquetes. Em vez disso, a IBM conseguiu tornar os núcleos mais poderosos em cada soquete e reduzir a contagem de soquetes, aumentando a memória principal e a eficiência das conexões NUMA entre os soquetes. Isso, pensamos, é na verdade uma escolha sábia. Suspeitamos que se a IBM precisasse conectar oito nós para construir um E980 de 32 soquetes, ele poderia fazer isso, mas acrescentaria latência à rede de interconexão (talvez três saltos entre quaisquer dois processadores no complexo em vez de um ou dois) .

Embora os aumentos de desempenho advindos da mudança para sistemas de energia9 sejam importantes, o que realmente importa para os clientes é o quanto os novos sistemas custam em comparação com a manutenção do antigo. Sibley nos deu dois exemplos de como a matemática se fortalece. O primeiro coloca um 770 de energia de núcleo de 770 baseado em processadores power7 em um cliente que possui a máquina e comprou as licenças perpétuas para o IBM i, mas está pagando a manutenção de hardware e software na máquina. Três anos de manutenção de hardware e software custam mais de US $ 2 milhões:

A potência E980 com 24 núcleos ativados e 1 TB de memória, a mesma memória que a 770 substitui, tem, com 381.000 cpws, 30% mais rendimento e cada núcleo tem mais de 3X o desempenho por núcleo (excelente para trabalho em lote) . A nova máquina custa US $ 358.000 a preço de tabela, e transferir as licenças IBM i dos 64 núcleos da energia 770 para os 24 núcleos ativados (de um total de 32 núcleos) na energia E980 custa US $ 141.000, e acrescentando manutenção de hardware no a máquina por três anos daqui para frente custa US $ 31.000 e a manutenção de software (SWMA) custa outros US $ 475.000, por apenas um pouco mais de US $ 1 milhão. Assim, a recompensa pela atualização acontece em cerca de 18 meses, o que não é ruim para uma máquina que poderia estar no campo daqui a quatro ou cinco anos. Essa comparação não inclui o consumo reduzido de energia para energia e resfriamento e deixa outros oito núcleos de capacidade latente nas máquinas para futura expansão de desempenho.

A máquina 795 tem 96 núcleos e todos eles são ativados por 655.200 cpws, mais 2 TB de memória principal. Novamente, supõe-se que o cliente possua o hardware e tenha licenciado o IBM i para o sistema 770 de energia de caixa. O pagamento por três anos de manutenção de hardware e software é de US $ 3,63 milhões. A mudança para um E980 de 64 núcleos com 43 núcleos ativados rende 679.938 cpws de desempenho, e essa máquina configurada com 2 TB de memória principal tem um preço de tabela de US $ 670.000. A transferência de licenças IBM i custa US $ 253.000 e, com três anos de manutenção de hardware e software, o custo total chega a US $ 1,83 milhão. O tamanho da máquina reduz-se de um rack gigante para um servidor de dois nós, e haverá uma economia significativa de energia e resfriamento ao passar para o E980 de energia. O retorno, mesmo sem incluir nada além do hardware, software e suporte, ocorre após cerca de 18 meses, o mesmo que no outro exemplo. A máquina Power E980 tem aproximadamente o mesmo desempenho agregado, mas há mais de 2 vezes o desempenho por núcleo, o que deve significar um desempenho mais rápido, na verdade, em tarefas single-threaded. O software está novamente em um nível de software muito mais baixo e isso reduz drasticamente o custo.