O que é um chiplet?O que é buffer?
Entenda como execução universal a capacidade do chip de executar código x86, Arm ou RISC-V por meio de emulação de software, mas sem que isso resulte em queda no desempenho. Pelo menos é o que a Tachyum afirma.
Tachyum Prodigy T16128: só números grandes
Como já ficou claro, desempenho é outra característica notável dos processadores Tachyum Prodigy. A linha tem versões com 32, 64 e 128 núcleos. Esta última, chamada de Tachyum Prodigy T16128, é a que mais chama a atenção, por motivos óbvios. Além de uma quantidade impressionante de núcleos, o T16128 suporta 16 canais de memória DDR5 em uma interface de 1.024 bits. O processador pode trabalhar com até 8 TB de RAM. O suporte ao padrão PCI Express 5.0, com 64 vias, é outro atributo do chip. Mas olhemos novamente para os núcleos. Todos são de 64 bits e têm como base a arquitetura VLIW (Very Long Instruction Word). Esta é focada na execução de grandes conjuntos de instruções ao mesmo tempo por meio de paralelismo. A frequência pode chegar a 5,7 GHz. Cada núcleo conta ainda com 64 KB de cache L1 e 1 MB de cache L2. Um detalhe interessante é que um núcleo pode utilizar o cache L2 que não está em uso por outros núcleos como uma espécie de cache L3.
Desempenho, mas muito desempenho
Esses e os demais números podem ser resumidos em uma única palavra: desempenho. De acordo com a Tachyum, o Prodigy T16128 alcança até 90 teraflops em FP64 na computação de alto desempenho (HPC, na sigla em inglês). Esse é um número próximo ao que é obtido por GPUs de uso profissional. O AMD Instinct MI250X, por exemplo, é um acelerador gráfico com 220 unidades computacionais e 128 GB de memória que alcança 96 teraflops FP64. Mas, como bem observa o Tom’s Hardware, GPUs não podem ser empregadas em todo e qualquer tipo de aplicação. Já uma CPU é muito mais abrangente nesse sentido. É aí que a linha Tachyum Prodigy se destaca. É claro que código nativo — escrito especificamente para rodar em máquinas com chips Prodigy — tendem a ter uma execução com desempenho notável. Linux, FreeBSD, Apache, MongoDB e Python já estão entre os sistemas operacionais e ferramentas totalmente compatíveis com máquinas Prodigy. Mas, como já destacado, a linha também é capaz de lidar com software em x86, Arm e RISC-V, sem degradação do desempenho. Na verdade, a Tachyum dá a entender que até pode haver alguma perda de performance, mas não de modo significativo. Só que todo esse poder tem um preço (e não falo dos custos dos chips, que não foram revelados): estima-se que o Prodigy T16128 pode atingir um consumo de 950 W ao trabalhar a todo vapor. A linha pode ainda ser empregada em computadores com quatro soquetes. Nessa configuração, o total de núcleos chega a 512; o nível de consumo combinado, a 3.800 W. É válido destacar que esse padrão de consumo vale para o Prodigy T16128-AIX. Outras variantes do processador têm especificações mais simples e, portanto, exigem menos energia. É o caso do modelo Prodigy T16128-HT, cujo TDP fica em 300 W.
Tachyum: que empresa é essa?
Tudo isso é muito interessante, mas uma pergunta fica no ar: Tachyum, que empresa é essa? A Tachyum é uma companhia de semicondutores fundada em 2016 por Radoslav Danilak. O seu objetivo é fornecer chips para aplicações de HPC, inteligência artificial, datacenters e afins. O principal produto da empresa é a linha Prodigy, que foi apresentada com base na ideia de “processador universal” — a já mencionada capacidade de o chip lidar com softwares de diferentes arquiteturas. A empresa aposta tanto no sucesso de sua tecnologia que está construindo um supercomputador que promete ser o mais rápido do mundo em operações de inteligência artificial. De humilde a Tachyum não tem nada. A intenção da companhia é brigar com Intel e AMD em aplicações de alto desempenho. O Prodigy T16128 sugere que a empresa está levando essa meta a sério. Mas o momento pede que os pés permaneçam no chão. Até o momento, a Tachyum tem apenas um protótipo FPGA (chip programável) de um processador Prodigy e todos os números de desempenho são oriundos de simulações. De todo modo, a companhia já está aceitando encomendas de chips. A primeira unidade “real” está prevista para ser apresentada em agosto. A expectativa é a de que a produção em massa comece no primeiro semestre de 2023. Todos os processadores da linha serão baseados em um processo de fabricação de 5 nanômetros (N5P) da TSMC.