A Arm anunciou um avanço significativo na democratização da inteligência artificial em dispositivos móveis com a introdução da Scalable Matrix Extension 2 (SME2), uma evolução fundamental em sua arquitetura Armv9. Com esta tecnologia, aliada à camada de software KleidiAI, desenvolvedores de Android poderão integrar funções avançadas de IA, como visão computacional, processamento de linguagem natural e geração de voz, diretamente nos smartphones, sem a necessidade de conexão com a nuvem ou alterações no código de seus aplicativos.
O foco está em aprimorar a experiência do usuário, permitindo que melhorias sejam feitas em fotos antes do clique, chamadas claras sem ruído de fundo e interações com assistentes de IA offline. Entretanto, o desafio sempre foi oferecer esse desempenho em tempo real sem comprometer a duração da bateria ou provocar superaquecimento, problema que SME2 promete resolver.
SME2 foi projetada para acelerar cargas de trabalho matriciais, essenciais para modelos geradores e de visão artificial, diretamente no processador do celular. Em vez de depender unicamente da GPU ou do NPU, SME2 adota uma abordagem heterogênea, distribuindo inteligentemente as tarefas de IA entre diversas unidades de processamento.
Um dos grandes atrativos do SME2 é sua acessibilidade transparente. Com o uso do KleidiAI, os desenvolvedores não precisam alterar nenhuma linha de código. A camada de aceleração se integra automaticamente em bibliotecas populares, como Google XNNPACK, MediaPipe e ONNX Runtime, garantindo que, quando habilitada no hardware, as operações intensivas sejam redirecionadas automáticamente.
Iliyan Malchev, engenheiro de software da Android (Google), comentou: “SME2 permite executar modelos de IA mais avançados, como Gemma 3, diretamente em uma ampla gama de dispositivos. Isso beneficiará o usuário final com experiências de baixa latência acessíveis de qualquer smartphone.”
Em testes realizados com dispositivos equipados com SME2, o modelo Gemma 3 obteve respostas até seis vezes mais rápidas em interações conversacionais. Além disso, com essa aceleração, o modelo pode resumir um texto de 800 palavras em menos de um segundo, demonstrando que a inferência de alto nível já não depende mais da nuvem.
Embora o SME2 chegue inicialmente em novos dispositivos Android, ele já está disponível nos últimos modelos do iOS. A Arm destaca que essa inovação impactará mais de 22 milhões de desenvolvedores e 9 milhões de aplicativos ativos em plataformas baseadas em seus designs, promovendo maior portabilidade e eficiência energética.
A Arm aconselha os desenvolvedores a garantir que seus aplicativos estejam baseados em frameworks compatíveis com KleidiAI, a fim de se beneficiarem automaticamente de futuras acelerações. Para auxiliar nessa transição, a empresa lançou um Developer Launchpad, um ambiente repleto de recursos e exemplos práticos que facilitarão a adoção das vantagens de SME2.
Com a SME2, a Arm não apenas otimiza a execução de modelos de IA em CPUs móveis, mas também estabelece uma estratégia clara para integrar a IA generativa, personalizada e em tempo real nas aplicações do futuro, tudo isso sem modificar a lógica dos aplicativos ou comprometer a experiência do usuário. Em um cenário onde cada segundo é precioso, a Arm mostra que o futuro da tecnologia não está apenas na potência, mas na forma como essa potência é utilizada de maneira inteligente.