A clonagem de voz por meio da IA se tornou uma ferramenta cada vez mais utilizada por cibercriminosos. Ataques direcionados a executivos e colaboradores-chave já não necessitam de senhas: basta a voz da vítima.
A popularização da inteligência artificial generativa no ambiente empresarial trouxe avanços sem precedentes, mas também riscos consideráveis. Um dos aspectos mais preocupantes para a cibersegurança corporativa é o aumento do vishing com IA, uma variante do phishing que utiliza a clonagem de voz para enganar e roubar dados ou dinheiro.
Essa ameaça não é futurista e já afetou altos cargos em empresas e instituições governamentais. O mais alarmante é que os atacantes não precisam de uma infraestrutura complexa; basta uma amostra breve da voz da vítima — facilmente obtida em redes sociais, entrevistas ou reuniões gravadas — e acesso a plataformas de clonagem de voz, muitas das quais estão disponíveis na internet.
O mecanismo é simples e eficaz: o criminoso obtém uma gravação de voz do alvo, apresenta um modelo sintético realista e, através de uma chamada ou mensagem de voz, finge ser o executivo, solicitando ações como transferências financeiras ou acesso a sistemas. Este tipo de ataque é uma forma de deepfake auditivo, e, ao contrário dos vídeos manipulados, a voz sintética é mais difícil de detectar.
Os executivos, como CEOs e CFOs, estão especialmente vulneráveis, pois suas vozes podem ser facilmente acessadas em eventos públicos e mídias sociais. A confiança que geram dentro de suas organizações os torna alvos perfeitos para ataques de engenharia social altamente personalizados.
Diante dessa nova ameaça, as empresas precisam adotar uma estratégia de defesa sólida, combinando pessoas, processos e tecnologia. Algumas medidas incluem proteger a “pegada vocal” dos executivos, implementar sistemas de verificação, capacitar colaboradores-chave, criar senhas verbais internas e monitorar possíveis incidentes.
O vishing com IA evidencia a forma como tecnologias emergentes podem ser exploradas por agentes maliciosos, mas também destaca a necessidade de inovações defensivas que permitam detectar vozes sintéticas e auditar padrões vocais. Proteger executivos e funcionários essenciais exige não apenas ferramentas novas, mas também uma cultura organizacional que compreenda o risco em questão, onde a segurança já não se baseia somente em senhas, mas também na confiança e na voz.