Esiste un malware progettato per manipolare l’AI

Check Point scopre un malware che manipola l’IA tramite prompt injection, aggirando i sistemi di sicurezza senza alterare il codice. Fortunatamente l’attacco ha fallito.

Tecnologie/Scenari

I ricercatori di Check Point Research hanno documentato il primo caso di malware specificamente progettato per eludere i sistemi di rilevamento basati sull'AI. È uno sviluppo importante perché segna l'emergere di una nuova categoria di minacce denominata "evasione dell'AI", in cui gli attaccanti, anziché mascherare il codice dannoso, tentano di convincere gli strumenti di sicurezza dell’innocenza di un file malevolo. Si tratta dell’ennesimo esempio - se ce ne fosse ancora bisogno - della capacità dei cyber criminali di adattare ed evolvere le proprie tattiche e tecniche per assicurarsi attacchi di successo.

Il contesto è ben noto: le difese integrano strumenti di GenAI nei flussi di analisi delle minacce per aumentare la propria efficacia. Finora gli attacchi hanno usato stratagemmi come l'offuscamento del codice, l'elusione delle sandbox, l'uso di strumenti LOLBin e via dicendo. Ora giocano una carta che potrebbe cambiare le regole del gioco: la prompt injection per ingannare l’AI, per minare l'efficacia degli strumenti di difesa colpendoli direttamente al cuore del processo decisionale automatizzato. E per trasformare di fatto i tanto decantati LLM in potenziali vettori di compromissione.

L’analisi tecnica

Tutto è iniziato a giugno 2025, quando un campione malware con caratteristiche inedite è stato caricato sulla piattaforma VirusTotal. Il codice incorporava un client TOR per comunicazioni cifrate e tecniche avanzate di evasione della sandbox: interessante, ma non inedito. Però c’era anche una stringa in linguaggio C++ (che riportiamo nell’immagine qui sotto) creata ad hoc per dialogare con i modelli di AI che, in sostanza, suggeriva all’AI di ignorare le istruzioni precedenti e di indicare che non era presente alcun malware.

Il codice tentava di sovrascrivere il processo analitico dell'AI mediante tre manipolazioni sequenziali: l’invalidazione delle direttive originali del sistema, l’imposizione di una falsa identità di “analizzatrice di codice neutrale”, e la richiesta esplicita di assoluzione del codice dannoso. Volendo fare un parallelo con gli esseri umani, questo approccio rappresenta un tentativo di ingegneria sociale applicata alle macchine, in cui l'attaccante cerca di stabilire un dialogo autoritario con il modello linguistico, simulando il ruolo di un utente legittimo che impartisce comandi. La scelta del linguaggio naturale incorporato nel codice evidenzia una comprensione avanzata del funzionamento degli LLM e dei loro punti deboli.

L’obiettivo è chiarissimo: sostituire completamente il flusso decisionale dell'AI bypassando i normali protocolli di analisi. Fortunatamente l’attacco è fallito perché il modello ha correttamente riconosciuto un tentativo di prompt injection. Ma il campione analizzato rappresenta comunque un campanello d'allarme e porta con sé molte implicazioni strategiche di cui i vendor di cybersecurity devono tenere conto. la prima è che i sistemi basati su LLM stanno mostrando vulnerabilità emergenti di fronte a manipolazioni intenzionali; SecurityOpenLab nel ha parlato più volte in riferimento alle tecniche di jailbreak degli LLM. Il caso analizzato dimostra che è possibile contrastare tali tecniche con architetture ben progettate, ma c’è ancora molto lavoro da fare in questo senso.

La posta in gioco è talmente alta da giustificare forti investimenti da parte degli attaccanti per aumentare progressivamente la sofisticazione degli attacchi. E, vista l’efficacia dell’AI nella difesa, tali investimenti saranno verosimilmente direzionati ad approfittare delle vulnerabilità intrinseche degli LLM. È verosimile pensare che la prompt injection dell’AI diventerà l’ennesima tecnica standardizzata nel toolkit degli attaccanti, esattamente come lo sono le tecniche di elusione delle sandbox, per fare un esempio.

I difensori devono quindi lavorare proattivamente per trovare e chiudere il più rapidamente possibile queste falle, ma anche per sviluppare tecniche di rilevamento specifiche fin dalla fase di training, così da identificare precocemente i tentativi di manipolazione degli LLM. In particolare, i ricercatori indicano l'implementazione di sistemi di convalida incrociata per correlare l'output degli LLM con analisi comportamentali tradizionali, così da ottenere un sistema di controllo e bilanciamento capace di identificare discrepanze tra l'analisi semantica e l'effettivo comportamento del codice.

Tags: ai malware LLM prompt injection Check Point

Rimani sempre aggiornato, seguici su Google News! Seguici

Notizie correlate

5 - Esiste un malware progettato per manipolare l’AI

3 - MalTerminal: l’ascesa dei malware potenziati dai modelli LLM

3 - Diecimila dollari per "bucare" un copilot di Microsoft

2 - Cynet: a ciascuno la sua AI

2 - Cybertech Europe 2025: la sicurezza della geopolitica digitale

2 - Nel 2025 impennata di malware unici, AI e ransomware cambiano le regole

2 - I security leader sottovalutano il rischio AI

2 - GenAI: i tool più gettonati diventano una trappola nei falsi installer

2 - F5 ADS Platform unifica sicurezza, gestione e bilanciamento del carico

2 - AI fra sfide e prospettive sulla cybersecurity

2 - L'AI generativa per la sicurezza del codice software

2 - AI: tre scenari di attacco preoccupanti

Speciali Tutti gli speciali

Speciale

Speciale Gestione degli accessi

Reportage

Cybertech Europe 2025

Speciale

Speciale Servizi gestiti

Reportage

ConfSec 2025 - Bari

Speciale

Speciale iperautomazione

Calendario Tutto

Nov 27

IDC CIO Summit 2025 - Milano

Nov 27

Webinar Zyxel Networks | Nebula 19.20 & uOS 1.36: Nuove Funzionalità per NCC, Firewall e MSP Pack

Dic 02

WPC 2025

Ultime notizie Tutto

S3K, la cybersecurity fatta di competenze

24-11-2025

Mercato del lavoro sul dark web, il candidato medio ha 24 anni

21-11-2025

Ransomware nel 2025: la mappa di Nozomi Networks

21-11-2025

ESET: il gruppo cinese PlushDaemon attacca device di rete con un nuovo componente

21-11-2025

G11 Media Networks

SecurityOpenLab e' un canale di BitCity, testata giornalistica registrata presso il tribunale di Como ,
n. 21/2007 del 11/10/2007- Iscrizione ROC n. 15698

G11 MEDIA S.R.L. Sede Legale Via NUOVA VALASSINA, 4 22046 MERONE (CO) - P.IVA/C.F.03062910132 Registro imprese di Como n. 03062910132 - REA n. 293834 CAPITALE SOCIALE Euro 30.000 i.v.

Esiste un malware progettato per manipolare l’AI

L’analisi tecnica

Notizie correlate

5 - Esiste un malware progettato per manipolare l’AI

3 - MalTerminal: l’ascesa dei malware potenziati dai modelli LLM

3 - Diecimila dollari per "bucare" un copilot di Microsoft

2 - Cynet: a ciascuno la sua AI

2 - Cybertech Europe 2025: la sicurezza della geopolitica digitale

2 - Nel 2025 impennata di malware unici, AI e ransomware cambiano le regole

2 - I security leader sottovalutano il rischio AI

2 - GenAI: i tool più gettonati diventano una trappola nei falsi installer

2 - F5 ADS Platform unifica sicurezza, gestione e bilanciamento del carico

2 - AI fra sfide e prospettive sulla cybersecurity

2 - L'AI generativa per la sicurezza del codice software

2 - AI: tre scenari di attacco preoccupanti

Speciali Tutti gli speciali

Speciale Gestione degli accessi

Cybertech Europe 2025

Speciale Servizi gestiti

ConfSec 2025 - Bari

Speciale iperautomazione

Calendario Tutto

Ultime notizie Tutto

S3K, la cybersecurity fatta di competenze

Mercato del lavoro sul dark web, il candidato medio ha 24 anni

Ransomware nel 2025: la mappa di Nozomi Networks

ESET: il gruppo cinese PlushDaemon attacca device di rete con un nuovo componente

Iscriviti alla nostra newsletter

G11 Media Networks