
Un nuevo informe de SentinelOne expone un malware de macOS denominado Gaslight que lleva la manipulación de entradas a un plano novedoso: la inyección de prompts para confundir a las herramientas de triage asistidas por IA durante su análisis. Más allá de las funciones habituales como backdoor e infostealer, Gaslight inserta mensajes falsos en formato Markdown que pretenden simular indicaciones del sistema para engañar a los LLMs (modelos de lenguaje) y detener la investigación.
Aunque a primera vista el malware no presenta rasgos extraordinarios, sus vectores de infección siguen la pauta clásica: phishing y ingeniería social para comprometer la máquina, conexión a infraestructura controlada por el atacante vía Telegram y ejecución de comandos variados, que van desde el profiling del dispositivo hasta la ejecución de comandos en shell, robo de archivos y terminación de procesos. También se despliega una etapa secundaria que funciona como infostealer, recolectando contraseñas, PDFs sensibles, información de billeteras de criptomonedas y otros datos.
El rasgo distintivo de Gaslight es su defensa contra el análisis automatizado alimentado por IA. Según SentinelOne, el malware contiene un bloque grande de mensajes falsos formateados en Markdown, diseñados para engañar a asistentes de IA que los analistas pueden usar durante la ingeniería inversa. Estos mensajes simulan problemas como “el token de autenticación de la IA ha caducado”, “el entorno de análisis está quedándose sin memoria”, “el espacio en disco se ha agotado” o “el análisis está fuera de seguridad”.
Mientras que un analista humano probablemente identifique de inmediato estos mensajes como falsos, una IA no aislada adecuadamente podría interpretarlos como instrucciones reales del sistema y negarse a continuar con el análisis. En palabras de SentinelOne, macOS.Gaslight es notable por su enfoque de inyección de prompts dirigido a analistas, un intento de weaponizar las canalizaciones de triage basadas en IA que están cada vez más presentes en el ciclo de análisis inverso. Es recomendable que quienes desarrollan estas herramientas traten el contenido de las muestras como entrada adversarial; nunca como instrucciones legítimas, y se mantenga el contenido hostil fuera del modelo por completo. A medida que el análisis asistido por LLM se normaliza, los defensores deben anticipar más muestras diseñadas para explotar estas vías.
Los investigadores han publicado una lista completa de indicadores de compromiso en el enlace de referencia. El análisis de Gaslight subraya la necesidad de ampliar las prácticas de contención y aislamiento de los pipelines de IA en seguridad, para evitar que entradas maliciosas influyan en la triage y en la toma de decisiones automatizadas.
Enlaces de interés:
– Indicadores de compromiso y detalles técnicos: SentinelOne Labs (gaslight macOS)
– Cobertura adicional: The Hacker News
Conclusión: Gaslight demuestra que la protección de infraestructuras de IA en seguridad debe ir más allá de la detección tradicional de malware y considerar la seguridad de los propios modelos y pipelines de análisis. La respuesta defensiva pasa por el aislamiento estricto de entornos de IA, la validación de entradas y la monitorización continua de posibles ataques de prompt injection en escenarios de análisis automatizado.
from Latest from TechRadar https://ift.tt/0KVc3HD
via IFTTT IA