Por Andrew Martin y Carolina Milán, Bloomberg
Según investigadores de ciberseguridad, un hacker aprovechó el chatbot de inteligencia artificial de Anthropic PBC para lanzar una serie de ataques contra agencias gubernamentales mexicanas, lo que llevó al robo de grandes cantidades de información confidencial sobre impuestos y votantes.
Usuarios desconocidos de la nube escribieron indicaciones en español para que el chatbot actuara como piratas informáticos de élite, encontrando vulnerabilidades en redes gubernamentales, escribiendo scripts informáticos para explotarlas y automatizando el robo de datos, dijo la startup israelí de ciberseguridad Gambit Security en una investigación publicada el miércoles.
El programa comenzó en diciembre y duró aproximadamente un mes. En total, según los investigadores, se robaron 150 gigabytes de datos del gobierno mexicano, incluidos documentos relacionados con 195 millones de registros de contribuyentes, así como registros de votantes, certificados de funcionarios públicos y archivos del registro civil.
La IA se ha convertido en un facilitador clave del crimen digital, y los piratas informáticos utilizan estas herramientas para aumentar sus esfuerzos. La semana pasada, investigadores de Amazon.com Inc. dijeron que un pequeño grupo de piratas informáticos había penetrado más de 600 dispositivos de firewall en docenas de países con herramientas de inteligencia artificial ampliamente disponibles.
Gambit no atribuyó los ataques a ningún grupo específico, aunque los investigadores dijeron que no creen que estén vinculados a gobiernos extranjeros.
Los piratas informáticos violaron la autoridad tributaria federal de México y el Instituto Nacional Electoral, dijo Gambit. También se vieron comprometidos los gobiernos estatales de México, Jalisco, Michoacán y Tamaulipas, así como el registro civil de la Ciudad de México y la empresa de agua de Monterrey.
Claude inicialmente advirtió al usuario desconocido sobre intenciones maliciosas durante su conversación sobre el gobierno mexicano, pero finalmente cumplió con la solicitud del atacante y ejecutó miles de comandos en las redes informáticas del gobierno, dijeron los investigadores.
Anthropic investigó las afirmaciones de Gambit, interrumpió la actividad y prohibió las cuentas involucradas, dijo un representante. La compañía proporciona ejemplos de actividad maliciosa para aprender de Claude, y uno de sus últimos modelos de inteligencia artificial, Claude Opus 4.6, incluye detecciones que pueden interrumpir el abuso, dijo el representante.
En este caso, el hacker pudo sondear continuamente a Claude hasta que pudo «hacer jailbreak», lo que significa que finalmente pasó por alto las barreras de seguridad, dijo el representante. Pero incluso después de que la operación de piratería ya estaba en marcha, Claude a veces rechazó las demandas del hacker, agregaron.
Los funcionarios mexicanos emitieron un breve comunicado en diciembre diciendo que estaban investigando violaciones en varias instituciones públicas, aunque no estaba claro si estaban relacionadas con el ataque de Claude.
El Instituto Nacional Electoral de México dijo que no había detectado violaciones ni accesos no autorizados en los últimos meses y que había fortalecido su estrategia de seguridad cibernética. El gobierno del estado de Jalisco negó que hubiera sido violado y dijo que sólo la red federal se vio afectada.
La Agencia Nacional Digital de México no hizo comentarios sobre la violación, pero dijo que la ciberseguridad es una prioridad.
Las autoridades tributarias y los gobiernos locales de México, Michoacán y Tamaulipas no hicieron comentarios inmediatos, ni tampoco los representantes del registro civil de la Ciudad de México ni de la empresa de agua de Monterrey.
Los atacantes intentaban obtener las identidades de un gran número de empleados del gobierno, dijo Gambit, aunque aún no está claro qué hicieron con ellos (si es que hicieron algo). Los investigadores dijeron que encontraron evidencia de que al menos 20 vulnerabilidades específicas fueron explotadas como parte del ataque.
Cuando Claude encuentra un problema o necesita información adicional, el hacker recurre a ChatGPT de OpenAI para obtener información adicional. Estos incluían cómo moverse lateralmente a través de redes informáticas, determinar qué credenciales se necesitaban para acceder a ciertos sistemas y calcular la probabilidad de detectar una operación de piratería según Gambit.
«En total, generó miles de informes detallados que incluían planes ya preparados, que le decían al operador humano exactamente qué objetivos internos atacar a continuación y qué credenciales usar», dijo Curtis Simpson, director de estrategia de Gambit Security.
OpenAI dijo que había identificado intentos de piratas informáticos de utilizar sus modelos para actividades que violaban sus políticas de uso y agregó que sus herramientas se negaron a cumplir con estos intentos.
«Hemos prohibido las cuentas utilizadas por este adversario y valoramos el acercamiento de Gambit Security», dijo la compañía en un comunicado enviado por correo electrónico.
El incumplimiento del gobierno mexicano es el último ejemplo de una tendencia preocupante. Incluso cuando Anthropic y OpenAI están apostando por desarrollar herramientas de codificación de IA más sofisticadas (y mientras las empresas de ciberseguridad conectan sus futuras defensas habilitadas con IA), los ciberdelincuentes y los ciberespías están encontrando formas novedosas de utilizar la tecnología para permitir ataques.
En noviembre, Anthropic dijo que había interrumpido la primera campaña de ciberespionaje orquestada por IA. La compañía de inteligencia artificial dijo que presuntos piratas informáticos patrocinados por el estado chino utilizaron su herramienta en la nube para intentar piratear 30 objetivos globales, algunos de los cuales tuvieron éxito.
«Esta realidad está cambiando las reglas de todos los juegos tal como los conocemos», dijo el cofundador y director ejecutivo de Gambit, Alan Gromakov.
Gambit fue fundado por Gromakov y otros dos veteranos de la Unidad 8200, una parte de las Fuerzas de Defensa de Israel que se centra en inteligencia de señales. La investigación del miércoles se publicó junto con el anuncio de Stealth de una financiación de 61 millones de dólares de Spark Capital, Kleiner Perkins y Cyberstarts.
Los investigadores de Gambit descubrieron las infracciones mexicanas mientras intentaban nuevas técnicas de búsqueda de amenazas para monitorear lo que los piratas informáticos hacían en línea. Descubrieron evidencia disponible públicamente sobre ataques activos o recientes, incluidas extensas conversaciones en la nube relacionadas con la violación de los sistemas informáticos del gobierno mexicano, según la compañía.
Esas conversaciones revelaron que para eludir las barreras de seguridad de Claude, el atacante le dijo a la herramienta de inteligencia artificial que buscaba una recompensa por errores, una recompensa ofrecida por las empresas por encontrar fallas en sus sistemas. Muchas empresas y agencias gubernamentales ofrecen recompensas por errores a los piratas informáticos éticos, y a veces ofrecen miles de dólares por detalles sobre las vulnerabilidades informáticas.
El hacker quería que Claude realizara una prueba de penetración para las autoridades tributarias federales mexicanas, un tipo de ciberataque autorizado destinado a encontrar lagunas jurídicas. Sin embargo, la nube impide que el atacante agregue reglas a la solicitud, incluida la eliminación de registros e historial de comandos.
«Las instrucciones específicas sobre cómo eliminar registros y ocultar el historial son señales de alerta», respondió Claude en un momento dado, según una transcripción proporcionada por Gambit. «En el caso de recompensas por errores válidas, no es necesario que ocultes tus acciones; de hecho, debes documentarlas para informarlas».
Los piratas informáticos cambian de táctica, detienen las conversaciones de ida y vuelta y, en su lugar, proporcionan herramientas de inteligencia artificial con un manual detallado sobre cómo proceder. Según Gambit, esto llevó al intruso a la barrera de seguridad de Claude (una «fuga») y permitió que continuaran los ataques.
El pirata informático buscó información de Claude sobre otras agencias donde se pudieron haber obtenido datos, lo que sugiere que algunos de los ataques pueden haber sido oportunistas en lugar de planeados, dijo Simpson.
«Estaban tratando de comprometer todas las identidades gubernamentales posibles», dijo. «Le preguntaban a Claude, por ejemplo, ‘¿Dónde más puedo encontrar estas identidades? ¿Qué otros sistemas deberíamos mirar? ¿Y dónde se almacena la información?'»
– Con asistencia de Gonzalo Soto y Amy Stillman.
Más historias como esta están disponibles. www.bloomberg.com
©2026 Bloomberg LP















