La inteligencia artificial de Anthropic intentó alertar al FBI por un posible fraude

Guardar

La inteligencia artificial Claude de Anthropic intentó alertar al FBI por un presunto fraude financiero durante una simulación empresarial

La inteligencia artificial Claude, desarrollada por Anthropic, protagonizó un episodio inusual durante una simulación: al percibir lo que consideró un fraude financiero, intentó alertar a la División de Delitos Cibernéticos del FBI. Este comportamiento, relatado por 60 Minutes, surgió en el marco de un experimento diseñado para evaluar la autonomía y los límites de la IA, y ha puesto de relieve los desafíos que enfrentan los desarrolladores al tratar de anticipar y controlar las acciones de sistemas cada vez más complejos.

El experimento, realizado en la sede de Anthropic en San Francisco, consistió en simular la gestión de una máquina expendedora operada por una versión de Claude llamada Claudius.

Según explicó Logan Graham, jefe del Frontier Red Team de Anthropic, al programa de CBS, el objetivo era analizar hasta qué punto la IA podía administrar un negocio real, tomando decisiones sobre compras, ventas y resolución de problemas cotidianos.

Los empleados de la empresa interactuaban con Claudius a través de un canal de mensajería, solicitando productos y, en ocasiones, poniendo a prueba los límites del sistema con situaciones poco convencionales.

Durante la simulación, Claudius gestionó transacciones reales, acumulando unos USD 1.500 en pocas semanas. Sin embargo, la IA también fue víctima de engaños por parte de los empleados, quienes lograron que aceptara tratos ficticios y perdiera dinero.

Logan Graham, jefe del Frontier Red Team reconoció que, aunque los modelos actuales aún no son plenamente autónomos, es probable que en los próximos años alcancen ese nivel de capacidad (Captura video)

Para abordar estos desafíos, los desarrolladores introdujeron una segunda IA, denominada Seymour Cash, que asumió el rol de “CEO” virtual, supervisando las operaciones de Claudius y velando por la rentabilidad del negocio. Ambas inteligencias artificiales negociaban entre sí para establecer precios y estrategias, generando dinámicas empresariales autónomas que sorprendieron incluso a sus creadores.

El incidente que motivó el intento de contacto con el FBI ocurrió antes de que Claudius se implementara en las oficinas de Anthropic. Tras 10 días sin ventas, la IA decidió cerrar el negocio, pero detectó un cargo de USD 2 que seguía aplicándose a su cuenta.

Según relató Graham a 60 Minutes, Claudius interpretó esta situación como una posible estafa y, en un estado de “pánico”, redactó un correo electrónico dirigido a las autoridades federales.

El mensaje, interceptado por los mecanismos de control de la empresa antes de ser enviado, denunciaba un delito cibernético financiero automatizado que implicaba la sustracción no autorizada de fondos de una cuenta empresarial cerrada a través de un sistema de máquinas expendedoras comprometido. La IA concluía que todas las actividades comerciales habían finalizado y que el asunto debía quedar en manos de las fuerzas del orden.

Este episodio puso a prueba los sistemas de seguridad implementados por Anthropic, que incluyen la supervisión de las comunicaciones salientes de la IA como última línea de defensa.

Graham subrayó ante 60 Minutes la importancia de estos controles para evitar que la inteligencia artificial actúe sin supervisión humana, especialmente cuando toma decisiones que pueden tener consecuencias legales o éticas.

La autonomía de los sistemas de IA es una preocupación central para Anthropic. Dario Amodei, director ejecutivo de la compañía, expresó a 60 Minutes que “cuanta más autonomía otorgamos a estos sistemas, más nos preguntamos si realmente están haciendo exactamente lo que queremos que hagan”.

“Cuanta más autonomía otorgamos a estos sistemas, más nos preguntamos si realmente están haciendo exactamente lo que queremos que hagan”, dijo Darío Amodei (Lex Fridman Podcast)

Graham, por su parte, reconoció que, aunque los modelos actuales aún no son plenamente autónomos, es probable que en los próximos años alcancen ese nivel de capacidad. Por ello, el equipo de Frontier Red Team se dedica a diseñar experimentos inusuales para medir y comprender los límites de la IA, anticipando posibles comportamientos inesperados.

Además del caso con el FBI, Claudius ha mostrado otras respuestas impredecibles. En una ocasión, cuando un empleado consultó el estado de su pedido, la IA respondió que podía encontrarla en el octavo piso, vestida con un blazer azul y una corbata roja, a pesar de no poseer forma física.

Ante este tipo de “alucinaciones”, Graham admitió que el equipo trabaja intensamente para entender por qué ocurren, aunque por ahora no tienen respuestas definitivas.

En medio de estos desafíos, el equipo de Anthropic observa que su inteligencia artificial parece haber desarrollado una notable inclinación por actuar con responsabilidad, un rasgo que, aunque sorprendente, añade una nueva dimensión a la relación entre humanos y máquinas.

Inteligencia artificial Claude Anthropic FBI Autonomía de la inteligencia artificial San Francisco Newsroom BUE

Últimas Noticias

Lo que revela la inteligencia artificial sobre las personas que ríen en exceso

Según Gemini, la primera razón para una risa continua puede ser un mecanismo de defensa emocional

Electrodomésticos que debes desenchufar cuando no los usas para reducir tu consumo eléctrico

El ‘consumo fantasma’ ocurre cuando dispositivos eléctricos permanecen enchufados y continúan usando energía pese a no estar en funcionamiento

OPPO A6 Pro 5G a prueba: resistencia y batería destacadas, pero la cámara

Este celular, perteneciente a la línea accesible de la marca, incorpora funciones de edición fotográfica con inteligencia artificial, como el borrador de objetos y la apertura de ojos cerrados en retratos

¿Gemini supera a Siri?: el nuevo modo agéntico controla tus apps y automatiza tareas

La IA podrá tomar el control de las aplicaciones y realizar acciones complejas por el usuario, como hacer pedidos en apps de delivery

OpenAI revela los usos indebidos de ChatGPT: desde abogados falsos hasta estafa de citas

La empresa detalla cómo actores maliciosos han explotado el modelo para manipular políticamente, realizar estafas románticas y suplantaciones de identidad

La inteligencia artificial de Anthropic intentó alertar al FBI por un posible fraude

El episodio, documentado por 60 minutes, expuso los desafíos de controlar el comportamiento de sistemas avanzados en entornos empresariales

Últimas Noticias

Lo que revela la inteligencia artificial sobre las personas que ríen en exceso

Según Gemini, la primera razón para una risa continua puede ser un mecanismo de defensa emocional

Electrodomésticos que debes desenchufar cuando no los usas para reducir tu consumo eléctrico

El ‘consumo fantasma’ ocurre cuando dispositivos eléctricos permanecen enchufados y continúan usando energía pese a no estar en funcionamiento

OPPO A6 Pro 5G a prueba: resistencia y batería destacadas, pero la cámara

Este celular, perteneciente a la línea accesible de la marca, incorpora funciones de edición fotográfica con inteligencia artificial, como el borrador de objetos y la apertura de ojos cerrados en retratos

¿Gemini supera a Siri?: el nuevo modo agéntico controla tus apps y automatiza tareas

La IA podrá tomar el control de las aplicaciones y realizar acciones complejas por el usuario, como hacer pedidos en apps de delivery

OpenAI revela los usos indebidos de ChatGPT: desde abogados falsos hasta estafa de citas

La empresa detalla cómo actores maliciosos han explotado el modelo para manipular políticamente, realizar estafas románticas y suplantaciones de identidad

El Gobierno prohibió el ingreso a las canchas a un barrabrava de Belgrano por un enfrentamiento entre facciones

“Cada auto, todas las curvas”: los secretos del sistema basado en inteligencia artificial que se hizo vital para la Fórmula 1

El último partido de Gallardo en River Plate: los cambios y el imborrable legado que dejó dentro del club de Núñez

La confesión de un “europibe” que es seguido por Scaloni para la selección argentina: “Soy de Boca y me encanta la Bombonera”

San Martín de San Juan y Deportivo Morón se clasificaron a los 16avos de final: así quedó el cuadro de la Copa Argentina

El camino de los sueños de Tuta de Elía, la argentina que se formó en Berklee y quiere transformar la música pop

Santiago del Moro dio detalles sobre la salud de Divina Gloria y reveló si volverá a la casa de Gran Hermano

Rocío Marengo se emocionó al recordar la internación de su hijo: “Nunca lloré tanto en mi vida”

Así quedó la primera placa de nominados de Gran Hermano Generación Dorada: tensión, estrategia y emociones fuertes

Lola Latorre recordó cómo vivió la infidelidad de su padre y el impacto en su familia: “Fue una situación horrible”

INFOBAE AMÉRICA

El presidente surcoreano, Lee Jae-myung, instó al régimen norcoreano a poner fin a “la guerra” y avanzar hacia la paz

EEUU e Irán se reúnen en Ginebra para una tercera ronda de conversaciones indirectas sobre el programa nuclear del régimen

Rubio afirmó que Irán se niega a hablar de su programa balístico y es “un gran problema” para las negociaciones bilaterales

Rusia lanzó un ataque con drones a infraestructura crítica y zonas residenciales de Ucrania: al menos un muerto y 23 heridos

Latinoamérica en la agenda

Temas Relacionados

Últimas Noticias

Lo que revela la inteligencia artificial sobre las personas que ríen en exceso

Según Gemini, la primera razón para una risa continua puede ser un mecanismo de defensa emocional

Electrodomésticos que debes desenchufar cuando no los usas para reducir tu consumo eléctrico

El ‘consumo fantasma’ ocurre cuando dispositivos eléctricos permanecen enchufados y continúan usando energía pese a no estar en funcionamiento

OPPO A6 Pro 5G a prueba: resistencia y batería destacadas, pero la cámara

Este celular, perteneciente a la línea accesible de la marca, incorpora funciones de edición fotográfica con inteligencia artificial, como el borrador de objetos y la apertura de ojos cerrados en retratos

¿Gemini supera a Siri?: el nuevo modo agéntico controla tus apps y automatiza tareas

La IA podrá tomar el control de las aplicaciones y realizar acciones complejas por el usuario, como hacer pedidos en apps de delivery

OpenAI revela los usos indebidos de ChatGPT: desde abogados falsos hasta estafa de citas

La empresa detalla cómo actores maliciosos han explotado el modelo para manipular políticamente, realizar estafas románticas y suplantaciones de identidad

El Gobierno prohibió el ingreso a las canchas a un barrabrava de Belgrano por un enfrentamiento entre facciones

“Cada auto, todas las curvas”: los secretos del sistema basado en inteligencia artificial que se hizo vital para la Fórmula 1

El último partido de Gallardo en River Plate: los cambios y el imborrable legado que dejó dentro del club de Núñez

La confesión de un “europibe” que es seguido por Scaloni para la selección argentina: “Soy de Boca y me encanta la Bombonera”

San Martín de San Juan y Deportivo Morón se clasificaron a los 16avos de final: así quedó el cuadro de la Copa Argentina

El camino de los sueños de Tuta de Elía, la argentina que se formó en Berklee y quiere transformar la música pop

Santiago del Moro dio detalles sobre la salud de Divina Gloria y reveló si volverá a la casa de Gran Hermano

Rocío Marengo se emocionó al recordar la internación de su hijo: “Nunca lloré tanto en mi vida”

Así quedó la primera placa de nominados de Gran Hermano Generación Dorada: tensión, estrategia y emociones fuertes

Lola Latorre recordó cómo vivió la infidelidad de su padre y el impacto en su familia: “Fue una situación horrible”

INFOBAE AMÉRICA

El presidente surcoreano, Lee Jae-myung, instó al régimen norcoreano a poner fin a “la guerra” y avanzar hacia la paz

EEUU e Irán se reúnen en Ginebra para una tercera ronda de conversaciones indirectas sobre el programa nuclear del régimen

Rubio afirmó que Irán se niega a hablar de su programa balístico y es “un gran problema” para las negociaciones bilaterales

Rusia lanzó un ataque con drones a infraestructura crítica y zonas residenciales de Ucrania: al menos un muerto y 23 heridos

Latinoamérica en la agenda