
OpenAI ha presentado un centro de evaluaciones de seguridad (Safety Evaluations Hub), que medirá la seguridad y el rendimiento de los modelos de la compañía y compartirá de manera pública los resultados.
El centro de evaluaciones de seguridad publicará los resultados que los modelos de inteligencia artificial de OpenAI han obtenido en evaluaciones centradas en cuatro áreas principales: contenido dañino, 'jailbreak', alucinaciones y jerarquía de instrucciones.
Con ellas se pretende verificar que el modelo no ofrece resultados a peticiones sobre contenido prohibido según las políticas de OpenAI ni cumple con aquellas indicaciones que pretenden que eluda sus capacidades de seguridad.
También atenderá a los momentos en que el modelo comete errores factuales, y medirá su adherencia al marco que utiliza para priorizar las instrucciones entre las tres clasificaciones de mensajes enviados al modelo.
OpenAI también ha confirmado que las evaluaciones incluyen las tarjetas de sistema, que describen las métricas de seguridad en el lanzamiento, y que utilizan a nivel interno para tomar decisiones sobre la seguridad y la implementación de los modelos.
"A medida que los modelos se vuelven más capaces y adaptables, los métodos antiguos se vuelven obsoletos o ineficaces para mostrar diferencias significativas. Por ello, actualizamos periódicamente nuestros métodos de evaluación para considerar nuevas modalidades y riesgos emergentes", ha explicado en la página de este centro de evaluaciones.
Últimas Noticias
Abortado un alijo de 410 kilos de cocaína que iba a ser desembarcado en Barbate con dos detenidos
La Guardia Civil impidió el acceso de una gran cantidad de droga a través de la costa de Cádiz, arrestó a dos sospechosos e incautó vehículos, un arma larga y dispositivos de comunicación además de los 17 fardos incautados

El publicitario Jorge Oller ha presentado su primer libro El arte del desapego junto a Toni Segarra
Jorge Oller, reconocido en la industria creativa latinoamericana, comparte en su obra una visión personal sobre la transformación y el papel de la autenticidad, presentando herramientas prácticas para afrontar desafíos y fomentar el liderazgo en entornos exigentes

El PSOE pedirá a la UE que se pronuncie sobre si las "prácticas" en el Hospital de Torrejón vulneran la normativa

Detenido uno de los menores investigados por quemar el pelo a una persona sin hogar en Benacazón
