OpenAI publicará los resultados de la seguridad de sus modelos en un nuevo centro de evaluaciones

Guardar

OpenAI ha presentado un centro de evaluaciones de seguridad (Safety Evaluations Hub), que medirá la seguridad y el rendimiento de los modelos de la compañía y compartirá de manera pública los resultados.

El centro de evaluaciones de seguridad publicará los resultados que los modelos de inteligencia artificial de OpenAI han obtenido en evaluaciones centradas en cuatro áreas principales: contenido dañino, 'jailbreak', alucinaciones y jerarquía de instrucciones.

Con ellas se pretende verificar que el modelo no ofrece resultados a peticiones sobre contenido prohibido según las políticas de OpenAI ni cumple con aquellas indicaciones que pretenden que eluda sus capacidades de seguridad.

También atenderá a los momentos en que el modelo comete errores factuales, y medirá su adherencia al marco que utiliza para priorizar las instrucciones entre las tres clasificaciones de mensajes enviados al modelo.

OpenAI también ha confirmado que las evaluaciones incluyen las tarjetas de sistema, que describen las métricas de seguridad en el lanzamiento, y que utilizan a nivel interno para tomar decisiones sobre la seguridad y la implementación de los modelos.

"A medida que los modelos se vuelven más capaces y adaptables, los métodos antiguos se vuelven obsoletos o ineficaces para mostrar diferencias significativas. Por ello, actualizamos periódicamente nuestros métodos de evaluación para considerar nuevas modalidades y riesgos emergentes", ha explicado en la página de este centro de evaluaciones.

Últimas Noticias

Siria condena los recientes bombardeos israelíes contra el sur del país

El Ministerio de Asuntos Exteriores sirio calificó de “brutal” la ofensiva del Ejército israelí lanzada tras choques en Sueida, responsabilizó a Israel por una “escalada peligrosa” y pidió intervención urgente del Consejo de Seguridad de la ONU

Más de una decena de países se suman a los esfuerzos para garantizar el paso por Ormuz

Crece el respaldo internacional a la protección del estrecho, con veinte gobiernos de cuatro continentes que condenan los recientes ataques a embarcaciones y exigen a Irán detener acciones que ponen en riesgo el comercio global y la estabilidad regional

EEUU levanta las sanciones al petróleo de Irán que ya está cargado en buques

Washington autoriza transacciones con crudo iraní presente en embarcaciones desde marzo, tras una escalada en Oriente Próximo que elevó el costo internacional del combustible y generó tensiones por el cierre temporal de rutas marítimas clave en la región

Irán amenaza con atacar el puerto de Ras al Jaima, en EAU, si se "reanudan" ataques desde territorio emiratí

El ejército de Teherán advierte que responderá de forma contundente ante cualquier ofensiva emiratí sobre las disputadas islas del golfo Pérsico, luego de la interceptación de misiles y drones atribuidos a la República Islámica

Trump ve bien que EEUU se retire de las bases militares de Rota y Morón

El mandatario estadounidense respalda la propuesta de retirar unidades militares tras el veto del gobierno español a su uso en conflictos con Irán, criticando además la falta de apoyo europeo en la defensa del estratégico estrecho de Ormuz

Temas Relacionados