Alineación deliberativa: el razonamiento permite modelos lingüísticos más seguros
1 year ago
10
Alineación deliberativa: el razonamiento permite modelos lingüísticos más seguros
Presentamos la nueva estrategia de alineación para los modelos o1, a los que enseñamos directamente las especificaciones de seguridad y cómo razonar sobre ellas.