Bitget App
Trading inteligente
Comprar criptoMercadosTradingFuturosCopyBotsRenda
OpenAI lança monitoramento CoT para prevenir comportamentos maliciosos em grandes modelos

OpenAI lança monitoramento CoT para prevenir comportamentos maliciosos em grandes modelos

Ver original
Bitget2025/03/10 23:35

A OpenAI lançou sua mais recente pesquisa, indicando que o uso do monitoramento CoT (Cadeia de Pensamento) pode impedir que grandes modelos falem bobagens, escondam verdadeiras intenções e outros comportamentos maliciosos. É também uma das ferramentas eficazes para supervisionar supermodelos. A OpenAI usou o modelo de ponta recém-lançado o3-mini como o sujeito a ser monitorado, com um modelo GPT-4o mais fraco atuando como monitor. O ambiente de teste consistia em tarefas de codificação, exigindo que a IA implementasse funções em bibliotecas de código para passar em testes unitários. Os resultados mostraram que os monitores CoT tiveram um desempenho excelente na detecção de comportamento sistemático de "hacking de recompensa", com uma taxa de recall de até 95%, superando em muito os 60% de apenas monitorar o comportamento.

0

Aviso Legal: o conteúdo deste artigo reflete exclusivamente a opinião do autor e não representa a plataforma. Este artigo não deve servir como referência para a tomada de decisões de investimento.

PoolX: bloqueie e ganhe!
Até 10% de APR - Quanto mais você bloquear, mais poderá ganhar.
Bloquear agora!