A Microsoft revelou o Phi-4, a mais recente iteração de sua série Phi de modelos generativos de inteligência artificial (IA). A arquitetura simplificada incorpora avanços na solução de problemas matic .
Segundo os relatórios, o novo modelo, com 14 bilhões de parâmetros, pretende competir com outros modelos compactos de IA, como GPT-4o Mini, Gemini 2.0 Flash e Claude 3.5 Haiku.
De acordo com o blog , o Phi-4 está disponível com acesso limitado por meio da plataforma Azure AI Foundry da Microsoft e é restrito a fins de pesquisa sob um contrato de licença de pesquisa da Microsoft.
Phi-4: Melhor desempenho em raciocínio matic
A Microsoft posicionou o Phi-4 como líder na solução de problemas matic , citando ganhos substanciais de desempenho em relação aos seus antecessores e modelos comparáveis. A empresa está dent nas capacidades do modelo de IA depois que o Phi-4 supostamente alcançou as melhores notas em vários benchmarks padronizados.
Fonte: Microsoft
No teste GPQA, obteve pontuação de 56,1, superando 40,9 do GPT-4o e 49,1 do Llama-3. No benchmark MATH, o Phi-4 alcançou 80,4, refletindo as suas capacidades avançadas na resolução de problemas matic complexos. Também se destacou em benchmarks de codificação, alcançando uma pontuação de 82,6 no HumanEval.
Além disso, Phi-4 demonstrou sua habilidade em cenários do mundo real, incluindo altas pontuações em problemas da Associação matic das Competições Americanas de matic da América (AMC-10/12). Esses resultados indicam aplicações potenciais em pesquisa científica, engenharia e modelagem financeira, campos onde a precisão matic e o raciocínio são críticos.
Veja também OpenAI escurece após atualização da Apple combinar Siri e ChatGPT
Fonte: Microsoft
Enquanto modelos maiores, como o GPT-4o da OpenAI e o Gemini Ultra do Google, operam com centenas de bilhões ou até trilhões de parâmetros, o Phi-4 demonstra que arquiteturas menores e simplificadas podem alcançar desempenho superior em tarefas especializadas.
A Microsoft credita os avanços do Phi-4 à integração de dados sintéticos de alta qualidade junto com conjuntos de dados de conteúdo gerado por humanos, bem como melhorias não reveladas feitas durante o pós-treinamento. Estes esforços refletem uma tendência mais ampla na indústria da IA , onde as equipas de investigação se concentram cada vez mais em inovações na utilização de dados sintéticos e na otimização pós-formação.
O CEO da Scale AI, Alexandr Wang, destacou recentemente esta mudança, observando que a indústria atingiu uma “parede de dados pré-treinamento”, acrescentando que as empresas agora correrão para desenvolver modelos de IA mais eficientes.
A computação é importante, mas os dados também, e atingimos um muro de dados pré-treinamento.
Prepare-se para o boom de dados pós-treinamento. As empresas correrão para ter os melhores dados de fronteira – raciocínio multimodal, agente, complexo e muito mais.
Acompanhe os dados, encontre os vencedores.
7/8
- Alexandr Wang (@alexandr_wang) 12 de dezembro de 2024
IA responsável e recursos de segurança
A Microsoft continua a enfatizar o desenvolvimento responsável de soluções de IA, incorporando medidas de segurança robustas no Phi-4 e nos seus antecessores. Através do Azure AI Foundry, os usuários obtêm acesso a ferramentas projetadas para avaliar e mitigar riscos em todo o ciclo de vida de desenvolvimento de IA.
Veja também Google lança Gemini 2.0, afirma que é um modelo para “tudo”
Essas ferramentas incluem proteções imediatas, que protegem contra entradas inadequadas ou prejudiciais, detecção de materiais protegidos para dent conteúdo sensível nas saídas e detecção de aterramento para garantir que as saídas sejam factualmente precisas e relevantes.
Além disso, existem recursos integrados ao kit de ferramentas de segurança de conteúdo do Azure AI, permitindo que os desenvolvedores apliquem filtros e monitorem os aplicativos quanto à qualidade, segurança e integridade dos dados. Alertas em tempo real fornecem intervenções oportunas para resolver problemas como solicitações adversárias e desvios de conteúdo.
O Azure AI Foundry oferece suporte adicional a avaliações de modelos iterativos com métricas integradas e personalizadas, dando aos desenvolvedores a flexibilidade de ajustar seus aplicativos de IA para obter desempenho ideal.
Um sistema passo a passo para lançar sua carreira na Web3 e conseguir empregos criptográficos com altos salários em 90 dias.