Categorias

GPT-4o: OpenAI Anuncia Nova Versão que Será Grátis para Todos

A OpenAI lançou uma atualização revolucionária para o ChatGPT, o GPT-4o (“o” de “omni”), que promete uma interação mais natural entre humanos e computadores. Esta versão é uma evolução significativa porque aceita qualquer combinação de texto, áudio e imagem como entrada e pode gerar saídas em qualquer uma dessas modalidades.

Inovações Técnicas e Melhorias

O GPT-4o pode responder a entradas de áudio em até 232 milissegundos, com uma média de 320 milissegundos, tempo comparável ao de resposta humana. Essa melhoria é significativa em relação ao modo Voice anterior, que tinha latências de 2,8 segundos com o GPT-3.5 e 5,4 segundos com o GPT-4. Com o novo modelo, todo o processo de transcrição de áudio para texto e vice-versa é realizado em uma única etapa por um modelo integrado, permitindo que o sistema processe tons, múltiplos falantes, ruídos de fundo e expresse emoções como risadas e canto.

Desempenho e Capacidades Multimodais

O GPT-4o estabelece novos padrões de desempenho em benchmarks tradicionais, igualando a performance do GPT-4 Turbo em texto, raciocínio e habilidades de codificação, e superando em capacidades multilíngues, áudio e visão. Esta versão introduziu uma melhoria significativa na tokenização de idiomas, reduzindo drasticamente o número de tokens necessários para várias línguas, o que otimiza tanto a eficiência quanto a velocidade de processamento.

Segurança e Limitações

A segurança é uma prioridade integrada no GPT-4o, com novos sistemas para monitorar a saída de voz e outras modalidades. A avaliação de segurança do modelo não indica riscos acima de médio em categorias como cibersegurança, persuasão e autonomia do modelo. Assim, a OpenAI também realizou uma extensa “red teaming” externa para identificar e mitigar riscos adicionados pelas novas modalidades.

Disponibilidade e Acessibilidade

O GPT-4o está sendo lançado gradualmente, começando com acesso ampliado para testadores e introduzindo capacidades de texto e imagem no ChatGPT a partir de hoje. O modelo estará disponível gratuitamente, e os desenvolvedores poderão acessá-lo via API com vantagens significativas em termos de custo e velocidade em relação ao GPT-4 Turbo.

Mas afinal, o que é o GPT-4o?

O GPT-4o, a mais recente inovação da OpenAI, representa um salto notável na tecnologia de inteligência artificial. Este modelo, apelidado de “omni”, é projetado para ser intrinsecamente multimodal, capaz de processar e gerar conteúdo através de texto, áudio e imagens simultaneamente. Ao contrário de seus predecessores, os desenvolvedores treinaram o GPT-4 de ponta a ponta para compreender e responder utilizando todas essas modalidades de entrada e saída, permitindo interações muito mais naturais e intuitivas entre humanos e computadores. Dessa forma, essa capacidade de entender nuances complexas em várias formas de comunicação o coloca à frente no campo da IA, abrindo novas possibilidades para aplicativos em educação, atendimento ao cliente, entretenimento e muito mais.

Experiência Aprimorada no ChatGPT

A OpenAI está comprometida em tornar a IA avançada mais acessível e útil globalmente. O GPT-4o suporta agora mais de 50 idiomas e introduz melhorias em qualidade e velocidade. Usuários do ChatGPT terão novas ferramentas e funcionalidades inteligentes na versão gratuita, melhorando a experiência de interação com o modelo.

O lançamento do GPT-4o marca um avanço significativo na usabilidade prática da IA, trazendo um modelo de nível GPT-4 de forma mais ampla e acessível. Assim, o GPT-4 da OpenAI redefine as expectativas dos modelos de linguagem e estabelece um novo padrão para a interação humano-computador.

Por fim, para mais insights sobre como essa tecnologia está transformando o campo da engenharia e tecnologia, visite o Blog da Engenharia em www.blogdaengenharia.com.

Postagens Relacionadas