Início Notícias O OpeniAi Operador fará o seu clique e digitar para você

O OpeniAi Operador fará o seu clique e digitar para você

6
0

A nova ferramenta de inteligência artificial da OpenAI, operadora, foi projetada para facilitar suas tarefas mundanas, incluindo fazer reservas de jantar, encomendar mantimentos e preencher formulários.

Em um vídeo de demonstração, o OpenAI destaca como o agente da IA ​​pode interagir com as páginas da web digitando, clicando e rolando ao usar um navegador especial. Você apenas descreve a tarefa que deseja executar e o agente pode lidar com várias solicitações ao mesmo tempo – como fazer compras no Etsy enquanto faz uma reserva para o jantar.

Pode “ver” via capturas de tela e “interagir” da mesma maneira que um mouse e teclado permitiriam dentro de um navegador, de acordo com o OpenAI. O operador, que o OpenAI descreve como “um de nossos primeiros agentes”, está disponível em uma visualização limitada.

Com concorrentes como o Google e o Antrópico já oferecendo agentes de IA semelhantes, o OpenAI está trabalhando para restringir a lacuna. Também faz parte do maior esforço da OpenAI para tornar sua IA generativa ainda mais útil, automatizando mais aspectos da vida cotidiana, potencialmente se aproximando de cumprir a promessa de que isso mudará para sempre a maneira como interagimos com a tecnologia.

“A capacidade de usar as mesmas interfaces e ferramentas com as quais os humanos interagem diariamente amplia a utilidade da IA, ajudando as pessoas a economizar tempo nas tarefas diárias e abrindo novas oportunidades de engajamento para empresas”, disse a empresa em uma postagem no blog.

A ferramenta é alimentada por um novo modelo chamado agente de uso de computador, que combina os recursos de visão do GPT-4O com o raciocínio avançado através do aprendizado de reforço. É treinado para interagir com interfaces gráficas do usuário, incluindo os botões, menus e campos de texto que as pessoas veem em uma tela.

Se surgirem problemas, disse a empresa, o operador poderá usar seus recursos de raciocínio para se autocorrer ou retornar o controle ao usuário. Também é treinado para solicitar ao usuário que assuma tarefas que exigem certas entradas, como credenciais de login ou detalhes de pagamento.

A ferramenta está agora disponível para pagar usuários profissionais nos EUA em operator.chatgpt.com.

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui