À medida que avançamos na era da inteligência artificial, a engenharia de prompt, que já foi vista como uma habilidade crucial, está no limiar de uma transformação significativa. Isso se deve à auto-otimização de prompts, aquelas instruções que fornecemos para moldar as respostas dos chatbots de IA, que está começando a superar a intervenção humana. E, ao que parece, com os avanços nos modelos de LLM (linguagem de grande escala), a necessidade de engenharia de prompt pode não apenas ser reduzida, mas possivelmente eliminada no futuro.
Historicamente, a engenharia de prompt envolvia habilidades especializadas para formular perguntas de maneira que os assistentes produzissem as melhores respostas possíveis. No entanto, com as inovações contínuas em inteligência artificial, os modelos estão cada vez mais capacitados para interpretar e processar perguntas de maneira natural, ajustando seus próprios algoritmos para entender e preencher as lacunas nas solicitações dos usuários. Esse avanço não é apenas uma questão de eficiência, mas também de acessibilidade, democratizando o uso da IA.
As últimas versões de modelos como GPT da OpenAI incorporam mecanismos que permitem uma compreensão mais profunda do contexto e do significado implícito nas interações. Isso significa que, independentemente da forma como uma pergunta é formulada, o modelo tem a capacidade de interpretar a intenção do usuário e gerar respostas apropriadas e contextualmente relevantes. Essa habilidade resulta em uma menor dependência de instruções meticulosamente engenhadas, permitindo que até usuários com conhecimento básico em IA interajam eficazmente com a tecnologia.
Como resultado, os assistentes podem aprender e adaptar-se de forma independente. Esses modelos não apenas respondem melhor durante interações naturais, mas também geram imagens com maior relevância ao longo do tempo.
Veja o resultado a seguir, obtido a partir do prompt “gato usando óculos e roupas steampunk” no DALL-E. Até pouco tempo atrás, para obter o mesmo resultado, seria preciso apresentar instruções muito mais detalhadas:
E, ainda no campo da geração de imagens, já existem ferramentas que ajudam na geração de prompts mais elaborados. Um exemplo é o GPT Turbo com Vision. O serviço tem a capacidade de “ver” e interpretar imagens, podendo gerar conteúdos sobre ela.
No caso abaixo, ao solicitarmos “gere um prompt que descreva essa imagem”:
o Vision gerou a seguinte descrição, que pode ser reutilizada para gerar novas versões da foto:
”A imagem captura o rosto vibrante e expressivo de um palhaço. A peruca do personagem é uma explosão de cores, com cachos que se alternam entre vermelho, amarelo, verde, azul e roxo, lembrando o arco-íris. O rosto é pintado predominantemente de branco, com detalhes teatrais que acentuam as características faciais. Os olhos são circundados por sombras azuis e pretas, com lágrimas estilizadas que escorrem, adicionando um toque dramático. Um nariz vermelho brilhante, redondo e proeminente ocupa o centro do rosto, enquanto lábios vermelhos e bem delineados exibem um sorriso exagerado. Completa o visual uma maquiagem em forma de coração na bochecha direita e uma lágrima na bochecha esquerda. A expressão do palhaço parece alegre e convidativa, apesar das lágrimas pintadas, criando uma dicotomia interessante entre alegria e tristeza que frequentemente é associada a esses personagens.”
Essa evolução implica que os usuários de IA precisarão entender cada vez menos a complexidade por trás da tecnologia. Isso não só amplia o seu alcance, mas também a torna mais interativa e menos intimidadora. A verdadeira democratização da IA ocorre quando qualquer pessoa pode utilizar suas funcionalidades avançadas sem necessidade de treinamento especializado.
E, neste cenário, como fica o papel do engenheiro de prompts? Ele também terá que evoluir. A tendência é que a atividade se volte para casos de uso específicos ou para a supervisão e gestão de modelos de IA. Assumirá novos papéis relevantes, focados na integração, segurança e conformidade dos sistemas.
O avanço na autonomia dos modelos de IA continuará quebrando paradigmas na interação humano-máquina. À medida que os modelos se tornem mais autossuficientes na compreensão e resposta às solicitações dos usuários, novos caminhos se abrirão para uma adoção mais ampla e popular da tecnologia.
Juliano Simões
CEO da CentralServer