Vários modelos de base de IA prontamente disponíveis podem ser aplicados a uma infinidade de utilizações. Esses modelos permitem que mesmo aqueles com relativamente pouco conhecimento técnico ou experiência com IA construam produtos de IA. A cientista da computação Chip Huyen ensina você a adaptar um modelo às suas necessidades específicas e escolher um modelo que funcione melhor no seu caso.
A engenharia de IA difere da engenharia tradicional de aprendizado das máquinas.
O que distingue a IA hoje das versões anteriores é a sua escala. Aplicativos como ChatGPT, Gemini e Midjourney consomem quantidades significativas de eletricidade e são treinados em quantidades impressionantes de dados. Esses modelos de IA poderosos podem executar inúmeras aplicações, aumentando o seu valor econômico – e, em última análise, melhorando a vida das pessoas.
O treinamento de IAs de grandes modelos de linguagem (LLM) requer enormes quantidades de dados e poder computacional. Poucas empresas conseguem atender a essa demanda. A diferença entre os LLMs atuais e os modelos de linguagem anteriores é a “autossupervisão”: algoritmos de modelos de linguagem mais antigos precisavam de dados especificamente rotulados – o que pode levar muito tempo e recursos para serem coletados. A supervisão envolve marcar dados com comportamento e outros recursos que você deseja que um modelo aprenda e depois os utilizar para consolidar o resultado. Após a conclusão do treinamento, o modelo pode aplicar o que aprendeu com os conjuntos de dados marcados para analisar os dados em geral, acelerando...
Chip Huyen é escritora e cientista da computação que atua na interseção entre IA, dados e storytelling. Ela trabalhou com a Snorkel AI e a NVIDIA, fundou uma startup de infraestrutura de IA e ensinou design de sistemas de aprendizado das máquinas na Universidade de Stanford.
Comente sobre este resumo