Existen diversos modelos fundacionales de IA fácilmente disponibles que pueden aplicarse a innumerables usos. Estos modelos permiten crear productos de IA incluso a personas con relativamente pocos conocimientos técnicos o experiencia en IA. Este libro le ayudará a comprender la diferencia entre la ingeniería de IA y los modelos clásicos de aprendizaje automático, así como a desarrollar un modelo de IA y superar los retos que puedan surgir durante el proceso. Aprenda a adaptar un modelo a sus necesidades específicas y, en última instancia, a elegir el modelo que mejor se adapte a usted.
La ingeniería de IA difiere de la ingeniería tradicional del aprendizaje automático.
Lo que distingue a la IA actual de sus versiones anteriores es su enorme escala. Aplicaciones como ChatGPT, Gemini de Google y Midjourney consumen cantidades significativas de electricidad y se entrenan con enormes cantidades de datos. La cantidad de datos disponibles públicamente para entrenarlos podría agotarse. Estos potentes modelos de IA pueden ejecutar innumerables aplicaciones, lo que aumenta su valor económico y, en última instancia, mejora la vida de las personas.
El entrenamiento de IA con modelos de lenguaje grandes (LLM) requiere enormes cantidades de datos y potencia de cómputo. Pocas empresas pueden satisfacer esta demanda. La diferencia entre los LLM actuales y los modelos anteriores es la autosupervisión: los algoritmos de los modelos más antiguos necesitaban datos etiquetados específicamente, lo que puede representar mucho tiempo y recursos. La supervisión consiste en etiquetar los datos con comportamientos y otras características que se desea que el modelo aprenda y que luego utilice para producir resultados. Una vez completado el entrenamiento, el...
Comentarios sobre este resumen