跳过导航
AI 工程
书籍

AI 工程

用基础模型构建属于你的应用程序

O’Reilly, 2025 更多详情

购买此书

评级

8

关键特征

  • 解析性
  • 科学性
  • 实用性

导读荐语

如今,市面上出现了各种唾手可得的 AI 基础模型。它们能够应用于千行百业,出现在不计其数的场景之中。借助这些模型,即便是那些技术背景相对薄弱、甚至几乎没有 AI 经验的人,也能够打造属于自己的 AI 产品。《 AI 工程》(AI Engineering)这本书将帮助读者厘清 AI 工程与经典机器学习这两个概念的根本区别,指导大家一步步开发 AI 模型,从容应对开发过程中可能出现的各种挑战。读完本书,你将学到如何根据自身业务的特定需求来定制和改造 AI 模型,最终掌握关键方法,选择最契合的模型。记住,想要实现这一切,数据集至关重要;同样重要的是拥有一套评估方法,清晰了解项目进展情况,对 AI 工程之旅了如指掌。

浓缩书

AI 工程有别于传统的机器学习工程。

现代 AI 与过去 AI 的根本区别在于规模量级完全不同。像 ChatGPT、谷歌的 Gemini 以及 Midjourney 这类应用,消耗着惊人的电力,训练过程依赖海量的学习数据。然而,目前训练这些 AI 依赖的公开数据资源可能濒临耗尽。这些强大的人工智能模型能够驱动无数应用,提升经济价值,最终改善人们的生活。

训练大语言模型需要耗费海量的数据和巨大的算力。只有极少数公司能够承受如此高昂的成本。当今的大语言模型与早期的语言模型之间有着显著区别,它们能自监督学习。老一代语言模型算法学习时,依赖经过专门标记的数据。收集和整理这些标记数据的过程极为耗时耗力。这便是所谓的监督学习,也就是给数据打上标签,包含希望模型学习的行为或其他特征,模型会利用这些标签来指导最终输出。一旦训练完成,模型就能够举一反三,学会泛化,将从带标签的数据集上学到的知识应用到其他数据的处理中。这里横亘着一个巨大的挑战。随着数据复杂性的增加,标记工作的难度急剧上升。例如,标记日常物品的照片几乎人人都能做到;但要判断一张 CT 扫描图里是否有癌症的迹象,并为其打上标签,那就需要精深的专业知识。自监督学习则不同。它大大加速了这一过程,因为它允许模型根据输入的数据内容推断应该打什么标签。大语言模型的自监督学习便是基于训练数据中出现的大量文本序列,预测句子中下一个最可能出现的词是什么。它的训练数据可能来自博客文章、新闻报道和电子书。

关于作者

奇普·玄(Chip Huyen),是一名作家与计算机科学家,深耕于人工智能、数据科学与叙事艺术交汇地带。她曾服务于 Snorkel AI 和英伟达(NVIDIA)。她创办了一家初创公司,专注人工智能基础设施领域。同时,她还执教斯坦福大学,教授机器学习系统设计课程。


恭喜你又学完了一篇干货!复述、评论及做笔记是对知识最大的致敬↓