读《大语言模型》中文书



最近在读来自RUC AI BOX《大语言模型》中文书。这本开源电子书是在去年上半年就发布的,现在读其实有点晚了,不过既然读了,终归有益。

之前大模型刚兴起时看过一些最新的英文著作,却始终没有读完。一直有系统学习AI大模型的想法,也就迟迟没有落实。

这本中文书应该可以实现这个目的了,至少可以快速先浏览一遍。整个内容比较清晰易懂,内容还算详实。

关键是,行文不是不忍卒读的翻译腔,是第一语言为中文的几个作者写的。看了下书作者的背景,基本都来自RUC高瓴人工智能学院AI BOX团队的老师和学生。质量应该是有保证的。

已经读了前面的几个章节,算是将之前零散的知识点串了起来,有了一个较为完整的框架,尤其是对LLM的历史发展和技术内核有了更准确和全面的把握。

后面继续看作为核心的部分,即大模型是如何通过预训练、微调这两个环节构建起来的。

AI这块我是打算作为往后的重点方向的。这个基础要打扎实了,才能走的更远。