一、面向初学者的生成式人工智能教程
微软推出了一套面向入门者的生成式人工智能免费课程。这个系列共包含 18 个单元,旨在全面介绍开发生成式 AI 应用的相关知识。
课程内容涵盖了多个关键领域:
1.生成式 AI 和大型语言模型(LLMs)的基本概念
2.提示工程技巧
3.文本生成应用的构建方法
4.聊天应用的开发流程
5.图像生成技术的应用
6.向量数据库的使用等
这套课程材料是开源的,让学习者能够系统地掌握创建各类生成式 AI 应用所需的基础知识和实践技能。
https://github.com/microsoft/generative-ai-for-beginners

二、Llama 3 教程
在GitHub上,一个名为「Nishant Aklecha」的开发者发布了《从零开始实现Llama3的项目》,迅速吸引了广泛关注。这个项目详细解释了Llama3推理原型模型的实现过程。对于初学者和想要深入了解大模型实现原理的开发者来说,这是一份不可多得的宝贵资料。然而,尽管原文已经做了较为详细的阐述,但要想完全理解和掌握Llama3推理原型模型的实现,还需要一定的背景知识作为基础。本文旨在为初学者提供这些必要的背景知识,并在此基础上对《从零开始实现Llama3》一文进行更深入的解读,帮助大家从零开始,逐步入门大模型的世界。
https://github.com/naklecha/llama3-from-scratch


三、动手学大模型应用开发
本项目是一个面向小白开发者的大模型应用开发教程,旨在基于阿里云服务器,结合个人知识库助手项目,通过一个课程完成大模型开发的重点入门,主要内容包括:
1.大模型简介,何为大模型、大模型特点是什么、LangChain 是什么,如何开发一个 LLM 应用,针对小白开发者的简单介绍;
2.如何调用大模型 API,本节介绍了国内外知名大模型产品 API 的多种调用方式,包括调用原生 API、封装为 LangChain LLM、封装为 Fastapi 等调用方式,同时将包括百度文心、讯飞星火、智谱AI等多种大模型 API 进行了统一形式封装;
3.知识库搭建,不同类型知识库文档的加载、处理,向量数据库的搭建;
4.构建 RAG 应用,包括将 LLM 接入到 LangChain 构建检索问答链,使用 Streamlit 进行应用部署
5.验证迭代,大模型开发如何实现验证迭代,一般的评估方法有什么
https://github.com/datawhalechina/llm-universe
