课程说明
课程级别 | 高级 |
培训周期 | 3-6个月 |
上课时间 | 全日制 |
上课地址 | 上海市徐汇区番禺路951B号-A座1楼IT研究院 |
课程简介
我们利用AI 赋能,为 200 多个行业客户提供AI解决方并顺利地实现商业化,积累了丰富的经验。AI技术案发展,尤其是大模型的出现及火爆,导致了就业市场出现了相关人才的短缺,面对此类工作岗位人才的巨大缺口,我们运用自身6年的人工智能项目经验,结合当下不断选代的AI技术,研发出适合当前就业市场需求的AI大模型算法工程师课程,促使越来越多的有志之人投身于人工智能大发展的浪潮中。
参加AI大模型算法工程师项目实训
我们用AI 赋能,为 200 多个行业客户提供AI 解决方案,并顺利实现了商业化,积累了丰富的经验。AI技术发展,尤其是大模型的出现及火爆,导致了就业市场出现了相关人才的短缺,面对此类工作岗位人才的巨大缺口,我们运用自身6年的人工智能项目经验,结合当下不断迭代的新AI技术,研发出适合当前就业市场需求的AI大模型算法工程师课程,促使越来越多的有志之人投身于人工智能大发展的浪潮中。
学员参与就业保 障计划
✔ 上海、苏州、杭州、北京、深圳等多家AI合作企业 ✔ 入职上述企业的人工智能及相关研发岗位工作 ✔ 通过考核的学员获得上海交大教育AI大模型算法工程师培训证书并提供就业保 障 ✔ 学习未达标者,提供免费重修服务
项目优势
1 优势
专业的实验设备
为学员配套练习,配置大模型训练微调所需要的算力资源,实训基本花巨资购买GPU卡和服务器,让每一位同学都有至少一台训练设备;
2 优势
直面真实场景实操,掌握实战技能
线下学习通过实际项目实操,学员能够直接面对真实场景中的问题,有助于理解理论知识在实际工作中的应用。这种实战经验对于学员的问题解决能力和模型微调技巧至关重要;
3 优势
行业项目经理授课,紧跟行业趋势
紧跟行业趋势,让学员所学技能不过时,提升其场的技术优势,由大模型项目研发亲自执导,为您带来成体系的微调技术课程。在这里,您将直接受益于业界的专业知识和实战经验,深入掌握前沿的大模型微调策略。
4 优势
深度体验实操练习,培训动手实战能力
我们的课程特别设计了一系列实操环节,确保学员不仅理论学习,更能亲自动手实践,深刻理解技术的来源与应用原理。通过这样的深度体验,学员将大幅提升技术的实际运用能力,增强自身竞争力。
AI大模型算法工程师的岗位职能
✔ 熟悉各类AI大语言模型和多模态大模型,能私有化部署;
✔ 熟练使用 LangChain等框架,对RAG,Agent有深入理解和思维链设计。;
✔ 负责相关产品的模型训练和服务部署;
✔ 对主流的大模型(GPT、文心一言、百川、chatGLM、通义、LLaMA等)有较丰富的使用经验和prompt微调经验;
✔ 掌握大语言模型SFT/LoRA/RLHF等技术,提升特定任务的大模型能力;
✔ 熟练掌握主流深度学习框架pytorch,LLM训练并行框架Deepspeed等多机多卡方案;
✔ 跟踪大模型领域前沿技术,提出创新思路来推动算法升级和业务发展。
适合人群
IT研发工程师
移动端开发,C++/Java有项目研发经验,代码能力强,学习后薪资涨幅较高。
本科及以上高校学生
计算机、人工智能、软件工程、数学、电子信息等相关的专业,本科及硕士人群。
产品经理
项目管理、产品经理、或者细分行业准备做智能化升级的负责人,希望提升自己的人士
想进入AI领域发展的人群
其它行业人士,想转行进入AI人工智能领域寻找机会的人士(IT相关职位优先)。
课程大纲
第一阶段:人工智能认知基础 | |||||||||
课程内容 | 课程大纲 | ||||||||
人工智能大模型技术的过去、现在与未来 | (1)人工智能的发展史 (2)大模型的发展史 (3)人工智能的基本原理 | ||||||||
大模型实际应用案例介绍 | (1)大模型企业应用案例 (2)企业拥抱大模型的痛点与解决方案 | ||||||||
体验大模型 | 体验大模型 |
第二阶段:大模型开发环境基础 | |||||||||
课程内容 | 课程大纲 | ||||||||
环境搭建与使用 | (1)Linux命令基础 (2)Docker基础 (3)XShell操作 (4)人工智能相关基础库介绍与安装 | ||||||||
开源大模型部署 | (1)Ollama介绍与安装 (2)常见的开源大模型部署 |
第三阶段:AI大模型应用开发平台基础 | |||||||||
课程内容 | 课程大纲 | ||||||||
AI大模型应用开发平台基础 | (1)Dify平台的介绍与安装 (2)Dify配置基础大模型 (3)Dify创建聊天机器人 (4)Dify创建知识库 (5)Dify创建Agent (6)Dify创建工作流 |
第四阶段:大模型研发基础 | |||||||||
课程内容 | 课程大纲 | ||||||||
IDE环境搭建 | (1)Vscode安装与配置 (2)Jupyter介绍 | ||||||||
python编程复盘 | (1)Python核心语法 (2)Python文件操作 (3)Python多进程与多线程 | ||||||||
数据科学计算库实战 | (1)Pandas实战 (2)Numpy实战 | ||||||||
人工智能开发框架基础 | (1)Pytorch基础 | ||||||||
大语言模型结构详解 | (1)注意力机制 (2)Transformer网络结构 |
第五阶段:大模型微调基础 | |||||||||
课程内容 | 课程大纲 | ||||||||
HuggingFace基础 | (1)Pipeline基础 (2)Transformers组件基础 (3)Tokenizer组件基础 (4)Datasets组件基础 (5)Evalaute组件基础 (6)Trainer组件基础 | ||||||||
显存优化基础 | (1)内存、显存基本结构与工作方式 (2)模型显存占有量计算 (3)模型在显存中的存储优化 | ||||||||
模型微调基础 | (1)大模型训练流程 (2)BitFit微调 (3)Prompt-Tuning微调 (4)P-Tuning微调 (5)Prefix-Tuning微调 (6)LORA微调 (7)IA3微调 (8)模型量化 (9)QLora微调 (10)对齐微调(RLHF\DPO) (11)实战:微调llama3 | ||||||||
模型推理优化基础 | (1)vLLM推理框架基础 (2)Llama.cpp基础 | ||||||||
多机多卡分布式训练基础 | (1)并行基础 (2)Fairscale训练基础 (3)Accelerator训练基础 (4)Deepspeed训练基础 |
第六阶段:大模型能力扩展 | |||||||||
课程内容 | 课程大纲 | ||||||||
Langchain基础 | (1)Langchain开发环境搭建 (2)链与LCEL基础 (3)记忆模块基础 (4)知识增强检索基础(RAG) (5)智能体基础(AGENT) |
第七阶段:项目实战 | |||||||||
课程内容 | 课程大纲 | ||||||||
智能问答 | 使用自己微调的大模型,叠加自己的知识库,开发一个专业问答。例如法律咨询、医疗咨询等。 | ||||||||
报告生成能手 | 使用自己微调的大模型,叠加自己的知识库与智能,开发一个报告撰写能手。 | ||||||||
数据智能治理 | 利用大模型从海量的、杂乱的文本数据中提取需要的信息,并结构化数据存储。 | ||||||||
全流程内容制造者 | 通过大模型Agent能力对网站进行的监视与内容获取,然后自动的对内容进行分析、摘要、重写,最后自动发布到平台。 |
项目开班
课程内容以实际授课为准
温馨提示