这篇报告主要讲了人工智能大模型的发展情况,尤其是DeepSeek的创新和应用,还介绍了大模型在各个领域的应用以及如何帮助个人提升工作和生活效率。
1. 大模型发展现状:人工智能发展迅速,应用广泛,大模型成为关键技术。DeepSeek自2023年11月起陆续发布多个版本,引发热潮。全球很多云服务厂商都接入了DeepSeek,它在央国企和政务领域得到了大量应用,像在通信、能源、汽车、金融等行业,以及北京、广东等多地的政务工作中都发挥了作用。DeepSeek有文件处理、多种任务处理、联网搜索和深度思考的能力,它通过思维链技术提升推理能力,但也存在局限性 。在发展过程中,它经过多个阶段的演化,性能不断提升,还能对其他开源模型进行蒸馏训练,让小模型也有更好的表现。
2. 大模型发展趋势:随着芯片技术发展受限,大模型开始依靠优化架构来提升知识密度,并且每8个月左右知识密度就能提升一倍。训练方式也在改变,合成数据训练越来越普遍,强化学习让AI模型能够自我迭代。现在的大模型可以分为概率预测和链式推理两类,各有特点和适用场景。高质量的数据对大模型很重要,通用大模型和垂域大模型会一起发展,小模型本地部署也会因为资源需求低和数据安全等优势成为主流。
3. 大模型重点应用场景:在现实世界中,端侧大模型用在智能眼镜、手机、智慧台灯等设备上;具身智能结合大模型在工业、医疗等领域发挥作用;医疗大模型能进行病历生成、医学问答等工作。在数字世界里,大模型可以用于智能客服、金融业务、内容创作,还能通过智能体拓展功能。不过,大模型应用落地需要逐步推进,先试点验证成果,再进行推广。
4. DeepSeek能力赋能个人发展:我们可以通过网页端和手机端多种方式使用DeepSeek。它能帮助我们进行文本读写,比如写公文、阅读文档、搜索知识、写论文;在办公方面,能处理会议纪要,生成PPT、图表、流程图;在创意设计上,能制作演讲插图、海报、创意图片和视频。它还能用于搭建个人知识库、编程、处理Excel表格、设置工作流等。如果DeepSeek的回答效果不好,还可以把思考过程复制给其他大模型。我们还能本地部署AI工具,对特定领域的模型进行微调,在和AI协作时,要发挥人类的优势 。