
中小学教育资源及组卷应用平台 单元3 第二节 第一课《搭建本地语言大模型》教学设计 课题 了解语言大模型 单元 第3单元 学科 信息科技 年级 七年级 核心素养目标 信息意识:能够认识到在使用本地语言大模型时,数据隐私和安全的重要性,了解如何保护个人信息不被滥用。计算思维:能够运用计算思维解决在使用本地语言大模型过程中遇到的问题,如模型选择、参数配置等。 数字化学习与创新:能够掌握搭建和使用本地语言大模型的技能,包括下载安装服务软件、下载开源模型和界面工具。 信息社会责任:能够理解在使用本地语言大模型技术时的社会责任,包括尊重知识产权、保护用户隐私和避免技术滥用。 教学重点 一、搭建本地语言大模型二、运行本地语言大模型 教学难点 运行本地语言大模型 教学过程 教学环节 教师活动 学生活动 设计意图 导入新课 单元3 第二节 第一课 《了解语言大模型》:学习目标1.搭建和运行本地语言大模型2.体验本地交互式知识库的搭建与使用。我们前面一直在使用在线语言大模型。我很期待能在自己的电脑上搭建本地语言大模型。 学生根据教师提供的指导,准备搭建本地语言大模型所需的硬件和软件环境,例如安装必要的编程工具、框架和依赖库。 让学生体验本地交互式知识库的搭建与使用,将之前学习的理论知识(如语言大模型的原理和应用)转化为实际操作能力,加深对知识的理解。 讲授新课 一、搭建本地语言大模型在自己的电脑上搭建一个语言大模型相当于拥有了个人版的智慧大脑。本地语言大模型不用依赖网络云计算服务,能快速响应用户需求。本地语言大模型将用户数据保留在本地,不会上传云端,保护了使用者的隐私与安全。本地语言大模型提供更大的可定制性和灵活性,更符合个人的需求与风格。思考活动一和同学讨论以下场景,使用在线语言大模型与本地语言大模型,哪种更合适 将讨论结果填写到下表中。建立本地语言大模型,通常采用“服务工具+开源语言大模型”的模式。为便于操作,还可以安装一个界面工具。第一步:下载安装一个服务软件。第二步:使用服务软件下载一个开源语言大模型。第三步:下载安装一个界面工具。我们应该如何选择开源的语言大模型呢 服务工具会列出自己所支持的开源语言大模型。注意,即使是同一个模型,也会有不同的参数版本,参数越大的模型,需要的计算机配置也就越高。拓展阅读语言大模型中的参数图中显示的“0.5b"“1.5b”“7b”“72b”指模型的参数量。上一节我们讲过语言大模型的“大”包含有“参数数量巨大”的意思。这里的“b”代表“Billion”。所以,0.5b 表示模型参数为 5 亿个,1.5b 表示模型参数为 15 亿个,7b 表示模型参数为 70 亿个,72b 的模型参数则达到了720亿个之多。参数越大模型的能力就越强,但同时也意味着硬件设备所提供的算力必须提升。粗略估算,训练一个有70亿参数的模型可能需要2至4张高性能显卡,以及14G左右的显存。各大公司训练规模巨大的模型往往需要上千张高性能显卡协同工作。不仅如此,训练与运行还将消耗庞大的电力,所以研究者已经开始在探索其他的模型实现方式,而不是一味地追求增加参数。我们把模型中的参数量与生物的神经元数量进行粗略的对比:人脑拥有约1000亿个神经元,每个神经元平均有1000个连接,估算人脑有100万亿个参数。1951年马文·斯基建立的第一个神经网络机器 SNARC ,模拟了40个神经元的小网络。CPT-4采用1.8万亿个参数,已经达到人脑1%的参数水平。二、运行本地语言大模型安装好本地语言大模型后,可以进一步根据需要去建立自己的本地知识库。将我们收集的资源相关的文件上传到本地大模型中,经过大模型的学习,一个“本地知识库”就设置成功了。现在知识库导入了很多关于美食的书籍。有问题知识库可以帮忙解答。比如想尝尝 ... ...
~~ 已预览到文档结尾了 ~~