大模型显存计算

news/2024/9/27 17:36:51

大模型微调需要多少GPU显存?

  如:微调 1B 模型,16bit = 2byte

  1. 全量微调

  显存占用分为:

  • model weight(参数本身):10亿(bit) = 20亿(byte)约等于2GB

  训练模型时,通过一系列反向传播的方法,来更新模型参数,涉及以下gradient​和optimizer states​参数。

  不断计算梯度,以更新模型参数

  • gradient(梯度):近似2GB
  • optimizer states(优化器):近似4倍的model weight​,即8GB
  • Activation:忽略不计

  共12GB,约6倍的model weight​显存。

  1. 高效微调(PEFT)
  • LoRA微调:以更少量的参数进行学习,从而对原有模型微调。

image

  原有模型model weight​为2GB

  ​Adaptor weight​为0.05GB(如按2.5%的比例)

  ​gradient​和optimizer states​约为0.25GB(如按2.5%的比例)

  共约2.3GB。

  • QLoRA微调:对原有参数(model weight​)进一步压缩,如将原有的16bit转换为8bit或者4bit。

论文推荐:

  1. GPU估计: LLMem: Estimating GPU Memory Usage for Fine-Tuning Pre-Trained LLMs
  2. QLoRA:Efficient Finetuning of Quantized LLMs
  3. LoRA: Low-Rank Adaptation of Large Language Models

  ‍

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.ryyt.cn/news/45912.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈,一经查实,立即删除!

相关文章

一图看懂编码,加密,令牌化的不同之处

一图看懂编码,加密,令牌化的不同之处

解决HBuilder X识别不了魅族手机的问题

似乎魅族手机有点特别,别的手机识别没事,但是到了魅族手机就是识别不了,下面上处理方案 这里假设你的调试已经打开的情况下, 找到目录C:\Users\tutu-qiuxie\Downloads\HBuilderX\plugins\launcher-tools\tools\adbs先把软件关闭, 打开HbuilderX后,记得手机上弹出的是否允…

[模式识别复习笔记] 第5章 贝叶斯分类器

1. 贝叶斯分类器 1.1 贝叶斯公式 假设有一个试验的样本空间为 \(S\),记 \(B_1, B_2, \ldots, B_c\) 为 \(S\) 的一个划分,\(A\) 为试验的条件,且 \(P(A) \not = 0\),则: \[P(B_i | A) = \frac{P(B_i)P(A|B_i)}{P(A)} = \frac{P(B_i)P(A|B_i)}{\sum_{j=1}^{c}P(B_j)P(A|B_j…

Windows删除服务

删除的是文件管理器里的服务 如何进入右击此电脑,选择管理(没看到管理的话点击显示更多选项) 进入计算机管理进入计算机管理后选择服务和应用程序 双击服务 要删除的就是这里的服务——————————如何删除 参考—— https://www.sysgeek.cn/windows-delete-service/以…

你不知道的 CSS 之包含块

你不知道的 CSS 之包含块 一说到 CSS 盒模型,这是很多小伙伴耳熟能详的知识,甚至有的小伙伴还能说出 border-box 和 content-box 这两种盒模型的区别。 但是一说到 CSS 包含块,有的小伙伴就懵圈了,什么是包含块?好像从来没有听说过这玩意儿。好吧,如果你对包含块的知识一…

《深入理解计算机系统》

深入理解计算机系统读书先看书之序言:明确他面向的读者——本书是一个导论课本,是面向程序员的,所以并不是那么深入(因为程序员也不需要了解那么多)所以这对于初学者来说是比较容易的,合适的入门之选第一章:计算机系统漫游相当于是一个粗略的介绍,导言,但是短小精干1.…

杨辉三角学习笔记

基本概念 这是一个杨辉三角。记 \(a_{i,j}\) 为第 \(i\) 行第 \(j\) 列的数。 \(a_{i,j} = a_{i-1,j-1} + a_{i-1,j}\) 示例代码 #include <bits/stdc++.h> using namespace std; int n; int a[105][105];int main(){scanf("%d",&n); //输入行数for(int i=…

【原创】EtherCAT主站IgH解析(二)-- Linux/Windows/RTOS等多操作系统IgH EtherCAT主站移植指南

本文探讨IgH EtherCAT Master针对Linux/Windows/RTOS等不同操作系统的移植。版权声明:本文为本文为博主原创文章,转载请注明出处。如有问题,欢迎指正。博客地址:https://www.cnblogs.com/wsg1100/ 前言 目前,EtherCAT商用主站有:Acontis、TwinCAT3、KPA、Codesys等,开源…