LLM学习-基础知识

news/2024/10/21 23:51:44

NLP

NLP代表自然语言处理,是关于计算机和人类语言之间交互的领域。NLP涵盖了一系列任务,包括文本处理、语音识别、语言翻译、信息检索等。NLP技术的发展使得计算机能够理解、解释和生成人类语言,促进了许多领域的发展,包括智能助手、文本分析、情感分析等。

LLM

LLM指的是大型语言模型(Large Language Models),是一类基于深度学习的模型,用于处理自然语言处理任务(NLP)。NLP是关于计算机和人类语言之间交互的领域,是一种概念;而LLM是一类基于深度学习的大型语言模型,是一种。
常见LLM模型:
image

  • 闭源LLM:ChatGPT(OpenAI)、Claude(Anthropic)、PaLM/Gemini(Google)、文心一言(百度)、星⽕⼤模型(讯⻜)..
  • 开源LLM:LLama(Meta)、通义千问(阿里巴巴)、ChatGLM(清华+智谱)、Baichuan(百川智能)..

RAG

检索增强⽣成(RAG, Retrieval-Augmented Generation),一种架构,通过融合检索模块和生成模块,提供更加准确和连贯的文本生成能力。整合了从庞⼤知识库中检索到的相关信息,并以此为基础,指导⼤型语⾔模型⽣成更为精准的答案,从⽽显著提升了回答的准确性与深度。
工作流:
image

Finetune

微调,通过在特定数据集上进⼀步训练⼤语⾔模型,来提升模型在特定任务上的表现。

LangChain

LangChain是一个用于构建基于语言模型的应用程序的框架。它的设计目标是帮助开发者更方便地使用大型语言模型并将其集成到实际应用中。LangChain提供了一系列工具和组件,使得开发者能够更容易地进行任务如生成文本、问答、对话系统等。
image

Embeddings

也叫词向量,一种文本嵌入技术,文本嵌入技术的核心思想是将文本中的单词、短语或句子映射到高维向量空间中。这些向量空间中的点表示文本单位,并且相似的文本单位在向量空间中应该距离较近。通过这种方式,文本嵌入可以捕捉到词语之间的语义关系。

向量数据库

存储经过了Embeddings的向量数据。向量数据库是⽤于⾼效计算和管理⼤量向量数据的解决⽅案。向量数据库是⼀种专⻔⽤于存储和检索向量数据(embedding)的数据库系统。它与传统的基于关系模型的数据库不同,它主要关注的是向量数据的特性和相似性。

Prompt

提示词,分为系统提示词、用户提示词。

  • System Prompt:在整个会话过程中持久地影响模型的回复,且相⽐于普通Prompt 具有更⾼的重要性。(如:设定模型始终模拟一个幽默的助理)
  • User Prompt:用户给模型的原始输入。
    所谓的提示词工程Prompt Engineering便是通过更加合理的输入,让大模型理解问题,以输出最合理的答案。

temperature参数

LLM中的温度参数,控制模型输出的随机性和多样性的重要超参数。它通常用于采样生成文本的过程,尤其是在生成式任务中,如文本生成、对话系统等。temperature 参数可以影响生成文本的样式和内容。
Temperature ⼀般取值在 0~1 之间,当取值较低接近 0 时,预测的随机性会较低,产⽣更保守、可预测的⽂本,不太可能⽣成意想不到或不寻常的词。当取值较⾼接近 1 时,预测的随机性会较⾼,所有词被选择的可能性更⼤,会产⽣更有创意、多样化的⽂本,更有可能⽣成不寻常或意想不到的词。

Transformer

是一种深度学习模型架构,最初用于自然语言处理任务,ChatGPT就是基于此架构开发的。
image

TensorFlow、PyTorch

TensorFlow(谷歌)和 PyTorch(Meta)为最受欢迎的两个深度学习开源框架,它们提供了丰富的算法库和工具,支持研究者和开发人员高效地实现复杂的神经网络模型。

预训练

使用海量的训练数据(纯文本,没有QA),这些数据可以来自互联网网页、维基百科、书籍、GitHub、论文、问答网站等,构建包含数千亿甚至数万亿单词的具有多样性的内容,经过数千块高性能GPU和高速网络组成的超级计算机,花费数十天甚至数月的时间完成深度神经网络参数的训练,构建基础模型(Foundation Model),也叫基座模型。
此时,基础模型能够对长文本进行建模,具备语言生成能力,根据输入的提示词,模型可以生成文本补全句子。

有监督微调/指令微调

在已经预训练好的模型基础上,通过使用有标注的特定任务数据(QA)对模型进行进一步的训练和调整,以提高模型在特定任务或领域上的性能。

奖励模型

文本质量对比模型,它接受环境状态、生成的结果等信息作为输入,并输出一个奖励值作为反馈。奖励模型通过训练,能够识别并区分不同输出文本之间的优劣,为后续的强化学习阶段提供准确的奖励信号。

强化学习

根据数十万名用户给出的提示词,利用前一阶段训练的奖励模型,给出SFT模型对用户提示词补全结果的质量评估,并与语言模型建模目标综合得到更好的效果。

模型量化

模型量化就是将浮点存储(运算)转换为整型存储(运算)的一种模型压缩技术。简单直白点讲,即原来表示一个权重需要使用float32表示,量化后只需要使用int8来表示就可以啦,仅仅这一个操作,就可以获得接近4倍的网络加速。

Agent

应用于特定领域的智能体,如医疗、教育、金融、娱乐等。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.ryyt.cn/news/74414.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈,一经查实,立即删除!

相关文章

Photoshop PS 免费安装使用2024 最新使用

传送门:https://pan.quark.cn/s/3166efc40518 ps:下载后解压就可使用在前端开发的过程中,设计师没有空的时候,或者独自在加班的时候,图像处理是一个不可避免的任务。无论是切图、调整图片尺寸,还是简单的修饰,掌握一款强大的图像编辑工具都是非常重要的。作为一名前端工…

form表单元素测试(checkbox和radio)

form表单元素测试之checkbox(复选框)和radiobutton(单选按钮)一、定义form表单 用到的元素:checkbox和radiobutton 下图定义了一个选择爱好和选择性别的form表单,区域1用到的表单元素是checkbox(复选框),区域2用到的表单元素是radiobutton点击查看代码 <!DOCTYPE htm…

Day11 备战CCF-CSP练习

202303-3Day 11 题目描述 题目很长,就不赘述了(主要是懒得写) 题目解析 Gauss 消元 题目的提示很明显,将元素守恒作为建立等式的基础。只要满足每一行元素守恒,即\(x_1 + x_2 + + x_n = 0\)即可 元素个数为\(m\),物质个数为\(n\),增广矩阵的大下为\(m * (n + 1)\),Gau…

服务器端训练yolov5使用tensorboard+端口转发 实时查看训练成果

服务器端训练yolov5使用tensorboard+端口转发 实时查看训练成果 本文参照博客园的一位大佬(相当感谢!!!):本地浏览器查看云服务器训练模型的tensorboard界面 - 拾一贰叁 - 博客园 服务器端操作运行train.py开始训练 新开一个终端进入到yolov5目录 输入 tensorboard --l…

习题6.7代码

习题6.7代码 import numpy as np import pandas as pd import cvxpy as cp import networkx as nx import matplotlib.pyplot as plt df = pd.read_excel(F:\python数学建模与算法\源程序\《Python数学建模算法与应用》程序和数据\第6章 图论模型\data6.xlsx) D = df.values d…

在华为云服务器上测试GCC for OpenEuler的特性

步骤1:购买并配置华为云服务器 1.1 注册华为云账号访问华为云官网:打开浏览器,访问 华为云官网。 注册账号:点击页面右上角的“注册”按钮。 按照提示填写必要的信息(邮箱、密码、验证码等)完成注册。 可能需要验证邮箱,请按照邮件中的指示完成验证。1.2 登录华为云控制…

类欧几里得算法

前言注:该文章不定期更新。Tips: 建议阅读文章后自行推导,否则难以掌握。介绍 类欧几里得算法是用 \(O(\log n)\) 的时间复杂度求解形似于 \(f(a,b,c,n)=\sum\limits_{i=0}^n\lfloor\frac{ai+b}{c}\rfloor\) 的函数的值的一种算法。 由于其算法复杂度证明与扩展欧几里得算法类…