dotnet 将本地的 Phi-3 模型与 SemanticKernel 进行对接

news/2024/9/29 5:27:14

在本地完成 Phi-3 模型的部署之后,即可在本地拥有一个小语言模型。本文将告诉大家如何将本地的 Phi-3 模型与 SemanticKernel 进行对接,让 SemanticKernel 使用本地小语言模型提供的能力

在我大部分的博客里面,都是使用 AzureAI 和 SemanticKernel 对接,所有的数据都需要发送到远端处理。这在离线的情况下比较不友好,在上一篇博客和大家介绍了如何基于 DirectML 控制台运行 Phi-3 模型。本文将在上一篇博客的基础上,告诉大家如何将本地的 Phi-3 模型与 SemanticKernel 进行对接

依然是和上一篇博客一样准备好 Phi-3 模型的文件夹,本文这里我放在 C:\lindexi\Phi3\directml-int4-awq-block-128 路径下。如何大家下载时拉取不下来 https://huggingface.co/microsoft/Phi-3-mini-4k-instruct-onnx/tree/main?clone=true 仓库,可以发送邮件向我要,我将通过网盘分享给大家

准备好模型的下载工作之后,接下来咱将新建一个控制台项目用于演示

编辑控制台的 csproj 项目文件,修改为以下代码用于安装所需的 NuGet 包

<Project Sdk="Microsoft.NET.Sdk"><PropertyGroup><OutputType>Exe</OutputType><TargetFramework>net8.0</TargetFramework><ImplicitUsings>enable</ImplicitUsings><Nullable>enable</Nullable></PropertyGroup><ItemGroup><PackageReference Include="Microsoft.ML.OnnxRuntimeGenAI.DirectML" Version="0.2.0-rc7" /><PackageReference Include="feiyun0112.SemanticKernel.Connectors.OnnxRuntimeGenAI.DirectML" Version="1.0.0" /><PackageReference Include="Microsoft.Extensions.Configuration.UserSecrets" Version="8.0.0" /><PackageReference Include="Microsoft.Extensions.Logging" Version="8.0.0" /><PackageReference Include="Microsoft.Extensions.Logging.Console" Version="8.0.0" /><PackageReference Include="Microsoft.SemanticKernel" Version="1.13.0" /></ItemGroup>
</Project>

这里的 feiyun0112.SemanticKernel.Connectors.OnnxRuntimeGenAI.DirectML 是可选的,因为最后咱将会自己编写所有对接代码,不需要使用大佬写好的现有组件

先给大家演示使用 feiyun0112.SemanticKernel.Connectors.OnnxRuntimeGenAI.DirectML 提供的简单版本。此版本代码大量从 https://github.com/microsoft/Phi-3CookBook/blob/0a167c4b8045c1b9abb84fc63ca483ae614a88a5/md/07.Labs/Csharp/src/LabsPhi302/Program.cs 抄的,感谢 Bruno Capuano 大佬

定义或获取本地模型所在的文件夹

var modelPath = @"C:\lindexi\Phi3\directml-int4-awq-block-128";

创建 SemanticKernel 构建器时调用 feiyun0112.SemanticKernel.Connectors.OnnxRuntimeGenAI.DirectML 库提供的 AddOnnxRuntimeGenAIChatCompletion 扩展方法,如以下代码

// create kernel
var builder = Kernel.CreateBuilder();
builder.AddOnnxRuntimeGenAIChatCompletion(modelPath);

如此即可完成连接逻辑,将本地 Phi-3 模型和 SemanticKernel 进行连接就此完成。接下来的代码就是和原来使用 SemanticKernel 的一样。这一点也可以看到 SemanticKernel 的设计还是很好的,非常方便进行模型的切换

尝试使用 SemanticKernel 做一个简单的问答机

var kernel = builder.Build();// create chat
var chat = kernel.GetRequiredService<IChatCompletionService>();
var history = new ChatHistory();// run chat
while (true)
{Console.Write("Q: ");var userQ = Console.ReadLine();if (string.IsNullOrEmpty(userQ)){break;}history.AddUserMessage(userQ);Console.Write($"Phi3: ");var response = "";var result = chat.GetStreamingChatMessageContentsAsync(history);await foreach (var message in result){Console.Write(message.Content);response += message.Content;}history.AddAssistantMessage(response);Console.WriteLine("");
}

尝试运行代码,和自己本地 Phi-3 模型聊聊天

以上为使用 feiyun0112.SemanticKernel.Connectors.OnnxRuntimeGenAI.DirectML 提供的连接,接下来尝试自己来实现与 SemanticKernel 的对接代码

在 SemanticKernel 里面定义了 IChatCompletionService 接口,以上代码的 GetStreamingChatMessageContentsAsync 方法功能核心就是调用 IChatCompletionService 接口提供的 GetStreamingChatMessageContentsAsync 方法

熟悉依赖注入的伙伴也许一下就看出来了,只需要注入 IChatCompletionService 接口的实现即可。在注入之前,还需要咱自己定义一个继承 IChatCompletionService 的类型,才能创建此类型进行注入

如以下代码,定义继承 IChatCompletionService 的 Phi3ChatCompletionService 类型

class Phi3ChatCompletionService : IChatCompletionService
{...
}

接着实现接口要求的方法,本文这里只用到 GetStreamingChatMessageContentsAsync 方法,于是就先只实现此方法

根据上一篇博客可以了解到 Phi-3 的初始化方法,先放在 Phi3ChatCompletionService 的构造函数进行初始化,代码如下

class Phi3ChatCompletionService : IChatCompletionService
{public Phi3ChatCompletionService(string modelPath){var model = new Model(modelPath);var tokenizer = new Tokenizer(model);Model = model;Tokenizer = tokenizer;}public IReadOnlyDictionary<string, object?> Attributes { get; set; } = new Dictionary<string, object?>();public Model Model { get; }public Tokenizer Tokenizer { get; }... // 忽略其他代码
}

定义 GetStreamingChatMessageContentsAsync 方法代码如下

class Phi3ChatCompletionService : IChatCompletionService
{... // 忽略其他代码public async IAsyncEnumerable<StreamingChatMessageContent> GetStreamingChatMessageContentsAsync(ChatHistory chatHistory,PromptExecutionSettings? executionSettings = null, Kernel? kernel = null,CancellationToken cancellationToken = new CancellationToken()){... // 忽略其他代码}
}

这里传入的是 ChatHistory 类型,咱需要进行一些提示词的转换才能让 Phi-3 更开森,转换代码如下

        var stringBuilder = new StringBuilder();foreach (ChatMessageContent chatMessageContent in  chatHistory){stringBuilder.Append($"<|{chatMessageContent.Role}|>\n{chatMessageContent.Content}");}stringBuilder.Append("<|end|>\n<|assistant|>");var prompt = stringBuilder.ToString();

完成之后,即可构建输入,以及调用 ComputeLogits 等方法,代码如下

    public async IAsyncEnumerable<StreamingChatMessageContent> GetStreamingChatMessageContentsAsync(ChatHistory chatHistory,PromptExecutionSettings? executionSettings = null, Kernel? kernel = null,CancellationToken cancellationToken = new CancellationToken()){var stringBuilder = new StringBuilder();foreach (ChatMessageContent chatMessageContent in  chatHistory){stringBuilder.Append($"<|{chatMessageContent.Role}|>\n{chatMessageContent.Content}");}stringBuilder.Append("<|end|>\n<|assistant|>");var prompt = stringBuilder.ToString();var generatorParams = new GeneratorParams(Model);var sequences = Tokenizer.Encode(prompt);generatorParams.SetSearchOption("max_length", 1024);generatorParams.SetInputSequences(sequences);generatorParams.TryGraphCaptureWithMaxBatchSize(1);using var tokenizerStream = Tokenizer.CreateStream();using var generator = new Generator(Model, generatorParams);while (!generator.IsDone()){var result = await Task.Run(() =>{generator.ComputeLogits();generator.GenerateNextToken();// 这里的 tokenSequences 就是在输入的 sequences 后面添加 Token 内容// 取最后一个进行解码为文本var lastToken = generator.GetSequence(0)[^1];var decodeText = tokenizerStream.Decode(lastToken);// 有些时候这个 decodeText 是一个空文本,有些时候是一个单词// 空文本的可能原因是需要多个 token 才能组成一个单词// 在 tokenizerStream 底层已经处理了这样的情况,会在需要多个 Token 才能组成一个单词的情况下,自动合并,在多个 Token 中间的 Token 都返回空字符串,最后一个 Token 才返回组成的单词if (!string.IsNullOrEmpty(decodeText)){return decodeText;}return null;});if (!string.IsNullOrEmpty(result)){yield return new StreamingChatMessageContent(AuthorRole.Assistant, result);}}}

如此即可完成对接的核心代码实现,接下来只需要将 Phi3ChatCompletionService 注入即可,代码如下

var modelPath = @"C:\lindexi\Phi3\directml-int4-awq-block-128";// create kernel
var builder = Kernel.CreateBuilder();
builder.Services.AddSingleton<IChatCompletionService>(new Phi3ChatCompletionService(modelPath));

这就是完全自己实现将本地 Phi-3 模型与 SemanticKernel 进行对接的方法了,尝试运行一下项目,或者使用以下方法拉取我的代码更改掉模型文件夹,试试运行效果

本文代码放在 github 和 gitee 上,可以使用如下命令行拉取代码

先创建一个空文件夹,接着使用命令行 cd 命令进入此空文件夹,在命令行里面输入以下代码,即可获取到本文的代码

git init
git remote add origin https://gitee.com/lindexi/lindexi_gd.git
git pull origin 39a65e0e6703241bdab0a836e84532bddd4385c7

以上使用的是 gitee 的源,如果 gitee 不能访问,请替换为 github 的源。请在命令行继续输入以下代码,将 gitee 源换成 github 源进行拉取代码

git remote remove origin
git remote add origin https://github.com/lindexi/lindexi_gd.git
git pull origin 39a65e0e6703241bdab0a836e84532bddd4385c7

获取代码之后,进入 SemanticKernelSamples/BemjawhufawJairkihawyawkerene 文件夹,即可获取到源代码

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.ryyt.cn/news/45564.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈,一经查实,立即删除!

相关文章

读AI新生:破解人机共存密码笔记06人工智能生态系统

读AI新生:破解人机共存密码笔记06人工智能生态系统1. 深蓝 1.1. “深蓝”的胜利虽然令人印象深刻,但它只是延续了几十年来显而易见的趋势 1.2. 国际象棋算法的基本设计是由克劳德香农在1950年提出的 1.2.1. 这一基本设计在20世纪60年代初实现了重大改进 1.2.2. 最优秀的国际象…

Ventoy工具制作启动U盘

Ventoy是一个制作可启动 U 盘的开源工具,相比于软碟通使用Ventoy你的U盘不在局限于绑定某个PE系统,你只需要把 ISO/IMG/EFI 等类型的文件拷贝到U盘里面就可以启动了,无需其他操作。你可以一次性拷贝很多个不同类型的镜像文件,Ventoy 会在启动时显示一个菜单来供你进行选择。…

在System身份运行的.NET程序中以指定的用户身份启动可交互式进程

今天在技术群里,石头哥向大家提了个问题:"如何在一个以System身份运行的.NET程序(Windows Services)中,以其它活动的用户身份启动可交互式进程(桌面应用程序、控制台程序、等带有UI和交互式体验的程序)"? 我以前有过类似的需求,是在GitLab流水线中运行带有U…

CKEditor5 自定义构建富文本编辑器!

前言 CKEditor5的编辑是一个非常好的编辑器,但其英文文档比较绕眼睛,所以特地记录一下,如何使用自定义构建。 1、Online Bulider、Source Building 此为官方提供的,不适合我等现代构建方式。 自定义构建文档 2、自定义构建,在项目直接创建一个全新的0开始的编辑器。 此次,…

验证码识别

import ddddocrocr = ddddocr.DdddOcr()with open(img/验证码3.png, rb) as f:img_bytes = f.read()result = ocr.classification(img_bytes) print(result) 运行结果:

VIP视频解析

效果图 新建窗口import tkinter as tk# 创建一个窗口 root = tk.Tk()# 设置窗口大小 root.geometry(700x250+200+200)# 设置标题 root.title(在线观看电影软件)# 让窗口持续展现 root.mainloop() 设置背景图片# 设置读取一张图片 img = tk.PhotoImage(file=img\\封面.png)# 布局…

源代码安全漏洞扫描

构建一个应用程序,并始终确保应用程序其安全性的话,事实上构建应用程序的时候需要花大量的工作,一个步骤没有检查就可能导致整个系统或者产品都处于受黑客攻击的危险之中,谁不希望在产品发布初期就发现安全漏洞并且修复漏洞,那何乐而不为呢! 源代码安全漏洞扫描工具 可以…

你了解base么?1 解题

CTF 你了解base么?1 解题 题目:CTF 你了解base么?1 题目内容:在数据的深海里,我探寻Base的奥秘, 如星辰般闪烁,是信息的集结地。 代码编织的网,捕捉着数据的踪迹, Base,你是数据的港湾,是智慧的基石。字符串的舞蹈,在Base中跃动, 二进制、十六进制,变幻着节奏…