腾讯云+Ollama部署远程访问大模型api

news/2024/10/3 0:35:02

Ollama是个极为方便的大模型框架

1.腾讯云上选购合适的云服务器,为了方便拉取模型,地区建议选择北美(计费模式选择按量计费是为了省钱,老板有钱的话随意)

架构选择异构计算

镜像选择Ubuntu22.04,驱动版本默认就行,云硬盘默认50G即可

网络默认分配即可,一定要选择分配独立公网IP,否则无法远程访问

事前需要建立一个安全组,方便起见放通全部流量即可,在此处选择此安全组

选择完成后,等待服务部署完成.

2.在云服务器界面登录进刚刚部署好的云服务器,等待安装显卡驱动的脚本自动执行完成后,使用如下脚本安装Ollama

curl -fsSL https://ollama.com/install.sh | sh

3.Ollama默认只监听本地11434端口,按如下方法更改设置令Ollama监听外部请求

sudo nano /etc/systemd/system/ollama.service

在Service下方(光标处)添加如下字段,

Environment="OLLAMA_HOST=0.0.0.0:11434"

按Ctrl+S保存,Ctrl+X退出

然后重新读取配置文件并重启Ollama服务

sudo systemctl daemon-reload

sudo systemctl restart ollama

4.在本地使用浏览器访问服务器IP地址:11434,(服务器地址可在腾讯云后台查看,注意是公网地址),出现如下页面则表示Olamma启动成功

5.但此时只安装好了Olamma框架,还没有模型,需要按需拉取模型,此处以llama3为例

6.然后在本地编写代码向服务器以网络请求的方式与大模型会话

import requestsurl = 'http://服务器公网IP地址:11434/api/chat'
data = {"model": "llama3","messages": [{"role": "user","content": "Hello!"}],"stream": False
}response = requests.post(url, json=data)print(response.text)
{"model":"llama3","created_at":"2024-06-17T06:33:07.6957739Z","message":{"role":"assistant","content":"Hello! It's nice to meet you. Is there something I can help you with, or would you like to chat?"},"done_reason":"stop","done":true,"total_duration":5919808133,"load_duration":5114879071,"prompt_eval_count":12,"prompt_eval_duration":205646000,"eval_count":26,"eval_duration":557299000
}

7.不需要时可在腾讯云后台将服务器关机以停止计费,节约费用

我买的硅谷的实例,配置都选的最便宜的,每小时7块多,关机后每小时2毛左右

主要参考资料:

解锁大模型的力量:我的本地部署到远程访问之旅 – WeiYoun

服务器部署开源大模型完整教程 Ollama+Gemma+open-webui - 哔哩哔哩 (bilibili.com)

Llama3本地部署及API接口本地调试,15分钟搞定最新Meta AI开源大模型本地Windows电脑部署_llama3 本地部署-CSDN博客

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.ryyt.cn/news/44721.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈,一经查实,立即删除!

相关文章

3.21随笔

SELECT Column 实例 下面的 SQL 语句从 "Websites" 表中选取 "name" 和 "country" 列:实例SELECT name,country FROM Websites;输出结果为:

中电金信:银行业数据中心何去何从

​ 20多年前,计算机走进国内大众视野,计算机行业迎来在国内的高速发展时代。银行业是最早使用计算机的行业之一,也是计算机技术应用最广泛、最深入的行业之一。近年来,随着银行竞争加剧,科技如何引领业务、金融科技如何发展,直接关系到银行的生存空间和发展命脉。银行业I…

团队作业sprint第九天

2024-05-04 项目任务进展: 5小时(46/50) 会议照片 过去一天完成了哪些任务完成AI对话的测试接下来的计划优化各个页面 继续学习flutter和Springboot还剩下哪些任务优化主页面 专栏功能的管理的优化 测试整个软件遇到了哪些困难出现了一些奇怪的dug 边学习边进行功能开发问题多多…

团队作业sprint第十天

2022-05-06项目任务进展: 4小时(50/50) 会议照片 过去一天完成了哪些任务完成专栏的测试 优化主页面 专栏功能的管理的优化 测试整个软件遇到了哪些困难出现了一些奇怪的dug 边学习边进行功能开发问题多多 Springboot的学习很困难,经常遇到很多问题一直在网上查找解决相关问题 …

团队作业sprint第四天

2024-04-23项目任务进展: 4小时(21/50)会议照片 过去一天完成了哪些任务学习如何将chat-gpt内置到程序 优化主页面 对登陆注册进行测试接下来的计划优先进行chat-gpt内置程序 继续学习flutter和Springboot 将主页面美化还剩下哪些任务优化主页面 专栏功能 内置AI对话功能 相应的…

团队作业sprint第五天

2024-04-25 项目任务进展: 5小时(26/50) 会议照片 过去一天完成了哪些任务开始将chat-gpt内置到程序 进一步优化主页面 对专栏的数据库进行构建接下来的计划优先进行chat-gpt内置程序 继续学习flutter和Springboot 将主页面美化 针对性的修改数据库还剩下哪些任务优化主页面 专…

团队开发sprint 第一天

2024-04-19项目任务进展: 6小时(6/50) 会议照片 过去一天完成了哪些任务今日主要是对后续任务和工作的细化分配和对课程情况和空余时间的讨论与协调 确定 flutter + Springboot 开发心理健康程序,并内置chat-gpt 完成了环境的安装接下来的计划对flutter和Springboot进行学习并尝…

CPU指令集——VS打断点时注意事项

在看内存中数据时,VS2015打断点碰到了数据读入不正确的问题uint8_t uint8_array[32] = { 00, 07, 04, 04, 02, 03, 06, 02, 02, 05, 04, 02, 06, 05, 04, 03, 00, 07, 04, 05, 00, 02, 00, 03, 04, 05, 02, 02, 04, 03, 04, 06 }; __m256i result = _mm256_loadu_si256((__m25…