ollama 最快方式部署管理大模型

news/2024/10/8 2:25:27

github:https://github.com/ollama/ollama

模型地址:https://ollama.com/library/llama3.1

linux: 安装

1.下载安装脚本

curl -fsSL https://ollama.com/install.sh | sh

2.修改启动环境变量

如果是root 用户记得改为root

vim /etc/systemd/system/ollama.service[Unit]
Description=Ollama Service
After=network-online.target[Service]
ExecStart=/usr/local/bin/ollama serve
User=root
Group=root
Restart=always
RestartSec=3
Environment="PATH=/root/.nvm/versions/node/v18.20.4/bin:/home/miniconda3/bin:/home/miniconda3/condabin:/usr/lib64/qt-3.3/bin:/root/perl5/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/root/bin:/usr/local/mysql/bin"
Environment="OLLAMA_DEBUG=1"
Environment="OLLAMA_HOST=0.0.0.0:11434"
Environment=" OLLAMA_KEEP_ALIVE=5h"
Environment="OLLAMA_MAX_LOADED_MODELS=10"
#export OLLAMA_MAX_QUEUE=100
Environment="OLLAMA_MODELS=/home/data/llm/ollama/models/"
[Install]
WantedBy=default.target

2.相关命令

(base) [root@ceph1 ~]# ollama 
Usage:ollama [flags]ollama [command]Available Commands:serve       Start ollamacreate      Create a model from a Modelfileshow        Show information for a modelrun         Run a modelpull        Pull a model from a registrypush        Push a model to a registrylist        List modelsps          List running modelscp          Copy a modelrm          Remove a modelhelp        Help about any commandFlags:-h, --help      help for ollama-v, --version   Show version informationUse "ollama [command] --help" for more information about a command.

3. 执行模型运行

o ollama run llama3.1:70b

首次执行会下载模型到 环境变量Environment="OLLAMA_MODELS=/home/data/llm/ollama/models/"

第二次就不用了下载执行 开始运行

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.ryyt.cn/news/54339.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈,一经查实,立即删除!

相关文章

荣誉+1 !入选十大科技领先成果!

8月28日,2024中国国际大数据产业博览会(简称“数博会”)在贵阳市隆重开幕,本届展会以“数智共生:开创数字经济高质量发展新未来”为主题,全方位、多角度展示国内外数据产业最新动态、最新成果和发展趋势。8月28日,2024中国国际大数据产业博览会(简称“数博会”)在贵阳…

Linux通用性-日志切割脚本

一、公司提供的参考脚本: #!/bin/bash # 定义需要清理的文件 log_file=( "/mpjava/ly.mp.dfpv.acc.biz/bin/nohup.out" "/mpjava/ly.mp.dfpv.acc.service/bin/nohup.out" ) # 获取当天日期 date_now=$(date +%Y%m%d)for file_dir in $log_file do# 获取文…

Redis十大数据类型

Redis十大数据类型 数据类型一般指的是 value 的数据类型,key的类型一般都是字符串 一、总体概述redis字符串(String)string是redis 最基本的类型,一个key对应一个value,string类型是二进制安全的,意思是redis的string可以包含任何数据,比如jpg图片或者序列化的对象 一个…

Redis 安装

Redis 安装安装前的准备确保Linux是64位,用 getconf LONG_BIT 查看Linux 必须 具备 gcc 编译环境 使用 gcc -v 查看版本 如果没有 使用 yum -y install gcc-c++ 命令安装安装步骤:下载 redis7的 压缩包,放到 本地 opt 目录下 命令:wget https ://download.redis.io/release…

【转载】启发式合并

https://zhuanlan.zhihu.com/p/560661911 数据结构学习笔记(8) 启发式合并 启发式合并是用来解决子树中的统计问题。在codeforces上叫做dsu on tree(树上启发式合并)。这里我们主要是来讲在树上进行启发式合并。实际上之前我有讲过启发式合并严格鸽:启发式合并 看似暴力实则很…

利用通义灵码实现我的第一次开源贡献

作者:重庆邮电大学计算机学院李逸雄 结缘开源 最早了解开源是从学校的兴趣组织开始的。2023 年 10 月 21 日,openSUSE 亚洲峰会在我们学校召开,这次会议汇聚了许多来自 openSUSE 社区贡献者以及对开源感兴趣的爱好者们。我第一次知道有这么多志同道合的爱好者在进行开源贡献…

腾讯云域名托管到 cloudflare

cloudflare https://dash.cloudflare.com/ 腾讯云域名列表 https://console.cloud.tencent.com/domain/all-domain/all 先进入 腾讯云列表,点击自己已购买的域名点击修改; https://console.cloud.tencent.com/domain/all-domain/all修改为cloudflare提供的, 如下: 进入 htt…

中间件实时监控,运维难题一站解决

智和信通方案通过构建对Tomcat、Jboss、WebLogic等中间件的关键指标的监控,实现对中间件性能和资源的实时追踪,识别并解决影响中间件性能的问题,保障中间件的高性能及高可用性,更全面地支撑业务及应用的稳定、持续运行,提升用户体验。 中间件是介于操作系统和在其上…