ollama也支持AMD,详见官方文档分析ollama/docs/gpu.md at main · ollama/ollama (github.com)[这里是图片005]https://github.com/ollama/ollama/blob/main/docs/gpu.md
ollama管理的大模型都是颠末量化后的大模型,以是它的模型文件会小许多。以ollama中llama3-8b为例,llama3-8b原始模型巨细接近15G,量化模型的只有4.7G,需要的硬件条件大大降低(老破小的福音)。
2.安装流程
2.1 windows系统
windows只支持win10或更高的版本。
2.1.1下载安装包
windows系统,直接下载安装程序(默认是最新的版本),下载完成后,直接点击安装即可,默认安装在C:UsersAdministratorAppDataLocalProgramsOllama。
Download Ollama on Windows[这里是图片007]https://ollama.com/download
重新打开一个cmd窗口,输入ollama run llama3:8b
。模型会拉取文件,然后运行模型。如果只想下载模型,则输入ollama pull llama3:8b。需要运行的时候再输入ollama run llama3:8b
即可。
模型下载速度很快(不需要魔法),基本上可以达到满速,如果自己电脑下载很慢,ctrl+c中止下载,再重新下载镜像。
如果出现Error: llama runner process no longer running: 3221225785。很有可能是ollama版本与操纵系统不和谐的关系,默认下载的是最新版,此时需要降低ollama版本至0.1.31。博客首页有ollama0.1.31版本下载链接。网盘下载链接
2.2linux系统
1.打开网页后,注册的第一个用户默以为管理员账号,以后注册的账号脚色均为pending(待分配权限)。
2.修改权限的方法。方法一:数据存放在backend/data/webui.db中,可以用数据库可视化软件打开数据库,将账号由pending修改为user或admin。方法二:修改backend/config.py文件中第358行,DEFAULT_USER_ROLE = os.getenv(“DEFAULT_USER_ROLE”, “pending”),将pending修改为user(普通用户)或admin(管理员),以后每次注册的账号就不需要管理员分配权限。
3.ollama run llama3无法运行,提示Error: llama runner process no longer running: 3221225785。很有可能是ollama版本与操纵系统不和谐的关系,默认下载的是最新版,此时需要降低ollama版本至0.1.31。博客首页有ollama0.1.31版本下载链接。