试试这个版本的llama3名字叫llama3-gradient:
Gradient AI 利用分阶段训练策略,成功地将 Llama-3 模型的文本处理能力扩展至百万字符以上。
通过引入 RingAttention 和 EasyContext Blockwise 技术,模型的运算效率得到显著增强。此外,NTK-aware 插值技术和缩放法则的应用进一步提升了模型性能。Llama-3 在大规模 GPU 集群上的训练,使其在长文本处理方面取得了突破性进展。
直接通过ollama run llama3-gradient运行,注意100k的上下文需要64g的内存
来源:https://ollama.com/library/llama3-gradient
网友回复
python如何实现torrent的服务端进行文件分发p2p下载?
如何在浏览器中录制摄像头和麦克风数据为mp4视频保存下载本地?
go如何编写一个类似docker的linux的虚拟容器?
python如何写一个bittorrent的种子下载客户端?
ai能通过看一个网页的交互过程视频自主模仿复制网页编写代码吗?
ai先写功能代码通过chrome mcp来进行测试功能最后ai美化页面这个流程能行吗?
vue在手机端上下拖拽元素的时候如何禁止父元素及body的滚动导致无法拖拽完成?
使用tailwindcss如何去掉响应式自适应?
有没有直接在浏览器中运行的离线linux系统?
nginx如何保留post或get数据进行url重定向?