【LLM大模型】模型和指令微调方法

清疚 2023-10-13 08:52 38阅读 0赞

发表评论取消回复

表情：

评论列表（有 0 条评论，38人围观）

还没有评论，来说两句吧...

相关阅读

相关大模型微调技术LoRA与QLoRA

大模型的参数量都在100B级别，由于算力的吃紧，在这个基础上进行所有参数的微调变得不可能。LoRA正是在这个背景下提出的解决方案。 1|2原理虽然模型的参数众多，但其

太过爱你忘了你带给我的痛/ 2024年03月17日 12:59/ 0 赞/ 228 阅读

相关 LLM-项目详解-KnowLM：信息抽取大模型

[GitHub - zjunlp/KnowLM: Knowledgable Large Language Models Framework.][GitHub - zjunlp_

快来打我*/ 2024年03月16日 20:23/ 0 赞/ 156 阅读

相关大模型优化：RAG还是微调？

引言随着人们对大型语言模型 (LLM) 的兴趣激增，许多开发人员和组织正忙于利用其能力构建应用程序。然而，当开箱即用的预训练LLM没有按预期或希望执行时，如何提高LLM

深碍√TFBOYSˉ_/ 2024年02月19日 11:15/ 0 赞/ 156 阅读

相关大模型微调样本构造trick

面试官：大模型微调如何组织训练样本？你：大模型训练一问一答，一指令一输出，问题和指令可以作为prompt输入，答案作为输出，计算loss的部分要屏蔽掉pad tok

矫情吗；*/ 2023年10月13日 16:13/ 0 赞/ 36 阅读

相关【LLM大模型】模型和指令微调方法

note Hugging Face 的 PEFT是一个库（LoRA 是其支持的技术之一，除此之外还有Prefix Tuning、P-Tuning、Prompt Tu

清疚/ 2023年10月13日 08:52/ 0 赞/ 39 阅读

相关大模型-微调技术：PEFT库

pypi：[https://pypi.org/project/peft/][https_pypi.org_project_peft] 目前peft 0.3.0 code地址：

浅浅的花香味﹌/ 2023年10月12日 13:11/ 0 赞/ 150 阅读

相关开源 LLM （大语言模型）整理（一）

Large Language Model (LLM) 即大规模语言模型，是一种基于深度学习的自然语言处理模型，它能够学习到自然语言的语法和语义，从而可以生成人类可读的文本。

叁歲伎倆/ 2023年10月12日 11:34/ 0 赞/ 157 阅读

相关 ChatGPT以及LLM（大语言模型）的思考

一、ChatGPT简介 ChatGPT本质是一个对话模型，它可以回答日常问题、挑战不正确的前提，甚至会拒绝不适当的请求，在去除偏见和安全性上不同于以往的语言模型。Chat

秒速五厘米/ 2023年09月27日 18:52/ 0 赞/ 169 阅读

相关大模型微调代码解析，哪些方法可以加速训练？

近期大模型层出不穷，大家对于大模型的微调也在跃跃欲试，像Lijia的BELLE，斯坦福的Alpaca\[1\], 清华的ChatGLM\[2\]，中文的Chinese-Vicu

迈不过友情╰/ 2023年09月26日 23:17/ 0 赞/ 33 阅读

相关 pytorch-模型微调

9.2 微调在前面的一些章节中，我们介绍了如何在只有6万张图像的Fashion-MNIST训练数据集上训练模型。我们还描述了学术界当下使用最广泛的大规模图像数据集Ima

ゞ浴缸里的玫瑰/ 2023年07月08日 05:49/ 0 赞/ 144 阅读