它是一种基于变压器的架构,

Advancing Forum Analytics at China Data
Post Reply
ujjal22
Posts: 49
Joined: Wed Dec 18, 2024 3:36 am

它是一种基于变压器的架构,

Post by ujjal22 »

该项目提供源代码、调优示例、推理代码、模型权重、数据集和演示。最棒的是,我们可以使用单个 RTX 4090 在几个小时内训练我们的模型。


卡型号:tloen/alpaca-lora-7b
演示:Alpaca-LoRA
3.骆驼毛
Vicuna 可以为聊天机器人生成连贯且富有创意的文本。根据 中东手机号码清单 从 ShareGPT.com 收集的对话数据集进行了微调。

Vicuna 提供了 ChatGPT 近 90% 的性能。它是FastChat的一部分,FastChat 是一个开放平台,允许用户训练、服务和评估他们的聊天机器人。 FastChat 提供了构建自定义聊天机器人模型所需的所有组件和工具。

图片14.png

图片来自FastChat (lmsys.org)

博客文章:Vicuna:一款开源聊天机器人,其 ChatGPT 质量的 90%* 给 GPT-4 留下了深刻的印象 |由来自加州大学伯克利分校、卡内基梅隆大学、斯坦福大学和加州大学圣地亚哥分校的成员组成的团队



通过使用 RNN,该模型实现了与 Transformer 相当的质量和可扩展性水平,并具有更快的处理速度和节省 VRAM 的额外优势。 Raven 针对以下指令进行了微调,并在斯坦福羊驼、code-alpaca 和更多数据集上进行了微调。

图片6.png

Raven RWKV 7B的图像

GitHub: BlinkDL/ChatRWKV
演示:Raven RWKV 7B
卡型号:BlinkDL/rwkv-4-raven
6.OpenChatKit
OpenChatKit是一个综合工具包,为开发聊天机器人应用程序提供了 ChatGPT 的开源替代方案。

该工具包包括用于训练您自己的大型语言模型(根据说明定制)和微调模型的分步说明,以及用于更新机器人响应的可扩展恢复系统。此外,它还包括审核功能,可以帮助过滤掉不适当的问题。

图片11.png
Post Reply