admin管理员组

文章数量:1530018

禅与计算机程序设计艺术:实测结论 —— ChatGLM > AquilaChat > BaiChuan-7B , 在写作和写代码方面都不大稳定。模型不怎么稳定,暂时感觉还不可用(有时候给了丰富的Prompt内容,结果原样输出了!)。跟ChatGLM比起来,还差一截啊。PS: 不知道开源文档里写的评测分数的具体的标准跟我这普通人随便问答的标准是不是差异很大。希望 baichuan-7B 再打磨打磨吧。

文章目录

        • 禅与计算机程序设计艺术:实测结论 —— ChatGLM > AquilaChat > BaiChuan-7B , 在写作和写代码方面都不大稳定。模型不怎么稳定,暂时感觉还不可用(有时候给了丰富的Prompt内容,结果原样输出了!)。跟ChatGLM比起来,还差一截啊。PS: 不知道开源文档里写的评测分数的具体的标准跟我这普通人随便问答的标准是不是差异很大。希望 baichuan-7B 再打磨打磨吧。
  • 快速安装上手
  • 源代码
  • 介绍
    • 数据
    • 分词
    • 模型结构
    • 训练稳定性和吞吐
  • 公开benchmark榜单
    • 中文评测
      • C-Eval
      • 结果
      • Gaokao
      • 结果
      • AGIEval
      • 结果
    • 英文榜单
      • 结果
      • 上标说明:
      • 复现方法
  • 推理方法
  • 训练方法
    • 安装依赖
    • 准备数据
    • 下载 tokenizer 模型
    • 配置 DeepSpeed
    • 执行训练
  • 协议
  • FAQ:遇到的问题和解决
    • RuntimeError: Expected all tensors to be on the same device, but found at least two devices, cuda:0 and cuda:1!
    • GPU 内存不足的报错
  • 附:完整测试对话记录


本文标签: 人工智能上手开源再打实战