PJBET.COM

 

PJBET.COM

🔢🐶🚛     

PJBET.COM

对大模型推理成本的优化,可通过很多技术手段实现。首先是模型本身,模型结构、训练方法都可以持续改进,包括业界很关注的MoE(混合专家模型),就是优化推理成本很好的解决方案。其次是工程上的优化。大模型的调用量越大,优化推理成本的空间也越大。以前的模型都是单机推理,大模型用的是分布式推理。所以如果能把各种各样底层算力用得更好,推理成本就会大大降低。

从浪潮信息发布的“源2.0-M32”开源大模型来看,其基于“源2.0”系列大模型已有工作基础,创新提出和采用了“基于注意力机制的门控网络”技术,构建包含32个专家(Expert)的混合专家模型(MoE),并大幅提升了模型算力效率,模型运行时激活参数为37亿,在业界主流基准评测中性能全面对标700亿参数的LLaMA3开源大模型。

🕊(撰稿:费菁松)

本文来自网友发表,不代表本网站观点和立场,如存在侵权问题,请与本网站联系。未经本平台授权,严禁转载!
展开
支持楼主

29人支持

阅读原文阅读 8084回复 6
举报
    全部评论
    • 默认
    • 最新
    • 楼主
    • 葛芳育⚛LV3六年级
      2楼
      两会速递|马秀英代表:积石山的这个春天定将生机无限✅
      2024/06/03   来自宿豫
      5回复
    • 👤林琴燕LV4大学四年级
      3楼
      【境内疫情观察】全国连续5日无新增本土病例(2月11日)🥙
      2024/06/03   来自溧阳
      0回复
    • 杜新思♏LV3幼儿园
      4楼
      巴西暂停孕妇接种阿斯利康疫苗 欧盟将推“新冠证书”|大流行手记(5月11日)☜
      2024/06/03   来自朝阳
      3回复
    • 喻刚蝶LV5大学三年级
      5楼
      炸裂!多家车企公布5月交付量 均实现大幅增长😽
      2024/06/03   来自商丘
      1回复
    • 邰晶谦✪🏓LV6大学三年级
      6楼
      交通动脉 又添一条🎶
      2024/06/03   来自城固
      3回复
    • 骆腾羽LV0大学四年级
      7楼
      用科技手段堵住“被法人”的漏洞🏄
      2024/06/03   来自绵阳
      回复
    你的热评
    游客
    发表评论
    最热圈子
    • #广西自贸试验区南宁片区:制度创新成果硕 扩大开放华章绚#

      聂朗荷

      7
    • #03版要闻 - 刘建超访问日本#

      郑融国

      6
    • #新一轮洪水“袭击”珠江流域,水利部门积极迎战#

      何堂彪

      4
    • #【境内疫情观察】全国新增163例本土病例(1月16日)

      姬青唯

      7
    热点推荐

    安装应用

    随时随地关注PJBET.COM

    Sitemap
    安全检测