异动
登录注册
无名小韭16190707
2025-04-29 11:06:50
谢谢分享
@题材涨乐通: 1)参数1.2T:既然不是671B,那说明“V4”基础模型已经出来了而且参数是V3(671B)的2倍。现在头部海外发布的主流模型基本都是千亿参数,DS似乎没有充足的理由将参数扩大这么大,毕竟Scaling Law某种程度上放缓。2)5.2PB训练数据。1PB=1024TB,而近期看到的模型训练数据最
7 赞同-7 评论
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
工分
0.02
转发
收藏
投诉
复制链接
分享到微信
有用 0
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
暂无数据