异动
关注
社群
搜公告
产业库
时间轴
公社AI
通知
全部已读
暂无数据
私信
暂无数据
登录注册
我的主页
退出
戈壁淘金
顺势而为,玉汝于成
IP属地:110000,110100
个人资料
戈壁淘金
只买龙头的老司机
2025-01-28 08:22:26
中信建投-人工智能行业:2025年人工智能十大发展趋势
核心观点:大语言模型发展进入深度推理阶段,通用人工智能愈行愈近,AI应用进入爆发前夜。站在当前这一重要的历史节点,我们从技术、应用、能源三个维度展望了人工智能的未来发展,其中技术是源动力,应用是牵引力,能源是支撑力。对未来的展望中,我们提出推理计算、合成数据、缩放法则、超级智能体、具身智能、 Al4Science、端侧创新、自动驾驶、人工智能、能源需求十个方面的发展趋势。 趋势一 推理计算提升大模型准确率,强化学习激发模型推理能力 OPenAl发布新的具有深度思考能力的a1推理模型,推理侧缩放法
S
汉得信息
S
拓尔思
S
鼎捷数智
S
瑞芯微
S
广和通
60
30
48
31.63
戈壁淘金
只买龙头的老司机
2025-01-28 07:07:20
DeepSeek冲击全球算力!英伟达跌近17%
摘要:DeepSeek引发AI股估值泡沫破裂担忧,英伟达跌近17%,市值蒸发近6000亿美元为美股史上规模最大,芯片指数大跌超9%,博通跌超17%,台积电跌超13%,AMD和阿斯麦跌约6%,Altman押注的核电股Oklo跌近26%,投资AI的科技巨头中,微软跌4.6%后跌幅砍半,亚马逊和Meta转涨,苹果涨超3%。美元、美债收益率急跌至一个多月最低,风险资产美油盘中跌3%。 中国人工智能初创公司DeepSeek暴击华尔街,AI“卖铲人”英伟达股价周一暴跌,盘中跌幅超过18%,创2020年3月以
S
鼎捷数智
S
汉得信息
6
17
36
17.11
戈壁淘金
只买龙头的老司机
2025-01-28 04:15:51
R1“轰炸”还不够,DeepSeek发布新开源AI模型,生图能力胜过DALL-E 3
摘要:DeepSeek称Janus-Pro框架简单且灵活性高。它采用视觉编码解耦方式提升不同任务中的适配性和性能,用统一的Transformer架构处理任务,适配384x384分辨率。基准测试中,70亿参数的Janus-Pro-7B表现强于包括DALL-E 3在内的其他模型,且较前代Janus准确率大幅提高。JanusFlow采用极简架构,将自回归语言模型与矫正流结合,无需复杂架构修改,生图支持384x384分辨率。 海外网友才开始经受R1的“洗礼”,中国人工智能(AI)初创DeepSeek又发
S
彩讯股份
S
万兴科技
S
虹软科技
13
18
31
19.26
戈壁淘金
只买龙头的老司机
2025-01-27 14:38:13
DeePSeek核心结论:影响深远
DS核心结论:影响深远,OpenAI 地位或为开源威胁,利好Agent,利好端侧,利好推理算力[天风计算机缪欣君团队] 1、开源阶段性的完胜(从前训练到后训练,无需SFT,迎接Ahamoment),或在后续影响 OpenAi收入 2、开源属性下行业快速扩散,加速AI-Agent落地(蒸馏小模型如32b/7b,私有化/端侧部署;推理成本下降30X) 3、重申Agent三大机会1)计算机双王,推理爆发2)To B Agent汉得/创达,小市值可私。3) To C端侧,SOC/存算一体/模组。 xxx
S
广和通
S
恒烁股份
S
鼎捷数智
S
星宸科技
17
33
47
21.51
戈壁淘金
只买龙头的老司机
2025-01-27 08:58:42
1月27日避雷针
1月27日避雷针
Screenshot_20250127_085734_com.baidu.searchbox_edit_182580231912764.jpg
S
每日互动
0
8
15
6.02
戈壁淘金
只买龙头的老司机
2025-01-27 04:55:17
计算机行业周报:Open AI发布AI Agent Operator,AI应用落地加速
本周观点 24日凌晨OpenAI发布AIAgent智能体Operator,通过CUA系统进行复杂的思维链反思和步骤规划,能够在不进行精调的情况下完成泛化任务。在目前的演示中,Operator可进行网购、订餐、论文分类搜索、文献综述等。CUA(Computer-Using Agent)原理:融合GPT-4o的视觉能力,可通过处理原始像素数据来了解屏幕上发生的事情,按照“集成感知(提供计算机当前状态的屏幕截图)—推理—行动”的流程进行迭代循环,能够操作屏幕上的按钮、菜单和文本框。目前Operator
S
虹软科技
S
萤石网络
8
6
11
13.86
戈壁淘金
只买龙头的老司机
2025-01-27 04:50:22
计算机行业周报:软件大革命,Agent投资机遇全梳理
本周观点 AIAgent或成为软件价值重估的重要催化剂,软件厂商的目标市场有望扩大到数万亿美元的劳动力市场,AIAgent也有望提升软件的消费属性,进一步打开软件厂商的估值天花板:通用SaaS是AIAgent的“基础设施”,企业或加速云化进而AI化的进程;垂类应用有望借助AI迎来数倍TAM增长,同时或成为大模型、通用SaaS生态的重要组成部分,针对不同方向,建议关注: 终端AI:中科创达、萤石网络等; 本地生活:值得买、焦点科技、光云科技等; 办公:金山办公、合合信息、福昕软件等; CRM:金蝶
S
汉得信息
S
鼎捷数智
11
13
22
18.34
戈壁淘金
只买龙头的老司机
2025-01-26 19:58:08
deepseek
deepseek
Screenshot_20250126_195548_com.tencent.mm_edit_163917145136966.jpg
S
润泽科技
3
12
24
5.28
戈壁淘金
只买龙头的老司机
2025-01-26 15:58:30
DeepSeek周末热议,如何与豆包进行对比?
1、DeepSeek属于大语言模型,而豆包属于多模态大模型。22因此在算力需求上本身不在同一数量级。 2、deepseek v3算力用的少,主要是通过激活参数少、把精度降低实现的(16位变8位),这是在不断改进基础大模型,而r1是在v3这个基础模型上,又花了大量算力去让他推理能力更强。而豆包属于基于前期大语言模型训练的同时,基于训练其他图片/音频/视频等模型能力,且训练和推理仍在持续。#相当于DeepSeek做减法、豆包做加法。 结论:#DeepSeek是国产大语言模型之光(重视合作方和生态);
S
每日互动
S
广和通
134
55
119
28.80
戈壁淘金
只买龙头的老司机
2025-01-26 11:40:02
【字节端侧]2025春节最强主线,“字节+机器”成为本轮端侧主线
【字节端侧]2025春节最强主线,“字节+机器”成为本轮端侧主线/广和通/瑞芯微/全志,此外核心关注视觉/星宸/富瀚微、连接/翱捷 字节豆包在2025年春节有望持续催化。(1)字节豆包全新基础模型Doubao-1.5-pro已正式发布。最近模型融合并提升了视觉和语音等多模态能力:视觉多模态性能进一步提升,语音多模态情商智商在线。(2)字节豆包模型日均tokens调用量在高速增长:截止2024年12月15日已经突破了4万亿,2025年1月已突破6万亿。(3) TOKEN分润商业模式逐步落地。移远通
S
广和通
S
瑞芯微
21
8
22
6.62
戈壁淘金
2025-01-26 03:46:11
DeepSeek利空算力?
其实具体逻辑,从12月deepseek v3到这周的r1,我们前前后后分析过很多次了,不妨总结梳理下 1. 海外广泛引用的550万美金是v3,而不是r1的训练成本,且550万只是v3实际训练成本的零头。v3论文原话:上述成本仅包括DeepSeek-V3 的正式训练,不包括与架构、算法、数据相关的前期研究、消融实验的成本。社群内一位算法工程师就曾说“v3用了幻方自己的r1模型生成数据,这个部分的反复尝试要不要算在成本里呢?”一个意思。 2. 前沿探索和后发追赶,所需要的算力本就不是一个量级。表现为
S
拓尔思
31
24
37
6.13
戈壁淘金
只买龙头的老司机
2025-01-25 18:54:31
超越OpenAI o1,DeepSeek-R1升至全球风格控制类第一
距离深度求索推理大模型 DeepSeek-R1 发布已经过去约一周时间。 然而,在海外社交媒体,乃至于华尔街上, DeepSeek-R1 的热度竟然才刚刚开始螺旋式上升。 1月24日,在国外大模型排名 Arena 上,DeepSeek-R1 基准测试已经升至全类别大模型第三,其中在风格控制类模型(StyleCtrl)分类中与 OpenAI o1 并列第一。而其竞技场得分达到1357分,略超 OpenAI o1 的1352分。 这是继 DeepSeek-V3 在剔除 OpenAI o1 等闭源模型
S
昆仑万维
26
26
59
15.46
戈壁淘金
只买龙头的老司机
2025-01-25 17:20:44
AMD:已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上
最新消息(1月25日15时)AMD宣布,已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上,该模型旨在与SGLang一起实现最佳性能。DeepSeek-V3针对Al推理进行了优化。
Screenshot_20250125_172014_com.wallstreetcn.news_edit_105166151062077.jpg
S
每日互动
7
29
42
10.63
戈壁淘金
只买龙头的老司机
2025-01-25 17:14:52
虹软科技:视觉AI龙头,商拍+AI眼镜业务续写新篇章
投资要点: 国内视觉AI领军厂商,智能手机业务受益端侧AI应用显著复苏 公司是国内CV行业领先的算法服务提供商及解决方案供应商,下游应用覆盖智能手机、智能汽车、智能家居等领域。2023年公司智能手机视觉解决方案实现营收5.81亿元,同比增长22.8%并呈现显著的复苏态势,未来有望受益于公司Turbo Fusion技术商业化加速以及端侧AI应用落地,实现主营业务持续增长。 根据公司业绩预告,2024年公司预计实现营收约8.15亿元,预计同比增长约21.60%;全年归母净利润预计约1.78亿元,预计
S
虹软科技
6
3
9
4.04
戈壁淘金
只买龙头的老司机
2025-01-25 17:09:00
字节AGI研究加速,token调用量环比上月+50%,看好字节主线
23年开始布局Seed模型和Flow应用两大团队后,据晚点信息,字节正式设立“SeedEdge”研究项目,做更长期的AGI研究,涉及1)高效通用的推理;2)世界模型和感知(这个或和机器人有关);3)探索Transformer+GPU之外的模型设计,适配未来可能的新硬件架构;4)模型新结构和训练方法探索;5)多智能体、推理 ScalingLaw等。 近期国产模型进展迅速,头部追上o1和GPT-4o,DeepSeek平权了RL模型的训练门槛。字节在情感模型后,MoE的豆包1.5Pro也发布了(并称不
S
慧博云通
S
法本信息
S
萤石网络
S
广和通
12
14
21
7.03
上一页
1
14
15
16
17
18
607
下一页
前往
页
戈壁淘金
只买龙头的老司机
2025-01-28 08:22:26
中信建投-人工智能行业:2025年人工智能十大发展趋势
核心观点:大语言模型发展进入深度推理阶段,通用人工智能愈行愈近,AI应用进入爆发前夜。站在当前这一重要的历史节点,我们从技术、应用、能源三个维度展望了人工智能的未来发展,其中技术是源动力,应用是牵引力,能源是支撑力。对未来的展望中,我们提出推理计算、合成数据、缩放法则、超级智能体、具身智能、 Al4Science、端侧创新、自动驾驶、人工智能、能源需求十个方面的发展趋势。 趋势一 推理计算提升大模型准确率,强化学习激发模型推理能力 OPenAl发布新的具有深度思考能力的a1推理模型,推理侧缩放法
S
汉得信息
S
拓尔思
S
鼎捷数智
S
瑞芯微
S
广和通
60
30
48
31.63
戈壁淘金
只买龙头的老司机
2025-01-28 07:07:20
DeepSeek冲击全球算力!英伟达跌近17%
摘要:DeepSeek引发AI股估值泡沫破裂担忧,英伟达跌近17%,市值蒸发近6000亿美元为美股史上规模最大,芯片指数大跌超9%,博通跌超17%,台积电跌超13%,AMD和阿斯麦跌约6%,Altman押注的核电股Oklo跌近26%,投资AI的科技巨头中,微软跌4.6%后跌幅砍半,亚马逊和Meta转涨,苹果涨超3%。美元、美债收益率急跌至一个多月最低,风险资产美油盘中跌3%。 中国人工智能初创公司DeepSeek暴击华尔街,AI“卖铲人”英伟达股价周一暴跌,盘中跌幅超过18%,创2020年3月以
S
鼎捷数智
S
汉得信息
6
17
36
17.11
戈壁淘金
只买龙头的老司机
2025-01-28 04:15:51
R1“轰炸”还不够,DeepSeek发布新开源AI模型,生图能力胜过DALL-E 3
摘要:DeepSeek称Janus-Pro框架简单且灵活性高。它采用视觉编码解耦方式提升不同任务中的适配性和性能,用统一的Transformer架构处理任务,适配384x384分辨率。基准测试中,70亿参数的Janus-Pro-7B表现强于包括DALL-E 3在内的其他模型,且较前代Janus准确率大幅提高。JanusFlow采用极简架构,将自回归语言模型与矫正流结合,无需复杂架构修改,生图支持384x384分辨率。 海外网友才开始经受R1的“洗礼”,中国人工智能(AI)初创DeepSeek又发
S
彩讯股份
S
万兴科技
S
虹软科技
13
18
31
19.26
戈壁淘金
只买龙头的老司机
2025-01-27 14:38:13
DeePSeek核心结论:影响深远
DS核心结论:影响深远,OpenAI 地位或为开源威胁,利好Agent,利好端侧,利好推理算力[天风计算机缪欣君团队] 1、开源阶段性的完胜(从前训练到后训练,无需SFT,迎接Ahamoment),或在后续影响 OpenAi收入 2、开源属性下行业快速扩散,加速AI-Agent落地(蒸馏小模型如32b/7b,私有化/端侧部署;推理成本下降30X) 3、重申Agent三大机会1)计算机双王,推理爆发2)To B Agent汉得/创达,小市值可私。3) To C端侧,SOC/存算一体/模组。 xxx
S
广和通
S
恒烁股份
S
鼎捷数智
S
星宸科技
17
33
47
21.51
戈壁淘金
只买龙头的老司机
2025-01-27 08:58:42
1月27日避雷针
1月27日避雷针
Screenshot_20250127_085734_com.baidu.searchbox_edit_182580231912764.jpg
S
每日互动
0
8
15
6.02
戈壁淘金
只买龙头的老司机
2025-01-27 04:55:17
计算机行业周报:Open AI发布AI Agent Operator,AI应用落地加速
本周观点 24日凌晨OpenAI发布AIAgent智能体Operator,通过CUA系统进行复杂的思维链反思和步骤规划,能够在不进行精调的情况下完成泛化任务。在目前的演示中,Operator可进行网购、订餐、论文分类搜索、文献综述等。CUA(Computer-Using Agent)原理:融合GPT-4o的视觉能力,可通过处理原始像素数据来了解屏幕上发生的事情,按照“集成感知(提供计算机当前状态的屏幕截图)—推理—行动”的流程进行迭代循环,能够操作屏幕上的按钮、菜单和文本框。目前Operator
S
虹软科技
S
萤石网络
8
6
11
13.86
戈壁淘金
只买龙头的老司机
2025-01-27 04:50:22
计算机行业周报:软件大革命,Agent投资机遇全梳理
本周观点 AIAgent或成为软件价值重估的重要催化剂,软件厂商的目标市场有望扩大到数万亿美元的劳动力市场,AIAgent也有望提升软件的消费属性,进一步打开软件厂商的估值天花板:通用SaaS是AIAgent的“基础设施”,企业或加速云化进而AI化的进程;垂类应用有望借助AI迎来数倍TAM增长,同时或成为大模型、通用SaaS生态的重要组成部分,针对不同方向,建议关注: 终端AI:中科创达、萤石网络等; 本地生活:值得买、焦点科技、光云科技等; 办公:金山办公、合合信息、福昕软件等; CRM:金蝶
S
汉得信息
S
鼎捷数智
11
13
22
18.34
戈壁淘金
只买龙头的老司机
2025-01-26 19:58:08
deepseek
deepseek
Screenshot_20250126_195548_com.tencent.mm_edit_163917145136966.jpg
S
润泽科技
3
12
24
5.28
戈壁淘金
只买龙头的老司机
2025-01-26 15:58:30
DeepSeek周末热议,如何与豆包进行对比?
1、DeepSeek属于大语言模型,而豆包属于多模态大模型。22因此在算力需求上本身不在同一数量级。 2、deepseek v3算力用的少,主要是通过激活参数少、把精度降低实现的(16位变8位),这是在不断改进基础大模型,而r1是在v3这个基础模型上,又花了大量算力去让他推理能力更强。而豆包属于基于前期大语言模型训练的同时,基于训练其他图片/音频/视频等模型能力,且训练和推理仍在持续。#相当于DeepSeek做减法、豆包做加法。 结论:#DeepSeek是国产大语言模型之光(重视合作方和生态);
S
每日互动
S
广和通
134
55
119
28.80
戈壁淘金
只买龙头的老司机
2025-01-26 11:40:02
【字节端侧]2025春节最强主线,“字节+机器”成为本轮端侧主线
【字节端侧]2025春节最强主线,“字节+机器”成为本轮端侧主线/广和通/瑞芯微/全志,此外核心关注视觉/星宸/富瀚微、连接/翱捷 字节豆包在2025年春节有望持续催化。(1)字节豆包全新基础模型Doubao-1.5-pro已正式发布。最近模型融合并提升了视觉和语音等多模态能力:视觉多模态性能进一步提升,语音多模态情商智商在线。(2)字节豆包模型日均tokens调用量在高速增长:截止2024年12月15日已经突破了4万亿,2025年1月已突破6万亿。(3) TOKEN分润商业模式逐步落地。移远通
S
广和通
S
瑞芯微
21
8
22
6.62
戈壁淘金
2025-01-26 03:46:11
DeepSeek利空算力?
其实具体逻辑,从12月deepseek v3到这周的r1,我们前前后后分析过很多次了,不妨总结梳理下 1. 海外广泛引用的550万美金是v3,而不是r1的训练成本,且550万只是v3实际训练成本的零头。v3论文原话:上述成本仅包括DeepSeek-V3 的正式训练,不包括与架构、算法、数据相关的前期研究、消融实验的成本。社群内一位算法工程师就曾说“v3用了幻方自己的r1模型生成数据,这个部分的反复尝试要不要算在成本里呢?”一个意思。 2. 前沿探索和后发追赶,所需要的算力本就不是一个量级。表现为
S
拓尔思
31
24
37
6.13
戈壁淘金
只买龙头的老司机
2025-01-25 18:54:31
超越OpenAI o1,DeepSeek-R1升至全球风格控制类第一
距离深度求索推理大模型 DeepSeek-R1 发布已经过去约一周时间。 然而,在海外社交媒体,乃至于华尔街上, DeepSeek-R1 的热度竟然才刚刚开始螺旋式上升。 1月24日,在国外大模型排名 Arena 上,DeepSeek-R1 基准测试已经升至全类别大模型第三,其中在风格控制类模型(StyleCtrl)分类中与 OpenAI o1 并列第一。而其竞技场得分达到1357分,略超 OpenAI o1 的1352分。 这是继 DeepSeek-V3 在剔除 OpenAI o1 等闭源模型
S
昆仑万维
26
26
59
15.46
戈壁淘金
只买龙头的老司机
2025-01-25 17:20:44
AMD:已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上
最新消息(1月25日15时)AMD宣布,已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上,该模型旨在与SGLang一起实现最佳性能。DeepSeek-V3针对Al推理进行了优化。
Screenshot_20250125_172014_com.wallstreetcn.news_edit_105166151062077.jpg
S
每日互动
7
29
42
10.63
戈壁淘金
只买龙头的老司机
2025-01-25 17:14:52
虹软科技:视觉AI龙头,商拍+AI眼镜业务续写新篇章
投资要点: 国内视觉AI领军厂商,智能手机业务受益端侧AI应用显著复苏 公司是国内CV行业领先的算法服务提供商及解决方案供应商,下游应用覆盖智能手机、智能汽车、智能家居等领域。2023年公司智能手机视觉解决方案实现营收5.81亿元,同比增长22.8%并呈现显著的复苏态势,未来有望受益于公司Turbo Fusion技术商业化加速以及端侧AI应用落地,实现主营业务持续增长。 根据公司业绩预告,2024年公司预计实现营收约8.15亿元,预计同比增长约21.60%;全年归母净利润预计约1.78亿元,预计
S
虹软科技
6
3
9
4.04
戈壁淘金
只买龙头的老司机
2025-01-25 17:09:00
字节AGI研究加速,token调用量环比上月+50%,看好字节主线
23年开始布局Seed模型和Flow应用两大团队后,据晚点信息,字节正式设立“SeedEdge”研究项目,做更长期的AGI研究,涉及1)高效通用的推理;2)世界模型和感知(这个或和机器人有关);3)探索Transformer+GPU之外的模型设计,适配未来可能的新硬件架构;4)模型新结构和训练方法探索;5)多智能体、推理 ScalingLaw等。 近期国产模型进展迅速,头部追上o1和GPT-4o,DeepSeek平权了RL模型的训练门槛。字节在情感模型后,MoE的豆包1.5Pro也发布了(并称不
S
慧博云通
S
法本信息
S
萤石网络
S
广和通
12
14
21
7.03
上一页
1
14
15
16
17
18
607
下一页
前往
页
戈壁淘金
只买龙头的老司机
2025-01-28 08:22:26
中信建投-人工智能行业:2025年人工智能十大发展趋势
核心观点:大语言模型发展进入深度推理阶段,通用人工智能愈行愈近,AI应用进入爆发前夜。站在当前这一重要的历史节点,我们从技术、应用、能源三个维度展望了人工智能的未来发展,其中技术是源动力,应用是牵引力,能源是支撑力。对未来的展望中,我们提出推理计算、合成数据、缩放法则、超级智能体、具身智能、 Al4Science、端侧创新、自动驾驶、人工智能、能源需求十个方面的发展趋势。 趋势一 推理计算提升大模型准确率,强化学习激发模型推理能力 OPenAl发布新的具有深度思考能力的a1推理模型,推理侧缩放法
S
汉得信息
S
拓尔思
S
鼎捷数智
S
瑞芯微
S
广和通
60
30
48
31.63
戈壁淘金
只买龙头的老司机
2025-01-28 07:07:20
DeepSeek冲击全球算力!英伟达跌近17%
摘要:DeepSeek引发AI股估值泡沫破裂担忧,英伟达跌近17%,市值蒸发近6000亿美元为美股史上规模最大,芯片指数大跌超9%,博通跌超17%,台积电跌超13%,AMD和阿斯麦跌约6%,Altman押注的核电股Oklo跌近26%,投资AI的科技巨头中,微软跌4.6%后跌幅砍半,亚马逊和Meta转涨,苹果涨超3%。美元、美债收益率急跌至一个多月最低,风险资产美油盘中跌3%。 中国人工智能初创公司DeepSeek暴击华尔街,AI“卖铲人”英伟达股价周一暴跌,盘中跌幅超过18%,创2020年3月以
S
鼎捷数智
S
汉得信息
6
17
36
17.11
戈壁淘金
只买龙头的老司机
2025-01-28 04:15:51
R1“轰炸”还不够,DeepSeek发布新开源AI模型,生图能力胜过DALL-E 3
摘要:DeepSeek称Janus-Pro框架简单且灵活性高。它采用视觉编码解耦方式提升不同任务中的适配性和性能,用统一的Transformer架构处理任务,适配384x384分辨率。基准测试中,70亿参数的Janus-Pro-7B表现强于包括DALL-E 3在内的其他模型,且较前代Janus准确率大幅提高。JanusFlow采用极简架构,将自回归语言模型与矫正流结合,无需复杂架构修改,生图支持384x384分辨率。 海外网友才开始经受R1的“洗礼”,中国人工智能(AI)初创DeepSeek又发
S
彩讯股份
S
万兴科技
S
虹软科技
13
18
31
19.26
戈壁淘金
只买龙头的老司机
2025-01-27 14:38:13
DeePSeek核心结论:影响深远
DS核心结论:影响深远,OpenAI 地位或为开源威胁,利好Agent,利好端侧,利好推理算力[天风计算机缪欣君团队] 1、开源阶段性的完胜(从前训练到后训练,无需SFT,迎接Ahamoment),或在后续影响 OpenAi收入 2、开源属性下行业快速扩散,加速AI-Agent落地(蒸馏小模型如32b/7b,私有化/端侧部署;推理成本下降30X) 3、重申Agent三大机会1)计算机双王,推理爆发2)To B Agent汉得/创达,小市值可私。3) To C端侧,SOC/存算一体/模组。 xxx
S
广和通
S
恒烁股份
S
鼎捷数智
S
星宸科技
17
33
47
21.51
戈壁淘金
只买龙头的老司机
2025-01-27 08:58:42
1月27日避雷针
1月27日避雷针
Screenshot_20250127_085734_com.baidu.searchbox_edit_182580231912764.jpg
S
每日互动
0
8
15
6.02
戈壁淘金
只买龙头的老司机
2025-01-27 04:55:17
计算机行业周报:Open AI发布AI Agent Operator,AI应用落地加速
本周观点 24日凌晨OpenAI发布AIAgent智能体Operator,通过CUA系统进行复杂的思维链反思和步骤规划,能够在不进行精调的情况下完成泛化任务。在目前的演示中,Operator可进行网购、订餐、论文分类搜索、文献综述等。CUA(Computer-Using Agent)原理:融合GPT-4o的视觉能力,可通过处理原始像素数据来了解屏幕上发生的事情,按照“集成感知(提供计算机当前状态的屏幕截图)—推理—行动”的流程进行迭代循环,能够操作屏幕上的按钮、菜单和文本框。目前Operator
S
虹软科技
S
萤石网络
8
6
11
13.86
戈壁淘金
只买龙头的老司机
2025-01-27 04:50:22
计算机行业周报:软件大革命,Agent投资机遇全梳理
本周观点 AIAgent或成为软件价值重估的重要催化剂,软件厂商的目标市场有望扩大到数万亿美元的劳动力市场,AIAgent也有望提升软件的消费属性,进一步打开软件厂商的估值天花板:通用SaaS是AIAgent的“基础设施”,企业或加速云化进而AI化的进程;垂类应用有望借助AI迎来数倍TAM增长,同时或成为大模型、通用SaaS生态的重要组成部分,针对不同方向,建议关注: 终端AI:中科创达、萤石网络等; 本地生活:值得买、焦点科技、光云科技等; 办公:金山办公、合合信息、福昕软件等; CRM:金蝶
S
汉得信息
S
鼎捷数智
11
13
22
18.34
戈壁淘金
只买龙头的老司机
2025-01-26 19:58:08
deepseek
deepseek
Screenshot_20250126_195548_com.tencent.mm_edit_163917145136966.jpg
S
润泽科技
3
12
24
5.28
戈壁淘金
只买龙头的老司机
2025-01-26 15:58:30
DeepSeek周末热议,如何与豆包进行对比?
1、DeepSeek属于大语言模型,而豆包属于多模态大模型。22因此在算力需求上本身不在同一数量级。 2、deepseek v3算力用的少,主要是通过激活参数少、把精度降低实现的(16位变8位),这是在不断改进基础大模型,而r1是在v3这个基础模型上,又花了大量算力去让他推理能力更强。而豆包属于基于前期大语言模型训练的同时,基于训练其他图片/音频/视频等模型能力,且训练和推理仍在持续。#相当于DeepSeek做减法、豆包做加法。 结论:#DeepSeek是国产大语言模型之光(重视合作方和生态);
S
每日互动
S
广和通
134
55
119
28.80
戈壁淘金
只买龙头的老司机
2025-01-26 11:40:02
【字节端侧]2025春节最强主线,“字节+机器”成为本轮端侧主线
【字节端侧]2025春节最强主线,“字节+机器”成为本轮端侧主线/广和通/瑞芯微/全志,此外核心关注视觉/星宸/富瀚微、连接/翱捷 字节豆包在2025年春节有望持续催化。(1)字节豆包全新基础模型Doubao-1.5-pro已正式发布。最近模型融合并提升了视觉和语音等多模态能力:视觉多模态性能进一步提升,语音多模态情商智商在线。(2)字节豆包模型日均tokens调用量在高速增长:截止2024年12月15日已经突破了4万亿,2025年1月已突破6万亿。(3) TOKEN分润商业模式逐步落地。移远通
S
广和通
S
瑞芯微
21
8
22
6.62
戈壁淘金
2025-01-26 03:46:11
DeepSeek利空算力?
其实具体逻辑,从12月deepseek v3到这周的r1,我们前前后后分析过很多次了,不妨总结梳理下 1. 海外广泛引用的550万美金是v3,而不是r1的训练成本,且550万只是v3实际训练成本的零头。v3论文原话:上述成本仅包括DeepSeek-V3 的正式训练,不包括与架构、算法、数据相关的前期研究、消融实验的成本。社群内一位算法工程师就曾说“v3用了幻方自己的r1模型生成数据,这个部分的反复尝试要不要算在成本里呢?”一个意思。 2. 前沿探索和后发追赶,所需要的算力本就不是一个量级。表现为
S
拓尔思
31
24
37
6.13
戈壁淘金
只买龙头的老司机
2025-01-25 18:54:31
超越OpenAI o1,DeepSeek-R1升至全球风格控制类第一
距离深度求索推理大模型 DeepSeek-R1 发布已经过去约一周时间。 然而,在海外社交媒体,乃至于华尔街上, DeepSeek-R1 的热度竟然才刚刚开始螺旋式上升。 1月24日,在国外大模型排名 Arena 上,DeepSeek-R1 基准测试已经升至全类别大模型第三,其中在风格控制类模型(StyleCtrl)分类中与 OpenAI o1 并列第一。而其竞技场得分达到1357分,略超 OpenAI o1 的1352分。 这是继 DeepSeek-V3 在剔除 OpenAI o1 等闭源模型
S
昆仑万维
26
26
59
15.46
戈壁淘金
只买龙头的老司机
2025-01-25 17:20:44
AMD:已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上
最新消息(1月25日15时)AMD宣布,已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上,该模型旨在与SGLang一起实现最佳性能。DeepSeek-V3针对Al推理进行了优化。
Screenshot_20250125_172014_com.wallstreetcn.news_edit_105166151062077.jpg
S
每日互动
7
29
42
10.63
戈壁淘金
只买龙头的老司机
2025-01-25 17:14:52
虹软科技:视觉AI龙头,商拍+AI眼镜业务续写新篇章
投资要点: 国内视觉AI领军厂商,智能手机业务受益端侧AI应用显著复苏 公司是国内CV行业领先的算法服务提供商及解决方案供应商,下游应用覆盖智能手机、智能汽车、智能家居等领域。2023年公司智能手机视觉解决方案实现营收5.81亿元,同比增长22.8%并呈现显著的复苏态势,未来有望受益于公司Turbo Fusion技术商业化加速以及端侧AI应用落地,实现主营业务持续增长。 根据公司业绩预告,2024年公司预计实现营收约8.15亿元,预计同比增长约21.60%;全年归母净利润预计约1.78亿元,预计
S
虹软科技
6
3
9
4.04
戈壁淘金
只买龙头的老司机
2025-01-25 17:09:00
字节AGI研究加速,token调用量环比上月+50%,看好字节主线
23年开始布局Seed模型和Flow应用两大团队后,据晚点信息,字节正式设立“SeedEdge”研究项目,做更长期的AGI研究,涉及1)高效通用的推理;2)世界模型和感知(这个或和机器人有关);3)探索Transformer+GPU之外的模型设计,适配未来可能的新硬件架构;4)模型新结构和训练方法探索;5)多智能体、推理 ScalingLaw等。 近期国产模型进展迅速,头部追上o1和GPT-4o,DeepSeek平权了RL模型的训练门槛。字节在情感模型后,MoE的豆包1.5Pro也发布了(并称不
S
慧博云通
S
法本信息
S
萤石网络
S
广和通
12
14
21
7.03
上一页
1
14
15
16
17
18
607
下一页
前往
页
戈壁淘金
只买龙头的老司机
2025-01-28 08:22:26
中信建投-人工智能行业:2025年人工智能十大发展趋势
核心观点:大语言模型发展进入深度推理阶段,通用人工智能愈行愈近,AI应用进入爆发前夜。站在当前这一重要的历史节点,我们从技术、应用、能源三个维度展望了人工智能的未来发展,其中技术是源动力,应用是牵引力,能源是支撑力。对未来的展望中,我们提出推理计算、合成数据、缩放法则、超级智能体、具身智能、 Al4Science、端侧创新、自动驾驶、人工智能、能源需求十个方面的发展趋势。 趋势一 推理计算提升大模型准确率,强化学习激发模型推理能力 OPenAl发布新的具有深度思考能力的a1推理模型,推理侧缩放法
S
汉得信息
S
拓尔思
S
鼎捷数智
S
瑞芯微
S
广和通
60
30
48
31.63
戈壁淘金
只买龙头的老司机
2025-01-28 07:07:20
DeepSeek冲击全球算力!英伟达跌近17%
摘要:DeepSeek引发AI股估值泡沫破裂担忧,英伟达跌近17%,市值蒸发近6000亿美元为美股史上规模最大,芯片指数大跌超9%,博通跌超17%,台积电跌超13%,AMD和阿斯麦跌约6%,Altman押注的核电股Oklo跌近26%,投资AI的科技巨头中,微软跌4.6%后跌幅砍半,亚马逊和Meta转涨,苹果涨超3%。美元、美债收益率急跌至一个多月最低,风险资产美油盘中跌3%。 中国人工智能初创公司DeepSeek暴击华尔街,AI“卖铲人”英伟达股价周一暴跌,盘中跌幅超过18%,创2020年3月以
S
鼎捷数智
S
汉得信息
6
17
36
17.11
戈壁淘金
只买龙头的老司机
2025-01-28 04:15:51
R1“轰炸”还不够,DeepSeek发布新开源AI模型,生图能力胜过DALL-E 3
摘要:DeepSeek称Janus-Pro框架简单且灵活性高。它采用视觉编码解耦方式提升不同任务中的适配性和性能,用统一的Transformer架构处理任务,适配384x384分辨率。基准测试中,70亿参数的Janus-Pro-7B表现强于包括DALL-E 3在内的其他模型,且较前代Janus准确率大幅提高。JanusFlow采用极简架构,将自回归语言模型与矫正流结合,无需复杂架构修改,生图支持384x384分辨率。 海外网友才开始经受R1的“洗礼”,中国人工智能(AI)初创DeepSeek又发
S
彩讯股份
S
万兴科技
S
虹软科技
13
18
31
19.26
戈壁淘金
只买龙头的老司机
2025-01-27 14:38:13
DeePSeek核心结论:影响深远
DS核心结论:影响深远,OpenAI 地位或为开源威胁,利好Agent,利好端侧,利好推理算力[天风计算机缪欣君团队] 1、开源阶段性的完胜(从前训练到后训练,无需SFT,迎接Ahamoment),或在后续影响 OpenAi收入 2、开源属性下行业快速扩散,加速AI-Agent落地(蒸馏小模型如32b/7b,私有化/端侧部署;推理成本下降30X) 3、重申Agent三大机会1)计算机双王,推理爆发2)To B Agent汉得/创达,小市值可私。3) To C端侧,SOC/存算一体/模组。 xxx
S
广和通
S
恒烁股份
S
鼎捷数智
S
星宸科技
17
33
47
21.51
戈壁淘金
只买龙头的老司机
2025-01-27 08:58:42
1月27日避雷针
1月27日避雷针
Screenshot_20250127_085734_com.baidu.searchbox_edit_182580231912764.jpg
S
每日互动
0
8
15
6.02
戈壁淘金
只买龙头的老司机
2025-01-27 04:55:17
计算机行业周报:Open AI发布AI Agent Operator,AI应用落地加速
本周观点 24日凌晨OpenAI发布AIAgent智能体Operator,通过CUA系统进行复杂的思维链反思和步骤规划,能够在不进行精调的情况下完成泛化任务。在目前的演示中,Operator可进行网购、订餐、论文分类搜索、文献综述等。CUA(Computer-Using Agent)原理:融合GPT-4o的视觉能力,可通过处理原始像素数据来了解屏幕上发生的事情,按照“集成感知(提供计算机当前状态的屏幕截图)—推理—行动”的流程进行迭代循环,能够操作屏幕上的按钮、菜单和文本框。目前Operator
S
虹软科技
S
萤石网络
8
6
11
13.86
戈壁淘金
只买龙头的老司机
2025-01-27 04:50:22
计算机行业周报:软件大革命,Agent投资机遇全梳理
本周观点 AIAgent或成为软件价值重估的重要催化剂,软件厂商的目标市场有望扩大到数万亿美元的劳动力市场,AIAgent也有望提升软件的消费属性,进一步打开软件厂商的估值天花板:通用SaaS是AIAgent的“基础设施”,企业或加速云化进而AI化的进程;垂类应用有望借助AI迎来数倍TAM增长,同时或成为大模型、通用SaaS生态的重要组成部分,针对不同方向,建议关注: 终端AI:中科创达、萤石网络等; 本地生活:值得买、焦点科技、光云科技等; 办公:金山办公、合合信息、福昕软件等; CRM:金蝶
S
汉得信息
S
鼎捷数智
11
13
22
18.34
戈壁淘金
只买龙头的老司机
2025-01-26 19:58:08
deepseek
deepseek
Screenshot_20250126_195548_com.tencent.mm_edit_163917145136966.jpg
S
润泽科技
3
12
24
5.28
戈壁淘金
只买龙头的老司机
2025-01-26 15:58:30
DeepSeek周末热议,如何与豆包进行对比?
1、DeepSeek属于大语言模型,而豆包属于多模态大模型。22因此在算力需求上本身不在同一数量级。 2、deepseek v3算力用的少,主要是通过激活参数少、把精度降低实现的(16位变8位),这是在不断改进基础大模型,而r1是在v3这个基础模型上,又花了大量算力去让他推理能力更强。而豆包属于基于前期大语言模型训练的同时,基于训练其他图片/音频/视频等模型能力,且训练和推理仍在持续。#相当于DeepSeek做减法、豆包做加法。 结论:#DeepSeek是国产大语言模型之光(重视合作方和生态);
S
每日互动
S
广和通
134
55
119
28.80
戈壁淘金
只买龙头的老司机
2025-01-26 11:40:02
【字节端侧]2025春节最强主线,“字节+机器”成为本轮端侧主线
【字节端侧]2025春节最强主线,“字节+机器”成为本轮端侧主线/广和通/瑞芯微/全志,此外核心关注视觉/星宸/富瀚微、连接/翱捷 字节豆包在2025年春节有望持续催化。(1)字节豆包全新基础模型Doubao-1.5-pro已正式发布。最近模型融合并提升了视觉和语音等多模态能力:视觉多模态性能进一步提升,语音多模态情商智商在线。(2)字节豆包模型日均tokens调用量在高速增长:截止2024年12月15日已经突破了4万亿,2025年1月已突破6万亿。(3) TOKEN分润商业模式逐步落地。移远通
S
广和通
S
瑞芯微
21
8
22
6.62
戈壁淘金
2025-01-26 03:46:11
DeepSeek利空算力?
其实具体逻辑,从12月deepseek v3到这周的r1,我们前前后后分析过很多次了,不妨总结梳理下 1. 海外广泛引用的550万美金是v3,而不是r1的训练成本,且550万只是v3实际训练成本的零头。v3论文原话:上述成本仅包括DeepSeek-V3 的正式训练,不包括与架构、算法、数据相关的前期研究、消融实验的成本。社群内一位算法工程师就曾说“v3用了幻方自己的r1模型生成数据,这个部分的反复尝试要不要算在成本里呢?”一个意思。 2. 前沿探索和后发追赶,所需要的算力本就不是一个量级。表现为
S
拓尔思
31
24
37
6.13
戈壁淘金
只买龙头的老司机
2025-01-25 18:54:31
超越OpenAI o1,DeepSeek-R1升至全球风格控制类第一
距离深度求索推理大模型 DeepSeek-R1 发布已经过去约一周时间。 然而,在海外社交媒体,乃至于华尔街上, DeepSeek-R1 的热度竟然才刚刚开始螺旋式上升。 1月24日,在国外大模型排名 Arena 上,DeepSeek-R1 基准测试已经升至全类别大模型第三,其中在风格控制类模型(StyleCtrl)分类中与 OpenAI o1 并列第一。而其竞技场得分达到1357分,略超 OpenAI o1 的1352分。 这是继 DeepSeek-V3 在剔除 OpenAI o1 等闭源模型
S
昆仑万维
26
26
59
15.46
戈壁淘金
只买龙头的老司机
2025-01-25 17:20:44
AMD:已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上
最新消息(1月25日15时)AMD宣布,已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上,该模型旨在与SGLang一起实现最佳性能。DeepSeek-V3针对Al推理进行了优化。
Screenshot_20250125_172014_com.wallstreetcn.news_edit_105166151062077.jpg
S
每日互动
7
29
42
10.63
戈壁淘金
只买龙头的老司机
2025-01-25 17:14:52
虹软科技:视觉AI龙头,商拍+AI眼镜业务续写新篇章
投资要点: 国内视觉AI领军厂商,智能手机业务受益端侧AI应用显著复苏 公司是国内CV行业领先的算法服务提供商及解决方案供应商,下游应用覆盖智能手机、智能汽车、智能家居等领域。2023年公司智能手机视觉解决方案实现营收5.81亿元,同比增长22.8%并呈现显著的复苏态势,未来有望受益于公司Turbo Fusion技术商业化加速以及端侧AI应用落地,实现主营业务持续增长。 根据公司业绩预告,2024年公司预计实现营收约8.15亿元,预计同比增长约21.60%;全年归母净利润预计约1.78亿元,预计
S
虹软科技
6
3
9
4.04
戈壁淘金
只买龙头的老司机
2025-01-25 17:09:00
字节AGI研究加速,token调用量环比上月+50%,看好字节主线
23年开始布局Seed模型和Flow应用两大团队后,据晚点信息,字节正式设立“SeedEdge”研究项目,做更长期的AGI研究,涉及1)高效通用的推理;2)世界模型和感知(这个或和机器人有关);3)探索Transformer+GPU之外的模型设计,适配未来可能的新硬件架构;4)模型新结构和训练方法探索;5)多智能体、推理 ScalingLaw等。 近期国产模型进展迅速,头部追上o1和GPT-4o,DeepSeek平权了RL模型的训练门槛。字节在情感模型后,MoE的豆包1.5Pro也发布了(并称不
S
慧博云通
S
法本信息
S
萤石网络
S
广和通
12
14
21
7.03
上一页
1
14
15
16
17
18
607
下一页
前往
页
戈壁淘金
只买龙头的老司机
2025-01-28 08:22:26
中信建投-人工智能行业:2025年人工智能十大发展趋势
核心观点:大语言模型发展进入深度推理阶段,通用人工智能愈行愈近,AI应用进入爆发前夜。站在当前这一重要的历史节点,我们从技术、应用、能源三个维度展望了人工智能的未来发展,其中技术是源动力,应用是牵引力,能源是支撑力。对未来的展望中,我们提出推理计算、合成数据、缩放法则、超级智能体、具身智能、 Al4Science、端侧创新、自动驾驶、人工智能、能源需求十个方面的发展趋势。 趋势一 推理计算提升大模型准确率,强化学习激发模型推理能力 OPenAl发布新的具有深度思考能力的a1推理模型,推理侧缩放法
S
汉得信息
S
拓尔思
S
鼎捷数智
S
瑞芯微
S
广和通
60
30
48
31.63
戈壁淘金
只买龙头的老司机
2025-01-28 07:07:20
DeepSeek冲击全球算力!英伟达跌近17%
摘要:DeepSeek引发AI股估值泡沫破裂担忧,英伟达跌近17%,市值蒸发近6000亿美元为美股史上规模最大,芯片指数大跌超9%,博通跌超17%,台积电跌超13%,AMD和阿斯麦跌约6%,Altman押注的核电股Oklo跌近26%,投资AI的科技巨头中,微软跌4.6%后跌幅砍半,亚马逊和Meta转涨,苹果涨超3%。美元、美债收益率急跌至一个多月最低,风险资产美油盘中跌3%。 中国人工智能初创公司DeepSeek暴击华尔街,AI“卖铲人”英伟达股价周一暴跌,盘中跌幅超过18%,创2020年3月以
S
鼎捷数智
S
汉得信息
6
17
36
17.11
戈壁淘金
只买龙头的老司机
2025-01-28 04:15:51
R1“轰炸”还不够,DeepSeek发布新开源AI模型,生图能力胜过DALL-E 3
摘要:DeepSeek称Janus-Pro框架简单且灵活性高。它采用视觉编码解耦方式提升不同任务中的适配性和性能,用统一的Transformer架构处理任务,适配384x384分辨率。基准测试中,70亿参数的Janus-Pro-7B表现强于包括DALL-E 3在内的其他模型,且较前代Janus准确率大幅提高。JanusFlow采用极简架构,将自回归语言模型与矫正流结合,无需复杂架构修改,生图支持384x384分辨率。 海外网友才开始经受R1的“洗礼”,中国人工智能(AI)初创DeepSeek又发
S
彩讯股份
S
万兴科技
S
虹软科技
13
18
31
19.26
戈壁淘金
只买龙头的老司机
2025-01-27 14:38:13
DeePSeek核心结论:影响深远
DS核心结论:影响深远,OpenAI 地位或为开源威胁,利好Agent,利好端侧,利好推理算力[天风计算机缪欣君团队] 1、开源阶段性的完胜(从前训练到后训练,无需SFT,迎接Ahamoment),或在后续影响 OpenAi收入 2、开源属性下行业快速扩散,加速AI-Agent落地(蒸馏小模型如32b/7b,私有化/端侧部署;推理成本下降30X) 3、重申Agent三大机会1)计算机双王,推理爆发2)To B Agent汉得/创达,小市值可私。3) To C端侧,SOC/存算一体/模组。 xxx
S
广和通
S
恒烁股份
S
鼎捷数智
S
星宸科技
17
33
47
21.51
戈壁淘金
只买龙头的老司机
2025-01-27 08:58:42
1月27日避雷针
1月27日避雷针
Screenshot_20250127_085734_com.baidu.searchbox_edit_182580231912764.jpg
S
每日互动
0
8
15
6.02
戈壁淘金
只买龙头的老司机
2025-01-27 04:55:17
计算机行业周报:Open AI发布AI Agent Operator,AI应用落地加速
本周观点 24日凌晨OpenAI发布AIAgent智能体Operator,通过CUA系统进行复杂的思维链反思和步骤规划,能够在不进行精调的情况下完成泛化任务。在目前的演示中,Operator可进行网购、订餐、论文分类搜索、文献综述等。CUA(Computer-Using Agent)原理:融合GPT-4o的视觉能力,可通过处理原始像素数据来了解屏幕上发生的事情,按照“集成感知(提供计算机当前状态的屏幕截图)—推理—行动”的流程进行迭代循环,能够操作屏幕上的按钮、菜单和文本框。目前Operator
S
虹软科技
S
萤石网络
8
6
11
13.86
戈壁淘金
只买龙头的老司机
2025-01-27 04:50:22
计算机行业周报:软件大革命,Agent投资机遇全梳理
本周观点 AIAgent或成为软件价值重估的重要催化剂,软件厂商的目标市场有望扩大到数万亿美元的劳动力市场,AIAgent也有望提升软件的消费属性,进一步打开软件厂商的估值天花板:通用SaaS是AIAgent的“基础设施”,企业或加速云化进而AI化的进程;垂类应用有望借助AI迎来数倍TAM增长,同时或成为大模型、通用SaaS生态的重要组成部分,针对不同方向,建议关注: 终端AI:中科创达、萤石网络等; 本地生活:值得买、焦点科技、光云科技等; 办公:金山办公、合合信息、福昕软件等; CRM:金蝶
S
汉得信息
S
鼎捷数智
11
13
22
18.34
戈壁淘金
只买龙头的老司机
2025-01-26 19:58:08
deepseek
deepseek
Screenshot_20250126_195548_com.tencent.mm_edit_163917145136966.jpg
S
润泽科技
3
12
24
5.28
戈壁淘金
只买龙头的老司机
2025-01-26 15:58:30
DeepSeek周末热议,如何与豆包进行对比?
1、DeepSeek属于大语言模型,而豆包属于多模态大模型。22因此在算力需求上本身不在同一数量级。 2、deepseek v3算力用的少,主要是通过激活参数少、把精度降低实现的(16位变8位),这是在不断改进基础大模型,而r1是在v3这个基础模型上,又花了大量算力去让他推理能力更强。而豆包属于基于前期大语言模型训练的同时,基于训练其他图片/音频/视频等模型能力,且训练和推理仍在持续。#相当于DeepSeek做减法、豆包做加法。 结论:#DeepSeek是国产大语言模型之光(重视合作方和生态);
S
每日互动
S
广和通
134
55
119
28.80
戈壁淘金
只买龙头的老司机
2025-01-26 11:40:02
【字节端侧]2025春节最强主线,“字节+机器”成为本轮端侧主线
【字节端侧]2025春节最强主线,“字节+机器”成为本轮端侧主线/广和通/瑞芯微/全志,此外核心关注视觉/星宸/富瀚微、连接/翱捷 字节豆包在2025年春节有望持续催化。(1)字节豆包全新基础模型Doubao-1.5-pro已正式发布。最近模型融合并提升了视觉和语音等多模态能力:视觉多模态性能进一步提升,语音多模态情商智商在线。(2)字节豆包模型日均tokens调用量在高速增长:截止2024年12月15日已经突破了4万亿,2025年1月已突破6万亿。(3) TOKEN分润商业模式逐步落地。移远通
S
广和通
S
瑞芯微
21
8
22
6.62
戈壁淘金
2025-01-26 03:46:11
DeepSeek利空算力?
其实具体逻辑,从12月deepseek v3到这周的r1,我们前前后后分析过很多次了,不妨总结梳理下 1. 海外广泛引用的550万美金是v3,而不是r1的训练成本,且550万只是v3实际训练成本的零头。v3论文原话:上述成本仅包括DeepSeek-V3 的正式训练,不包括与架构、算法、数据相关的前期研究、消融实验的成本。社群内一位算法工程师就曾说“v3用了幻方自己的r1模型生成数据,这个部分的反复尝试要不要算在成本里呢?”一个意思。 2. 前沿探索和后发追赶,所需要的算力本就不是一个量级。表现为
S
拓尔思
31
24
37
6.13
戈壁淘金
只买龙头的老司机
2025-01-25 18:54:31
超越OpenAI o1,DeepSeek-R1升至全球风格控制类第一
距离深度求索推理大模型 DeepSeek-R1 发布已经过去约一周时间。 然而,在海外社交媒体,乃至于华尔街上, DeepSeek-R1 的热度竟然才刚刚开始螺旋式上升。 1月24日,在国外大模型排名 Arena 上,DeepSeek-R1 基准测试已经升至全类别大模型第三,其中在风格控制类模型(StyleCtrl)分类中与 OpenAI o1 并列第一。而其竞技场得分达到1357分,略超 OpenAI o1 的1352分。 这是继 DeepSeek-V3 在剔除 OpenAI o1 等闭源模型
S
昆仑万维
26
26
59
15.46
戈壁淘金
只买龙头的老司机
2025-01-25 17:20:44
AMD:已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上
最新消息(1月25日15时)AMD宣布,已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上,该模型旨在与SGLang一起实现最佳性能。DeepSeek-V3针对Al推理进行了优化。
Screenshot_20250125_172014_com.wallstreetcn.news_edit_105166151062077.jpg
S
每日互动
7
29
42
10.63
戈壁淘金
只买龙头的老司机
2025-01-25 17:14:52
虹软科技:视觉AI龙头,商拍+AI眼镜业务续写新篇章
投资要点: 国内视觉AI领军厂商,智能手机业务受益端侧AI应用显著复苏 公司是国内CV行业领先的算法服务提供商及解决方案供应商,下游应用覆盖智能手机、智能汽车、智能家居等领域。2023年公司智能手机视觉解决方案实现营收5.81亿元,同比增长22.8%并呈现显著的复苏态势,未来有望受益于公司Turbo Fusion技术商业化加速以及端侧AI应用落地,实现主营业务持续增长。 根据公司业绩预告,2024年公司预计实现营收约8.15亿元,预计同比增长约21.60%;全年归母净利润预计约1.78亿元,预计
S
虹软科技
6
3
9
4.04
戈壁淘金
只买龙头的老司机
2025-01-25 17:09:00
字节AGI研究加速,token调用量环比上月+50%,看好字节主线
23年开始布局Seed模型和Flow应用两大团队后,据晚点信息,字节正式设立“SeedEdge”研究项目,做更长期的AGI研究,涉及1)高效通用的推理;2)世界模型和感知(这个或和机器人有关);3)探索Transformer+GPU之外的模型设计,适配未来可能的新硬件架构;4)模型新结构和训练方法探索;5)多智能体、推理 ScalingLaw等。 近期国产模型进展迅速,头部追上o1和GPT-4o,DeepSeek平权了RL模型的训练门槛。字节在情感模型后,MoE的豆包1.5Pro也发布了(并称不
S
慧博云通
S
法本信息
S
萤石网络
S
广和通
12
14
21
7.03
上一页
1
14
15
16
17
18
607
下一页
前往
页
15
关注
53018
粉丝
134405.14
工分
社区规则
服务协议
隐私政策
沪ICP备20009443号
© 2020 上海韭研信息科技有限公司
关于韭研公社
问题反馈
有问题请联系
@韭菜团子
公社愿景:韭研公社,原韭菜公社,投资干货最多的共享社群,汇聚全网最深度的基本面研究,消弭个人滞后机构的逻辑鸿沟。
风险提示:韭研公社里任何网友的发言,都有其特定立场,均不构成投资建议,请投资者独立审慎决策。
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609