异动
关注
社群
搜公告
产业库
时间轴
公社AI
通知
全部已读
暂无数据
私信
暂无数据
登录注册
我的主页
退出
戈壁淘金
顺势而为,玉汝于成
IP属地:110000,110100
个人资料
戈壁淘金
只买龙头的老司机
2025-02-20 19:09:12
国泰君安-计算机行业:DeepSeek NSA架构引领AI效率革新
投资建议:DeepSeek发布NSA(Native Sparse Attention)相关论文,突破长文本处理瓶颈,低成本模型训练可行性推动AI大模型转向算法效率竞争。通过降低AI应用开发门槛,有望激发新一轮创新浪潮,最终加速AI在各行业的渗透,带动整个产业链升级,从基础设施到应用层都将会迎来新的发展机遇。推荐标的:鼎捷数智、福昕软件、神州数码、科大讯飞,受益标的:优刻得、海天瑞声。 NSA通过原生稀疏注意力机制在长上下文处理实现突破。长上下文处理是大模型发展的关键瓶颈之一,softmax架构中
S
鼎捷数智
S
优刻得
3
4
6
1.86
戈壁淘金
只买龙头的老司机
2025-02-20 14:42:25
Rokid (灵伴科技)AI眼镜相关概念股
在A 股市场中,与Rokid(灵伴科技)AI眼镜相关的个股主要可分为参股投资、业务合作及供应链这三类,具体情况如下: 一、参股投资 慈文传媒(002343) 通过子公司间接参股Rokid,并合作开发XR内容生态和文旅 AR 导览。 浙版传媒(601921) 通过春晓基金投资Rokid 3400万元,布局 AR数字出版与教育场景。 二、业务合作 博士眼镜(300622) 为Rokid 用户提供定制化视力矫正方案,解决近视适配问题。 亿道信息(001314) 与 Rokid 联合研发AR 空间计算产
S
明月镜片
50
11
21
7.22
戈壁淘金
只买龙头的老司机
2025-02-20 13:47:46
全志科技
全志科技
Screenshot_20250220_134642_com.tencent.mm_edit_110245747559740.jpg
S
全志科技
0
3
11
3.29
戈壁淘金
只买龙头的老司机
2025-02-20 12:53:35
xAI称Grok 3将免费提供,利好云计算
【xAI称Grok 3将免费提供】xAI宣布,世界上最智能的AI Grok 3,现在免费提供(直到我们的服务器不堪重负为止)。云计算雄起!
Screenshot_20250220_125037_com.wallstreetcn.news_edit_107365254333617.jpg
S
优刻得
S
青云科技
S
深信服
2
5
9
1.60
戈壁淘金
只买龙头的老司机
2025-02-20 09:17:36
重点关注DS出世企业软件的机会
各位领导好,调研发现企业和政府客户对 DS的热情高于软件厂商! 1、#银行、法院的私有部署一定要重视!我们新增覆盖了【京北方】PE估值仅30X+的银行IT公司,全面拥抱AI。可以详聊京北方的最新业务进展!根据最近的调研情况,银行是有资金实力也有强动力进行独立部署的机构,AI助业务的KPI指标下放到业务部门。法院比厂商对DS 更积极,大语言模型为法律而生,DS 部署后在法律问答的效果提升40-60%。标的:京北方、宇信科技、恒生电子、华宇软件、通达海、金桥信息等。 2、# 重大推荐【迈富时】,稀缺
S
京北方
S
博思软件
6
7
20
4.71
戈壁淘金
只买龙头的老司机
2025-02-20 08:27:13
2月20日避雷针
2月20日避雷针
Screenshot_20250220_082625_com.baidu.searchbox_edit_97874949226732.jpg
S
贵州茅台
1
3
8
1.32
戈壁淘金
只买龙头的老司机
2025-02-20 07:18:04
DS 带来新一轮云计算重估
1、[为什么DS 才是真正引领云计算重估的 23年一轮跟这轮的区别?]2019到2021年云计算行情高涨到现在,我们看到2022 年底 AI 主要是海外 OpenAl重塑全球格局,云开始进入云基建时代,大部分云厂商开始转型算力租赁,现在看来前期的摸索和准备或已进入落地期,2024年底-2025年国产模型全面启动,由此带来的国产模型成熟转向应用推理的过渡,真正刺激 BC端应用落地,训练转向推理,国产算力性价比优势凸显,算力门槛下降,数据的云端处理需求大幅度提升,云算力、运维调优能力凸显,与此同时云
S
优刻得
S
品高股份
S
首都在线
S
青云科技
11
14
25
5.05
戈壁淘金
只买龙头的老司机
2025-02-20 06:48:37
华创证券:DeepSeek 发布最新论文,大模型长文本推理革命
事项: 2025年2月18日,DeepSeek联手两大机构发布最新论文,研究由DeepSeek创始人梁文锋亲自领导,旨在优化Transformer注意力机制。论文提出了革命性注意力机制NSA,NSA是一种面向硬件且支持原生训练的稀疏注意力机制,专为超快长上下文训练与推理设计。它包含动态分层稀疏策略、粗粒度的token压缩和细粒度的token选择等核心组成部分,在通用、长文本、思维链推理基准测试中,刷新SOTA,碾压全注意力。NSA是对Transformer注意力机制的重大优化。 评论: NSA实
S
新致软件
S
鼎捷数智
S
深信服
S
汉得信息
S
泛微网络
7
7
10
3.10
戈壁淘金
只买龙头的老司机
2025-02-20 06:03:08
报道:DeepSeek考虑首次从外部融资
摘要:周三,据The Information报道,最近几周,包括阿里巴巴在内的众多实力雄厚的投资者对DeepSeek的下一阶段增长表现出浓厚兴趣。DeepSeek、阿里巴巴等未就最新消息回应。 周三,据The Information报道,DeepSeek考虑首次从外部融资。 DeepSeek迅速崛起,使这家中国人工智能初创公司面临一个重要的两难选择——是否要筹集资金: DeepSeek迄今尚未接受外部融资,部分原因是为了避免投资者施加压力,要求其过快地商业化产品。 不过伴随着其AI聊天机器人应用
S
每日互动
S
汉得信息
16
21
28
7.50
戈壁淘金
只买龙头的老司机
2025-02-19 19:15:05
浙商证券-深信服:“一朵云”平台进行面向AI的全方位升级
研报摘要 深信服此次升级不仅强化了其在AI基础设施领域的领先地位,更通过DeepSeek开源生态与AICP算力平台的深度整合,为行业提供了“高性能、低成本、易部署”的AI转型路径。未来,深信服有望成为企业级大模型部署的核心服务商,推动 AI技术从“可用”向“好用”迈进。 公司宣布对“一朵云”平台进行面向AI的全方位升级 公司在2025年2月17日的深信服核心合作伙伴论坛中宣布对“一朵云”平台进行面向AI的全方位升级,重点围绕大模型场景的智算承载、应用构建与成本优化展开。此次升级包含三大核心方向:
S
深信服
1
3
8
2.00
戈壁淘金
只买龙头的老司机
2025-02-19 17:13:50
长江证券-通信设备行业:Deepseek对运营商及产业链影响几何?
事件描述 近日,国内三大运营商,相继接入DeepSeek开源大模型,并在多场景、多产品中实现应用。中国电信天翼云自主研发的“息壤”智算平台为国内首家实现DeepSeek模型全栈国产化推理服务落地的运营商级云平台。中国移动的云平台针对 DeepSeek-R1模型特别定制了专属算力方案,为互联网企业创新与高效科研提供了高性价比的算力支持和开发环境。2月5日,中国联通公众号表示,联通云上架DeepSeek-R1系列模型,可在全国270+骨干云池预部署。 事件评论 充分受益于Deepseek出圈,运营商
S
奥飞数据
S
中兴通讯
7
4
13
2.99
戈壁淘金
只买龙头的老司机
2025-02-19 14:40:44
0219昇腾一体机交流要点
0219昇腾一体机交流要点: 1昇腾整体:DS对昇腾下游拉动需求较大,全年昇腾预计出货量75万-80万张之间,***b在35万,***c在45万整体目标;鲲鹏25全年预计130万颗,26年昇腾目标110万-120万区间; 结构:地方算力中心10万张,运营商20万,互联网40-45万,其中一体机形式在5-10万张左右(政企为主); 3deepseek一体机对于30家合作伙伴态度:H适配为主,出货、运维、微调合作伙伴为主; 4价格利润:1)售:价格目前价格不太会加,后面如果遇到交货困难,可能会加,D
S
云从科技
3
5
16
5.06
戈壁淘金
只买龙头的老司机
2025-02-19 14:29:33
AIDC:全年维度主线,持续强 call
1、国内CAPEX竞赛:字节(豆包)→阿里&苹果→腾讯(微信+DS),国内互联网大厂的 CAPEX全面加速,腾讯的投资额暂时未知,但可以确定行业β是向上全面加速的状态。 2、海外仍是算力主战场,建议关注月底的NV业绩会,同时关注消息面的变化。 3、算力带动的基础设施投资海外国内都在加速,未来将是海外、国内交替演绎。 当前推荐思路: 1、弹性:【科华】卡位逻辑好;【盛弘]数据中心电能质量。 2、海外链高度相关:【麦米]【江海]【禾望],反应海外催化。 3、主业有支撑+AIDC增强:【明阳电气][宏
S
禾望电气
5
5
20
4.57
戈壁淘金
只买龙头的老司机
2025-02-19 09:14:37
【东方计算机】DS公开新注意力架构NSA,进一步推动推理端降本提速
[庆祝]DS昨天发布的论文提出了一种新的注意力机制 —NSA,核心思想是通过“稀疏化”注意力计算,减少不必要的计算量,同时保持模型性能。 [庆祝]#NSA进一步降低推理成本、提高推理速度 与传统注意力机制相比,NSA通过分层处理、选择性关注等方式,关注关键信息而非对每个词详细计算,从而减少计算开支,大幅提升长文本处理能力(处理64K文本时,前向计算和反向计算速度分别提升9倍和6倍)。 [庆祝]#NSA如在模型中应用,可加速在多场景AI落地 NSA在长文档、复杂推理、多轮对话和大规模数据处理任务中
S
优刻得
S
金山办公
7
7
11
2.62
戈壁淘金
只买龙头的老司机
2025-02-19 09:01:07
2月19日避雷针
2月19日避雷针
Screenshot_20250219_090019_com.baidu.searchbox_edit_45686250630007.jpg
S
贵州茅台
0
3
6
0.41
上一页
1
6
7
8
9
10
607
下一页
前往
页
戈壁淘金
只买龙头的老司机
2025-02-20 19:09:12
国泰君安-计算机行业:DeepSeek NSA架构引领AI效率革新
投资建议:DeepSeek发布NSA(Native Sparse Attention)相关论文,突破长文本处理瓶颈,低成本模型训练可行性推动AI大模型转向算法效率竞争。通过降低AI应用开发门槛,有望激发新一轮创新浪潮,最终加速AI在各行业的渗透,带动整个产业链升级,从基础设施到应用层都将会迎来新的发展机遇。推荐标的:鼎捷数智、福昕软件、神州数码、科大讯飞,受益标的:优刻得、海天瑞声。 NSA通过原生稀疏注意力机制在长上下文处理实现突破。长上下文处理是大模型发展的关键瓶颈之一,softmax架构中
S
鼎捷数智
S
优刻得
3
4
6
1.86
戈壁淘金
只买龙头的老司机
2025-02-20 14:42:25
Rokid (灵伴科技)AI眼镜相关概念股
在A 股市场中,与Rokid(灵伴科技)AI眼镜相关的个股主要可分为参股投资、业务合作及供应链这三类,具体情况如下: 一、参股投资 慈文传媒(002343) 通过子公司间接参股Rokid,并合作开发XR内容生态和文旅 AR 导览。 浙版传媒(601921) 通过春晓基金投资Rokid 3400万元,布局 AR数字出版与教育场景。 二、业务合作 博士眼镜(300622) 为Rokid 用户提供定制化视力矫正方案,解决近视适配问题。 亿道信息(001314) 与 Rokid 联合研发AR 空间计算产
S
明月镜片
50
11
21
7.22
戈壁淘金
只买龙头的老司机
2025-02-20 13:47:46
全志科技
全志科技
Screenshot_20250220_134642_com.tencent.mm_edit_110245747559740.jpg
S
全志科技
0
3
11
3.29
戈壁淘金
只买龙头的老司机
2025-02-20 12:53:35
xAI称Grok 3将免费提供,利好云计算
【xAI称Grok 3将免费提供】xAI宣布,世界上最智能的AI Grok 3,现在免费提供(直到我们的服务器不堪重负为止)。云计算雄起!
Screenshot_20250220_125037_com.wallstreetcn.news_edit_107365254333617.jpg
S
优刻得
S
青云科技
S
深信服
2
5
9
1.60
戈壁淘金
只买龙头的老司机
2025-02-20 09:17:36
重点关注DS出世企业软件的机会
各位领导好,调研发现企业和政府客户对 DS的热情高于软件厂商! 1、#银行、法院的私有部署一定要重视!我们新增覆盖了【京北方】PE估值仅30X+的银行IT公司,全面拥抱AI。可以详聊京北方的最新业务进展!根据最近的调研情况,银行是有资金实力也有强动力进行独立部署的机构,AI助业务的KPI指标下放到业务部门。法院比厂商对DS 更积极,大语言模型为法律而生,DS 部署后在法律问答的效果提升40-60%。标的:京北方、宇信科技、恒生电子、华宇软件、通达海、金桥信息等。 2、# 重大推荐【迈富时】,稀缺
S
京北方
S
博思软件
6
7
20
4.71
戈壁淘金
只买龙头的老司机
2025-02-20 08:27:13
2月20日避雷针
2月20日避雷针
Screenshot_20250220_082625_com.baidu.searchbox_edit_97874949226732.jpg
S
贵州茅台
1
3
8
1.32
戈壁淘金
只买龙头的老司机
2025-02-20 07:18:04
DS 带来新一轮云计算重估
1、[为什么DS 才是真正引领云计算重估的 23年一轮跟这轮的区别?]2019到2021年云计算行情高涨到现在,我们看到2022 年底 AI 主要是海外 OpenAl重塑全球格局,云开始进入云基建时代,大部分云厂商开始转型算力租赁,现在看来前期的摸索和准备或已进入落地期,2024年底-2025年国产模型全面启动,由此带来的国产模型成熟转向应用推理的过渡,真正刺激 BC端应用落地,训练转向推理,国产算力性价比优势凸显,算力门槛下降,数据的云端处理需求大幅度提升,云算力、运维调优能力凸显,与此同时云
S
优刻得
S
品高股份
S
首都在线
S
青云科技
11
14
25
5.05
戈壁淘金
只买龙头的老司机
2025-02-20 06:48:37
华创证券:DeepSeek 发布最新论文,大模型长文本推理革命
事项: 2025年2月18日,DeepSeek联手两大机构发布最新论文,研究由DeepSeek创始人梁文锋亲自领导,旨在优化Transformer注意力机制。论文提出了革命性注意力机制NSA,NSA是一种面向硬件且支持原生训练的稀疏注意力机制,专为超快长上下文训练与推理设计。它包含动态分层稀疏策略、粗粒度的token压缩和细粒度的token选择等核心组成部分,在通用、长文本、思维链推理基准测试中,刷新SOTA,碾压全注意力。NSA是对Transformer注意力机制的重大优化。 评论: NSA实
S
新致软件
S
鼎捷数智
S
深信服
S
汉得信息
S
泛微网络
7
7
10
3.10
戈壁淘金
只买龙头的老司机
2025-02-20 06:03:08
报道:DeepSeek考虑首次从外部融资
摘要:周三,据The Information报道,最近几周,包括阿里巴巴在内的众多实力雄厚的投资者对DeepSeek的下一阶段增长表现出浓厚兴趣。DeepSeek、阿里巴巴等未就最新消息回应。 周三,据The Information报道,DeepSeek考虑首次从外部融资。 DeepSeek迅速崛起,使这家中国人工智能初创公司面临一个重要的两难选择——是否要筹集资金: DeepSeek迄今尚未接受外部融资,部分原因是为了避免投资者施加压力,要求其过快地商业化产品。 不过伴随着其AI聊天机器人应用
S
每日互动
S
汉得信息
16
21
28
7.50
戈壁淘金
只买龙头的老司机
2025-02-19 19:15:05
浙商证券-深信服:“一朵云”平台进行面向AI的全方位升级
研报摘要 深信服此次升级不仅强化了其在AI基础设施领域的领先地位,更通过DeepSeek开源生态与AICP算力平台的深度整合,为行业提供了“高性能、低成本、易部署”的AI转型路径。未来,深信服有望成为企业级大模型部署的核心服务商,推动 AI技术从“可用”向“好用”迈进。 公司宣布对“一朵云”平台进行面向AI的全方位升级 公司在2025年2月17日的深信服核心合作伙伴论坛中宣布对“一朵云”平台进行面向AI的全方位升级,重点围绕大模型场景的智算承载、应用构建与成本优化展开。此次升级包含三大核心方向:
S
深信服
1
3
8
2.00
戈壁淘金
只买龙头的老司机
2025-02-19 17:13:50
长江证券-通信设备行业:Deepseek对运营商及产业链影响几何?
事件描述 近日,国内三大运营商,相继接入DeepSeek开源大模型,并在多场景、多产品中实现应用。中国电信天翼云自主研发的“息壤”智算平台为国内首家实现DeepSeek模型全栈国产化推理服务落地的运营商级云平台。中国移动的云平台针对 DeepSeek-R1模型特别定制了专属算力方案,为互联网企业创新与高效科研提供了高性价比的算力支持和开发环境。2月5日,中国联通公众号表示,联通云上架DeepSeek-R1系列模型,可在全国270+骨干云池预部署。 事件评论 充分受益于Deepseek出圈,运营商
S
奥飞数据
S
中兴通讯
7
4
13
2.99
戈壁淘金
只买龙头的老司机
2025-02-19 14:40:44
0219昇腾一体机交流要点
0219昇腾一体机交流要点: 1昇腾整体:DS对昇腾下游拉动需求较大,全年昇腾预计出货量75万-80万张之间,***b在35万,***c在45万整体目标;鲲鹏25全年预计130万颗,26年昇腾目标110万-120万区间; 结构:地方算力中心10万张,运营商20万,互联网40-45万,其中一体机形式在5-10万张左右(政企为主); 3deepseek一体机对于30家合作伙伴态度:H适配为主,出货、运维、微调合作伙伴为主; 4价格利润:1)售:价格目前价格不太会加,后面如果遇到交货困难,可能会加,D
S
云从科技
3
5
16
5.06
戈壁淘金
只买龙头的老司机
2025-02-19 14:29:33
AIDC:全年维度主线,持续强 call
1、国内CAPEX竞赛:字节(豆包)→阿里&苹果→腾讯(微信+DS),国内互联网大厂的 CAPEX全面加速,腾讯的投资额暂时未知,但可以确定行业β是向上全面加速的状态。 2、海外仍是算力主战场,建议关注月底的NV业绩会,同时关注消息面的变化。 3、算力带动的基础设施投资海外国内都在加速,未来将是海外、国内交替演绎。 当前推荐思路: 1、弹性:【科华】卡位逻辑好;【盛弘]数据中心电能质量。 2、海外链高度相关:【麦米]【江海]【禾望],反应海外催化。 3、主业有支撑+AIDC增强:【明阳电气][宏
S
禾望电气
5
5
20
4.57
戈壁淘金
只买龙头的老司机
2025-02-19 09:14:37
【东方计算机】DS公开新注意力架构NSA,进一步推动推理端降本提速
[庆祝]DS昨天发布的论文提出了一种新的注意力机制 —NSA,核心思想是通过“稀疏化”注意力计算,减少不必要的计算量,同时保持模型性能。 [庆祝]#NSA进一步降低推理成本、提高推理速度 与传统注意力机制相比,NSA通过分层处理、选择性关注等方式,关注关键信息而非对每个词详细计算,从而减少计算开支,大幅提升长文本处理能力(处理64K文本时,前向计算和反向计算速度分别提升9倍和6倍)。 [庆祝]#NSA如在模型中应用,可加速在多场景AI落地 NSA在长文档、复杂推理、多轮对话和大规模数据处理任务中
S
优刻得
S
金山办公
7
7
11
2.62
戈壁淘金
只买龙头的老司机
2025-02-19 09:01:07
2月19日避雷针
2月19日避雷针
Screenshot_20250219_090019_com.baidu.searchbox_edit_45686250630007.jpg
S
贵州茅台
0
3
6
0.41
上一页
1
6
7
8
9
10
607
下一页
前往
页
戈壁淘金
只买龙头的老司机
2025-02-20 19:09:12
国泰君安-计算机行业:DeepSeek NSA架构引领AI效率革新
投资建议:DeepSeek发布NSA(Native Sparse Attention)相关论文,突破长文本处理瓶颈,低成本模型训练可行性推动AI大模型转向算法效率竞争。通过降低AI应用开发门槛,有望激发新一轮创新浪潮,最终加速AI在各行业的渗透,带动整个产业链升级,从基础设施到应用层都将会迎来新的发展机遇。推荐标的:鼎捷数智、福昕软件、神州数码、科大讯飞,受益标的:优刻得、海天瑞声。 NSA通过原生稀疏注意力机制在长上下文处理实现突破。长上下文处理是大模型发展的关键瓶颈之一,softmax架构中
S
鼎捷数智
S
优刻得
3
4
6
1.86
戈壁淘金
只买龙头的老司机
2025-02-20 14:42:25
Rokid (灵伴科技)AI眼镜相关概念股
在A 股市场中,与Rokid(灵伴科技)AI眼镜相关的个股主要可分为参股投资、业务合作及供应链这三类,具体情况如下: 一、参股投资 慈文传媒(002343) 通过子公司间接参股Rokid,并合作开发XR内容生态和文旅 AR 导览。 浙版传媒(601921) 通过春晓基金投资Rokid 3400万元,布局 AR数字出版与教育场景。 二、业务合作 博士眼镜(300622) 为Rokid 用户提供定制化视力矫正方案,解决近视适配问题。 亿道信息(001314) 与 Rokid 联合研发AR 空间计算产
S
明月镜片
50
11
21
7.22
戈壁淘金
只买龙头的老司机
2025-02-20 13:47:46
全志科技
全志科技
Screenshot_20250220_134642_com.tencent.mm_edit_110245747559740.jpg
S
全志科技
0
3
11
3.29
戈壁淘金
只买龙头的老司机
2025-02-20 12:53:35
xAI称Grok 3将免费提供,利好云计算
【xAI称Grok 3将免费提供】xAI宣布,世界上最智能的AI Grok 3,现在免费提供(直到我们的服务器不堪重负为止)。云计算雄起!
Screenshot_20250220_125037_com.wallstreetcn.news_edit_107365254333617.jpg
S
优刻得
S
青云科技
S
深信服
2
5
9
1.60
戈壁淘金
只买龙头的老司机
2025-02-20 09:17:36
重点关注DS出世企业软件的机会
各位领导好,调研发现企业和政府客户对 DS的热情高于软件厂商! 1、#银行、法院的私有部署一定要重视!我们新增覆盖了【京北方】PE估值仅30X+的银行IT公司,全面拥抱AI。可以详聊京北方的最新业务进展!根据最近的调研情况,银行是有资金实力也有强动力进行独立部署的机构,AI助业务的KPI指标下放到业务部门。法院比厂商对DS 更积极,大语言模型为法律而生,DS 部署后在法律问答的效果提升40-60%。标的:京北方、宇信科技、恒生电子、华宇软件、通达海、金桥信息等。 2、# 重大推荐【迈富时】,稀缺
S
京北方
S
博思软件
6
7
20
4.71
戈壁淘金
只买龙头的老司机
2025-02-20 08:27:13
2月20日避雷针
2月20日避雷针
Screenshot_20250220_082625_com.baidu.searchbox_edit_97874949226732.jpg
S
贵州茅台
1
3
8
1.32
戈壁淘金
只买龙头的老司机
2025-02-20 07:18:04
DS 带来新一轮云计算重估
1、[为什么DS 才是真正引领云计算重估的 23年一轮跟这轮的区别?]2019到2021年云计算行情高涨到现在,我们看到2022 年底 AI 主要是海外 OpenAl重塑全球格局,云开始进入云基建时代,大部分云厂商开始转型算力租赁,现在看来前期的摸索和准备或已进入落地期,2024年底-2025年国产模型全面启动,由此带来的国产模型成熟转向应用推理的过渡,真正刺激 BC端应用落地,训练转向推理,国产算力性价比优势凸显,算力门槛下降,数据的云端处理需求大幅度提升,云算力、运维调优能力凸显,与此同时云
S
优刻得
S
品高股份
S
首都在线
S
青云科技
11
14
25
5.05
戈壁淘金
只买龙头的老司机
2025-02-20 06:48:37
华创证券:DeepSeek 发布最新论文,大模型长文本推理革命
事项: 2025年2月18日,DeepSeek联手两大机构发布最新论文,研究由DeepSeek创始人梁文锋亲自领导,旨在优化Transformer注意力机制。论文提出了革命性注意力机制NSA,NSA是一种面向硬件且支持原生训练的稀疏注意力机制,专为超快长上下文训练与推理设计。它包含动态分层稀疏策略、粗粒度的token压缩和细粒度的token选择等核心组成部分,在通用、长文本、思维链推理基准测试中,刷新SOTA,碾压全注意力。NSA是对Transformer注意力机制的重大优化。 评论: NSA实
S
新致软件
S
鼎捷数智
S
深信服
S
汉得信息
S
泛微网络
7
7
10
3.10
戈壁淘金
只买龙头的老司机
2025-02-20 06:03:08
报道:DeepSeek考虑首次从外部融资
摘要:周三,据The Information报道,最近几周,包括阿里巴巴在内的众多实力雄厚的投资者对DeepSeek的下一阶段增长表现出浓厚兴趣。DeepSeek、阿里巴巴等未就最新消息回应。 周三,据The Information报道,DeepSeek考虑首次从外部融资。 DeepSeek迅速崛起,使这家中国人工智能初创公司面临一个重要的两难选择——是否要筹集资金: DeepSeek迄今尚未接受外部融资,部分原因是为了避免投资者施加压力,要求其过快地商业化产品。 不过伴随着其AI聊天机器人应用
S
每日互动
S
汉得信息
16
21
28
7.50
戈壁淘金
只买龙头的老司机
2025-02-19 19:15:05
浙商证券-深信服:“一朵云”平台进行面向AI的全方位升级
研报摘要 深信服此次升级不仅强化了其在AI基础设施领域的领先地位,更通过DeepSeek开源生态与AICP算力平台的深度整合,为行业提供了“高性能、低成本、易部署”的AI转型路径。未来,深信服有望成为企业级大模型部署的核心服务商,推动 AI技术从“可用”向“好用”迈进。 公司宣布对“一朵云”平台进行面向AI的全方位升级 公司在2025年2月17日的深信服核心合作伙伴论坛中宣布对“一朵云”平台进行面向AI的全方位升级,重点围绕大模型场景的智算承载、应用构建与成本优化展开。此次升级包含三大核心方向:
S
深信服
1
3
8
2.00
戈壁淘金
只买龙头的老司机
2025-02-19 17:13:50
长江证券-通信设备行业:Deepseek对运营商及产业链影响几何?
事件描述 近日,国内三大运营商,相继接入DeepSeek开源大模型,并在多场景、多产品中实现应用。中国电信天翼云自主研发的“息壤”智算平台为国内首家实现DeepSeek模型全栈国产化推理服务落地的运营商级云平台。中国移动的云平台针对 DeepSeek-R1模型特别定制了专属算力方案,为互联网企业创新与高效科研提供了高性价比的算力支持和开发环境。2月5日,中国联通公众号表示,联通云上架DeepSeek-R1系列模型,可在全国270+骨干云池预部署。 事件评论 充分受益于Deepseek出圈,运营商
S
奥飞数据
S
中兴通讯
7
4
13
2.99
戈壁淘金
只买龙头的老司机
2025-02-19 14:40:44
0219昇腾一体机交流要点
0219昇腾一体机交流要点: 1昇腾整体:DS对昇腾下游拉动需求较大,全年昇腾预计出货量75万-80万张之间,***b在35万,***c在45万整体目标;鲲鹏25全年预计130万颗,26年昇腾目标110万-120万区间; 结构:地方算力中心10万张,运营商20万,互联网40-45万,其中一体机形式在5-10万张左右(政企为主); 3deepseek一体机对于30家合作伙伴态度:H适配为主,出货、运维、微调合作伙伴为主; 4价格利润:1)售:价格目前价格不太会加,后面如果遇到交货困难,可能会加,D
S
云从科技
3
5
16
5.06
戈壁淘金
只买龙头的老司机
2025-02-19 14:29:33
AIDC:全年维度主线,持续强 call
1、国内CAPEX竞赛:字节(豆包)→阿里&苹果→腾讯(微信+DS),国内互联网大厂的 CAPEX全面加速,腾讯的投资额暂时未知,但可以确定行业β是向上全面加速的状态。 2、海外仍是算力主战场,建议关注月底的NV业绩会,同时关注消息面的变化。 3、算力带动的基础设施投资海外国内都在加速,未来将是海外、国内交替演绎。 当前推荐思路: 1、弹性:【科华】卡位逻辑好;【盛弘]数据中心电能质量。 2、海外链高度相关:【麦米]【江海]【禾望],反应海外催化。 3、主业有支撑+AIDC增强:【明阳电气][宏
S
禾望电气
5
5
20
4.57
戈壁淘金
只买龙头的老司机
2025-02-19 09:14:37
【东方计算机】DS公开新注意力架构NSA,进一步推动推理端降本提速
[庆祝]DS昨天发布的论文提出了一种新的注意力机制 —NSA,核心思想是通过“稀疏化”注意力计算,减少不必要的计算量,同时保持模型性能。 [庆祝]#NSA进一步降低推理成本、提高推理速度 与传统注意力机制相比,NSA通过分层处理、选择性关注等方式,关注关键信息而非对每个词详细计算,从而减少计算开支,大幅提升长文本处理能力(处理64K文本时,前向计算和反向计算速度分别提升9倍和6倍)。 [庆祝]#NSA如在模型中应用,可加速在多场景AI落地 NSA在长文档、复杂推理、多轮对话和大规模数据处理任务中
S
优刻得
S
金山办公
7
7
11
2.62
戈壁淘金
只买龙头的老司机
2025-02-19 09:01:07
2月19日避雷针
2月19日避雷针
Screenshot_20250219_090019_com.baidu.searchbox_edit_45686250630007.jpg
S
贵州茅台
0
3
6
0.41
上一页
1
6
7
8
9
10
607
下一页
前往
页
戈壁淘金
只买龙头的老司机
2025-02-20 19:09:12
国泰君安-计算机行业:DeepSeek NSA架构引领AI效率革新
投资建议:DeepSeek发布NSA(Native Sparse Attention)相关论文,突破长文本处理瓶颈,低成本模型训练可行性推动AI大模型转向算法效率竞争。通过降低AI应用开发门槛,有望激发新一轮创新浪潮,最终加速AI在各行业的渗透,带动整个产业链升级,从基础设施到应用层都将会迎来新的发展机遇。推荐标的:鼎捷数智、福昕软件、神州数码、科大讯飞,受益标的:优刻得、海天瑞声。 NSA通过原生稀疏注意力机制在长上下文处理实现突破。长上下文处理是大模型发展的关键瓶颈之一,softmax架构中
S
鼎捷数智
S
优刻得
3
4
6
1.86
戈壁淘金
只买龙头的老司机
2025-02-20 14:42:25
Rokid (灵伴科技)AI眼镜相关概念股
在A 股市场中,与Rokid(灵伴科技)AI眼镜相关的个股主要可分为参股投资、业务合作及供应链这三类,具体情况如下: 一、参股投资 慈文传媒(002343) 通过子公司间接参股Rokid,并合作开发XR内容生态和文旅 AR 导览。 浙版传媒(601921) 通过春晓基金投资Rokid 3400万元,布局 AR数字出版与教育场景。 二、业务合作 博士眼镜(300622) 为Rokid 用户提供定制化视力矫正方案,解决近视适配问题。 亿道信息(001314) 与 Rokid 联合研发AR 空间计算产
S
明月镜片
50
11
21
7.22
戈壁淘金
只买龙头的老司机
2025-02-20 13:47:46
全志科技
全志科技
Screenshot_20250220_134642_com.tencent.mm_edit_110245747559740.jpg
S
全志科技
0
3
11
3.29
戈壁淘金
只买龙头的老司机
2025-02-20 12:53:35
xAI称Grok 3将免费提供,利好云计算
【xAI称Grok 3将免费提供】xAI宣布,世界上最智能的AI Grok 3,现在免费提供(直到我们的服务器不堪重负为止)。云计算雄起!
Screenshot_20250220_125037_com.wallstreetcn.news_edit_107365254333617.jpg
S
优刻得
S
青云科技
S
深信服
2
5
9
1.60
戈壁淘金
只买龙头的老司机
2025-02-20 09:17:36
重点关注DS出世企业软件的机会
各位领导好,调研发现企业和政府客户对 DS的热情高于软件厂商! 1、#银行、法院的私有部署一定要重视!我们新增覆盖了【京北方】PE估值仅30X+的银行IT公司,全面拥抱AI。可以详聊京北方的最新业务进展!根据最近的调研情况,银行是有资金实力也有强动力进行独立部署的机构,AI助业务的KPI指标下放到业务部门。法院比厂商对DS 更积极,大语言模型为法律而生,DS 部署后在法律问答的效果提升40-60%。标的:京北方、宇信科技、恒生电子、华宇软件、通达海、金桥信息等。 2、# 重大推荐【迈富时】,稀缺
S
京北方
S
博思软件
6
7
20
4.71
戈壁淘金
只买龙头的老司机
2025-02-20 08:27:13
2月20日避雷针
2月20日避雷针
Screenshot_20250220_082625_com.baidu.searchbox_edit_97874949226732.jpg
S
贵州茅台
1
3
8
1.32
戈壁淘金
只买龙头的老司机
2025-02-20 07:18:04
DS 带来新一轮云计算重估
1、[为什么DS 才是真正引领云计算重估的 23年一轮跟这轮的区别?]2019到2021年云计算行情高涨到现在,我们看到2022 年底 AI 主要是海外 OpenAl重塑全球格局,云开始进入云基建时代,大部分云厂商开始转型算力租赁,现在看来前期的摸索和准备或已进入落地期,2024年底-2025年国产模型全面启动,由此带来的国产模型成熟转向应用推理的过渡,真正刺激 BC端应用落地,训练转向推理,国产算力性价比优势凸显,算力门槛下降,数据的云端处理需求大幅度提升,云算力、运维调优能力凸显,与此同时云
S
优刻得
S
品高股份
S
首都在线
S
青云科技
11
14
25
5.05
戈壁淘金
只买龙头的老司机
2025-02-20 06:48:37
华创证券:DeepSeek 发布最新论文,大模型长文本推理革命
事项: 2025年2月18日,DeepSeek联手两大机构发布最新论文,研究由DeepSeek创始人梁文锋亲自领导,旨在优化Transformer注意力机制。论文提出了革命性注意力机制NSA,NSA是一种面向硬件且支持原生训练的稀疏注意力机制,专为超快长上下文训练与推理设计。它包含动态分层稀疏策略、粗粒度的token压缩和细粒度的token选择等核心组成部分,在通用、长文本、思维链推理基准测试中,刷新SOTA,碾压全注意力。NSA是对Transformer注意力机制的重大优化。 评论: NSA实
S
新致软件
S
鼎捷数智
S
深信服
S
汉得信息
S
泛微网络
7
7
10
3.10
戈壁淘金
只买龙头的老司机
2025-02-20 06:03:08
报道:DeepSeek考虑首次从外部融资
摘要:周三,据The Information报道,最近几周,包括阿里巴巴在内的众多实力雄厚的投资者对DeepSeek的下一阶段增长表现出浓厚兴趣。DeepSeek、阿里巴巴等未就最新消息回应。 周三,据The Information报道,DeepSeek考虑首次从外部融资。 DeepSeek迅速崛起,使这家中国人工智能初创公司面临一个重要的两难选择——是否要筹集资金: DeepSeek迄今尚未接受外部融资,部分原因是为了避免投资者施加压力,要求其过快地商业化产品。 不过伴随着其AI聊天机器人应用
S
每日互动
S
汉得信息
16
21
28
7.50
戈壁淘金
只买龙头的老司机
2025-02-19 19:15:05
浙商证券-深信服:“一朵云”平台进行面向AI的全方位升级
研报摘要 深信服此次升级不仅强化了其在AI基础设施领域的领先地位,更通过DeepSeek开源生态与AICP算力平台的深度整合,为行业提供了“高性能、低成本、易部署”的AI转型路径。未来,深信服有望成为企业级大模型部署的核心服务商,推动 AI技术从“可用”向“好用”迈进。 公司宣布对“一朵云”平台进行面向AI的全方位升级 公司在2025年2月17日的深信服核心合作伙伴论坛中宣布对“一朵云”平台进行面向AI的全方位升级,重点围绕大模型场景的智算承载、应用构建与成本优化展开。此次升级包含三大核心方向:
S
深信服
1
3
8
2.00
戈壁淘金
只买龙头的老司机
2025-02-19 17:13:50
长江证券-通信设备行业:Deepseek对运营商及产业链影响几何?
事件描述 近日,国内三大运营商,相继接入DeepSeek开源大模型,并在多场景、多产品中实现应用。中国电信天翼云自主研发的“息壤”智算平台为国内首家实现DeepSeek模型全栈国产化推理服务落地的运营商级云平台。中国移动的云平台针对 DeepSeek-R1模型特别定制了专属算力方案,为互联网企业创新与高效科研提供了高性价比的算力支持和开发环境。2月5日,中国联通公众号表示,联通云上架DeepSeek-R1系列模型,可在全国270+骨干云池预部署。 事件评论 充分受益于Deepseek出圈,运营商
S
奥飞数据
S
中兴通讯
7
4
13
2.99
戈壁淘金
只买龙头的老司机
2025-02-19 14:40:44
0219昇腾一体机交流要点
0219昇腾一体机交流要点: 1昇腾整体:DS对昇腾下游拉动需求较大,全年昇腾预计出货量75万-80万张之间,***b在35万,***c在45万整体目标;鲲鹏25全年预计130万颗,26年昇腾目标110万-120万区间; 结构:地方算力中心10万张,运营商20万,互联网40-45万,其中一体机形式在5-10万张左右(政企为主); 3deepseek一体机对于30家合作伙伴态度:H适配为主,出货、运维、微调合作伙伴为主; 4价格利润:1)售:价格目前价格不太会加,后面如果遇到交货困难,可能会加,D
S
云从科技
3
5
16
5.06
戈壁淘金
只买龙头的老司机
2025-02-19 14:29:33
AIDC:全年维度主线,持续强 call
1、国内CAPEX竞赛:字节(豆包)→阿里&苹果→腾讯(微信+DS),国内互联网大厂的 CAPEX全面加速,腾讯的投资额暂时未知,但可以确定行业β是向上全面加速的状态。 2、海外仍是算力主战场,建议关注月底的NV业绩会,同时关注消息面的变化。 3、算力带动的基础设施投资海外国内都在加速,未来将是海外、国内交替演绎。 当前推荐思路: 1、弹性:【科华】卡位逻辑好;【盛弘]数据中心电能质量。 2、海外链高度相关:【麦米]【江海]【禾望],反应海外催化。 3、主业有支撑+AIDC增强:【明阳电气][宏
S
禾望电气
5
5
20
4.57
戈壁淘金
只买龙头的老司机
2025-02-19 09:14:37
【东方计算机】DS公开新注意力架构NSA,进一步推动推理端降本提速
[庆祝]DS昨天发布的论文提出了一种新的注意力机制 —NSA,核心思想是通过“稀疏化”注意力计算,减少不必要的计算量,同时保持模型性能。 [庆祝]#NSA进一步降低推理成本、提高推理速度 与传统注意力机制相比,NSA通过分层处理、选择性关注等方式,关注关键信息而非对每个词详细计算,从而减少计算开支,大幅提升长文本处理能力(处理64K文本时,前向计算和反向计算速度分别提升9倍和6倍)。 [庆祝]#NSA如在模型中应用,可加速在多场景AI落地 NSA在长文档、复杂推理、多轮对话和大规模数据处理任务中
S
优刻得
S
金山办公
7
7
11
2.62
戈壁淘金
只买龙头的老司机
2025-02-19 09:01:07
2月19日避雷针
2月19日避雷针
Screenshot_20250219_090019_com.baidu.searchbox_edit_45686250630007.jpg
S
贵州茅台
0
3
6
0.41
上一页
1
6
7
8
9
10
607
下一页
前往
页
戈壁淘金
只买龙头的老司机
2025-02-20 19:09:12
国泰君安-计算机行业:DeepSeek NSA架构引领AI效率革新
投资建议:DeepSeek发布NSA(Native Sparse Attention)相关论文,突破长文本处理瓶颈,低成本模型训练可行性推动AI大模型转向算法效率竞争。通过降低AI应用开发门槛,有望激发新一轮创新浪潮,最终加速AI在各行业的渗透,带动整个产业链升级,从基础设施到应用层都将会迎来新的发展机遇。推荐标的:鼎捷数智、福昕软件、神州数码、科大讯飞,受益标的:优刻得、海天瑞声。 NSA通过原生稀疏注意力机制在长上下文处理实现突破。长上下文处理是大模型发展的关键瓶颈之一,softmax架构中
S
鼎捷数智
S
优刻得
3
4
6
1.86
戈壁淘金
只买龙头的老司机
2025-02-20 14:42:25
Rokid (灵伴科技)AI眼镜相关概念股
在A 股市场中,与Rokid(灵伴科技)AI眼镜相关的个股主要可分为参股投资、业务合作及供应链这三类,具体情况如下: 一、参股投资 慈文传媒(002343) 通过子公司间接参股Rokid,并合作开发XR内容生态和文旅 AR 导览。 浙版传媒(601921) 通过春晓基金投资Rokid 3400万元,布局 AR数字出版与教育场景。 二、业务合作 博士眼镜(300622) 为Rokid 用户提供定制化视力矫正方案,解决近视适配问题。 亿道信息(001314) 与 Rokid 联合研发AR 空间计算产
S
明月镜片
50
11
21
7.22
戈壁淘金
只买龙头的老司机
2025-02-20 13:47:46
全志科技
全志科技
Screenshot_20250220_134642_com.tencent.mm_edit_110245747559740.jpg
S
全志科技
0
3
11
3.29
戈壁淘金
只买龙头的老司机
2025-02-20 12:53:35
xAI称Grok 3将免费提供,利好云计算
【xAI称Grok 3将免费提供】xAI宣布,世界上最智能的AI Grok 3,现在免费提供(直到我们的服务器不堪重负为止)。云计算雄起!
Screenshot_20250220_125037_com.wallstreetcn.news_edit_107365254333617.jpg
S
优刻得
S
青云科技
S
深信服
2
5
9
1.60
戈壁淘金
只买龙头的老司机
2025-02-20 09:17:36
重点关注DS出世企业软件的机会
各位领导好,调研发现企业和政府客户对 DS的热情高于软件厂商! 1、#银行、法院的私有部署一定要重视!我们新增覆盖了【京北方】PE估值仅30X+的银行IT公司,全面拥抱AI。可以详聊京北方的最新业务进展!根据最近的调研情况,银行是有资金实力也有强动力进行独立部署的机构,AI助业务的KPI指标下放到业务部门。法院比厂商对DS 更积极,大语言模型为法律而生,DS 部署后在法律问答的效果提升40-60%。标的:京北方、宇信科技、恒生电子、华宇软件、通达海、金桥信息等。 2、# 重大推荐【迈富时】,稀缺
S
京北方
S
博思软件
6
7
20
4.71
戈壁淘金
只买龙头的老司机
2025-02-20 08:27:13
2月20日避雷针
2月20日避雷针
Screenshot_20250220_082625_com.baidu.searchbox_edit_97874949226732.jpg
S
贵州茅台
1
3
8
1.32
戈壁淘金
只买龙头的老司机
2025-02-20 07:18:04
DS 带来新一轮云计算重估
1、[为什么DS 才是真正引领云计算重估的 23年一轮跟这轮的区别?]2019到2021年云计算行情高涨到现在,我们看到2022 年底 AI 主要是海外 OpenAl重塑全球格局,云开始进入云基建时代,大部分云厂商开始转型算力租赁,现在看来前期的摸索和准备或已进入落地期,2024年底-2025年国产模型全面启动,由此带来的国产模型成熟转向应用推理的过渡,真正刺激 BC端应用落地,训练转向推理,国产算力性价比优势凸显,算力门槛下降,数据的云端处理需求大幅度提升,云算力、运维调优能力凸显,与此同时云
S
优刻得
S
品高股份
S
首都在线
S
青云科技
11
14
25
5.05
戈壁淘金
只买龙头的老司机
2025-02-20 06:48:37
华创证券:DeepSeek 发布最新论文,大模型长文本推理革命
事项: 2025年2月18日,DeepSeek联手两大机构发布最新论文,研究由DeepSeek创始人梁文锋亲自领导,旨在优化Transformer注意力机制。论文提出了革命性注意力机制NSA,NSA是一种面向硬件且支持原生训练的稀疏注意力机制,专为超快长上下文训练与推理设计。它包含动态分层稀疏策略、粗粒度的token压缩和细粒度的token选择等核心组成部分,在通用、长文本、思维链推理基准测试中,刷新SOTA,碾压全注意力。NSA是对Transformer注意力机制的重大优化。 评论: NSA实
S
新致软件
S
鼎捷数智
S
深信服
S
汉得信息
S
泛微网络
7
7
10
3.10
戈壁淘金
只买龙头的老司机
2025-02-20 06:03:08
报道:DeepSeek考虑首次从外部融资
摘要:周三,据The Information报道,最近几周,包括阿里巴巴在内的众多实力雄厚的投资者对DeepSeek的下一阶段增长表现出浓厚兴趣。DeepSeek、阿里巴巴等未就最新消息回应。 周三,据The Information报道,DeepSeek考虑首次从外部融资。 DeepSeek迅速崛起,使这家中国人工智能初创公司面临一个重要的两难选择——是否要筹集资金: DeepSeek迄今尚未接受外部融资,部分原因是为了避免投资者施加压力,要求其过快地商业化产品。 不过伴随着其AI聊天机器人应用
S
每日互动
S
汉得信息
16
21
28
7.50
戈壁淘金
只买龙头的老司机
2025-02-19 19:15:05
浙商证券-深信服:“一朵云”平台进行面向AI的全方位升级
研报摘要 深信服此次升级不仅强化了其在AI基础设施领域的领先地位,更通过DeepSeek开源生态与AICP算力平台的深度整合,为行业提供了“高性能、低成本、易部署”的AI转型路径。未来,深信服有望成为企业级大模型部署的核心服务商,推动 AI技术从“可用”向“好用”迈进。 公司宣布对“一朵云”平台进行面向AI的全方位升级 公司在2025年2月17日的深信服核心合作伙伴论坛中宣布对“一朵云”平台进行面向AI的全方位升级,重点围绕大模型场景的智算承载、应用构建与成本优化展开。此次升级包含三大核心方向:
S
深信服
1
3
8
2.00
戈壁淘金
只买龙头的老司机
2025-02-19 17:13:50
长江证券-通信设备行业:Deepseek对运营商及产业链影响几何?
事件描述 近日,国内三大运营商,相继接入DeepSeek开源大模型,并在多场景、多产品中实现应用。中国电信天翼云自主研发的“息壤”智算平台为国内首家实现DeepSeek模型全栈国产化推理服务落地的运营商级云平台。中国移动的云平台针对 DeepSeek-R1模型特别定制了专属算力方案,为互联网企业创新与高效科研提供了高性价比的算力支持和开发环境。2月5日,中国联通公众号表示,联通云上架DeepSeek-R1系列模型,可在全国270+骨干云池预部署。 事件评论 充分受益于Deepseek出圈,运营商
S
奥飞数据
S
中兴通讯
7
4
13
2.99
戈壁淘金
只买龙头的老司机
2025-02-19 14:40:44
0219昇腾一体机交流要点
0219昇腾一体机交流要点: 1昇腾整体:DS对昇腾下游拉动需求较大,全年昇腾预计出货量75万-80万张之间,***b在35万,***c在45万整体目标;鲲鹏25全年预计130万颗,26年昇腾目标110万-120万区间; 结构:地方算力中心10万张,运营商20万,互联网40-45万,其中一体机形式在5-10万张左右(政企为主); 3deepseek一体机对于30家合作伙伴态度:H适配为主,出货、运维、微调合作伙伴为主; 4价格利润:1)售:价格目前价格不太会加,后面如果遇到交货困难,可能会加,D
S
云从科技
3
5
16
5.06
戈壁淘金
只买龙头的老司机
2025-02-19 14:29:33
AIDC:全年维度主线,持续强 call
1、国内CAPEX竞赛:字节(豆包)→阿里&苹果→腾讯(微信+DS),国内互联网大厂的 CAPEX全面加速,腾讯的投资额暂时未知,但可以确定行业β是向上全面加速的状态。 2、海外仍是算力主战场,建议关注月底的NV业绩会,同时关注消息面的变化。 3、算力带动的基础设施投资海外国内都在加速,未来将是海外、国内交替演绎。 当前推荐思路: 1、弹性:【科华】卡位逻辑好;【盛弘]数据中心电能质量。 2、海外链高度相关:【麦米]【江海]【禾望],反应海外催化。 3、主业有支撑+AIDC增强:【明阳电气][宏
S
禾望电气
5
5
20
4.57
戈壁淘金
只买龙头的老司机
2025-02-19 09:14:37
【东方计算机】DS公开新注意力架构NSA,进一步推动推理端降本提速
[庆祝]DS昨天发布的论文提出了一种新的注意力机制 —NSA,核心思想是通过“稀疏化”注意力计算,减少不必要的计算量,同时保持模型性能。 [庆祝]#NSA进一步降低推理成本、提高推理速度 与传统注意力机制相比,NSA通过分层处理、选择性关注等方式,关注关键信息而非对每个词详细计算,从而减少计算开支,大幅提升长文本处理能力(处理64K文本时,前向计算和反向计算速度分别提升9倍和6倍)。 [庆祝]#NSA如在模型中应用,可加速在多场景AI落地 NSA在长文档、复杂推理、多轮对话和大规模数据处理任务中
S
优刻得
S
金山办公
7
7
11
2.62
戈壁淘金
只买龙头的老司机
2025-02-19 09:01:07
2月19日避雷针
2月19日避雷针
Screenshot_20250219_090019_com.baidu.searchbox_edit_45686250630007.jpg
S
贵州茅台
0
3
6
0.41
上一页
1
6
7
8
9
10
607
下一页
前往
页
15
关注
53018
粉丝
134405.14
工分
社区规则
服务协议
隐私政策
沪ICP备20009443号
© 2020 上海韭研信息科技有限公司
关于韭研公社
问题反馈
有问题请联系
@韭菜团子
公社愿景:韭研公社,原韭菜公社,投资干货最多的共享社群,汇聚全网最深度的基本面研究,消弭个人滞后机构的逻辑鸿沟。
风险提示:韭研公社里任何网友的发言,都有其特定立场,均不构成投资建议,请投资者独立审慎决策。
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609