3月18日,通用人工智能创业公司月之暗面宣布在大模型长上下文窗口技术上取得新的突破,其自研的Kimi智能助手已支持200万字超长无损上下文,并已开启产品内测。
根据机器之心数据显示,尚未上线的GPT-4.5 Turbo能同时能够处理约20万个单词,这意味着Kimi这次升级后长文本能力为其10倍,Kimi的长文本能力已经远超海外目前最先进的大模型,因此有机构称是国内应用的GPT时刻。
Kimi智能助手于2023年10月发布,凭借约20万汉字的无损上下文能力,帮助用户解锁了很多新的使用场景,包括专业学术论文的翻译和理解、辅助分析法律问题、快速理解API开发文档等,获得了良好的用户口碑和用户量的快速增长。数据显示,Kimi智能助手在效率(免费榜)排名从1月14日的436名提升至3月20日的10名。从访问量来看,Kimi智能助手的周度访问量由23年12月初的15万提升至近期(3.10-3.16)的超过200万。而随着访问量的持续增加,3月20日开始,Kimi助手因服务器流量承压一度无法使用。
Kimi智能助手宣布大模型正式进入“长文本时代”,是AGI进程中的又一“里程碑”事件。Kimi此次更新后支持的200万字的上下文意味着模型的文本理解容量有了本质变化,应用落地场景也有望扩大,AI应用端商业化进程有望持续加速。建议关注AI影视、AI传媒、AI游戏、AI教育、AI办公等AI应用方向,以及图书出版、优质视频等IP方向。此外,随着大模型不断升级,也将拉动国产算力需求持续旺盛。
Kimi智能助手横空出世,用户群体快速增长
2024年2月,月之暗面以15亿美金投前估值完成超10亿美元B轮,阿里领投,砺思资本、小红书等跟投,该笔交易完成后,月之暗面投后估值约25亿美元——由此,它成为中国大模型赛场上现阶段估值最高的一家独角兽。
据了解,月之暗面核心团队成员分别来自谷歌、Meta、亚马逊等全球科技巨头,整体团队包括了NLP、CV、RL、Infra等方面人才,做了很多有世界级影响力的工作。比如,在大模型方向,团队成员发明了RoPE相对位置编码,是Meta LLaMa和谷歌PALM等大多数主流模型的重要组成部分;发明了group normalization,是Stable Diffusion等AI模型成功的关键组件。创始人杨植麟本人以一作身份发表了XLNet与Transformer-XL,Transformer-XL成为首个全面超越RNN 的注意力语言模型,论文成为NeurIPS 2019与ACL 2019的最高引论文之一;XLNet则在20项任务上超越谷歌BERT模型。
2023年10月,Kimi智能助手正式发布,支持20万汉字无损级别上下文输入,是当时AI消费级产品支持上下文文本长度记录保持者。其主要功能包括1)长文总结和生成:通过提问和文件上传等功能,能够迅速对众多文献和报告进行摘要提炼;2)联网搜索:能够搜索实时信息,迅速整合并给出详尽回答,同时提供信息来源,确保对话的丰富性和准确性;3)数据处理:把繁杂的数据整理成表格,以助于数据分析,从而提高工作效率;4)编写代码:能帮助理解和编写代码;5)用户交互:Kimi智能助手提供了丰富多样的人格化聊天互动体验,可以扮演与名人对话;6)翻译:支持多语言互译功能,帮助实现无障碍沟通。
产品力提升促进口碑发酵,Kimi智能助手用户群体快速增长
Kimi是一款智能文本助手,其入口包括网页、App和微信小程序,重要的是,其面向全社会免费开放。Kimi基于出色的长上下文处理能力帮助用户解锁了专业学术论文的翻译和理解、辅助分析法律问题、快速理解API开发文档等众多应用场景,产品力的提升促进口碑发酵,用户群体快速增长。
根据SimilarWeb数据显示,去年12月Kimi的周访问量还在10万次上下,到了1月下旬才突破40万,但是从春节开始访问量疾速攀升,到现在周访问量已经超过160万次。从2024年2月18日至3月16日,Kimi的总访问量达到了539万次,这实现了日均浏览量近20万次的佳绩,这一指标反映了Kimi对用户的吸引力在增加。不过,同期国内大模型文心一言的总访问量达到1273万次,目前来看,Kimi的浏览量距离头部大模型的使用量还有一定的增长空间。
此外,根据七麦数据的资料,Kimi智能助手在各个手机平台的下载量自3月11日起迎来了显著的增长。截至2024年3月19日,Kimi智能助手的累计下载量已经突破了50万次大关,这一成就标志着Kimi智能助手在用户中的广泛认可和受欢迎程度。在过去的一周中,Kimi智能助手的日均下载量接近4万次,周环比提升4倍,这一数据不仅展示了Kimi智能助手在手机市场上的快速扩张,也预示着其在大模型领域的潜力和影响力正不断增强。但相对于文心一言过去一周日均14万的下载量,目前Kimi智能助手的用户量和影响力距离头部大模型还有一定差距。
全球首个支持200万字上下文的中文大模型,引领GPT时代新变革
3月18日,月之暗面Kimi智能助手启动200万字无损上下文内测,官方指出“过去要10000小时才能成为专家的领域,现在只需要10分钟,Kimi就能接近任何一个新领域的初级专家水平”。
暂定一个中文大概为2个token,也就是说Kimi已经支持400万token上下文输入,对比目前主流大模型:1)谷歌近期发布的Gemini 1.5 pro支持100万token输入;2)Claude3支持20万token输入;3)GPT-4 Turbo支持12.8万token输入。
根据机器之心数据显示,尚未上线的GPT-4.5 Turbo上下文窗口指定为25.6万个token,能同时能够处理约20万个单词,Kimi此次升级后长文本能力为其10倍。Kimi的长文本能力已经远超海外目前最先进的大模型,因此有机构称是国内应用的GPT时刻。
Kimi Chat产品在半年时间内,从2023年10月的20万汉字上下文能力,增长至200万字。同时在相同成本、相同设备情况下,模型的响应速度提升了3倍左右。与无损上下文能力相关的指令遵循能力和智能搜索功能均得益于文本的扩充,在实现多轮复杂对话、完成超长复杂指令、整合更多网页信息等方面表现提升。
如果把上下文长度理解成大模型的“精力”,那么现在Kimi能够一口气精读500个甚至更多数量的文件,帮助用户快速分析所有文件的内容,并且支持通过自然语言进行信息查询和筛选。在Kimi还是20万字输入长度的时候,它的能力界限还在50个文件左右。
AGI进程中,大模型上下文输入长度是关键之一
从word2vec到RNN、LSTM,再到Transformer,历史上所有的模型架构演进,本质上都是在提升有效的、无损的上下文长度。
对于更新后的Kimi大模型,月之暗面相信长文本技术是大模型“登月计划”的第一步,关于大模型幻觉的问题,实用价值低的问题,本质上都是因为困在文本长度的限制里。甚至模型微调也只是目前文本长度有限情况下的权宜之计。
根据华尔街见闻的报道,月之暗面创始人CEO杨植麟曾在之前的采访中表示“所有问题都是文本长度的问题。如果你有10亿的context length(上下文长度),今天看到的问题都不是问题”。
Kimi智能助手在长上下文窗口技术上持续迭代,无损上下文长度提升了一个数量级到200万字,是AGI进程中的又一“里程碑”事件。Kimi智能助手领先于其他同类产品,在复杂任务、长文档及长对话场景中或更具优势。
根据内测反馈,Kimi在卡牌游戏攻略、病症诊疗建议、财报分析解读、代码解析、人才资源筛选、文娱作品剧情分析等测试场景中均有良好表现。Kimi在内容端表现优异,中下游内容生成和创作有望得到进一步赋能。
潜在应用场景扩大化,2024年将是AI应用元年
相较于GPT-4可接受的文本输入长度约为2.4万个单词,Kimi此次更新后支持的200万字的上下文意味着模型的文本理解容量有了本质变化,应用落地场景也有望扩大,如:
(1)专业书籍Agent,长文本理解意味着模型可以联系整本专业书籍的知识进行直接交流,构建专业Agent模式的门槛得以降低,甚至实现跨领域(多本书籍)的联系和解读;
(2)IP衍生,大多数文学作品能够直接提供理解(《红楼梦》也就72万字),从而实现人物对话、书籍导读、解析等效果,也可以用于打通与其他AI生成功能如文生图、文生视频的联系;
(3)游戏、影视,可进一步辅助游戏策划或影视脚本环节的长文本设定(如世界观、人设、故事梗概)的理解,从而改进后续开发和拍摄的实现效果,也可直接用于智能NPC、AI剧本杀的设计。
随着应用场景的不断扩大,AI应用端商业化进程有望持续加速,2024年将是AI应用元年逐渐成为行业共识。
关注典型AI应用方向投资机会
AI赋能千行百业,场景应用遍地开花,典型如传媒、办公、教育、机器人、医疗、电商、金融、营销等方向。
从近期来看,3月13日,电广传媒旗下达晨财智完成对爱诗科技A1轮投资,爱诗科技海外版产品PixVerse于2024年1月正式上线,目前已是全球用户量最大的国产AI视频生成产品;3月13日,天图万境联合华为云推出AI声音生成工具SoraOpera,通过上传视频,即可自动生成四个不同风格的音效视频;3月15日,捷成股份发布了智能创作引擎ChatPV,能够自动化处理大量图片和视频素材,并根据用户输入的关键词,自动生成视频脚本、广告词、标题、分镜脚本等;3月19日,英伟达AI大会(GTC)上公布了完美世界游戏旗下MMO端游《诛仙世界》正式接入了英伟达Audio2Face技术。
随着国内外AI多模态大模型的持续突破及后续商业化,或大幅降低广告、课件、短剧、动画、剧集、电影、游戏等制作成本,提高IP开发、广告营销、教学效率、办公效率、游戏研发效率及体验,扩大商业化空间。
建议关注:
AI+影视:多模态大模型有望在创意发散、信息搜集、内容制作、宣发营销环节赋能影视内容创作。相关上市公司包括慈文传媒、华策影视、上海电影、光线传媒、超讯通信、因赛集团、中广天择、芒果超媒、捷成股份等。
AI+游戏:多模态大模型有望加速赋能游戏研发、发行等各环节,带来降本增效与商业化空间打开。相关上市公司包括汤姆猫、宝通科技、三七互娱、吉比特、巨人网络、姚记科技、盛天网络、完美世界、电魂网络、恺英网络、掌趣科技、神州泰岳、昆仑万维等。
AI+IP:大模型提升IP内容变现效率,驱动IP商业化价值提升。相关上市公司包括华策影视、上海电影、中文在线、奥飞娱乐、果麦文化、捷成股份、掌阅科技等。
AI+办公:大模型助力用户工作流程简化、效率提高,也带动相关产品基础ARPU(每用户平均收入)值提升。相关上市公司主要包括万兴科技、彩讯股份、福昕软件、金山办公、致远互联、鼎捷软件、泛微网络等。
AI+教育:多模态大模型有望降低课件制作成本,提高教学效率,同时,教育出版公司多数具备高股息率,AI教育叠加课后服务等打开成长空间。相关上市公司主要包括学大教育、中公教育、传智教育、科德教育、创业黑马、行动教育、国新文化、盛通股份、世纪天鸿、科大讯飞、南方传媒、凤凰传媒等。
AI+营销:营销垂类模型持续探索AI视频生成、智剪等,赋能广告营销降本提效。相关上市公司包括分众传媒、三人行、易点天下、蓝色光标、兆讯传媒、浙文互联、遥望科技等。
人形机器人:英伟达创始人兼CEO黄仁勋此前表示,AI下一个浪潮将是“具身智能”,即能理解、推理、并与物理世界互动的智能系统。AI大模型是人形机器人具备自主感知和决策能力的关键,人形机器人也是AI大模型原生应用的最佳实体,OpenAI、英伟达等公司一直处于Al变革前沿,随着这些公司的加入,AI赋能有望加快人形机器人产业商业化落地。关注减速器、伺服电机、传感器等核心零部件投资机会。相关上市公司主要包括中大力德、南方精工、丰立智能、新时达、步科股份、昊志机电、江苏雷利、鸣志电器、双环传动、柯力传感、奥比中光、五洲新春等。
此外,自3月20日以来Kimi智能助手因服务器流量承压一度无法使用,月之暗面宣布,自20日以来,Kimi的系统流量持续异常增高,流量增加的趋势远超预期规划。公司已经进行了5次扩容工作,推理资源会持续配合流量进行扩容,以尽量承载持续增长的用户量。Kimi的宕机也凸显了算力的紧张和重要性,未来在政策推动和技术催化下,国产算力建设速度仍将持续加快。个股方面包括高新发展、神州数码、拓维信息、中贝通信、四川长虹、浪潮信息、中科曙光、紫光股份、海光信息等。