异动
登录注册
计算机行业点评报告:OpenAI发布Whisper API,再添新收费产品
发现牛股
中线波段的散户
2023-03-04 10:53:25

 北京时间3月2日,OpenAI宣布开放ChatGPTAPI,价格为每1000 tokens0.002美元,较GPT-3.5模型价格降低90%。同时,OpenAI还推出Whisper官方API,Whisper模型可实现语音-文本(Speech-to-Text)的跨模态任务,使用者可实现语音的转录和翻译,费用为每分钟0.006美元。

  投资要点

  微软宣布开放Whisper API接口,AI多模态进程加速

  1、Whisper支持语音转录和翻译两项功能并接受各种语音格式,模型中、英、法、德、意、日等主流语言上取得85%以上的准确率,完全符合工业准确率标准,未来有望打开商业化空间;

  2、Whisper模型根据参数量和语言不同,共有9种版本,可适应不同使用者的需求。在中文语料测试下,模型在语音识别、语气识别、自动断句等方面表现出色,可满足各类使用场景需求;

  3、多模态将成为AI大模型发展的重要趋势,Whisper模型在跨模态任务上的出色表现,有望为AI大模型多模态化发展奠定重要基础。

  Whisper模型拆解,性能优异应用场景丰富

  1、Whisper模型的编码/解码器架构仍基于Transformer,通过不同大小和类型的数据输入,实现模型的缩放性能,以及各项语音-文本任务的泛化性和鲁棒性;

  2、Whisper模型较之前的语音识别模型有多项改进,在识别准确率、断句、漏音等维度上均有显著优化。目前已有Speak为代表的产品使用Whisper API提升服务质量,未来看好Whisper在更多商业场景中的深度应用。

  投资建议:关注具备底层算法模型核心技术优势的厂商

  1、推荐标的:拓尔思(中文NLP龙头厂商),科大讯飞(智能语音处理及合成);

  2、建议关注:谷歌(DeepMind),微软(ChatGPT,Whisper),Meta(OPT模型),百度(“文心”模型),腾讯;

  风险提示

  1、AI技术迭代不及预期的风险;2、AI商业化产品发布不及预期;3、政策不确定性带来的风险;4、下游市场不确定性带来的风险;

作者利益披露:转载,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
拓尔思
S
科大讯飞
工分
2.43
转发
收藏
投诉
复制链接
分享到微信
有用 2
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
评论(1)
只看楼主
热度排序
最新发布
最新互动
  • 只看TA
    2023-03-04 17:26
    感谢
    0
    0
    打赏
    回复
    投诉
  • 1
前往