一、AI技术对行业带来的改变
绝大部分(业务)全部来自于互联网广告,主要是以效果投放和算法为主的信息流投放,也就是负责帮客户进行下载与购买,这需要大量的程序员、优化师。我们的注册地在杭州,主要内容已经变成了互联网的数据和流量相关,也有自建的研发团队。
1、广告领域:承接范围及收入极大增加
在今年年初,AI领域出现了一些以人工智能的自动生成为主的新技术,在广告领域有较大的应用前景,尤其是在互联网效果类广告领域,原因在于该领域与传统广告的不同。传统广告以客户为导向,从客户处得到毛利率较高的订单,但是个人或公司的人脉、客情关系有限,无法承接大量客户。互联网广告特别是效果类广告,可以称为“接不完的客户”,问题在于是否有能力承接。对于我们来说,每年我们先与字节、腾讯等建立关系,之后它们会给我们推荐大量客户,这些客户要求达到一定的效果,需要做文案或者做投流。但是我们其实每年会放弃大约20亿到30亿收入,原因是没有相关的技术支撑这么大的数量。
现在有了AIGC技术,这一窗口得以打开。以前我们扩大收入规模的方式是并购,并购稳定的效果类广告客户的团队。但现在这种模式可能不再需要,因为可以直接承接这类存在于市场上的效果类广告订单而不需要通过并购增加人手,用AI技术批量生产相关文案及数据,达到增加收入和利润的效果。
这件事我们正在尝试中,可能需要一定时间但是前景很乐观。我们对近一年来投放的2.5万条互联网投流的文案数据使用AI模型,产生一些语言不够清晰等的小问题,但是我认为经过调校,预期在1到2个月之内能够产生一个商业化的,能用于内部互联网投流的小模型。
对于小模型,我们在与清华系的智谱华章合作,模型经过研发和测试展现出很强的能力,在三四年前已开始进行模型的神经链路训练,测试敏感数据的结果比较准确。下一步我们会与智谱华章深度合作,通过广告小模型用我们的数据专门进行互联网素材文案投流的制作。这样我们能够把原来每年放弃的大量订单重新承接,增加收益并在该领域不断扩张。因此我们很看好AI技术。
2、数字阅读领域:AI加速小说产出,革新行业逻辑
我们曾经收购过一个名叫掌微科技的企业,它帮助我们打通了数字阅读领域的渠道和链路,使得我们在这个行业有一席之地。以前这个行业“得版权者得天下”,掌阅、七猫等企业版权数量比较多,主要属于爽文这一领域,但现在我认为AIGC把各方又拉到了同一起跑线上。如果能把这些合作版权用于AI学习,它产出的小说其实质量不差,完全可以用于互联网文学的商业化,因此以后可能对于拥有版权的人不一定是利好得。对于任何行业内能获取到这些书籍的人来说,他们能够通过AI训练的方式达到类似的效果;未来如果我们在投流上能达到一定水平,可能在这个行业能够实现反超。
我们很看好模型对小说行业的改变。近几年阅读行业的垄断模式主要是签约作者,争取市场上的作者,竞争激烈。而智谱大模型会极大降低作者们的工作量。目前的小说行业,即使是顶尖的批量式生产的作者,日更达到15000字已经非常极限,一般情况是日更6000-9000甚至以下。而使用大模型后,列出提纲就能得到基本产出,在此基础上修改估计能将生产效率提高3-4倍;此外有很多想法很好但文笔一般的作者也能够得到引进。对我们来说,无论是文字生成文字,还是文字生成漫画,对旗下的掌阅这家公司有极大的帮助作用。大模型能够增强竞争力,也会变革整个行业,可能部分公司的领先度将没有那么高。
3、其他分支领域:衍生性产品
在其他延伸分支领域,包括小型游戏、直播带货虚拟人等,也会应用相关技术。对于虚拟人直播,抖音直播投流的成本比较高,主体费用在于雇佣,而且一般情况需要选择黄金时间段按小时记工资,但实际上顾客购买的需求时间线并不集中,而虚拟人直播可以在非黄金时间做到24小时直播。这类直播一般采取播一段、互动答疑一段的方式。同时,这类直播可以成为一个系列,比如旅游直播等,不需要很多实物而需要搭建虚拟人脸。
二、Q&A
Q:是否在向上的开发者或商品等方面有其他的模型的前端。
A:智谱的技术很先进,中大型的模型需要一定算力。我们希望能够利用我们在四川地区的资源对接四川超算成都中心,因为它的算力的富余较大,能够帮助支撑算力。做模型最大的压力之一是显卡价格高,花费多。四川有全国排名前列的超算中心,水电价格低,而且位于天府新区的八方腾泰公司附近。超算中心的控制率极高,目前算力估计控制在2/3以上。因此可以联合质谱对客户进行算力输出,用低成本输出算力。
智谱有一定的排他性,使用需要有研发接口。在整个广告行业中,有研发的公司不算多,在对接时我们会带研发总监派人在他们公司工作。智谱研究的是大模型,我们自己也在研发小模型,在技术上有一定的积累,因此对于将模型转化成可用工具我们非常有信心。这在最大的痛点比如素材、创意的方面能精简很多人力,预期精简50%以上。目前对内赋能的产出速度快,它的效果逐渐显现,因为模型的准确率需要训练的,经过训练越来越精准。
我们现在也在考虑,当解决内部人员复用率及轻量级之后,是否给行业输出,其成本比和代价,这是一个选择。
Q:智谱可以与其他公司合作,包括同类友商,在这种情况下与智谱的商业合作模式会是什么样的?
A:与智谱合作需要保证自己具有与人工智能大模型对接的能力,否则是无法解决完整的行业问题的。智谱能够作为基石在其上对接研发自己的产品,而不是完全照搬使用,但是在数字广告行业拥有足够研发能力的团队较少。而我们一直保留着研发团队,具有技术出身背景,能够在模型的基础上进行二次开发。因此如果其他公司想要与智谱合作,需要保证有相对的能力和技术才能够做到成型化与商业化。
Q:是否需要等待国家发放大模型牌照并获得牌照?
A:我们是使用别人的大模型改变自己,因此不需要牌照,模型的提供企业如智谱则会取得牌照,而在牌照发放之前的这段时间内各类大模型百花齐放发展。牌照发放相当于一种备案。在备案的窗口期,公司进行深度探索和开发;而在备案之后可能上线更多功能。
Q:与智谱的合作是否是排他的?
A:智谱的现有逻辑是在每个行业选择一个深度合作伙伴,我们是传媒领域的合作伙伴,可能在能源、信息安全等领域它有其他的合作伙伴。在传媒领域,随着我们提供的行业数据进入模型,数据积累慢慢积累,这个过程实质上形成了一种自然的排查。
Q:公司的数据有什么优势?
A:广告行业的数据量很大,我们是全行业数字营销,比如汽车类大消费品营销、数字阅读小说等全行业领域,因此我们的数据更加全面。我们深入能够行业里中获得这个行业所有的数据,包括我们自己的供应商和客户的数据,并且我们客户的多元性比较强。
在数据方面,我们做追踪系统是从13年开始,为教育、医疗、金融等行业提供追踪与签订系统、竞价与分析软件等,属于科技型公司。我们在之前存在的系统中收集数据,我们比如说用软件或系统与各个媒体对接。现在,我们对数据应用非常谨慎,注重合规。在数据上进行建模,再跑ROI,进行二次数据标注,利用客户资源进行时间积累是很重要的过程。
Q:与成都超算中心是什么样的关系?
A:在股权上没有合作,但是我们是他们招商引资的重点项目,给予更大的政策支持力度。比如子公司八方滕泰已经成为市级重点对象,纳入政府的考核指标。
Q:与智谱相比,对于百度文心一言的看法?
A:百度的文心一言基本上开放给它的核心代理商,开放一些API。我们帮助文心一言的测试,与之关系良好。将来如果百度模型开放,可能更多围绕百度搜索生态链开放给相应的周边客户而不是全盘开放。未来我们可能与百度深度合作,我们与之的研发关系很密切。
百度与智谱不同,智谱比较专,而百度较为通用,更为GC服务,作为AIGC的一个分支和方向发展。这需要一段的过程比如内部的测试,因此它可能会比智谱速度稍慢,但是未来也会有合作的机会。智谱是我们精心挑选的合作伙伴。
Q:数据方面在明确反馈上的优势?
A:本行业大部分的版权与作者合作,在拥有全行业版权的情况下需要数据与模型的先行一步。行业内的小说不难获取,因此核心在于怎样快速迭代,跑出一个可以商用化的网络小说,并使得迭代速度越来越快。我们拥有的小说数据对于模型来说是充裕的。
Q:未来各大科技公司都会拥有自己的生态,竞争会变得更加激烈,您如何看待这种趋势?
A:行业不停变化,而不是不停竞争,公司会不断更替,有企业兴起也会有企业没落。每个公司都会有自己的发展方向和专业领域,有些公司会选择通用性模型,有些公司则会更专注于某一项领域的模型,这取决于公司自身的战略规划。因此我们跟着科技的方向走,不惧怕竞争,AIGC仅是AGI的开始,沿着这条路延展,未来还会有无穷的变化。
Q:智谱与目前市场上的大模型相比的优势与壁垒?
A:各种模型也各有侧重,比如字节模型的出发点是推荐系统,百度的出发点是从搜索到通用。质谱的模型为AIGC服务,针对特定领域的模型,其优势在于专注,百度等公司则在更加综合的发展方向。但质谱也需要不断发展壮大,需要算力和资本的支持,如果得到这些支持,将会有更大的发展空间。
Q:目前市场上是否有比较好的AI小说出现?
A:目前无法让大众得知。一些内部的文档已经开始使用AI来改写,但不会对小说作特别分类,因为会产生读者付费意愿等问题。目前已经有AI产生的小说,通过提纲等生成,能够模仿文风等并且速度快效率高,这将降低小说写作的门槛。
Q:小说的大众化是否会产生同质化、质量下降等问题?
A:首先,这是一种打破垄断,可能小说进一步丰富,不必担心同质化,并且AI有规避重复规避版权问题的功能。第二,在训练时会有不同的文风,每个人二次开发的方向不同。在壁垒方面,首先市场上绝大多数消费小说对于知识的要求并不高,但是对更新速度的要求较高,需要AI实力使得小说更新能够追到读者阅读的速度,让读者不断付费。智谱在神经链路算法方面已有积累,现在尚且需要行业数据。对于我们而言,在小说方面先行一步,迭代速度会更快,追更的速度决定了收益。
Q:智谱是否具有文生图功能?
A:智谱的文生图叫做图形创作,具备这一功能。但是现在的难点是真人直接生成。漫画与剧本生成也在我们的预期规划之内。我们需要做相对自动化与半自动化批量化生产的系统。小说类的我们希望在一个月之内产生,漫画可能在一个半月到两个月左右,需要评估研发成本等,尚且不确定。
Q:与智谱合作的收费方式?
A:费用大约在百万级别,包括数据授权、私有化部署、算力购买等服务。付费方式是按年包的,但有一部分属于永久性,因为我们提供的数据没有年限。我们也会考虑再融资,希望能够通过再融资,包括自有的经营方式推动研发的发展。
Q:今年可能属于研发投入期,业绩压力比较大,明年是否会有比较明显的业绩释放?
A:明年会有集中释放,今年也会有一些,因为除了一些比较尖端应用,我们在比如效果类广告领域今年就会产生成果,因为我们承接了一些原来能力所限无法承接的客户。
Q:在这一过程的成本费用?
初步估计可能在500-1000万左右对的水平,包括算力、数据归集等工作,但是目前并不准确。我们尽量使用通用的方式,但是也会借用一些我们自己以及大股东的资源、服务器等。一般情况,模型训练未到一定量级时不需要GPT那样的性能,而广告数据达不到相当大量的数据,一般情况还要经过预处理,对机器性能的要求并没有那么大。
Q:智谱模型能够相当于GPT的哪一个版本?
A:目前对标GPT-3.5,可能在全面上尚未达到,在局部上已经可以对标。对于OpenAI,中国的逻辑与算法与欧美的投入模式不同,能够追得上半年乃至一年的差距在技术领域已经不错。智谱已经具有一定能力和水平,今年年底可能达到3.5以上的水平。与国外相比,国内需要更多创新。
Q:集团对此的考核要求和支持?
A:考核要求主要是利润和收入两个方面。支持主要分为三块:第一是本地生活,当地的文旅资源主要用于电商直播;第二,集团的背书使得我们更容易享受到政府政策;第三,我们资金成本得到下降,流动性贷款比较大。我认为今年的主体第一是收入,第二是铺研发,需要跑马圈地,在行业内的前端和先进端树立壁垒,将公司向科技方向转变。
Q:公司的调整目标与方向?
A:我们今年的重点方向就是在做公司组织架构的改变,让老业务转起来并孵化新业务,投资方向一方面是与我们相关的新媒体,比如小红书、B站,另一方面是AI与游戏。并做好股权架构的设计。
Q:公司的商业化落地计划是什么?
A:首先是在广告行业内,近期计划是用自己的广告文案编辑以及投流的模型,并可能会推广到全行业。第一步推广到我们参股的公司,它们会采购我们的应用产品;第二步在网络小说领域可能会形成一些新形式的网络小说以及一些网络小说生成的软件。这个推广输出过程需要一定时间。但是这种推广有边界,需要保持自己的核心竞争力,在主业上保持先进性。
Q:对于游戏的发展有何计划?
A:游戏在研发策划阶段,上海公司做的是游戏技术。但是今年仍然以主业广告为主,由于在投流方面积累的经验可能会尝试一下游戏,但不会是最主要的板块。我们会做一些比较小的高收益的游戏,与AI结合,因为研发成本对于我们来说还比较高,我们会以小型游戏为主。
Q:智谱在选择合作伙伴方面会考量哪些因素?
A:首先,他们比较倾向跟国资背景的合作,更安全,以及便于后续取得牌照。其次是执行力,我们执行力相对其他广告公司比较强。第三是对他们研发的模型的理解,我们的研发团队能够对接。因此我们可能是传媒领域较为合适的合作伙伴