资讯
展览资讯 大型展会 灯光节 大型盛典 赛事 中标捷报 产品快讯 热门话题 艺术节 活动 演出 新闻 数艺报道 俱乐部签约
观点
大咖专访 观点洞察 书籍推荐 吐槽 设计观点 企业访谈 问答 趋势创新 论文 职场方法 薪资报价 数艺专访
幕后
幕后故事 团队访谈 经验分享 解密 评测 数艺访谈
干货
设计方案 策划方案 素材资源 教程 文案资源 PPT下载 入门宝典 作品合集 产品手册 电子书 项目对接
  • 0
  • 0
  • 0

分享

星图比特张炯:低成本专属模型定制训练服务是刚需,未来会走向细分工作流AIGC的产品化

原创 2023-04-18



随着以ChatGPT为代表的预训练大模型展现出多产业应用可能性,国内大模型产品接连发布,围绕AIGC的探讨持续升温。

作为国内较早获得微软和OpenAI赞助的一家初创公司,星图比特在2022年就顺利接入OpenAI的API。公司目前位于上海漕河泾微软加速器。

成立于2015年的星图比特,是一家由上海树图区块链研究院与风语筑(603466.SH)联合投资的原生智能数字内容资产科技公司,主要业务为智能数字资产内容管理。目前,基于率先接入OpenAI API的先发优势,星图比特正为企业和机构提供细分模型定制服务。

作为一家目前同时接入OpenAI和部分国产大模型生态的初创公司,星图比特创始人张炯认为,现在到未来半年也是国内大厂的窗口期,虽然短期来说,国内去赶上和超越都很难,但从长期来说的话,国内的应用场景更多,数据生态更加完整,初创公司可能会更有机会。

作为国内区块链和生成式AI领域较早的从业者和接触者,张炯曾就职于IBM,长期服务大型金融机构。近期,由张炯主导编写的《一本书读懂AIGC》出版。他在书中提到,新的AI带来的是新的操作系统,这是一个时代的革命,会带来新的流量红利和机会。

张炯表示,AI模型可以提供很强的增效能力,并且具备固化自己公司核心业务的优势,未来星图比特的路径是产品化,目前产品正处于研发中。

星图比特创始人张炯

image.png

中文大模型开发仍面临三大难点

 Q  作为同时接入open AI和国内部分大模型的公司,你怎么看目前国内中文基准的大模型开发难点?

张炯:主要三个难点,三个核心问题。

第一是工程师,前几年国内的算法工程师基本上都以计算机视觉为主,CV代表的公司有商汤科技和旷视科技。现在很多从业者基本上也都是从CV计算机视觉领域转行而来。NLP跟CV本质上是两个体系,算法训练、模型建模对于CV算法工程师来说,也是一个新的领域,所以人才方面有很大的缺口。

第二,国外目前做AI训练最好的GPU商用硬件是英伟达高性能计算的A100、V100。但是A100、V100目前因为中美之间的问题而对国内禁售,国内只能买到A800和V800,它们在训练模型或者说算法的训练效率上来说是只有 A100和V100的1/2和1/3。所以同样的资源,国内硬件在成本消耗上更贵。

第三,训练的数据和语料。中文本身在语料的逻辑上来说不如英文。英文有词根词缀,但中文是象形文字,所以从语法的训练上来说中文难度更大。这也是前段时间百度文心一言的主要的争议点之一。我觉得可以把模型训练当成一个小孩的培养,比如说教学英文,基本上都是先教他3000个单词,然后他的单词认知量在阅读和工作的场景下会提到4000、5000、6000甚至更多。


  Q  你怎么看待AIGC的“进化”,对于企业来说应用成本上又会呈现怎样的变动趋势?

张炯:进化非常快,一般而言,我比较赞同OpenAI的CEO奥特曼的观点,即从2022年开始AI的迭代周期将遵循新的摩尔定律——基本上AI算力每18个月左右的时间会翻一番。AI的进化速度非常快,但仍受制于硬件的供给。

从成本上来说,通用模型在个人用户使用中成本可能会有一定下降,我坚信整个AI研发和运营成本会越来越低,通用大模型也会越来越便宜,但它的降幅是有限的,因为最终它要受制于硬件和电力的成本。

对于企业而言,必然会训练自己基于大模型的细分工作流模型,回归正常值的企业投资产出比,才能让AI在企业端长久的被使用。然后可能从1700亿个参数通过算法工程师优化至50亿参数,于是整个模型的运载效率和能耗成本都会大幅度地降低。模型参数越小,运行模型成本就越低。



image.png

可信AI将成未来主流
AI赛道门槛比互联网更高

  Q  如何看待国内公司在AIGC赛道的竞争力?

张炯:现在市场需求我觉得处在一个爆发的前期,现在其实也是给了国内这些大厂时间的窗口期,谁先出来谁就会占很大的市场,在未来半年是一个窗口期。模型经过一定时长的训练之后,表现会越来越好。模型表现处在一个爬坡期的过程当中,就会有越来越多的客户去接入。这也是国内纷纷抢先发布的原因。

虽然短期来说,国内去赶上和超越都很难,但从长期来说的话,我们的应用场景更多。我们这边的传统互联网的数据化做得更好,然后应用场景更多,长期的表现就放在可能5~10年。我们的表现其实会比他们要来的更强。

这一波AI,所有人都站在同一起跑线,对于大家来说,起跑线其实都是一样的,反而一些初创公司可能会更有机会,因为它的适配性更强,更加灵活,然后如果有很强的语料基础,基本上发展就会比较快。


  Q  如何看待AIGC后续的发展趋势?

张炯:首先我更关注的是可信AI和责任AI,因为现在基于transformer理论体系的 AI产品和应用都是离散式的。它生产出来的内容在很多时候不受人类控制,他可以胡说八道或者去引导人类做一些不该做的事。根本而言,AI没有伦理道德。所以未来基于控制论的可信AI和责任AI这两个理念会更多地被摆上主流技术界的研究和发展方向。

其次,商业化层面,因为在目前的AI赛道可能有很多初创公司创业,但是赛道的门槛其实比传统互联网的门槛高,核心点在于公司是否有自己的算法能力,但其实大部分公司只有产品工程能力,所以目前很多公司通过集成应用制作通用平台,但他们本身不具备算法。在商业化的领域,我相信可能在未来的一年或者两年时间会有一批公司倒掉,我也很关心整个行业的可持续发展的问题。


image.png

专属模型定制训练服务是刚需
星图比特未来发展路径是产品化

  Q  你的团队应该说是国内较早接触ChatGPT的团队之一,当时是在怎样契机下开始对接的?

张炯:我们作为一个初创公司,内部80%都是技术人员,剩下20%是公司运营。我们有算法工程师,但没有设计师,所以在业务过程中需要一些内容输出的时候,我们就用算法去解决设计的问题,这对于我们来说会比招个设计师更方便。后面我们就把解决设计问题的思路展现给了微软,并在去年6月份搬到微软加速器办公。


在2021年11月份的时候, OpenAI的API在微软云的market上线,那时候他们还缺乏生态,国内对它的关注度也没有那么高。

我们可能是国内在2022年11月以前唯一拿到OpenAI API接口的公司。现在申请基本上要排队,直到OpenAI开放账号才能获得使用权。但基本上国内的公司很难排到,因为OpenAI对国内的政策是比较保守的,对国内公司的支持力度没有像对海外公司支持力度这么大,所以就偏弱势,而且目前Open AI在微软云上获得的GPU资源也很紧张,所以对新的账号申请也是分批次开通。

所以从2022年11月份、12月份开始,随着AIGC热度骤增,我们开始把AI的能力以业务形式对外输出,因为很多公司有这方面的诉求。



  Q  星图比特怎么看 AIGC的应用前景,后续在AIGC上有怎样的规划?

张炯:截止3月,星图比特提供的主要服务还是企业端专属模型的定制训练服务。我们从2022年12月份开始推出到现在其实需求量是非常大的,大家都了解到AI模型可以提供很强的增效能力,而且更重要的一点是固化自己公司核心业务的优势。

举个例子,比如出版公司或一些泛内容公司,它最大的阻碍是人员流动所带来的内容产出的不稳定性,在公司成本固定的前提下,内容缩水会导致公司营收下降。而基于AI可以很好地把基于传统工作流的能力进行固化,通过模仿原作者内容给这些创作者灵感,从而保证内容作者产出的持续性。

因为接触的早,所以很早就对各个模型的能力有了比较深度的了解,之后我们也将根据各个模型的特性再研发我们自己的产品,未来路径肯定是产品化。目前文字处理的应用方向也是我们重点发展的方向,因为NLP自然语言处理是我们公司的在算法这个领域的核心能力。

Hello!

我们在为更加闭环、更加高效的服务模式做准备

欢迎加入限定白名单

与我们一起探索


abcf7556d340bb79f3c474250b86c851_640_wx_fmt=jpeg&wxfrom=5&wx_lazy=1&wx_co=1.jpg



5914325cebed6da7cef4566223bef922_640_wx_fmt=jpeg&wxfrom=5&wx_lazy=1&wx_co=1.jpg

阅读原文

* 文章为作者独立观点,不代表数艺网立场转载须知

本文内容由数艺网收录采集自微信公众号共同虚拟 ,并经数艺网进行了排版优化。转载此文章请在文章开头和结尾标注“作者”、“来源:数艺网” 并附上本页链接: 如您不希望被数艺网所收录,感觉到侵犯到了您的权益,请及时告知数艺网,我们表示诚挚的歉意,并及时处理或删除。

数字媒体艺术 新媒体艺术 科技艺术 AIGC ChatGPT

14274 举报
  0
登录| 注册 后参与评论