每经特约评论员 盘和林

ChatGPT火了,从2022年下半年到2023年上半年,关于ChatGPT的讨论热度持续不减。持续的热度也带火了ChatGPT背后的公司OpenAI,1月23日微软宣布对OpenAI追加数十亿美元的投资,而美国数字媒体公司BuzzFeed宣布计划使用ChatGPT开发商OpenAI提供的人工智能技术来协助创作个性化内容。


【资料图】

ChatGPT带来的改变是什么?人工智能概念其实在上世纪50年代已经出现,但人工智能真正发展的时间只有20年,被大众认知的时间不足十年,一般认为本轮人工智能发展受益于三个客观条件:其一,算法变革。深度学习神经网络算法的优化,使得机器学习能力改善,能够更好地通过数据进行训练。其二,数据爆发。互联网带来数据爆发,互联网平台企业手中握有大量数据,算法是开采方式,那么数据就是石油。其三,算力提升。以GPU为主力的终端算力和以超算服务器为主力的云端算力,以算力堆叠的方式解决了算力瓶颈问题。

综合看,ChatGPT的成功关键是因为算法优化。算法的技术解析过于复杂,这里举几个例子:比如ChatGPT能够结合上下文语义来获取补充信息,传统人工智能是一问一答,或者超过几问几答,人工智能就忘记了之前的问题,但ChatGPT的问答是连续的,你能够通过回答ChatGPT问题的方式来补充信息,改善了人和AI答非所问的情况,可能一 开始你提的问题ChatGPT无法给出答案,但补充若干信息后,ChatGPT就理解了你的提问,给出有用的答案。上下文语义算法探索的不止OpenAI,但当前形成应用的,只有OpenAI。对于语义的整体把握是ChatGPT的算法优势,可以说是算法循序迭代的结果,从早期的GPT1.0到GPT3.0,再到ChatGPT,很显然OpenAI在算法上进行了数次迭代。

与此同时,和算法优化伴随而来的,是OpenAI数据积累方式的改善。前文提到,数据是AI发展的关键,AI有算法后需要学习,而AI使用人数增加,可以对AI学习产生正反馈,ChatGPT也要求试验人员对ChatGPT给出的答案进行评分,从而进一步加速了ChatGPT数据积累的过程。

所以ChatGPT已经形成正反馈。由于语义的理解能力增强,ChatGPT可以为内容创作者、论文作者、代码作者提供有效的帮助,而用户获得帮助的同时,也在不断加强ChatGPT的能力,帮助其成长。科技发展往往有一个奇点,一但越过奇点,科技将进入加速阶段。所以当前ChatGPT的热度是有道理的。

中国如何赶上ChatGPT的潮流?笔者认为,我们要做三点:

首先,要引入ChatGPT。ChatGPT是工具,在AI应用领域,其能够为自媒体和程序员提供很大的助力,这是生产力工具,是能够为我国经济带来效率的。

其次,我国需要ChatGPT的平替算法。我国有很多ChatGPT概念公司,这些公司大部分准备用ChatGPT算法为基础,来推出AI应用工具。但笔者希望这些企业关注两点:第一,未来ChatGPT可能要收费,如果没有自己的算法,容易受制于人。第二,我国并没有开放ChatGPT国内端口,即便开放端口,未来文化差异也会导致一些使用障碍。所以,企业要开发适合自身的算法来对ChatGPT进行替代。如果AI算法上没有突破,那么开发再多的AI应用也是没有意义的。

最后,我国要平衡好AIGC的监管规则。这里主要是两点:第一点是知识产权的问题。诸如绘图AI的作品会体现某位画家独有的风格,是因为AI在数据训练的时候输入了这位画家的一些作品,由于算法黑箱,AI的输出很难和输入的训练数据产生关联,比较合理的办法是在AI进行数据训练的时候就像数据来源方支付费用。第二点是输出内容的问题。AI如果输出了不合“公序良俗”的内容,谁来负责?负多少责任?由于AI开发企业也并非有意,内容的问题当然不能按主观错误进行处罚。

综上,ChatGPT已经成为生产力的一部分,对内容创作者,对程序员来说,已经成为生产力工具,而这也是当前硅谷大佬追捧ChatGPT的原因。不过,将视角转移到中国,我们还是会存在这样或者那样的问题,阻碍了中国类似优秀算法的出现。ChatGPT赶上谷歌搜索,可能还有一段路要走,但如果ChatGPT已经从玩具进化到工具,随着数据训练量级的提升,其追上各类搜索只是时间问题,这就使得我国在算法上的探索必须抓紧,否则怕是要在这个全新领域再次受制于人。

(作者系浙江大学国际联合商学院数字经济与金融创新研究中心联席主任、研究员,工信部信息通信经济专家委员会委员)

封面图片来源:视觉中国

关键词: 人工智能 受制于人 补充信息