OpenAI发布ChatGPT背后是前两年OpenAI发布的GPT3.0技术,由于在GPT3.0技术上做了一些优化,所以ChatGPT又被认为是GPT3.5版本。在3月14日,OpenAI再次发布了新版本GPT4.0,并将其作为plus订阅服务发布,新版本再次掀起热潮,订阅支付通道一度拥堵瘫痪。
ChatGPT 一次又一次掀起热潮,是因为ChatGPT突破了人工智能应用瓶颈,未来以生成式AI为代表的人工智能产业将进入全面爆发阶段。
面对生成式AI热潮,四川要紧抓前沿科技发展机遇,将发展生成式AI作为四川实现高质量发展、实现科技弯道超车的重要应用方向,主动推动生成式AI产业的发展和进步,争做生成式AI发展的引领省份。
ChatGPT将带来生产力的变革
ChatGPT是生成式AI,通过机器学习让AI掌握一种能力,最终实现机器表达。而为了规范AI的行为,ChatGPT通过三步走来优化:第一步是利用海量语言数据来进行无监督学习,就好像鹦鹉学习人类讲话那样;第二步是利用海量标注的语言范例来进行监督学习,用人类的语言数据来规范GPT的回答模式;第三步是通过强化学习算法对GPT回答进行打分,这一方面让GPT的回答具有随机性,另一方面让GPT更大概率用最优的方式回答问题。
ChatGPT之所以引起轰动,主要原因有二:其一是GPT比过去的AI更智能,过去的AI是玩具,如今的AI是工具。ChatGPT根据用户的关键词提示,在理解语义的情况下,会不断追问要求用户补充信息,最终给予用户满意、符合人类逻辑的答案。其二是万物皆可GPT。ChatGPT不仅仅是聊天,它可以写代码、写文案,GPT-4的多模态模型中还加入读图功能,它也可以辅助搜索,同样的功能可以移植到办公软件领域,移植到医学领域,移植到新闻广告领域。可以说ChatGPT应用到一个行业领域,就会大大影响到一个产业。
综上两点,我们认为ChatGPT将带来生产力的变革。人类之所以站在地球生态系统顶端,关键在于人类知识可传承、可积累,而每个时代,人类都用不同工具来传承知识。原始和封建社会我们靠代代相传、口耳相传的知识传承和积累体系,而到工业革命,古登堡印刷机和造纸工业只是支撑了传承和积累体系,书本让工人成为先进生产力的代表。而到信息时代,互联网和存储芯片成为知识的重要载体,人类摆脱了知识匮乏的状态,但受限于人类的认知容量,信息时代人类面临的问题不是信息不足,而是信息过量过载,此时,诸如ChatGPT这样的生成式AI就是人类解决问题的钥匙。
万物皆可GPT,因为所有领域都可以用GPT来提升效率。人类将记忆性、重复性的工作交给GPT,而自己承担创造性的工作,这大大降低了人类创新创造的门槛。过去写软件需要数十年的编程学习,如今通过生成式AI,那些机械重复的代码,完全可以用AI去解决。有了生成式AI,人类将从重复劳动中解脱出来,将有限的生命投入到无限的创新创作、开拓进取当中。
四川发展生成式AI有自身优势
ChatGPT大火引爆生成式AI的产业机会,生成式AI发展的背后有三大基础:智算算力、高质量数据、大模型算法。当前,各省市都在围绕生成式AI展开产业竞争,发展生成式AI,四川有自身的一些优势:
四川尤其是成都创业氛围良好,对互联网、初创企业创造了良好的创业环境。成都2022年净增高新技术企业达3489家,较2021年有较大幅度增长。早在2015年,四川成都就推出了“创业天府”行动计划,在电子信息产业、传媒互联网、生物技术等新兴产业领域,成都一直居于全国各大城市的前列。
成渝地区双城经济圈建设为四川和成都经济发展提供了支持动力。成渝双城经济存在互补优势,重庆有较为突出的工业、金融业,成都有较为出色的科技初创企业,通过科技创新,成都的产业诸如数字经济可以和重庆的工业相互结合,形成数实融合发展态势,通过重庆的金融亦可以加大对成都初创企业的支持力度,以双城经济圈来带动成都创新发展。
四川有资源优势。四川是全国水力发电量最高的省份,其他能源资源、矿产资源也非常丰富,这让四川在发展算力方面具备很强的优势。国家“东数西算”提出建设成渝枢纽,但实际上成渝算“东数”,就四川来看,“西算”可以布局到除成都以外的其他城市,比如四川雅安就在着手建设数据中心。
四川具备发展生成式AI的人才优势。成都有多所院校开设“数据科学与大数据技术”专业,受益于过去重点发展软件外包业务的基础,当前成都聚集了不少大数据、人工智能、区块链领域专业人才。
综上,正是因为有如此条件,四川可以力求在生成式AI领域有所作为,并借发展生成式AI的契机,为四川培育一批高科技企业。
以算力基建数据产业为基点推进
政策层面,四川继续以包容性、支持性政策引入初创企业,尤其是AI领域企业。生成式AI 需要海量资本投入,比如有人估算ChatGPT的总投入高达40亿美元,单次数据训练的算力耗费都高达千万美元,所以生成式AI的确是一个烧钱的行业,初创企业需要资金支持。为解决初创企业资金不足的问题,四川可以考虑通过政府牵头,国企、民企跟投的方式来为生成式AI初创企业提供融资支持。所以政策层面的任务主要是两方面:一方面是保持,继续以包容性、支持性的政策吸引相关初创企业来四川创业,另一方面是以投资支持来扶持初创企业,助力其迅速壮大。
基建层面,抓紧“东数西算”中成渝枢纽的建设。这里要强调三点:其一,所说的算力是智算中心,是针对生成式AI的算力,而在算力基础设施之外,当前算力GPU等芯片领域依然是我国的短板,以智算基建为契机,四川可以引入更多芯片初创企业,壮大四川的芯片产业。其二,所说的“东数西算”,成都应该以数字经济发展为主,四川其他地市则可以着重布局数据中心。其三,算力供给会出现过剩的局面,可以考虑引入更多的云计算企业来合理调配资源,算力建设应该以企业推动为主,政府为参与算力建设的企业提供好能源、通信等基础配套,以防止算力供给过剩。
产业层面,生成式AI的产生需要一条完整的创新链条。产生生成式AI基于三大基础:算力、算法、数据。算法依托人才,算力依托基建,当前我国各地在算法和算力上都有长足进步,唯独数据,当前依然有很大的发展空间。生成式AI发展需要高质量数据。高质量数据需要经历多个环节,包括数据收集、数据筛选、数据处理、数据预标注。而预标注数据是规范生成式AI语言生成能力的重要资源。
在过去,数据标注企业是一个比较低端的产业,但低端产业亦有很大的发展空间,理由如下:第一,生成式AI对高质量数据提出要求,市场有了新的需求增量。而随着各大企业纷纷介入到大模型AI当中,未来标注数据、高质量数据需求将井喷式爆发,在这个情况下,数据标注企业的规模效应将逐渐显现。第二,数据标注企业亦可以做到差异化。数据标注早先采取人工标注方式,如今通过算法和其他技术手段,数据标注的智能度提升,行业壁垒也逐步提升。第三,数据标注企业可成长为数据经纪商。数据企业可细分为具备数据资源的平台和面向数据需求的经纪商。经纪商从客户获得需求订单,通过数据平台购买等方式最终向客户提供数据产品。生成式AI 需要高质量数据,而当前大数据时代正逐渐从数据粗加工转向数据精加工。而实现数据精加工的企业,就是数据经纪商。四川在发展生成式AI方面,要尤其重视数据要素产业的发展。而发展数据要素产业的侧重点,就是培育本土的数据经纪商。培育本土数据经纪商的基础,可以通过引入更多的数据标注工厂来实现。现阶段较为低端的数据标注业务,相信未来会逐渐走向高端,从规模化走向差异化。
综上,从四川的优势出发,四川可以算力基建、数据产业为基点,推进四川生成式AI产业的发展。与此同时,算力基建和数据产业也将在其他方面为四川数实融合、数据要素价值释放提供更好的支撑作用,从而推动四川数字产业实现高质量发展。