我们非常重视您的个人隐私,当您访问我们的网站时,请同意使用的所有cookie。有关个人数据处理的更多信息可访问《隐私政策》

400-090-9889

ChatGPT技术狂潮下,中关村科金在五个关键方向的深入思考

媒体报道
2023-03-10

ChatGPT热潮持续涌动,中关村科金作为国内领先的对话式AI技术解决方案提供商,对于“GPT”大规模语言模型在“chat”领域的发展动向和应用落地始终保持密切关注和深入探索。目前,中关村科金自研的多项对话式AI产品已在企业服务场景实现了众多应用落地。

中关村科金技术副总裁张杰表示,2023年中关村科金在对话式AI的技术布局重点在三个方面:预训练对话语言模型、会话分析和话术流程挖掘,同时关注AI技术的工程化、产品化问题。

在张杰看来,大规模语言模型展示出了强大的能力,例如思维链(Chain of Thought),这些能力可能只存在于大模型中,而不存在于百亿参数以下的小模型中。在不远的未来,更大参数量级的多模态语言模型可能会带来复杂推理能力的大量涌现。技术层面的量变,可能会引发应用层的质变,今年中关村科金将仔细研究这些能力在企服场景下能提供什么、会改变什么,尤其是领域知识如何低成本地注入到大模型里,使其具备可控的领域知识的问答和推理能力。

围绕ChatGPT相关热点问题,近期中关村科金与行业多家媒体聊了聊,ChatGPT技术狂潮下中关村科金在五个关键方向的深入思考。

ChatGPT的爆火原因与技术奇点

 2.jpg

中关村科金张杰:以前的机器人只能做简单且有限的事,比如聊天气、放音乐。ChatGPT可以说技术上的量变引起了效果上的质变,主要体现在三个方面:有上下文记忆能力,多轮对话衔接得很好,很难看出是机器生成的;有学习纠错能力,在它回答错误之后,如果你纠正了它,第二次就不会再答错;有思维链推理能力,具备一些常识知识,能做复杂一些的算数题。

ChatGPT的能力可以分成chat和GPT两部分,即上层的对话能力和底层的大规模语言模型能力。此外,ChatGPT还通过基于人类反馈的强化学习,使GPT能够记住之前的对话、承认错误、在连续的多轮对话中给人很顺畅的感觉。

3.jpg

中关村科金张杰:在ChatGPT背后起关键作用的是一种被称为大规模语言模型(Large Language Model,LLM)的东西,ChatGPT用的这款语言模型命名为GPT-3.5,GPT是生成式预训练(Generative Pre-Training)的缩写,目前的版本号是3.5版。此外,在GPT-3.5之上,ChatGPT还通过基于人类反馈的强化学习(Reinforcement Learning from Human Feedback,RLHF),使GPT能够记住之前的对话、承认错误、在连续的多轮对话中给人很顺畅的感觉。

4.jpg

中关村科金张杰:当年AlphaGo的推出就曾经引发过人们对于通过人工智能的讨论,之后很长一段时间大家都没有就具体的技术路线达成共识,也没有特别重要的突破。ChatGPT背后至关重要的组件是大规模语言模型(GPT-3.5),这次ChatGPT在效果上突破让人们充分认识到,大规模语言模型中除了常规的语言模型能力,还蕴含着世界知识、具备思维链推理能力,通过大模型在特定任务下的效果不比专用小模型差。ChatGPT的出现或许只是在通往强人工智能的路上撕开了一个小口子,未来可能会出现知识提炼能力和复杂推理能力更强的工具。

 5.jpg

中关村科金曹阳:现阶段的ChatGPT和元宇宙最火爆时比较类似,都是资本笃定的一个方向,国内外都如此认为,国内现在很多业界大牛都在考虑参与到这场竞赛当中,但是我觉得两者不一样,ChatGPT已经让大家能够看到目前是具备一定的实际应用价值,在商业转化上ChatGPT可能会发展的更好一些。

ChatGPT在金融领域的应用空间与难题挑战

6.jpg

中关村科金邓江:作为对话式AI技术的里程碑式的产品,ChatGPT可以说由技术上的量变引起了效果上的质变,让人惊艳的地方是上下文记忆能力让多轮对话衔接自然、学习纠错能力、思维链推理能力。其优异的对话能力,在金融领域对话的应用场景会很多,比如:外呼营销、客服中心、员工培训、虚拟营业厅等。这些前沿科技的应用进一步推动了金融业加大数智化转型的力度。

 7.jpg

中关村科金李国庆:中国版ChatGPT在金融领域的应用仍处于起步阶段。目前,类ChatGPT项目仍有问题待解。例如,由于金融业的复杂性,类ChatGPT项目的成熟应用首先要解决数据隐私及数据安全等难题,此外,还存在着领域知识不完备、生成内容可解释性不够、不符合业务逻辑、存在偏见等问题,这些都是类ChatGPT项目在金融领域大规模应用前有待解决的问题。

 8.jpg

中关村科金张杰:关于语言模型能力,除了生成对话、生成图片外,还带来的一个惊喜,就是涌现出了思维链推理能力,在提示下它可以将复杂的任务分解成一步步的子任务。这就大幅拓展了AI的应用范围,除了替代简单重复的体力劳动,还能替代简单重复的脑力劳动、辅助做一些复杂的脑力劳动、创造性工作。比如:营销文案撰写、根据文章自动配图。

在金融应用场景下不是简单的闲聊,机器人不仅要模拟真人回复,还要有领域知识的注入,要兼顾答案的准确性和可控性,不能“一本正经地胡说八道”。

ChatGPT引发的模式颠覆与秩序冲击

 9.jpg

中关村科金李国庆:ChatGPT能够很好地理解用户意图,有能力把一个大的复杂问题拆解成多个小的简单问题,再利用一定的推理能力形成一个更接近正确答案的回答。它会把自己掌握的信息组织成符合人类阅读习惯的答案,对人类特别友好,这个答案甚至是饱含善意的,和冷冰冰的搜索引擎截然不同。

另外,ChatGPT会给搜索引擎带来一场比较大的变革。微软发布ChatGPT之后股价大涨,谷歌为了应对挑战也推了自己的对话机器人,但是很遗憾在演示的时候出错了,导致它的股价大跌。一个涨一个跌,也反映了用户以及资本市场对新技术的期望。

现在谷歌毫无疑问是搜索引擎领域的老大,有着更大的用户群体和收入规模,微软和国内的搜索引擎目前所占的市场规模要小一些。但是更小规模的搜索引擎,在应用新技术、给自己的存量用户推新服务时,也会有一些独特优势,相比下投入的成本和资源要更少一些。

像谷歌,它现在要去决策做一些彻底的变革不是那么容易的,对于市场上其他搜索引擎来说,ChatGPT的出现可能会带来一个弯道超车的机会,这在历史上并不少见。一个新技术的出现,蕴含着重塑市场格局的巨大机会。

这是一方面,另一方面PC端和手机端的搜索引擎发展相对成熟,体验提升可能比较有限,在新形态的搜索方式上,ChatGPT会给其他赛道的玩家带来优势,比如音箱类的智能设备。

还有一点,搜索引擎的初心是帮助用户在互联网上找到有用信息,但是随着企业发展,规模不断变大,渐渐的搜索引擎有了两种不太一样的盈利模式。一个模式是尽可能精准的为用户提供搜索结果,最大化促成交易。另一种模式是广告主付费意愿越高,信息曝光的可能性越大。但ChatGPT能够以一种不同的方式去组织信息,有望帮用户找到更精准、更符合所需的答案,怎么将这种搜索方式跟现有的商业模式对应匹配,对于不同的企业来讲,可能是优势,也可能是劣势。

现在ChatGPT的英文版效果会比中文版要好很多,因为整个互联网空间内,英文语料数量比中文要多很多。对于英文搜索来讲,ChatGPT的出现就是一个优势。对于中文搜索引擎厂商来讲,如何面对拥有着非常高心理预期的用户群,去解决语料的不同,利用ChatGPT提供更好的中文搜索体验,是需要解决的问题。

 10.jpg

中关村科金李国庆:程序员更准确应该叫做软件工程师,岗位要求不是简单掌握一门程序设计语言,把代码写出来就结束了,还涉及到软件工具上的其他阶段,怎样把软件程序跟硬件结合,应用到具体的物理环境、真实世界中。

ChatGPT是一款更高阶的工具,OpenAI这样的企业可以用ChatGPT这样优秀的产品设计出更加高阶的软件,但是我觉得它不会消灭一个行业、一个工作岗位。有了ChatGPT这样一款比较好的工具,我们相当于站在巨人的肩膀上,能够更快的让自己成长。拥抱这种工具,更好的用这种工具,让我们有能力去解决更多更复杂的问题。就目前国家的数字化程度来说,还是有很多需要用软件方法去解决的问题,软件工程师有充足的工作机会。另外在追赶ChatGPT这种比较高阶的技术过程中,围绕算力、标注数据等,也会产生跟原来职位不同的工作机会。

全球新一轮AI竞赛开启

 11.jpg

中关村科金李国庆:可以从两个角度来看。一是现在国内做自然语言相关技术的创业公司和产品,很多是基于窄领域的语料生成一些非通用模型,跟ChatGPT有一些区别,但专用模型也会吸引到更多客户买单。

这类围绕专用窄领域知识的公司,如果能找到一个语料比较丰富的领域,和科技企业达成合作,相对也比较容易成功,这个时候应用国外的ChatGPT框架,或者是国内原生的知识中文框架去创新,都是没有问题的。但合作态度,或者开源意愿,也是影响企业选择的重要因素。

 12.jpg

中关村科金李国庆:目前,中国不少头部科技企业已经开始着手研发类似于ChatGPT的产品。实际上,近年来我国在自然语言处理和人工智能领域的研究及发展不断取得重大突破,在全球范围内已处于领先地位,在原始数据积累、人才储备、国家政策支持方面也占据上风。ChatGPT的成熟应用一方面要基于大量的底层数据和强大的算力支撑,另一方面也需要足够多的场景应用,而这些都是我国的显著优势。

国内ChatGPT产业化路径


 13.jpg

中关村科金李国庆:ChatGPT在国内想要实现同等水平还需要克服很多困难,像算力、数据、人才等等。我觉得国内可以两条腿走路,一方面是跟随路径,在这条已经走通的路上继续努力追赶,另一方面是国内工业生产产值最高,5G、IoT技术应用比较广泛,传感器数据的收集采集也比较丰富,可以尝试用不同于自然语言的语料数据去尝试,可能会有一些意想不到的效果。

 14.jpg

中关村科金张杰:ChatGPT在科技能力上涉及多个层面:芯片、算力、模型、工具、场景。科技巨头可以全链路布局,中小企业可以依据自身的资源禀赋构建竞争门槛。

对于芯片厂商而言,无疑会成为最大赢家。对于云计算厂商而言,大模型可能会成为标配,联手模型厂商以模型即服务(ModelasaService,MaaS)的方式盈利。工具层可能会越来越薄,除非能积累下大量的、跨场景的高质量数据。

这其中可能会遇到很多挑战,比如:如何在使用强大的通用模型和构建自己的垂直模型之间进行迭代,如何将通用无标注的大规模数据和领域小规模知识相结合,如何将领域事实知识注入到LLM中使得LLM的输出内容可控。

在目前的研究范式下,领域内高质量的标注数据+领域推理能力,两者如何形成“飞轮效应”是非常重要的问题。对于ToB类科技公司而言,技术并不是唯一的战略控制点,还是要认清自己的商业实质,在垂直细分领域下,形式化知识的技术路线并不一定会完全被大模型这类参数化的方式所取代。

 


方案咨询