中关村科金张杰:对话式AI,大规模语言模型展示出强大能力|展望2023
去年11月30日,对话式AI ChatGPT横空出世,刷爆社交圈,火出了天际,5天内便拥有了百万用户,推出它的OpenAI更是水涨船高。据外媒报道,微软有意向OpenAI投资100亿美元,OpenAI估值将达290亿美元。实际上,在ChatGPT背后起至关重要作用的是一种被称为大型语言模型的人工智能(AI)程序,它的出现一并带火了对话式AI赛道。
中关村科金是中国对话式AI技术解决方案提供商,ITPUB&IT168日前采访了中关村科金技术副总裁张杰,对其所关注的AI技术进行了回顾与展望。
回顾2022年对话式AI的发展趋势,可以拆分为多模态和大规模语言模型两个子方向来看。
多模态技术走入下沉市场
据张杰观察,多模态技术正在逐渐走入下沉市场、垂直细分场景,如方言ASR(自动语音识别)、领域ASR、特定动作识别等。通用的模型往往不满足商业应用,定制化的模型往往开发成本高。对于甲方而言,既不想数据外发、又不想对乙方过于依赖;对于乙方而言,定制化开发模型的方式既难以大规模推广、又无利可图。中关村科金针对领域化、定制化的市场需求,投入研发零代码的、可在线自训练的模型优化工具,甲方业务人员可以自行更新迭代模型,解决双方顾虑。
大规模语言模型商业前景巨大
大规模语言模型的热度正旺,已经火出了技术圈。张杰谈到了技术发展趋势,他认为2023年会出现更多的大规模语言模型,它们将助推底层科技公司的模型即服务(Model as a Service,MaaS)的商业模式。另外,对于处于中间层的科技公司而言,它们将围绕大模型所涌现出的复杂推理能力,挖掘出更多令人震撼的应用。
大模型的上层商用场景有着丰富的想象空间,在国内很多企业讲数字化转型过程中如何用AI替代简单重复性劳动的时候,AI已经开始画插画、写代码了,插画师、媒体工作者、甚至是程序员,这些从事创造性工作的人都已经面临AI的冲击。AI技术在短期内,起码会对搜索引擎、广告点击产生影响。未来,AI的生成能力如果再加上逻辑推理能力,可能会生成高质量的营销文案、办公文档、短视频等,这对于国内挣扎在ToB赛道上的科技公司而言,是个不容错过的大机遇。中关村科金重点关注对话式AI如何在企业服务赛道上落地,例如:通过AI生成营销文案、7*24小时在线回答客户咨询、模拟真实业务场景的新员工沉浸式陪练、以数字人的形态在线办理业务。
对话式AI对于企业客户的价值
关于对话式AI在企业级的应用,张杰指出企业客户的需求,主要有以下几类:
1、 业务增长需求:大部分客户都会有此类需求,客户关注系统对最终用户的意向识别准确率,以及业务转化效果。此类产品有时是外呼机器人、有时是销售助手的形式。
2、 降本增效需求:大多出现在客服中心场景下,目标是替代坐席、降低投诉、或者是带来二次营销的机会。
3、 员工培训需求:有些线下连锁零售、劳动力密集型行业的客户,面临招工难、流失率高的挑战,如何使新员工快速获得技能、降低培训成本是他们重点考虑的问题,要求产品低成本的构建知识库、针对员工做个性化的复盘分析报告。
4、 平台建设需求:这类客户往往是金融机构或行业龙头企业,之前已经落地过多个AI项目,意识到要在平台层做能力拉通,避免“建烟囱”和“重复造轮子”。
企业客户在产品选型时一般会关注以下几方面:
1、 产品功能与业务需求的匹配度:产品的功能不是越多越好、越灵活越好,太多功能需要客户去配置的话,反而影响使用时的便捷性。
2、 AI模型的性能:性能体现在多个方面,客户会根据自身的人力状况和经营策略,在模型的准确度、覆盖度、响应时效、算力消耗等方面做取舍。
3、 是否预置行业知识:行业内的中小微客户,可能会希望厂商具备行业经验,预置一些模型、话术、模板。
4、 系统的常规需求,如稳定性、可靠性、实效性、安全性等。
2023年中关村科金的技术布局
展望2023年,中关村科金对于对话式AI将会做什么样的技术布局?张杰表示,研发重点将会放在三个方面:预训练对话语言模型、会话分析和话术流程挖掘。同时,关注AI技术的工程化、产品化问题。
1、 预训练对话语言模型:大规模语言模型展示出了强大的能力,例如思维链(Chain of Thought),这些能力可能只存在于大模型中,而不存在于百亿参数以下的小模型中。在不远的未来,更大参数量级的多模态语言模型可能会带来复杂推理能力的大量涌现。技术层面的量变,可能会引发应用层的质变,今年张杰团队将仔细研究这些能力在企服场景下能提供什么、会改变什么,尤其是领域知识如何低成本地注入到大模型里,使其具备可控的领域知识的问答和推理能力。
2、 会话分析:领域知识关注事实知识,会话分析关注行为意图。中关村科金仍将沿用基于真实数据的统计分析的方法,挖掘出对话中常见的行为模式,用于话轮设计。ChatGPT未来可能在内容营销、文章写作、绘画生成等方面产生巨大的商业价值,但其背后是语言模型,是语料上的条件概率,因此可能会出现生成文本不可控、多轮之间不可解释的情况,即大家常说的“一本正经的胡说八道”。企服场景下的对话任务所面临的问题不一样,不是在一个语料上学出一个条件概率的问题,而是要找出处于头部的小概率的最 佳实践。
3、 话术流程挖掘:在流程挖掘子领域,国外有些初创公司发展的很好,尤其是结合RPA,应用生产流程或审批流程的优化上,有很好的落地。但国内仍处于起步阶段。中关村科金研究的流程挖掘与之不同,主要处理对话语料,将对话序列做事件切分,然后从事件序列中找到话术流程的最 佳实践、或者做流程一致性校验。
关于AI工程化,张杰指出,AI技术除了要做的足够智能,还要做的足够简单,让下游系统甚至业务人员容易使用才行,否则也会难以发挥应有的价值。中关村科金在AI工程化方面会重点投入在三个方面:
1、零代码:面向不懂算法但有一定IT基础的人员,如项目交付人员或运维人员,他们经过简单培训后就可以根据特定语料定制化模型。
2、 自更新:模型可以线上环境不断积累语料,持续地自我更新,适应线上语料特征迁移的情况。
3、 可感受:AI技术带来的增量价值要让客户直观的感受到。首先,要“前后可比较”,有严谨的方法、明确的业务目标,使其具备可比较性。然后,要“流程可闭环”,AI技术带来的效果往往不是一蹴而就、一劳永逸的,需要不断迭代,让业务结果反馈到产品中,形成正循环。
总之,AI工程化的目的就是,不仅降低业务场景中的重复性劳动,还能降低模型开发与运维本身的成本。AI工具越简单,使用范围才能越广。