火博体育多技术融合推动元宇宙应用破局向前
发布时间:2023-03-19 10:41:37

  随着传统互联网向Web3.0的跃进、数字化水平的提高以及XR、人机交互等硬科技设备的不断涌现,元宇宙的构建变得更加趋于可行。国家在十四五规划中也提及元宇宙,指出需要加强元宇宙底层核心技术基础能力的前瞻研发,推进深化感知交互的新型终端研制和系统化的虚拟内容建设,探索行业应用。泛娱乐、工业元宇宙、数字文旅、混合办公等元宇宙的应用开始逐步推动落地。

  与此同时,由于元宇宙的技术支撑体系非常庞杂,需要5G/6G、人工智能、云计算、区块链、物联网、三维建模与渲染等诸多技术的深度融合,甚至还需要全息显示、脑机接口等技术做支撑,而各条技术线发展的成熟度存在明显差异,元宇宙作为技术集大成的应用形态,其发展势必需要一个相对长期的过程。

  随着AIGC技术取得重大突破,作为元宇宙引擎层的一项重要组成部分,可极大促进元宇宙高质量内容的生成,以AIGC、三维图形图像引擎为代表的关键技术的突破,将为元宇宙的落地提供新动能。

  在此背景下,为了帮助各行业了解元宇宙落地过程中遇到的难点与挑战,以及当前的优质厂商,2023年3月17日,爱分析正式发布《2023爱分析·元宇宙实践报告》。

  工业元宇宙,作为元宇宙+产业应用的典型代表,工信部也于2022年牵头发布了发布《工业元宇宙创新发展三年行动计划(2022-2025年)》,显示了政策层面对工业元宇宙的重视与支持。工业元宇宙可以让工业现场、价值链处于数字化及可视化的状态,有助于打破工业生产现场的物理空间与时间限制,扩大信息获取的范围、效率,并且可进行模拟试错,对工业企业提升作业效率、降本增效意义重大。但受限于技术体系复杂、标准尚不统一等问题,工业元宇宙目前的应用广度和深度仍旧相对有限。

  产业界目前主要从工业现场的数据采集清洗与分析、展现以及XR设备实现虚实互动、数字孪生进行虚实融合等维度展开应用实践。借助数字孪生尤其是国产化的图形图像显示与交互技术,不仅有助于强化工业元宇宙的关键技术储备,还有助于增强技术自主可控性,降低数据安全风险,从而为更多价值链环节、更多行业场景提供应用价值。

  数字人,是融合人的外形、思维、行为三要素的数字化载体,是技术与场景深度融合的综合产物。伴随着元宇宙、Web3时代的迎面而来,数字人不仅有望成为下一代互联网人机交互的重要入口,承担信息传递、实时交互的重要职责,还将随着应用的持续深入,成为人类在虚拟世界中的重要的数字资产甚至是情感连接纽带。目前主要在AI新闻播报、智能陪护、智能助理、直播带货等场景,已服务于诸多行业应用领域,有助于低人力成本,提升了服务的人性化程度、智能化。但目前仍旧面临智能化程度不足、制作及运营成本高昂、商业化落地情况不佳问题,本质上是技术与产品,尚未在场景端形成深入、可持续的应用价值和交互体验。

  鉴于此,业界目前也在积极从单点突破、一体化解决方案两方面进行尝试。一方面,寻求在建模、动作捕捉、驱动、渲染等环节的单环节优化方案;另一方面,以百度、华为、商汤科技等为代表的业界大厂也在不断尝试将数字人的整个创建、智能交互甚至运营环节打通,形成一站式数字人解决方案平台。随着人工智能技术的快速发展,尤其是AIGC技术的突破,将有望从制作成本、交互智能化与体验方面给数字人的制作与应用带来实质性改观,帮助数字人深入场景,扎根成长,促进数字人行业的健康、快速、可持续发展。

  元宇宙作为下一代互联网的典型代表,很可能将是人类数字化生存的终极形态,将带来更高维的信息密度和数据价值。从技术构成来看,元宇宙包括基础设施层、引擎层、交互入口层和应用层。工业元宇宙、数字人则是元宇宙在落地应用中最为热门的两大领域。具体如下:

  首先,工业元宇宙,作为元宇宙上层应用场景的典型代表,一直以来都是元宇宙落地的热门方向,工信部也于2022年牵头发布了发布《工业元宇宙创新发展三年行动计划(2022-2025年)》,显示了政策层面对工业元宇宙的重视与支持。工业元宇宙可以让工业现场、价值链处于数字化及可视化状态,有助于打破工业生产现场的物理空间与时间限制,扩大信息获取的范围、提升信息获取的时效性,还可进行模拟试错,对工业企业降本增效、提升作业效率意义重大。但受限于技术体系复杂、标准尚不统一等问题,工业元宇宙目前的应用广度和深度仍旧相对有限。借助数字孪生尤其是国产化的图形图像显示与交互技术,不仅有助于强化工业元宇宙的关键技术储备,还有助于增强技术自主可控性,降低数据安全风险,从而为更多价值链环节、更多行业场景提供应用价值。

  其次,数字人,是融合人的外形、思维、行为三要素的数字化载体,有望成为下一代互联网人机交互的重要入口,承担着信息传递、实时交互的重要职责,甚至随着应用的持续深入,数字人还将成为人类在虚拟世界中的重要的数字资产甚至是情感连接纽带。但数字人目前面临智能化程度不足、制作及运营成本高昂、商业化落地情况不佳等问题,本质上是技术与产品,尚未在场景端形成深入、可持续的应用价值和良好交互体验。随着人工智能技术的快速发展,尤其是AIGC技术的突破,将有望从制作成本、交互智能化与体验方面给数字人行业带来实质性改观,帮助数字人深入场景,扎根成长,促进数字人行业的健康、快速、可持续发展。

  综上,本报告选取工业元宇宙、数字人两个市场作为重点研究对象,围绕相关组织的元宇宙应用实践展开研究。

  工业元宇宙是指面向工业企业降本增效、提升作业效率等需求,在新一代信息技术引领下,借助物联网、数字孪生、人工智能、自然交互、区块链等各类新技术群的融合,通过对设备、产线等要素的数字孪生镜像构建,实现工业企业全价值链的虚实融合,赋能工业企业的研发设计、工艺流程管控、设备运维、仿真测试、售后培训等全链条场景,助力工业制造、建筑工程、能源、交通、航空航天等领域企业的智能应用深化和效能提升。其本质是元宇宙在工业领域的垂直化应用,是数实融合发展的新型载体。

  从发展过程来看,参考《工业元宇宙创新发展三年行动计划(2022-2025)》并结合爱分析调研,横向角度,工业元宇宙已在工业的研发、生产、管理、销售、实训等阶段有不同程度应用;纵向角度,工业元宇宙已实现设备、产线、工厂甚至产业链级的应用,对企业提质降本增效、服务产业链治理与供应链优化起到了重要作用。

  src=从技术构成来看,首先,工业元宇宙,需要高效基础的网络和算力等基础设施来有效支撑大范围的工业级数据的采集与运算,将工业现场各部分业务系统的数据快速融合起来,再配合上述基础设施进行实时、更深层次的分析处理,进而形成工业元宇宙的底层物理环境。其次,需要SCADA(数据采集与监视控制系统)、DCS(分散控制系统)等工业控制系统及CADCAE传统工业软件,主要实现各项设备及生产数据的采集以及生产过程的自动化控制与执行,是工业元宇宙信息采集、虚实交互的重要支撑;再次,需要人工智能技术,利用算法模型将所采集的数据进行数字化的模拟、推演去提升传统工业软件的模拟速度与精度,甚至可以做一些预测性的维护预警。最后,图形图像显示与交互技术,主要是通过与物理实体环境的连接,获取现场实时数据并予以可视化,同时与CAD、CAE等传统工业软件进行交叉融合,在数字空间内完成工业生产现场的镜像生成及交互操作,可极大提升信息密度、创新工业现场管理模式。

  从应用实践来看,国外类似达索等一些老牌工业企业、Autodesk等设计软件公司,之前也曾介入到工业元宇宙中来,但这些企业,尤其是老牌工业企业,其更多是基于多年来积淀而来的行业经验,通过与一些新兴的技术的融合,面向集团内部所进行的一些方案创新,到后来才对外输出一些整体化解决方案。由于涉及到的技术领域复杂繁多,在国内,能够提供全套的、比较完整方案的机构,目前还相对比较少。

  工业元宇宙的发展,其背后,本质上反应的是工业发展的完整历程,即从机械化、电气化、信息化到目前的数字化与智能化时代。工业元宇宙即是数字化与智能化大背景下,依托多技术群对提升工业生产及管控效能目标的一个复杂、系统化落地的过程,整体在国内还处于相对初级的阶段。

  1) 技术储备仍旧不足。工业元宇宙需要硬件设施、基础软件、虚拟平台、内容生产、人工智能图形图像显示与交互等多种技术的深刻融合,国内目前在基础软件、人工智能、图形图像显示与交互等关键技术方面,仍旧存在短板,且技术间的深度融合仍需突破。

  2) 缺乏统一的标准体系。国内的工业元宇宙起步相对晚,应用也并不广泛,目前还缺乏诸如标准化路线图、技术架构标准、数据接口协议及标准等均还缺乏完备的标准体系,从架构搭建、数据获取两大维度对国内元宇宙的发展形成了制约。

  3) 数据安全问题突出。国内的很多基础工业软件,都依赖国外供应商,但工业生产领域,会涉及大量工业企业的关键核心数据,在当前的国际竞争环境下,数据安全问题显得尤为突出。

  4) 应用场景的广度及深度相对有限。无论是横向的价值链维度还是面向不同行业,国内的工业元宇宙应用还相对初级,虽然在产品的数字化设计、重大设备及产线管理、城市管理等方面已有不同程度的应用,但还是需要在政策、产业界的持续推动下,往工业制造、冶金、港口、航空航天、能源、交通等领域纵深发展,同时往研发制造、生产、销售、培训等环节不断拓展,加深仿真测试、设备及产线运维、自动驾驶等更丰富场景的应用。

  1) 工业现场的数据采集清洗与分析、展现:由于工业生产现场设备类型和种类繁多,不同设备的型号及通信协议存在差异,通过打通协议、安装传感器等方式,将各类物理设备数据的基础数据进行采集,然后通过大数据技术进行数据清洗,最后以二维图表的形式进行实时展现,便于企业管理者对工业生产的各方面、各部门数据进行分析挖掘、有效决策。

  2) XR设备及配套系统进行虚实互动:利用XR设备作为交互平台,借助通信网络,让后台工程师团队、后台知识库能够与前端XR设备进行信息的实时交互,以远程协助方式,提升现场作业人员的作业效率。

  3) 数字孪生实现虚实融合:通过数字孪生、图形图像显示与交互技术,对建筑、厂房、产线、设备进行高精度的复刻,形成数字镜像,实现物理世界与虚拟世界之间的映射、重构;同时通过IoT平台等方式,实时接入物理世界的真实数据,通过虚实交互融合,进行分析、模拟、推演,从而实现更好的感知、试错、预测以及反控,实现数与实深度融合。随着部分厂商在图形图像显示与交互技术领域的技术国产化突破,将有助于我国在工业元宇宙领域的技术储备的提升,加速行业应用,逐步应对数据安全问题。

  用友网络,是全球领先的企业服务提供商,为企业及公共组织提供数字化、智能化服务,推动产业转型升级。用友网络为工业、医疗、建筑、能源、金融等多个行业提供软件产品及云服务,内容覆盖营销、采购、制造、供应链、财务、人力、协同等组织全价值链环节,不仅为客户提供本土化的业务管理系统,还提供专业的工业控制系统,拥有庞大的客户基数。多年来,用友网络持续发挥自身优势,结合众多战略合作伙伴的资源能力,加速我国传统产业数智化转型升级。

  近年来,随着数字技术的发展,尤其是数字孪生、数据可视化、大数据和人工智能等新兴技术在工业领域的创新应用,众多工业企业都希望通过数字技术提升自身的数字化转型效率。用友网络的设备制造商客户(以下简称合作伙伴)也需要顺应终端工业企业客户的业务数字化转型发展趋势,提供相应产品与服务。合作伙伴在顺应趋势发展升级自身服务能力的时候,面临以下主要需求痛点:

  1. 传统产品无法适应终端工业企业需求升级。工业企业的作业现场,传统模式下,产线、设备的管控效率相对较低,存在时滞性和信息盲区,管理者无法掌控全局,不能实时做出最优决策,潜在风险大,因此终端工业企业客户希望在实体设备交付之时,在设备之外,设备制造商能够提供一个该设备相应的数字孪生体,以便利用该设备的数字原生体在虚拟空间快速的搭建生产环境,或基于实时数据去监控物理设备的实时运转状态。

  2. 实际业务应用对数字孪生的技术、产品、成本提出高要求。首先,终端客户需要将设备及其数字孪生体应用于实际生产环节,且涉及大量核心生产数据,需要数字孪生技术足够先进、成熟且技术自主可控;其次,设备制造商通常会有多条产品线及大量设备需要交付,传统高度依赖人工的项目式交付,无法保证交付效率,且性价比低;最后,在全生命周期视角下,设备制造商需要数字孪生服务商的产品快速交付、快速部署、灵活拓展,使得给到最终客户端的增加的边际成本相对可控,且支持终端客户的业务创新。

  3. 终端客户培训模式亟待变革。很多大型工业设备,都属于高净值设备,基于实体设备进行培训,有一定的操作风险,并且设备损耗较高,培训规模受限,整体培训成本高昂;而传统的录播方式,无法基于设备的实时状态进行交互和设备状态反馈,培训效果大打折扣。

  针对以上业务需求痛点,用友网络决定顺应需求升级演化趋势,启动项目,通过将数字孪生技术及产品整合进自身的制造云产品,通过应用方式的升级进阶,赋能其合作伙伴,进而为终端工业企业提供一体化解决方案,实现降本增效。

  艾迪普科技股份有限公司(以下简称艾迪普),专注实时三维图形图像引擎技术研发与应用,面向工业、传媒、教育、医疗等众多行业,为客户提供数字孪生、元宇宙、虚拟/增强现实、虚拟仿真等产业创新应用的数字内容生产及信息三维可视化的平台与工具组件、解决方案。

  鉴于此,用友网络在对数字孪生技术服务商进行招投标选型工作时,在充分考虑技术自主与先进性、产品成熟度与易用性等多种因素后,最终选择艾迪普作为合作伙伴。主要考虑到艾迪普的三维图形图像引擎拥有100%完全自主知识产权,核心技术获得了国际专利,产品通过国家级+省级项目及超万家重点客户的应用及迭代,成熟度高,通过可视化与无代码化的建模与可视化工具,可快速、低成本地进行模型开发。

  经过与用网络智能制造事业部决策层、交付团队的多次研讨以及前期的业务调研与沟通,艾迪普进一步明确了用友网络对于数字孪生产品部署及集成效率、全周期应用维护成本的综合需求,为用友网络提供了集成了艾迪普自研三维图形图像引擎底层核心能力的、无代码、易学易用的工具化产品,并集成设备运行、产线生产等业务系统数据,支持用友网络快速、低成本地构建3D数字孪生无人产线,升级自身工业控制软件应用方式,提升终端用户体验,帮助客户降本增效。

  根据过往服务经验,结合用友网络的核心诉求,在艾迪普的建议下,双方按照需求刻画-场景构建-虚实匹配-数据接入-部署调试-系统培训的六步走的具体流程展开项目合作,为用友网络提供了基于艾迪普自研实时三维图形图像引擎核心能力的开发的数字孪生产线,最终通过与用友网络IOT平台进行打通,实现了虚实联动,取得了出色的项目成效。

  艾迪普项目团队与用友网络项目团队进行详细需求对接。一方面,结合用友网络及其合作伙伴所反馈信息,明确作为工业企业的最终用户希望以何种形态来使用设备的数字孪生体、当前有哪些业务系统和工业控制软件、平时在实际生产当中产生哪些数据、对于数字孪生体有何种展示和交互需求。另一方面,基于需求画像,艾迪普向用友网络推荐了SaaS化的工具软件,即iArtist(实时三维可视化建模工具)+iVis(信息三维可视化工具)。

  其中,iArtist支持制作和处理文字、图片、2D/3D视频、声音、VR视频、模型、数据、场景、事件等全类型内容,可一站式满足三维内容设计制作需求;iVis信息三维可视化工具软件可无代码实现数字孪生、虚拟仿真、信息可视化等应用开发。二者结合,可使得三维数字内容的创建与可视化开发门槛大幅降低,一次制作后即可规模化复用。

  在客户需求的基础上,艾迪普协助用友网络针对某个产线,构建产线的数字原生场景。以机械臂生产线) 若用友网络能够提供客户物理设备的产线三维模型,如设备制造商的机械臂生产线基础模型,因其还原度较高,则通常艾迪普不用进行明显的拆解和优化,仅需将源文件导入后进行运用iArtist、iVis工具进行微调即可完成针对该客户三维产线) 若用友网络提供不了产线三维模型,艾迪普项目团队将安排团队赴用友网络的合作伙伴现场进行现场采集,如通过现场查勘,用CAD、扫描仪、红外等方式,进行设备各方面数据的采集。同时,艾迪普团队基于设备的模型,运用iArtist、iVis中的一些行业组件,以可视化方式快速为该设备配套 AGV 小车、运输流水线等周边设备,帮助用友网络快速构建针对某个客户某类型设备的完整生产线) 此外,在上述基础上,艾迪普的技术团队还会结合现场所采集数据,进行产线模型的拆解、重构、清洗等进一步的轻量化优化操作,保证模型的精准度和还原度。

  对用友网络的客户而言,静态的模型固然重要,但对于终端工业企业客户而言,与现实世界能够进行实时、同步的活体数字模型,才是数字孪生的意义所在。为此,艾迪普先利用部分数据进行动态测验。

  1) 在静态产线模型的基础上,艾迪普将所建产线当中的所有设备的运动状态、运动逻辑与现实产线当中对应设备在产线当中实际运营的状态、运动逻辑进行校验和匹配,确保完全一致,同时核查不同设备所需要的数据类型是否完整、准确。2) 对于核查后有运动状态缺失的部分,如六轴的机械臂若测验时给出的数据类型是四轴的,会导致机械臂动作还原不够精准。艾迪普技术团队通过与用友网络机器合作伙伴进行沟通,将另外两轴的数据接口开放出来,达到最大化的还原效果,实现了线. 数据接入

  6. 系统培训在艾迪普的协助下,用友网络构建的3D数字孪生无人产线打破了客户原来需要现场启动大型、高净值设备对业务、销售人员、终端客户进行现场模拟和培训的制约,让受训人员在自己的终端,实时和产线、设备的数字孪生体进行交互并观察产线、设备的实时反馈效果,提升了培训体验,大幅降低了设备耗损成本,规避了培训风险,提升了培训效率。技术可控+过程可视化,用友网络助推生产范式的优化和制造革新

  艾迪普帮助用友网络3D数字孪生无人产线,实现物理世界实时数据与数字孪生体的无缝连接。待设备制造商的某条设备产线出新产品时,原有的模型可由设备制造商的业务人员通过可视化的、无代码工具进行快速的调整、优化,而不必再重新进行建模。并且,由于艾迪普的技术全部为国产化,有效避免了终端工业企业客户大量生产数据在开源模型之下的潜在泄露风险。

  数字人3.1数字人当前的应用现状及面临的主要挑战——技术、成本、场景成主要制约因素

  数字人,是融合人的外形、思维、行为三要素的数字化载体,是技术与场景深度融合的综合产物。伴随着元宇宙、Web3时代的迎面而来,数字人不仅有望成为下一代互联网人机交互的重要入口,承担信息传递、实时交互的重要职责,还将随着应用的持续深入,成为人类在虚拟世界中的重要的数字资产甚至是情感连接纽带,其价值势必会伴随技术的持续成熟、应用的持续深化而加速演化升级。AI新闻主播、智能陪护、智能助理、直播带货等,数字人如今已服务于诸多行业应用领域,在大幅降低人力成本的同时,也一定程度上提升了服务的人性化程度、智能化程度以及时间跨度。然而当前数字人的应用发展也面临着一些问题和挑战,主要有以下几方面:

  1) 产业发展还相对处于早期,技术发展仍不成熟。从数字人的技术构成来看,除了底层的计算、通信、显示技术外,关键还需要建模、渲染等数字人开发技术,以及由AI赋能的智能生成、驱动、交互技术,分别为数字人提供外形、灵魂与大脑。尤其是在智能化方面,需要NLP、知识图谱、语音视觉识别等众多AI技术共同聚合创新,并做到口型适配。从结果来看,数字人的形象与早期相比并未出现明显进步,智能化驱动与交互效果也差强人意,存在动作僵硬、肢体和语音不协调等问题,无法像真人一样实时获取交互内容并进行智能化实时反馈,整体的使用和交互体验还有待改善。

  2) 数字人的制作周期长、成本高。数字人按照角色的类型风格可以分为写实/超写实、二次元、卡通角色三大类。目前应用趋势在往写实/超写实风格的数字人加速演进,但这类数字人从形象构思与设计、建模、骨骼绑定、贴图、动作捕捉、驱动、渲染等完整流程,通常需要以月为单位进行各细分环节的创作实施,并且构建成本至少都在百万量级,制作成本高昂且周期较长,制约了其在终端的快速迭代发力。据英伟达官方消息,其黄仁勋虚拟人在发布会上出镜仅14秒视频,却共有34位3D美术师和15位软件工程师协同参与,总计近千工时,成本可见一斑。3) 数字人的后期运营成本高昂,同质化严重,商业化情况普遍不佳。数字人主要分为to C的偶像型、to BG的服务型数字人两大类。To C数字人,主要集中在游戏主播泛娱乐、电商及游戏直播等场景,但在场景内缺乏有效交互,更强调单向、标准化内容输出,没有差异化特点,效果无法保证,而且to C端的数字人,完成数字人制作只是万里长征的第一步,后期IP的持续打造和粉丝运营才是关键,与制作阶段成本相比,数字人运营阶段的成本则更高;而to BG的服务型数字人,应用场景相对简单,但需要对行业知识库进行持续更新。整体而言,目前数字人的前端应用效果并不理想,商业化空间并未打开。

  一方面,业界也在寻求在建模、动作捕捉、驱动、渲染等环节的单环节优化方案。比如在建模环节,相较于传统的CG建模,静态扫描、动态光场重建技术也被引入,不仅效率大幅提升,也克服了传统CG依赖人工导致的成本高、产能低、品质精度不够的弊端,借助相机阵列和三维扫描仪,制作时间与成本已大幅降低,且效果更好。同时,业界也在尝试利用人工智能进行建模,相较于相机阵列、三维扫描仪的数字人制作成本,AI建模可进一步大幅降作成本,但仍旧限于关键技术的制约,尤其对超写实级的数字人,AI建模仍旧有较大提升空间。在驱动环节,AI驱动也在逐步成为主流,随着ChatGPT的火爆,很多数字人厂商也纷纷宣布正在研发将虚拟人接入ChatGPT的相关技术,使AIGC技术以更加形象的数字人的形式进行输出,让数字人互动更具灵性。另一方面,以百度、华为、商汤科技等为代表的业界大厂也在不断尝试将数字人的整个创建、智能交互甚至运营环节打通,形成一站式数字人解决方案平台。一体化的解决方案,可以有效避免在建模、动捕、驱动、渲染等数字人的制作工序当中由于对接沟通产生的沟通协调及摩擦成本。在建模方面,凭借强大的AI能力,数字人解决方案平台通常可以让用户经过图片上传,在分钟甚至秒级时间内,即可生成2D、3D数字人形象;在驱动及交互方面,通过AI语音、AI视频驱动,提升语音识别、口型合成等方面的准确率,交互识别和输出的等待时长、交互人性化方面更加趋向于真人化。总之,通过AI技术,可降低数字人创作门槛,让更多机构拥有低成本、高效率、高品质的数字人生成能力,同时提升用户交互体验,让数字人更快更扎实地与场景紧密相连,进而推动行业健康发展。

  科技化大势所趋,宁波银行以数字人提升网点服务智能化水平宁波银行是一家区域性上市银行,是国内19家系统重要性银行之一。目前,宁波银行在北京、上海、深圳、杭州、南京、苏州、无锡、温州等地设有16家分行,开设永赢基金、永赢金租、宁银理财、宁银消金4家子公司,全行员工2.5万人。在英国《银行家》杂志2022年度全球银行1000强最新榜单中,宁波银行排名第87位,首次迈入全球银行百强行列。当前,银行业经营环境发生了显著变化,科技化、市场化、国际化趋势明显。虽然金融行业客户线上化已是大势所趋,但线下服务网点仍是重要的客户服务平台和触点。在数字化转型的浪潮下,金融网点正朝着智能化、无人化方向发展。全新的科技理念,将有助于优化网点服务标准、质量和效率。

  宁波银行始终牢固树立科技就是第一生产力的发展理念,持续加大科技系统建设投入力度,已在同类银行中建立起一定的比较优势。考虑到数字人可通过语音交互方式代替银行员工与客户进行互动,提供业务咨询、产品介绍、扫码取号等众多服务,还可协客户在自助机上办理转账汇款等业务,有助于提升自身银行网点服务的智能化、科技化水平,宁波银行决定引入数字人来推动智能服务体系的升级,增添更多金融服务的人文关怀。

  针对上述业务诉求,宁波银行上海分行携手商汤科技,打造了超写实型 AI 数字人大堂经理小宁,以栩栩如生的客服形象为客户提供各类业务咨询和服务。该数字人客服由商汤科技基于三大智能引擎为宁波银行专属打造,可提供从前端客户接待到后端运营管理的全链条服务支持。

  三大智能引擎支撑,宁波银行数字人员工高效 上岗根据与宁波银行上海分行金融科技部的需求交流,商汤科技结合自身能力优势,围绕拟人化和自动化两大维度,调用自身的智能化生成引擎、智能化驱动引擎及智能化交互引擎三大引擎,并通过三大引擎间的流程打通和标准化处理,打造一站式AI 数字人生产流水线,快速高效地完成小宁的建模、驱动。

  1.拟人化方面1)商汤科技的智慧化生成引擎将人工智能技术与 CG 建模环节融合,支持 3D 超写实、3D 拟线D 卡通等多种类型数字人的快速生成。该生成引擎可通过少量照片的面部扫描,依托算法自动生成高精度 3D 面部模型,或基于照片快速生成 3D 卡通的风格化形象。此外,该生成引擎还支持调用相应的算法模块,自动美化、脸部 / 头发等人物形象细节,帮助开发者在 CG 建模环节降低所需投入的成本和时间。基于宁波银行的需求,商汤科技依托智慧化生成引擎为宁波银行打造了3D超写实风格的数字人形象。

  2)同时,为提升小宁的动作协调性,让小宁的视觉效果、用户感知更真实,商汤科技将人工智能技术与动画设计和制作环节相融合,利用智能化驱动引擎分两个阶段进行处理。第一阶段,在AI 驱动准备环节,通过算法代替人工来加速蒙皮和 BS 制作;其次,在动作 AI 驱动环节,通过真人大数据的深度神经网络训练,基于 STA 算法模拟真人说话的口型、表情和肢体动作,使得AI 数字人的动作表现更加协调,也大幅减轻了动画师的工作强度和人工成本。

  1) 在交流对象识别分析功能下,商汤科技依赖视觉和语音识别等算法组合,帮助小宁在实际应用场景下与用户快速、高效建立对话关系。当视觉算法识别到人脸注视时,小宁可自动开启语音交互并进行主动式问候及触发后续服务,无需通过传统语音唤醒;在服务过程中,也可以识别用户口型,判定当前用户是否说了话,进而过滤掉背景杂音。

  2)在语音语义理解和知识库方面,基于语音识别(ASR)、语音合成(TTS)、自然语言理解(NLP)等技术组合,结合商汤所积累的海量金融知识领域的知识问答库、金融行业语料自动获取和 NLP模型训练能力,快速定制出了小宁的智能语音对话和问答系统,并通过接入后台运营管理平台,实现小宁知识库的在线更新和维护,帮助小宁进行持续迭代升级。

  2)在管理后端,小宁连接了宁波银行的运营管理平台,可实现知识库的持续更新和业务数据分析。依托知识库体系,小宁可回答各类复杂业务问题。当遇到超出知识库范围的问题时,还可由管理人员远程接管,以便及时回复。同时,平台还会自动将该问题进行收集和记录,在完善答案后,及时更新到知识库中,以持续扩大小宁的知识面。目前,小宁已经可以回答超过550个常见业务问题以及由此衍生的超3000个相关业务问题,通过运营管理平台的持续运营优化,每天还可新增超过50个业务相关衍生问题。

  3)不仅如此,宁波银行的运营管理平台还可汇聚小宁作为前端触点所搜集的与客户每日互动所产生的大量业务信息,通过对互动信息进行分析,可对各网点关注问题方向、高频问题、业务需求进行后台统计,进而为宁波银行内部产品迭代、业务方向预测等提供大数据支持,便于宁波银行对各网点的业务进行有效的统筹规划,进一步实现科技赋能业务创新。

  1. AIGC不会吞噬元宇宙,反而会成为元宇宙发展的加速器。由ChatGPT引爆的AIGC,虽然从资本、社会关注度角度给元宇宙带来了一定的短期冲击,但AIGC作为元宇宙引擎层的一项重要工具,可极大促进元宇宙高质量内容的生成。尤其是作为交互入口的数字人若接入ChatGPT、百度文心一言等,将还有助于大幅提升数字人的智能化程度,推动数字人行业跨越发展平台期;同时,AI绘画、AI生成策略等,AIGC将发挥所长,大幅提升数字内容的生成和创作效率,改变数字内容生成范式,为元宇宙的加速发展提供可能。

  传统发展思路下,元宇宙的形态表现得更为重度,并且交互终端多集中于XR设备之上,与普通用户距离相对较远。为解决流量问题,在终极元宇宙到来之前,如何利用好现有设备,让更多人参与其中,逐步向更高级、更深度的元宇宙过渡,是当前元宇宙发展的重要议题。借助手机等现有终端进行随时随地接入的轻量元宇宙,将有望能够通过撬动需求端,聚集充分的流量,基本解决用户来源问题,反向拉动生产端,进而促进整体生态的逐步正向循环。

  3. 工业元宇宙、数字文旅、混合办公、数字展厅等产业应用将引领元宇宙应用由点及面。元宇宙当前正在经历自消费级向产业级过渡的发展阶段,从应用的直观效果、应用粘性等角度,以工业元宇宙为代表的领域,将产生更为直观、可持续的应用价值,因此有望持续发展。随着技术的进一步突破,元宇宙势必将慢慢渗透到消费端、产业端的各个方面。火博体育