半岛·体育(综合)官方APP下载·IOS/安卓/手机APP下载

咨询热线:

+86-0222-22366





公司动态

半岛综合体育下载大模型与体验关系研究之二:大模型对交互体验与功能体验影响解析

发布时间:2024/07/13    浏览次数:

  半岛综合体育下载大模型与体验关系研究之二:大模型对交互体验与功能体验影响解析2022年,以ChatGPT为代表的AI大模型诞生,不仅在技术上实现了传统机器学习机制和模型的进化与变革,在商业应用上也实现了交互体验、功能体验、流程体验和情境体验的全方位的提升与颠覆,本文在系列之一文章基础上,探讨AI大模型在交互体验和功能体验方面的应用实践。

  交互体验指客户或用户与机器、平台、工具、虚拟形象等元素交流互动过程中的体验,AI大模型可有效提升交互体验的多元性、友善性、一致性、灵活性。

  借助AI大语言模型LLM和多模态的支持,可以对虚拟人和AI分身实现个性化定制,大部分产品提供私有化服务、公有云服务和SDK接口调用三种服务模式。在形象方面,可自行设置2D、3D、、年龄、性别、传达等属性;在形态方面,服装库、动作库、全身/半身、多视角提供丰富选择;在表现方面可选择丰富的表情、嘴型、肢体动作,并可通过复刻声音、海量音库实现声音定制。经过实时合成实现从真人听观虚拟人到真人-虚拟人多模态交互的进阶。

  (1)真身虚拟人复刻:AI大模型可根据真人的形象、形态、表现形式、声音数据合成形成等比的虚拟人,并可与真人实时交互,辅助线年期间,真人王冠和AI超仿真主播王冠同屏《“冠”察》,用全新的方式给观众带来惊喜。节目中,“AI王冠”作为控场主持人,连线财经评论员王冠,表达清晰、手势自如,与真人王冠配合十分默契,保证了节目节奏,向观众传递多项重要信息。

  (2)AI分身:AI分身,是指利用人工智能技术,根据真人的声音、外貌、性格等特征,创建一个虚拟的数字化代理,可以与人类进行语言、视觉、情感等多模态的交互。主要经历以下步骤完成创建:①映射:从海量个人数据中,抽象出用户行为模式、习惯偏好等特征,利用AI大模型实现对用户个性深度洞察;②全景理解:通过社交、通讯、电商、搜索等多个领域数据分析,全方位、全景式理解;③动态进化:随着数据积累,具备自我学习和调整能力,实现对用户变化动态适应。④智能融合:将个人模型和通用大数据融合,发展两者优势,实现智能融合。

  卡琳·玛乔丽和开发者团队将她2,000小时的YouTube内容与OpenAI的GPT-4技术相结合, 创建了一个可供雇佣的“虚拟女友”,每分钟收费1美元。该女明星制造的AI分身,同时交往1000个男友。

  (3)纯虚拟人构建:利用AI生成虚拟人,如CEO老郎、元卿梦、元梦成等,可实现虚拟人多样情感、丰富使用场景、流畅交互能力。

  (4)数字生命:通过AI算法赋能生命传承数字化,包括虚拟祭祀、生平书写、族谱查询、参与议事、寻祖、守望、祖先虚拟人、数字藏品等应用。其中祖先虚拟人指根据逝者虚拟复刻形象、演绎形象,实现自然对话互动,感情传递沟通。家族数字藏品包括时光相册、传家宝、留声机,时光相册指全家福、旅游照片、族内重大事件如婚嫁等记录;传家宝指数字孪生族人互动讲述祖传珍宝或有意义物件的来历和其中的价值所在;时光相册指长辈对后辈的嘱咐、心情感悟、才艺表达等,播放时辅助投影该成员的照片或视频影像。

  社交场景,注重心灵认同,情感陪伴,提供情绪价值。如社交软件Soul丰富多元的玩法激发用户认同感,增强粘性。Soul定位为“年轻人的社交元宇宙”,是AIGC社交场景落地的重要平台,基于用户的社交画像和兴趣图谱,通过机器学习来推荐用户可能会产生的高质量的新关系。以下三大应用场景助力提升体验:第一,通过产品沉淀的公域场景语料内容构建模型,智能对话机器人“AI苟蛋”可与用户进行多轮个性化沟通,提供个性化关怀。第二,NAWA POP社交空间中用户可以创建专属3D全身虚拟形象,与其他用户进行社交互动,特定节日通过摄像头扫描生产个性祝福视频,实现虚拟社交场景,个性化交互。第三, AI绘画、AI配音、花神测试等场景,丰富用户内容分享维度,刺激用户创作和表达。

  游戏场景中NPC多样化提升游戏可玩性、可拓展性。如汤姆猫已经尝试应用 GPT-3.5 模型进行 AI 语音互动产品功能原型测试,并已经将汤姆猫 IP 形象植入产品功能原型当中,并外接包括用户习惯数据缓存和通识大模型调度协助打造可实现信息分类和快速响应的感情教育模型,加载在AI交互终端产品中,增加应用的维度、交互的深化程度,从而增加用户的粘性。

  人形机器人应用场景主要包括人形机器人导航、人形机器人交互、情感表达和自主学习。人形机器人导航指结合视觉、语音等,协助人形机器人推断最可能导航路线;人形机器人交互即结合自然语言处理、计算机视觉等技术,使机器人更好理解人类的语言和行为,预测人类意图;情感表达应用是人形机器人通过面部表情、肢体语言等方式表达情感,并通过AIGC技术来优化其情感表达的真实性和逼真感;自主学习指让人形机器人拥有自主学习能力,从环境中学习并不断完善自己的行为和决策,使人形机器人更加智能化和自适应,并在未知环境中做出更好的决策。

  人形机器人在大模型的打磨下将面临重大发展机遇。高智能化水平使得人形机器人更好适应各种任务和环境,安全性和可靠性进一步提高,在更加危险的环境中也游刃有余,可实现深度智能化;可借助人形机器人的自然交互能力,实现感情和交互能力改进,是其更贴近人类;在医疗、教育、家庭服务等领域,人形机器将辅助人类提高生活和工作品质,促进应用领域延伸;商业化进程加速,人形机器人商业化应用普及,可以提供更加高效和智能的服务,帮助企业降本增效。

  人智交互指让AI系统更好的与现实世界交互及理解现实世界,让人工智能系统通过感知和操作物理世界获取更多的信息和知识,更加准确和有效进行决策和行动,从而实现感知拓维、行动增效。在智能家居领域,通过手机APP或者语音控制实现远程操作自动完成家务;在智能制造领域,实现生产流程数字化和自动化管理,提高生产效率和产品质量;在医疗健康领域,分析病历数据,辅助医生诊断和治疗疾病,自动完成简单手术操作。

  人智协调指在智能产品设计中通过某种机制让机器(算法)和人互动协作以更好地处理事情,以打造完善机制,促进高效合作。主要通过确定目标、划分分工-数据收集、模型训练-测试模型、验证AI-协同工作、持续改进实现工作闭环。目前在元宇宙世界中,自然人通过三元一体引擎,实现自然人、虚拟人、机器人在外形、交互、行为、认知层面一体化,采用AI驱动、穿戴设备惯性驱动、纯摄像头视觉驱动,组成元宇宙虚拟人驱动的主流模式,通过外形共用、交互共通、行为同一、认知共享实现无缝交流。

  人机融生是人机交互的最高层次,通过脑机互联,实现无缝协同,需要多种技术协同实现。脑波共鸣技术协助大脑和计算机直接进行信息传输,快速、高效沟通,实现思想行动高度统一;生物技术和基因编辑技术改变人类基因组的能力,提高智力、抵抗疾病或适应不同环境;纳米技术在内部应用,如纳米机器人维护和修复、对抗疾病或者基因编辑;虚实结合的无缝混合现实,打破现实与虚拟的界限,推动数字世界与现实世界的高度融合;人工智能与人类高效协助,保护人类主体性同时提升决策能力和创造力。

  功能体验指用户或客户使用工具、平台、产品推进工作进展过程中产生的体验,AI大模型在工作场景赋能千行百业提升效率,降低成本,为工作解压,在可用性、耐用性、流畅性、理解性提升功能体验。

  目前工业领域的功能体验提升场景主要应用于汽车制造和建筑设计领域。在生产侧提效方面,通过AI大模型持续学习和反馈,优化生产流程,减少浪费,提高效率。并根据历史数据预测设备的维护需求,提前维护,防止生产中断;无缝集成到工业生产各个环节,实现智能制造;强化AI和人类合作,实现人机高效协作。在设计侧赋能领域,AI大模型可生产个性化的产品描述、营销材料等,生成新颖的设计方案,推动工业创新,各个部分赋能自动生产和优化内容,实现自我协调,此外还可预测市场趋势、优化生产流程。

  AI大模型在生物医药行业的功能体验提升主要应用于新药研发和健康指引领域。在新药研发领域,AI大模型应用可加速新药研发进程,缩短研发周期。生物行为模型可模拟和预测个体或种群的生物行为;通过生物网络解析,模拟并分析复杂的生物网络,如代谢网络、基因调控网络等;基因密码破译可解密基因信息,推动精准医疗发展。

  AI大模型在IT行业可利用模型判断实现辅助编码、自动编程。大模型的应用可根据自然语言快速生成代码,GPT-4代码可读性更强,作为助手提升开发效率,并将宏观任务转化为微观指令,帮助实现多个需求的聚合能力,打通业务逻辑,实现需求聚合;AI大模型代码重构和纠错能力强,GPT-4给很粗详细配置缓存步骤,可考虑更多任务中的细节,并更适配具体的场景,可实现动态调整。

  虽然AI大模型在IT行业的应用可提升功能性体验,但目前应用仍存在缺陷,如无法支持复杂软件的端到端开发,代码不完整、不准确,无法保证正确性,问题描述精确度影响ChatGPT代码能力,需要根据开发者进一步询问和提示引导,具体场景下,内在推理链的容错能力会直接影响其代码的可用性。大模型本质上是回归计算,回归精度受限训练数据中正确逻辑的显著程度,显示一定编程语言偏好。随着AI大模型的优化破解以上完整性、理解性不足的问题,IT行业的功能体验将进一步提升。

  AI大模型在四个学习阶段通过对话式、核查筛选、头脑风暴式、角色扮演式、反思式、元认知策略、概念层次递进等方式推动学生成绩螺旋上升,提升教学过程能体验。

  AI可辅助学习与个性化教育,AI技术根据每个学习者的需求和优势定制教学内容和方法,帮助学习者从低能力状态迅速提升到高能力状态。

  AI大模型可实现跨学科学习与综合技能培养,为学习者提供更为广泛的学习资源,辅助掌握多种技能。

  AI大模型可实现深度学习与高阶思维能力提升,AI提供高质量学习资源,引导学习者深入研究特定领域,提高创新能力、批评性思维和解决问题能力。

  拓展认知边界和创新思维模式,AI协助学习者挖掘潜在认知能力,开发思维方式,应对社会挑战和变革。

  在传媒行业AI大模型可多元交互,去伪存真,提升新闻的真实度和趣味性。主要应用于无记者新闻、对话新闻和辟谣新闻三个场景。

  无记者新闻指通过机器人、AI自动化技术收集、编辑和发布新闻的方式,特点是无需人力,快速、准确发布新闻,减少人为干预,具有可短时间内大量生成新闻,客观性和中立性较高的优点,但可能存在数据误解和错误报到和分析深度性、全面性不足的弊端。

  对话新闻指通过对话形式呈现新闻,通常有两个或多个角色,通过交流观点和分析呈现新闻事件,具有交互性和立体性,增强新闻趣味。这类应用更具人性化和针对性,并提供与用户的互动和反馈,但也存在精准度和逻辑性问题、大量训练数据和算法支持、大量人力和资金投入等落地瓶颈。

  在影视行业,AI大模型可提升视听特性,提供无限创意,实现无演员电影向无导演电影的转变,实现多模态融合半岛综合体育官网、超现实主义视觉呈现、视频风格转换、动态故事板、主题隔离与修改的智能化,优化影视制作流程的功能体验。

  剧本创作阶段,AI大模型可激发影视剧本创作思路,如AI协作模型Dramatron生成剧本包括标题、人物名单、故事情节、对话、地点等,海马扬帆上线“小说转剧本”模式,包含重要场景、对白、动作等视听语言剧本格式。

  影视制作阶段,AI大模型助力拓展影视角色、场景创作空间,如AI修复,使得主演年轻化,AI修复声带受损演员声音,复原已故演员,如流浪地球。此外,AI辅助视频剪辑提速,智能动画配音,通过构建人物形象-生成故事情节-将故事分场景-场景生成视频-后期制作与调整打造视频自生成闭环流。

  后期修复阶段,AI大模型可提升作品后期制作质量,如后期修复,如AI修复100年前的北京,修复老电影。

  后期修复阶段,AI大模型可提升作品后期制作质量,如后期修复,如AI修复100年前的北京,修复老电影。

  AI辅助生产多类型系列作品,赋能设计工作体验。在图像处理领域,Midjourney根据文本提示成视觉效果,快速生产一组连贯图像;Stablediffusion可快速生产摄影、油画、水彩、概念艺术风格作品;Leonnardo.ai不使用现有模型或自己训练AI模式生产各种生产就绪艺术资产;Novelai生成动漫、手绘、素描、CG风格图片,出图率高。

  在文学创造领域,以中文在线为代表的AIGC内容智能生产覆盖辅助创作和续写,17k小说网平台可针对人物、物品等进行AI辅助创作,并针对不同作品类别(如古风、都市等)进行语言调整,并可理解小说中故事主线、人物关系、关键情节等,通过聊天方式理解用户提示,设定人物角色、小说大纲、根据主题词创作小说等,完成数千字小说续写。

  AI大模型辅助可有效替代人力,提升设计智能性。在UI设计领域,AI大模型可使得UI设计视感共生、减少记忆障碍,提升设计温度。AIGC根据指定参数自动生成UI设计,极大提高设计效率,AIGC可以学习和了解用户视觉偏好,创建符合个人喜好的UI设计。AIGC也可以生产富有感情的UI设计,提升用户情感参与度,通过与用户和其他系统互动,不断学习进化,提升自身设计能力。AIGC加成使UI设计具有更高的适应性和灵活性,在不同设备上、不同环境中,UI可以进行自我调整,提供最佳用户体验。此外,大模型千亿级语料让UI设计更加简洁,功能布局简明,减少用户记忆负担。

  在APP设计领域,AI大模型可打通意图通路,减少繁杂操作。借助大模型,用户通过自然语言表达需求,无需复杂菜单或过滤器,用户自有地以他们最自然、最方便的方式表达需求,系统可理解并准确捕捉用户的非结构化描述意图,通过操作层实现服务,直接通过理解用户需求提供服务,体验流畅,如有操作问题,用户通过与虚拟人进行对线. APP交互因AI介入使用体验持续优化

  在APP优化领域,AI大模型可通过功能、服务的优化因势利导,强化产品。在内容生产方面,新闻应用、社交媒体应用、教育应用等可自动生成新闻报告、社交媒体帖子、教育材料,降低内容生产成本,轻松进行规模扩展。在服务方面,通过生产个性化内容和推荐,如应用应用自动生产个性化播放列表,新闻APP自动生产用户感兴趣的新闻摘要,游戏APP自动生成游戏剧情可自动回答问题,提升服务个性化;在线聊天、问题解答工具,可自动回答问题,获得7*24小时服务,提升服务可得性。

  以ChatGPT+AIGC为代表的AI大模型已经开始突破概念阶段逐渐在各个场景实现商业化落地,深刻影响着客户、用户、员工角色在生活、工作、学习场景中的交互和功能体验,未来随着模型持续的优化,智能强化、人机协调将促进更多元化的场景落地,个性化、人性化、一致性、可用性、耐用性的场景将无处不在,真正实现智能和人类的高效协作、和谐共生。

  创立于2002年,是一个产、学、研一体化的产业发展集团。我们立足呼叫中心产业发展、专注客户管理研究方向、推动服务科学实践创新、拓展数字经济全新疆界。透过媒体出版、认证测评、产业研究、管理咨询、会展服务、产业投资、教育培训、人力资源、法律服务等全方位、度、高度整合的产业链基础业务,对相关产业发展提供支撑服务。


Copyright © 2018-2028 半岛·体育(综合)官方APP下载·IOS/安卓/手机APP下载 版权所有      黔ICP备18003557号-1
电 话:+86-0222-22366 手 机:08663022900
地 址:广东省半岛·体育(综合)官方APP下载
扫一扫关注微信