安庆大理运城常德铜陵江西
投稿投诉
江西南阳
嘉兴昆明
铜陵滨州
广东西昌
常德梅州
兰州阳江
运城金华
广西萍乡
大理重庆
诸暨泉州
安庆南充
武汉辽宁

AI文本生成模型如何重塑Airbnb的客户支持(译文)

9月9日 孤行者投稿
  利用文本生成模型构建更有效、可扩展的客户支持产品。
  GavinLi,MiaZhao和ZhenyuZhao
  现代人工智能(AI)中发展最快的领域之一是AI文本生成模型。顾名思义,这些模型生成自然语言。以前,大多数工业自然语言处理(NLP)模型都是分类器,或者在机器学习(ML)文献中可能称为判别模型。然而,近年来,基于大规模语言模型的生成模型正在迅速获得关注,并从根本上改变了ML问题的表述方式。生成模型现在可以通过大规模预训练获得一些领域知识,然后生成高质量的文本例如回答问题或解释一段内容。
  在Airbnb,我们在我们的社区支持(CS)产品中大量投资于AI文本生成模型,这已经启用了许多新功能和用例。本文将详细讨论其中三个用例。然而,首先让我们谈谈文本生成模型的一些有益特性,这些特性使其非常适合我们的产品。关于文本生成模型
  将AI模型应用于Airbnb客户支持等大规模工业应用并非易事。现实生活中的应用程序有很多长尾角案例,很难扩展,而且标记训练数据的成本通常很高。文本生成模型有几个特点可以解决这些挑战,并使这个选项特别有价值。编码知识
  第一个吸引人的特征是能够将领域知识编码到语言模型中。正如Petroni等人所说明的。(2019),我们可以通过大规模预训练和迁移学习对领域知识进行编码。在传统的ML范式中,输入非常重要。模型只是一个从输入到输出的转换函数。模型训练主要侧重于准备输入、特征工程和训练标签。而对于生成模型,关键是知识编码。我们如何设计预训练和训练以将高质量知识编码到模型中以及我们如何设计提示来归纳这些知识更为关键。这从根本上改变了我们解决分类、排名、候选生成等传统问题的方式。
  在过去的几年里,我们积累了大量的人工代理为爱彼迎房客和房东提供帮助的记录。然后,我们使用这些数据设计了大规模的预训练和训练,以编码解决用户出行问题的知识。在推理时,我们设计了提示输入以直接根据编码的人类知识生成答案。与传统的分类范式相比,这种方法产生了明显更好的结果。AB测试显示业务指标显着改善,用户体验也明显改善。无监督学习
  我们发现文本生成模型的第二个吸引人的特征是它的无监督性质。像Airbnb这样的大规模工业用例通常拥有大量的用户数据。如何挖掘有用的信息和知识来训练模型成为一个挑战。首先,通过人工标记大量数据的成本非常高,极大地限制了我们可以使用的训练数据规模。其次,设计良好的标签指南和用户问题和意图的综合标签分类具有挑战性,因为现实生活中的问题通常具有长尾分布和许多细微的角落案例。它无法扩展到依靠人工来穷尽所有可能的用户意图定义。
  文本生成模型的无监督性质使我们能够在不大量标记数据的情况下训练模型。在预训练中,为了学习如何预测目标标签,模型被迫首先对问题分类法有一定的了解。本质上,该模型是在内部和隐式地为我们做一些数据标签设计。这解决了涉及意图分类设计和标签成本的可扩展性问题,因此开辟了许多新的机会。当我们稍后在本文中深入探讨用例时,我们将看到一些这样的例子。更自然和高效的语言模型
  最后,文本生成模型超越了ML问题公式的传统界限在过去的几年中,研究人员已经意识到自动编码模型中的额外密集层可能是不自然的、适得其反的和限制性的。事实上,所有典型的机器学习任务和问题表述都可以看作是语言建模的单一统一问题的不同表现形式。分类可以格式化为一种语言模型,其中输出文本是类的文字字符串表示。
  为了使语言模型统一有效,引入了一个新的但必不可少的角色:提示符。提示是一小段文本指令,它告知模型手头的任务,并设置对输出格式和内容的期望。除了提示之外,额外的自然语言注释或提示也非常有利于将ML问题进一步上下文化为语言生成任务。提示的结合已被证明可以显着提高各种任务的语言模型质量。下图说明了通用生成建模的高质量输入文本的剖析。
  图1。1我们的文本生成模型的提示和输入特征设计示例
  现在,让我们深入探讨文本生成模型在Airbnb的社区支持产品中应用的几种方式。我们将探讨三个用例内容推荐、实时代理协助和聊天机器人释义。内容推荐模型
  我们的内容推荐工作流程为Airbnb的帮助中心搜索和我们的Helpbot中的支持内容推荐提供支持,它利用逐点排名来确定用户收到的文档的顺序,如图2。1所示。这个逐点排序器采用两部分输入的文本表示当前用户的问题描述和候选文档,以标题、摘要和关键字的形式。然后计算描述和文档之间的相关性分数,用于排名。在2022年之前,这个逐点排序器是使用XLMRoBERTa实现的,但是我们很快就会看到为什么我们切换到MT5模型。
  图2。1我们如何利用具有任意分类头的仅编码器架构来执行逐点文档排序
  根据引入提示的设计决定,我们将经典的二元分类问题转化为基于提示的语言生成问题。输入仍然来自问题描述和候选文档的文本表示。但是,我们通过在描述前添加提示来将输入上下文化,该提示通知模型我们期望二进制答案,是或否,即文档是否有助于解决问题。我们还添加了注释,为输入文本各部分的预期作用提供额外提示,如下图所示。为了实现个性化,我们使用用户及其预订信息的文本表示扩展了问题描述输入。
  图2。2。我们如何利用具有自然语言输出的编码器解码器架构作为逐点排序器
  我们针对上述任务对MT5模型进行了微调。为了评估生成分类器的质量,我们使用从与训练数据相同的分布中采样的生产流量数据。生成模型展示了支持文档排名的关键性能指标的显着改进,如下表所示。
  表2。1Airbnb支持内容推荐
  此外,我们还在在线AB实验中测试了生成模型,将模型集成到拥有数百万活跃用户的Airbnb的帮助中心。成功的实验结果得出了相同的结论与基于分类的基线模型相比,生成模型推荐具有显着更高相关性的文档。实时代理助理模型
  为代理配备正确的上下文知识和强大的工具可以为我们的客户带来更好的体验。因此,我们为我们的代理提供及时的指导,引导他们始终如一地找到正确的答案,并帮助他们有效地解决用户问题。
  例如,通过坐席与用户的对话,展示建议的模板,帮助坐席解决问题。为确保我们的建议在CS政策中得到执行,建议模板通过API检查和模型意图检查的组合进行门控。该模型需要回答问题以捕获用户意图,例如:这条消息是关于取消的吗?该用户提到的取消原因是什么?该用户是否因COVID疾病而取消预订?这位用户是不是不小心订了位?
  图3。1AI生成的推荐模板
  为了支持许多细粒度的意图检查,我们开发了一个策划者问答(QA)模型,旨在帮助回答所有相关问题。这个QA模型是使用上面提到的生成模型架构开发的。我们连接多轮用户代理对话以利用聊天历史作为输入文本,然后在服务时间点询问我们关心的提示。
  提示自然地与我们要求人类注释的相同问题对齐。略有不同的提示会导致不同的答案,如下所示。然后根据模型的回答,向代理推荐相关模板。
  表3。1mastermindQA模型提示设计
  图2。2MastermindQA模型架构
  我们利用了t5base和Narrativa等主干模型,并对各种训练数据集组合进行了实验,包括基于注释的数据和基于日志的数据以及额外的后处理。注释数据集通常具有更高的精度、更低的覆盖率和更一致的噪声,而日志数据集具有更低的精度、更高的案例覆盖率和更多的随机噪声。我们发现将这两个数据集组合在一起会产生最佳性能。
  表3。2mastermindQA模型实验结果
  由于参数量大,我们利用名为DeepSpeed的库来使用多GPU内核训练生成模型。DeepSpeed有助于将训练过程从几周缩短到几天。话虽如此,超参数调整通常需要更长的时间。因此,需要用较小的数据集进行实验,以获得更好的参数设置方向。在生产中,与真正的CS大使进行的在线测试显示参与率有了很大的提高。聊天机器人中的释义模型
  准确的意图检测、插槽填充和有效的解决方案不足以构建成功的AI聊天机器人。用户通常选择不与聊天机器人互动,无论ML模型有多好。用户希望快速解决问题,因此他们不断尝试评估机器人是否理解他们的问题,以及它是否能比人工代理更快地解决问题。建立一个释义模型,首先改写用户描述的问题,可以给用户一些信心并确认机器人的理解是正确的。这显着提高了我们机器人的参与率。下面是我们的聊天机器人自动解释用户描述的示例。
  图4。1聊天机器人转述用户对支付问题的描述的实际示例
  这种解释用户问题的方法经常被人类客户支持代理使用。最常见的模式是我知道你。例如,如果用户询问是否可以免费取消预订,代理人会回复我知道你想取消,想知道我们是否可以全额退款。我们构建了一个简单的模板来提取代理回复以该关键词开头的所有对话。因为我们有多年的代理用户通信数据,所以这个简单的启发式方法免费为我们提供了数百万个训练标签。
  我们测试了流行的序列到序列转换器模型骨干,如BART、PEGASUS、T5等,以及自回归模型,如GPT2等。对于我们的用例,T5模型产生了最佳性能。
  正如Huang等人所发现的那样。(2020),文本生成模型最常见的问题之一是它倾向于生成平淡、通用、无信息的回复。这也是我们面临的主要挑战。
  例如,该模型对许多不同的输入输出相同的回复:我知道您的预订有一些问题。虽然正确,但这太笼统了,没有用。
  我们尝试了几种不同的解决方案。首先,我们尝试建立一个后向模型来预测P(Sourcetarget),正如Zhang等人介绍的那样。(2020),并将其用作重新排序模型以过滤掉过于通用的结果。其次,我们尝试使用一些基于规则或基于模型的过滤器。
  最后,我们发现最好的解决方案是调整训练数据。为此,我们基于SentenceTransformers的预训练相似性模型对训练目标数据进行文本聚类。如下表所示,训练数据包含太多无意义的通用回复,导致模型在其输出中执行相同的操作。
  表4。2训练标签中的顶级集群
  我们标记了所有过于通用的集群,并使用SentenceTransformers从训练数据中过滤掉它们。这种方法的效果明显更好,并为我们提供了一个可以投入生产的高质量模型。结论
  随着基于大规模预训练的transformer模型的快速增长,文本生成模型现在可以对领域知识进行编码。这不仅使他们能够更好地利用应用程序数据,而且使我们能够以无监督的方式训练模型,从而帮助扩展数据标签。这使得许多创新方法能够应对构建AI产品的常见挑战。正如本文详述的三个用例(内容排名、实时代理协助和聊天机器人释义)所示,文本生成模型在客户支持场景中有效地改善了我们的用户体验。我们认为文本生成模型是NLP领域中一个至关重要的新方向。他们帮助Airbnb的房客和房东更快地解决他们的问题,并协助支持大使提高效率,更好地解决手头的问题。我们期待继续在这一领域积极投资。致谢
  感谢WeipingPen、XinLiu、MukundNarasimhan、JoyZhang、TinaSu和AndyYasutake审阅和完善博文内容以及所有重要建议。感谢JoyZhang、TinaSu、AndyYasutake的领导支持!感谢ElaineLiu构建释义端到端产品、运行实验并发布。感谢我们亲密的PM合作伙伴CassieCao和JerryHong,感谢他们在PM方面的专业知识。如果没有他们的努力,这项工作是不可能完成的。
  作者:GavinLi
  出处:https:medium。comairbnbengineeringhowaitextgenerationmodelsarereshapingcustomersupportatairbnba851db0b4fa3
投诉 评论 转载

如何利用一台旧手机制作区块链硬件钱包安全,是所有币圈人必须学会的生存技能,如果对硬件钱包在购买渠道、快递安全、使用习惯等存在疑虑,那么,我们可以用一台iPhone手机制作一个硬件钱包。具体步骤如下:1……秋冬谁能不爱毛绒绒天冷了,羊毛羊绒的衣物开始大张旗鼓地热卖。羊羔绒以外观清淡爽洁,具有良好的透气性和悬垂性的特性受到各路时尚秀场的青睐。今天,小编就带大家一起看看,羊羔绒在秀场的表现如何吧……父母走了之后,若能主动做好三件事,说明你相当聪明父母在,人生尚有来处;父母去,人生只剩归途这个世上,能够无私对你好的人,大概只有父母。但是父母也会让你难过,甚至会控制你的人生。父母健在的时候,不管怎样,碍于道义,……号称小鹏P5双胞胎预售18万起,零跑C01实车亮相5月28日,2022年粤港澳车展正式开幕,其中零跑品牌发布了旗下全新中大型轿车零跑C01。该车早在车展以前便开启预售,其价格区间为18万27万元。仅代表个人而言,这造型也太像小……AI文本生成模型如何重塑Airbnb的客户支持(译文)利用文本生成模型构建更有效、可扩展的客户支持产品。GavinLi,MiaZhao和ZhenyuZhao现代人工智能(AI)中发展最快的领域之一是AI文本生成模型。顾……强森换发型后,风格大变,成为欧美王子现在回忆起强森的形象,还是让小编觉得心有余悸。职业摔跤手的出身让强森,有着令对手恐惧的强壮身材。他在《速度与激情》中的表现,更是让人记住了他的硬汉形象。说起强森经典的形象,恐怕……曝仅有2支球队愿意参加2022年NBL联赛已面临流产风险北京时间11月14日,据知名媒体人劭化谦报道,仅有2家俱乐部愿意参加2022赛季NBL联赛。这对于NBL联赛来说,无疑是沉重的打击,联赛面临着流产的危险。据悉,本赛季的N……一起去摘西华的头茬草莓吧西华的草莓熟了头茬草莓又大又甜周末来摘草莓吧西华草莓专业大棚种植,选用优质脱毒种苗,生态种植,不催熟,不膨大,自然生长。花期进行蜜蜂传粉,完全生态化,无人干预……孙颖莎陈梦迎奥运后首战,男单决赛上演中日对决记者杨弋北京时间2022年10月29日晚间,WTT新乡世界杯总决赛男、女单半决赛全部结束。最终,孙颖莎与陈梦会师女单决赛,而男单决赛则将由王楚钦对阵日本选手张本智和。……巴爷真男人!谈凯尔特人丑闻我的婚姻更乱,没资格给建议卫冕东部冠军在休赛季结束的最后一刻爆发了丑闻,主教练乌度卡出轨泡了同事,严重违反了NBA和凯尔特人规定面临禁赛!巴恩斯在播客中谈及此事。凯尔特人主帅乌度卡出轨球队的后勤服……秋天营养均衡的美食1。尖椒溜肥肠青尖椒含有维生素C、叶酸、镁以及钾等,其中维生素C含量丰富。青尖椒含水分93。9左右、碳水化合物约3。8。肥肠的营养价值:有润燥、补虚、止渴、止血的功效。……富达国际首席投资官AndrewMcCaffery中国市场能提南方财经全媒体记者吴霜,实习生王仪上海报道9月20日,南财年度投资论坛2022中国资产管理年会前瞻以全平台线上直播形式举办,该活动由南方财经全媒体集团指导,南财金融终端发……
普通人该怎么和王菲学习自我定位暗黑2今日mf成果印尼足球惨剧并非偶然女排训练出成果!女排杨千嬅猛涨肌肉,李盈莹暴瘦是喜是忧?华为P50双胞胎!鼎桥P50上架,骁龙8885G加持值得推荐持有多套房的人要注意!财政部一锤定音,房产税或将这样收取武装RTX3080Ti的西装暴徒!宏碁掠夺者刀锋500SE是陈若仪不眠不休照顾林志颖,患难见真情,自卑10年选择勇敢做自男人的品位好不好,看他怎么穿皮鞋就一目了然美国航天事故,7名宇航员瞬间汽化,NASA早预判他们会死?当59岁关之琳同框68岁赵雅芝,终于明白什么叫岁月从不败美人225页10万字政务大数据能力平台项目建议书怀孕四个月需要注意些什么履行建筑工程合同签订的原则有哪些?简单的新年窗花剪纸图解神印王座txt免费下载小说无弹窗5200耳语海岸看书网格力变频多联空调怎么样格力变频多联空调特点详解在汽车上作文400字武夷山归来公司的通知核武器来了!以色列遭到轰炸,普京重拳出击,美国再传坏消息那件事我做错了外国暖男日记走红如何俘获女生芳心鸡蛋清可以直接敷脸吗?鸡蛋清能直接敷脸吗?

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找七猫云易事利