CN117933195A - 导航播报数据处理方法、装置、计算机设备和存储介质 - Google Patents
导航播报数据处理方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN117933195A CN117933195A CN202410342033.8A CN202410342033A CN117933195A CN 117933195 A CN117933195 A CN 117933195A CN 202410342033 A CN202410342033 A CN 202410342033A CN 117933195 A CN117933195 A CN 117933195A
- Authority
- CN
- China
- Prior art keywords
- text
- broadcasting
- stylized
- standard
- broadcast
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 30
- 238000011156 evaluation Methods 0.000 claims abstract description 144
- 238000012549 training Methods 0.000 claims abstract description 113
- 238000000034 method Methods 0.000 claims abstract description 55
- 238000006243 chemical reaction Methods 0.000 claims abstract description 45
- 238000012545 processing Methods 0.000 claims abstract description 26
- 238000004590 computer program Methods 0.000 claims abstract description 25
- 238000012216 screening Methods 0.000 claims description 64
- 238000013145 classification model Methods 0.000 claims description 45
- 230000003993 interaction Effects 0.000 claims description 33
- 238000012163 sequencing technique Methods 0.000 claims description 4
- 230000008859 change Effects 0.000 description 28
- 238000012552 review Methods 0.000 description 22
- 238000005516 engineering process Methods 0.000 description 21
- 238000013473 artificial intelligence Methods 0.000 description 19
- 230000008569 process Effects 0.000 description 13
- 238000010801 machine learning Methods 0.000 description 9
- 238000013459 approach Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000013500 data storage Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 235000002198 Annona diversifolia Nutrition 0.000 description 3
- 241000282842 Lama glama Species 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000011511 automated evaluation Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Traffic Control Systems (AREA)
Abstract
本申请涉及一种导航播报数据处理方法、装置、计算机设备、存储介质和计算机程序产品。所述方法可应用于交通领域,包括:获取各导航路段的初始播报配置数据,根据初始播报配置数据生成多个标准播报文本,利用根据风格化文本提示信息对标准播报文本生成模型进行训练得到的风格化播报文本生成模型,对多个标准播报文本进行文本风格转换,得到多个标准播报文本各自的候选风格化播报文本。对每个标准播报文本的各候选风格化播报文本进行文本评估,得到相应候选风格化播报文本各自的评估结果,根据评估结果确定与标准播报文本对应的目标风格播报文本。采用本方法能够针对不同导航路段的初始播报配置数据进行风格化播报文本的全面配置,并减少资源消耗。
Description
技术领域
本申请涉及人工智能技术领域,特别是涉及一种导航播报数据处理方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
随着人工智能技术的发展,以及各类导航应用的推广使用,对于导航应用过程中导航播报的准确度要求、以及个性化要求等日益提升。为满足不同用户的实际使用需求,比如个性化语音播报等需求,出现了根据用户实际需求,配置具体播报文案、以及设置个性化播报语音风格的方式。
然而,传统上通常采用根据实际场景人工配置播报文案,并设置个性化播报语音风格的方式,其需要针对不同场景分别配置风格化文案,仍然存在配置资源消耗过大的问题。
为了减少播报文本配置过程中的资源消耗,出现了筛选场景和针对性配置的方式,即筛选某些常见场景,比如导航过程中的出发场景、结束场景等,针对性配置风格化文案,而导航过程中的其他场景,则采用普通标准文案的方式。但采用筛选场景和针对性配置风格化文案的方式,存在导航过程的播报文案风格不统一、以及前后衔接性差的问题,仍需要不断调整导航过程中的播报文案,风格化文案的覆盖率有待提升。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提升导航过程中的风格化播报文案的覆盖率,减少调整或生成播报文案的重复操作的导航播报数据处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种导航播报数据处理方法,包括:
获取多个导航路段各自对应的初始播报配置数据,根据所述初始播报配置数据生成多个标准播报文本;
通过训练好的风格化播报文本生成模型,对所述多个标准播报文本分别进行文本风格转换,得到所述多个标准播报文本各自对应的至少一个候选风格化播报文本;所述风格化播报文本生成模型,是根据风格化文本提示信息对标准播报文本生成模型进行训练得到的,所述风格化文本提示信息包括风格化查询数据和风格化播报文本;
针对每个所述标准播报文本,对所述标准播报文本对应的至少一个候选风格化播报文本进行文本评估,得到所述至少一个候选风格化播报文本各自的评估结果,根据所述评估结果确定与所述标准播报文本对应的目标风格播报文本。
第二方面,本申请还提供了一种导航播报数据处理装置,包括:
标准播报文本生成模块,用于获取多个导航路段各自对应的初始播报配置数据,根据所述初始播报配置数据生成多个标准播报文本;
候选风格化播报文本生成模块,用于通过训练好的风格化播报文本生成模型,对所述多个标准播报文本分别进行文本风格转换,得到所述多个标准播报文本各自对应的至少一个候选风格化播报文本;所述风格化播报文本生成模型,是根据风格化文本提示信息对标准播报文本生成模型进行训练得到的,所述风格化文本提示信息包括风格化查询数据和风格化播报文本;
目标风格播报文本确定模块,用于针对每个所述标准播报文本,对所述标准播报文本对应的至少一个候选风格化播报文本进行文本评估,得到所述至少一个候选风格化播报文本各自的评估结果,根据所述评估结果确定与所述标准播报文本对应的目标风格播报文本。
第三方面,本申请还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取多个导航路段各自对应的初始播报配置数据,根据所述初始播报配置数据生成多个标准播报文本;
通过训练好的风格化播报文本生成模型,对所述多个标准播报文本分别进行文本风格转换,得到所述多个标准播报文本各自对应的至少一个候选风格化播报文本;所述风格化播报文本生成模型,是根据风格化文本提示信息对标准播报文本生成模型进行训练得到的,所述风格化文本提示信息包括风格化查询数据和风格化播报文本;
针对每个所述标准播报文本,对所述标准播报文本对应的至少一个候选风格化播报文本进行文本评估,得到所述至少一个候选风格化播报文本各自的评估结果,根据所述评估结果确定与所述标准播报文本对应的目标风格播报文本。
第四方面,本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取多个导航路段各自对应的初始播报配置数据,根据所述初始播报配置数据生成多个标准播报文本;
通过训练好的风格化播报文本生成模型,对所述多个标准播报文本分别进行文本风格转换,得到所述多个标准播报文本各自对应的至少一个候选风格化播报文本;所述风格化播报文本生成模型,是根据风格化文本提示信息对标准播报文本生成模型进行训练得到的,所述风格化文本提示信息包括风格化查询数据和风格化播报文本;
针对每个所述标准播报文本,对所述标准播报文本对应的至少一个候选风格化播报文本进行文本评估,得到所述至少一个候选风格化播报文本各自的评估结果,根据所述评估结果确定与所述标准播报文本对应的目标风格播报文本。
第五方面,本申请还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取多个导航路段各自对应的初始播报配置数据,根据所述初始播报配置数据生成多个标准播报文本;
通过训练好的风格化播报文本生成模型,对所述多个标准播报文本分别进行文本风格转换,得到所述多个标准播报文本各自对应的至少一个候选风格化播报文本;所述风格化播报文本生成模型,是根据风格化文本提示信息对标准播报文本生成模型进行训练得到的,所述风格化文本提示信息包括风格化查询数据和风格化播报文本;
针对每个所述标准播报文本,对所述标准播报文本对应的至少一个候选风格化播报文本进行文本评估,得到所述至少一个候选风格化播报文本各自的评估结果,根据所述评估结果确定与所述标准播报文本对应的目标风格播报文本。
上述导航播报数据处理方法、装置、计算机设备、存储介质和计算机程序产品中,通过获取多个导航路段各自对应的初始播报配置数据,并根据初始播报配置数据生成多个标准播报文本,以利用根据风格化文本提示信息对标准播报文本生成模型进行训练得到的风格化播报文本生成模型,对多个标准播报文本分别进行文本风格转换,可得到多个标准播报文本各自对应的至少一个候选风格化播报文本,实现了采用将模型微调和提示信息引导相结合的方式,快速获得所需风格化的候选风格化播报文本,减少了人工配置带来的资源消耗,同时可针对不同导航路段对应的初始播报配置数据进行全面配置,提升了风格化播报文本的覆盖面,避免在导航过程中出现导航播报文本风格不一,前后衔接性差的问题。进一步地,针对每个标准播报文本,对标准播报文本对应的至少一个候选风格化播报文本进行文本评估,得到至少一个候选风格化播报文本各自的评估结果,以根据评估结果确定与标准播报文本对应的目标风格播报文本,通过进一步评估和筛选,减少调整或生成播报文案的重复操作,提升了风格化播报文本的生成效率。
附图说明
为了更清楚地说明本申请实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一个实施例中导航播报数据处理方法的应用环境图;
图2为一个实施例中导航播报数据处理方法的流程示意图;
图3为一个实施例中训练得到风格化播报文本生成模型的流程示意图;
图4为一个实施例中风格化文本提示信息的示意图;
图5为另一个实施例中风格化文本提示信息的示意图;
图6为一个实施例中确定与标准播报文本对应的目标风格播报文本的流程示意图;
图7为另一个实施例中确定与标准播报文本对应的目标风格播报文本的流程示意图;
图8为另一个实施例中导航播报数据处理方法的流程示意图;
图9为再一个实施例中导航播报数据处理方法的流程示意图;
图10为一个实施例中导航播报数据处理方法的主体流程示意图;
图11为一个实施例中导航播报数据处理装置的结构框图;
图12为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的导航播报数据处理方法,具体涉及人工智能技术,可应用于智慧交通、地图导航、辅助驾驶、以及网络媒体等各种场景。其中,人工智能(ArtificialIntelligence, AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。同时,人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术,人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、预训练模型技术、操作/交互***、以及机电一体化等。其中,预训练模型又称大模型、基础模型,经过微调后可以广泛应用于人工智能各大方向下游任务。具体来说,人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
其中,机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、以及算法复杂度理论等多门学科,其专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。其中,机器学习是人工智能的核心,是使计算机具有智能的根本途经,其应用遍及人工智能的各个领域。具体来说,机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、以及式教学习等技术。而预训练模型是深度学习的最新发展成果,融合了以上技术。智能车路协同***(Intelligent Vehicle InfrastructureCooperative Systems,IVICS),简称车路协同***,是智能交通***(ITS)的一个发展方向。车路协同***是采用先进的无线通信和新一代互联网等技术,全方位实施车车、车路动态实时信息交互,并在全时空动态交通信息采集与融合的基础上开展车辆主动安全控制和道路协同管理,充分实现人车路的有效协同,保证交通安全,提高通行效率,形成的安全、高效和环保的道路交通***。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、数字孪生、虚拟人、机器人、人工智能生成内容(即AIGC)、对话式交互、智能医疗、智能客服以及游戏AI等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
本申请实施例提供的导航播报数据处理方法,具体涉及人工智能技术中的机器学***板电脑、物联网设备、便携式可穿戴设备以及飞行器等,物联网设备可为智能音箱、智能电视、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以是独立的物理播控服务器,也可以是多个物理播控服务器构成的播控服务器集群,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云播控服务器。其中,智能终端设备102以及服务器104可以通过有线或无线通信方式进行直接或间接地连接,本申请实施例中不对此进行限制。
具体来说,智能终端设备102和服务器104均可单独用于执行本申请实施例中提供的导航播报数据处理方法,智能终端设备102和服务器104也可以协同执行本申请实施例提供的导航播报数据处理方法。举例来说,以智能终端设备102和服务器104协同执行本申请实施例提供的导航播报数据处理方法为例,服务器104通过获取多个导航路段各自对应的初始播报配置数据,根据初始播报配置数据生成多个标准播报文本,并通过利用根据风格化文本提示信息对标准播报文本生成模型进行训练得到的风格化播报文本生成模型,对多个标准播报文本分别进行文本风格转换,得到多个标准播报文本各自对应的至少一个候选风格化播报文本。进一步地,服务器104针对每个标准播报文本,对标准播报文本对应的至少一个候选风格化播报文本进行文本评估,得到至少一个候选风格化播报文本各自的评估结果,以根据评估结果确定与标准播报文本对应的目标风格播报文本,从而可将目标风格播报文本和当前导航路段对应的初始播报配置数据进行结合,得到和当前导航路段对应的风格化导航播报数据,以将风格化导航播报数据反馈至智能终端设备102进行播报,达到车辆导航的目的。
其中,多个导航路段各自对应的初始播报配置数据、根据初始播报配置数据生成的多个标准播报文本、与每一标准播报文本各自对应的至少一个候选风格化播报文本、至少一个候选风格化播报文本各自的评估结果、以及与标准播报文本对应的目标风格播报文本等数据,可存储在服务器104的云端存储中、或数据存储***中、或智能终端设备102的本地存储中,当需要进行导航播报数据处理时,可从服务器104、或数据存储***、或智能终端设备102的本地存储中获取。
在一个示例性的实施例中,如图2所示,提供了一种导航播报数据处理方法,该方法可以由终端或服务器单独执行,也可以由终端和服务器协同执行。在本申请实施例中,以该方法应用于图1中的服务器104为例进行说明,包括以下步骤S202至步骤206。其中:
步骤S202,获取多个导航路段各自对应的初始播报配置数据,根据初始播报配置数据生成多个标准播报文本。
其中,不同导航路段可对应不同的导航场景,比如“前方直行”、“前方左转,进入XX路”以及“在红绿灯路口右转,进入XX环岛” 等不同的具体场景,而不同导航场景分别配置有各自对应的初始播报配置数据。其中,初始播报配置数据中,通常包含导航标签,比如<distance>即里程、<roadNames>即道路名称、<roundaboutName>即环岛名称、以及<cityName>即城市名称等导航标签,还包括与导航标签对应的具体参数值,比如与<distance>即里程对应的“200米”、与<roadNames>即道路名称对应的“A路”、与<roundaboutName>即环岛名称对应的“B环岛”、以及与<cityName>即城市名称对应的“C市”等数据。
示例性地,比如“前方直行”的导航场景对应的初始播报配置数据,具体可以是“前方200米直行”,而“前方左转,进入XX路”的导航场景对应的初始播报配置数据,则具体可以是“前方500米左转,进入A路”,与“在红绿灯路口右转,进入XX环岛”的导航场景对应的初始播报配置数据,具体可以是“在红绿灯路口右转,进入B环岛”。
具体地,通过获取多个导航路段对应的导航场景、以及与多个导航场景各自对应的初始播报配置数据,并针对每个初始播报配置数据,对初始播报配置数据进行导航标签识别,以获得初始播报配置数据携带的导航标签。
其中,在获得不同导航路段对应的各导航场景,比如获得“前方直行”、“前方左转,进入XX路”以及“在红绿灯路口右转,进入XX环岛” 等不同的具体场景后,进一步获取针对不同导航场景分别配置的初始播报配置数据,比如“前方200米直行”、“前方500米左转,进入A路”、以及“在红绿灯路口右转,进入B环岛”等具体的初始播报配置数据,并针对每个初始播报配置数据,对初始播报配置数据进行导航标签识别,比如获得<distance>即里程、<roadNames>即道路名称、以及<roundaboutName>即环岛名称等导航标签。
进一步地,在获得初始播报配置数据携带的导航标签后,根据初始播报配置数据和初始播报配置数据携带的导航标签,生成携带导航标签的标准播报文本。
其中,标准播报文本指的是携带有导航标签的播报文案,比如“前方<distance>,在红绿灯路口右转,进入<roadName>”。示例性地,根据 “前方500米左转,进入A路”、以及“在红绿灯路口右转,进入B环岛”等具体的初始播报配置数据,以及初始播报配置数据携带的导航标签,包括<distance>、<roadNames>、以及<roundaboutName>等导航标签后,根据具体的初始播报配置数据、以及初始播报配置数据携带的导航标签,生成携带导航标签的标准播报文本,包括“前方<distance>左转,进入<roadName>”、“在红绿灯路口右转,进入<roundaboutName>环岛”等播报文本。
步骤S204,通过训练好的风格化播报文本生成模型,对多个标准播报文本分别进行文本风格转换,得到多个标准播报文本各自对应的至少一个候选风格化播报文本,风格化播报文本生成模型,是根据风格化文本提示信息对标准播报文本生成模型进行训练得到的,风格化文本提示信息包括风格化查询数据和风格化播报文本。
其中,在利用训练好的风格化播报文本生成模型,对多个标准播报文本分别进行文本风格转换之前,需训练得到标准播报文本生成模型,并进一步根据风格化文本提示信息对标准播报文本生成模型进行二次训练,以生成训练好的风格化播报文本生成模型。
具体地,通过构建标准播报文本相应的对话训练样本,并根据对话训练样本对初始文本生成模型进行训练,获得训练好的标准文本生成模型。进一步地,通过获取多轮风格化交互数据,并根据多轮风格化交互数据构建得到风格化文本提示信息,以根据风格化文本提示信息,对标准文本生成模型进行二次训练,以获得训练好的风格化播报文本生成模型。
示例性地,多轮风格化交互数据具体可以是多轮风格化对话数据,比如首次对话为“请将下面句子改为孙悟空风格:准备出发”—“现在启程”,第二次对话为“好的。这句:前方红绿灯直行”—“施主,前方道路红绿灯请直行”,以及第三次对话为“好的。这句:导航结束”—“师傅,咱们到了”等,即多轮风格化对话数据中,通常包括:风格化查询数据即“请将下面句子改为孙悟空风格”、“这句:前方红绿灯直行”即具体需要进行风格转换的标准文本、以及“施主,前方道路红绿灯请直行”即风格化播报文本等具体数据。
其中,风格化文本提示信息通常包括风格化查询数据和风格化播报文本,而通过对多轮风格化交互数据进行解析,可获得与多轮风格化交互数据对应的多个风格化查询数据、以及与多个风格化查询数据各自对应的风格化播报文本,从而可根据多个风格化查询数据、以及与多个风格化查询数据各自对应的风格化播报文本,构建得到风格化文本提示信息。
也就是说,针对多轮风格化交互数据所构建的风格化文本提示信息中,通常包括多个风格化查询数据、以及与多个风格化查询数据各自对应的风格化播报文本,即可以采用多个风格化查询数据、以及与多个风格化查询数据各自对应的风格化播报文本,持续对标准文本生成模型进行二次训练,以获得训练好的风格化播报文本生成模型。
进一步地,在获得训练好的风格化播报文本生成模型后,通过将多个标准播报文本输入训练好的风格化播报文本生成模型,以通过训练好的风格化播报文本生成模型,对多个标准播报文本分别进行文本风格转换,获得多个标准播报文本各自对应的至少一个候选风格化播报文本。
具体来说,通过将多个标准播报文本输入训练好的风格化播报文本生成模型,以基于所述风格化播报文本生成模型对应的风格化文本提示信息,获得对所述多个标准播报文本进行文本风格转换的转换指引信息。
其中,风格化播报文本生成模型对应的风格化文本提示信息,具体包括多个风格化查询数据、以及与多个风格化查询数据各自对应的风格化播报文本,比如针对“请将下面句子改为孙悟空风格:准备出发”的风格化查询数据,其对应的风格化播报文本可以是多个,包括比如 “现在启程”、“取经之路开始”、以及“快快启程回家”等,进而针对每个标准播报文本,比如针对“前方<distance>红绿灯直行”的标准播报文本,其对应的标准查询数据为“请生成一条标准播报文案”, 进而可根据“请将下面句子改为孙悟空风格:准备出发”的风格化查询数据,生成对标准查询数据为“请生成一条标准播报文案”的转换指引信息,比如生成将标准查询数据为“请生成一条标准播报文案”转换成“请生成一条孙悟空风格的播报文案”的风格化查询数据的转换指引信息,并进一步获得将“前方<distance>红绿灯直行”的标准播报文本转换成孙悟空风格的风格化播报文本的转换指引信息。
进一步地,根据各所述转换指引信息,分别对多个标准播报文本进行文本风格转换,得到所述多个标准播报文本各自对应的至少一个候选风格化播报文本。其中,具体可根据将标准查询数据为“请生成一条标准播报文案”转换成“请生成一条孙悟空风格的播报文案”的风格化查询数据的转换指引信息,确定将“前方<distance>红绿灯直行”的标准播报文本转换成孙悟空风格的风格化播报文本的转换指引信息,即需要将查询数据和播报文本的风格进行统一,比如均属于孙悟空风格时,则可根据“请生成一条孙悟空风格的播报文案”的查询数据,生成与孙悟空风格的风格化播报文本“施主,前方200米红绿灯直行”。
示例性地,针对“准备出发”的标准播报文本,通过训练好的风格化播报文本生成模型对应的风格化文本提示信息,获得对该标准播报文本进行文本风格转换的转换指引信息,以根据转换指引信息对其进行文本风格转换,可获得采用孙悟空风格的“现在启程”、“取经之路开始”、以及“快快启程回家”等多个候选风格化播报文本。比如,针对“前方200米红绿灯直行” 的标准播报文本,通过训练好的风格化播报文本生成模型对应的风格化文本提示信息,获得对该标准播报文本进行文本风格转换的转换指引信息,以根据转换指引信息对其进行文本风格转换,可获得采用孙悟空风格的“施主,前方200米红绿灯直行”、以及“师傅,前方道路200米红绿灯请直行” 等多个候选风格化播报文本。又比如,针对“导航结束”的标准播报文本,通过训练好的风格化播报文本生成模型对应的风格化文本提示信息,获得对该标准播报文本进行文本风格转换的转换指引信息,以根据转换指引信息对其进行文本风格转换,可获得采用孙悟空风格的“施主,咱们到了”、以及“师傅,咱们取经之路到此结束” 等多个候选风格化播报文本。
可以理解的是,本申请实施例中,通过应用训练好的风格化播报文本生成模型,针对不同标准播报文本,获得符合实际要求风格(比如孙悟空风格)的多个候选风格化播报文本,相比传统的人工标注或人工配置不同导航路段的风格化文案的方式,可极大减少人工标注的成本和资源消耗。且在本申请实施例中,通过应用训练好的风格化播报文本生成模型,针对标准播报文本所生成的候选风格化播报文本的数量为多个时,可针对同一导航路段,在不同导航时间段内随机确定出与标准播报文本匹配的任一目标风格播报文本,以在针对不同导航时间段内经过同一导航路段时,相比传统导航使用的每个导航路段采用固定话术和固定播报内容,本申请实施例中提供的导航播报数据处理方法,针对不同导航时间段内经过同一导航路段的情况时,可提供多种不同形式或具体内容的导航播报内容,增强导航播报文本的多样性,提高导航的多样性和趣味性。
步骤S206,针对每个标准播报文本,对标准播报文本对应的至少一个候选风格化播报文本进行文本评估,得到至少一个候选风格化播报文本各自的评估结果,根据评估结果确定与标准播报文本对应的目标风格播报文本。
具体地,针对每个标准播报文本,通过训练好的标准文本分类模型,对标准播报文本对应的至少一个候选风格化播报文本进行文本评估,得到至少一个候选风格化播报文本各自的评估结果,根据至少一个候选风格化播报文本各自的评估结果,对至少一个候选风格化播报文本进行筛选,筛选并保留文本评估结果为携带导航标签的中间风格化播报文本,并通过获取对中间风格化播报文本进行复核的第一复核结果,以根据第一复核结果,确定与标准播报文本对应的目标风格播报文本。
其中,根据至少一个候选风格化播报文本各自的评估结果,对至少一个候选风格化播报文本进行筛选时,可将未携带导航标签的播报文本过滤掉,保留携带导航标签的中间风格化播报文本,减少标签丢失或标签变更的情况出现,保障导航播报数据的正确性。可以理解的是,通过预先对至少一个候选风格化播报文本进行筛选,过滤掉未携带导航标签的播报文本,可减少后续需进行的复核操作次数,提升风格化播报文本的生成效率。
在一个示例性的实施例中,在筛选并保留文本评估结果为携带导航标签的中间风格化播报文本后,进一步根据训练好的风格化评分模型,对各中间风格化播报文本进行风格评估,获得风格评估结果,以按照风格评估结果,对各中间风格化播报文本进行排序和筛选,获得二次筛选风格化播报文本,并进一步获取对二次筛选风格化播报文本进行复核的第二复核结果,以根据第二复核结果,确定与标准播报文本对应的目标风格播报文本。
其中,在筛选并保留文本评估结果为携带导航标签的中间风格化播报文本后,进一步根据训练好的风格化评分模型,对各中间风格化播报文本进行风格评估,可基于各中间风格化播报文本进行进一步排序和筛选,以获得风格与实际要求的个性化风格(比如孙悟空风格)更贴近的二次筛选风格化播报文本,可减少反复调整和生成风格化播文案的处理操作,提升风格化播报文本的生成效率。
上述导航播报数据处理方法中,通过获取多个导航路段各自对应的初始播报配置数据,并根据初始播报配置数据生成多个标准播报文本,以利用根据风格化文本提示信息对标准播报文本生成模型进行训练得到的风格化播报文本生成模型,对多个标准播报文本分别进行文本风格转换,可得到多个标准播报文本各自对应的至少一个候选风格化播报文本,实现了采用将模型微调和提示信息引导相结合的方式,快速获得所需风格化的候选风格化播报文本,减少了人工配置带来的资源消耗,同时可针对不同导航路段对应的初始播报配置数据进行全面配置,提升了风格化播报文本的覆盖面,避免在导航过程中出现导航播报文本风格不一,前后衔接性差的问题。进一步地,针对每个标准播报文本,对标准播报文本对应的至少一个候选风格化播报文本进行文本评估,得到至少一个候选风格化播报文本各自的评估结果,以根据评估结果确定与标准播报文本对应的目标风格播报文本,通过进一步评估和筛选,减少调整或生成播报文案的重复操作,提升了风格化播报文本的生成效率。
在一个示例性的实施例中,如图3所示,训练得到风格化播报文本生成模型的步骤,具体包括以下步骤S302至步骤S306。其中:
步骤S302,获取多轮风格化交互数据,解析多轮风格化交互数据,获得与多轮风格化交互数据对应的多个风格化查询数据、以及与多个风格化查询数据各自对应的风格化播报文本。
具体地,多轮风格化交互数据具体可以是多轮风格化对话数据,即服务器具体是获取包括首次对话为“请将下面句子改为孙悟空风格:准备出发”—“现在启程”,第二次对话为“好的。这句:前方红绿灯直行”—“施主,前方道路红绿灯请直行”,以及第三次对话为“好的。这句:导航结束”—“师傅,咱们到了”等多轮风格化对话数据,并通过对多轮风格化交互数据进行解析,可获得与多轮风格化交互数据对应的多个风格化查询数据,比如获得“请将下面句子改为孙悟空风格:准备出发”、“这句:前方红绿灯直行”、“这句:导航结束”等风格化查询数据,以及获得与多个风格化查询数据各自对应的风格化播报文本,包括“现在启程”、“施主,前方道路红绿灯请直行”、以及“师傅,咱们到了”等风格化播报文本。
步骤S304,根据多个风格化查询数据、以及与多个风格化查询数据各自对应的风格化播报文本,构建得到风格化文本提示信息。
具体地,在获得与多轮风格化交互数据对应的多个风格化查询数据、以及与多个风格化查询数据各自对应的风格化播报文本后,比如获得“请将下面句子改为孙悟空风格:准备出发”、“这句:前方红绿灯直行”、“这句:导航结束”等风格化查询数据,和“现在启程”、“施主,前方道路红绿灯请直行”、以及“师傅,咱们到了”等风格化播报文本后,进一步根据多个风格化查询数据、以及与多个风格化查询数据各自对应的风格化播报文本,构建得到风格化文本提示信息,比如构建得到“请将下面句子改为孙悟空风格:准备出发”—“现在启程”、“请将下面句子改为孙悟空风格:前方红绿灯直行”—“施主,前方道路红绿灯请直行”、以及“请将下面句子改为孙悟空风格:导航结束”—“师傅,咱们到了”等多组风格化文本提示信息。
在一个示例性的实施例中,如图4所示,提供了一种风格化文本提示信息的示例,参照图4可知,提供了“请将下面句子改为孙悟空风格:准备出发”—“现在启程”、“好的。这句:前方红绿灯直行”—“施主,前方道路红绿灯请直行”、以及“好的。这句:导航结束”—“师傅,咱们到了”等多轮风格化对话数据,基于该些多轮风格化对话数据进行解析,可获得“请将下面句子改为孙悟空风格:准备出发”、“这句:前方红绿灯直行”、“这句:导航结束”等风格化查询数据,和“现在启程”、“施主,前方道路红绿灯请直行”、以及“师傅,咱们到了”等风格化播报文本,进而构建得到“请将下面句子改为孙悟空风格:准备出发”—“现在启程”、“请将下面句子改为孙悟空风格:前方红绿灯直行”—“施主,前方道路红绿灯请直行”、以及“请将下面句子改为孙悟空风格:导航结束”—“师傅,咱们到了”等多组风格化文本提示信息。
在一个示例性的实施例中,如图5所示,提供了另一种风格化文本提示信息的示例,参照图5可知,通过针对语言大模型预先设置“你是一个语音播报文案的风格化改写员,擅长将所给文案改写为特定风格,且确保标签不丢、含义不变。以下是一些例子:请将下面句子改为孙悟空风格:准备出发—现在启程、前方红绿灯直行—施主,前方道路红绿灯请直行、以及导航结束—师傅,咱们到了…”的风格化文本提示信息,从而可将该风格化文本提示信息作为语言大模型后续对话的指引,进而通过采用预先设置清晰明确的***提示的方式,有效提升语言大模型的回复质量,即提升所获得的风格化播报文本的准确度。
步骤S306,根据风格化文本提示信息,对标准文本生成模型进行训练,获得训练好的风格化播报文本生成模型。
具体地,根据“请将下面句子改为孙悟空风格:准备出发”—“现在启程”、“请将下面句子改为孙悟空风格:前方红绿灯直行”—“施主,前方道路红绿灯请直行”、以及“请将下面句子改为孙悟空风格:导航结束”—“师傅,咱们到了”等多组风格化文本提示信息,对标准文本生成模型进行训练,直至满足风格化播报文本生成模型的训练结束条件,获得训练好的风格化播报文本生成模型。
其中,风格化播报文本生成模型的训练结束条件,具体可以是模型训练损失值达到预设损失阈值,或对标准文本生成模型的训练迭代次数达到预设迭代次数。
进一步地,在训练得到风格化播报文本生成模型之前,还包括训练得到标准文本生成模型,训练得到标准文本生成模型的步骤具体包括:
针对每个标准播报文本,获取与标准播报文本对应的标准查询数据;基于标准查询数据和标准播报文本,构建标准播报文本相应的对话训练样本;根据多个标准播报文本各自相应的对话训练样本,对初始文本生成模型进行训练,获得训练好的标准文本生成模型。
具体地,针对每个标准播报文本,获取与标准播报文本对应的标准查询数据,比如针对“前方<distance>直行”的标准播报文本,获取与其对应的标准查询数据为“请生成一条标准播报文案”,则可基于“请生成一条标准播报文案”的标准查询数据、以及“前方<distance>直行”的标准播报文本,构建标准播报文本相应的对话训练样本,即构建“请生成一条标准播报文案”—“前方<distance>直行”的对话训练样本。
其中,由于不同导航路段各自对应的初始播报配置数据不同,针对不同导航路段,同一标准查询数据通常可对应多条标准播报文本,比如针对“准备出发”的标准播报文本,获取与其对应的标准查询数据为“请生成一条标准播报文案”,针对“前方<distance>红绿灯右拐”的标准播报文本,其对应的标准查询数据同样也为“请生成一条标准播报文案”,同样地,针对“导航结束”的标准播报文本,其对应的标准查询数据也可以是“请生成一条标准播报文案”,从而针对所获取的标准查询数据和标准播报文本,构建标准播报文本相应的对话训练样本,即得到多个对话训练样本,包括“请生成一条标准播报文案”—“前方<distance>直行”、“请生成一条标准播报文案”—“准备出发”、“请生成一条标准播报文案”—“前方<distance>红绿灯右拐”、以及“请生成一条标准播报文案”—“导航结束”等多个对话训练样本。
进一步地,根据“请生成一条标准播报文案”—“前方<distance>直行”、“请生成一条标准播报文案”—“准备出发”、“请生成一条标准播报文案”—“前方<distance>红绿灯右拐”、以及“请生成一条标准播报文案”—“导航结束”等多个对话训练样本,对初始文本生成模型进行训练,直至满足标准文本生成模型的训练结束条件,获得训练好的标准文本生成模型。
其中,标准文本生成模型的训练结束条件,具体可以是模型训练损失值达到预设损失阈值,或对初始文本生成模型的训练迭代次数达到预设迭代次数。示例性地,初始文本生成模型具体可以是LLaMA(即Large Language Model Meta AI,理解为大语言模型)、或GPT(即Generative pretrained transformer,理解为生成性预训练转化模型)等。
本实施例中,通过获取多轮风格化交互数据,解析多轮风格化交互数据,以获得与多轮风格化交互数据对应的多个风格化查询数据、以及与多个风格化查询数据各自对应的风格化播报文本,并根据多个风格化查询数据、以及与多个风格化查询数据各自对应的风格化播报文本,构建得到风格化文本提示信息,从而可根据风格化文本提示信息,对标准文本生成模型进行训练,获得训练好的风格化播报文本生成模型,实现了从多轮风格化交互数据的角度,获得用于对标准文本生成模型进行训练的风格化查询数据、以及与风格化查询数据各自对应的风格化播报文本,使得训练好的风格化播报文本生成模型具有生成特定风格的播报文本的功能,减少反复配置风格化播报文本的资源消耗,提升风格化播报文本的生成效率。
在一个示例性的实施例中,如图6所示,确定与标准播报文本对应的目标风格播报文本的步骤,即针对每个标准播报文本,对标准播报文本对应的至少一个候选风格化播报文本进行文本评估,得到至少一个候选风格化播报文本各自的评估结果,根据评估结果确定与标准播报文本对应的目标风格播报文本的步骤,具体包括以下步骤S602至步骤S606,其中:
步骤S602,针对每个标准播报文本,通过训练好的标准文本分类模型,对标准播报文本对应的至少一个候选风格化播报文本进行文本评估,得到至少一个候选风格化播报文本各自的评估结果。
具体地,通过对初始文本分类模型进行训练,获得训练好的标准文本分类模型,针对每个标准播报文本,将每个标准播报文本对应的至少一个候选风格化播报文本输入训练好的标准文本分类模型中,以通过训练好的标准文本分类模型,对标准播报文本对应的至少一个候选风格化播报文本进行文本评估,获得至少一个候选风格化播报文本各自的评估结果。
其中,文本评估结果包括候选风格化播报文本携带导航标签、以及候选风格化播报文本未携带导航标签。其中,训练好的标准文本分类模型,具有对各候选风格化播报文本是否携带导航标签进行评估,从而可确定出是否存在丢失导航标签(即未携带导航标签)的候选风格化播报文本,以过滤掉未携带导航标签的播报文本,可减少后续需进行的复核操作次数。
在一个示例性的实施例中,训练得到标准文本分类模型的方式,包括:
获取携带导航标签的多个标准播报文本、以及未携带导航标签的多个缺失播报文本;将携带导航标签的多个标准播报文本分别作为正样本,并将未携带导航标签的多个缺失播报文本分别作为负样本,得到标签分类训练样本集;根据标签分类训练样本集,对初始文本分类模型进行训练,获得训练好的标准文本分类模型。
具体地,获取携带导航标签的多个标准播报文本,比如“前方<distance>直行”、“前方<distance>左转,进入<roadName>”、“在红绿灯路口右转,进入<roundaboutName>环岛”等,并获取未携带导航标签的多个缺失播报文本,比如“前方米直行”、“前方米左转,进入路”、“在红绿灯路口右转,进入环岛”等,并将多个标准播报文本分别作为正样本,以及将未携带导航标签的多个缺失播报文本分别作为负样本,构建得到标签分类训练样本集。
示例性地,标准播报文本 “前方<distance>直行”作为正样本,其标签为“1”,而缺失播报文本“前方米直行”作为负样本,其标签为“0”,以此类推,标准播报文本“前方<distance>左转,进入<roadName>” 作为正样本,其标签为“1”,缺失播报文本“前方米左转,进入路”作为负样本,其标签为“0”。同样地,标准播报文本“在红绿灯路口右转,进入<roundaboutName>环岛” 作为正样本,其标签为“1”,而缺失播报文本“在红绿灯路口右转,进入环岛” 作为负样本,其标签为“0”。
进一步地,根据“前方<distance>直行”—“1”、“前方米直行”—“0”、“前方<distance>左转,进入<roadName>”—“1”、“前方米左转,进入路”—“0”、“在红绿灯路口右转,进入<roundaboutName>环岛”—“1”、“在红绿灯路口右转,进入环岛”—“0”等构建得到的标签分类训练样本集,对初始文本分类模型进行训练,直至满足标准文本分类模型的训练结束条件,获得训练好的标准文本分类模型。
其中,标准文本分类模型的训练结束条件,具体可以是模型训练损失值达到预设损失阈值,或对初始文本分类模型的训练迭代次数达到预设迭代次数。示例性地,初始文本分类模型具体可以是LLaMA(即Large Language Model Meta AI,理解为大语言模型)、或GPT(即Generative pretrained transformer,理解为生成性预训练转化模型)等。
步骤S604,基于各候选风格化播报文本,确定出文本评估结果为携带导航标签的中间风格化播报文本。
具体地,文本评估结果包括候选风格化播报文本携带导航标签、以及候选风格化播报文本未携带导航标签。通过利用训练好的标准文本分类模型,具有对各候选风格化播报文本是否携带导航标签进行评估,从而可确定出是否存在丢失导航标签(即未携带导航标签)的候选风格化播报文本,以过滤掉未携带导航标签的播报文本,即保留文本评估结果为携带导航标签的中间风格化播报文本。
步骤S606,获取对中间风格化播报文本进行复核的第一复核结果,根据第一复核结果,确定与标准播报文本对应的目标风格播报文本。
具体地,在获得文本评估结果为携带导航标签的各中间风格化播报文本后,进一步触发对中间风格化播报文本的复核指令,并获取响应复核指令所反馈的对中间风格化播报文本进行复核的第一复核结果,以根据第一复核结果,确定与标准播报文本对应的目标风格播报文本。
其中,第一复核结果表示对各中间风格化播报文本进行进一步复核后获得的复核评分结果,比如文本评估结果为携带导航标签的各中间风格化播报文本的数量为3个,包括中间风格化播报文本1、中间风格化播报文本2、以及中间风格化播报文本3,则通过获取针对中间风格化播报文本1、中间风格化播报文本2、以及中间风格化播报文本3的第一复核评分结果,从而可根据对各中间风格化播报文本的第一复核评分结果,确定出最高复核评分的中间风格化播报文本(比如中间风格化播报文本1)作为目标风格播报文本。
其中,标准播报文本对应的目标风格播报文本可以有多个,则还可根据对各中间风格化播报文本的第一复核评分结果,对各中间风格化播报文本进行排序,确定排序靠前的若干个中间风格化播报文本(比如中间风格化播报文本1和中间风格化播报文本3),作为目标风格播报文本。
本实施例中,针对每个标准播报文本,通过训练好的标准文本分类模型,对标准播报文本对应的至少一个候选风格化播报文本进行文本评估,得到至少一个候选风格化播报文本各自的评估结果,并基于各候选风格化播报文本,确定出文本评估结果为携带导航标签的中间风格化播报文本,从而可将未携带导航标签的播报文本过滤掉,保留携带导航标签的中间风格化播报文本,减少标签丢失或标签变更的情况出现,保障导航播报数据的正确性。进一步地,通过获取对中间风格化播报文本进行复核的第一复核结果,根据第一复核结果进行进一步筛选,确定与标准播报文本对应的目标风格播报文本,提升了所确定出的目标风格播报文本的精准度,同时减少反复调整和风格化播报文本的处理操作,进一步提升目标风格播报文本的生成效率。
在一个示例性的实施例中,如图7所示,确定与标准播报文本对应的目标风格播报文本的步骤,即针对每个标准播报文本,对标准播报文本对应的至少一个候选风格化播报文本进行文本评估,得到至少一个候选风格化播报文本各自的评估结果,根据评估结果确定与标准播报文本对应的目标风格播报文本的步骤,具体包括以下步骤S702至步骤S710。其中:
步骤S702,针对每个标准播报文本,通过训练好的标准文本分类模型,对标准播报文本对应的至少一个候选风格化播报文本进行文本评估,得到至少一个候选风格化播报文本各自的评估结果。
具体地,通过对初始文本分类模型进行训练,获得训练好的标准文本分类模型,针对每个标准播报文本,将每个标准播报文本对应的至少一个候选风格化播报文本输入训练好的标准文本分类模型中,以通过训练好的标准文本分类模型,对标准播报文本对应的至少一个候选风格化播报文本进行文本评估,获得至少一个候选风格化播报文本各自的评估结果。
步骤S704,基于各候选风格化播报文本,确定出文本评估结果为携带导航标签的中间风格化播报文本。
具体地,文本评估结果包括候选风格化播报文本携带导航标签、以及候选风格化播报文本未携带导航标签。通过利用训练好的标准文本分类模型,具有对各候选风格化播报文本是否携带导航标签进行评估,从而可确定出是否存在未携带导航标签的候选风格化播报文本,以过滤掉未携带导航标签的播报文本,即保留文本评估结果为携带导航标签的中间风格化播报文本。
步骤S706,根据训练好的风格化评分模型,对各中间风格化播报文本进行风格评估,获得风格评估结果。
具体地,通过对初始文本评分模型进行训练,获得训练好的风格化评分模型,并将各中间风格化播报文本输入训练好的风格化评分模型,以通过训练好的风格化评分模型,对各中间风格化播报文本进行风格评估,获得风格评估结果。
其中,利用训练好的风格化评分模型,可对各中间风格化播报文本的风格和实际要求的个性化风格(比如孙悟空风格)之间的相似度进行评估,从而得到相应的风格评估结果。
在一个示例性的实施例中,获得训练好的风格化评分模型的方式,包括:
获取与风格化文本提示信息关联的各风格化语料数据;将各风格化语料数据分别作为正样本,并将标准播报文本分别作为负样本,得到风格化训练样本集;根据风格化训练样本集对初始文本评分模型进行训练,获得训练好的风格化评分模型。
具体地,风格化文本提示信息包括风格化查询数据、以及与风格化查询数据对应的风格化播报文本,根据风格化查询数据以及风格化播报文本,可确定当前的风格化文本提示信息对应的个性化风格(比如孙悟空风格),则可获取与风格化文本提示信息对应的个性化风格关联的各风格化语料数据(比如从涉及孙悟空的影视剧、广播剧以及文档等,提取台词,作为与孙悟空风格关联的风格化语料数据)。
进一步地,通过将各标准播报文本分别作为负样本、以及将各风格化语料数据作为正样本,构建得到风格化训练样本集,以根据风格化训练样本集对初始文本评分模型进行训练,直至满足风格化评分模型的训练结束条件,获得训练好的风格化评分模型。
其中,风格化评分模型的训练结束条件,具体可以是模型训练损失值达到预设损失阈值,或对初始文本评分模型的训练迭代次数达到预设迭代次数。示例性地,初始文本评分模型具体可以是LLaMA(即Large Language Model Meta AI,理解为大语言模型)、或GPT(即Generative pretrained transformer,理解为生成性预训练转化模型)等。
步骤S708,按照风格评估结果,对各中间风格化播报文本进行排序和筛选,获得二次筛选风格化播报文本。
具体地,在获得各中间风格化播报文本各自对应的风格评估结果后,按照风格评估结果,对各中间风格化播报文本进行排序,比如按照风格评估结果的实际评分值大小,对各中间风格化播报文本进行排序,获得中间风格化播报文本序列。其中,具体可按照风格评估结果的实际评分值从大至小,对各中间风格化播报文本进行排序,也可按照风格评估结果的实际评分值从小至大,对各中间风格化播报文本进行排序。
进一步地,在对各中间风格化播报文本进行排序,获得中间风格化播报文本序列后,根据预设筛选要求,从中间风格化播报文本序列中筛选出二次筛选风格化播报文本。
其中,预设筛选要求具体可以是预设文本数量要求,比如在中间风格化播报文本序列中,按照风格评估结果的实际评分值从大至小的方式,筛选排序靠前的预设个数的二次筛选风格化播报文本。同样地,预设筛选要求还可以是风格评估结果的实际评分阈值,即从中间风格化播报文本序列中,筛选出风格评估结果的实际评分值大于实际评分阈值的若干二次筛选风格化播报文本。
步骤S710,获取对二次筛选风格化播报文本进行复核的第二复核结果,根据第二复核结果,确定与标准播报文本对应的目标风格播报文本。
具体地,在获得各二次筛选风格化播报文本后,进一步触发对二次筛选风格化播报文本的复核指令,并获取响应复核指令所反馈的对二次筛选风格化播报文本进行复核的第二复核结果,以根据第二复核结果,确定与标准播报文本对应的目标风格播报文本。
其中,第二复核结果表示对各二次筛选风格化播报文本进行进一步复核后获得的复核评分记过,比如二次筛选风格化播报文本的数量为2个,包括二次筛选风格化播报文本1、以及二次筛选风格化播报文本2,则具体是获取二次筛选风格化播报文本1、以及二次筛选风格化播报文本2的第二复核结果,以根据对各二次筛选风格化播报文本的第二复核评分结果,确定出最高复核评分的二次筛选风格化播报文本(比如二次筛选风格化播报文本1)作为目标风格播报文本。
可选地,二次筛选风格化播报文本的数量可以是多个(比如二次筛选风格化播报文本1、二次筛选风格化播报文本2以及二次筛选风格化播报文本3),而标准播报文本对应的目标风格播报文本可以有多个,进而还可根据对各二次筛选风格化播报文本的第二复核评分结果,对各二次筛选风格化播报文本进行排序,确定排序靠前的若干个二次筛选风格化播报文本(比如二次筛选风格化播报文本2、二次筛选风格化播报文本3),作为目标风格播报文本。
本实施例中,针对每个标准播报文本,通过训练好的标准文本分类模型,对标准播报文本对应的至少一个候选风格化播报文本进行文本评估,得到至少一个候选风格化播报文本各自的评估结果,并基于各候选风格化播报文本,确定出文本评估结果为携带导航标签的中间风格化播报文本,从而可将未携带导航标签的播报文本过滤掉,保留携带导航标签的中间风格化播报文本,减少标签丢失或标签变更的情况出现,保障导航播报数据的正确性。进一步地,根据训练好的风格化评分模型,对各中间风格化播报文本进行风格评估,获得风格评估结果,以按照风格评估结果,对各中间风格化播报文本进行排序和筛选,获得二次筛选风格化播报文本,从而实现了利用风格化评分模型对各中间风格化播报文本的二次评估和筛选,剔除风格评分不符合实际要求的中间风格化播报文本,减少后续复核和筛选时的资源消耗。而通过获取对二次筛选风格化播报文本进行复核的第二复核结果,根据第二复核结果进行进一步筛选,确定与标准播报文本对应的目标风格播报文本,提升了所确定出的目标风格播报文本的精准度,同时减少反复调整和风格化播报文本的处理操作,进一步提升目标风格播报文本的生成效率。
在一个示例性的实施例中,如图8所示,提供了一种导航播报数据处理方法,该方法可以由终端或服务器单独执行,也可以由终端和服务器协同执行。在本申请实施例中,以该方法应用于图1中的服务器104为例进行说明,包括以下步骤S802至步骤S806。其中:
步骤S802,当目标风格播报文本的数量为多个,生成与标准播报文本对应的候选播报文案列表。
具体地,当针对标准播报文本所生成的目标风格播报文本的数量为多个时,服务器则根据多个目标风格播报文本,生成与该标准播报文本对应的候选播报文案列表。
示例性地,比如针对“准备出发”的标准播报文本,所生成的目标风格播报文本,具体可包括“现在启程”、“取经之路开始”、以及“快快启程回家”,针对“导航结束”的标准播报文本,所生成的目标风格播报文本,具体可包括“施主,咱们到了”、以及 “师傅,咱们取经之路到此结束” 等,从而可针对“准备出发”的标准播报文本,生成包括“现在启程”、“取经之路开始”、以及“快快启程回家”等多个目标风格播报文本的候选播报文案列表。同样地,针对“导航结束”的标准播报文本,生成包括“施主,咱们到了”、以及 “师傅,咱们取经之路到此结束” 等多个目标风格播报文本的候选播报文案列表。
步骤S804,根据候选播报文案列表,针对同一导航路段,在不同导航时间段内随机确定出与标准播报文本匹配的目标风格播报文本。
具体地,由于候选播报文案列表中通常包括多个目标风格播报文本,进而用户在不同导航时间段内多次途经同一导航路段时,服务器可基于候选播报文案列表,随机确定出与标准播报文本匹配的目标风格播报文本,即可在不同导航时间段内分别采用不同的目标风格播报文本进行导航播报,以提升导航播报的多样性和趣味性,避免采用单一固定的导航播报方式,满足实际应用过程中的个性化需求。
步骤S806,根据导航路段对应的初始播报配置数据、以及随机确定出的目标风格播报文本,生成与对应导航路段对应的风格化导航播报数据。
具体地,在用户在不同导航时间段内多次途经同一导航路段时,服务器基于候选播报文案列表,随机确定出与标准播报文本匹配的目标风格播报文本后,进一步获取相应导航路段对应的初始播报配置数据,以根据导航路段对应的初始播报配置数据、以及随机确定出的目标风格播报文本,在不同导航时间段,分别生成与对应导航路段对应的风格化导航播报数据。
示例性地,用户A在多个导航时间段内,比如1月2号、1月3号、以及1月4号,均途经导航路段1,针对导航路段1,服务器针对“准备出发”的标准播报文本,生成了包括“现在启程”、“取经之路开始”、以及“快快启程回家”等多个目标风格播报文本的候选播报文案列表,以及针对“导航结束”的标准播报文本,生成了包括“施主,咱们到了”、以及 “师傅,咱们取经之路到此结束” 等多个目标风格播报文本的候选播报文案列表,从而用户A在1月2号、1月3号以及1月4号,均途经导航路段1时,可在1月2号、1月3号以及1月4号,从候选播报文案列表中分别随机确定出其中一个目标风格播报文本,比如在1月2号途经导航路段1时,针对“准备出发”的标准播报文本确定出的目标风格播报文本为“取经之路开始”,而在1月3号途经导航路段1时,针对“准备出发”的标准播报文本确定出的目标风格播报文本为“快快启程回家”,从而用户在不同导航时间段内多次途经同一导航路段时,服务器可分别生成不同的风格化导航播报数据,即可在不同导航时间段内分别采用不同的目标风格播报文本进行导航播报,以提升导航播报的多样性和趣味性,避免采用单一固定的导航播报方式,满足实际应用过程中的个性化需求。
上述导航播报数据处理方法中,当目标风格播报文本的数量为多个,生成与标准播报文本对应的候选播报文案列表,并根据候选播报文案列表,针对同一导航路段,在不同导航时间段内随机确定出与标准播报文本匹配的目标风格播报文本,从而可根据导航路段对应的初始播报配置数据、以及随机确定出的目标风格播报文本,生成与对应导航路段对应的风格化导航播报数据,实现了在不同导航时间段内分别采用不同的目标风格播报文本进行导航播报的方式,提升了导航播报的多样性和趣味性,而避免采用单一固定的导航播报方式,进一步满足实际应用过程中的个性化需求。
在一个示例性的实施例中,如图9所示,提供了一种导航播报数据处理方法,该方法可以由终端或服务器单独执行,也可以由终端和服务器协同执行。在本申请实施例中,以该方法应用于图1中的服务器104为例进行说明,包括以下步骤S901至步骤S922。其中:
步骤S901,服务器获取多个导航路段对应的导航场景,并获取与多个导航场景各自对应的初始播报配置数据。
步骤S902,服务器针对每个初始播报配置数据,对初始播报配置数据进行导航标签识别,获得初始播报配置数据携带的导航标签。
步骤S903,服务器根据初始播报配置数据和初始播报配置数据携带的导航标签,生成携带导航标签的标准播报文本。
步骤S904,服务器针对每个标准播报文本,获取与标准播报文本对应的标准查询数据,并基于标准查询数据和标准播报文本,构建标准播报文本相应的对话训练样本。
步骤S905,服务器根据多个标准播报文本各自相应的对话训练样本,对初始文本生成模型进行训练,获得训练好的标准文本生成模型。
步骤S906,服务器获取多轮风格化交互数据,解析多轮风格化交互数据,获得与多轮风格化交互数据对应的多个风格化查询数据、以及与多个风格化查询数据各自对应的风格化播报文本。
步骤S907,服务器根据多个风格化查询数据、以及与多个风格化查询数据各自对应的风格化播报文本,构建得到风格化文本提示信息。
步骤S908,服务器根据风格化文本提示信息,对标准文本生成模型进行训练,获得训练好的风格化播报文本生成模型。
步骤S909,服务器通过训练好的风格化播报文本生成模型,对多个标准播报文本分别进行文本风格转换,得到多个标准播报文本各自对应的至少一个候选风格化播报文本。
步骤S910,服务器获取携带导航标签的多个标准播报文本、以及未携带导航标签的多个缺失播报文本,将携带导航标签的多个标准播报文本分别作为正样本,并将未携带导航标签的多个缺失播报文本分别作为负样本,得到标签分类训练样本集。
步骤S911,服务器根据标签分类训练样本集,对初始文本分类模型进行训练,获得训练好的标准文本分类模型。
步骤S912,服务器针对每个标准播报文本,通过训练好的标准文本分类模型,对标准播报文本对应的至少一个候选风格化播报文本进行文本评估,得到至少一个候选风格化播报文本各自的评估结果。
步骤S913,服务器基于各候选风格化播报文本,确定出文本评估结果为携带导航标签的中间风格化播报文本。
步骤S914,服务器获获取对中间风格化播报文本进行复核的第一复核结果,根据第一复核结果,确定与标准播报文本对应的目标风格播报文本。
执行步骤S913后执行步骤S915,服务器获取与风格化文本提示信息关联的各风格化语料数据,将各风格化语料数据分别作为正样本,并将标准播报文本分别作为负样本,得到风格化训练样本集。
步骤S916,服务器根据风格化训练样本集对初始文本评分模型进行训练,获得训练好的风格化评分模型。
步骤S917,服务器根据训练好的风格化评分模型,对各中间风格化播报文本进行风格评估,获得风格评估结果。
步骤S918,服务器按照风格评估结果,对各中间风格化播报文本进行排序和筛选,获得二次筛选风格化播报文本。
步骤S919,服务器获取对二次筛选风格化播报文本进行复核的第二复核结果,根据第二复核结果,确定与标准播报文本对应的目标风格播报文本。
执行步骤S914或步骤S919后,执行步骤S920,当目标风格播报文本的数量为多个,服务器生成与标准播报文本对应的候选播报文案列表。
步骤S921,服务器根据候选播报文案列表,针对同一导航路段,在不同导航时间段内随机确定出与标准播报文本匹配的目标风格播报文本。
步骤S922,服务器根据导航路段对应的初始播报配置数据、以及随机确定出的目标风格播报文本,生成与对应导航路段对应的风格化导航播报数据。
在一个示例性的实施例中,如图10所示,提供了导航播报数据处理方法的主体处理流程,参照图10可知,导航播报数据处理方法的主体处理流程具体包括数据预处理、候选风格化播报文本的生成、以及候选风格化播报文本的评估的处理步骤。其中:
一、数据预处理:包括配置化内容导出和生成携带导航标签的多个标准播报文本。
1)配置化内容导出,包括:获取多个导航路段对应的导航场景,并获取与多个所述导航场景各自对应的初始播报配置数据。
2)生成携带导航标签的多个标准播报文本,包括:针对每个所述初始播报配置数据,对所述初始播报配置数据进行导航标签识别,获得所述初始播报配置数据携带的导航标,以根据所述初始播报配置数据和所述初始播报配置数据携带的导航标签,生成携带所述导航标签的标准播报文本。
二、候选风格化播报文本的生成,包括:基于规则生成、基于风格化文本提示信息的生成、以及基于模型微调和风格化文本提示信息的生成。
1)基于规则生成,包括:获取实际所使用的个性化风格(比如孙悟空风格)对应的惯用字句,采用规则替换的方式,将标准播报文本中的特定字句替换为个性化风格对应的惯用字句,得到各候选风格化播报文本。例如针对孙悟空风格,可以将“请”替换为“老孙请”、“谨慎”替换为“当心”等。
2)基于风格化文本提示信息的生成,其采用的提示方式具体包括:简单提示、***提示以及多轮对话提示,采用将提风格化文本提示信息输入模型的方式,引导模型输出和风格化文本提示信息相对应的候选风格化播报文本。其中:
A、简单提示:采用“请使用xx风格复述下面这句话”的风格化文本提示信息,引导模型输出和“xx风格”相对应的候选风格化播报文本。
B、***提示:针对语言大模型预先设置“你是一个语音播报文案的风格化改写员,擅长将所给文案改写为特定风格,且确保标签不丢、含义不变。以下是一些例子:请将下面句子改为孙悟空风格:准备出发—现在启程、前方红绿灯直行—施主,前方道路红绿灯请直行、以及导航结束—师傅,咱们到了……”的风格化文本提示信息,从而可将该风格化文本提示信息作为语言大模型后续对话的指引,引导模型输出和风格化文本提示信息相对应的候选风格化播报文本。其中,通过采用预先设置清晰明确的***提示的方式,有效提升语言大模型的回复质量,即提升所获得的风格化播报文本的准确度。
C、多轮对话提示:提供“请将下面句子改为孙悟空风格:准备出发”—“现在启程”、“好的。这句:前方红绿灯直行”—“施主,前方道路红绿灯请直行”、以及“好的。这句:导航结束”—“师傅,咱们到了”等多轮风格化对话数据,并对该些多轮风格化对话数据进行解析,可获得 “请将下面句子改为孙悟空风格:准备出发”、“这句:前方红绿灯直行”、“这句:导航结束”等风格化查询数据,和“现在启程”、“施主,前方道路红绿灯请直行”、以及“师傅,咱们到了”等风格化播报文本,进而构建得到“请将下面句子改为孙悟空风格:准备出发”—“现在启程”、“请将下面句子改为孙悟空风格:前方红绿灯直行”—“施主,前方道路红绿灯请直行”、以及“请将下面句子改为孙悟空风格:导航结束”—“师傅,咱们到了”等多组风格化文本提示信息,进而将多组风格化文本提示信息输入模型,以引导模型输出和风格化文本提示信息相对应的候选风格化播报文本。
3)基于模型微调和风格化文本提示信息的生成,包括:
A、针对每个所述标准播报文本,获取与所述标准播报文本对应的标准查询数据,基于所述标准查询数据和所述标准播报文本,构建所述标准播报文本相应的对话训练样本,根据所述多个标准播报文本各自相应的对话训练样本,对初始文本生成模型进行训练,获得训练好的标准文本生成模型。
其中,针对每个标准播报文本,获取与标准播报文本对应的标准查询数据,比如针对“前方<distance>直行”的标准播报文本,获取与其对应的标准查询数据为“请生成一条标准播报文案”,则可基于“请生成一条标准播报文案”的标准查询数据、以及“前方<distance>直行”的标准播报文本,构建标准播报文本相应的对话训练样本,即构建“请生成一条标准播报文案”—“前方<distance>直行”的对话训练样本,以根据多个对话训练样本,对初始文本生成模型进行训练,直至满足标准文本生成模型的训练结束条件,获得训练好的标准文本生成模型。
B、获取多轮风格化交互数据,解析所述多轮风格化交互数据,获得与所述多轮风格化交互数据对应的多个风格化查询数据、以及与多个所述风格化查询数据各自对应的风格化播报文本,根据所述多个风格化查询数据、以及与多个所述风格化查询数据各自对应的风格化播报文本,构建得到风格化文本提示信息,根据所述风格化文本提示信息,对所述标准文本生成模型进行训练,获得训练好的风格化播报文本生成模型。
其中,服务器通过多轮风格化对话数据,并通过对多轮风格化交互数据进行解析,可获得与多轮风格化交互数据对应的多个风格化查询数据,比如获得“请将下面句子改为孙悟空风格:准备出发”、“这句:前方红绿灯直行”、“这句:导航结束”等风格化查询数据,以及获得与多个风格化查询数据各自对应的风格化播报文本,包括“现在启程”、“施主,前方道路红绿灯请直行”、以及“师傅,咱们到了”等风格化播报文本。
进一步地,服务器根据多个风格化查询数据、以及与多个风格化查询数据各自对应的风格化播报文本,构建得到风格化文本提示信息,比如构建得到“请将下面句子改为孙悟空风格:准备出发”—“现在启程”、“请将下面句子改为孙悟空风格:前方红绿灯直行”—“施主,前方道路红绿灯请直行”、以及“请将下面句子改为孙悟空风格:导航结束”—“师傅,咱们到了”等多组风格化文本提示信息,以根据所获得的多组风格化文本提示信息,对标准文本生成模型进行训练,直至满足风格化播报文本生成模型的训练结束条件,获得训练好的风格化播报文本生成模型。
C、通过训练好的风格化播报文本生成模型,对所述多个标准播报文本分别进行文本风格转换,得到所述多个标准播报文本各自对应的至少一个候选风格化播报文本。
示例性地,针对“准备出发”的标准播报文本,通过训练好的风格化播报文本生成模型,对其进行文本风格转换,可获得采用孙悟空风格的“现在启程”、“取经之路开始”、以及“快快启程回家”等多个候选风格化播报文本。
三、候选风格化播报文本的评估,包括:基于大模型和风格化文本提示信息的自动化评估、基于大模型的标准文案分类模型的评估、基于大模型的标准文案分类模型+基于大模型的风格分类模型的评估、以及人工复核。其中:
1)基于大模型和风格化文本提示信息的自动化评估:
具体来说,通过使用风格化文本提示信息,引导训练好的模型对候选风格化播报文本进行评估,例如采用“下面是一个孙悟空风格的播报文案,它是否符合标签不丢、含义不变、风格化明显的标准,从0~10打分,你会给几分?”的风格化文本提示信息,通过将该风格化文本提示信息输入训练好的模型,引导模型对候选风格化播报文本进行评估,获得评估结果。
2)基于大模型的标准文案分类模型的评估:
具体地,通过获取携带导航标签的多个标准播报文本、以及未携带导航标签的多个缺失播报文本,将携带导航标签的多个标准播报文本分别作为正样本,并将未携带导航标签的多个缺失播报文本分别作为负样本,得到标签分类训练样本集,以根据标签分类训练样本集,对初始文本分类模型进行训练,获得训练好的标准文本分类模型。
进一步地,针对每个标准播报文本,通过训练好的标准文本分类模型,对标准播报文本对应的至少一个候选风格化播报文本进行文本评估,得到至少一个候选风格化播报文本各自的评估结果,并基于各候选风格化播报文本,确定出文本评估结果为携带导航标签的中间风格化播报文本,从而通过获取对中间风格化播报文本进行复核的第一复核结果,根据第一复核结果,确定与标准播报文本对应的目标风格播报文本。
3)基于大模型的标准文案分类模型+基于大模型的风格分类模型的评估:
具体来说,在基于大模型的标准文案分类模型的基础上,通过对初始文本评分模型进行训练,获得训练好的风格化评分模型,并将各中间风格化播报文本输入训练好的风格化评分模型,以通过训练好的风格化评分模型,对各中间风格化播报文本进行风格评估,获得风格评估结果。
其中,具体是通过获取与风格化文本提示信息关联的各风格化语料数据,将各风格化语料数据分别作为正样本,并将标准播报文本分别作为负样本,得到风格化训练样本集,以根据风格化训练样本集对初始文本评分模型进行训练,获得训练好的风格化评分模型,并利用训练好的风格化评分模型,对各中间风格化播报文本进行风格评估,获得风格评估结果。
进一步地,按照风格评估结果,对各所述中间风格化播报文本进行排序和筛选,获得二次筛选风格化播报文本,进而通过该获取对二次筛选风格化播报文本进行复核的第二复核结果,以根据第二复核结果,确定与标准播报文本对应的目标风格播报文本。
上述导航播报数据处理方法中,通过获取多个导航路段各自对应的初始播报配置数据,并根据初始播报配置数据生成多个标准播报文本,以利用根据风格化文本提示信息对标准播报文本生成模型进行训练得到的风格化播报文本生成模型,对多个标准播报文本分别进行文本风格转换,可得到多个标准播报文本各自对应的至少一个候选风格化播报文本,实现了采用将模型微调和提示信息引导相结合的方式,快速获得所需风格化的候选风格化播报文本,减少了人工配置带来的资源消耗,同时可针对不同导航路段对应的初始播报配置数据进行全面配置,提升了风格化播报文本的覆盖面,避免在导航过程中出现导航播报文本风格不一,前后衔接性差的问题。进一步地,针对每个标准播报文本,对标准播报文本对应的至少一个候选风格化播报文本进行文本评估,得到至少一个候选风格化播报文本各自的评估结果,以根据评估结果确定与标准播报文本对应的目标风格播报文本,通过进一步评估和筛选,减少调整或生成播报文案的重复操作,提升了风格化播报文本的生成效率。
应该理解的是,虽然如上的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的导航播报数据处理方法的导航播报数据处理装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个导航播报数据处理装置实施例中的具体限定可以参见上文中对于导航播报数据处理方法的限定,在此不再赘述。
在一个示例性的实施例中,如图11所示,提供了一种导航播报数据处理装置,包括:标准播报文本生成模块1102、候选风格化播报文本生成模块1104以及目标风格播报文本确定模块1106,其中:
标准播报文本生成模块1102,用于获取多个导航路段各自对应的初始播报配置数据,根据初始播报配置数据生成多个标准播报文本;
候选风格化播报文本生成模块1104,用于通过训练好的风格化播报文本生成模型,对多个标准播报文本分别进行文本风格转换,得到多个标准播报文本各自对应的至少一个候选风格化播报文本;风格化播报文本生成模型,是根据风格化文本提示信息对标准播报文本生成模型进行训练得到的,风格化文本提示信息包括风格化查询数据和风格化播报文本;
目标风格播报文本确定模块1106,用于针对每个标准播报文本,对标准播报文本对应的至少一个候选风格化播报文本进行文本评估,得到至少一个候选风格化播报文本各自的评估结果,根据评估结果确定与标准播报文本对应的目标风格播报文本。
上述导航播报数据处理装置中,通过获取多个导航路段各自对应的初始播报配置数据,并根据初始播报配置数据生成多个标准播报文本,以利用根据风格化文本提示信息对标准播报文本生成模型进行训练得到的风格化播报文本生成模型,对多个标准播报文本分别进行文本风格转换,可得到多个标准播报文本各自对应的至少一个候选风格化播报文本,实现了采用将模型微调和提示信息引导相结合的方式,快速获得所需风格化的候选风格化播报文本,减少了人工配置带来的资源消耗,同时可针对不同导航路段对应的初始播报配置数据进行全面配置,提升了风格化播报文本的覆盖面,避免在导航过程中出现导航播报文本风格不一,前后衔接性差的问题。进一步地,针对每个标准播报文本,对标准播报文本对应的至少一个候选风格化播报文本进行文本评估,得到至少一个候选风格化播报文本各自的评估结果,以根据评估结果确定与标准播报文本对应的目标风格播报文本,通过进一步评估和筛选,减少调整或生成播报文案的重复操作,提升了风格化播报文本的生成效率。
在一个示例性的实施例中,标准播报文本生成模块,还用于:获取多个导航路段对应的导航场景,并获取与多个导航场景各自对应的初始播报配置数据;针对每个初始播报配置数据,对初始播报配置数据进行导航标签识别,获得初始播报配置数据携带的导航标签;根据初始播报配置数据和初始播报配置数据携带的导航标签,生成携带导航标签的标准播报文本。
在一个示例性的实施例中,提供了一种导航播报数据处理装置,还包括风格化播报文本生成模型获得模块,用于:获取多轮风格化交互数据,解析多轮风格化交互数据,获得与多轮风格化交互数据对应的多个风格化查询数据、以及与多个风格化查询数据各自对应的风格化播报文本;根据多个风格化查询数据、以及与多个风格化查询数据各自对应的风格化播报文本,构建得到风格化文本提示信息;根据风格化文本提示信息,对标准文本生成模型进行训练,获得训练好的风格化播报文本生成模型。
在一个示例性的实施例中,提供了一种导航播报数据处理装置,还包括标准文本生成模型获得模块,用于:针对每个标准播报文本,获取与标准播报文本对应的标准查询数据;基于标准查询数据和标准播报文本,构建标准播报文本相应的对话训练样本;根据多个标准播报文本各自相应的对话训练样本,对初始文本生成模型进行训练,获得训练好的标准文本生成模型。
在一个示例性的实施例中,目标风格播报文本确定模块,还用于:针对每个标准播报文本,通过训练好的标准文本分类模型,对标准播报文本对应的至少一个候选风格化播报文本进行文本评估,得到至少一个候选风格化播报文本各自的评估结果;基于各候选风格化播报文本,确定出文本评估结果为携带导航标签的中间风格化播报文本;获取对中间风格化播报文本进行复核的第一复核结果,根据第一复核结果,确定与标准播报文本对应的目标风格播报文本。
在一个示例性的实施例中,目标风格播报文本确定模块,还用于:根据训练好的风格化评分模型,对各中间风格化播报文本进行风格评估,获得风格评估结果;按照风格评估结果,对各中间风格化播报文本进行排序和筛选,获得二次筛选风格化播报文本;获取对二次筛选风格化播报文本进行复核的第二复核结果,根据第二复核结果,确定与标准播报文本对应的目标风格播报文本。
在一个示例性的实施例中,提供了一种导航播报数据处理装置,还包括标准文本分类模型获得模块,用于:获取携带导航标签的多个标准播报文本、以及未携带导航标签的多个缺失播报文本;将携带导航标签的多个标准播报文本分别作为正样本,并将未携带导航标签的多个缺失播报文本分别作为负样本,得到标签分类训练样本集;根据标签分类训练样本集,对初始文本分类模型进行训练,获得训练好的标准文本分类模型。
在一个示例性的实施例中,提供了一种导航播报数据处理装置,还包括风格化评分模型获得模块,用于:获取与风格化文本提示信息关联的各风格化语料数据;将各风格化语料数据分别作为正样本,并将标准播报文本分别作为负样本,得到风格化训练样本集;根据风格化训练样本集对初始文本评分模型进行训练,获得训练好的风格化评分模型。
在一个示例性的实施例中,提供了一种导航播报数据处理装置,还包括风格化导航播报数据生成模块,用于:当目标风格播报文本的数量为多个,生成与标准播报文本对应的候选播报文案列表;根据候选播报文案列表,针对同一导航路段,在不同导航时间段内随机确定出与标准播报文本匹配的目标风格播报文本;根据导航路段对应的初始播报配置数据、以及随机确定出的目标风格播报文本,生成与对应导航路段对应的风格化导航播报数据。
上述导航播报数据处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个示例性的实施例中,提供了一种计算机设备,该计算机设备可以是服务器或者终端,在本实施例中,以该计算机设备是服务器为例进行说明,其内部结构图可以如图12所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过***总线连接,通信接口通过输入/输出接口连接到***总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储多个导航路段各自对应的初始播报配置数据、根据初始播报配置数据生成的多个标准播报文本、与每一标准播报文本各自对应的至少一个候选风格化播报文本、至少一个候选风格化播报文本各自的评估结果、以及与标准播报文本对应的目标风格播报文本等数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种导航播报数据处理方法。
本领域技术人员可以理解,图12中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储、以及展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要符合相关规定。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (14)
1.一种导航播报数据处理方法,其特征在于,所述方法包括:
获取多个导航路段各自对应的初始播报配置数据,根据所述初始播报配置数据生成多个标准播报文本;
通过训练好的风格化播报文本生成模型,对所述多个标准播报文本分别进行文本风格转换,得到所述多个标准播报文本各自对应的至少一个候选风格化播报文本;所述风格化播报文本生成模型,是根据风格化文本提示信息对标准播报文本生成模型进行训练得到的,所述风格化文本提示信息包括风格化查询数据和风格化播报文本;
针对每个所述标准播报文本,对所述标准播报文本对应的至少一个候选风格化播报文本进行文本评估,得到所述至少一个候选风格化播报文本各自的评估结果,根据所述评估结果确定与所述标准播报文本对应的目标风格播报文本。
2.根据权利要求1所述的方法,其特征在于,所述获取多个导航路段各自对应的初始播报配置数据,根据所述初始播报配置数据生成多个标准播报文本,包括:
获取多个导航路段对应的导航场景,并获取与多个所述导航场景各自对应的初始播报配置数据;
针对每个所述初始播报配置数据,对所述初始播报配置数据进行导航标签识别,获得所述初始播报配置数据携带的导航标签;
根据所述初始播报配置数据和所述初始播报配置数据携带的导航标签,生成携带所述导航标签的标准播报文本。
3.根据权利要求1所述的方法,其特征在于,训练得到所述风格化播报文本生成模型的方式,包括:
获取多轮风格化交互数据,解析所述多轮风格化交互数据,获得与所述多轮风格化交互数据对应的多个风格化查询数据、以及与多个所述风格化查询数据各自对应的风格化播报文本;
根据所述多个风格化查询数据、以及与多个所述风格化查询数据各自对应的风格化播报文本,构建得到风格化文本提示信息;
根据所述风格化文本提示信息,对标准文本生成模型进行训练,获得训练好的风格化播报文本生成模型。
4.根据权利要求1至3任意一项所述的方法,其特征在于,训练得到标准文本生成模型的方式,包括:
针对每个所述标准播报文本,获取与所述标准播报文本对应的标准查询数据;
基于所述标准查询数据和所述标准播报文本,构建所述标准播报文本相应的对话训练样本;
根据所述多个标准播报文本各自相应的对话训练样本,对初始文本生成模型进行训练,获得训练好的标准文本生成模型。
5.根据权利要求4所述的方法,其特征在于,所述通过训练好的风格化播报文本生成模型,对所述多个标准播报文本分别进行文本风格转换,得到所述多个标准播报文本各自对应的至少一个候选风格化播报文本,包括:
通过所述风格化播报文本生成模型对应的风格化文本提示信息,获得对所述多个标准播报文本进行文本风格转换的转换指引信息;
根据各所述转换指引信息,分别对多个标准播报文本进行文本风格转换,得到所述多个标准播报文本各自对应的至少一个候选风格化播报文本。
6.根据权利要求1至3任意一项所述的方法,其特征在于,所述针对每个所述标准播报文本,对所述标准播报文本对应的至少一个候选风格化播报文本进行文本评估,得到所述至少一个候选风格化播报文本各自的评估结果,根据所述评估结果确定与所述标准播报文本对应的目标风格播报文本,包括:
针对每个所述标准播报文本,通过训练好的标准文本分类模型,对所述标准播报文本对应的至少一个候选风格化播报文本进行文本评估,得到所述至少一个候选风格化播报文本各自的评估结果;
基于各所述候选风格化播报文本,确定出所述文本评估结果为携带导航标签的中间风格化播报文本;
获取对所述中间风格化播报文本进行复核的第一复核结果,根据所述第一复核结果,确定与所述标准播报文本对应的目标风格播报文本。
7.根据权利要求6所述的方法,其特征在于,训练得到所述标准文本分类模型的方式,包括:
获取携带导航标签的多个标准播报文本、以及未携带导航标签的多个缺失播报文本;
将携带导航标签的多个标准播报文本分别作为正样本,并将未携带导航标签的多个缺失播报文本分别作为负样本,得到标签分类训练样本集;
根据所述标签分类训练样本集,对初始文本分类模型进行训练,获得训练好的标准文本分类模型。
8.根据权利要求6所述的方法,其特征在于,所述方法还包括:
根据训练好的风格化评分模型,对各所述中间风格化播报文本进行风格评估,获得风格评估结果;
按照所述风格评估结果,对各所述中间风格化播报文本进行排序和筛选,获得二次筛选风格化播报文本;
获取对所述二次筛选风格化播报文本进行复核的第二复核结果,根据所述第二复核结果,确定与所述标准播报文本对应的目标风格播报文本。
9.根据权利要求8所述的方法,其特征在于,获得训练好的风格化评分模型的方式,包括:
获取与所述风格化文本提示信息关联的各风格化语料数据;
将各所述风格化语料数据分别作为正样本,并将所述标准播报文本分别作为负样本,得到风格化训练样本集;
根据所述风格化训练样本集对初始文本评分模型进行训练,获得训练好的风格化评分模型。
10.根据权利要求1至3任意一项所述的方法,其特征在于,所述方法还包括:
当所述目标风格播报文本的数量为多个,生成与所述标准播报文本对应的候选播报文案列表;
根据所述候选播报文案列表,针对同一导航路段,在不同导航时间段内随机确定出与所述标准播报文本匹配的目标风格播报文本;
根据所述导航路段对应的初始播报配置数据、以及随机确定出的所述目标风格播报文本,生成与对应所述导航路段对应的风格化导航播报数据。
11.一种导航播报数据处理装置,其特征在于,所述装置包括:
标准播报文本生成模块,用于获取多个导航路段各自对应的初始播报配置数据,根据所述初始播报配置数据生成多个标准播报文本;
候选风格化播报文本生成模块,用于通过训练好的风格化播报文本生成模型,对所述多个标准播报文本分别进行文本风格转换,得到所述多个标准播报文本各自对应的至少一个候选风格化播报文本;所述风格化播报文本生成模型,是根据风格化文本提示信息对标准播报文本生成模型进行训练得到的,所述风格化文本提示信息包括风格化查询数据和风格化播报文本;
目标风格播报文本确定模块,用于针对每个所述标准播报文本,对所述标准播报文本对应的至少一个候选风格化播报文本进行文本评估,得到所述至少一个候选风格化播报文本各自的评估结果,根据所述评估结果确定与所述标准播报文本对应的目标风格播报文本。
12.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至10中任一项所述的方法的步骤。
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至10中任一项所述的方法的步骤。
14.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至10中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410342033.8A CN117933195A (zh) | 2024-03-25 | 2024-03-25 | 导航播报数据处理方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410342033.8A CN117933195A (zh) | 2024-03-25 | 2024-03-25 | 导航播报数据处理方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117933195A true CN117933195A (zh) | 2024-04-26 |
Family
ID=90761358
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410342033.8A Pending CN117933195A (zh) | 2024-03-25 | 2024-03-25 | 导航播报数据处理方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117933195A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111145721A (zh) * | 2019-12-12 | 2020-05-12 | 科大讯飞股份有限公司 | 个性化提示语生成方法、装置和设备 |
US20200311195A1 (en) * | 2019-04-01 | 2020-10-01 | International Business Machines Corporation | Controllable Style-Based Text Transformation |
US20210303803A1 (en) * | 2020-03-25 | 2021-09-30 | International Business Machines Corporation | Text style transfer using reinforcement learning |
CN113822064A (zh) * | 2021-06-22 | 2021-12-21 | 腾讯科技(深圳)有限公司 | 一种文本风格迁移方法、装置、电子设备和存储介质 |
CN115545010A (zh) * | 2022-10-12 | 2022-12-30 | 阿里巴巴(中国)有限公司 | 一种导航播报语句生成网络的训练方法、装置及设备 |
CN116975214A (zh) * | 2023-02-13 | 2023-10-31 | 腾讯科技(深圳)有限公司 | 文本生成方法、装置、存储介质及计算机设备 |
CN116992024A (zh) * | 2023-07-06 | 2023-11-03 | 平安科技(深圳)有限公司 | 评语生成模型训练方法、装置、计算机设备及存储介质 |
CN117115303A (zh) * | 2023-08-24 | 2023-11-24 | 支付宝(杭州)信息技术有限公司 | 用于内容生成的方法、***、计算设备和存储介质 |
-
2024
- 2024-03-25 CN CN202410342033.8A patent/CN117933195A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200311195A1 (en) * | 2019-04-01 | 2020-10-01 | International Business Machines Corporation | Controllable Style-Based Text Transformation |
CN111145721A (zh) * | 2019-12-12 | 2020-05-12 | 科大讯飞股份有限公司 | 个性化提示语生成方法、装置和设备 |
US20210303803A1 (en) * | 2020-03-25 | 2021-09-30 | International Business Machines Corporation | Text style transfer using reinforcement learning |
CN113822064A (zh) * | 2021-06-22 | 2021-12-21 | 腾讯科技(深圳)有限公司 | 一种文本风格迁移方法、装置、电子设备和存储介质 |
CN115545010A (zh) * | 2022-10-12 | 2022-12-30 | 阿里巴巴(中国)有限公司 | 一种导航播报语句生成网络的训练方法、装置及设备 |
CN116975214A (zh) * | 2023-02-13 | 2023-10-31 | 腾讯科技(深圳)有限公司 | 文本生成方法、装置、存储介质及计算机设备 |
CN116992024A (zh) * | 2023-07-06 | 2023-11-03 | 平安科技(深圳)有限公司 | 评语生成模型训练方法、装置、计算机设备及存储介质 |
CN117115303A (zh) * | 2023-08-24 | 2023-11-24 | 支付宝(杭州)信息技术有限公司 | 用于内容生成的方法、***、计算设备和存储介质 |
Non-Patent Citations (2)
Title |
---|
聂锦燃 等: "基于变分自编码器的无监督文本风格转换", 《中文信息学报》, vol. 34, no. 7, 31 July 2020 (2020-07-31), pages 79 - 88 * |
黄若孜 等: "基于矩阵变换的文本风格迁移方法", 《计算机***应用》, vol. 29, no. 9, 30 September 2020 (2020-09-30), pages 1 - 6 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111488931B (zh) | 文章质量评估方法、文章推荐方法及其对应的装置 | |
CN111783394A (zh) | 事件抽取模型的训练方法、事件抽取方法和***及设备 | |
CN108959531A (zh) | 信息搜索方法、装置、设备及存储介质 | |
CN111081220A (zh) | 车载语音交互方法、全双工对话***、服务器和存储介质 | |
CN116468298A (zh) | 基于gpt网络模型的汽车技术规划与决策的方法及*** | |
CN110309277A (zh) | 人机对话语义解析方法和*** | |
CN112529615A (zh) | 自动生成广告的方法、装置、设备和计算机可读存储介质 | |
CN113988071A (zh) | 一种基于金融知识图谱的智能对话方法及装置、电子设备 | |
CN114528418B (zh) | 一种文本处理方法、***和存储介质 | |
CN115545010A (zh) | 一种导航播报语句生成网络的训练方法、装置及设备 | |
CN114398909A (zh) | 用于对话训练的问题生成方法、装置、设备和存储介质 | |
CN116541517A (zh) | 文本信息处理方法、装置、设备、软件程序以及存储介质 | |
Tian et al. | RSG-GCN: predicting semantic relationships in urban traffic scene with map geometric prior | |
CN113609866A (zh) | 文本标记方法、装置、设备及存储介质 | |
CN116977701A (zh) | 视频分类模型训练的方法、视频分类的方法和装置 | |
CN112905787A (zh) | 文本信息处理方法、短信处理方法、电子设备及可读介质 | |
CN117216185A (zh) | 分发内容的评论生成方法、装置、设备及存储介质 | |
CN117933195A (zh) | 导航播报数据处理方法、装置、计算机设备和存储介质 | |
CN113656560B (zh) | 情感类别的预测方法和装置、存储介质及电子设备 | |
CN111222533B (zh) | 一种基于依赖树的深度学习视觉问答方法及*** | |
CN114036268A (zh) | 基于意图门的任务型多轮对话方法及*** | |
CN113741759A (zh) | 评论信息的展示方法、装置、计算机设备和存储介质 | |
CN113569153A (zh) | 图文内容的分类方法、装置、电子设备及存储介质 | |
CN114547435A (zh) | 内容质量的识别方法、装置、设备及可读存储介质 | |
CN115658964B (zh) | 预训练模型以及体感画风识别模型的训练方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |