CN117473169A - 一种基于aigc的文旅数据筛选方法 - Google Patents

一种基于aigc的文旅数据筛选方法 Download PDF

Info

Publication number
CN117473169A
CN117473169A CN202311812174.3A CN202311812174A CN117473169A CN 117473169 A CN117473169 A CN 117473169A CN 202311812174 A CN202311812174 A CN 202311812174A CN 117473169 A CN117473169 A CN 117473169A
Authority
CN
China
Prior art keywords
information
data
province
module
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311812174.3A
Other languages
English (en)
Other versions
CN117473169B (zh
Inventor
张卫平
王晶
丁洋
张伟
李显阔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Global Digital Group Co Ltd
Original Assignee
Global Digital Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Global Digital Group Co Ltd filed Critical Global Digital Group Co Ltd
Priority to CN202311812174.3A priority Critical patent/CN117473169B/zh
Publication of CN117473169A publication Critical patent/CN117473169A/zh
Application granted granted Critical
Publication of CN117473169B publication Critical patent/CN117473169B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及旅数据筛选方法技术领域,具体涉及一种基于AIGC的文旅数据筛选方法,包括以下步骤:数据分析模块基于AIGC技术得出第个数据平台搜索关键词的总数量、第个数据平台搜索关键词时对应原文热度最高的好评总数量、第个数据平台搜索关键词时对应原文热度最高的总评论数量和第个数据平台搜索关键词时对应原文热度最高的发文者的粉丝量的信息,并传输至控制模块;控制模块根据相关信息计算省份热门程度因子,根据省份热门程度因子得出省份热门程度信息并传输至通信模块。利用AIGC技术能提高整体的处理效率以及信息提取的精准度,为旅游者提供更有价值的信息,且AIGC技术是以大数据为基础,更好的反应大众的信息。

Description

一种基于AIGC的文旅数据筛选方法
技术领域
本发明涉及文旅数据筛选技术领域,具体涉及一种基于AIGC的文旅数据筛选方法。
背景技术
AIGC(Artificial Intelligence Generated Content)是指基于生成对抗网络、大型预训练模型等人工智能的技术方法,通过已有数据的学习和识别,以适当的泛化能力生成相关内容的技术。
AIGC技术的核心思想是利用人工智能算法生成具有一定创意和质量的内容。通过训练模型和大量数据的学习,AIGC可以根据输入的条件或指导思路,生成与之相关的内容。例如,通过输入关键词、描述或样本,AIGC可以生成与之相匹配的文章、图像、音频等。
文旅数据是基于云计算、大数据、机器学***台。
经过我们大量的检索与参考发现现在已经开发出了很多文旅数据筛选方法,例如现有技术的有如公开号为CN116822503A所公开的文旅数据筛选方法,该方法一般包括:采集旅游路线的评价信息作为目标文本;基于目标文本中短词的一致性参数以及完整性参数获得候选词;基于候选词集合对目标文本进行分词;基于分词结果,采用TF-idf算法筛选权重最高的若干个特色词;基于特色词集合进行旅游路线聚合获得旅游路线群组;统计目标群体指数,根据出现于多个旅游路线群组的特色词集合,并去重;对各旅游线路的特色词进行标注;基于标注数据集和线路特色排序特征输入神经网络模型进行训练,以对目标路线进行特色词集合的预测。上述能够基于文本挖掘的线路特色化分析方法,更好的辅助用户决策,帮助用户更快更准的理解线路信息,提升用户体验。
然而现有技术中的处理速率较慢,用户使用时的体验感较差。
发明内容
本发明的目的在于提高数据筛选速度,针对上述存在的不足,提出一种基于AIGC的文旅数据筛选方法。
本发明采用如下技术方案:
一种基于AIGC的文旅数据筛选方法,包括以下步骤:
S1:数据统计模块统计数据且得出今年假期内前往省份的人流量、前一年假期内前往省份自驾游的人流量、前一年假期内前往省份的人流量和前一年假期内前往省份的车辆总数的信息,并传输至控制模块;
S2:数据预设模块设定统计自驾游人流量的准确率、数据平台的总数量、统计数据平台的准确率和车辆内的平均人数的信息,并传输至控制模块;
S3:数据分析模块基于AIGC技术得出第个数据平台搜索关键词的总数量、第/>个数据平台搜索关键词时对应原文热度最高的好评总数量、第/>个数据平台搜索关键词时对应原文热度最高的总评论数量和第/>个数据平台搜索关键词时对应原文热度最高的发文者的粉丝量的信息,并传输至控制模块;
S4:控制模块根据前一年假期内前往省份的车辆总数和车辆内的平均人数计算前一年假期内前往省份自驾游的人流量,根据相关信息计算省份热门程度因子,根据省份热门程度因子得出省份热门程度信息并传输至通信模块;
S5:通信模块将省份热门程度信息传输至用户端。
可选的,所述数据分析模块包括依次通信连接的数据采集子模块、数据转换子模块、数据筛选子模块和数据传输子模块,所述数据传输子模块与控制模块通信连接;
所述数据采集子模块用于采集相关的语音、图像和文字的信息,并传输至数据转换子模块;
所述数据转换子模块将相关的语音和图像的信息转换为文字信息,并将转换的文字信息和数据采集子模块采集的文字信息均传输至数据筛选子模块;
所述数据筛选子模块基于AIGC技术筛选转换的文字信息、采集的文字信息且得出筛选的文字信息,并传输至数据传输子模块;
所述数据传输子模块基于AIGC技术根据筛选的文字信息得出第个数据平台搜索关键词的总数量、第/>个数据平台搜索关键词时对应原文热度最高的好评总数量、第/>个数据平台搜索关键词时对应原文热度最高的总评论数量和第/>个数据平台搜索关键词时对应原文热度最高的发文者的粉丝量的信息,并传输至控制模块。
可选的,所述控制模块计算省份热门程度因子时,满足以下式子:
其中,为省份热门程度因子,/>为今年假期内前往省份的人流量,/>为前一年假期内前往省份自驾游的人流量,/>为统计自驾游人流量的准确率,/>为前一年假期内前往省份的人流量,/>为数据平台的总数量,/>为第/>个数据平台搜索关键词的总数量,/>第/>个数据平台搜索关键词时对应原文热度最高的好评总数量,/>为第/>个数据平台搜索关键词时对应原文热度最高的总评论数量,/>为第/>个数据平台搜索关键词时对应原文热度最高的发文者的粉丝量,/>为统计数据平台的准确率;
为前一年假期内前往省份的车辆总数,/>为车辆内的平均人数。
可选的,所述控制模块计算省份热门程度信息时,满足以下式子:
其中,为省份热门程度信息,/>为省份热门程度因子的选择阈值,当/>时为省份热门程度低,当/>时为省份热门程度高。
可选的,在步骤S1中,数据统计模块还得出前一年假期内前往景点的人流量和前一年假期内前往景点的旅游者设定的推荐指数的平均值的信息,并传输至控制模块;
在步骤S2中,数据预设模块还设定第个数据平台的信息准确指数和第/>个数据平台的权重指数的信息,并传输至控制模块;
在步骤S3中,数据分析模块还得出第个数据平台搜索景点出现的原文总数量的信息,并传输至控制模块;
在步骤S4中,控制模块根据省份热门程度因子计算省份热门程度参考指数,根据相关信息计算省份内景点的拥挤程度因子,根据省份内景点的拥挤程度因子得出省份内景点的拥挤程度信息并传输至通信模块;
在步骤S5中,通信模块将省份内景点的拥挤程度信息传输至用户端。
可选的,所述数据筛选子模块还得出第个数据平台搜索景点出现的原文总数量的信息,并传输至控制模块。
可选的,所述控制模块计算省份内景点的拥挤程度因子时,满足以下式子:
其中,为省份内景点的拥挤程度因子,/>为第/>个数据平台搜索景点出现的原文总数量,/>为第/>个数据平台的信息准确指数,/>为第/>个数据平台的权重指数,/>为前一年假期内前往景点的人流量,/>为前一年假期内前往景点的旅游者设定的推荐指数的平均值;
为省份热门程度参考指数,/>至/>为不同的省份热门程度参考指数的选择阈值,其中/></></></>,/>至/>为不同的省份热门程度因子的选择阈值。
可选的,所述控制模块计算省份内景点的拥挤程度信息时,满足以下式子:
其中,为省份内景点的拥挤程度信息,/>为省份内景点的拥挤程度因子的选择阈值,当/>时为省份内景点的拥挤程度低,/>时为省份内景点的拥挤程度高。
本发明所取得的有益效果是:
1、利用AIGC技术能提高整体的处理效率以及信息提取的精准度,为旅游者提供更有价值的信息,且AIGC技术是以大数据为基础,更好的反应大众的信息;
2、计算省份热门程度因子时,以今年假期内前往省份的人流量和前一年假期内前往省份的人流量形成的比例为基础,然后考虑前一年假期内前往省份自驾游的人流量以及数据平台中反应的数据,综合考虑到实际人流量与网络数据平台对旅游者产生的影响,从而有助于提高计算省份热门程度因子的精度;
3、假期出行的旅游者,多数会选择舒适且人少的旅游线路,当已经明确旅游的省份后,通过控制模块计算省份内景点的拥挤程度因子并得出省份内景点的拥挤程度信息,旅游者参考省份内景点的拥挤程度信息再选择是否前往该景点旅游,从而提高旅游的体验感;
4、且通过AIGC技术还能过滤和识别一些恶意诋毁的原文、垃圾信息、诈骗信息和广告,从而提高计算的精度。
为使能更进一步了解本发明的特征及技术内容,请参阅以下有关本发明的详细说明与附图,然而所提供的附图仅用于提供参考与说明,并非用来对本发明加以限制。
附图说明
图1为本发明的方法流程图;
图2为本发明的整体结构示意图;
图3为本发明中数据分析模块的结构示意图;
图4为本发明实施例二的整体结构示意图;
图5为本发明实施例二中尺寸测量模块的结构示意图。
具体实施方式
以下是通过特定的具体实施例来说明本发明的实施方式,本领域技术人员可由本说明书所公开的内容了解本发明的优点与效果。本发明可通过其他不同的具体实施例加以施行或应用,本说明书中的各项细节也可基于不同观点与应用,在不背离本发明的精神下进行各种修饰与变更。另外,本发明的附图仅为简单示意说明,并非依实际尺寸描绘,事先声明。以下实施方式将进一步详细说明本发明的相关技术内容,但所公开的内容并非用以限制本发明的保护范围。
实施例一:本实施例提供了一种基于AIGC的文旅数据筛选方法,结合图1至图3所示。
一种基于AIGC的文旅数据筛选方法,包括以下步骤:
S1:数据统计模块统计数据且得出今年假期内前往省份的人流量、前一年假期内前往省份自驾游的人流量、前一年假期内前往省份的人流量和前一年假期内前往省份的车辆总数的信息,并传输至控制模块;
S2:数据预设模块设定统计自驾游人流量的准确率、数据平台的总数量、统计数据平台的准确率和车辆内的平均人数的信息,并传输至控制模块;
S3:数据分析模块基于AIGC技术得出第个数据平台搜索关键词的总数量、第/>个数据平台搜索关键词时对应原文热度最高的好评总数量、第/>个数据平台搜索关键词时对应原文热度最高的总评论数量和第/>个数据平台搜索关键词时对应原文热度最高的发文者的粉丝量的信息,并传输至控制模块;
S4:控制模块根据前一年假期内前往省份的车辆总数和车辆内的平均人数计算前一年假期内前往省份自驾游的人流量,根据相关信息计算省份热门程度因子,根据省份热门程度因子得出省份热门程度信息并传输至通信模块;
S5:通信模块将省份热门程度信息传输至用户端。
具体的,全文提及的省份均为指定省份。
可选的,所述数据分析模块包括依次通信连接的数据采集子模块、数据转换子模块、数据筛选子模块和数据传输子模块,所述数据传输子模块与控制模块通信连接;
所述数据采集子模块用于采集相关的语音、图像和文字的信息,并传输至数据转换子模块;
所述数据转换子模块将相关的语音和图像的信息转换为文字信息,并将转换的文字信息和数据采集子模块采集的文字信息均传输至数据筛选子模块;
所述数据筛选子模块基于AIGC技术筛选转换的文字信息、采集的文字信息且得出筛选的文字信息,并传输至数据传输子模块;
所述数据传输子模块基于AIGC技术根据筛选的文字信息得出第个数据平台搜索关键词的总数量、第/>个数据平台搜索关键词时对应原文热度最高的好评总数量、第/>个数据平台搜索关键词时对应原文热度最高的总评论数量和第/>个数据平台搜索关键词时对应原文热度最高的发文者的粉丝量的信息,并传输至控制模块。
可选的,所述控制模块计算省份热门程度因子时,满足以下式子:
其中,为省份热门程度因子,/>为今年假期内前往省份的人流量,今年假期内前往省份的人流量优选为今年内至今为止所有假期前往指定省份的铁路、飞机、船票的总人数获取;/>为前一年假期内前往省份自驾游的人流量,/>为统计自驾游人流量的准确率,/>为前一年假期内前往省份的人流量,该数据优选通过相关统计平台的数据直接抓取,例如网站;/>为数据平台的总数量,/>为第/>个数据平台搜索关键词的总数量,第/>个数据平台搜索关键词时对应原文热度最高的好评总数量,/>为第/>个数据平台搜索关键词时对应原文热度最高的总评论数量,/>为第/>个数据平台搜索关键词时对应原文热度最高的发文者的粉丝量,/>为统计数据平台的准确率;
为前一年假期内前往省份的车辆总数,/>为车辆内的平均人数。
具体的,以下举例说明计算省份热门程度因子时需要注意的事项,例如,本月是2月,本月之前只有元旦和春节,假设元旦假期对应的法定放假时间为1月1日至1月2日,则计算中提及的假期内前往省份的人流量为前年的12月30日(比法定放假时间的第一天提前两天)凌晨至1月1日(比法定放假时间的最后一天提前一天)24时之间购买前往省份的铁路、飞机、船票的总人数,同理获取春节期间对应的铁路、飞机、船票的总人数,元旦和春节对应的总人数之和即为今年假期内前往省份的人流量;车辆总数通过省份内所有高速路口统计的车辆出行总和计算得出,例如,广东省内设置有A、B和C三个高速出入口,车辆从广东省外的入口进入高速然后从广东省的A出口驶入广东省,则该车辆属于车辆总数内的其中一辆,假设车辆从广东省的A入口进入高速然后从广东省的B出口驶入目标路段,则该车辆不属于车辆总数内的其中一辆;当选取小红书、知乎和微博作为数据平台时,则数据平台的总数量为3个;以下举例说明计算第个数据平台的搜索总量时需要注意的事项,例如,计算省份热门程度因子的时间为9月1日,则第/>个数据平台搜索关键词的总数量对应的时间为9月1日前30天内(不包括9月1日)第/>个数据平台每天对关键词的搜索量的总和,关键词指的是省份、省份内各个相关地区、省份内所有景点名称、省份内相关的物质文化遗产或非物质文化遗产、美食等,例如,以广东省作为目标省份,则出现“盲公饼”、“佛山”、“顺德”、“清晖园”、“西樵山”、“双皮奶”均属于搜索的关键词;以下举例说明计算第/>个数据平台搜索关键词的总数量时需要注意的事项,基于AIGC技术可以分析原作者的历史发文内容以及历史评论行为,包括点赞、转发以及关注等信息,从而确定某些用户发表的原文具有参考价值,而不是将搜索出现的垃圾原文直接计算,另外,通过AIGC技术还能过滤和识别一些恶意诋毁的原文、垃圾信息、诈骗信息和广告,从而提高计算的精度;以下举例说明计算第/>个数据平台搜索关键词时对应原文热度最高的总评论数量时需要注意的事项,原文热度最高指的是该段文字总浏览量最高,原文指的是原作者发表的,关于抄袭或者转发的不计算在内;以下举例说明计算第/>个数据平台搜索关键词时对应原文热度最高的好评总数量时需要注意的事项,好评指的是评论中出现“推荐”、“可以再去一次”、“好”、“没有缺点”等褒义的词语,相反的,假设评论中出现“避雷”、“不推荐”、“踩坑”等贬义的词语则属于差评,或者,可以基于AIGC技术通过自然语言处理技术,分析评论内容的语义和情感,从而确定好评总数量;车辆内的平均人数根据历史数据设定,一般设定车辆内的平均人数为3人;计算统计自驾游人流量的准确率方法有:由于统计自驾游的人流量时会存在一定的误差,导致计算的数值会偏小,因此,本领域技术人员会根据实际情况设定自驾游人流量的准确率的范围值在1.1至1.3之间,具体根据对应省份的热门景点的路况决定,例如,假设四川热门景点只有“稻城亚丁”,由于其地形复杂,旅客选择自驾游的需求低,则对应的自驾游人流量的准确率设定为1.1。
可选的,所述控制模块计算省份热门程度信息时,满足以下式子:
其中,为省份热门程度信息,/>为省份热门程度因子的选择阈值,当/>时为省份热门程度低,当/>时为省份热门程度高。
可选的,在步骤S1中,数据统计模块还得出前一年假期内前往景点的人流量和前一年假期内前往景点的旅游者设定的推荐指数的平均值的信息,并传输至控制模块;
在步骤S2中,数据预设模块还设定第个数据平台的信息准确指数和第/>个数据平台的权重指数的信息,并传输至控制模块;
在步骤S3中,数据分析模块还得出第个数据平台搜索景点出现的原文总数量的信息,并传输至控制模块;
在步骤S4中,控制模块根据省份热门程度因子计算省份热门程度参考指数,根据相关信息计算省份内景点的拥挤程度因子,根据省份内景点的拥挤程度因子得出省份内景点的拥挤程度信息并传输至通信模块;
在步骤S5中,通信模块将省份内景点的拥挤程度信息传输至用户端
可选的,所述数据筛选子模块还得出第个数据平台搜索景点出现的原文总数量的信息,并传输至控制模块。
可选的,所述控制模块计算省份内景点的拥挤程度因子时,满足以下式子:
其中,为省份内景点的拥挤程度因子,/>为第/>个数据平台搜索景点出现的原文总数量,/>为第/>个数据平台的信息准确指数,/>为第/>个数据平台的权重指数,该值由工作人员预先根据经验设置,/>为前一年假期内前往景点的人流量,/>为前一年假期内前往景点的旅游者设定的推荐指数的平均值;
为省份热门程度参考指数,/>至/>为不同的省份热门程度参考指数的选择阈值,其中/></></></>,/>至/>为不同的省份热门程度因子的选择阈值。
具体的,均不相同,省份热门程度因子的数值越高,则对应的省份热门程度参考指数越高;计算前一年假期内前往景点的旅游者设定的推荐指数的平均值时需要注意以下事项,将对应景点的推荐指数统计在一起,且将最大值和最小值去除后再计算,且设定前一年假期内前往景点的旅游者设定的推荐指数的数值范围在0至10,当旅游者对景点的满意度越高,则对应的前一年假期内前往景点的旅游者设定的推荐指数越高;设定第/>个数据平台的信息准确指数时需要考虑对应的数据平台的所有数据与筛选的垃圾数据相比较,假设对应数据平台的垃圾数据占所有数据的比例较大,则对应的第/>个数据平台的信息准确指数较低;设定数据平台的权重指数时需要考虑的是数据平台的注册用户总数以及日均在线人数,当注册用户总数以及日均在线人数均偏高时数据平台的权重指数设较大,反之较小。
可选的,所述控制模块计算省份内景点的拥挤程度信息时,满足以下式子:
其中,为省份内景点的拥挤程度信息,/>为省份内景点的拥挤程度因子的选择阈值,当/>时为省份内景点的拥挤程度低,/>时为省份内景点的拥挤程度高。
本实施例解决了传统的文旅数据筛选方法的筛选速度较低的问题,具体的,本实施例利用AIGC技术能提高整体的处理效率以及信息提取的精准度,为旅游者提供更有价值的信息,且AIGC技术是以大数据为基础,更好的反应大众的信息。
另外,传统的筛选方法也无法预测旅游省份热门程度的情形,控制模块可以得出省份热门程度信息,便于旅游者规划旅游路线,且通过该信息可以提醒商家加大力度备货且能提醒安排相关警力调整现场秩序。
且计算省份热门程度因子时,以今年假期内前往省份的人流量和前一年假期内前往省份的人流量形成的比例为基础,然后考虑前一年假期内前往省份自驾游的人流量以及数据平台中反应的数据,综合考虑到实际人流量与网络数据平台对旅游者产生的影响,从而有助于提高计算省份热门程度因子的精度。
最后,假期出行的旅游者,多数会选择舒适且人少的旅游线路,当已经明确旅游的省份后,通过控制模块计算省份内景点的拥挤程度因子并得出省份内景点的拥挤程度信息,旅游者参考省份内景点的拥挤程度信息再选择是否前往该景点旅游,从而提高旅游的体验感。
实施例二:本实施例包含了实施例一的全部内容,提供了一种基于AIGC的文旅数据筛选方法,结合图4和图5所示。
一种基于AIGC的文旅数据筛选方法,包括以下步骤:
在步骤S1中:还利用尺寸测量模块测量尺寸且得出省份的总面积和省份内第一景点和第二景点之间的距离信息,并传输至控制模块;
在步骤S4中:控制模块根据相关信息计算省份内两个景点之间的安全程度系数,根据省份内两个景点之间的安全程度系数得出省份内两个景点之间的安全程度信息并传输至通信模块;
在步骤S5中:通信模块将省份内两个景点之间的安全程度信息传输至用户端。
可选的,尺寸测量模块包括依次通信连接图像拍摄子模块、目标提取子模块和尺寸计算子模块,尺寸计算子模块与控制模块通信连接;
图像拍摄子模块用于拍摄且得出拍摄图像,并传输至目标提取子模块;
目标提取子模块根据设定的目标提取拍摄图像且得出目标图像,并传输至尺寸计算子模块;
尺寸计算子模块根据目标图像得出省份的总面积,根据目标图像且结合导航软件得到省份内第一景点和第二景点之间的距离信息,并传输至控制模块。
具体的,尺寸测量模块利用现有的视觉检测的技术检测省份的总面积和省份内第一景点和第二景点之间的距离信息,从而有助于提高整体计算的精准度以及整个方法的处理速度。
可选的,控制模块计算省份内两个景点之间的安全程度系数时,满足以下式子:
其中,为省份内两个景点之间的安全程度系数,/>为省份的总面积,/>为省份内第一景点的拥挤程度信息,/>为省份内第二景点的拥挤程度信息,所述拥挤程度信息均根据实施例一中的拥挤程度信息/>计算公式获得,/>为省份内第一景点和第二景点之间的距离,该距离计算的方式如下:尺寸计算子模块获取第一景点和第二景点的中心位置信息,然后结合导航软件的自驾方式,所得出的最短距离。
具体的,省份内第一景点的拥挤程度信息、省份内第二景点的拥挤程度信息的计算方式与省份内景点的拥挤程度信息的计算方式均相同,省份内第一景点的拥挤程度信息和省份内第二景点的拥挤程度信息仅仅是用于区别两个不同景点的省份内景点的拥挤程度信息。
可选的,控制模块计算省份内两个景点之间的安全程度信息时,满足以下式子:
其中,为省份内两个景点之间的安全程度信息,/>为省份内两个景点之间的安全程度系数的选择阈值,当/>时为省份内两个景点之间的安全程度高,当/>时为省份内两个景点之间的安全程度低。
本实施例解决了传统的文旅数据筛选方法无法判断同一省份内两个景点之间的安全问题,具体的,本实施例通过控制模块计算省份内两个景点之间的安全程度系数,通过省份内两个景点之间的安全程度系数得出省份内两个景点之间的安全程度信息,当时为省份内两个景点之间的安全程度低,此时需要在两个景点之间的主干道安排更多的警力配合,以及延长现场的开放时间,另外通知景点周围的商家安排足够的商品以满足旅游者的基本需求。
以上所公开的内容仅为本发明的优选可行实施例,并非因此局限本发明的保护范围,所以凡是运用本发明说明书及附图内容所做的等效技术变化,均包含于本发明的保护范围内,此外,随着技术发展其中的元素是可以更新的。

Claims (8)

1.一种基于AIGC的文旅数据筛选方法,其特征在于,包括以下步骤:
S1:数据统计模块统计数据且得出今年假期内前往省份的人流量、前一年假期内前往省份自驾游的人流量、前一年假期内前往省份的人流量和前一年假期内前往省份的车辆总数的信息,并传输至控制模块;
S2:数据预设模块设定统计自驾游人流量的准确率、数据平台的总数量、统计数据平台的准确率和车辆内的平均人数的信息,并传输至控制模块;
S3:数据分析模块基于AIGC技术得出第个数据平台搜索关键词的总数量、第/>个数据平台搜索关键词时对应原文热度最高的好评总数量、第/>个数据平台搜索关键词时对应原文热度最高的总评论数量和第/>个数据平台搜索关键词时对应原文热度最高的发文者的粉丝量的信息,并传输至控制模块;
S4:控制模块根据前一年假期内前往省份的车辆总数和车辆内的平均人数计算前一年假期内前往省份自驾游的人流量,根据相关信息计算省份热门程度因子,根据省份热门程度因子得出省份热门程度信息并传输至通信模块;
S5:通信模块将省份热门程度信息传输至用户端。
2.如权利要求1所述的一种基于AIGC的文旅数据筛选方法,其特征在于,所述数据分析模块包括依次通信连接的数据采集子模块、数据转换子模块、数据筛选子模块和数据传输子模块,所述数据传输子模块与控制模块通信连接;
所述数据采集子模块用于采集相关的语音、图像和文字的信息,并传输至数据转换子模块;
所述数据转换子模块将相关的语音和图像的信息转换为文字信息,并将转换的文字信息和数据采集子模块采集的文字信息均传输至数据筛选子模块;
所述数据筛选子模块基于AIGC技术筛选转换的文字信息、采集的文字信息且得出筛选的文字信息,并传输至数据传输子模块;
所述数据传输子模块基于AIGC技术根据筛选的文字信息得出第个数据平台搜索关键词的总数量、第/>个数据平台搜索关键词时对应原文热度最高的好评总数量、第/>个数据平台搜索关键词时对应原文热度最高的总评论数量和第/>个数据平台搜索关键词时对应原文热度最高的发文者的粉丝量的信息,并传输至控制模块。
3.如权利要求2所述的一种基于AIGC的文旅数据筛选方法,其特征在于,所述控制模块计算省份热门程度因子时,满足以下式子:
其中,为省份热门程度因子,/>为今年假期内前往省份的人流量,/>为前一年假期内前往省份自驾游的人流量,/>为统计自驾游人流量的准确率,/>为前一年假期内前往省份的人流量,/>为数据平台的总数量,/>为第/>个数据平台搜索关键词的总数量,/>第/>个数据平台搜索关键词时对应原文热度最高的好评总数量,/>为第/>个数据平台搜索关键词时对应原文热度最高的总评论数量,/>为第/>个数据平台搜索关键词时对应原文热度最高的发文者的粉丝量,/>为统计数据平台的准确率;
为前一年假期内前往省份的车辆总数,/>为车辆内的平均人数。
4.如权利要求3所述的一种基于AIGC的文旅数据筛选方法,其特征在于,所述控制模块计算省份热门程度信息时,满足以下式子:
其中,为省份热门程度信息,/>为省份热门程度因子的选择阈值,当/>时为省份热门程度低,当/>时为省份热门程度高。
5.如权利要求4所述的一种基于AIGC的文旅数据筛选方法,其特征在于,在步骤S1中,数据统计模块还得出前一年假期内前往景点的人流量和前一年假期内前往景点的旅游者设定的推荐指数的平均值的信息,并传输至控制模块;
在步骤S2中,数据预设模块还设定第个数据平台的信息准确指数和第/>个数据平台的权重指数的信息,并传输至控制模块;
在步骤S3中,数据分析模块还得出第个数据平台搜索景点出现的原文总数量的信息,并传输至控制模块;
在步骤S4中,控制模块根据省份热门程度因子计算省份热门程度参考指数,根据相关信息计算省份内景点的拥挤程度因子,根据省份内景点的拥挤程度因子得出省份内景点的拥挤程度信息并传输至通信模块;
在步骤S5中,通信模块将省份内景点的拥挤程度信息传输至用户端。
6.如权利要求5所述的一种基于AIGC的文旅数据筛选方法,其特征在于,所述数据筛选子模块还得出第个数据平台搜索景点出现的原文总数量的信息,并传输至控制模块。
7.如权利要求6所述的一种基于AIGC的文旅数据筛选方法,其特征在于,所述控制模块计算省份内景点的拥挤程度因子时,满足以下式子:
其中,为省份内景点的拥挤程度因子,/>为第/>个数据平台搜索景点出现的原文总数量,/>为第/>个数据平台的信息准确指数,/>为第/>个数据平台的权重指数,/>为前一年假期内前往景点的人流量,/>为前一年假期内前往景点的旅游者设定的推荐指数的平均值;
为省份热门程度参考指数,/>至/>为不同的省份热门程度参考指数的选择阈值,其中</></></>,/>至/>为不同的省份热门程度因子的选择阈值。
8.如权利要求7所述的一种基于AIGC的文旅数据筛选方法,其特征在于,所述控制模块计算省份内景点的拥挤程度信息时,满足以下式子:
其中,为省份内景点的拥挤程度信息,/>为省份内景点的拥挤程度因子的选择阈值,当/>时为省份内景点的拥挤程度低,/>时为省份内景点的拥挤程度高。
CN202311812174.3A 2023-12-27 2023-12-27 一种基于aigc的文旅数据筛选方法 Active CN117473169B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311812174.3A CN117473169B (zh) 2023-12-27 2023-12-27 一种基于aigc的文旅数据筛选方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311812174.3A CN117473169B (zh) 2023-12-27 2023-12-27 一种基于aigc的文旅数据筛选方法

Publications (2)

Publication Number Publication Date
CN117473169A true CN117473169A (zh) 2024-01-30
CN117473169B CN117473169B (zh) 2024-04-16

Family

ID=89639944

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311812174.3A Active CN117473169B (zh) 2023-12-27 2023-12-27 一种基于aigc的文旅数据筛选方法

Country Status (1)

Country Link
CN (1) CN117473169B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2010201127A1 (en) * 2009-06-09 2010-12-23 Earthcheck Pty Ltd Sustainability assessment
CN109858388A (zh) * 2019-01-09 2019-06-07 武汉中联智诚科技有限公司 一种智慧旅游管理***
CN110795673A (zh) * 2019-10-30 2020-02-14 成都中科大旗软件股份有限公司 基于多维数据分析的文旅综合管理平台
CN117135380A (zh) * 2023-10-26 2023-11-28 环球数科集团有限公司 一种基于aigc技术的文旅产品直播营销***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2010201127A1 (en) * 2009-06-09 2010-12-23 Earthcheck Pty Ltd Sustainability assessment
CN109858388A (zh) * 2019-01-09 2019-06-07 武汉中联智诚科技有限公司 一种智慧旅游管理***
CN110795673A (zh) * 2019-10-30 2020-02-14 成都中科大旗软件股份有限公司 基于多维数据分析的文旅综合管理平台
CN117135380A (zh) * 2023-10-26 2023-11-28 环球数科集团有限公司 一种基于aigc技术的文旅产品直播营销***

Also Published As

Publication number Publication date
CN117473169B (zh) 2024-04-16

Similar Documents

Publication Publication Date Title
CN108154134B (zh) 基于深度卷积神经网络的互联网直播色情图像检测方法
CN104318324B (zh) 基于出租车gps记录的机场巴士站点及路线规划方法
Yu et al. Characterizing metro stations via urban function: Thematic evidence from transit-oriented development (TOD) in Hong Kong
CN109697214A (zh) 一种旅游数据分析***及方法
Brida et al. Segmenting cruise passengers visiting Uruguay: A factor–cluster analysis
CN108364467A (zh) 一种基于改进型决策树算法的路况信息预测方法
CN110084151A (zh) 基于非局部网络深度学习的视频异常行为判别方法
CN106156372B (zh) 一种互联网网站的分类方法及装置
WO2023143000A1 (zh) 一种基于多源大数据的老龄友好街道建成环境审计***
CN112668375B (zh) 景区内游客分布分析***及方法
CN107657056A (zh) 基于人工智能展示评论信息的方法和装置
CN104834739B (zh) 互联网信息存储***
CN108764018A (zh) 一种基于卷积神经网络的多任务车辆再识别方法及装置
Li et al. Study on tourism consumer behavior and countermeasures based on big data
CN104809252A (zh) 互联网数据提取***
CN113449111B (zh) 基于时空语义知识迁移的社会治理热点话题自动识别方法
CN106204297A (zh) 一种封闭社交传播意见领袖的识别方法及装置
Zhang et al. Knowledge and topology: A two layer spatially dependent graph neural networks to identify urban functions with time-series street view image
CN112417204A (zh) 一种基于实时路况的音乐推荐***
CN115100395A (zh) 一种融合poi预分类和图神经网络的城市街区功能分类方法
CN111104614A (zh) 用于旅游目的地推荐***的召回信息的生成方法
Michailidis et al. Real time location based sentiment analysis on twitter: The airsent system
CN113064989B (zh) 一种交通舆情感知特征提取方法
CN117473169B (zh) 一种基于aigc的文旅数据筛选方法
CN109166012A (zh) 针对行程预定类用户的分类及信息推送的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant