CN113553399B - 基于模糊语言近似概念格的文本搜索方法及*** - Google Patents
基于模糊语言近似概念格的文本搜索方法及*** Download PDFInfo
- Publication number
- CN113553399B CN113553399B CN202110807366.XA CN202110807366A CN113553399B CN 113553399 B CN113553399 B CN 113553399B CN 202110807366 A CN202110807366 A CN 202110807366A CN 113553399 B CN113553399 B CN 113553399B
- Authority
- CN
- China
- Prior art keywords
- language
- house
- fuzzy language
- fuzzy
- renting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 238000011156 evaluation Methods 0.000 claims abstract description 24
- 230000015654 memory Effects 0.000 claims description 12
- 239000011159 matrix material Substances 0.000 claims description 8
- 238000013507 mapping Methods 0.000 claims description 5
- 239000000126 substance Substances 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 239000000463 material Substances 0.000 claims description 2
- 230000008569 process Effects 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 239000013589 supplement Substances 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 238000010438 heat treatment Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000035699 permeability Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000003749 cleanliness Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 101150049349 setA gene Proteins 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0645—Rental transactions; Leasing transactions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/16—Real estate
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Marketing (AREA)
- Data Mining & Analysis (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Finance (AREA)
- Tourism & Hospitality (AREA)
- Databases & Information Systems (AREA)
- Strategic Management (AREA)
- Computational Linguistics (AREA)
- Primary Health Care (AREA)
- Artificial Intelligence (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了基于模糊语言近似概念格的文本搜索方法及***,获取租房领域的若干个评价语言值;根据房屋、房屋属性以及二者之间的关系,构建租房领域模糊语言数据集;生成租房领域模糊语言近似概念;生成租房领域模糊语言近似概念格;得到补全后的租房领域模糊语言近似概念;根据补全后的租房领域模糊语言近似概念和租房领域模糊语言近似概念格,得到补全后的租房领域模糊语言近似概念格;获取待搜索的租房领域房屋属性,将待搜索的房屋属性输入到补全后的租房领域模糊语言近似概念格中,输出搜索结果。利用补全后的模糊语言近似概念格可以解决租房领域中部分评价信息不完整的问题,对不完整的评价信息进行了处理,缩小搜索范围。
Description
技术领域
本发明涉及数据挖掘和智能信息处理技术领域,特别是涉及基于模糊语言近似概念格的文本搜索方法及***。
背景技术
本部分的陈述仅仅是提到了与本发明相关的背景技术,并不必然构成现有技术。
目前,概念格作为一种有效的数据分析工具,在信息检索、软件工程、推荐***、知识发现等领域都具有比较广泛的应用。利用概念格可以发现隐含的概念以及概念之间的关系,并且概念格可以将概念形式化,通过符号表示所有的概念。但是由于经典概念格的完备性和准确性,在实际应用中会存在某种局限,为了表示不完备信息,李金海基于不完备形式背景构建了近似概念格,提出了一种从不完备决策形式背景中提取非冗余近似决策规则的方法。为了处理具有语言值的不确定性问题,崔慧给出了基于模糊语言决策形式背景下的规则提取方法。
如今从现实世界的应用中收集到的信息规模是巨大的,有时会遇到信息缺失的情况,同时在不确定环境下存在大量用语言值表达的信息,这给知识的评价,解释,发现都带来了一定的困难。
发明人发现,现有技术中存在如下技术问题需要解决:
目前租房人员在租房网站搜索自己感兴趣的多个关键词时,并不能一次搜索到最相关或最接近的信息,或者搜索出来的信息与自己感兴趣的方向并不相关,增加了搜索的时长,降低了用户的体验度。
发明内容
为了解决现有技术的不足,本发明提供了基于模糊语言近似概念格的文本搜索方法及***;
第一方面,本发明提供了基于模糊语言近似概念格的文本搜索方法;
基于模糊语言近似概念格的文本搜索方法,包括:
获取租房领域的若干个评价语言值;根据房屋、房屋属性以及二者之间的关系,构建租房领域模糊语言数据集;
根据租房领域模糊语言数据集,生成租房领域模糊语言近似概念;
根据租房领域模糊语言近似概念,生成租房领域模糊语言近似概念格;
对租房领域模糊语言近似概念进行数据补全,得到补全后的租房领域模糊语言近似概念;
根据补全后的租房领域模糊语言近似概念和租房领域模糊语言近似概念格,得到补全后的租房领域模糊语言近似概念格;
获取待搜索的租房领域房屋属性,将待搜索的房屋属性输入到补全后的租房领域模糊语言近似概念格中,输出搜索结果。
第二方面,本发明提供了基于模糊语言近似概念格的文本搜索***;
基于模糊语言近似概念格的文本搜索***,包括:
获取模块,其被配置为:获取租房领域的若干个评价语言值;根据房屋、房屋属性以及二者之间的关系,构建租房领域模糊语言数据集;
模糊语言近似概念生成模块,其被配置为:根据租房领域模糊语言数据集,生成租房领域模糊语言近似概念;
模糊语言近似概念格生成模块,其被配置为:根据租房领域模糊语言近似概念,生成租房领域模糊语言近似概念格;
数据补全模块,其被配置为:对租房领域模糊语言近似概念进行数据补全,得到补全后的租房领域模糊语言近似概念;
补全模糊语言近似概念格生成模块,其被配置为:根据补全后的租房领域模糊语言近似概念和租房领域模糊语言近似概念格,得到补全后的租房领域模糊语言近似概念格;
输出模块,其被配置为:获取待搜索的租房领域房屋属性,将待搜索的房屋属性输入到补全后的租房领域模糊语言近似概念格中,输出搜索结果。
第三方面,本发明还提供了一种电子设备,包括:
存储器,用于非暂时性存储计算机可读指令;以及
处理器,用于运行所述计算机可读指令,
其中,所述计算机可读指令被所述处理器运行时,执行上述第一方面所述的方法。
第四方面,本发明还提供了一种存储介质,非暂时性地存储计算机可读指令,其中,当所述非暂时性计算机可读指令由计算机执行时,执行第一方面所述方法的指令。
与现有技术相比,本发明的有益效果是:
针对在不完备形式背景下不能很好地获取语言值信息的问题,本发明将语言值引入不完备形式背景中以解决上述问题。对比近似概念格,补全后的模糊语言近似概念格对缺失数据进行了处理,减少了信息缺失的损失,缩减了概念,缩小了搜索范围,并且利用语言值可以从对象一定具有的属性,以及对象一定具有或可能具有的属性,这两方面更好地表达定性概念。
利用模糊语言近似概念可以从该房屋一定具有的属性,以及一定具有或可能具有的属性这两方面来描述房屋,更好地表达定性概念。利用补全后的模糊语言近似概念格可以解决租房领域中部分评价信息不完整的问题,对不完整的评价信息进行了处理,缩小了搜索范围。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为本发明实施例模糊语言近似概念格的结构图。
图2为本发明实施例补全后的模糊语言近似概念格的结构图。
具体实施方式
应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
本实施例所有数据的获取都在符合法律法规和用户同意的基础上,对数据的合法应用。
实施例一
本实施例提供了基于模糊语言近似概念格的文本搜索方法;
基于模糊语言近似概念格的文本搜索方法,包括:
S101:获取租房领域的若干个评价语言值;根据房屋、房屋属性以及二者之间的关系,构建租房领域模糊语言数据集;
S102:根据租房领域模糊语言数据集,生成租房领域模糊语言近似概念;
S103:根据租房领域模糊语言近似概念,生成租房领域模糊语言近似概念格;
S104:对租房领域模糊语言近似概念进行数据补全,得到补全后的租房领域模糊语言近似概念;
S105:根据补全后的租房领域模糊语言近似概念和租房领域模糊语言近似概念格,得到补全后的租房领域模糊语言近似概念格;
S106:获取待搜索的租房领域房屋属性,将待搜索的房屋属性输入到补全后的租房领域模糊语言近似概念格中,输出搜索结果。
进一步地,所述S101:获取租房领域的若干个评价语言值;具体包括:
获取租房领域的若干个评价语言值{S,◇},其中S={sα|α=-τ,...-1,0,1,...,τ},则称集合S为下标对称的语言术语集;其中,s0表示“一般”,其余的语言术语均对称的放置在s0两侧;语言集术语集S表示为S={s-2=低,s-1=较低,s0=一般,s1=较高,s2=高};◇表示评价语言值缺失。
进一步地,所述S101:根据房屋、房屋属性以及二者之间的关系,构建租房领域模糊语言数据集;具体包括:
设定(U,A,{S,◇},R◇)为一租房领域的不完备模糊语言形式背景,其中U={ui|i∈1,2,...,n}为房屋集合,A={aj|j∈1,2,...,m}为属性集合,S={sα|α=-τ,...-1,0,1,...,τ},收集映射R◇:U×A→{S,◇},给定阈值
若R◇(u,a)=◇,则表示房屋u是否具有属性a的情况未知,即评价语言值缺失。
ui表示第i个对象;n表示对象的总数量;aj表示第j个属性;m表示属性的总数量。
房屋具有属性,包括:房屋价格、房屋结构、房屋面积、房屋层高、房屋水电暖电梯基础设施配备情况、房屋通透性、房屋地理位置、房屋周边商超医院其他建筑设施配备情况等。
进一步地,所述S102:根据租房领域模糊语言数据集,生成租房领域模糊语言近似概念;具体包括:
其中,AS为属性集A定义在{S,◇}上的子集。X′#表示全体房屋共同确定具有的属性语言值交集集合,X″*表示全体房屋共同确定具有或可能具有的属性语言值交集集合。
XΔ=(X′#,X″*)
S1023:设(U,A,{S,◇},R◇)为一不完备模糊语言形式背景,若XΔ=(B,C),称(X,(B,C))为不完备模糊语言形式背景(U,A,{S,◇},R◇)的一个模糊语言近似概念,其中,称X是模糊语言近似概念(X,(B,C))的外延,(B,C)是模糊语言近似概念(X,(B,C))的内涵。
进一步地,所述S103:根据租房领域模糊语言近似概念,生成租房领域模糊语言近似概念格;具体包括:
进一步地,所述S104:对租房领域模糊语言近似概念进行数据补全,得到补全后的租房领域模糊语言近似概念;具体包括:
通过计算缺失值对应行的语言值集的平均值,利用平均值对不完备模糊语言形式背景缺失值进行初始补全;
计算得到初始补全后的不完备模糊语言形式背景中各个对象语言值集之间的模糊语言混合相似度;
根据各个对象语言值集之间的模糊语言混合相似度,得到模糊语言混合相似度矩阵;
根据模糊语言混合相似度矩阵得到缺失值最为相似的对象,利用最为相似对象的值对缺失值进行补全,得到补全后的租房领域模糊语言近似概念。
模糊语言混合相似度,公式:
进一步地,所述S104:对租房领域模糊语言近似概念进行数据补全,得到补全后的租房领域模糊语言近似概念;具体包括:
S1041:在不完备模糊语言形式背景(U,A,{S,◇},R◇)下,其中U={ui|i∈1,2,...,n}为房屋集合,A={aj|j∈1,2,...,m}为属性集合,用均值填补法对不完备模糊语言形式背景(U,A,{S,◇},R◇)进行初始填充,则房屋ui缺失的评价语言值的填充值为:
S1042:在(U,A,S*,R*)中,其中U={ui|i∈1,2,...,n}为一个非空对象集,A={aj|j∈1,2,...,m}为一个非空属性集,S*为初始补全后的语言值集,映射R*:U×A→S*,为U定义在集合A上的初始补全后的语言值集,其中那么对于任意up∈U的语言值集和任意uq∈U的语言值集的模糊语言混合相似度计算公式定义如下:
其中,表示房屋up和房屋uq语言值集的交集元素个数,表示房屋up和房屋uq语言值集的并集元素个数,分别表示房屋up的属性aj对应的语言值角标,房屋uq的属性aj对应的语言值角标, 分别是房屋up和房屋uq语言值集的角标均值。
S1043:找到与需要补全评价语言值的房屋的模糊语言混合相似度最高的房屋,对其进行二次补全,得到补全后的模糊语言形式背景(U,A,S,R)。
进一步地,所述S106:获取待搜索的租房领域房屋属性,将待搜索的房屋属性输入到补全后的租房领域模糊语言近似概念格中,输出搜索结果;具体包括:
获取待搜索的属性,将待搜索的属性输入到补全后的租房领域模糊语言近似概念格中,输出搜索结果。
所述租房领域房屋属性,包括:房屋价格、房屋结构、房屋面积、房屋层高、房屋水电暖电梯基础设施配备情况、房屋通透性、房屋地理位置、房屋周边商超医院其他建筑设施配备情况等。
以房屋租赁为例,本发明提出一种在不完备模糊语言形式背景下,基于模糊语言近似概念格的搜索方法,按照如下步骤进行:
步骤1数据采集与预处理:
给定一个不完备模糊语言形式背景(U,A,{S,◇},R◇),其中U={u1,u2,u3,u4,u5}表示5所房屋,A={a1,a2,a3,a4,a5,a6}表示6个属性,a1表示价格优惠,a2表示户型通透,a3表示交通便利,a4表示设施齐全,a5表示周边环境整洁,a6表示购物便利。S={s-3=很低,s-2=低,s-1=较低,s0=一般,s1=较高,s2=高,s3=很高},为了只考虑对象一定具有的属性,需要设定一个阈值,以便忽略小于该阈值的属性,设阈值如表1所示。
表1不完备模糊语言形式背景(U,A,{S,◇},R◇)
注:◇2表示对象u2的缺失语言值,◇3表示对象u3的缺失语言值,◇5表示对象u5的缺失语言值。
步骤2生成模糊语言近似概念:
基于不完备模糊语言形式背景(U,A,{S,◇},R◇),利用 上定义运算:XΔ=(X′#,X″*),若XΔ=(B,C),得到不完备模糊语言形式背景(U,A,{S,◇},R◇)的模糊语言近似概念(X,(B,C)),如下所示:
步骤3生成模糊语言近似概念格:根据得到的模糊语言近似概念构建模糊语言近似概念格,如图1所示。
步骤4生成补全后的模糊语言近似概念及概念格:
步骤4.1通过计算缺失值对应行的语言值集的平均值,利用均值对不完备模糊语言形式背景缺失值进行初始补全,如表2所示(填充值用二元组语言值加粗表示)。
表2初始补全形式背景(U,A,S*,R*)
步骤4.2利用模糊语言混合相似度公式计算得到初始补全后的(U,A,S*,R*)中各个对象语言值集之间的模糊语言混合相似度,给出模糊语言混合相似度矩阵:
步骤4.3由模糊语言混合相似度矩阵得到:
对象u2和对象u1最为相似,因此对象u2缺失值补s2;
对象u3和对象u4最为相似,因此对象u3缺失值补s1;
对象u5和对象u4最为相似,因此对象u5缺失值补s2;
得到二次补全后的模糊语言形式背景(U,A,S,R),如表3所示(填充值用语言值加粗表示)。
表3模糊语言形式背景(U,A,S,R)
根据表3,删除重复概念6#,7#,12#,19#,得到26个补全后的模糊语言近似概念:
根据补全后的模糊语言近似概念得到补全后的模糊语言近似概念格,见图2。
基于补全后的模糊语言近似概念格进行查询,假设租客正在寻找价格优惠,户型通透,周边环境整洁的房屋,即寻找具有属性a1、a2、a5的对象。该查询以不完备模糊语言形式背景中的属性表示如下:
Q={a1,a2,a5}
搜索得到满足条件的补全后的模糊语言近似概念如下:
由概念23#可知,u3、u5这两个房屋都满足条件,并且在已满足条件的所有补全后的模糊语言近似概念内,租客可以根据每个房屋具有所需属性的程度来选择更适合的对象。
由概念27#、29#可知,如果租客更看重价格优惠的情况,即更在意属性a1,则选择房屋u3;如果租客对房屋整体属性要求都较高,则选择房屋u5。
本发明公开了一种在不完备模糊语言形式背景下,基于模糊语言近似概念格的搜索方法。按照如下步骤进行:针对在不确定环境下存在大量用语言值表达的信息,并且语言值信息存在缺失的情况,提出不完备模糊语言形式背景,生成模糊语言近似概念;为了修正初始补全带来的误差,提出一种基于模糊语言混合相似度的补全方法;构建补全后的模糊语言近似概念格,实现信息的近似搜索。
实施例二
本实施例提供了基于模糊语言近似概念格的文本搜索***;
基于模糊语言近似概念格的文本搜索***,包括:
获取模块,其被配置为:获取租房领域的若干个评价语言值;根据房屋、房屋属性以及二者之间的关系,构建租房领域模糊语言数据集;
模糊语言近似概念生成模块,其被配置为:根据租房领域模糊语言数据集,生成租房领域模糊语言近似概念;
模糊语言近似概念格生成模块,其被配置为:根据租房领域模糊语言近似概念,生成租房领域模糊语言近似概念格;
数据补全模块,其被配置为:对租房领域模糊语言近似概念进行数据补全,得到补全后的租房领域模糊语言近似概念;
补全模糊语言近似概念格生成模块,其被配置为:根据补全后的租房领域模糊语言近似概念和租房领域模糊语言近似概念格,得到补全后的租房领域模糊语言近似概念格;
输出模块,其被配置为:获取待搜索的租房领域模糊语言,将待搜索的租房领域模糊语言输入到补全后的租房领域模糊语言近似概念格中,输出搜索结果。
此处需要说明的是,上述获取模块、模糊语言近似概念生成模块、模糊语言近似概念格生成模块、数据补全模块、补全模糊语言近似概念格生成模块和输出模块对应于实施例一中的步骤S101至S106,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为***的一部分可以在诸如一组计算机可执行指令的计算机***中执行。
上述实施例中对各个实施例的描述各有侧重,某个实施例中没有详述的部分可以参见其他实施例的相关描述。
所提出的***,可以通过其他的方式实现。例如以上所描述的***实施例仅仅是示意性的,例如上述模块的划分,仅仅为一种逻辑功能划分,实际实现时,可以有另外的划分方式,例如多个模块可以结合或者可以集成到另外一个***,或一些特征可以忽略,或不执行。
实施例三
本实施例还提供了一种电子设备,包括:一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序;其中,处理器与存储器连接,上述一个或多个计算机程序被存储在存储器中,当电子设备运行时,该处理器执行该存储器存储的一个或多个计算机程序,以使电子设备执行上述实施例一所述的方法。
应理解,本实施例中,处理器可以是中央处理单元CPU,处理器还可以是其他通用处理器、数字信号处理器DSP、专用集成电路ASIC,现成可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如,存储器还可以存储设备类型的信息。
在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。
实施例一中的方法可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。
本领域普通技术人员可以意识到,结合本实施例描述的各示例的单元及算法步骤,能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
实施例四
本实施例还提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成实施例一所述的方法。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.基于模糊语言近似概念格的文本搜索方法,其特征是,包括:
获取租房领域的若干个评价语言值;根据房屋、房屋属性以及二者之间的关系,构建租房领域模糊语言数据集;
根据租房领域模糊语言数据集,生成租房领域模糊语言近似概念;
根据租房领域模糊语言近似概念,生成租房领域模糊语言近似概念格;
对租房领域模糊语言近似概念进行数据补全,得到补全后的租房领域模糊语言近似概念;
根据补全后的租房领域模糊语言近似概念和租房领域模糊语言近似概念格,得到补全后的租房领域模糊语言近似概念格;
获取待搜索的租房领域房屋属性,将待搜索的房屋属性输入到补全后的租房领域模糊语言近似概念格中,输出搜索结果;
根据房屋、房屋属性以及二者之间的关系,构建租房领域模糊语言数据集;具体包括:
设定(U,A,{S,◇},R◇)为一租房领域的不完备模糊语言形式背景,其中U={ui|i∈1,2,...,n}为房屋集合,A={aj|j∈1,2,...,m}为属性集合,S={sα|α=-τ,...-1,0,1,...,τ},S为下标对称的语言术语集,收集映射R◇:U×A→{S,◇},给定阈值
若R◇(u,a)=◇,则表示房屋u是否具有属性a的情况未知,即评价语言值缺失;
ui表示第i个对象;n表示对象的总数量;aj表示第j个属性;m表示属性的总数量;
对租房领域模糊语言近似概念进行数据补全,得到补全后的租房领域模糊语言近似概念;具体包括:
通过计算缺失值对应行的语言值集的平均值,利用平均值对不完备模糊语言形式背景缺失值进行初始补全;
计算得到初始补全后的不完备模糊语言形式背景中各个对象语言值集之间的模糊语言混合相似度;
根据各个对象语言值集之间的模糊语言混合相似度,得到模糊语言混合相似度矩阵;
根据模糊语言混合相似度矩阵得到缺失值最为相似的对象,利用最为相似对象的值对缺失值进行补全,得到补全后的租房领域模糊语言近似概念;
对租房领域模糊语言近似概念进行数据补全,得到补全后的租房领域模糊语言近似概念;具体包括:
(a):在不完备模糊语言形式背景(U,A,{S,◇},R◇)下,其中U={ui|i∈1,2,...,n}为房屋集合,A={aj|j∈1,2,...,m}为属性集合,用均值填补法对不完备模糊语言形式背景(U,A,{S,◇},R◇)进行初始填充,则房屋ui缺失的评价语言值的填充值为:
(b):在(U,A,S*,R*)中,其中U={ui|i∈1,2,...,n}为一个非空对象集,A={aj|j∈1,2,...,m}为一个非空属性集,S*为初始补全后的语言值集,映射R*:U×A→S*,为U定义在集合A上的初始补全后的语言值集,其中那么对于任意up∈U的语言值集和任意uq∈U的语言值集的模糊语言混合相似度计算公式定义如下:
其中表示房屋up和房屋uq语言值集的交集元素个数,表示房屋up和房屋uq语言值集的并集元素个数,分别表示房屋up的属性aj对应的语言值角标,房屋uq的属性aj对应的语言值角标, 分别是房屋up和房屋uq语言值集的角标均值;
(c):找到与需要补全评价语言值的房屋的模糊语言混合相似度最高的房屋,对其进行二次补全,得到补全后的模糊语言形式背景(U,A,S,R)。
2.如权利要求1所述的基于模糊语言近似概念格的文本搜索方法,其特征是,获取租房领域的若干个评价语言值;具体包括:
获取租房领域的若干个评价语言值{S,◇},其中S={sα|α=-τ,...-1,0,1,...,τ},则称集合S为下标对称的语言术语集;其中,s0表示“一般”,其余的语言术语均对称的放置在s0两侧;语言集术语集S表示为S={s-2=低,s-1=较低,s0=一般,s1=较高,s2=高};◇表示评价语言值缺失。
3.如权利要求1所述的基于模糊语言近似概念格的文本搜索方法,其特征是,根据租房领域模糊语言数据集,生成租房领域模糊语言近似概念;具体包括:
其中,AS为属性集A定义在{S,◇}上的子集;X′#表示全体房屋共同确定具有的属性语言值交集集合,X″*表示全体房屋共同确定具有或可能具有的属性语言值交集集合;
(2):设定(U,A,{S,◇},R◇)为一不完备模糊语言形式背景;
XΔ=(X′#,X″*)
5.基于模糊语言近似概念格的文本搜索***,其特征是,包括:
获取模块,其被配置为:获取租房领域的若干个评价语言值;根据房屋、房屋属性以及二者之间的关系,构建租房领域模糊语言数据集;
模糊语言近似概念生成模块,其被配置为:根据租房领域模糊语言数据集,生成租房领域模糊语言近似概念;
模糊语言近似概念格生成模块,其被配置为:根据租房领域模糊语言近似概念,生成租房领域模糊语言近似概念格;
数据补全模块,其被配置为:对租房领域模糊语言近似概念进行数据补全,得到补全后的租房领域模糊语言近似概念;
补全模糊语言近似概念格生成模块,其被配置为:根据补全后的租房领域模糊语言近似概念和租房领域模糊语言近似概念格,得到补全后的租房领域模糊语言近似概念格;
输出模块,其被配置为:获取待搜索的租房领域模糊语言,将待搜索的租房领域模糊语言输入到补全后的租房领域模糊语言近似概念格中,输出搜索结果;
根据房屋、房屋属性以及二者之间的关系,构建租房领域模糊语言数据集;具体包括:
设定(U,A,{S,◇},R◇)为一租房领域的不完备模糊语言形式背景,其中U={ui|i∈1,2,...,n}为房屋集合,A={aj|j∈1,2,...,m}为属性集合,S={sα|α=-τ,...-1,0,1,...,τ},S为下标对称的语言术语集,收集映射R◇:U×A→{S,◇},给定阈值
若R◇(u,a)=◇,则表示房屋u是否具有属性a的情况未知,即评价语言值缺失;
ui表示第i个对象;n表示对象的总数量;aj表示第j个属性;m表示属性的总数量;
对租房领域模糊语言近似概念进行数据补全,得到补全后的租房领域模糊语言近似概念;具体包括:
通过计算缺失值对应行的语言值集的平均值,利用平均值对不完备模糊语言形式背景缺失值进行初始补全;
计算得到初始补全后的不完备模糊语言形式背景中各个对象语言值集之间的模糊语言混合相似度;
根据各个对象语言值集之间的模糊语言混合相似度,得到模糊语言混合相似度矩阵;
根据模糊语言混合相似度矩阵得到缺失值最为相似的对象,利用最为相似对象的值对缺失值进行补全,得到补全后的租房领域模糊语言近似概念;
对租房领域模糊语言近似概念进行数据补全,得到补全后的租房领域模糊语言近似概念;具体包括:
(a):在不完备模糊语言形式背景(U,A,{S,◇},R◇)下,其中U={ui|i∈1,2,...,n}为房屋集合,A={aj|j∈1,2,...,m}为属性集合,用均值填补法对不完备模糊语言形式背景(U,A,{S,◇},R◇)进行初始填充,则房屋ui缺失的评价语言值的填充值为:
(b):在(U,A,S*,R*)中,其中U={ui|i∈1,2,...,n}为一个非空对象集,A={aj|j∈1,2,...,m}为一个非空属性集,S*为初始补全后的语言值集,映射R*:U×A→S*,为U定义在集合A上的初始补全后的语言值集,其中那么对于任意up∈U的语言值集和任意uq∈U的语言值集的模糊语言混合相似度计算公式定义如下:
其中表示房屋up和房屋uq语言值集的交集元素个数,表示房屋up和房屋uq语言值集的并集元素个数,分别表示房屋up的属性aj对应的语言值角标,房屋uq的属性aj对应的语言值角标, 分别是房屋up和房屋uq语言值集的角标均值;
(c):找到与需要补全评价语言值的房屋的模糊语言混合相似度最高的房屋,对其进行二次补全,得到补全后的模糊语言形式背景(U,A,S,R)。
6.一种电子设备,其特征是,包括:
存储器,用于非暂时性存储计算机可读指令;以及
处理器,用于运行所述计算机可读指令,
其中,所述计算机可读指令被所述处理器运行时,执行上述权利要求1-4任一项所述的方法。
7.一种存储介质,其特征是,非暂时性地存储计算机可读指令,其中,当所述非暂时性计算机可读指令由计算机执行时,执行权利要求1-4任一项所述方法的指令。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110807366.XA CN113553399B (zh) | 2021-07-16 | 2021-07-16 | 基于模糊语言近似概念格的文本搜索方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110807366.XA CN113553399B (zh) | 2021-07-16 | 2021-07-16 | 基于模糊语言近似概念格的文本搜索方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113553399A CN113553399A (zh) | 2021-10-26 |
CN113553399B true CN113553399B (zh) | 2022-05-27 |
Family
ID=78131975
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110807366.XA Active CN113553399B (zh) | 2021-07-16 | 2021-07-16 | 基于模糊语言近似概念格的文本搜索方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113553399B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114049956B (zh) * | 2022-01-12 | 2022-06-24 | 山东建筑大学 | 基于属性导出模糊对象语言概念格的疾病诊断预测*** |
CN116756431B (zh) * | 2023-08-14 | 2023-10-31 | 西南石油大学 | 不完备形式背景下基于近似概念的信息或物品推荐方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103440308A (zh) * | 2013-08-27 | 2013-12-11 | 北京理工大学 | 一种基于形式概念分析的数字论文检索方法 |
CN105678382A (zh) * | 2015-12-29 | 2016-06-15 | 惠州Tcl移动通信有限公司 | 一种基于子形式背景属性相似度的概念格合并方法及*** |
CN109086381A (zh) * | 2018-07-25 | 2018-12-25 | 郑州大学 | 模糊概念格的一种更新生成方法 |
CN109784405A (zh) * | 2019-01-16 | 2019-05-21 | 山东建筑大学 | 基于伪标签学习和语义一致性的跨模态检索方法及*** |
CN110377700A (zh) * | 2019-07-01 | 2019-10-25 | 厦门美域中央信息科技有限公司 | 一种专业知识语义检索*** |
CN111597217A (zh) * | 2020-05-07 | 2020-08-28 | 辽宁师范大学 | 基于模糊对象语言概念格的个性化推荐方法 |
CN112434813A (zh) * | 2020-11-03 | 2021-03-02 | 辽宁师范大学 | 基于面向属性语言概念格的多重多维语言推理方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101464896B (zh) * | 2009-01-23 | 2010-08-11 | 安徽科大讯飞信息科技股份有限公司 | 语音模糊检索方法及装置 |
CN102135955A (zh) * | 2011-04-14 | 2011-07-27 | 上海红神信息技术有限公司 | 一种基于模糊认知图的文档语义自动生成方法 |
US9461876B2 (en) * | 2012-08-29 | 2016-10-04 | Loci | System and method for fuzzy concept mapping, voting ontology crowd sourcing, and technology prediction |
CN104484815B (zh) * | 2014-12-18 | 2017-11-21 | 刘耀强 | 基于模糊本体面向产品方面的情感分析方法及*** |
CN106528629B (zh) * | 2016-10-09 | 2018-04-03 | 深圳云天励飞技术有限公司 | 一种基于几何空间划分的向量模糊搜索方法及*** |
CN112465337A (zh) * | 2020-11-25 | 2021-03-09 | 重庆邮电大学 | 一种基于犹豫模糊语言术语集的污水处理厂选址方法 |
CN112992370B (zh) * | 2021-05-06 | 2021-07-30 | 四川大学华西医院 | 一种无监督的基于电子病历的医疗行为合规性评估方法 |
-
2021
- 2021-07-16 CN CN202110807366.XA patent/CN113553399B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103440308A (zh) * | 2013-08-27 | 2013-12-11 | 北京理工大学 | 一种基于形式概念分析的数字论文检索方法 |
CN105678382A (zh) * | 2015-12-29 | 2016-06-15 | 惠州Tcl移动通信有限公司 | 一种基于子形式背景属性相似度的概念格合并方法及*** |
CN109086381A (zh) * | 2018-07-25 | 2018-12-25 | 郑州大学 | 模糊概念格的一种更新生成方法 |
CN109784405A (zh) * | 2019-01-16 | 2019-05-21 | 山东建筑大学 | 基于伪标签学习和语义一致性的跨模态检索方法及*** |
CN110377700A (zh) * | 2019-07-01 | 2019-10-25 | 厦门美域中央信息科技有限公司 | 一种专业知识语义检索*** |
CN111597217A (zh) * | 2020-05-07 | 2020-08-28 | 辽宁师范大学 | 基于模糊对象语言概念格的个性化推荐方法 |
CN112434813A (zh) * | 2020-11-03 | 2021-03-02 | 辽宁师范大学 | 基于面向属性语言概念格的多重多维语言推理方法 |
Non-Patent Citations (4)
Title |
---|
Cross-Lingual Document Representation andSemantic Similarity Measure: A Fuzzy Set and Rough Set Based Approach;Hsun-Hui Huang等;《IEEE Transactions on Fuzzy Systems》;20101231;第1098-1111页 * |
Granule Description of Object-Oriented Linguistic Concept Lattice Based on Dominance Relation;Hui Cui等;《2019 IEEE 14th International Conference on Intelligent Systems and Knowledge Engineering (ISKE)》;20191116;第1119-1125页 * |
基于内涵模糊概念格的汽车评价知识发现方法研究;李旸等;《中文信息学报》;20170531;第31卷(第3期);第69-76页 * |
基于粒计算的语言概念决策形式背景分析;庞阔等;《山东大学学报(工学版)》;20181231;第48卷(第6期);第74-81页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113553399A (zh) | 2021-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113553399B (zh) | 基于模糊语言近似概念格的文本搜索方法及*** | |
CN110457420B (zh) | 兴趣点位置识别方法、装置、设备及存储介质 | |
CN111259210B (zh) | 用于从管道和仪表图中自动化提取信息的***和方法 | |
Sarkar et al. | Integration, inference, and management of spatial information using bayesian networks: Perceptual organization | |
Peterson et al. | STARS: An ArcGIS toolset used to calculate the spatial information needed to fit spatial statistical models to stream network data | |
Masucci et al. | Limited urban growth: London's street network dynamics since the 18th century | |
CN112651373B (zh) | 一种建筑图纸文本信息的识别方法及装置 | |
CA2750093A1 (en) | Method for computing and storing voronoi diagrams, and uses therefor | |
CN111949306B (zh) | 一种支持开源项目碎片化学习的推送方法和*** | |
Abdolmajidi et al. | Matching authority and VGI road networks using an extended node-based matching algorithm | |
Nikolić et al. | Implementation of generic algorithm in map-matching model | |
CN111462069A (zh) | 目标对象检测模型训练方法、装置、电子设备及存储介质 | |
CN111784084A (zh) | 基于梯度提升决策树的出行生成预测方法、***及装置 | |
CN114911833A (zh) | 工业互联网平台监测数据传输交换方法及*** | |
Kim et al. | A simplified linear feature matching method using decision tree analysis, weighted linear directional mean, and topological relationships | |
Kochański et al. | Automating the conceptual design of residental areas using visual and generative programming | |
CN111382250A (zh) | 问句文本的匹配方法、装置、计算机设备和存储介质 | |
CN116822366A (zh) | 一种径流污染负荷计算模型构建和径流污染负荷计算方法 | |
CN110728359A (zh) | 搜索模型结构的方法、装置、设备和存储介质 | |
CN114969135A (zh) | 一种个性化旅游路线推荐方法、设备及介质 | |
CN114896353A (zh) | 一种地理编码方法、存储介质及*** | |
CN111435537B (zh) | 模型训练方法、装置及基于拼接图的位姿优化方法、装置 | |
JP4528644B2 (ja) | 配管図面認識方法及び装置 | |
CN112287005A (zh) | 一种数据处理方法、装置、服务器及介质 | |
CN112069806B (zh) | 简历筛选方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |