CN112133391B - 一种基于人体异常眉毛的疾病认知*** - Google Patents

一种基于人体异常眉毛的疾病认知*** Download PDF

Info

Publication number
CN112133391B
CN112133391B CN202010983562.8A CN202010983562A CN112133391B CN 112133391 B CN112133391 B CN 112133391B CN 202010983562 A CN202010983562 A CN 202010983562A CN 112133391 B CN112133391 B CN 112133391B
Authority
CN
China
Prior art keywords
eyebrow
characteristic information
disease
information
compared
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010983562.8A
Other languages
English (en)
Other versions
CN112133391A (zh
Inventor
李平
杜登斌
杜小军
杜乐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuzheng Intelligent Technology Beijing Co ltd
Original Assignee
Wuzheng Intelligent Technology Beijing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuzheng Intelligent Technology Beijing Co ltd filed Critical Wuzheng Intelligent Technology Beijing Co ltd
Priority to CN202010983562.8A priority Critical patent/CN112133391B/zh
Publication of CN112133391A publication Critical patent/CN112133391A/zh
Application granted granted Critical
Publication of CN112133391B publication Critical patent/CN112133391B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Epidemiology (AREA)
  • Biomedical Technology (AREA)
  • Primary Health Care (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本发明提出了一种基于人体异常眉毛的疾病认知***。包括:库构建模块,用于采集眉毛数据以及对应的疾病数据,并建立疾病认知数据库;特征提取模块,用于获取用户病历数据,通过TextRank算法从用户病历数据中提取眉毛特征信息作为待比较眉毛特征信息;比较模块,用于通过余弦相似度算法计算待比较眉毛特征信息与疾病认知库中眉毛特征信息之间的相似度,根据相似度确定眉毛特征信息以及对应的权重值;认知模块,用于根据用户病历数据中待比较眉毛特征信息对应的权重值确定待比较眉毛特征信息对应的伴随症状信息,根据伴随症状信息生成疾病认知报告。本发明通过TextRank算法以及权重值累加来对用户病历进行认知,能够更加精确认知对应疾病,提高整个***的精确度。

Description

一种基于人体异常眉毛的疾病认知***
技术领域
本发明涉及人工智能领域,尤其涉及一种基于人体异常眉毛的疾病认知***。
背景技术
眉毛不仅仅是脸上的一处风景,也是反映身体健康状况的晴雨表之一,通过眉毛的形态位置变化、色泽变化、脱落等,便能得知身体健康状况的信息。
现代医学对眉诊的诊断方式往往都是通过临床医师来进行诊断,得到临床医师的诊断报告后,再通过电脑对诊断报告进行分析,直至确定对应的疾病,这种方式虽然准确,但是比较耗费时间,用户体验不好,而直接通过电脑来完成整个认知分析过程,虽然速度快,但是最后的认知结果不够准确,所以,亟需一种基于人体异常眉毛的疾病认知***。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
有鉴于此,本发明提出了一种基于人体异常眉毛的疾病认知***,旨在解决现有技术无法实现通过权重值的累加来提高疾病认知的准确度的技术问题。
本发明的技术方案是这样实现的:
一方面,本发明提供了一种基于人体异常眉毛的疾病认知***,所述基于人体异常眉毛的疾病认知***包括:
库构建模块,用于采集眉毛数据以及对应的疾病数据,根据眉毛数据获取眉毛特征信息,根据疾病数据获取对应的伴随症状信息以及每个眉毛特征信息对应的权重值,通过眉毛特征信息、权重值以及伴随症状信息建立疾病认知数据库;
特征提取模块,用于获取用户病历数据,通过TextRank算法从用户病历数据中提取眉毛特征信息作为待比较眉毛特征信息;
比较模块,用于通过余弦相似度算法计算待比较眉毛特征信息与疾病认知库中眉毛特征信息之间的相似度,根据相似度确定眉毛特征信息以及对应的权重值;
认知模块,用于根据用户病历数据中待比较眉毛特征信息对应的权重值确定待比较眉毛特征信息对应的伴随症状信息,根据伴随症状信息生成疾病认知报告。
在以上技术方案的基础上,优选的,库构建模块包括数据采集模块,用于采集眉毛数据以及对应的疾病数据,所述眉毛数据包括:正常眉毛特征信息以及异常眉毛特征信息,所述眉毛特征信息包括:颜色特征信息、形态特征信息、部位特征信息以及数量特征信息,所述疾病数据包括:疾病名称以及伴随症状特征信息,一种疾病名称包括至少一种伴随症状特征信息。
在以上技术方案的基础上,优选的,库构建模块包括权重值划分模块,用于根据伴随症状特征信息获取对应的历史病历数据,从历史病历数据中提取历史眉毛特征信息,将历史眉毛特征信息与眉毛特征信息进行匹配,并记录历史病历数据中每个眉毛特征信息的出现次数,根据该出现数量生成每个眉毛特征信息的权重值,出现次数越大则权重值越大,将带有权重值的眉毛特征信息与对应的伴随症状特征信息关联,且一种伴随症状特征信息至少关联一个带有权重值的眉毛特征信息。
在以上技术方案的基础上,优选的,库构建模块包括表建立模块,用于根据眉毛特征信息、疾病名称、伴随症状特征信息以及眉毛特征信息的权重值生成眉毛疾病认知表,其中,眉毛特征信息与其对应的权重值以及伴随症状特征信息关联,伴随症状特征信息与疾病名称关联,并将该眉毛疾病认知表作为疾病认知数据库。
在以上技术方案的基础上,优选的,特征提取模块包括算法处理模块,用于获取用户病历数据,通过TextRank算法将用户病历数据中的文本分割成至少一组句子,对每组句子进行分词和词性标注处理,并过滤掉停用词,只保留指定词性的单词作为候选关键词,根据候选关键词构建候选关键词图,利用TextRank算法对候选关键词的重要性进行排序,排序序号数值小的候选关键词则为待比较眉毛特征信息。
在以上技术方案的基础上,优选的,特征提取模块包括TextRank算法单元,包括:
其中,d代表阻尼系数,表示从图中某一特定点指向其他任意点的概率,Vi,Vj,Vk代表给定的点,ln(Vi)代表指向该点的点集合,out(Vi)代表点Vi指向的点集合,WS(Vi)代表窗口中点Vi的重要性,WS(Vj)代表窗口中点Vj的重要性,wji代表Vi,Vj之间边的权重,wjk代表Vj,Vk之间边的权重,k表示窗口大小,即最多共现k个单词。
在以上技术方案的基础上,优选的,比较模块包括相似度匹配计算模块,用于通过余弦相似度算法计算待比较眉毛特征信息与疾病认知库中眉毛特征信息之间的相似度,设定相似度阈值,当相似度大于相似度阈值时,根据待比较眉毛特征信息将疾病认知库中对应的眉毛特征信息进行标记,并获取该眉毛特征信息对应的权重值;当相似度小于相似度阈值时,重新选择待比较眉毛特征信息。
在以上技术方案的基础上,优选的,认知模块包括报告生成模块,用于获取用户病历数据中待比较眉毛特征信息对应的权重值,并判断待比较眉毛特征信息对应的伴随症状信息,若该伴随症状信息至少关联两个待比较眉毛特征信息,则将关联的待比较眉毛特征信息对应的权重值进行累加,获取最终权重值;若该伴随症状信息只关联一个待比较眉毛特征信息,则将该待比较眉毛特征信息作为最终权重值,并将所有最终权重值进行比较,确定数值最大的最终权重值,根据该数值最大的最终权重值对应的伴随症状信息生成疾病认知报告。
更进一步优选的,所述基于人体异常眉毛的疾病认知设备包括:
库构建单元,用于采集眉毛数据以及对应的疾病数据,根据眉毛数据获取眉毛特征信息,根据疾病数据获取对应的伴随症状信息以及每个眉毛特征信息对应的权重值,通过眉毛特征信息、权重值以及伴随症状信息建立疾病认知数据库;
特征提取单元,用于获取用户病历数据,通过TextRank算法从用户病历数据中提取眉毛特征信息作为待比较眉毛特征信息;
比较单元,用于通过余弦相似度算法计算待比较眉毛特征信息与疾病认知库中眉毛特征信息之间的相似度,根据相似度确定眉毛特征信息以及对应的权重值;
认知单元,用于根据用户病历数据中待比较眉毛特征信息对应的权重值确定待比较眉毛特征信息对应的伴随症状信息,根据伴随症状信息生成疾病认知报告。
本发明的一种基于人体异常眉毛的疾病认知***相对于现有技术具有以下有益效果:
(1)通过根据伴随症状特征信息建立眉毛特征信息的不同权重值,然后根据权重值的累加大小数值,实现对疾病的精确认知,提高整个***的精确度,提升用户体验;
(2)通过TextRank算法能够精确从用户病历数据中提取对应的眉毛特征信息,从而提高最后疾病认知的精确度,提高用户的体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明基于人体异常眉毛的疾病认知***第一实施例的结构框图;
图2为本发明基于人体异常眉毛的疾病认知***的第二实施例结构框图;
图3为本发明基于人体异常眉毛的疾病认知***的第三实施例结构框图;
图4为本发明基于人体异常眉毛的疾病认知***的第四实施例结构框图;
图5为本发明基于人体异常眉毛的疾病认知***的第五实施例结构框图;
图6为本发明基于人体异常眉毛的疾病认知设备结构框图。
具体实施方式
下面将结合本发明实施方式,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
如图1所示,图1为本发明基于人体异常眉毛的疾病认知***第一实施例的结构框图。其中,所述基于人体异常眉毛的疾病认知***包括:库构建模块10、特征提取模块20、比较模块30和认知模块40。
库构建模块10,用于采集眉毛数据以及对应的疾病数据,根据眉毛数据获取眉毛特征信息,根据疾病数据获取对应的伴随症状信息以及每个眉毛特征信息对应的权重值,通过眉毛特征信息、权重值以及伴随症状信息建立疾病认知数据库;
特征提取模块20,用于获取用户病历数据,通过TextRank算法从用户病历数据中提取眉毛特征信息作为待比较眉毛特征信息;
比较模块30,用于通过余弦相似度算法计算待比较眉毛特征信息与疾病认知库中眉毛特征信息之间的相似度,根据相似度确定眉毛特征信息以及对应的权重值;
认知模块40,用于根据用户病历数据中待比较眉毛特征信息对应的权重值确定待比较眉毛特征信息对应的伴随症状信息,根据伴随症状信息生成疾病认知报告。
应当理解的是,本实施例还提出了另一种人体异常眉毛的疾病认知***,包括:构建知识库、用户症状特征信息提取、特征信息相似度计算、权重计算及疾病预测。
知识库构建模块:采集异常眉毛(颜色异常、形态异常、部位异常、数量异常)与疾病相关的数据,构建眉毛特征信息及对应的伴随症状特征信息向量集,建立异常眉毛特征信息对应的疾病知识库。
用户症状特征信息提取模块:运用jieba分词关键词抽取(TextRank算法)技术实现对重要特征信息词的提取。
特征信息相似度计算模块:运用余弦相似度算法,比较用户的特征信息关键词和知识库中向量集的特征信息的相似度(值越大表示相似度越大),并对知识库中相似度最大的特征信息做标记。
权重计算及疾病预测模块:知识库中特征信息标记后,取每个特征对应的权重值,权重累加计算,累加值越大,疾病概率越大,取累加结果最大的特征信息对应的疾病。
进一步地,如图2所示,基于上述各实施例提出本发明基于人体异常眉毛的疾病认知***的第二实施例结构框图,在本实施例中,库构建模块10还包括:
数据采集模块101,用于采集眉毛数据以及对应的疾病数据,所述眉毛数据包括:正常眉毛特征信息以及异常眉毛特征信息,所述眉毛特征信息包括:颜色特征信息、形态特征信息、部位特征信息以及数量特征信息,所述疾病数据包括:疾病名称以及伴随症状特征信息,一种疾病名称包括至少一种伴随症状特征信息。
权重值划分模块102,用于根据伴随症状特征信息获取对应的历史病历数据,从历史病历数据中提取历史眉毛特征信息,将历史眉毛特征信息与眉毛特征信息进行匹配,并记录历史病历数据中每个眉毛特征信息的出现次数,根据该出现数量生成每个眉毛特征信息的权重值,出现次数越大则权重值越大,将带有权重值的眉毛特征信息与对应的伴随症状特征信息关联,且一种伴随症状特征信息至少关联一个带有权重值的眉毛特征信息。
表建立模块103,用于根据眉毛特征信息、疾病名称、伴随症状特征信息以及眉毛特征信息的权重值生成眉毛疾病认知表,其中,眉毛特征信息与其对应的权重值以及伴随症状特征信息关联,伴随症状特征信息与疾病名称关联,并将该眉毛疾病认知表作为疾病认知数据库。
应当理解的是,***会采集眉毛数据以及对应的疾病数据,所述眉毛数据包括:正常眉毛特征信息以及异常眉毛特征信息,所述眉毛特征信息包括:颜色特征信息、形态特征信息、部位特征信息以及数量特征信息,所述疾病数据包括:疾病名称以及伴随症状特征信息,一种疾病名称包括至少一种伴随症状特征信息。
应当理解的是,通过眉毛的形态位置变化、色泽变化、脱落等,便能得知身体健康状况的信息。例如:眉毛梢直而干燥者,如果是女性可能有月经不正常,是男性则多患神经***疾病;一侧眉毛不能向上抬举,可能是出现了“小中风”;眉毛比眼睛长者较佳,说明此人的肾脏机能好,是长寿的象征;眉毛浓密粗长,说明肾气充沛,身强力壮;眉毛稀淡恶少,说明肾气虚弱,体弱多病;眉毛的颜色变得暗淡无光,这可能是内分泌失调,或营养摄入不足所带来的并发症状;眉毛脱落稀疏,尤其眉外段较明显,多见于黏液性水肿(甲状腺功能减退症)、脑垂体前叶功能减退、麻风病初期、三叉神经痛等病症;眉毛上翘,是膀胱炎的征兆,同时还反应了身体内部毒素过多,是身体发出的排毒信号;眉形中断,小心会有突发性病变、尤其是血液循环***。
应当理解的是,采集数据如:颜色异常:眉毛黄淡,山根低陷,眉毛附近多现筋露骨的人--多数都会患结核病;眉毛粗黑浓厚眉形长,有这样眉毛面相的人--易患神经性胃疾;眉毛变白--可能患有白化病、白癜风和病毒性虹膜睫状体炎;女性眉毛特别浓黑--可能患肾上腺皮质功能亢进症;形态异常:眉头上翘,其他部位平直、柔顺--易患遗尿、小便频数、泄泻等症;眉毛过短,眉位低陷--多数是贫血、有头晕、头昏的病征;男性眉浓密、眉毛向下盖眼、眼神不强者--多数因好色而引起肾和泌尿***的疾病;眉浓密,连及眉间--多见内分泌疾病,如肾上腺皮质功能亢进症,或女性男性化现象;部位异常:外眉三分之一过于稀疏或脱落--说明肾气衰减,多有肾上腺皮质功能减退症、脑垂体前叶功能减退症或甲状腺功能减退症等;眉尾散乱,眼色泛黄的人--多数易患肝胆的疾病;眉梢下垂而柔顺--为气血循环缓和,心性平顺;一侧眉毛不能向上抬举--可能是出现了“小中风”(西医称为面神经麻痹);数量异常:眉毛淡疏易落者--多见于气血衰弱,体弱多病者,此类患者容易手脚冰冷,肾气也较弱;眉头处眉毛粗而稀少--为足太阳经上部气血少,易患扭伤、拉伤和痔疮等病;眉毛完全脱落者--见于早老症、斑秃或全秃等,若眉脱部位皮肤肥厚者也可见于麻风病人;眉毛稀疏淡薄--多见于体质虚弱、精力不足、容易患病的象征。向量集如:颜色异常(浓黑、变红、变白、色淡、黄白色、淡黄、红黑相间等);数量异常(稀疏、脱落、浓密、细小、宽大、匀称、不匀称等);部位异常(眉头平直、眉梢宽大、眉尾散乱、眉尾稀疏、眉头浓密、外眉段稀疏、眉梢下垂等)。
应当理解的是,之后***会根据伴随症状特征信息获取对应的历史病历数据,从历史病历数据中提取历史眉毛特征信息,将历史眉毛特征信息与眉毛特征信息进行匹配,并记录历史病历数据中每个眉毛特征信息的出现次数,根据该出现数量生成每个眉毛特征信息的权重值,出现次数越大则权重值越大,将带有权重值的眉毛特征信息与对应的伴随症状特征信息关联,且一种伴随症状特征信息至少关联一个带有权重值的眉毛特征信息,通过这一步是根据哪一种眉毛特征信息对伴随症状特征信息影响最大,则对应的眉毛特征信息权重值越高,这样是用于后续精确对疾病进行认知。
应当理解的是,最后***会根据眉毛特征信息、疾病名称、伴随症状特征信息以及眉毛特征信息的权重值生成眉毛疾病认知表,其中,眉毛特征信息与其对应的权重值以及伴随症状特征信息关联,伴随症状特征信息与疾病名称关联,并将该眉毛疾病认知表作为疾病认知数据库。
进一步地,如图3所示,基于上述各实施例提出本发明基于人体异常眉毛的疾病认知***的第三实施例结构框图,在本实施例中,特征提取模块20还包括:
算法处理模块201,用于获取用户病历数据,通过TextRank算法将用户病历数据中的文本分割成至少一组句子,对每组句子进行分词和词性标注处理,并过滤掉停用词,只保留指定词性的单词作为候选关键词,根据候选关键词构建候选关键词图,利用TextRank算法对候选关键词的重要性进行排序,排序序号数值小的候选关键词则为待比较眉毛特征信息。
TextRank算法单元202,包括:
其中,d代表阻尼系数,表示从图中某一特定点指向其他任意点的概率,Vi,Vj,Vk代表给定的点,ln(Vi)代表指向该点的点集合,out(Vi)代表点Vi指向的点集合,WS(Vi)代表窗口中点Vi的重要性,WS(Vj)代表窗口中点Vj的重要性,wji代表Vi,Vj之间边的权重,wjk代表Vj,Vk之间边的权重,k表示窗口大小,即最多共现k个单词。
应当理解的是,TextRank算法是一种用于文本的基于图的排序算法。其基本思想是通过把文本分割成若干组成单元(单词、句子)并建立图模型利用投票机制对文本中的重要成分进行排序,仅利用文本的信息即可实现关键词提取。
应当理解的是,对于从用户病历数据中提取待比较眉毛特征信息可以通过结巴分词关键词抽取方法实现,结巴分词关键字抽取***中基于无监督学习TextRank关键词抽取算法实现,例如:用户输入:“眉尾散乱,眉毛稀疏脱落,比较干燥”,结巴分词结果为“眉尾”、“散乱”、“眉毛”、“稀疏”、“脱落”、“比较”、“干燥”,TextRank关键字抽取结果为:“眉尾”、“散乱”、“稀疏”、“脱落”、“干燥”。
应当理解的是,具体步骤如下:
结巴分词算法使用了基于前缀词典实现高效的词图扫描,生成句子中汉字所有可能生成词情况所构成的有向无环图(DAG),再采用了动态规划查找最大概率路径,找出基于词频的最大切分组合。对于未登录词,采用了基于汉字成词能力的HMM模型,使用了Viterbi算法,
构造前缀字典:首先定义一个空的python字典,然后遍历dict.txt的每一行,取词条作为字典的键,词频作为对应的键值,然后遍历该词条的前缀,如果前缀对应的键不在字典里,就把该前缀设为字典新的键,对应的键值设为0,如果前缀在字典里,则什么都不做。这样等遍历完dict.txt后,前缀词典就构造好了。在构造前缀词典时,会对统计词典里所有词条的词频做一下累加,累加值等计算最大概率路径时会用到。
生成有向无环图(DAG):先定义一个空的python字典,然后遍历子句,当前子句元素的索引会作为字典的一个键,对应的键值为一个python列表(初始为空),然后会以当前索引作为子串的起始索引,不断向后遍历生成不同的子串,如果子串在前缀词典里且键值不为0的话,则把子串的终止索引添加到列表中。这样等遍历完子句的所有字后,对应的DAG就生成好了。
计算最大概率路径:从子句的最后一个字开始,倒序遍历子句的每个字,取当前字对应索引在DAG字典中的键值(一个python列表),然后遍历该列表,当前字会和列表中每个字两两组合成一个词条,然后基于词频计算出当前字到句尾的概率,以python元组的方式保存最大概率,元祖第一个元素是最大概率的对数,第二个元素为最大概率对应词条的终止索引。
对未登录词采用HMM模型进行分词:当出现没有在前缀词典里收录的词时,会采用HMM模型进行分词。HMM模型有5个基本组成:观测序列、状态序列、状态初始概率、状态转移概率和状态发射概率。分词属于HMM的预测问题,即已知观测序列、状态初始概率、状态转移概率和状态发射概率的条件下,求状态序列。结巴分词已经内置了训练好的状态初始概率、状态转移概率和状态发射概率。
应当理解的是,本实施例中是通过结巴分词关键词抽取方法中的TextRank算法将用户病历数据中的文本分割成至少一组句子,对每组句子进行分词和词性标注处理,并过滤掉停用词,只保留指定词性的单词作为候选关键词,根据候选关键词构建候选关键词图,利用TextRank算法对候选关键词的重要性进行排序,排序序号数值小的候选关键词则为待比较眉毛特征信息。
应当理解的是,具体步骤如下:
TextRank一般模型可以表示为一个有向有权图G=(V,E),由点集合V和边集合E组成,E是V×V的子集。图中任两点Vi,Vj之间边的权重为wji,对于一个给定的点Vi,ln(Vi)为指向该点的点集合,out(Vi)为点Vi指向的点集合。点Vi的得分定义如下:
其中,d为阻尼系数,取值范围为0到1,代表从图中某一特定点指向其他任意点的概率,一般取值为0.85。使用TextRank算法计算图中各点的得分时,需要给图中的点指定任意的初值,并递归计算直到收敛,即图中任意一点的误差率小于给定的极限值时就可以达到收敛,一般该极限值取0.0001。
关键词抽取的任务就是从一段给定的文本中自动抽取出若干有意义的词语或词组。TextRank算法是利用局部词汇之间关系(共现窗口)对后续关键词进行排序,直接从文本本身抽取。其主要步骤如下:
(1)把给定的文本T按照完整句子进行分割,即T=[S1,S2,S3,...,Sm];
(2)对于每个句子Si€T,进行分词和词性标注处理,并过滤掉停用词,只保留指定词性的单词,如名词、动词、形容词,即Si=[ti,1,ti,2,ti,3,......,ti,n],其中ti,j€Si是保留后的候选关键词;
(3)构建候选关键词图G=(V,E),其中V为节点集,由(2)生成的候选关键词组成,然后采用共现关系(co-occurrence)构造任两点之间的边,两个节点之间存在边仅当它们对应的词汇在长度为k的窗口中共现,k表示窗口大小,即最多共现k个单词;
(4)根据上面公式,迭代传播各节点的权重,直至收敛;
(5)对节点权重进行倒序排序,从而得到最重要的T个单词,作为候选关键词;
(6)由(5)得到最重要的T个单词,在原始文本中进行标记,若形成相邻词组,则组合成多词关键词。
进一步地,如图4所示,基于上述各实施例提出本发明基于人体异常眉毛的疾病认知***的第四实施例结构框图,在本实施例中,比较模块30包括:
相似度匹配计算模块301,用于通过余弦相似度算法计算待比较眉毛特征信息与疾病认知库中眉毛特征信息之间的相似度,设定相似度阈值,当相似度大于相似度阈值时,根据待比较眉毛特征信息将疾病认知库中对应的眉毛特征信息进行标记,并获取该眉毛特征信息对应的权重值;当相似度小于相似度阈值时,重新选择待比较眉毛特征信息。
应当理解的是,此时***会通过余弦相似度算法计算待比较眉毛特征信息与疾病认知库中眉毛特征信息之间的相似度,设定相似度阈值,当相似度大于相似度阈值时,根据待比较眉毛特征信息将疾病认知库中对应的眉毛特征信息进行标记,并获取该眉毛特征信息对应的权重值;当相似度小于相似度阈值时,重新选择待比较眉毛特征信息。
应当理解的是,利用余弦相似度算法,比较用户的特征信息关键词和知识库中特征信息的相似度(值越大表示相似度越大,余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似)本实施例中通过设定相似度阈值来代替0和1的作用,当然相似度阈值由人为进行设定,也可以是0和1。
应当理解的是,利用该公式比较用户的特征信息关键词和知识库中的每个特征信息的相似度,匹配出相似度最大的特征信息并标记。例如:特征信息稀疏与变少、稀少、脱落的相似度由高到低依次为:稀少、变少、脱落,相似度最高的为稀少。
进一步地,如图5所示,基于上述各实施例提出本发明基于人体异常眉毛的疾病认知***的第五实施例结构框图,在本实施例中,认知模块40包括:
报告生成模块401,用于获取用户病历数据中待比较眉毛特征信息对应的权重值,并判断待比较眉毛特征信息对应的伴随症状信息,若该伴随症状信息至少关联两个待比较眉毛特征信息,则将关联的待比较眉毛特征信息对应的权重值进行累加,获取最终权重值;若该伴随症状信息只关联一个待比较眉毛特征信息,则将该待比较眉毛特征信息作为最终权重值,并将所有最终权重值进行比较,确定数值最大的最终权重值,根据该数值最大的最终权重值对应的伴随症状信息生成疾病认知报告。
应当理解的是,最终***会根据每个特征对应的权重值,进行权重累加计算,累加值越大,疾病概率越大,取累加结果最大的特征信息对应的疾病即为预测疾病。比如:标记的特征信息为:稀疏、脱落,分别取四级分类标签中为稀疏、脱落的特征词及对应的权重值,每个疾病中对应的标签权重值不同。如果稀疏、脱落在同一个疾病中出现,权重值累加,得到该疾病的最终权重值;如果稀疏、脱落特征词未在同一疾病中,单项特征词对应的权重为该疾病的最终权重值。
需要说明的是,以上仅为举例说明,并不对本申请的技术方案构成任何限定。
通过上述描述不难发现,本实施例提出了一种基于人体异常眉毛的疾病认知***,包括:库构建模块,用于采集眉毛数据以及对应的疾病数据,根据眉毛数据获取眉毛特征信息,根据疾病数据获取对应的伴随症状信息以及每个眉毛特征信息对应的权重值,通过眉毛特征信息、权重值以及伴随症状信息建立疾病认知数据库;特征提取模块,用于获取用户病历数据,通过TextRank算法从用户病历数据中提取眉毛特征信息作为待比较眉毛特征信息;比较模块,用于通过余弦相似度算法计算待比较眉毛特征信息与疾病认知库中眉毛特征信息之间的相似度,根据相似度确定眉毛特征信息以及对应的权重值;认知模块,用于根据用户病历数据中待比较眉毛特征信息对应的权重值确定待比较眉毛特征信息对应的伴随症状信息,根据伴随症状信息生成疾病认知报告。本实施例通过TextRank算法以及权重值累加来对用户病历进行认知,能够更加精确认知对应疾病,提高整个***的精确度。
此外,本发明实施例还提出一种基于人体异常眉毛的疾病认知设备。如图6所示,该基于人体异常眉毛的疾病认知设备包括:库构建单元10、特征提取单元20、比较单元30以及认知单元40。
库构建单元10,用于采集眉毛数据以及对应的疾病数据,根据眉毛数据获取眉毛特征信息,根据疾病数据获取对应的伴随症状信息以及每个眉毛特征信息对应的权重值,通过眉毛特征信息、权重值以及伴随症状信息建立疾病认知数据库;
特征提取单元20,用于获取用户病历数据,通过TextRank算法从用户病历数据中提取眉毛特征信息作为待比较眉毛特征信息;
比较单元30,用于通过余弦相似度算法计算待比较眉毛特征信息与疾病认知库中眉毛特征信息之间的相似度,根据相似度确定眉毛特征信息以及对应的权重值;
认知单元40,用于根据用户病历数据中待比较眉毛特征信息对应的权重值确定待比较眉毛特征信息对应的伴随症状信息,根据伴随症状信息生成疾病认知报告。
此外,需要说明的是,以上所描述的装置实施例仅仅是示意性的,并不对本发明的保护范围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的,此处不做限制。
另外,未在本实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的基于人体异常眉毛的疾病认知***,此处不再赘述。
以上所述仅为本发明的较佳实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (2)

1.一种基于人体异常眉毛的疾病认知***,其特征在于,所述基于人体异常眉毛的疾病认知***包括:
库构建模块,用于采集眉毛数据以及对应的疾病数据,根据眉毛数据获取眉毛特征信息,根据疾病数据获取对应的伴随症状信息以及每个眉毛特征信息对应的权重值,通过眉毛特征信息、权重值以及伴随症状信息建立疾病认知数据库;库构建模块包括数据采集模块,用于采集眉毛数据以及对应的疾病数据,所述眉毛数据包括:正常眉毛特征信息以及异常眉毛特征信息,所述眉毛特征信息包括:颜色特征信息、形态特征信息、部位特征信息以及数量特征信息,所述疾病数据包括:疾病名称以及伴随症状特征信息,一种疾病名称包括至少一种伴随症状特征信息;库构建模块包括权重值划分模块,用于根据伴随症状特征信息获取对应的历史病历数据,从历史病历数据中提取历史眉毛特征信息,将历史眉毛特征信息与眉毛特征信息进行匹配,并记录历史病历数据中每个眉毛特征信息的出现次数,根据该出现数量生成每个眉毛特征信息的权重值,出现次数越大则权重值越大,将带有权重值的眉毛特征信息与对应的伴随症状特征信息关联,且一种伴随症状特征信息至少关联一个带有权重值的眉毛特征信息;库构建模块包括表建立模块,用于根据眉毛特征信息、疾病名称、伴随症状特征信息以及眉毛特征信息的权重值生成眉毛疾病认知表,其中,眉毛特征信息与其对应的权重值以及伴随症状特征信息关联,伴随症状特征信息与疾病名称关联,并将该眉毛疾病认知表作为疾病认知数据库;
特征提取模块,用于获取用户病历数据,通过TextRank算法从用户病历数据中提取眉毛特征信息作为待比较眉毛特征信息;特征提取模块包括算法处理模块,用于获取用户病历数据,通过TextRank算法将用户病历数据中的文本分割成至少一组句子,对每组句子进行分词和词性标注处理,并过滤掉停用词,只保留指定词性的单词作为候选关键词,根据候选关键词构建候选关键词图,利用TextRank算法对候选关键词的重要性进行排序,排序序号数值小的候选关键词则为待比较眉毛特征信息;特征提取模块包括TextRank算法单元,包括:
其中,d代表阻尼系数,表示从图中某一特定点指向其他任意点的概率,Vi,Vj,Vk代表给定的点,ln(Vi)代表指向该点的点集合,out(Vi)代表点Vi指向的点集合,WS(Vi)代表窗口中点Vi的重要性,WS(Vj)代表窗口中点Vj的重要性,wji代表Vi,Vj之间边的权重,wjk代表Vj,Vk之间边的权重,k表示窗口大小,即最多共现k个单词;
比较模块,用于通过余弦相似度算法计算待比较眉毛特征信息与疾病认知库中眉毛特征信息之间的相似度,根据相似度确定眉毛特征信息以及对应的权重值;比较模块包括相似度匹配计算模块,用于通过余弦相似度算法计算待比较眉毛特征信息与疾病认知库中眉毛特征信息之间的相似度,设定相似度阈值,当相似度大于相似度阈值时,根据待比较眉毛特征信息将疾病认知库中对应的眉毛特征信息进行标记,并获取该眉毛特征信息对应的权重值;当相似度小于相似度阈值时,重新选择待比较眉毛特征信息;
认知模块,用于根据用户病历数据中待比较眉毛特征信息对应的权重值确定待比较眉毛特征信息对应的伴随症状信息,根据伴随症状信息生成疾病认知报告。
2.如权利要求1所述的基于人体异常眉毛的疾病认知***,其特征在于:认知模块包括报告生成模块,用于获取用户病历数据中待比较眉毛特征信息对应的权重值,并判断待比较眉毛特征信息对应的伴随症状信息,若该伴随症状信息至少关联两个待比较眉毛特征信息,则将关联的待比较眉毛特征信息对应的权重值进行累加,获取最终权重值;若该伴随症状信息只关联一个待比较眉毛特征信息,则将该待比较眉毛特征信息作为最终权重值,并将所有最终权重值进行比较,确定数值最大的最终权重值,根据该数值最大的最终权重值对应的伴随症状信息生成疾病认知报告。
CN202010983562.8A 2020-09-17 2020-09-17 一种基于人体异常眉毛的疾病认知*** Active CN112133391B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010983562.8A CN112133391B (zh) 2020-09-17 2020-09-17 一种基于人体异常眉毛的疾病认知***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010983562.8A CN112133391B (zh) 2020-09-17 2020-09-17 一种基于人体异常眉毛的疾病认知***

Publications (2)

Publication Number Publication Date
CN112133391A CN112133391A (zh) 2020-12-25
CN112133391B true CN112133391B (zh) 2024-01-26

Family

ID=73841940

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010983562.8A Active CN112133391B (zh) 2020-09-17 2020-09-17 一种基于人体异常眉毛的疾病认知***

Country Status (1)

Country Link
CN (1) CN112133391B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112802597B (zh) * 2021-01-18 2023-11-21 吾征智能技术(北京)有限公司 一种新生儿黄疸的智能评估***、设备、存储介质

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1801180A (zh) * 2005-02-24 2006-07-12 北京工业大学 基于眉毛识别的身份鉴别方法
CN1849093A (zh) * 2003-09-11 2006-10-18 株式会社日立医药 生物体光测量装置
JP2014029644A (ja) * 2012-07-31 2014-02-13 Panasonic Corp 類似症例検索装置および類似症例検索方法
CN103622961A (zh) * 2013-09-06 2014-03-12 武汉光谷百桥国际生物科技有限公司 一种非肽类缓激肽b2受体激动剂在促进毛发生长方面的应用
CN104102816A (zh) * 2014-06-20 2014-10-15 周晋 基于症状匹配和机器学习的自动诊断***和方法
CN110189831A (zh) * 2019-06-06 2019-08-30 厦门大学 一种基于动态图序列的病历知识图谱构建方法及***
CN110428908A (zh) * 2019-07-31 2019-11-08 广西壮族自治区人民医院 一种基于人工智能的眼睑运动功能评估***
CN110931090A (zh) * 2019-11-26 2020-03-27 太平金融科技服务(上海)有限公司 疾病数据处理方法、装置、计算机设备和存储介质
CN111000569A (zh) * 2019-11-29 2020-04-14 中润普达(十堰)大数据中心有限公司 一种异常血糖智能认知的监护***
CN111105852A (zh) * 2019-12-02 2020-05-05 上海联影智能医疗科技有限公司 一种电子病历推荐方法、装置、终端及存储介质
CN111462869A (zh) * 2020-04-14 2020-07-28 青岛大学附属医院 一种多功能的新生儿临床用头部影像诊疗***及方法
CN111460864A (zh) * 2019-01-22 2020-07-28 天津大学青岛海洋技术研究院 一种基于图像识别的动物疾病检测方法
CN111563891A (zh) * 2020-05-09 2020-08-21 吾征智能技术(北京)有限公司 基于颜色认知的疾病预测***
CN111599462A (zh) * 2020-05-09 2020-08-28 吾征智能技术(北京)有限公司 基于认知学习的身体异常气味智能筛查***
CN111599463A (zh) * 2020-05-09 2020-08-28 吾征智能技术(北京)有限公司 基于声音认知模型的智能辅助诊断***
CN111653359A (zh) * 2020-05-30 2020-09-11 吾征智能技术(北京)有限公司 一种出血性疾病的智能预测模型构建方法和预测***

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10409952B2 (en) * 2015-10-12 2019-09-10 National Taiwan University Knowledge-based personal intelligent health consulting system

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1849093A (zh) * 2003-09-11 2006-10-18 株式会社日立医药 生物体光测量装置
CN1801180A (zh) * 2005-02-24 2006-07-12 北京工业大学 基于眉毛识别的身份鉴别方法
JP2014029644A (ja) * 2012-07-31 2014-02-13 Panasonic Corp 類似症例検索装置および類似症例検索方法
CN103622961A (zh) * 2013-09-06 2014-03-12 武汉光谷百桥国际生物科技有限公司 一种非肽类缓激肽b2受体激动剂在促进毛发生长方面的应用
CN104102816A (zh) * 2014-06-20 2014-10-15 周晋 基于症状匹配和机器学习的自动诊断***和方法
CN111460864A (zh) * 2019-01-22 2020-07-28 天津大学青岛海洋技术研究院 一种基于图像识别的动物疾病检测方法
CN110189831A (zh) * 2019-06-06 2019-08-30 厦门大学 一种基于动态图序列的病历知识图谱构建方法及***
CN110428908A (zh) * 2019-07-31 2019-11-08 广西壮族自治区人民医院 一种基于人工智能的眼睑运动功能评估***
CN110931090A (zh) * 2019-11-26 2020-03-27 太平金融科技服务(上海)有限公司 疾病数据处理方法、装置、计算机设备和存储介质
CN111000569A (zh) * 2019-11-29 2020-04-14 中润普达(十堰)大数据中心有限公司 一种异常血糖智能认知的监护***
CN111105852A (zh) * 2019-12-02 2020-05-05 上海联影智能医疗科技有限公司 一种电子病历推荐方法、装置、终端及存储介质
CN111462869A (zh) * 2020-04-14 2020-07-28 青岛大学附属医院 一种多功能的新生儿临床用头部影像诊疗***及方法
CN111563891A (zh) * 2020-05-09 2020-08-21 吾征智能技术(北京)有限公司 基于颜色认知的疾病预测***
CN111599462A (zh) * 2020-05-09 2020-08-28 吾征智能技术(北京)有限公司 基于认知学习的身体异常气味智能筛查***
CN111599463A (zh) * 2020-05-09 2020-08-28 吾征智能技术(北京)有限公司 基于声音认知模型的智能辅助诊断***
CN111653359A (zh) * 2020-05-30 2020-09-11 吾征智能技术(北京)有限公司 一种出血性疾病的智能预测模型构建方法和预测***

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Eyebrow loss-clinical review;Velez nicole等;American journal of clinical dermatology;第6卷(第8期);第337-346页 *
眉毛的外部特征提取及应用研究;刘燕;中国优秀硕士学位论文全文数据库 信息科技辑(第2期);第I138-1599页 *

Also Published As

Publication number Publication date
CN112133391A (zh) 2020-12-25

Similar Documents

Publication Publication Date Title
CN107403068B (zh) 融合临床思维的智能辅助问诊方法及***
US11989518B2 (en) Normalized processing method and apparatus of named entity, and electronic device
CN108399163A (zh) 结合词聚合与词组合语义特征的文本相似性度量方法
CN108345585A (zh) 一种基于深度学习的自动问答方法
CN111949759A (zh) 病历文本相似度的检索方法、***及计算机设备
CN111985246B (zh) 一种基于主要症状与伴随症状词的疾病认知***
CN111563891B (zh) 基于颜色认知的疾病预测***
CN111243699A (zh) 基于字词信息融合的中文电子病历实体抽取方法
Ming et al. Visuals to text: A comprehensive review on automatic image captioning
CN112052356A (zh) 多媒体分类方法、装置和计算机可读存储介质
CN117077786A (zh) 一种基于知识图谱的数据知识双驱动智能医疗对话***和方法
CN111859938B (zh) 基于位置向量降噪和丰富语义的电子病历实体关系抽取方法
CN112133391B (zh) 一种基于人体异常眉毛的疾病认知***
CN112037909A (zh) 诊断信息复核***
Chen et al. Automatic ICD code assignment utilizing textual descriptions and hierarchical structure of ICD code
Mansour et al. Text vectorization method based on concept mining using clustering techniques
Tan et al. Chinese medical named entity recognition based on Chinese character radical features and pre-trained language models
CN116092699A (zh) 一种基于预训练模型的癌症问答交互方法
CN113254609A (zh) 一种基于负样本多样性的问答模型集成方法
CN111222325A (zh) 一种双向栈式循环神经网络的医疗语义标注方法和***
CN113130025A (zh) 一种实体关系抽取方法、终端设备及计算机可读存储介质
CN111639189A (zh) 一种基于文本内容特征的文本图构建方法
CN114496231B (zh) 基于知识图谱的体质识别方法、装置、设备和存储介质
CN116341546A (zh) 一种基于预训练模型的医学自然语言处理方法
Mitchell Class-based ordering of prenominal modifiers

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant