WO2020013302A1 - 精神・神経系疾患の推定システム、推定プログラムおよび推定方法 - Google Patents

精神・神経系疾患の推定システム、推定プログラムおよび推定方法 Download PDF

Info

Publication number
WO2020013302A1
WO2020013302A1 PCT/JP2019/027607 JP2019027607W WO2020013302A1 WO 2020013302 A1 WO2020013302 A1 WO 2020013302A1 JP 2019027607 W JP2019027607 W JP 2019027607W WO 2020013302 A1 WO2020013302 A1 WO 2020013302A1
Authority
WO
WIPO (PCT)
Prior art keywords
disease
dementia
estimation
subject
unit
Prior art date
Application number
PCT/JP2019/027607
Other languages
English (en)
French (fr)
Inventor
康宏 大宮
頼夫 熊本
Original Assignee
株式会社生命科学インスティテュート
Pst株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社生命科学インスティテュート, Pst株式会社 filed Critical 株式会社生命科学インスティテュート
Priority to EP19835135.5A priority Critical patent/EP3821815A4/en
Priority to US17/257,975 priority patent/US20210233660A1/en
Priority to JP2019543953A priority patent/JPWO2020013302A1/ja
Publication of WO2020013302A1 publication Critical patent/WO2020013302A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/0002Remote monitoring of patients using telemetry, e.g. transmission of vital signals via a communication network
    • A61B5/0015Remote monitoring of patients using telemetry, e.g. transmission of vital signals via a communication network characterised by features of the telemetry system
    • A61B5/0022Monitoring a patient using a global network, e.g. telephone networks, internet
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/16Devices for psychotechnics; Testing reaction times ; Devices for evaluating the psychological state
    • A61B5/165Evaluating the state of mind, e.g. depression, anxiety
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/40Detecting, measuring or recording for evaluating the nervous system
    • A61B5/4076Diagnosing or monitoring particular conditions of the nervous system
    • A61B5/4082Diagnosing or monitoring movement diseases, e.g. Parkinson, Huntington or Tourette
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/40Detecting, measuring or recording for evaluating the nervous system
    • A61B5/4076Diagnosing or monitoring particular conditions of the nervous system
    • A61B5/4088Diagnosing of monitoring cognitive diseases, e.g. Alzheimer, prion diseases or dementia
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/48Other medical applications
    • A61B5/4803Speech analysis specially adapted for diagnostic purposes
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7271Specific aspects of physiological measurement analysis
    • A61B5/7275Determining trends in physiological measurement data; Predicting development of a medical condition based on physiological measurements, e.g. determining a risk factor
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/74Details of notification to user or communication with user or patient ; user input means
    • A61B5/742Details of notification to user or communication with user or patient ; user input means using visual displays
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/66Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for extracting parameters related to health condition
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/20ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/63Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state

Definitions

  • the present invention relates to a mental / nervous system disease estimation system, an estimation program, and an estimation method.
  • mental illness Diseases in which mental health is impaired (hereinafter, referred to as “mental illness”), compared with diseases in which physical health is impaired (hereinafter, referred to as “physical illness”), causes and mechanisms of onset Is often not understood.
  • physical illness diseases in which physical health is impaired
  • DSM-5 Diagnostic Standards and Statistical Manuals of Mental Disorders (Diagnosis and Statistical Manual for Mental Disorders: hereinafter referred to as “DSM-5”) published by the American Psychiatric Association disclose diagnostic criteria. There is.
  • II. Schizophrenia spectrum disorder and other psychotic disorder group “III. Bipolar disorder and related disorder group”, “IV. Depressive disorder group”, “V. Anxiety group anxiety disorder group” , “XVIII. Personality disorder group” and the like are generally recognized as mental disorders. These mental illnesses affect a wide range of young people to the elderly. In addition, these mental illnesses may impair daily life by reducing social motivation, such as a decrease in motivation and a decrease in motivation to communicate with others.
  • DSM-5 “XVII. Neurocognitive impairment group” is a so-called dementia-related disease, and the number of patients is increasing with the aging of the population.
  • Dementia such as Alzheimer's dementia and Lewy body dementia has no curative drug at present. Therefore, if the symptoms progress, it is a social burden, and the family is particularly burdened.
  • the Ministry of Health, Labor and Welfare of Japan has formulated a new Orange Plan (Comprehensive Strategy for Promotion of Dementia Measures) and is taking measures.
  • SPECT Single Photo Emission CT
  • optical topography for measurement in the diagnosis of depression and the like.
  • these measuring instruments are expensive, and medical institutions that can perform the measurement are limited.
  • Non-Patent Document 1 it has been reported that various mental health services can be used to recover depression without medical treatment if depression can be detected in an undiseased state or in mild cases. Therefore, there is a need for a simple and light examination method for estimating mental illness.
  • Alzheimer's type dementia Neurorocognitive ⁇ Disorder Due to Alzheimer's Disease
  • frontotemporal dementia Frontotemporal Neurocognitive Disorder
  • Lewy body type cognition Four types of illness (Neurocognitive Disorder with Lewy Bodies) and vascular dementia (Vascular Neurocognitive Disorder) are shown.
  • dementia due to brain damage and other diseases has been shown.
  • Parkinson's disease is included in the category of dementia with Lewy bodies.
  • Lewy body dementia depends on the site where Lewy bodies occur. Therefore, the symptoms may be similar and it is difficult to determine.
  • dementias cannot be completely cured at present, there are drugs that can delay the progress to some extent and are approved.
  • drugs that can delay the progress to some extent and are approved.
  • different types of dementia have different therapeutic agents, it is necessary to estimate these types.
  • the estimation requires a high technology. For example, it is generally difficult to estimate the type of dementia, as it is generally said that a patient can be definitely diagnosed with Alzheimer's type dementia only by observing the brain after death of the patient.
  • the type of dementia can be determined in a state where the degree of dementia is mild, that is, a state of mild dementia (MCI), the state can be maintained for a longer time.
  • MCI mild dementia
  • schizophrenia (Schizophrenia), major depression (Major Depressive Disorder), depression with atypical symptoms (Depressive Disorder with Atypical Features: hereinafter referred to as “atypical depression”), bipolar disorder (Bipolar) Disorder), generalized anxiety disorder (Disorder), personality disorder group (Personality Disorders), dysthymia (Persistent Depressive Disorder), and dysthymia (Cyclothymic Disorder)
  • Bipolar bipolar disorder
  • Depression generalized anxiety disorder
  • personality disorder group Pierersonality Disorders
  • dysthymia Persistent Depressive Disorder
  • dysthymia Cert Depressive Disorder
  • the patient may not receive medical care due to prejudice of mental illness and resistance to consulting a psychiatrist or psychosomatic medicine.
  • the patient may not receive medical care due to prejudice of mental illness and resistance to consulting a psychiatrist or psychosomatic medicine.
  • the patient may not receive medical care due to prejudice of mental illness and resistance to consulting a psychiatrist or psychosomatic medicine.
  • there are few specialized counselors and it is customary to consult with a specialized counselor.
  • the disorder may become chronic and the symptoms may become severe.
  • Alzheimer's dementia and frontotemporal dementia Alzheimer's dementia and Lewy body dementia
  • Lewy body dementia and Parkinson's disease and bipolar disorder and major depression. It is.
  • Patients may also have dementia and senile depression at the same time.
  • patients often show depressive symptoms as an initial symptom of dementia.
  • the patient if the patient has depressive pseudo-dementia, the patient is actually depressed, but symptoms appear to impair cognitive function. Therefore, it is important to determine whether a patient is a type of dementia or a type of depression, or if any of the symptoms are significant due to a combination of dementia and depression. . This is because, for example, when a patient is treated for depression, cognitive function is restored when the patient is treated for depressive pseudo-dementia. Because it gets worse.
  • the present invention has been made in view of such a situation, and a mental and nervous system disease estimation system capable of determining and estimating dementia by analyzing a voice uttered by a subject. It is intended to provide a program and an estimation method.
  • Another object of the present invention is to analyze and analyze a voice uttered by a subject to determine and estimate a mental disorder associated with mood modulation, such as bipolar disorder and major depression.
  • An object of the present invention is to provide a disease estimation system, an estimation program, and an estimation method.
  • Another object of the present invention is to make it possible to discriminate between mental illnesses having very similar symptoms, thereby reducing misdiagnosis, speeding up the discrimination, making it possible to carry out appropriate treatment. It is an object of the present invention to provide a mental / nervous system disease estimation system, an estimation program and an estimation method.
  • Another object of the present invention is to provide a simple operation, capable of measurement without a special environment, and having a small burden on a patient, and estimating a psychiatric / nervous system disease by a short time measurement. It is an object of the present invention to provide a psychiatric / nervous system disease estimating system, an estimating program and an estimating method.
  • Another object of the present invention is to provide a psychiatric / nervous system disease estimating system and an estimating program which can measure even if a patient and a doctor are physically separated and can estimate a psychiatric / nervous system disease. And an estimation method.
  • the present invention is a system for estimating a psychiatric / nervous system disease, comprising: an acquisition unit that acquires voice data of a subject; and a first transmission unit that transmits the voice data to a server.
  • Receiving audio data from a result display unit comprising: one audio input unit, a first reception unit for receiving data of an estimated result in the server, and an output unit for displaying data, and a first transmission unit
  • a second receiving unit a calculating unit that calculates a predictive value of the disease based on a combination of at least one acoustic feature amount extracted from the voice data of the subject, and an estimating unit that estimates the disease of the subject.
  • a server that includes a second transmission unit that transmits the result data to the display unit; the server includes an arithmetic processing device that executes the estimation program; and a recording device that records the estimation program.
  • Program the estimating unit as input an estimate of the disease, and estimates the subject of a disease selected from the group consisting of a plurality of diseases.
  • the voice uttered by the subject is estimated, the disease that the subject suffers is determined and estimated, the illness is prevented from becoming severe, and the patient is appropriately treated based on the accurate determination of the disease. It is possible to provide an estimation system, an estimation program, and an estimation method that enable the estimation.
  • FIG. 9 is an explanatory diagram of a second acoustic parameter. It is a figure of the regression analysis of this invention. It is a figure of the regression analysis of this invention. It is a figure showing an example of distribution of zero point crossing rate ZCR and Hurst exponent H of the present invention. It is a figure which shows the Parkinson's disease parameter
  • FIG. 1 shows a configuration diagram of an estimation system 100 of the present invention.
  • the estimation system 100 in FIG. 1 includes an input unit 110 for acquiring a voice of a subject, a display unit 130 for displaying an estimation result or the like to the subject, and a server 120.
  • the server 120 includes an arithmetic processing unit 120A (CPU), a first recording device such as a hard disk recording an estimation program for executing the processing by the arithmetic processing unit 120A, and transmission to the subject's examination data and the subject. And a second recording device, such as a hard disk, that records the message collection.
  • the server 120 is connected to the input unit 110 and the display unit 130 via a wired or wireless connection.
  • Arithmetic processing unit 120A may be realized by hardware.
  • the input unit 110 includes an audio acquisition unit 111 such as a microphone, and a first transmission unit 112 that transmits the acquired audio data to the server 120.
  • the acquisition unit 111 generates voice data of a digital signal from a voice of a subject from an analog signal.
  • the audio data is transmitted from the first transmission unit 112 to the server 120.
  • the input unit 110 acquires an audio signal spoken by a subject via an audio acquisition unit 111 such as a microphone, and samples the audio signal at a predetermined sampling frequency (for example, 11025 Hertz or the like) to thereby obtain audio data of a digital signal.
  • a predetermined sampling frequency for example, 11025 Hertz or the like
  • the input unit 110 may include a recording unit that records audio data separately from the recording device on the server 120 side.
  • the input unit 110 may be a portable recorder.
  • the recording unit may be a recording medium such as a CD, a DVD, a USB memory, an SD card, and a mini disk.
  • the display unit 130 includes a first receiving unit 131 that receives data such as an estimation result, and an output unit 132 that displays the data.
  • the output unit 132 is a display that displays data such as an estimation result.
  • the display may be an organic EL (Organic Electro-Luminescence), a liquid crystal, or the like.
  • the input unit 110 may have a function such as a touch panel in order to input data of a result of a health check described later and data of an answer regarding a stress check in advance. In this case, it may be realized by the same hardware having the functions of the input unit 110 and the display unit 130.
  • the arithmetic processing device 120A includes a second receiving unit 121 that receives the voice data transmitted from the first transmitting unit 112, and a calculating unit 122 that calculates a predicted value of the disease based on the acoustic feature amount extracted from the voice data of the subject. And an estimation unit 123 for estimating a subject's disease using an estimation model learned by machine learning using a predicted value of the disease as an input, and a second transmission unit 124 for transmitting data and the like regarding the estimation result to the display unit 130. Is provided. Although the calculation unit 122 and the estimation unit 123 are described separately for explaining the functions, the functions of the calculation unit and the estimation unit may be performed simultaneously. In this specification, the term "mental value" is used synonymously with the predicted value of a disease.
  • FIG. 2 shows another configuration diagram of the estimation system 100 of the present invention.
  • the estimation system 100 of FIG. 2 connects the server 120 and the input unit 110 or the display unit 130 of the estimation system 100 of FIG. 1 via a network NW.
  • the input unit 110 and the display unit 130 are the communication terminal 200.
  • the communication terminal 200 is, for example, a smartphone, a tablet-type terminal, or a notebook computer or a desktop personal computer including a microphone.
  • the network NW connects the communication terminal 200 and the server 120 via a mobile phone communication network or a wireless LAN based on a communication standard such as Wi-Fi (Wireless @ Fidelity) (registered trademark).
  • the estimation system 100 may connect the plurality of communication terminals 200 and the server 120 via the network NW.
  • the estimation system 100 may be realized by the communication terminal 200.
  • the estimation program stored in the server 120 via the network NW is downloaded and recorded on the recording device of the communication terminal 200.
  • the communication terminal 200 may function as the calculation unit 122 and the estimation unit 123 when the CPU included in the communication terminal 200 executes an application recorded on the recording device of the communication terminal 200.
  • the estimation program may be recorded on an optical disk such as a DVD or a portable recording medium such as a USB memory and distributed. (1st Embodiment)
  • FIG. 3 shows an example of the estimation process of the estimation system 100 shown in FIG.
  • the processing illustrated in FIG. 3 is realized by the arithmetic processing device 120A of the estimation system 100 executing the estimation program recorded in the first recording device 120B of the estimation system 100.
  • Each function of the second receiving unit 121, the calculating unit 122, the estimating unit 123, and the second transmitting unit 124 of the arithmetic processing device 120A will be described with reference to FIG. (Calculation unit 122)
  • step S101 the calculation unit 122 determines whether the acquisition unit 111 has acquired audio data. If audio data has already been acquired, the process proceeds to step S104. If the voice data has not been acquired, in step S102, the calculation unit 122 instructs the output unit 132 of the display unit 130 to display a predetermined fixed phrase.
  • This estimation program does not estimate mental or nervous system diseases based on the meaning or content of the subject's speech. Therefore, any voice data may be used as long as the utterance time is 15 seconds to 300 seconds.
  • the language used is not particularly limited, it is desirable that the language used matches the language used by the population when creating the estimation program. Therefore, the fixed phrase displayed on the output unit 132 may be any fixed phrase that is in the same language as the population and has a speech time of 15 seconds to 300 seconds.
  • a fixed sentence in which the utterance time is 20 seconds to 180 seconds is desirable.
  • the voice acquisition environment is not particularly limited as long as it is an environment in which only the voice spoken by the subject can be acquired, but is preferably acquired in an environment of 40 bB or less. Preferably, it is obtained in an environment of 30 dB or less.
  • step S103 voice data is obtained from the voice spoken by the subject, and the process proceeds to step S104.
  • step S104 the calculation unit 122 instructs the audio data to be transmitted from the input unit 110 to the second reception unit 121 of the server 120 via the first transmission unit 112.
  • step S105 the calculation unit 122 determines whether or not the predicted value of the subject's disease has been calculated.
  • the disease predictive value is a feature value F (a) composed of a combination of acoustic feature values generated by extracting one or more acoustic parameters, and is a predictive value of a specific disease used for input of an estimation algorithm of machine learning. It is.
  • the acoustic parameter is obtained by parameterizing a characteristic when a sound is transmitted. If the predicted value of the disease has already been calculated, the process proceeds to step S107. If the predicted value of the disease has not been calculated, in step S106, the calculation unit 122 calculates the predicted value of the disease based on the voice data of the subject and the learned estimation program.
  • step S107 the calculation unit 122 acquires the medical examination data of the subject acquired in advance from the second recording device 120C.
  • Step S107 may be omitted, and the disease may be estimated from the predicted value of the disease without acquiring the medical examination data.
  • step S108 the estimation unit 123 estimates the disease based on the predicted value of the disease calculated by the calculation unit 122 and / or the medical examination data.
  • the determination is made by classifying the case where the threshold value is exceeded and the case where the threshold value is not exceeded.
  • step S109 the estimation unit 123 determines whether the advice data corresponding to the disease has been selected.
  • the advice data corresponding to a disease is advice for preventing a disease or avoiding aggravation when a subject receives the advice data. If the advice data has been selected, the process proceeds to step S111.
  • step S110 the advice data corresponding to the symptom of the subject is selected from the second recording device.
  • step S111 the estimation unit 123 instructs to transmit the disease estimation result and the selected advice data to the first reception unit 131 of the display unit 130 via the second transmission unit 124.
  • step S112 the estimation unit 123 instructs the output unit 132 of the display unit 130 to output the estimation result and the advice data. Finally, the estimation system 100 ends the estimation processing. (2nd Embodiment)
  • the estimation program of the present invention can analyze even a voice from a remote place, it can be used in online medical treatment and online counseling.
  • a doctor observes a patient's facial expression, movement, and the state of conversation through interviews and interviews.
  • patients may be hesitant to go to a psychiatric hospital or clinic because they may be prejudiced against mental and nervous system disorders.
  • Doctors, counselors, and clinical psychologists can use this estimation program to analyze patients (or clients) online. This makes it possible to very easily estimate whether or not a person has a mental or nervous system disease and the type of the disease.
  • various psychological tests and cognitive function tests such as MMSE, BDI, and PHQ-9 can be performed together.
  • a monitor screen for interviews and a microphone for voice recording are required.
  • the estimation program of the present invention can be used as a screening device by increasing the sensitivity for estimating a specific disease (in this case, the specificity generally decreases).
  • test item such as a medical examination conducted by a company or a local government, or a medical checkup conducted at a medical institution
  • a test item such as a medical examination conducted by a company or a local government, or a medical checkup conducted at a medical institution
  • the estimation program of the present invention does not require any special device, and can be easily used by anyone.
  • the usage scene is limited to mental and nervous system diseases, so the usage frequency is not always high. Therefore, a set of the estimating apparatus of the present invention is provided in a specialty hospital equipped with an expensive test apparatus, and a family doctor or the like can request the specialty hospital to perform a test when the target patient comes to the hospital.
  • Devices used for mental and nervous system diseases include optical topography, myocardial scintigraphy, cerebral blood flow scintigraphy, CT, MRI, brain waves, and the like. These are used for disease estimation and exclusion diagnosis, but since the estimation device of the present invention is extremely invasive, it can be used in conjunction with these tests or prior to these tests. (Fifth embodiment)
  • the estimation program of the present invention can be easily used at home, it can be used as a monitoring device after diagnosis. For example, in the case of a disease of the mood disorder group, drugs and psychotherapy are treated according to the patient's disease, and the effectiveness of these therapies can be measured. Further, by using the apparatus continuously, it is possible to observe daily whether the symptoms are stable and there is no sign of recurrence. (Sixth embodiment)
  • the estimation program of the present invention analyzes voice generated by utterance, it can be applied as a monitoring device for elderly people.
  • the method of acquiring voice there is no particular limitation on the method of acquiring voice, but (1) a method of sending voice recorded via a telephone or the Internet from the target person, and (2) a method of receiving voice from the examiner. (3) A method in which a voice is acquired by contacting a person via the telephone or the Internet and having a conversation, (3) a method in which a voice acquisition device is provided in the residence of the subject and the subject records on the device, (4) There is a method in which the voice acquisition device automatically starts up periodically and talks to the target person to obtain the voice of the target person.
  • the calculation unit 122 passes a step of extracting a plurality of acoustic parameters from the voice data of the subject.
  • the acoustic parameters are extracted from the voice data of the patient.
  • the acoustic parameter is obtained by parameterizing a characteristic when a sound is transmitted.
  • the acoustic parameters include a zero crossing rate and a Hurst exponent.
  • the zero-point crossing rate is obtained by calculating the number of times that the waveform of the sound pressure of the voice crosses the reference pressure per unit time, as the degree of the change of the waveform of the voice.
  • the Hurst exponent indicates the correlation of changes in the audio waveform.
  • the sound parameter is composed of a first sound parameter and a second sound parameter.
  • the first acoustic parameter is an acoustic parameter extracted from the voice of the patient whose specific disease is to be estimated.
  • the second sound parameter is a sound parameter recorded in the database 120B in advance.
  • the second acoustic parameter is extracted from voice data of a patient having Alzheimer's dementia, Lewy body dementia, Parkinson's disease, major depression, atypical depression, or a disorder of bipolar disorder. And each disease are linked in advance.
  • the acoustic parameters used in the present invention include the following items. 1) Volume envelope (attack time, decay time, sustain level, release time) 2) Waveform fluctuation information (Shimmer, Jitter) 3) Zero crossing rate 4) Hurst index 5) VOT (Voice Onset Time) 6) Statistics of the distribution in the utterance for certain coefficients of the mel-frequency cepstrum (first quartile, median, third quartile, 95 percent, arithmetic mean, geometric mean, third quartile, Median difference) 7) Statistical value of distribution in speech at the speed of change of frequency spectrum (first quartile, median, third quartile, 95 percent point, arithmetic mean, geometric mean, third quartile And median difference) 8) The statistical value of the distribution in the utterance with respect to the time change of a certain coefficient of the mel frequency cepstrum (first quartile, median, third quartile, 95 percent point, arithmetic mean, geometric mean, third quartile Difference between the rank and median)
  • the estimation program has a learning function using artificial intelligence and performs estimation processing using the learning function.
  • Neural network type deep learning may be used, reinforcement learning etc. that partially strengthens the learning field may be used, and other, genetic algorithm, cluster analysis, self-organizing map, ensemble learning, Etc. may be used.
  • other technologies related to artificial intelligence may be used.
  • ensemble learning a classification algorithm may be created by a technique using both boosting and a decision tree.
  • the algorithm creator examines the second acoustic parameter item by the stepwise method so as to obtain a better combination of arbitrary acoustic parameters used as the variable f (n). And select one or more. Next, a coefficient is assigned to the selected arbitrary acoustic parameter to create one or more acoustic feature values. Further, a feature F (a) is created by combining these acoustic features.
  • variable increase method There are three types of stepwise methods: a variable increase method, a variable decrease method, and a variable increase / decrease method, and any of them may be used.
  • the regression analysis used in the stepwise method includes a process of linear classification such as a linear discriminant or a logistic regression analysis.
  • the variable f (n) and the coefficient thereof, that is, the coefficient xn of the equation F (a) expressed by the following equation is called a regression coefficient, and is a weight given to the function f (n).
  • the quality may be improved by machine learning for increasing the estimation accuracy from disease information or the like stored in the database.
  • the predicted value of the subject's disease is calculated from one or more acoustic features based on, for example, the following equation F (a).
  • f (n) is an arbitrarily selected one or more second acoustic parameters from the above acoustic parameter items (1) to (11).
  • xn is a regression coefficient specific to the disease.
  • f (n) and xn may be recorded in the recording device 120 of the estimation program in advance.
  • the regression coefficient of the feature F (a) may be improved in the process of machine learning of the estimation program.
  • the calculation unit 122 in FIG. 1 calculates a feature amount for distinguishing a healthy subject from a test subject having a disease or for distinguishing a disease from each other based on a combination of the second acoustic parameters. From this feature amount, a predicted value of the subject's disease is calculated by performing scoring to calculate the reference range and how far the subject's value is from the reference range.
  • FIG. 4A is an image diagram showing that the intensity of one acoustic feature value differs for each disease.
  • the subject has the highest score for Disease A. Therefore, the predicted value for the disease A of the subject is calculated higher than that of the other disease groups. Further, for example, by setting the intensity 50 as a threshold value, it can be classified into a group of diseases A, B, and C, and a group of diseases D and E.
  • the predicted value of the disease is calculated based on the intensity of one acoustic feature, but it is actually difficult to classify the disease using only one acoustic feature. Therefore, the disease amount may be classified by calculating the characteristic amount F (a) obtained by combining some acoustic characteristic amounts.
  • a predicted value of the disease is calculated for the voice of the labeled subject, and the distribution of the predicted value for each disease is obtained. Thereby, each disease can be classified.
  • FIG. 4B is a distribution image of a predicted value of a disease (denoted as “mental value” in FIG. 4B) obtained by a combination of certain three acoustic parameters.
  • the distribution of the predicted values of the patient group of Lewy body dementia can be separated from the distribution of the predicted values of the patient group of other diseases and the healthy group.
  • a combination of acoustic parameters is set for each disease so that it can be distinguished from other diseases, a feature value F (a) is calculated, and the voice of each subject is input using the feature value F (a) as an input. Which disease applies to can be determined.
  • Another method is to extract a feature amount F (a) for each disease from the voice of each patient, find out which disease has more feature amounts, and compare the predicted values of the diseases with each other. It can be estimated that the disease is affecting the patient.
  • the predicted value of the disease can be regarded as the degree of suffering from the disease. By comparing and recalculating the predicted value of each disease, it is possible to represent which disease is affected by the probability.
  • an estimation program may be created from voices of patients including 10 diseases including 4 diseases of vascular dementia, frontotemporal dementia, dysthymia, and dysthymia. .
  • the characteristic amount (a) of each disease may be extracted to calculate the predicted value of the disease.
  • the feature amount F (a) relating to the disease group as an input to the estimating unit and performing input / estimation in a plurality of stages, each disease or healthy state is finally estimated. You may. (Estimated flow 1)
  • (1-A) dementia group including Alzheimer's dementia, Lewy body dementia, Parkinson's disease, (1-B) major depression, atypical depression, bipolar disorder And (1-C) three healthy groups.
  • the voices of the patients classified into (1-A) dementia group are divided into (1-A-1) Alzheimer's dementia and (1-A-2) Lewy body dementia.
  • (1-A-3) Estimate the disease of patients in the dementia group by using a program for estimating any of the three diseases of Parkinson's disease.
  • the voices of patients classified into the (1-B) mood disorder group are (1-B-1) major depression, (1-B-2) atypical depression, and (1-B-3)
  • the disease of patients in the mood disorder group is estimated by a program for estimating one of the three diseases of bipolar disorder. (Estimated flow 2)
  • (2-A) dementia group including Alzheimer's dementia, Lewy body dementia, Parkinson's disease, (2-B) major depression, atypical Depression, mood disorders including bipolar disorder, and (2-C) healthy group are estimated.
  • the voices of the patients classified into (2-A) dementia group are compared with (2-A-1) Lewy body dementia or other dementia. Is determined by a program for estimating.
  • the speech of the patient classified into the (2-B) mood disorder group is (2-B-1) a major depression by a program for estimating major depression or other mood disorders. Is determined.
  • (2-A-2) a program for estimating Alzheimer's dementia or other dementia
  • (2-B-2) a program for estimating whether it is atypical depression or other mood disorders
  • (2-B-3) a bipolar disorder
  • the voice of the patient classified into (3-A) dementia group is converted into (3-A-1) Alzheimer type dementia or Lewy body type.
  • a program for estimating dementia (3-A-2) a program for estimating Lewy body dementia or Parkinson's disease, (3-A-3) a Parkinson's disease or Alzheimer's disease
  • a disease of a patient classified into a dementia group is estimated.
  • (3-B) a program for estimating (3-B-1) major depression or atypical depression from the speech of a patient classified into a mood disorder group
  • (3-B- 2) Combination of three estimation programs: a program for estimating atypical depression or bipolar disorder, and a program for estimating (3-B-3) bipolar disorder or major depression To estimate the disease in patients classified into the mood disorder group. (Estimated flow 4)
  • the first step of dividing into the above-described three classes of dementia group, mood disorder group, and healthy is first divided into two classes of (4-A) healthy group and (4-B) other disease group.
  • two stages of classifying the disease group into a (4-B-1) dementia group and a (4-B-2) mood disorder group may be used.
  • the acquisition of the audio data of the second acoustic parameter will be described. It is preferable that the subject who acquires the sound is selected based on the following criteria.
  • the age is not particularly limited as long as it can speak. However, considering voice change and emotional stability, the age is preferably 15 years or older, more preferably 18 years or older, particularly preferably 20 years or older. Also, considering the difficulty of physical speech due to age, 100 years or older. Is preferably less than 90 years, and more preferably less than 90 years.
  • voices are used for persons corresponding to the six diseases of Alzheimer's dementia, Lewy body dementia, Parkinson's disease, major depression, atypical depression, and bipolar disorder, respectively. Is preferred. However, excluding those who have these diseases. In addition to these six diseases, it is also possible to use voices for those corresponding to vascular dementia, frontotemporal dementia, dysthymia, and dysthymia. Further, voices for persons corresponding to schizophrenia, general anxiety disorder, and other neuropsychiatric disorders can also be used.
  • a healthy person is preferably a person confirmed to have neither dementia nor mood disorder. (Means for acquiring audio)
  • the microphone is not particularly limited as long as it can acquire sound.
  • the microphone may be selected from a hand microphone, a headset, a microphone built in a portable terminal, and a microphone built in a personal computer, a tablet, or the like. From the viewpoint that only the voice of the target person can be acquired, a pin microphone, a directional microphone, and a microphone built in a portable terminal are preferable.
  • a recording medium built in or external to a portable recorder a personal computer, a tablet, or a portable terminal can be used.
  • the utterance content when estimating a disease there are no restrictions on the utterance content when estimating a disease. For example, an utterance made freely by the target person, an utterance in which the target person reads out a sentence prepared in advance, or an utterance made by telephone or face-to-face conversation can be used. However, when creating an estimation algorithm, it is preferable to use the utterance content common to the subject. Therefore, when creating an estimation algorithm, an utterance in which the target person reads a sentence prepared in advance is preferable.
  • the time is too short, the accuracy of the estimation result will be low. It is preferably at least 15 seconds, more preferably at least 20 seconds, particularly preferably at least 30 seconds. If it is longer than necessary, it takes time to obtain the result. It is preferably 5 minutes or less, more preferably 3 minutes or less, and particularly preferably 2 minutes or less.
  • the information includes gender, age, height, weight, etc. as general information, the confirmed diagnosis name, severity, complications of physical illness, past history, onset time, etc. as medical information, and MRI, CT, etc.
  • PHQ Patient Interview and Question Patient Health Quastionnaire
  • MINI Mini-International Neuropsychiatric Interview
  • HAM-D or HDRS Hamilton Depression Rating Scale
  • YMRS Young Mania Rating Scale
  • MMSE Mini-Mental State Examination
  • BSDS Bipolar Spectrum Diagnostic Scale
  • MDS-UPDRS Unified Parkinson's Disease Rating Scale
  • the environment for acquiring voice there is no particular limitation on the environment for acquiring voice as long as it is an environment that can acquire only the utterance of the patient.
  • a quiet environment specifically, preferably 40 dB or less, more preferably 30 dB or less.
  • the sound may be acquired in a quiet room at the subject's home.
  • FIG. 5 is a graph of an ROC curve showing the separation performance of a healthy person or a specific disease and the other.
  • the horizontal axis indicates 1-specificity, and the vertical axis indicates sensitivity. In other words, the horizontal axis indicates the false positive rate, and the vertical axis indicates the true positive rate.
  • the ROC curves in FIG. 5 all showed a high value of the true positive rate when the false positive standing was low.
  • the AUC (Area ⁇ under ⁇ the ⁇ ROC ⁇ curve) was high in each case, and a significant difference was confirmed from the case of random identification.
  • Diseases for which separation performance has been verified are dementia with Lewy bodies, Parkinson's disease, and major depression.
  • the AUC in each ROC curve was 0.794 for Lewy body dementia, 0.771 for Parkinson's disease, and 0.869 for major depression.
  • the diseases that can be estimated using the present invention are not limited to those described above. From the results of the AUC, it can be confirmed that the estimation accuracy of the disease is high.
  • the estimation program created as described above can be used without any limitation whether it is a person suspected of suffering from a neuropsychiatric disorder or a person estimated to be healthy.
  • the usage scene can be easily used as a tool for medical examination by a doctor, or as a test item for a medical examination or a medical checkup, by acquiring the voice of the subject.
  • the number of times of voice acquisition it is possible to determine if the number of times is one, but for example, even a healthy person may exhibit a depressed state due to a life event or the like, and it is highly probable that the mood fell by chance at the time of voice acquisition.
  • the mood may change between morning and night. Therefore, when an estimation result indicating that a person is suffering from any mental illness is indicated, it is preferable to acquire the voice at least once more and estimate again. (Disease estimation by combining elements other than speech)
  • the system for estimating a psychiatric / neurological disorder of the present invention can estimate the type of a psychiatric / neurological disorder only by the voice of the subject, but in order to further increase the estimation accuracy, the elements held by the subject other than the voice May be used together.
  • the factors held by these subjects include examination data, questionnaire results on stress, and results of cognitive function tests.
  • the calculation unit 122 acquires the previously acquired medical examination data of the subject from the second recording device 120C.
  • the medical examination data is data in which a result of a medical examination or the like is recorded when a subject inputs a voice or before a voice is input.
  • the medical examination data may be acquired in advance in the form of a medical inquiry via the communication terminal 200 or the like.
  • the medical examination data include items such as a body mass index, fasting blood glucose, hemoglobin A1c, blood pressure, whether total cholesterol, LDL cholesterol, and urea nitrogen are each higher than a reference value, and whether HDL corsterol is lower than a reference value. Is included.
  • the physical health value of the subject may be calculated as a physical value based on the above items.
  • biomarkers for Alzheimer's dementia include (1) amyloid beta 42 (A ⁇ 42) in cerebrospinal fluid, (2) amyloid PET imaging, and (3) total ⁇ protein or phosphorylated ⁇ protein in cerebrospinal fluid. And (4) contraction of temporal and parietal lobes in fMRI examination.
  • biomarkers for Lewy body dementia (1) decrease in dopamine transporter by SPECT test, (2) decrease in accumulation of MIBG by MIBG myocardial scintigraphy, (3) REM without decrease in muscle activity by polysomnography Sleep and the like.
  • Biomarkers for Parkinson's disease include (1) decreased dopamine transporter by SPECT examination, (2) decreased accumulation of MIBG by MIBG myocardial scintigraphy, and (3) increased ⁇ -synuclein oligomer in cerebrospinal fluid.
  • Biomarkers for vascular dementia include lacunar infarction, white matter lesions, cerebral hemorrhage, multiple cortical infarcts, and other defective lesions based on MRI images.
  • PEA ethanolamine phosphate
  • ribosome genes etc.
  • the second recording device 120C records, in addition to the health data, response data on stress that describes the subject's response to the questionnaire on stress.
  • the calculation unit 122 performs a scoring process on the answer data, and calculates a stress value indicating the degree of the subject being affected by the stress based on the answer data.
  • the questionnaire regarding stress executes, for example, a scoring process defined according to a questionnaire such as a simple occupational stress questionnaire on the response data of the subject, and acquires information on the stress received by the subject.
  • Information on stress includes, for example, a measure of the subject's stress intensity, a measure of the subject's subjective symptoms, a measure of the subject's tolerance to stress, a measure of the subject's ability to recover from stress, and At least one of the surrounding support measures is included.
  • the scale of the stress intensity received by the subject indicates the intensity of the stress the subject is receiving when the subject answers the question.
  • the scale of the stress intensity is obtained from the answers to 17 questions included in the area “A” out of a total of 57 questions.
  • the scale of the stress intensity may be obtained not only with the cause of the psychological burden in the workplace such as a simple questionnaire for occupational stress, but also with the stress factor in personal life in general.
  • the stress intensity is measured by using an interpersonal stress event scale (Takeshi Hashimoto, “An Attempt to Classify Interpersonal Stress Events in University Students”, Social Psychology Research, Vol. 13, No. 1, pp. 64-75, 1997). May be determined.
  • the scale of the subject's subjective symptoms indicates the psychological state at the time when the subject answers, and is obtained, for example, in the case of a simple occupational stress questionnaire from the answers to 29 questions included in the area “B”. .
  • the subjective symptom scale checks mental and physical subjective symptoms due to a psychological burden, and indicates a state as a result of stress.
  • the factor of the stress that causes the subjective symptoms is not limited to work.
  • the scale of subjective symptoms is, for example, Beck Depression Inventory (BDI: Beck et “al.,“ An Inventory for measuring depression ”, Arch. Gen. Psychiatry, Vol. 4, pp.561-571, 1961) or Self. -Rating Depression Scale (SDS: Zunk et al., “Self-Rating Depression Scale in in an outpatient Further Validation of the the SDS”, Arch. Gen. Psychiatry, Vol. 13, pp. 508-515, 1965)
  • a scale that measures depression such as the Disease Rating Scale (GDS), Self-Rating Questionnaire for Depression (SQR-D), Hamilton Depression Rating Scale (HAM-D), and Patient Health Questionnaire-9 (PHQ-9), May be required.
  • GDS Disease Rating Scale
  • SQR-D Self-Rating Questionnaire for Depression
  • HAM-D Hamilton Depression Rating Scale
  • PHQ-9 Patient Health Questionnaire-9
  • the score is 63 points out of 0, 0 to 10 points are in the normal range, 11 to 16 points are neurosis-like, and light depression. 17-20 points demarcation from depressive state, need specialist treatment. 21-30 points of moderate depression, need professional treatment. 31-40 points are severe depression, need specialist treatment. Extreme depression of 41 points or more, treatment by specialists is required.
  • PHQ-9 has a score of 27 points on a scale of 0 to 4 for none, 5 to 9 for mild, 10 to 14 for moderate, and 15 to 19 for moderate to severe. , 20-27 points are considered severe.
  • the scale of surrounding support for the target person indicates the status of the cooperation system by the person who contacts the target person, such as the supervisor of the workplace, colleagues, family, friends, and nearby people.
  • the scale of the surrounding support for the target person is obtained from the answers of nine questions included in the area “C”.
  • the scale of the surrounding support indicates that as the surrounding support increases, the stress that the subject receives is likely to be alleviated, and the stress tolerance of the subject increases.
  • the surrounding support scale is the social support scale for university students (Yasutaka Katatake, Naoko Onuki, “Creation of a social support scale for university students and examination of its reliability and validity”, Rissho University Psychological Research Annual Report, No. 5 , Pp. 37-46, 2014) and the like.
  • the scale of the subject's tolerance to stress is a scale indicating whether or not the subject is liable to be mentally ill when subjected to the same level of stress.
  • the area "A" Is obtained using some of the answers to the questions in the area "C". It should be noted that it is preferable to appropriately determine which question should be used to determine the scale of stress tolerance. That is, as described in the stress vulnerability model, there are some people who develop the same stress and those who do not, and if the subject is more vulnerable to the stress, as described in the stress vulnerability model ( The lower the tolerance), the greater the likelihood of developing even a small stress. Therefore, the second calculating section 260 can calculate the risk tolerance of the disease more accurately by calculating the stress tolerance of the subject at the same time as the stress load.
  • stress tolerance is considered to include two elements, vulnerability (barnability) and resilience (resilience), and there are some parts where the two elements overlap with each other.
  • one of the two elements may be used, or both elements may be used. Since a plurality of risk factors are involved in the onset process, obtaining a measure of vulnerability among measures of stress tolerance has been studied from the viewpoint of various risk factors.
  • a measure of vulnerability a shortened version of the Narcissistic Vulnerability Scale (Yuichiro Uechi, Kazuhiro Miyashita, “Relationship between Narrative Vulnerability, Self-Inconsistency, and Self-Esteem as Factors of Social Fear Tendency”, Personality Research, Vol. 17, pp. 280-291, 2009).
  • Another measure of vulnerability is Rumination-Reflection Questionnaire Japanese version (Keisuke Takano, Yoshihiko Tanno, “A trial of creating Rumination-Reflection Questionnaire Japanese version”, Personality Studies, Vol. 16, pp.
  • ⁇ ⁇ Resilience (recoverability) in psychology usually means a defense factor against stress, and indicates resistance to stress and resilience in case of illness. Resilience is thought to have innate qualitative resilience and acquired resilience acquired after birth. Regarding the scale of resilience, for example, a two-dimensional resilience factor scale (Mari Hirano, "An attempt to classify qualitative and resilient factors of resilience", Personality Studies, Vol. 19, pp.94-106, 2010) is there. In addition, qualitative resilience is considered as a lower scale, with four factors of optimism, control, sociality and behavioral power, and acquisitional resilience being three factors of problem-solving orientation, self-understanding, and understanding of psychology of others. I have. Since resilience also differs depending on the subject, the risk of illness can be more accurately determined by measuring the resilience of the subject together with the stress.
  • HDS-R Hasegawa-style simplified intelligence evaluation scale
  • MMSE Mini-Mental State Examination
  • WMS-R Wechsler Memory Scale-Revised
  • N-type mental function test N-type
  • National Seiki-style screening test National Seiki-style
  • Montreal Cognitive Assessment MoCA
  • Dementia-Assessment-Sheet-for Community-based Integrated System System-21 items DASC-21
  • DASC-21 Dementia-Assessment-Sheet-for Community-based Integrated System System-21 items
  • HDS-R has a score of 30 out of 30, and a score of 20 or less is suspected of dementia, and its sensitivity is 93% and specificity is 86%.
  • the MMSE is a perfect score of 30 points, and a score of 23 or less is suspected of dementia, the sensitivity is 81%, and the specificity is 89%. If the score is 27 or lower, mild dementia (MCI) is suspected. (About the estimation unit)
  • step S108 the estimation unit 123 estimates the disease based on the predicted value of the disease and / or the medical examination data acquired by the calculation unit 122.
  • the calculation unit 122 also calculates the stress value in step S107, the disease may be estimated based on the predicted value of the disease, the medical examination data, the physical value, and the stress value.
  • step S109 the estimation unit 123 determines whether the advice data corresponding to the disease has been selected.
  • the advice data corresponding to a disease is advice for preventing a disease or avoiding aggravation when a subject receives the advice data.
  • the advice data created for each disease is recorded in the second recording device 120C. If the advice data corresponding to the disease has been selected, the process proceeds to step S111. If the advice data has not been selected, in step S110, the advice data corresponding to the symptom of the subject is selected from the second recording device.
  • step S111 the estimation unit 123 instructs to transmit the disease estimation result and the selected advice data to the first reception unit 131 of the display unit 130 via the second transmission unit 124.
  • step S112 the estimation unit 123 instructs the output unit 132 of the display unit 130 to output the estimation result and the advice data.
  • the estimation system 100 ends the estimation processing.
  • the estimation system 100 repeatedly executes the processing of steps S101 to S112 each time the voice data of the subject is received from the communication terminal 200.
  • the calculating unit 122 calculates the predicted value of the disease of the subject based on the feature value F (a) using the voice data of the subject obtained from the input unit 110.
  • the estimating unit 123 estimates the health condition or the disease of the subject based on the calculated predicted value of the disease of the subject and / or the medical examination data recorded in the second recording device 120C, and estimates the estimation result together with the advice data. Can be shown to the subject.
  • the estimation system 100 estimates the psychiatric / nervous system disease suffering from the subject from the voice uttered by the subject, and reduces the severity of the disease. It is possible to provide an estimation system 100, an estimation program, and an estimation method that prevent a disease and allow a patient to receive an appropriate treatment based on accurate determination of a disease.
  • a doctor, a clinical psychologist, a nurse, a laboratory technician, a counselor, or another person who uses the apparatus of the present invention uses the apparatus while facing a subject who acquires voice.
  • a room where a quiet environment is maintained such as a treatment room or a counseling room
  • one or more persons who handle the device of the present invention explain how to directly acquire voice in an open state for a subject who acquires voice.
  • a subject who obtains sound enters the hearing test room and other various test rooms, and the above-mentioned operator uses the subject through the glass or while watching the subject on the monitor image.
  • the voice can be obtained and estimated when the subject goes to a medical institution or a counseling room, and the voice can be obtained and estimated as a health checkup of a company or a local government or an examination item of a health checkup.
  • the following voices of patients and healthy subjects were acquired between December 25, 2017 and May 30, 2018, in order to attach voice data to a plurality of diseases.
  • ⁇ 20 voices of Alzheimer-type dementia patients ⁇ 20 voices of Lewy body dementia patients ⁇ 20 voices of Parkinson's disease patients ⁇ 20 voices of major depressive patients ⁇ 16 voices of bipolar disorder patients ⁇ non-voice 19 voices of patients with typical depression and 20 voices of healthy people
  • Olympus pin microphones and Roland portable recorders were used for voice acquisition.
  • the audio data was recorded on an SD card.
  • the utterance contents were read out by the subject twice in 17 sentences shown in Table 1 below and once in 1 to 13 and once in 14 to 17.
  • utterance content per subject Of the 17 types of utterance content per subject, 1 to 13 utterances (26 utterances for each 2 times) and 14 to 17 utterances (4 utterances for each 1 time) Of the total 30 utterances, the long one was broken down into two, and the unclear ones were excluded, 613 utterances from Alzheimer's dementia patients, 573 utterances from Lewy body dementia patients, Parkinson's disease A total of 4186 uttered 608 uttered patients, 619 uttered from major depressed patients, 484 uttered from bipolar disorder patients, 573 uttered from atypical depressed patients, and 615 uttered from healthy subjects The utterance was obtained.
  • the above-mentioned six diseases and seven types of healthy subjects and a plurality of associated Acoustical parameters were obtained.
  • a plurality of acoustic features were extracted by selecting combinations of a plurality of acoustic parameters. Further, by combining them, an estimation program 1 based on the feature value F (a) for estimating one of the six diseases or a healthy person was created.
  • the disease estimating program used in the disease estimating system of the present invention does not analyze the contents of words spoken with respect to acoustic features.
  • the estimation program calculates a predicted value of a disease from a feature created by extracting an acoustic feature from an utterance. Therefore, there is an advantage that it does not depend on a language.
  • the acoustic characteristics may be affected by being unable to speak fluently unless the sentence is in the native language. Therefore, for example, when estimating the disease of a subject whose native language is English, first collect the voices of patients and healthy people whose native language is English, create an estimation program for English, and use this. It is preferable to estimate the disease using English utterances. Similarly, an estimation program for languages other than Japanese and English can be created.
  • the sentences read by the subject and the subject include, for example, the following English sentences.
  • a commercially available feature extraction program can be used as a method for extracting the acoustic feature from the uttered voice. Specific examples include openSMILE.
  • acoustic features can be extracted from many utterances (one phrase) by such an acoustic feature extraction program.
  • 7440 acoustic features are used as a base.
  • each estimation program from the 7440 acoustic features, some suitable acoustic features for judging a disease are selected, and they are combined so that each patient can be distinguished from each other.
  • a calculation formula for calculating the predicted value of the disease is set.
  • utterances uttered by healthy subjects 383 were estimated as healthy subjects, 246 were estimated as Lewy body dementia, 72 were estimated as Alzheimer's dementia, and 72 were Parkinson's disease.
  • the estimated number was 51, the major depression was estimated 18, the bipolar disorder was estimated 30 and the atypical depression was estimated 15. Therefore, the ratio (sensitivity, recall: Recall) of the utterances of the healthy person actually estimated to be those of the healthy person was 62.3%.
  • the ratio (sensitivity, recall) of the utterance of the dementia with Lewy bodies among the utterances of the dementia with Lewy bodies was 58.8%.
  • Estimation program 1-2 is for mental and nervous system disorders including at least Alzheimer's dementia, Lewy body dementia, Parkinson's disease, major depression, atypical depression, and bipolar disorder, whose symptoms are similar to each other. , Major depression is extracted and estimated.
  • the utterance types used in the analysis are 17 types of utterances (phrases), as in the estimation program 1.
  • acoustic features were extracted using openSMILE, which is software for extracting acoustic features. Excluding data with significant differences depending on the facility that acquired the audio, a classification algorithm was created using a combination of boosting and decision trees using features of 1547 data to discriminate major depression and other diseases Generated predictive value of disease.
  • Synthetic Minority Over-sampling Technique Using the technique of (SMOTE), pseudo data of utterances of the major depressed patients were created, and the number of uttered phrases of the major depressed patients was set to 3,139.
  • Table 2 shows the estimation results based on the estimation program 1-2.
  • the recall rate for major depression is 91.1% and that for other psychiatric and nervous system diseases is The recall rate was 93.8% and the correct answer rate was 92.7%.
  • AUC was 0.977.
  • estimation program 1-2-2 can discriminate major depression from other psychiatric / nervous system diseases, in an actual clinical setting, other diseases having similar symptoms to major depression are identified. Can be determined. Specifically, for example, it can be used to determine whether the subject is major depression or bipolar disorder, or to determine whether the subject is major depression or atypical depression. (Creation of estimation program 1-3)
  • Estimation program 1-3 is for mental and nervous system diseases including at least Alzheimer's dementia, Lewy body dementia, Parkinson's disease, major depression, atypical depression, and bipolar disorder whose symptoms are similar to each other. , And extract and estimate Lewy body dementia.
  • the types of utterances used in the analysis are 17 types of utterances (phrases) as in the estimation program 1.
  • acoustic features were extracted using openSMILE, which is software for extracting acoustic features. Excluding features that have significant differences depending on the facility where the voice was acquired, a classification algorithm was created using a combination of boosting and decision trees using 1547 features, and Lewy body dementia and other diseases were created. Disease predictive values were generated for discrimination.
  • openSMILE is software for extracting acoustic features.
  • Table 3 shows the estimation results based on the estimation program 1-3.
  • the recall rate for Lewy body dementia is 88.6%
  • the recall rate for the disease was 89.8%
  • the correct answer rate was 89.2%.
  • AUC was 0.959.
  • the estimation program 1-3-2 can discriminate between Lewy body dementia and other psychiatric and nervous system disorders, so in an actual clinical setting, the symptoms may be similar to those of Lewy body dementia.
  • Disease can be determined. Specifically, for example, it can be used to determine whether it is Lewy body dementia or Alzheimer's type dementia, or to determine whether it is Lewy body dementia or Parkinson's disease. . (Creation of estimation program 2)
  • the estimation program 1 first, the acoustic parameters associated with each disease were selected, and then the acoustic parameters were combined to generate a feature amount, thereby creating an estimation program.
  • the estimation program 2 first, two target diseases are selected, a combination of acoustic parameters for distinguishing these two diseases is created, and a combination of acoustic parameters for distinguishing the two diseases and the accuracy of the combination are calculated.
  • a program for estimating disease was created.
  • Estimation Program 2 six diseases including Alzheimer's dementia, Lewy body dementia, Parkinson's disease, bipolar disorder, atypical depression or major depression, and two healthy subjects were selected. By estimating closeness and performing each of the two combinations, the most likely disease (or healthy) is estimated.
  • any of Alzheimer's dementia and Lewy body dementia, Lewy body dementia and Parkinson's disease, or major depression and bipolar disorder, or any of those diseases and healthy will be described.
  • parameters A, B, and C may be used, for example.
  • D, E, and F may be used, for example.
  • Alzheimer's dementia or Lewy body dementia, Lewy body dementia or Parkinson's disease, or major depression or bipolar disorder, which has a higher probability of being a disease Alternatively, it can be estimated that the person is healthy. (Creation of estimation program 2-1)
  • Examples of acoustic features include: (1) Fourier transform, mel-frequency cepstrum coefficient, voiced probability, zero-crossing rate, fundamental frequency (F0), and the like, where physical features calculated in frame units are similar to the features. (2) Moving average, time change, and the like as the processing in the time direction (1). (3) Average, maximum, minimum, and center of gravity as statistical quantities for frames in the same file of (2). , Quartile, variance, kurtosis, skewness and the like.
  • the J48 decision tree algorithm (Weka implementation of C4.5) is used to discriminate healthy subjects from Alzheimer's dementia patients. The voices obtained at three different hospitals were used for verification. (Estimation result based on estimation program 2-1) Result 1: Classification performance for each utterance
  • Result 2 Classification performance for each subject For utterances (approximately 30 each) for each subject, count whether the utterance was estimated to be Alzheimer-type dementia or healthy person, and determined the majority with the majority decision. The estimation results were as follows. Table 6 shows the results.
  • the estimation program 2-2 whether Parkinson's disease is present in 20 utterances of “Ah” of a patient with Parkinson's disease (for 20 people) and 20 utterances of “Ah” of a patient with Lewy body dementia (for 20 people) Presumed to be Lewy body dementia.
  • the accuracy rate (Accuracy) of the estimation program 2-2 was 87.5%.
  • the recall (Recall) for Lewy body dementia was 90%, and the precision (Precision) was 85.7%.
  • the recall rate (Recall) was 85% and the precision rate (Precision) was 89.5%.
  • an estimation program 2-3 for estimating whether the patient has Lewy body dementia or is healthy was created.
  • the estimation program 2-3 shows that the estimation program 2-3 is normal or Levy small. It was estimated whether the person had body type dementia.
  • the accuracy rate (Accuracy) of the estimation program 2-3 was 92.3%. Further, the sensitivity (Sensitivity) of dementia with Lewy bodies is 85%, the specificity (Specificity) is 100%, the positive precision (Positive Precision) is 100%, and the negative precision (Negative Precision) is 86.4%. Was. (Estimation program 2-4)
  • an estimation program 2-4 for estimating whether the subject is healthy or major depression was created.
  • Estimation program 2-4 showed that 19 utterances of "Ah” of a healthy person (for 19 people) and 18 utterances of "Ah” of a major depressed patient (for 18 people) were healthy or major depression. I guessed.
  • 17 were supposed to be healthy and 2 were supposed to have major depression. Also, out of the 18 utterances of the major depressed patients, 17 were estimated to be major depression and one was estimated to be healthy.
  • the accuracy rate (Accuracy) of the estimation program 2-4 was 91.9%.
  • the sensitivity (sensitivity) of major depression is 94.4%
  • the specificity (Specificity) is 89.5%
  • the positive precision (Positive Precision) is 89.5%
  • the negative precision (Negative Precision) is 94.%. 4%.
  • the estimation program 2-5 is a program for discriminating healthy subjects from major depressed patients. First, for each utterance phrase (about 30 utterances for each person) of 20 healthy subjects and 20 major depressed patients, 7,440 acoustic features are extracted using openSMILE which is software for extracting acoustic features. did. A feature amount having a significant difference depending on the facility from which the voice was acquired was excluded, and 1547 feature amounts were selected. Then, by a method using both boosting and a decision tree, a predicted value of a disease for discriminating between a healthy person and major depression was generated from the feature amount, and a classification algorithm was created. Table 7 shows the estimation results for each phrase. The determination of major depression in the estimation program 2-5 was 81.4% for sensitivity, 85.5% for specificity, and 83.5% for the correct answer rate.
  • Table 8 shows the result of summarizing, for each person, what was determined to be either major depression or healthy for each phrase. Furthermore, the health judgment rate for each individual was determined, and those with a health judgment rate of 60% or more were estimated as healthy subjects, and those with a health judgment rate of less than 60% were estimated as major depressed patients. As a result, as shown in Table 9, all 20 healthy subjects were estimated to be healthy subjects, and all 20 major depressed patients were estimated to be major depressed patients. That is, the specificity, sensitivity, and correct answer rate were all 100%.
  • the estimation program 2-6 is a program for discriminating healthy persons and patients with Lewy body dementia.
  • a classification algorithm was created by the same procedure as that of the estimation program 2-5, except that the speech phrases of 20 healthy subjects and 20 Lewy body dementia patients were used as voices. Table 10 shows the estimation results for each phrase.
  • Lewy body dementia was 81.5% for sensitivity, 83.1% for specificity, and 82.2% for the correct answer rate.
  • Table 11 shows the results obtained by estimating either Lewy body dementia or healthy for each phrase for each individual. Furthermore, the healthy judgment rate of each person was calculated, and those with a healthy judgment rate of 60% or more were estimated as healthy persons, and those with a healthy judgment rate of less than 60% were estimated as patients with Lewy body dementia. As a result, as shown in Table 12, all 20 healthy subjects were estimated to be healthy, and 20 of the patients with Lewy body dementia were estimated to be 19 with Lewy body dementia, and one was estimated to be healthy. Was done. That is, the specificity was 100%, the sensitivity was 95%, and the correct answer rate was 97.5%.
  • Lewy body dementia can be estimated with a high determination probability.
  • an estimation program for classifying a specific disease and the other 5 diseases is combined with an estimation program for classifying the specific disease and a healthy person.
  • the estimation program 2-7 is a program for estimating whether the subject is a healthy subject, a major depressed patient, or a patient with Lewy body dementia.
  • a classification algorithm was created by the same procedure as that of the estimation program 2-5 except that speech phrases of 20 healthy subjects, 20 major depression patients, and 20 Lewy body dementia patients were used as voices. Table 13 shows the estimation results for each phrase.
  • the specificity was 67.8%, the sensitivity for Lewy body dementia was 70.3%, the sensitivity for major depression was 69.5%, and the correct answer rate was 69.2%.
  • the utterance of each subject is estimated for each utterance, and the most presumed disease (or healthy) is estimated as the disease (or healthy) affected by the subject. For example, as a result of estimating 32 utterances obtained from the subject A, 4 healthy subjects, 16 Lewy body dementias, 3 Alzheimer's type dementia, 3 Parkinson's disease, 2 major depression, 2 bipolar disorder If there are two atypical depressions, it is presumed that the subject A is suffering from Lewy body dementia, which has obtained the most estimates. (Creation of estimation program 4)
  • the estimation program 5 enables estimation of two specific diseases even in a mild case.
  • MCI mild dementia
  • DSM-5 mild dementia caused by Alzheimer's disease, frontotemporal mild dementia, mild dementia with Lewy bodies, mild cognitive impairment in vascular, Parkinson's disease Mild dementia harm and several other mild dementia harms are defined.
  • dementia Mild dementia
  • the characteristic symptoms of the disease are often unclear and difficult to diagnose.
  • two specific diseases such as an algorithm for estimating Alzheimer's dementia and Lewy body dementia, an algorithm for estimating Alzheimer's dementia and frontotemporal dementia, and Lewy body dementia and Parkinson's disease
  • a precise discriminant algorithm is created, whereby one of the diseases is estimated when the disease is mild. (Creation of estimation program 6)
  • ⁇ II Schizophrenia spectrum disorders and other psychotic disorders, III. Bipolar and related disorders group, IV. Depressive disorder group; Anxiety group anxiety disorder group, XVIII. Personality disorder group, XVII. Estimate that you are suffering from any of the diseases belonging to these groups, such as the neurocognitive disorder group.
  • the algorithm for estimating such a disease group is suitably used, for example, when screening for a mental illness without any illness by a medical examination, or when a general internal medicine or general physician is first examined.
  • bipolar disorder and related disorder groups as bipolar disorder and neurocognitive disorder group as Alzheimer's dementia and Lewy body dementia, and apply characteristic speech parameters to each of these groups to estimate disease group Create an algorithm to (Creation of estimation program 7)
  • a dementia group including three diseases of Alzheimer's dementia, Lewy body dementia, and Parkinson's disease, major depression, bipolar disorder, It is possible to estimate which of the three groups, a mood disorder group including three diseases of typical depression and a healthy group, is a disease or a healthy group.
  • the dementia group may further include two diseases such as vascular dementia and frontotemporal dementia, and the mood disorder group may further include dysthymia and circulatory dysfunction.
  • a group consisting of Alzheimer's dementia and Lewy body dementia, a group of Parkinson's disease, major depression, bipolar disorder and atypical It is possible to estimate which of the four groups, the mood disorder group including depression and the healthy group, belongs to the disease or healthy group.
  • characteristic acoustic parameters for each of these utterances By extracting characteristic acoustic parameters for each of these utterances and associating the characteristics of the acoustic parameters, such as frequency and intensity, with the subject's disease, three types of dementia group, mood-gargle group, and healthy person and Various associated acoustic parameter groups were obtained.
  • a characteristic for determining whether the subject is a dementia group or a mood disorder group or a healthy person by selecting characteristic acoustic parameters for each disease and further performing a combination of the selected acoustic parameters.
  • An estimation program 7 based on quantities was created. When the estimation program was created, the utterance of each group was divided into five parts, and the cross verification was performed five times. (Estimation result based on estimation program 7)
  • the ratio (accuracy, precision: Precision) of the healthy person among the utterances estimated to be the healthy person was 65.2%.
  • the ratio (sensitivity, recall: Recall) of the utterances of the dementia group patients actually estimated to be those of the dementia group patients was 90.2%.
  • the ratio (sensitivity, recall: Recall) estimated to be that of the patient in the mood disorder group was 90.4%.
  • the overall correct answer rate (Accuracy) was 86.5%. With this estimation algorithm, it is possible to estimate which group belongs to the disease.
  • an algorithm for estimating a disease group such as the estimation program 7 is also used when screening for any mental illness through a physical examination, or for the first time in a general internal medicine or general clinician. It is preferably used when consulting. Then, after estimating the disease groups, a specific disease among mental / neurological diseases can be estimated for each disease group by using the above-described estimation program 2 or the estimation program 8 described later. (Creation of estimation program 8)
  • acoustic parameter is selected depending on how the feature is generated, whether mental or neurological disease is Alzheimer's disease or other disease, or Lewy body dementia, depending on which acoustic parameter is selected Alternatively, it can be estimated which one of the specific disease and the other disease belongs to, for example, whether the disease belongs to another disease or the like.
  • a program for estimating Lewy body dementia can be created. Then, if voice data of the estimation target person is calculated by this estimation program, it can be estimated whether the subject has Lewy body dementia or other dementia.
  • voice data of major depression and, as other diseases, Lewy body dementia, Alzheimer's dementia, Parkinson's disease, atypical depression, and combined voice with bipolar disorder By selecting an acoustic parameter that can be distinguished, a program for estimating major depression from mental and neurological disorders can be created. Then, if the voice data of the estimation target person is calculated by this estimation program, it can be estimated whether the subject has major depression or other. (Creation of estimation program 9)
  • Alzheimer's dementia, Lewy body dementia, Parkinson's disease, major depression, bipolar disorder, atypical Depression and healthy can be determined, but after once determining six diseases and healthy, Alzheimer's dementia, Lewy body dementia, Parkinson's disease three diseases together, as a dementia group, Combining major depression, bipolar disorder, and atypical depression into a mood disorder group, it is possible to estimate whether the disease is a dementia group, a mood disorder group, or healthy. it can. (Creation of estimation program 10)
  • the estimation program 9 it is for estimating whether the disease is in the dementia group or the mood disorder group, or whether it is healthy. Is assigned, and the one assigned the disease for the largest number of sentences is estimated to be the person's disease, and it is estimated whether the disease is in the dementia group or the mood disorder group, or is normal.
  • the voice used for the learning data is such that each patient and a healthy person utters the above-mentioned 17 sentences (twice for Nos. 1 to 13 and twice for Nos. 14 to 17 each) for each person. Got utterances.
  • the acoustic features are narrowed down from 7440 to the top 13 acoustic features with high correlation by logistic regression analysis, and using this, the predicted value of the disease of Lewy body dementia, the predicted value of the disease of major depression, the healthy disease Were calculated to sum to 1. (Estimation result based on estimation program 11)
  • Table 15 shows which of the individual's voices was estimated to be Lewy body dementia, major depression, or healthy. In addition, the predicted value of the disease in the table is described as "mental value”.
  • DSM Mental Disorder Diagnosis and Statistical Manual
  • I Neurodevelopmental Disorders Neurodevelopmental group-Neurodevelopmental disorder group II. Schizophrenia Spectrum and Other Psychotic Disorders III. Bipolar and Related Disorders Bipolar and related disorders IV. Depressive Disorders Depressive disorder group Anxiety Disorders Anxiety group Anxiety disorder group VI. Obsessive Compulsive and Related Disorders Obsessive-compulsive and related disorders, obsessive-compulsive and related disorders VII. Trauma and Stressor Related Disorders Trauma and Stress Cause Related Disorders Group VIII.
  • Dissociative Disorders Dissociation group-Dissociative disorder group IX. Somatic Symptom and Related Disorders Physical Symptoms and Related Diseases Group X. Feeding and Eating Disorders Eating and eating disorders XI. Elimination Diorders Excretory Group XII. Sleep-Wake Disorders Sleep-Wake Disorder Group XIII. Sexual Functions Sexual Dysfunction Group XIV. Gender Dysphoria gender dysphoria XV. Disruptive, Impulse-Control, and Conduct Disorders Order-disruptive, impulsive control, behavioral disorder group XVI. Substance-Related and Additive Disorders Substance-related disorders and addictive disorders XVII. Neurocognitive Disorders Neurocognitive impairment group XVIII. Personality Disorders Personality Disorder Group XIX. Paraphilic Disorders Paraphilia disorder group
  • Major Depressive Disorder A Five (or more) of the following symptoms are present during the same two weeks, causing a change from pre-disease function: At least one of these symptoms is (1) depressed mood, or (2) loss of interest or pleasure. Note: Symptoms apparently caused by other medical conditions are not included. (1) Almost every day, almost every day, as indicated by the person's own words (eg, feeling sad, empty, or desperate) or observations of others (eg, appearing to be weeping) Feeling depressed.
  • Dementia with Probable Lewy body disease involves two core features or one or more core features and one suggestive feature with a possible Lewy body disease
  • there is only one core feature or one or more suggestive features (1) core features (a) cognitive upset with significantly fluctuating attention and alertness (b) well-formed details Repetitive visual hallucinations (c) Naturally occurring parkinsonism following cognitive decline (2) Suggestive features (a) Meet the criteria for REM sleep disorder (b) Serious neuroleptics Hypersensitivity to D. The disorder is not well described by cerebrovascular disorders, other neurodegenerative disorders, the action of substances, or other mental, neurological, or systemic disorders. (Seventh embodiment)
  • the calculation unit 122 calculates the zero-point crossing rate as the degree of the waveform change in the voice. Further, the calculation unit 122 calculates a Hurst exponent indicating a correlation between changes in the waveform of the sound. The calculation unit 122 outputs the calculated zero-point crossing rate and the Hurst index of the subject to the estimation unit 123.
  • the calculating unit 122 does not suffer from a disease such as depression because the estimating unit 123 estimates the predicted value (sometimes described as a mental value) of the subject's disease from the zero-crossing rate and the Hurst index of the subject. Set a health reference range that indicates a healthy state.
  • the calculation unit 122 reads voice data of a plurality of persons whose health status is known whether or not they suffer from a disease such as depression from the recording device of the estimation system 100, and calculates a plurality of persons from the read voice data.
  • a second acoustic parameter including each zero crossing rate and Hurst exponent is calculated.
  • the calculation unit 122 calculates a linear discriminant or a logistic for the distribution of the zero point crossing rates and the Hurst indices of a plurality of persons calculated by the calculation unit 122 in the two-dimensional space of the zero point crossing rate and the Hurst index. By performing a process of linear classification such as regression analysis, a feature amount is created based on these linear models.
  • the calculation unit 122 sets a boundary line that divides a region of a person suffering from depression or the like from a reference range of a healthy person not suffering from depression or the like based on the feature amount.
  • the degree to which the subject's zero-crossing rate and the Hurst exponent score are apart from the reference range including the determined boundary line is calculated as a predicted value of the disease, and output to the estimation unit 123.
  • the estimation unit 123 estimates a disease from a predicted value of the disease in the subject. Then, the estimating unit 123 outputs information indicating the estimated health condition to the communication terminal 200.
  • FIG. 6 shows an example of audio data obtained via the communication terminal 200 shown in FIG.
  • FIG. 6 shows a temporal change in the sound pressure of the voice uttered by the subject obtained via the communication terminal 200.
  • the horizontal axis in FIG. 6 indicates time t, and the vertical axis indicates sound pressure.
  • FIG. 6 shows the data of the utterance unit that uttered “Thank you” in the voice data of the utterance by the subject.
  • Times t0, t1, t2, t3, and t4 indicate the start times at which the words “A”, “R”, “GA”, “TO”, and “U” included in the utterance unit are uttered.
  • the calculation process performed by the calculation unit 122 on the voice data in which the word “Ri” is uttered in the utterance unit of “Thank You” will be described. The same or similar calculation process is executed for the unit.
  • the calculation unit 122 calculates the zero point crossing rate and the Hurst exponent for each window WD having a sample number of 512 or the like using the audio data acquired from the communication terminal 200. As shown in FIG. 6, since the sound pressure changes greatly in the utterance of each word, for example, the calculation unit 122 calculates a zero-point crossing rate by using a window WD1 having a sample number smaller than the window WD, such as 30. Then, the average value of the sound pressure is calculated, and the average value calculated in each window WD1 is set as the reference pressure of each window WD1. The calculation unit 122 measures the number of times that the sound pressure of the subject crosses the calculated reference pressure (average value) in each window WD1, and calculates the zero-point crossing rate.
  • the calculation unit 122 calculates the average value of the zero-point crossing rates calculated in the respective windows WD1 as the zero-point crossing rate ZCR of the window WD.
  • the standard deviation ⁇ ( ⁇ ) of the difference between the sound pressure x (t) at time t and the sound pressure x (t + ⁇ ) separated by time ⁇ from time t is related as shown in Expression (1). It is known that there is a power law relationship as shown in Expression (2) between the time interval ⁇ and the standard deviation ⁇ ( ⁇ ). H in Equation (2) is the Hurst exponent.
  • the Hurst exponent H is "0" because there is no temporal correlation between the audio data. Also, as the audio data changes from white noise to pink noise or brown noise, that is, as the audio waveform has temporal correlation, the Hurst exponent H shows a value larger than “0”.
  • the Hurst exponent H is 0.5. Further, as the audio data has a stronger correlation than the brown noise, that is, as the audio data becomes more dependent on the past state, the Hurst exponent H takes a value between 0.5 and 1.
  • the calculation unit 122 calculates the standard deviation ⁇ ( ⁇ ) of the audio data for each ⁇ in which the time interval ⁇ is 1 to 15, and calculates the standard deviation ⁇ ( ⁇ ) of each calculated time interval ⁇ .
  • the Hurst exponent H is calculated by performing a regression analysis on ()).
  • the calculation unit 122 moves the window WD at a predetermined interval such as a quarter of the width of the window WD, and calculates the zero-point crossing rate ZCR and the Hurst exponent H in each window WD. Then, the calculation unit 122 averages the calculated zero-point crossing rate ZCR and the Hurst index H of all the calculated windows WD, and estimates the averaged zero-point crossing rate ZCR and the Hurst index H as the zero-point crossing rate and the Hurst index of the subject. Output to the unit 123.
  • FIG. 7 shows an example of the distribution of the zero-crossing rates ZCR and the Hurst exponent H of a plurality of persons calculated by the calculation unit 122 shown in FIG.
  • the vertical axis indicates the zero point crossing rate ZCR
  • the horizontal axis indicates the Hurst exponent H.
  • the zero-crossing rate ZCR and the Hurst index H of a person suffering from a disease such as depression are indicated by crosses, and the zero-crossing rate ZCR and the Hurst index H of a healthy person are indicated by circles.
  • the distribution of the zero point crossing rate ZCR and the Hurst exponent H shown in FIG. 7 is generated using a total of 1218 voice data. Out of a total of 1218 people, 697 people suffer from diseases such as depression, and 521 healthy people.
  • the calculation unit 122 executes a linear classification process such as a linear discriminant or a logistic regression analysis on the distribution of the zero-crossing rates ZCR and the Hurst exponent H of a plurality of persons shown in FIG.
  • the calculation unit 122 determines a boundary line indicated by a broken line that separates a person suffering from a disease such as depression from a healthy person.
  • the calculation unit 122 outputs information of the reference range including the determined boundary line to the estimation unit 123 using the area below the boundary line indicated by the broken line as the reference range, and sets the reference range in the estimation unit 123.
  • the vertical axis of the zero-point crossing rate ZCR and the horizontal axis of the Hurst exponent H are linear axes.
  • the boundary line It is preferable to use a logarithmic axis in order to show a straight line.
  • FIG. 8 shows an example of the distribution of the zero-crossing rate ZCR and the Hurst exponent H according to the environment in which audio data is acquired.
  • the vertical axis indicates the zero-point crossing rate ZCR
  • the horizontal axis indicates the Hurst exponent H
  • FIG. 8 shows the boundary line determined by the calculation unit 122 from the distribution of the zero point crossing rate ZCR and the Hurst exponent H shown in FIG.
  • FIG. 8 shows, for example, black triangles indicating the distribution of the zero-crossing rate ZCR and the Hurst exponent H calculated by the communication terminal 200 using voice data obtained by sampling the voice of the subject at a sampling frequency of 11 kHz.
  • FIG. 9 shows an example of the distribution of the zero point crossing rate ZCR and the Hurst exponent H calculated in each of the windows WD using one voice data.
  • the vertical axis represents the zero-point crossing rate Z.
  • CR is shown, and the horizontal axis shows Hurst index H.
  • the zero-point crossing rate ZCR and the Hurst exponent H calculated in each of the windows WD using one voice data are calculated, and the average values and are obtained from the data of HE and ZCR of all sections.
  • the communication terminal 200 downsamples the voice data of the subject sampled at 11 kHz at a sampling frequency of 8 kHz.
  • FIG. 8 shows the distribution of the zero-crossing rate ZCR and the Hurst exponent H calculated using the audio data down-sampled to 8 kHz, as white rectangles.
  • the zero-crossing rate ZCR and the Hurst exponent H of the subject are affected by sound quality deterioration (increase in noise) due to downsampling. That is, the zero-crossing rate ZCR of the down-sampled audio data is increased by increasing the number of times the noise and the sound pressure of the voice cross the reference pressure. It shows a large value as compared with.
  • the Hurst exponent H of the down-sampled audio shows a smaller value than the Hurst exponent H of the audio data sampled at 11 kHz because the audio data approaches white noise due to an increase in noise.
  • the zero-crossing rate ZCR and the Hurst exponent H are affected by downsampling, but do not change independently of each other but change in a relationship. That is, as shown in FIG. 8, the zero-point crossing rate ZCR and the Hurst exponent H change along the boundary indicated by the broken line while correlating with each other with respect to deterioration in sound quality due to downsampling or the like. .
  • the estimation system 100 can estimate the health state of the subject with higher accuracy than before, regardless of the environment in which the voice data is acquired.
  • the estimation system 100 may be applied to, for example, robots, artificial intelligence, automobiles, call centers, the Internet, mobile terminal device applications and services such as smartphones and tablet terminals, and search systems.
  • the estimation system 100 may be applied to a diagnostic device, an automatic inquiry device, a disaster triage, and the like.
  • Estimate the voice spoken by the subject determine and estimate the disease the subject is suffering from, prevent the disease from becoming more severe, and enable the patient to receive appropriate treatment based on the accurate determination of the disease
  • An estimation system, an estimation program, and an estimation method can be provided.

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Public Health (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Neurology (AREA)
  • Psychiatry (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physiology (AREA)
  • Neurosurgery (AREA)
  • Developmental Disabilities (AREA)
  • Epidemiology (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Psychology (AREA)
  • Child & Adolescent Psychology (AREA)
  • Hospice & Palliative Care (AREA)
  • Signal Processing (AREA)
  • Primary Health Care (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Educational Technology (AREA)
  • Social Psychology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Evolutionary Computation (AREA)
  • Fuzzy Systems (AREA)

Abstract

被験者が発話する音声を推定し、被験者が患っている病気を判別・推定し、病気の重症化を予防し、また病気の的確な判別に基づいて患者が適切な治療をうけることを可能にする推定システム、推定プログラムおよび推定方法を提供する。

Description

精神・神経系疾患の推定システム、推定プログラムおよび推定方法
 関連出願の相互参照
 本出願は、平成30年7月13日に出願された特願2018-133356、および平成31年3月25日に出願された特願2019-057353の優先権を主張する。
 本発明は、精神・神経系疾患の推定システム、推定プログラムおよび推定方法に関する。
 身体の健康状態が損なわれる疾患(以下、「身体疾患」と称する)と比して、精神の健康状態が損なわれる疾病(以下、「精神疾患」と称する)は、発病の原因、発生機序が解明されていない場合が多い。また、患者の身体の一部を採取して診断を行う確定診断やその治療も困難であることが多い。
 精神疾患の種類に関しては、例えばアメリカ精神医学会により出版されている Diagnostic and Statistical Manual of Mental Disorders(精神障害の診断と統計マニュアル:以下、「DSM-5」と称する)には、診断基準の開示がある。
 ここで、「II.統合失調症スペクトラム障害および他の精神病性障害群」、「III.双極性障害および関連障害群」、「IV.抑うつ障害群」、「V.不安症群 不安障害群」、「XVIII.パーソナリティ障害群」等は、精神疾患として一般に認知される。これらの精神疾患は、若年層から高齢者まで幅広く罹患する。また、これらの精神疾患は気分の落ち込みによって行動意欲が減少し、他者とのコミュニケーションが取れにくくなるなど社会性の低下を生ずることにより、日常生活に支障が生じる場合がある。
 特に、大うつ病など、重度の抑うつ状態に伴う自殺も大きな問題となっている。また、このような病気に罹患した生産年齢層が就業できないことによる経済的損失も大きい。統合失調症、うつ病、および不安障害を合算した2008年度の我国における罹病費用は、約6兆円と算出されている(厚生労働省:平成23年3月「精神疾患の社会的コストの推計」事業報告書)。
 これらの精神疾患に関して、様々な理由から未だ偏見が残っている。それによって、これらの精神疾患を患う患者は、自らが精神疾患を患っていることを打ち明けるのを躊躇する傾向にある。それによって、患者の発見や治療が遅れ、結果として重症になるまで対策が取られないという問題が生じている。さらに、精神疾患に有効なバイオマーカが極めて少ないことも、発見や治療が遅れる原因となっている。
 例えば、身体疾患に関しては、血液検査、X線、心電図、その他の各種検査等の典型的な健康診断により、身体疾患を早期に発見できる場合が多い。一方で、精神疾患に関しては、数問の問診票によるテストがあるのみであるため、精神疾患の罹患の可能性を十分予測できるとは言い難い。
 また、DSM-5の「XVII.神経認知障害群」は、いわゆる認知症に関する疾患であり、人口の高齢化に伴って患者数は増加傾向にある。アルツハイマー型認知症、レビー小体型認知症等の認知症は、現時点では根治薬が無い。そのため、症状が進行した場合には社会的な負担となり、特に家族が大きな負担をかかえることになるため問題である。この状況に対し、日本の厚生労働省も新オレンジプラン(認知症施策推進総合戦略)を策定し、対策に乗り出している。
 近年、脳を観察する定量的な測定手法として、脳の血流状態を測定するSPECT(Single Photo Emission CT)を、認知症やパーキンソンの診断に活用する例や、大脳皮質の血中ヘモグロビン濃度を測定する光トポグラフィを、うつ病などの診断に活用する例が見られるようになった。しかし、これらの測定機器は高価であり、そのため測定できる医療機関が限られている。
 近年、血中のエタノールアミンリン酸(EPA)を測定し、うつ病の診断に用いる技術が開発されており(特許文献3参照)現在臨床検査が行われている。この検査方法では、「うつ病」と血漿中のエタノールアミンリン酸濃度に有意な相関があることから被験者がうつ病であると判定できることが示されている。しかし、大うつ病、非定型うつ病、双極性障害など、抑うつ症状を呈する複数の疾患の判別に関しては示されていない。
 一方で、例えばうつ病は、未病の状態や、軽症時に発見できれば、医療を伴わずに回復させるための様々なメンタルヘルスサービスを活用できることが報告されている。(非特許文献1参照)。そのため、精神疾患を推定する簡便で患者負担の軽い検査手法が求められている。
 また、従来、人が発話した音声を解析することにより、感情や心的状態(抑うつ症状を呈していること)を推定する技術が提案されている(特許文献2、3参照)。しかしこの技術では、疾患の種類を推定することができない。
国際公開第2013/069645号 特開2007-296169号公報 国際公開第2006/132159号
独立行政法人経済産業研究所 Policy Discussion Paper Series 14-P-001 2004年1月 「未病うつに対する低強度メンタルヘルスサービスにおける積極的な民間活力導入の提案」
 DSM-5の診断基準では、神経認知障害群(認知症)のサブタイプとして、アルツハイマー型認知症(Neurocognitive Disorder Due to Alzheimer’s Disease)、前頭側頭型認知症(Frontotemporal Neurocognitive Disorder)、レビー小体型認知症(Neurocognitive Disorder with Lewy Bodies)、血管性認知症(Vascular Neurocognitive Disorder)の4つの型が示されている。これらの型の他に、脳損傷や他の疾患に起因する認知症についても示されている。
 また、DSM-5の診断基準では、パーキンソン病(Parkinson’s Disease)はレビー小体型認知症のカテゴリに含まれる。レビー小体型認知症とパーキンソン病の区別は、レビー小体の発生する部位に依存する。そのため、症状が類似する可能性があり、判別が困難である。
 これら認知症は、現状では完治できないが、進行をある程度遅らせることができる薬が存在し、認可されている。しかし、認知症の型により治療薬が異なるため、これらの型を推定する必要がある。また、推定には高度な技術を要する。例えば、患者の死亡後の脳を観察して初めてアルツハイマー型認知症であると確定的に診断できる、と一般に言われる程、認知症の型の推定は困難である。
 従って、認知症の程度が軽度な状態、すなわち軽度認知症(MCI)の状態で、認知症の型が判別可能になれば、その状態をより長く維持することができる。
 また、統合失調症(Schizophrenia)、大うつ病(Major Depressive Disorder)、非定型の症状を伴ううつ病(Depressive Disorder with Atypical Features:以下、「非定型うつ病」と称する)、双極性障害(Bipolar Disorder)、全般性不安障害(Generalized Anxiety Disorder)、パーソナリティ障害群(Personality Disorders)、気分変調症(Persistent Depressive Disorder)、気分循環性障害(Cyclothymic Disorder)等の気分の変調を伴う精神疾患に関して、症状の程度が軽度の段階では、患者の不調を、単に性格的な問題、単に怠けている、単に体調が悪い等、上記の精神疾患以外の問題として解釈される傾向にあり、患者自身も疾患に気付かない場合がある。
 また、たとえ患者が不調を自覚しても、精神疾患の偏見や、精神科・心療内科を受診すること対する抵抗感から、患者が医療ケアを受けない場合がある。更に、国・地域によっては、専門のカウンセラが少ない、専門のカウンセラに相談することが一般でないとの習慣を有すること等、社会的理由により、不調の回復手段としてソーシャルサービスが十分活用されないことにより、患者が不調を早期に自覚しても、不調が慢性化し、症状が重症化する場合がある。
 また、精神疾患には症状が共通しているため、疾患を特定し難い場合がある。例えば、アルツハイマー型認知症と前頭側頭型認知症、アルツハイマー型認知症とレビー小体型認知症、レビー小体型認知症とパーキンソン病、双極性障害と大うつ病は、それぞれの疾患の区別が困難である。
 また、患者が、認知症と老年性うつ病を併発することがある。また、患者が認知症の初期症状として抑うつ症状を示す場合も多い。一方、患者がうつ病性仮性認知症を有する場合には、患者は実際にはうつ病であるが、認知機能が低下するように症状が現れる。そのため、患者が認知症の類であるのか、うつ病の類であるのか、認知症とうつ病を合併していずれかの症状が有意に表れているのか、判別することは重要な課題である。何故なら、例えば患者がうつ病性仮性認知症の場合に、患者がうつ病の処置を受ければ認知機能も回復するが、患者が認知症の処理を受けても、回復しないか、或いは症状が悪化するためである。
 本発明は、このような状況を鑑みてなされたものであり、被験者が発話する音声を解析することにより認知症であることを判別・推定することができる精神・神経系疾患の推定システム、推定プログラムおよび推定方法を提供することを目的とする。
 また、本発明の別の目的は、被験者が発話する音声を解析することにより、双極性障害、大うつ病などの、気分の変調を伴う精神疾患を判別・推定することができる精神・神経系疾患の推定システム、推定プログラムおよび推定方法を提供することである。
 また、本発明の別の目的は、症状の非常に似通った精神疾患どうしを判別可能とすることにより、誤診を低減し、判別の早期化、的確化を図り、適切な治療を行うことを可能にする精神・神経系疾患の推定システム、推定プログラムおよび推定方法を提供することである。
 さらに、本発明の別の目的は、操作が簡便で、特別な環境が無くても計測可能であり、且つ患者の負担が小さく、短時間の計測で、精神・神経系疾患を推定することができる精神・神経系疾患の推定システム、推定プログラムおよび推定方法を提供することである。
 さらに、本発明の別の目的は、患者と医師とが物理的に離れていても、計測可能であり、精神・神経系疾患を推定することができる精神・神経系疾患の推定システム、推定プログラムおよび推定方法を提供することである。
 上記課題を解決するために、本発明は、精神・神経系疾患の推定システムであって、被験者の音声データを取得する取得部と、音声データをサーバに送信する第1送信部を備える、少なくとも1つの音声の入力部と、サーバにおいて推定された結果のデータを受信する第1の受信部と、データを表示する出力部を備える、結果の表示部と、第1送信部から音声データを受信する第2受信部と、被験者の音声データから抽出された少なくとも1つの音響特徴量の組合せに基づき、疾患の予測値を算出する算出部と、被験者の疾患を推定する推定部と、推定された結果のデータを表示部へ送信する第2送信部を備える、サーバを備え、サーバが、推定プログラムを実行するための演算処理装置と、推定プログラムを記録した記録装置を備え、推定プログラムにより、推定部が疾患の予測値を入力として、複数の疾患からなる群から選択される被験者の疾患を推定することを特徴とする。
 本発明によれば、被験者が発話する音声を推定し、被験者が患っている病気を判別・推定し、病気の重症化を予防し、また病気の的確な判別に基づいて患者が適切な治療をうけることを可能にする推定システム、推定プログラムおよび推定方法を提供することができる。
本願発明の構成図である。 本願発明の構成図である。 本願発明のフローチャートである。 スコアリングの一例を示す図である。 疾患の予測値の疾患別分布を示す概念図である。 本願発明の推定の精度を示すROC曲線である。 本願発明の推定の精度を示すROC曲線である。 第2の音響パラメータの説明図である。 本願発明の回帰分析の図である。 本願発明の回帰分析の図である。 本願発明のゼロ点交差率ZCRおよびハースト指数Hの分布の一例を示す図である。 本願発明のパーキンソン病指標を示す図である。 本願発明の各疾患の音声データをプロットした図である。
(実施形態)
以下、本発明を実施するための形態について図面などを参照して説明する。
 図1は、本願発明の推定システム100の構成図を示す。図1の推定システム100は、被験者の音声を取得するための入力部110と、被験者へ推定結果等を表示するための表示部130とおよびサーバ120を備える。サーバ120は、演算処理装置120A(CPU)と、演算処理装置120Aが処理を実行するための推定プログラムを記録したハードディスク等の第1の記録装置と、ならびに被験者の検診データおよび被験者へ送信するためのメッセージ集を記録したハードディスク等の第2の記録装置を備える。サーバ120は、有線または無線を介して入力部110および表示部130に接続される。演算処理装置120Aはハードウェアにより実現されてもよい。
 入力部110は、マイクロホン等の音声の取得部111と、取得した音声データをサーバ120へ送信する第1送信部112を備える。取得部111は、被験者の音声をアナログ信号からデジタル信号の音声データを生成する。音声データは第1送信部112からサーバ120へ送信される。
 入力部110は、マイクロホン等の音声の取得部111を介して被験者が発話する音声信号を取得し、音声信号を所定のサンプリング周波数(例えば、11025ヘルツ等)でサンプリングすることでデジタル信号の音声データを生成する。
 入力部110は、音声データを記録する記録部をサーバ120側の記録装置とは別個に備えていてもよい。この場合、入力部110はポータブルレコーダでもよい。記録部は、CD、DVD、USBメモリ、SDカード、ミニディスク等の記録媒体でもよい。
 表示部130は、推定結果等のデータを受信する第1受信部131と、当該データを表示する出力部132とを備える。出力部132は、推定結果等のデータを表示するディスプレイである。ディスプレイは、有機EL(Organic Electro-Luminescence)や液晶等であってもよい。
 なお、入力部110は、後述する健康診断の結果のデータや、ストレスチェックに関する回答のデータを予め入力するために、タッチパネル等の機能を備えていてもよい。この場合、入力部110と表示部130の機能を有する同一のハードウェアにより実現されてもよい。
 演算処理装置120Aは、第1送信部112から送信された音声データを受信する第2受信部121と、被験者の音声データから抽出される音響特徴量に基づき疾患の予測値を算出する算出部122と、疾患の予測値を入力として、機械学習により学習された推定モデルを用いて被験者の疾患を推定する推定部123と、および推定結果に関するデータ等を表示部130へ送信する第2送信部124を備える。なお、算出部122と推定部123は機能を説明するために分けて記載したが、算出部と推定部の機能を同時に行ってもよい。なお、本明細書では「メンタル値」という用語を疾患の予測値と同義に用いている。
 図2は、本発明の推定システム100の別の構成図を示す。図2の推定システム100は、図1の推定システム100のサーバ120と入力部110または表示部130との接続を、ネットワークNWを介して行う。この場合、入力部110および表示部130は通信端末200である。通信端末200は、例えば、スマートフォン、タブレット型の端末、またはマイクロホンを備えるノートパソコンやデスクトップパソコン等である。
 ネットワークNWは、携帯電話通信網またはWi-Fi(Wireless Fidelity)(登録商標)等の通信規格に基づく無線LANを介して通信端末200とサーバ120を接続する。推定システム100は、ネットワークNWを介する複数の通信端末200とサーバ120を接続してもよい。
 推定システム100は、通信端末200により実現されてもよい。この場合、ネットワークNWを介してサーバ120に格納される推定プログラムがダウンロードされ、通信端末200の記録装置に記録される。通信端末200に含まれるCPUが、通信端末200の記録装置に記録されるアプリケーションを実行することにより、通信端末200が算出部122、推定部123として機能してもよい。推定プログラムは、DVD等の光ディスクやUSBメモリ等の可搬型記録媒体に記録して頒布されてもよい。
 (第1実施形態)
 図3は、図1に示した推定システム100の推定処理の一例を示す。図3に示す処理は、推定システム100の演算処理装置120Aが推定システム100の第1記録装置120Bに記録された推定プログラムを実行することにより実現される。図3を用いて、演算処理装置120Aの第2受信部121、算出部122、推定部123および第2送信部124の各機能についてそれぞれ説明する。
 (算出部122)
 処理を開始すると、ステップS101において、算出部122は取得部111に音声データが取得されたか否かを判定する。既に音声データが取得されている場合には、ステップS104へ進む。音声データが取得されていない場合には、ステップS102において、算出部122は表示部130の出力部132に所定の定型文を表示させるように命令する。
 本推定プログラムは被験者の発話の意味や内容によって精神・神経系疾患を推定するものではない。そのため、取得される音声データは、発話時間が15秒ないし300秒となるものであれば何でもよい。使用言語は、特に制限しないが、推定プログラムを作成する際に母集団が使用した言語と一致することが望ましい。従って、出力部132に表示される定型文は、母集団と同一の言語であって、発話時間が15秒ないし300秒になる定型文であれば何でもよい。好ましくは、発話時間が20秒ないし180秒になる定型文が望ましい。
 例えば、特定の感情を含まない“いろはにほへと”や“あいうえおかきくけこ”等でもよく、“あなたのお名前は”や“あなたの誕生日はいつですか”等の質問でもよい。
 音声の取得環境は、被験者の発話した音声のみを取得できる環境であれば特に制限はないが、40bB以下の環境で取得されることが好ましい。好ましくは、30dB以下の環境で取得されることが好ましい。
 被験者が定型文を読み上げると、ステップS103において、被験者の発話した音声から音声データが取得されてステップS104へ進む。
 次に、ステップS104において、算出部122は、音声データが第1送信部112を介して入力部110からサーバ120の第2受信部121へ送信されるように命令する。
 次に、ステップS105において、算出部122は、被験者の疾患の予測値が算出済みであるか否かを判定する。疾患の予測値とは、1つ以上の音響パラメータを抽出して生成する音響特徴量の組合せからなる特徴量F(a)であり、機械学習の推定アルゴリズムの入力に用いられる特定疾患の予測値である。音響パラメータは、音が伝わる際の特徴をパラメータ化したものである。疾患の予測値が既に算出されている場合は、ステップS107へ進む。疾患の予測値が算出されていない場合は、ステップS106において、算出部122が被験者の音声データと学習済みの推定プログラムに基づき、疾患の予測値を算出する。
 なお、以降のステップS107ないしステップS112は後の段落で詳述するが、ここで簡潔に説明する。ステップS107において、算出部122は予め取得された被験者の健診データを第2記録装置120Cから取得する。なお、ステップS107を省略して、健診データの取得を行わずに疾患の予測値から疾患を推定してもよい。
 次に、ステップS108において、推定部123は、算出部122で算出した疾患の予測値および/または健診データを基に疾患を推定する。
 疾患の予測値に関して、特定の疾患とその他を区別するための個々の閾値を設けることにより、疾患の予測値を算出した複数の患者を、特定すべき対象とその他に判別することができる。後述する実施形態では、閾値を超えた場合とそうでない場合とに分類して判定している。
 次に、ステップS109において、推定部123は疾患に対応する助言データが選択済みであるか否かを判定する。疾患に対応する助言データとは、被験者が助言データを受け取った際に疾患を予防または重症化を回避するための助言である。助言データが選択済みであれば、ステップS111へ進む。
 助言データが選択済み出ない場合、ステップS110において、第2の記録装置から被験者の症状に対応する助言データが選択される。
 次に、ステップS111において、推定部123は疾患の推定結果と選択された助言データを第2送信部124を介して表示部130の第1受信部131へ送信するように命令する。
 次に、ステップS112において、推定部123は表示部130の出力部132に対して推定結果と助言データを出力するように命令する。最後に、推定システム100は、推定処理を終了する。
(第2実施形態)
 本発明の推定プログラムは、遠隔地からの音声であっても解析することが可能であるから、オンライン診療やオンラインカウンセリングの場面で用いることができる。精神・神経系疾患を診断する場合、医師は問診や面談によって、患者の表情、動き、会話の状況などを観察する。しかし、患者は、精神・神経系疾患に対する偏見を感じることがあるため、精神科の病院やクリニックに行くことが躊躇われることがある。
 オンラインによる診療やカウンセリングは、施設に出向かなくとも医師やカウンセラと面談可能である。そのため、精神神経系疾患以外の他の病気と比して、精神・神経系疾患はオンライン診療に非常に親和性が高い。
 医師、カウンセラ、および臨床心理士は、オンラインで患者(またはクライアント)と面談する場合に、本推定プログラムによる解析を行うことができる。これにより、非常に簡便に精神・神経系疾患に罹患しているかどうか、またその疾患の種類について推定することができる。なお、面談時には、MMSEやBDI、PHQ-9等、各種心理テストや認知機能テストを併せて行うことができる。
 この場合、患者側に、音声を送信できるコンピュータハードウエアのほか、面談用のモニター画面、音声収録用のマイクが必要である。
 患者の自宅にこれらの装置がない場合は、例えば、かかりつけの医院などに装置を備えることができる。患者はかかりつけの病院に通って、そこで装置を通して面談することができる。
 また、例えば、患者が身体疾患の治療を目的としてかかりつけの病院に通う場合、かかりつけの医師が診断して精神・神経系疾患の疑いがあると判断すれば、その場で音声を取得して本発明のプログラムで解析することが可能である。
 その他の場所でも、精神科医、神経内科医がオンライン診療可能な状態であれば、かかりつけの医師と精神科医、神経内科医がオンライン上で連携して診断を行うことが可能である。
(第3実施形態)
 本発明の推定プログラムは、特定の疾患を推定するための感度を上げる(この場合、特異度は一般に下がる)ことにより、スクリーニング装置として利用することができる。
 会社や自治体などで行われている健康診断や、医療機関で行われている人間ドックなどの検査項目として利用することにより、これまで発見が困難で、簡便な検査法がなかった精神・神経科の疾患の早期発見に寄与することができる。
 例えば、眼底検査、視力検査、聴力検査などと同様に、一連の検査の一つとして音声の取得を行い、その場で、あるいは他の検査結果と一緒にプログラムによる推定結果を通知することができる。
(第4実施形態)
 本発明の推定プログラムは、特別な装置を必要としないので、手軽にだれでも利用できる。一方で、利用場面が精神・神経系疾患に限定されるので、必ずしも利用頻度が高いものではない。そこで、高価な検査装置を備えた専門病院に本発明の推定装置一式を備えておき、かかりつけ医などが、対象患者が来院した時に、その専門病院に検査を依頼することができる。
 精神・神経系疾患で使用される装置としては、光トポグラフィ、心筋シンチグラフィ、脳血流シンチグラフィ、CT、MRI、脳波等が挙げられる。これらは、疾患の推定や除外診断に用いられるが、本発明の推定装置は極めて侵襲性が低いので、これら検査と併せて、あるいはこれら検査に先駆けて用いることができる。
(第5実施形態)
 本発明の推定プログラムは、自宅でも簡便に利用できるので、診断後のモニタリング装置として利用することができる。例えば、気分障害群の疾患の場合、患者の疾患に応じて薬剤や心理療法が処置されるが、これら療法の効き具合を測定することができる。また、継続的に利用することにより、症状が安定しているか、再発の予兆が無いかなどを日々観察することができる。
(第6実施形態)
 本発明の推定プログラムは、発話による音声を解析するものであるので、高齢者の見守り装置としての適用が可能である。
 一人暮らしの高齢者が、元気に過ごしているかどうかは近親者にとって気になるところである。電話やビデオ電話等の通信手段を用いた高齢者見守りシステムに、本発明の推定プログラムを実装することにより、生活反応を見るだけでなく、認知症やうつの傾向がないかどうかも測定することができ、一人暮らしであっても適宜対処することが可能となる。
 これらさまざまな実施形態において、音声の取得方法としては特に制限はないが、(1)対象者のほうから、電話やインターネットを通じで録音した音声を送付する方法、(2)検査者のほうから対象者へ電話やインターネットを通じでコンタクトし、会話をすることにより音声を取得する方法、(3)対象者の住居に音声取得装置を備えておき、対象者がその装置に録音する方法、(4)音声取得装置が定期的に自動起動し、対象者へ会話を行うことにより、対象者の音声を取得する方法等が挙げられる。
 音声を取得するにあたって、対象者がスムーズに発話できるように、推定装置に備えられたディスプレイに発話すべき文章を表示するか、またはスピーカーから発話すべき文章の音を再生するのが好ましい。
 録音開始の機械音により録音が開始され、発話を終えたらスイッチにより録音を終了するなどして、文章毎に発話による音声を取得することができる。
(疾患の予測値の算出)
 本願発明における、疾患の予測値の算出の概略を説明する。図1の推定部123で推定処理を行う前処理として、算出部122で、被験者の音声データから、複数の音響パラメータを抽出する段階を経る。音響パラメータは、患者の音声データから抽出される。音響パラメータは、音が伝わる際の特徴をパラメータ化したものである。例えば、音響パラメータにはゼロ点交差率やハースト指数等がある。ゼロ点交差率は、音声の音圧の波形が基準圧力を横切る単位時間あたりの回数を、音声における波形の変化の激しさの度合いとして算出したものである。ハースト指数は、音声の波形における変化の相関性を示す。
 音響パラメータは、第1の音響パラメータと第2の音響パラメータからなる。第1の音響パラメータは、特定の疾患を推定すべき患者の音声から抽出した音響のパラメータである。第2の音響パラメータは、予めデータベース120Bに記録されている音響のパラメータである。第2の音響パラメータは、アルツハイマー型認知症、レビー小体型認知症、パーキンソン病、大うつ病、非定型うつ病、または双極性障害の疾患を有する患者の音声データから抽出を行い、各音響パラメータと各疾患が予め紐付けされている。
 本願発明で使用する音響パラメータには、以下のような項目がある。
1)           音量のエンベロープ(アタックタイム、ディケイタイム、サステインレベル、リリースタイム)
2)           波形の変動情報(Shimmer, Jitter)
3)           ゼロ点交差率
4)           ハースト指数
5)           VOT(Voice Onset Time)
6)           メル周波数ケプストラムのある係数に関する発話内分布の統計値(第1四分位点、中央値、第3四分位点、95パーセント点、算術平均、幾何平均、第3四分位点と中央値の差など)
7)           周波数スペクトラムの変化の速さにおける発話内分布の統計値(第1四分位点、中央値、第3四分位点、95パーセント点、算術平均、幾何平均、第3四分位点と中央値の差など)
8)           メル周波数ケプストラムのある係数の時間変化に関する発話内分布の統計値(第1四分位点、中央値、第3四分位点、95パーセント点、算術平均、幾何平均、第3四分位点と中央値の差など)
9)           メル周波数ケプストラムのある係数の時間変化の時間変化に関する発話内分布の統計値(第1四分位点、中央値、第3四分位点、95パーセント点、算術平均、幾何平均、第3四分位点と中央値の差など)
10)         周波数スペクトラム90%ロールオフの発話内時間変化における2次回帰近似に対する二乗誤差
11)         周波数スペクトラム重心の発話内時間変化における2次回帰近似に対する算術誤差
その他、ピッチレート、有声音である確率、任意範囲の周波数のパワー、音階、話速(一定時間におけるモーラ数)、ポーズ・間、音量などが挙げられる。
 推定プログラムは、人工知能による学習機能を有しその学習機能によって推定処理を行う。ニューラルネットワーク型のディープラーニングが利用されてもよいし、部分的に学習分野を強化する強化学習等が利用されてもよいし、その他、遺伝的アルゴリズム、クラスタ分析、自己組織化マップ、アンサンブル学習、等が利用されてもよい。もちろん、これら以外の人工知能に関する技術が利用されてもよい。アンサンブル学習においては、ブースティングと決定木を併用した手法により分類アルゴリズムを作成してもよい。
 推定プログラムの作成段階において、アルゴリズム作成者は、上記の第2の音響パラメータの項目の中から、変数f(n)として使用する任意の音響パラメータをより良い組合せとなるようにステップワイズ法により検討を行い、1つまたは複数選択する。次に、選択された任意の音響パラメータに対し係数を付し、1つまたは複数の音響特徴量を作成する。さらに、これらの音響特徴量を組合せて、特徴量F(a)を作成する。
 ステップワイズ法には変数増加法、変数減少法、変数増減法の3種類があるがいずれを用いてもよい。ステップワイズ法で用いられる回帰分析には、線形判別式やロジスティック回帰分析等の線形分類の処理が含まれる。変数f(n)およびそれらの係数、すなわち以下の式で示される式F(a)の係数xnは回帰係数と呼ばれ、関数f(n)に付与される重みである。
 回帰係数は、学習アルゴリズムの作成者が選択した後に、データベースに蓄積される疾患情報などから、推定精度を高めるための機械学習により品質の改善を行ってもよい。
 被験者の疾患の予測値は、例えば以下の式F(a)に基づいて1つ以上の音響特徴量から算出される。
Figure JPOXMLDOC01-appb-M000001
 ここで、f(n)は、上記の音響パラメータの項目(1)ないし(11)の中からいずれか1つ以上の第2の音響パラメータを任意に選択したものである。xnは疾患に固有の回帰係数である。f(n)、xnは、予め推定プログラムの記録装置120に記録されていてもよい。推定プログラムの機械学習の過程で特徴量F(a)の回帰係数を改善してもよい。
 図1の算出部122は、第2の音響パラメータの組合せに基づいて、健常者と疾患を有する被験者を区別する、あるいは疾患どうしを区別するための特徴量を算出する。この特徴量から、基準範囲と、基準範囲から被験者の値がどの程度離れているのかを算出するためのスコアリングを行うことにより、被験者の疾患の予測値を算出する。
 図4Aは、ある一つの音響特徴量の強度が、疾患毎に異なっていることを示すイメージ図である。被験者は疾患Aのスコアが最も高いことを示している。従って、被験者の疾患Aに対する予測値は、他の疾患群と比較して高く算出される。また、例えば、強度50を閾値と設定することにより、疾患A、疾患B、疾患Cの群と、疾患D、疾患Eの群とに分類できる。
 図4Aは、一つの音響特徴量の強度を基に疾患の予測値を算出しているが、実際は一つの音響特徴量のみで疾患を分類できることは困難である。そのため、いくつかの音響特徴量の組み合わせにより求められる特徴量F(a)を算出して、疾患を分類しても良い。
 この特徴量F(a)を基に、ラベル付けされた被験者の音声について疾患の予測値を計算し、疾患ごとの予測値の分布を求める。これにより、各疾患を分類することができる。
 図4Bは、ある3つの音響パラメータの組み合わせによって得られた疾患の予測値(図4B中では、「メンタル値」と記載している)の分布画像である。
 図4Bから、レビー小体型認知症の患者群の予測値の分布が、他の疾患の患者群及び健常者群の予測値の分布から分離できることがわかる。本願発明は、疾患ごとに、他の疾患と区別できるように音響パラメータの組み合わせを設定し、特徴量F(a)を計算し、特徴量F(a)を入力として、各対象者の音声がどの疾患に当てはまるかを判定することができる。
 別の手法としては、各患者の音声から、疾患毎の特徴量F(a)を抽出し、どの疾患の特徴量をより多く有しているかを求め、疾患の予測値を互いに比較することにより、患者が罹患している疾患と推定することができる。
 この場合、疾患の予測値は、その疾患に罹患している程度ととらえることができる。各疾患の予測値を比較、再計算することにより、どの疾患に罹患しているかを確率で表現することができる。
 このようにして、アルツハイマー型認知症、レビー小体型認知症、パーキンソン病、大うつ病、非定型うつ病、双極性障害の6疾患を含む患者の音声、および健常者の音声から、それぞれの疾患に関連する特徴量(a)を抽出し、それぞれの疾患の予測値を算出する。
 また、対象とする疾患に関して、更に血管性認知症、前頭側頭型認知症、気分循環症、気分変調症の4疾患を加えた10疾患を含む患者の音声から推定プログラムを作成してもよい。
 最終的には、判別対象者が発話した音声を解析することにより、上述の6疾患乃至10疾患のいずれかであるか、または健常であるかを推定する。
(推定プログラムの推定フロー)
 推定プログラムの推定フローに関して、上述したように、個別の疾患に対し、それぞれの疾患の特徴量(a)を抽出して疾患の予測値を算出してもよいが、まず、疾患群に関する音響特徴量の組合せを作成し、疾患群に関する特徴量F(a)を推定部への入力として用い、複数の段階に分けて入力・推定を行うことで、最終的に各疾患または健常の推定をしてもよい。
(推定フロー1)
 例えば、まず、第1ステップで、(1-A)アルツハイマー型認知症、レビー小体型認知症、パーキンソン病を含む認知症群、(1-B)大うつ病、非定型うつ病、双極性障害を含む気分障害群、(1-C)健常の3群に推定する。
 次に、第2ステップで、(1-A)認知症群にクラス分けされた患者の音声を、(1-A-1)アルツハイマー型認知症、(1-A-2)レビー小体型認知症、(1-A-3)パーキンソン病の3つの疾患のいずれであるかを推定するプログラムにより、認知症群の患者の疾患を推定する。一方、(1-B)気分障害群にクラス分けされた患者の音声は、(1-B-1)大うつ病、(1-B-2)非定型うつ病、(1-B-3)双極性障害の3つの疾患のいずれかであるかを推定するプログラムにより、気分障害群の患者の疾患を推定する。
(推定フロー2)
 別の判定フローの態様としては、まず、第1ステップで(2-A)アルツハイマー型認知症、レビー小体型認知症、パーキンソン病を含む認知症群、(2-B)大うつ病、非定型うつ病、双極性障害を含む気分障害群、(2-C)健常の3群に推定する。
 次に、第2ステップで、(2-A)認知症群にクラス分けされた患者の音声を、(2-A-1)レビー小体型認知症であるか、それ以外の認知症であるかを推定するプログラムによりレビー小体型認知症であるか否かを判定する。一方、(2-B)気分障害群にクラス分けされた患者の音声は、(2-B-1)大うつ病であるか、それ以外の気分障害であるかを推定するプログラムにより大うつ病であるか否かを判定する。
 そして、同様に、(2-A-2)アルツハイマー型認知症であるか、それ以外の認知症であるかを推定するプログラム、(2-A-3)パーキンソン病であるかそれ以外の認知症であるかを推定するプログラム、(2-B-2)非定型うつ病であるか、それ以外の気分障害であるかを推定するプログラム、(2-B-3)双極性障害であるか、それ以外の気分障害であるかを推定するプログラムを、用いることにより、最終的にアルツハイマー型認知症、レビー小体型認知症、パーキンソン病、大うつ病、非定型うつ病、双極性障害のいずれであるかを判定することができる。
(推定フロー3)
 また、別の実施態様としては、第2ステップにおいて、(3-A)認知症群にクラス分けされた患者の音声を、(3-A-1)アルツハイマー型認知症であるか、レビー小体型認知症であるかを推定するプログラム、(3-A-2)レビー小体型認知症であるか、パーキンソン病であるかを推定するプログラム、(3-A-3)パーキンソン病であるか、アルツハイマー型認知症であるかを推定するプログラムの3つの推定プログラムを合わせて用いることにより、認知症群にクラス分けされた患者の疾患を推定する。
 一方、(3-B)気分障害群にクラス分けされた患者の音声を、(3-B-1)大うつ病であるか非定型うつ病であるかを推定するプログラム、(3-B-2)非定型うつ病であるか双極性障害であるかを推定するプログラム、(3-B-3)双極性障害であるか大うつ病であるかを推定するプログラムの3つの推定プログラムを合わせて用いることにより、気分障害群にクラス分けされた患者の疾患を推定する。
(推定フロー4)
 また、上述した認知症群、気分障害群、健常の3クラスに分ける第1ステップは、まず(4-A)健常群と(4-B)それ以外の疾患群の2クラスに分別し、次に疾患群を(4-B-1)認知症群と(4-B-2)気分障害群に分別する2段階であってもよい。
(推定プログラム作成時に取得された音声の対象者)
 第2の音響パラメータの音声データの取得に関し説明する。音声を取得する対象者は以下の基準により選択されることが好ましい。
 (ア)取得された音声が疾患解析に用いられることに十分な説明を受け、対象者は文書による同意をする。
 (イ)本推定システムでは、言葉の意味または内容(テキスト)を基に疾患の推定解析を行わない。よって、基本的には国籍や母語に制限がない。しかし、人種間、言語間の差がある可能性はあるため、同じ人種と言語を比較対照として判定することが好ましい。例えば、利便性の観点から、日本で本発明を実施する場合は、母語が日本語である者から音声を取得して本推定プログラムを作成し、日本語の発話で疾患を推定することが好ましい。また、英語圏で本発明を実施する場合は、母語が英語である者から音声を取得して本推定プログラムを作成し、英語の発話で疾患を推定することが好ましい。
 (ウ)年齢は、発話可能である限り特に制限はない。ただし、声変わりや情緒的な安定性を考慮すると、15歳以上が好ましく、18歳以上が更に好ましく、20歳以上が特に好ましい、また、年齢による物理的な発話の困難さを考慮すると、100歳未満が好ましく、90歳未満が更に好ましい。
 (エ)日本で本発明を実施する場合は、音声を取得する際、日本語の文章の読み上げ(発話)ができる者が好ましい。但し、日本語以外の母語を有する者を推定する場合には、該当する母語の文章を読み上げることにより判別が可能である。
 (オ)推定アルゴリズムの作成に当たって、アルツハイマー型認知症、レビー小体型認知症、パーキンソン病、大うつ病、非定型うつ病、双極性障害の6疾患にそれぞれ該当する者を対象とした音声を用いることが好ましい。ただし、これらの疾患を併発している者を除く。これら6疾患に加え、血管性認知症、前頭側頭型認知症、気分変調症、気分循環性障害にそれぞれ該当するものを対象とした音声を用いることもできる。さらに、統合失調症、全般性不安障害、その他の精神神経疾患にそれぞれ該当する者を対象とした音声を用いることもできる。
 (カ)健常者は、認知症でも気分障害でもないことが確認された者が好ましい。
(音声を取得する手段)
 音声を取得する手段について説明する。
 (1)マイクは、音声を取得できるものであれば特に制限はない。例えば、ハンドマイク、ヘッドセット、携帯端末に内蔵されたマイク、パーソナルコンピュータやタブレット等に内蔵されたマイクから選択してもよい。対象者の音声のみを取得できるという観点からは、ピンマイク、指向性マイク、携帯端末に内蔵されたマイクが好ましい。
 (2)レコーダは、ポータブルレコーダ、パーソナルコンピュータ、タブレット、携帯端末に内蔵されたまたは外付けされた記録媒体を用いることができる。
 (3)疾患を推定する場合の発話内容に制限はない。例えば、対象者が自由に行った発話、対象者が予め用意された文章を読み上げた発話、電話または対面の会話による発話を用いることができる。ただし、推定アルゴリズムを作成する場合には、対象者に共通した発話内容を用いるのが好ましい。そのため、推定アルゴリズムを作成する場合には、対象者が予め用意された文章を読み上げた発話が好ましい。
 発話時間に関しては、短すぎると推定結果の精度が低くなる。好ましくは15秒以上、更に好ましくは20秒以上、特に好ましくは30秒以上である。また、必要以上に長すぎると結果を得るまでに時間がかかる。好ましくは5分以下、更に好ましくは3分以下、特に好ましくは2分以下である。
 (4)観察・検査項目に関して、特に制限はない。ただし、対象者のプロファイルの差によって音声に差があるかどうかを検証するため、情報を得ておくことが好ましい。情報には、一般情報として性別、年齢、身長、体重等が含まれ、医療情報として確定診断名、重症度、身体疾患の合併症、既往歴、発症時期等が含まれ、検査情報としてMRI、CT等、問診及び質問としてPatient Health Quastionnaire(PHQ)-9、The M.I.N.I-International Neuropsychiatric Interview (M.I.N.I.スクリーン)、Hamilton Depression Rating Scale (HAM-D または HDRS)、Young Mania Rating Scale (YMRS)、Mini-Mental State Examination (MMSE)、Bipolar Spectrum Diagnostic Scale (BSDS)、The Movement Disorder Society により改訂されたThe Unified Parkinson’s Disease Rating Scale (MDS-UPDRS)等が含まれる。
 (5)音声を取得する環境に関して、患者の発話のみを取得できる環境であれば特に制限はない。静音な環境、具体的には40dB以下が好ましく、30dB以下が更に好ましい。具体的には、診察室、カウンセリングルーム、会議室、聴力検査室、CT、MRI、X線等の検査室がある。また、対象者の自宅の静かな部屋で音声を取得してもよい。
 図5は、健常者または特定疾患と、それ以外の分離性能を示すROC曲線のグラフである。横軸が1-特異度を示し、縦軸が感度を示す。言い換えると、横軸が偽陽性率を示し、縦軸が真陽性率を示す。図5のROC曲線は、いずれも偽陽性立が低い時点で真陽性率が高い値を示した。
 また、AUC(Area under the ROC curve)はいずれも高く、ランダムに識別した場合と有意な差が確認できた。分離性能の検証が行われた疾患は、レビー小体型認知症、パーキンソン病、大うつ病である。それぞれのROC曲線におけるAUCは、レビー小体型認知症が0.794、パーキンソン病が0.771、大うつ病が0.869であった。なお、本願発明を用いて推定可能な疾患は上記のものに限定されない。AUCの結果から、疾患の推定精度が高いことが確認できる。
 前述のように作成された推定プログラムは、精神神経疾患に罹患していると疑われる者であっても、健常と推定される者であっても特に制限なく利用できる。使用場面も、医師による診察のツールとして、あるいは健康診断や人間ドックの検査項目として、対象者の音声を取得すれば簡便に利用可能である。
 音声取得回数に関して、1回あれば判別可能であるが、例えば、健常人でもライフイベントなどにより抑うつ状態を呈することがあり、たまたま音声取得の時に気分が落ち込んでいたということは大いにあり得る。また、大うつ病、非定型うつ病などは、朝と夜とで気分の良し悪しが変化することがある。従って、何らかの精神疾患に罹患しているとの推定結果が示された場合には、更に少なくとも1回、音声取得を行い再度推定するのが好ましい。
(音声以外の要素を合わせることによる疾患推定)
 音声以外の要素を合わせることによる疾患推定について説明する。本発明の精神・神経系疾患の推定システムは、被験者の音声のみで精神・神経疾患の種別を推定することが可能であるが、推定確度を更に増すために、音声以外の被験者が保有する要素を合わせて用いてもよい。
 これらの被験者が保有する要素としては、検診データ、ストレスに関するアンケート結果、認知機能テストの結果等が挙げられる。
 図3のステップS107において、算出部122は予め取得された被験者の健診データを第2記録装置120Cから取得する。健診データは、被験者が音声を入力の際、あるいは音声入力前に、健康診断の結果等を記録したデータである。健診データは、通信端末200等を介して問診形式で予め取得されてもよい。健診データには、体格指数、空腹時血糖、ヘモグロビンA1c、血圧、総コルステロール、LDLコルステロールおよび尿素窒素の各々が基準値より高いか否か、HDLコルステロールが基準値より低いか否か等の項目が含まれる。上記の項目に基づき被験者の身体的な健康値をフィジカル値として算出してもよい。
 また、精神・神経系疾患のバイオマーカとして、現時点で決め手になるものはないが、疾患毎にバイオマーカの探索が進められている。そこで、これらバイオマーカを測定し、その結果と本発明の音声による解析結果を併せることにより、より確実に疾患を推定できる。
 例えば、アルツハイマー型認知症のバイオマーカとしては、(1)脳脊髄液中のアミロイドベータ42(Aβ42)、(2)アミロイドPETイメージング、(3)脳脊髄液中のトータルτ蛋白またはリン酸化τ蛋白、(4)fMRI検査における側頭葉・頭頂葉の委縮等が挙げられる。
 レビー小体型認知症のバイオマーカとしては、(1)SPECT検査によるドーパミントランスポータの減少、(2)MIBG心筋シンチグラフィによるMIBGの集積低下、(3)睡眠ポリグラフ検査による筋活動低下を伴わないレム睡眠等が挙げられる。
 パーキンソン病のバイオマーカとしては、(1)SPECT検査によるドーパミントランスポータの減少、(2)MIBG心筋シンチグラフィによるMIBGの集積低下、(3)髄液中のαシヌクレインオリゴマーの増加等が挙げられる。
 血管性認知症のバイオマーカとしては、MRI画像によりラクナ梗塞、白質病変、脳出血、多発皮質梗塞、その他の欠陥性病変が挙げられる。
 一方で、大うつ病等気分障害のバイオマーカとしては、PEA(エタノールアミンリン酸)や、リボソーム遺伝子等、様々な研究が進められているものの未だ確立されていない。
 また、第2記録装置120Cは、健康データに加えて、ストレスに関するアンケートに対する被験者の回答を記載したストレスに関する回答データを記録する。算出部122は、回答データに対する採点の処理を実行して、回答データに基づき被験者においてストレスの影響を受けている度合いを示すストレス値を算出する。
 ストレスに関するアンケートは、例えば、職業性ストレス簡易調査票等のアンケートに応じて定義される採点の処理を、被験者の回答データに実行し、被験者が受けているストレスに関する情報を取得する。ストレスに関する情報には、例えば、対象者が受けるストレス強度の尺度、対象者の自覚症状の尺度、対象者のストレスに対する耐性の尺度、対象者のストレス状態からの回復性の尺度、および対象者に対する周囲のサポートの尺度の少なくとも1つが含まれる。
 対象者が受けているストレス強度の尺度は、対象者が質問に回答する時点で対象者が受けているストレスの強度を示す。ストレス強度の尺度は、例えば、職業性ストレス簡易調査票の場合、全57問のうち領域「A」に含まれる17問に対する回答から求められる。なお、ストレス強度の尺度は、職業性ストレス簡易調査票等のように職場における心理的な負担の原因だけでなく、私生活一般におけるストレス要因と合わせて求められてもよい。また、例えば、対人ストレスイベント尺度(橋本剛、“大学生における対人ストレスイベント分類の試み”、社会心理学研究、第13巻第1号、pp.64-75、1997)等を用いて、ストレス強度の尺度が求められてもよい。
 対象者の自覚症状の尺度は、対象者が回答している時点における心理状態を示すもので、例えば、職業性ストレス簡易調査票の場合、領域「B」に含まれる29問に対する回答から求められる。自覚症状の尺度は、心理的な負担による心身の自覚症状をチェックするものであり、ストレスを受けた結果の状態を表す。なお、自覚症状の原因となるストレスの要因は、仕事に限らない。
 また、自覚症状の尺度は、例えば、Beck Depression Inventory (BDI:Beck et al.、“An Inventory for measuring depression”、Arch. Gen. Psychiatry、Vol.4、pp.561-571、1961)や、Self-Rating Depression Scale(SDS:Zunk et al.、“Self-Rating Depression Scale in an Outpatient Further Validation of the SDS”、Arch. Gen. Psychiatry、Vol.13、pp.508-515、1965)、老年期うつ病評価尺度(GDS)、Self-Rating Questionnaire for Depression(SQR-D)、Hamilton Depression Rating Scale(HAM-D)、Patient Health Questionnaire-9(PHQ-9)等のうつ状態を測る尺度を用いて、求められてもよい。これらのテストは得点方式であり、それぞれのテストの得点により、正常、境界領域、うつ病の疑いなどの評価を行うことができる。また、あくまで抑うつ症状の評価であってこれだけでは疾患を判別することはできないが、本発明の推定システムによる疾患判定を補助することができる。
 例えば、BDIでは、63点満点であり、0~10点は正常範囲、11~16点はノイローゼ気味、軽いうつ状態。17~20点はうつ状態との境界、専門家の治療が必要。21~30点は中程度のうつ病、専門家の治療が必要。31~40点は重いうつ病、専門家の治療が必要。41点以上極度のうつ病、専門家の治療が必要、とされる。
 また、PHQ-9では、27点満点であり、うつ症状の程度としてそれぞれ、0~4点はなし、5~9点は軽度、10~14点は中等度、15~19点は中等度~重度、20~27点は重度であるとされる。
 対象者への周囲のサポートの尺度は、職場の上司や同僚、家族、友人、近隣の人々等、対象者と接する人による協力の体制の状況を示す。対象者への周囲のサポートの尺度は、例えば、職業性ストレス簡易調査票の場合、領域「C」に含まれる9問の回答から求められる。周囲のサポートの尺度は、周囲のサポートが大きくなるに従って、対象者が受けるストレスが緩和されやすいことを示し、対象者のストレス耐性が高まる。なお、周囲のサポートの尺度は、大学生用ソーシャルサポート尺度(片受靖、大貫尚子、“大学生用ソーシャルサポート尺度の作成と信頼性・妥当性の検討”、立正大学心理学研究年報、第5号、pp.37-46、2014)等を用いて求められてもよい。
 対象者のストレスに対する耐性の尺度は、同じ程度のストレスを受けた場合に、精神的な障害を招きやすいかどうかを示す尺度であり、例えば、職業性ストレス簡易調査票の場合、領域「A」から領域「C」の設問の一部の回答を用いて求められる。なお、ストレスの耐性の尺度を求めるにあたり、どの設問の回答を用いて求めるかについては、適宜決定されることが好ましい。すなわち、ストレスの耐性の尺度については、ストレス脆弱性モデルで説明されているように、同じストレスを受けても発症する人と発症しない人が存在し、対象者がストレスに対する脆弱性が大きければ(耐性が小さければ)、小さいストレスでも発症する可能性が高くなる。そこで、第2算出部260は、ストレスの負荷と同時に、対象者のストレス耐性を算出することにより、病気に罹る危険度をより正確に求めることができる。
 なお、ストレス耐性は、脆弱性(バルナラビリティ)と回復性(レジリエンス)との2つの要素を含み、2つの要素が互いに重なる部分もあると考えられている。ストレスの耐性の尺度を求めるにあたり、2つの要素のうち一方の要素が用いられてもよく、両方の要素が用いられてもよい。発症の過程では複数のリスク要因が関連することから、ストレスの耐性の尺度のうち、脆弱性の尺度を求めることについて、様々なリスク要因の観点から検討されている。例えば、脆弱性の尺度として、自己愛的脆弱性尺度短縮版(上地雄一郎、宮下一博、“対人恐怖傾向の要因としての自己愛的脆弱性,自己不一致,自尊感情の関連性”、パーソナリティ研究、第17巻、pp.280-291、2009)がある。また、別の脆弱性の尺度として、Rumination-Reflection Questionnaire  日本語版(高野慶輔、丹野義彦、“Rumination-Reflection Questionnaire  日本語版作成の試み”、パーソナリティ研究、第16巻、pp.259-261、2008)や、日本語版Brief Core Schema Scale(山内貴史、須藤杏寿、丹野義彦、“日本語版Brief Core Schema Scaleの信頼性・妥当性”、心理学研究、第79巻、pp.498-505、2009)等がある。
 また、レジリエンス(回復性)は、心理学においては通常ストレスに対する防衛因子を意味しており、ストレスへの抵抗力と病気に罹った場合の回復力を示す。レジリエンスには、生来備わっている資質的レジリエンスと、生まれた後に獲得される獲得的レジリエンスとがあると考えられている。レジリエンスの尺度については、例えば、二次元レジリエンス要因尺度(平野真理、“レジリエンスの資質的要因・獲得的要因の分類の試み”、パーソナリティ研究、第19巻、pp.94-106、2010)等がある。なお、資質的レジリエンスは、楽観性、統御力、社交性、行動力の4因子、獲得的レジリエンスは、問題解決志向、自己理解、他者心理の理解の3要因がそれぞれ下位尺度として捉えられている。レジリエンスも対象者により異なることから、ストレスの負荷と同時に対象者のレジリエンスを合わせて測ることにより、病気に罹る危険度をより正確に求めることができる。
 認知機能テストとしては、改訂長谷川式簡易知能評価スケール(HDS-R)、Mini‐Mental State Examination (MMSE)が一般に用いられている。これらのほか、Wechsler Memory Scale‐Revised (WMS‐R)、N式精神機能検査(N式)、国立精研式スクリーニング・テスト(国立精研式)、Montreal Cognitive Assessment(MoCA)、Dementia Assessment Sheet for Community‐based Integrated Care System-21 items(DASC-21)等を用いることもできる。これらのテストは得点方式であり、それぞれのテストの得点により、正常、境界領域、軽度認知症、重度認知症などの評価を行うことができる。また、あくまで認知機能の評価であって、これだけでは疾患を判別することはできないが、本発明の推定システムによる疾患判定を補助することができる。
 例えば、HDS-Rは30点満点であり、20点以下が認知症の疑いがあるとされ、その感度は93%、特異度は86%とされている。
 また、MMSEは30点満点であり、23点以下が認知症の疑いがあるとされ、その感度は81%、特異度は89%とされている。そして、27点以下は軽度認知症(MCI)が疑われる。
 (推定部について)
 図1の推定部123について図3のステップを参照しつつ説明する。ステップS108において、推定部123は算出部122で取得した疾患の予測値および/または健診データを基に、疾患を推定する。ステップS107において、算出部122がストレス値も算出した場合には、疾患の予測値、健診データ、フィジカル値、ストレス値を基に疾患を推定してもよい。
 次に、ステップS109において、推定部123は疾患に対応する助言データが選択済みであるか否かを判定する。疾患に対応する助言データとは、被験者が助言データを受け取った際に疾患を予防または重症化を回避するための助言である。助言データは、疾患ごとに作成されたものが第2記録装置120Cに記録されている。疾患に対応する助言データが選択済みである場合には、ステップS111へ進む。助言データが選択されていない場合には、ステップS110において、第2の記録装置から被験者の症状に対応する助言データが選択される。
 次に、ステップS111において、推定部123は疾患の推定結果と選択された助言データを第2送信部124を介して表示部130の第1受信部131へ送信するように命令する。
 次に、ステップS112において、推定部123は表示部130の出力部132に対して推定結果と助言データを出力するように命令する。
 最後に、推定システム100は、推定処理を終了する。推定システム100は、通信端末200から被験者の音声データを受信する度に、ステップS101ないしステップS112の処理を繰り返し実行する。
 以上の実施形態では、算出部122は、入力部110から取得した被験者の音声データを用いて、特徴量F(a)に基づき被験者の疾患の予測値を算出する。推定部123は、算出された被験者の疾患の予測値と、および/または第2記録装置120Cに記録される健診データに基づいて、被験者の健康状態または疾患を推定し、助言データと共に推定結果を被験者に示すことができる。
 以上に示す様に、図3に示すステップS101ないしステップS112を行うことにより、推定システム100は、被験者が発話する音声から被験者が患っている精神・神経系疾患を推定し、病気の重症化を予防し、また病気の的確な判別に基づいて患者が適切な治療をうけることを可能にする推定システム100、推定プログラムおよび推定方法を提供することができる。
 本発明の推定システム100の使用形態としては、医師、臨床心理士、看護師、検査技師、カウンセラその他本発明の装置を扱う人が、音声を取得する被験者と対面しながら使用する。処置室、カウンセリングルーム等の静かな環境が保たれた部屋においては、本発明の装置を扱う1人または複数人が音声を取得する被験者に対して、オープンな状態で直接音声取得の仕方を説明しながら使用する。また、聴力検査室、その他各種の検査室に音声を取得する被験者が入り、前述の取扱者が、ガラス越しに、またはモニターの映像により被験者を見ながら、使用する。被験者が自宅など遠隔地にいる場合に、予め音声取得の方法を被験者に説明しておき、指定された日時までに被験者自身で録音を行う、などの方法がある。遠隔地で行う場合には、別途通信回線を利用してカメラ映像等で本人を確認しながら音声を取得することも可能である。
 また、被験者が医療機関やカウンセリングルームへ通った際に音声を取得し推定することもでき、また、企業や自治体の健康診断や、人間ドックの一検査項目として音声を取得し推定することもできる。
(複数の疾患と音声データとの関連付け作業-音声取得)
 推定プログラム作成時の手順を記載する。
 複数の疾患と音声データとの付け作業を行うため、平成29年12月25日から平成30年5月30日の間に、以下の患者及び健常者の音声を取得した。
・アルツハイマー型認知症患者の音声 20例
・レビー小体型認知症患者の音声 20例
・パーキンソン病の患者の音声 20例
・大うつ病患者の音声 20例
・双極性障害患者の音声 16例
・非定型うつ病患者の音声 19例
・健常者の音声 20例
 なお、これら患者は精神科、神経内科等、専門分野の医師により、DSM-5またはICD-10の基準によりそれぞれの疾患と認められた患者である。また、PHQ-9、MMSE等を行うことにより、他の精神・神経系疾患を合併していないことを医師が確認した。
 健常者は、PHQ-9、MMSE等を行うことにより、抑うつ症状や認知機能の低下が認められないことを確認した。
 音声取得には、オリンパス製ピンマイク、ローランド製ポータブルレコーダを用いた。音声データはSDカードに記録した。
 発話内容は、下記の表1に示す17の文章を被験者が、1~13まではそれぞれ2回ずつ、14~17までは1回ずつ読み上げた。
Figure JPOXMLDOC01-appb-T000002
 音声を取得するに当たって、被験者には、精神神経系の病気の患者の声と病気との関係性を解析する研究に用いること、発話の内容、音声取得の方法を説明し、書面による同意書にサインしていただいた。また、音声を含む取得したデータは、個人を特定できない形式に記号化して管理した。
 (推定プログラム1の作成)
 被験者1人に付き、上記17種類の発話内容のうち、1~13までの発話(各2回で1例あたり26発話)、14~17までの発話(各1回で1例あたり4発話)の合計30発話について、長いものは2つに分解し、また不鮮明なものは除外することにより、アルツハイマー型認知症患者の発話を613個、レビー小体型認知症患者の発話を573個、パーキンソン病患者の発話を608個、大うつ病患者の発話を619個、双極性障害患者の発話を484個、非定型うつ病患者の発話を573個、健常者の発話を615個の合計4186個の発話が得られた。
 これら各発話について複数の音響パラメータを抽出し、その頻度、強度等、音響パラメータの特徴と当該被験者の疾患とを関連付けることにより、上記の6疾患と健常者の7種とそれに関連づけられた複数の音響パラメータを得た。各疾患に対して、複数の音響パラメータの組合せの取捨選択により複数の音響特徴量の抽出を行った。さらに、それらを組合わせて6疾患のいずれか、または健常者であるかを推定するための特徴量F(a)に基づく推定プログラム1を作成した。
 なお、本発明の疾患推定システムに用いられる疾患推定プログラムは、音響特徴量に関し発話する言葉の内容を解析するのではない。本推定プログラムは、発話から音響特徴量を抽出して作成した特徴量から疾患の予測値を算出する。そのため、言語に依らないという利点がある。しかし、実際に対象者や被験者が発話する場合は、母国語の文章でないと流暢に話すことできないことで音響特性に影響する可能性がある。従って、例えば英語が母国語である対象者の疾患を推定する場合、まず英語を母国語とする患者及び健常者の声を収集し、解析して英語用の推定プログラムを作成し、これを用いて英語の発話により疾患を推定することが好ましい。同様にして、日本語、英語以外の言語用の推定プログラムを作成することができる。
 英語用の推定プログラムを作成し、またそれにより疾患を推定する場合において、被験者や対象者が読む文章としては、例えば、以下に示す英語の文章が挙げられる。
 例えば、英語の文章としては、以下のようなものが例示できる。
(1)A,B,C,D,E,F,G
(2)Prevention is better than cure.
(3)Time and tide wait for no man.
(4)Seeing is believing.
(5)A rolling stone gathers no moss.
(6)One, Two, Three, Four, Five, Six, Seven, Eight
 どの言語であっても、発話する文章に特に制限はないが、誰でも読みやすいという観点から、よく知られた文章であることが好ましい。また、「あーーー」、「えーーー」、「うーーー」などの長母音は、どの言語が母国語であっても誰でも発音可能であるという点で好ましい。
 発話による音声から音響特徴量を抽出する方法としては、市販の特徴量抽出プログラムを用いることができる。具体的には例えば、openSMILE等が挙げられる。
 このような音響特徴量抽出プログラムにより多くの発話(1フレーズ)から数多くの音響特徴量を抽出することができるが、本発明においては、ベースとして7440個の音響特徴量を用いた。
 其々の推定プログラムの作成にあたっては、7440個の音響特徴量から、疾患を判定するために好適な音響特徴量をいくつか選定し、それらを組み合わせて、各患者が区別できるように、疾患毎の疾患の予測値を算出するための計算式を設定する。
 従って、どのような判別を行うかによって(即ち、それぞれの推定プログラムによって)用いる音響特徴量の数や組み合わせが異なる。
(推定プログラム1に基づく推定結果)
 推定プログラム1では、健常者、レビー小体型認知症、アルツハイマー型認知症、パーキンソン病、大うつ病、双極性障害、非定型うつ病のそれぞれに関し、音響特徴量を取捨選択し、健常者、疾患毎の疾患の予測値をそれぞれ算出した。
 健常者が発した615個の発話については、健常者と推定したものが383個、レビー小体型認知症と推定したものが246個、アルツハイマー型認知症と推定したものが72個、パーキンソン病と推定したものが51個、大うつ病と推定したものが18個、双極性障害と推定したものが30個、非定型うつ病と推定したものが15個であった。従って、実際に健常者の発話のうち、健常者のものと推定した割合(感度、再現率:Recall)は、62.3%であった。
 また、健常者の発話と推定された600個の発話については、実際に健常者のものが383個、実際にはレビー小体型認知症のものが38個、アルツハイマー型認知症のものが67個、パーキンソン病のものが45個、大うつ病のものが32個、双極性障害のものが28個、非定型うつ病のものが7個であった。従って、健常者のものと推定された発話の内、実際にも健常者のものの割合(精度、適合率:Precision)は、63.8%であった。
 また大うつ病の患者が発した940個の発話については、健常者と推定したものが46個、レビー小体型認知症と推定したものが43個、アルツハイマー型認知症と推定したものが24個、パーキンソン病と推定したものが15個、大うつ病と推定したものが748個、双極性障害と推定したものが38個、非定型うつ病と推定したものが26個であった。従って、実際に大うつ病患者の発話のうち、大うつ病患者のものと推定した割合(感度、再現率)は、79.6%であった。
 また、大うつ病患者の発話と推定された923個の発話については、実際に大うつ病患者のものが748個、実際にはレビー小体型認知症のものが29個、アルツハイマー型認知症のものが8個、パーキンソン病のものが33個、健常者のものが37個、双極性障害のものが33個、非定型うつ病のものが35個であった。従って、大うつ病患者のものと推定された発話の内、実際にも大うつ病患者のものの割合(精度、適合率)は、81.0%であった。
 またレビー小体型認知症の患者が発した589個の発話については、健常者と推定したものが41個、レビー小体型認知症と推定したものが347個、アルツハイマー型認知症と推定したものが67個、パーキンソン病と推定したものが61個、大うつ病と推定したものが29個、双極性障害と推定したものが24個、非定型うつ病と推定したものが20個であった。従って、実際にレビー小体型認知症患者の発話のうち、レビー小体型認知症患者のものと推定した割合(感度、再現率)は、58.8%であった。
 また、レビー小体型認知症の患者の発話と推定された602個の発話については、実際
にレビー小体型認知症患者のものが347個、実際には大うつ病患者のものが46個、ア
ルツハイマー型認知症のものが73個、パーキンソン病のものが68個、健常者のものが
32個、双極性障害のものが25個、非定型うつ病のものが14個であった。従って、レビー小体型認知症患者のものと推定された発話の内、実際にもレビー小体型認知症大うつ病患者のものの割合(精度、適合率)は、57.6%であった。
 これらの結果から、各疾患について、健常者及びその他の疾患との推定の程度を示すAUC曲線が得られた。図5に示す通り、各精神疾患の推定の程度はAUCがいずれも0.8程度であり、精度が高いことが解る。
 (推定プログラム1-2の作成)
 推定プログラム1-2は、互いに症状が類似しているアルツハイマー型認知症、レビー小体型認知症、パーキンソン病、大うつ病、非定型うつ病、双極性障害を少なくとも含む精神・神経系疾患のうち、大うつ病を抽出して推定するものである。
 解析に使用した発話の種類は、前記推定プログラム1と同様に17種類の発話(フレーズ)である。
 まず、発話フレーズ毎に、音響特徴量を抽出するソフトウエアであるopenSMILEを用いて、それぞれ7440個の音響特徴量を抽出した。音声を取得した施設により有意差のあるデータを除外し、1547個のデータの特徴量を用いてブースティングと決定木を併用した手法により分類アルゴリズムを作成し、大うつ病とその他の疾患を判別するための疾患の予測値を生成した。
 なお、大うつ病以外の5つの患者による発話フレーズは2236個を用い、一方で大うつ病患者の発話は940個であったので、データ数の不均衡を避けるため、Synthetic Minority Over-sampling Technique(SMOTE)の手法を用いて大うつ病患者の発話の疑似データを作成し、大うつ病患者の発話フレーズを3139個とした。
 データを10分割し、推定プログラム1-2の分類アルゴリズムの10回交差検証を行った。
 (推定プログラム1-2に基づく推定結果)
 推定プログラム1-2に基づく推定結果を表2に示す。推定プログラム1-2を用いて、大うつ病と他の精神・神経系疾患を区別する場合において、大うつ病から見た再現率はは91.1%、他の精神・神経系疾患から見た再現率は93.8%、正答率は92.7%であった。また、AUCは0.977であった。
Figure JPOXMLDOC01-appb-T000003
 
(推定プログラム1-2の応用例/推定プログラム1-2-2)
 推定プログラム1-2-2は、大うつ病と他の精神・神経系疾患とを判別することができるので、実際の臨床場面においては、大うつ病と症状が似ている他の疾患とを判別することができる。具体的には例えば、大うつ病と双極性障害のいずれであるかを判別すること、あるいは、大うつ病と非定型うつ病のいずれであるかを判別することに用いることができる。
 (推定プログラム1-3の作成)
 推定プログラム1-3は、互いに症状が類似しているアルツハイマー型認知症、レビー小体型認知症、パーキンソン病、大うつ病、非定型うつ病、双極性障害を少なくとも含む精神・神経系疾患のうち、レビー小体型認知症を抽出して推定するものである。解析に使用した発話の種類は、前記推定プログラム1と同様に17種類の発話(フレーズ)である。
 まず、発話フレーズ毎に、音響特徴量を抽出するソフトウエアであるopenSMILEを用いて、それぞれ7440個の音響特徴量を抽出した。音声を取得した施設により有意差のある特徴量を除外し、1547個の特徴量を用いてブースティングと決定木を併用した手法により分類アルゴリズムを作成し、レビー小体型認知症とその他の疾患を判別するための疾患の予測値を生成した。
 なお、レビー小体型認知症以外の5つの患者による発話フレーズは2987個を用い、一方でレビー小体型認知症患者の発話は583個であったので、データ数の不均衡を避けるため、Synthetic Minority Over-sampling Technique(SMOTE)の手法を用いてレビー小体型認知症患者の発話の疑似データを作成し、レビー小体型認知症患者の発話フレーズを2696個とした。
 データを10分割し、推定プログラム1-3の分類アルゴリズムの10回交差検証を行った。
 (推定プログラム1-3に基づく推定結果)
 推定プログラム1-3に基づく推定結果を表3に示す。推定プログラム1-3を用いて、レビー小体型認知症と他の精神・神経系疾患を区別する場合において、レビー小体型認知症から見た再現率は88.6%、他の精神・神経系疾患から見た再現率は89.8%、正答率は89.2%であった。また、AUCは0.959であった。
Figure JPOXMLDOC01-appb-T000004
(推定プログラム1-3の応用例/推定プログラム1-3-2)
 推定プログラム1-3-2は、レビー小体型認知症と他の精神・神経系疾患とを判別することができるので、実際の臨床場面においては、レビー小体型認知症と症状が似ている他の疾患とを判別することができる。具体的には例えば、レビー小体型認知症とアルツハイマー型認知症のいずれであるかを判別すること、あるいは、レビー小体型認知症とパーキンソン病のいずれであるかを判別することに用いることができる。
 (推定プログラム2の作成)
 推定プログラム1では、まず疾患ごとに関連付けられた音響パラメータを選択し、次いで、それらの音響パラメータを組合せて特徴量を生成し、推定プログラムを作成した。推定プログラム2では、まず対象となる疾患を2つ選択し、これら2つの疾患を区別する音響パラメータの組合せを作成し、2つの疾患を区別する音響パラメータの組合せと、その確度の優劣を算出することにより疾患を推定するプログラムを作成した。
 推定プログラム2では、アルツハイマー型認知症、レビー小体型認知症、パーキンソン病、双極性障害、非定型うつ病または大うつ病を含む6種の疾患および健常の中から2つを選び、そのいずれに近いかを推定し、2つの組み合わせをそれぞれ行うことにより、最も可能性の高い疾患(または健常)を推定する。
 例えば、アルツハイマー型認知症とレビー小体型認知症のいずれか、レビー小体型認知症とパーキンソン病のいずれか、もしくは大うつ病と双極性障害のいずれか、またはそれらの疾患と健常のいずれかを推定する場合を説明する。ここで、レビー小体型認知症と健常者のいずれであるかを推定するには、例えばA、B、Cというパラメータを用いればよい。一方、アルツハイマー型認知症とレビー小体型認知症のいずれであるかを推定するにはD、E、Fのパラメータを用いた方が良いというように、2つの組み合わせの何れかを推定するには最も有効なパラメータが異なる可能性がある。
 その場合でも、2つの組み合わせにおいて、確度の優劣を算出することにより、6種の疾患及び健常の確度の順位をつけることができる。そして順位の1位と2位との差が一定以上大きければ、順位第一位の疾患に罹っていることが判別・推定できる。また、順位の1位と2位との差が大きくない場合には、その2疾患について罹患している確率で表すことができる。
 このようにして、アルツハイマー型認知症とレビー小体型認知症のいずれか、レビー小体型認知症とパーキンソン病のいずれか、もしくは大うつ病と双極性障害のいずれの疾患である確率が高いか、または健常であるかを推定することができる。
(推定プログラム2-1の作成)
 表4に示した通り、数か所の病院から健常者及びアルツハイマー型認知症の患者の音声を取得した。
 被験者1人に付き、上記表1に記載した17種類の発話内容のうち、1~13までの発話(各2回で1例あたり26発話)の発話(各1回で1例あたり4発話)の合計30発話について、不鮮明なものは除外することにより、アルツハイマー型認知症患者の発話を737個、健常者の発話を1287個取得した。
Figure JPOXMLDOC01-appb-T000005
 各患者の発話について、音響特徴量を抽出するソフトウエアであるopenSMILEを用いて、それぞれ7440個の音響特徴量を抽出した。
 音響特徴量の例としては、(1)フレーム単位で算出される物理的特徴量をそれに類する特徴量として、フーリエ変換、メル周波数ケプストラム係数、有声音確率、ゼロ交差率、基本周波数(F0)等、(2)前記(1)の時間方向の処理として、移動平均、時間変化等、(3)前記(2)の同一ファイル内フレームを対象とした統計的数量として、平均、最大、最少、重心、四分位点、分散、尖度、歪度等が挙げられる。
 7440個の音響特徴量のうち、まず録音環境に依存することが懸念される特徴量を除外し、197個の音響特徴量を選定した。
 この197個の音響特徴量を用い、健常者とアルツハイマー型認知症患者を判別するため、J48決定木アルゴリズム(C4.5のWeka実装)を使用し、学習には3病院で取得した音声を,検証には別の3病院で取得した音声を用いた。
(推定プログラム2-1に基づく推定結果)
結果1:発話ごとの分類性能
 発話毎に推定プログラムを用いて、その発話がアルツハイマー型認知症の患者のものであるか、健常者のものであるかを推定した。結果を表5に示す。
Figure JPOXMLDOC01-appb-T000006
結果2:被験者毎の分類性能
 被験者毎の発話(それぞれ概ね30個)について、その発話がアルツハイマー型認知症と推定されたか、健常者と推定されたかを数え、多数決で決の多いほうを推定プログラムによる推定結果とした。結果を表6に示す。
Figure JPOXMLDOC01-appb-T000007
(推定ブログラム2-2の作成)
 パーキンソン病及びレビー小体型認知症の患者からそれぞれ“あー”という3秒間の発話各20個(各20名分)を得た。これら発話について特徴的な音響パラメータを抽出し、その頻度、強度等、音響パラメータの特徴と当該被験者の疾患とを関連付けることにより、パーキンソン病とレビー小体型認知症患者の各発話に関連づけられた各種の音響パラメータ群が得られた。パーキンソン病及びレビー小体型認知症を判別するための特徴的な音響パラメータを選択し、さらに選択された音響パラメータを2個組合せることにより、パーキンソン病又はレビー小体型認知症のいずれであるかを推定するための特徴量に基づく推定プログラム2-2を作成した。
 なお、推定プログラム作成に際しては、発話を10分割-交差検証を行った。
(推定プログラム2-2に基づく推定結果)
 パーキンソン病患者の“あー”という発話20個(20人分)と、レビー小体型認知症患者の“あー”という発話20個(20人分)について、推定プログラム2-2によりパーキンソン病であるかレビー小体型認知症であるか推定した。
 その結果、パーキンソン病患者の20個の発話のうち、パーキンソン病と推定されたものが17個、レビー小体型認知症であると推定されたものが3個であった。また、レビー小体型認知症患者の20個の発話のうち、レビー小体型認知症と推定されたものが18個、パーキンソン病と推定されたものが2個であった。
 従って、推定プログラム2-2の正答率(Accuracy)は87.5%であった。また、レビー小体型認知症については再現率(Recall)は90%、適合率(Precision)は85.7%であった。またパーキンソン病については再現率(Recall)は85%、適合率(Precision)は89,5%であった。
(推定プログラム2-3)
 推定プログラム2-1の場合と同様の手法を用いて、レビー小体型認知症であるか健常であるかを推定する推定プログラム2-3を作成した。
 健常者の“あー”という発話19個(19人分)と、レビー小体型認知症患者の“あー”という発話20個(20人分)について、推定プログラム2-3により健常であるかレビー小体型認知症であるか推定した。
 その結果、健常者の19個の発話のうち、健常と推定されたものは19個、レビー小体型認知症であると推定されたものは0個であった。また、レビー小体型認知症患者の20個の発話のうち、レビー小体型認知症と推定されたものは17個、健常と推定されたものは3個であった。
 従って、推定プログラム2-3の正答率(Accuracy)は92.3%であった。また、レビー小体型認知症の感度(Sensitivity)は85%、特異度(Specificity)は100%、陽性適合率(Positive Precision)は100%、陰性適合率(Negative Precision)は86.4%であった。
(推定プログラム2-4)
 推定プログラム2-1の場合と同様の手法を用いて、健常であるか大うつ病であるかを推定する推定プログラム2-4を作成した。
 健常者の“あー”という発話19個(19人分)と、大うつ病患者の“あー”という発話18個(18人分)について、推定プログラム2-4により健常であるか大うつ病であるか推定した。
 その結果、健常者の19個の発話のうち、健常と推定されたものは17個、大うつ病であると推定されたものは2個であった。また、大うつ病患者の18個の発話のうち、大うつ病と推定されたものは17個、健常と推定されたものは1個であった。
 従って、推定プログラム2-4の正答率(Accuracy)は91.9%であった。
また、大うつ病の感度(Sensitivity)は94.4%、特異度(Specificity)は89.5%、陽性適合率(Positive Precision)は89.5%、陰性適合率(Negative Precision)は94.4%であった。
(推定プログラム2-5)
 推定プログラム2-5は、健常者と大うつ病患者を判別するプログラムである。
 まず、健常者20名、大うつ病患者20名による発話フレーズ(各人それぞれ約30発話)毎に、音響特徴量を抽出するソフトウエアであるopenSMILEを用いて、7440個の音響特徴量を抽出した。音声を取得した施設により有意差のある特徴量を除外し、1547個の特徴量を選定した。そして、ブースティングと決定木を併用した手法により、特徴量から、健常者と大うつ病とを判別するための疾患の予測値を生成し、分類アルゴリズムを作成した。各フレーズ毎の推定結果を表7に示す。
 推定プログラム2-5における大うつ病の判定は、感度81.4%、特異度85.5%、正答率83.5%であった。
Figure JPOXMLDOC01-appb-T000008
 推定プログラム2-5に基づき、各フレーズに対して大うつ病または健常のいずれかと判定したものを、各人ごとに纏めた結果を表8に示す。更に、各人ごとの健常判定率を求め、健常判定率が60%以上の者を健常者と推定し、健常判定率が60%未満の者を大うつ病患者と推定した。その結果、表9に示す通り、20人の健常者はすべて健常者と推定され、20人の大うつ病患者はすべて大うつ病患者と推定された。即ち、特異度、感度、正答率とも100%であった。
Figure JPOXMLDOC01-appb-T000009
Figure JPOXMLDOC01-appb-I000010
Figure JPOXMLDOC01-appb-T000011
 このことから、推定プログラム1-2と、推定プログラム2-5を併用することにより、アルツハイマー型認知症、レビー小体型認知症、パーキンソン病、大うつ病、非定型うつ病、双極性障害の各患者及び健常者の中から、大うつ病を高い判定確率で推定できる。
(推定プログラム2-6)
 推定プログラム2-6は、健常者とレビー小体型認知症患者を判別するプログラムである。音声として、健常者20名、レビー小体型認知症患者20名の発話フレーズを用いた以外は、推定プログラム2-5と同様の手順により、分類アルゴリズムを作成した。各フレーズ毎の推定結果を表10に示す。
 推定プログラム2-6におけるレビー小体型認知症の判定は、感度81.5%、特異度83.1%、正答率82.2%であった。
Figure JPOXMLDOC01-appb-T000012
 推定プログラム2-6に基づき、各フレーズに対してレビー小体型認知症または健常のいずれかを推定したものを、各人ごとに纏めた結果を表11に示す。更に、各人の健常判定率を求め、健常判定率が60%以上の者を健常者と推定し、健常判定率が60%未満のものをレビー小体型認知症の患者と推定した。その結果、表12に示す通り、20人の健常者はすべて健常と推定され、20人のレビー小体型認知症患者は19人がレビー小体型認知症と推定され、1人が健常者と推定された。即ち、特異度は100%、感度は95%、正答率は97.5%であった。
Figure JPOXMLDOC01-appb-T000013
Figure JPOXMLDOC01-appb-I000014
Figure JPOXMLDOC01-appb-T000015
 このことから、推定プログラム1-3と推定プログラム2-6を併用することにより、アルツハイマー型認知症、レビー小体型認知症、パーキンソン病、大うつ病、非定型うつ病、双極性障害の各患者及び健常者の中から、レビー小体型認知症を高い判定確率で推定できる。
 更に、推定プログラム2-5や推定プログラム2-6と同様にして、特定の疾患と、その他の5疾患とを分類する推定プログラムと、その特定の疾患と健常者とを分類する推定プログラムを組み合わせることにより、アルツハイマー型認知症、レビー小体型認知症、パーキンソン病、大うつ病、非定型うつ病、双極性障害の各患者及び健常者とを高い判定確率で推定することができる。
 (推定プログラム2-7)
 推定プログラム2-7は、健常者と大うつ病患者とレビー小体型認知症患者のいずれであるかを推定するプログラムである。
 音声として、健常者20名、大うつ病患者20名、レビー小体型認知症患者20名の発話フレーズを用いた以外は推定プログラム2-5と同様の手順で分類アルゴリズムを作成した。フレーズ毎の推定結果を表13に示す。
 特異度は67.8%、レビー小体型認知症の感度は70.3%、大うつ病の感度は69.5%、正答率は69.2%であった。
Figure JPOXMLDOC01-appb-T000016
 (推定プログラム3の作成)
 各被験者の発話について、発話毎の推定を行い、そのうち最も多かった推定の疾患(または健常)を、その被験者の罹患している疾患(または健常)と推定する。例えば、被験者Aから得られた32発話を推定した結果、健常4個、レビー小体型認知症16個、アルツハイマー型認知症3個、パーキンソン病3個、大うつ病2個、双極性障害2個、非定型うつ病2個であった場合、被験者Aは最も多くの推定を得たレビー小体型認知症に罹患していると推定する。
 (推定プログラム4の作成)
 各被験者の発話について、発話毎の推定を行い、そのうち推定の頻度により、当該疾患に罹患している(または健常である)確率として推定する。この場合、頻度の少ない推定は除外することもできる。
 例えば、被験者Aから得られた32発話を推定した結果、健常4個、レビー小体型認知症16個、アルツハイマー型認知症3個、パーキンソン病3個、大うつ病2個、双極性障害2個、非定型うつ病2個であった場合、ここでは推定数が3以下を除外処理して、健常4個、レビー小体型認知症16個としたうえで、レビー小体型認知症である確率が80%、健常である確率が20%であると推定する。
 (推定プログラム5の作成)
 推定プログラム5は、特定の2種の疾患を軽度の場合でも推定可能とする。例えば、軽度認知症(MCI)はDSM-5では、アルツハイマー病による軽度認知症害、前頭側頭型軽度認知症害、レビー小体を伴う軽度認知症害、血管性時軽度認知障害、パーキンソン病による軽度認知症害、その他いくつかの軽度認知症害が定義されている。認知症が軽度の時は、その疾患の特徴的な症状が不鮮明であり診断が困難な場合が多い。
 そこで、例えば、アルツハイマー型認知症とレビー小体型認知症を推定するアルゴリズム、アルツハイマー型認知症と前頭側頭型認知症を推定するアルゴリズム、レビー小体型認知症とパーキンソン病など、特定の2疾患について精密な判別アルゴリズムを作成し、これによって、いずれか一方の疾患であることを軽度の時に推定する。
 (推定プログラム6の作成)
 II.統合失調症スペクトラム障害および他の精神病性障害群、III.双極性障害および関連障害群、IV.抑うつ障害群、V.不安症群 不安障害群、XVIII.パーソナリティ障害群、XVII.神経認知障害群など、これら群に属する疾患のいずれかに罹患していることを推定する。
 このような疾患群を推定するアルゴリズムは、例えば、健康診断により何からの精神疾患に罹患していないかをスクリーニングする場合や、一般の内科や総合診療医で初めて診察を受ける場合に好適に用いられる。
 例えば、抑うつ障害群として、大うつ病と非定型うつ病、III.双極性障害および関連障害群として双極性障害、神経認知障害群として、アルツハイマー型認知症、レビー小体型認知症を選び、これらの群毎に特徴的な音声パラメータを当てはめ、これにより疾患群を推定するアルゴリズムを作成する。
 (推定プログラム7の作成)
 特徴量の生成のしかたによっては、いずれの音響パラメータを選択するかにより、アルツハイマー型認知症、レビー小体型認知症、パーキンソン病の3疾患を含む認知症群、大うつ病、双極性障害、非定型うつ病の3疾患を含む気分障害群、及び健常の群の3つの群のうち、どの群に属する疾患または健常であるかを推定することができる。認知症群には更に血管性認知症、前頭側頭型認知症に2疾患を加えても良く、気分障害群には更に気分変調症、気分循環症を加えても良い。
 また、特徴量の生成のしかたによっては、いずれの音響パラメータを選択するかにより、アルツハイマー型認知症およびレビー小体型認知症からなる群、パーキンソン病の群、大うつ病、双極性障害および非定型うつ病を含む気分障害群、ならびに健常の群の4つの群のうち、どの群に属する疾患または健常であるかを推定することができる
 被験者1人に付き、上記17種類の発話内容のうち、1~13までの発話(各2回で1例あたり26発話)、14~17までの発話(各1回で1例あたり4発話)の合計30発話について、長いものは2つに分解し、また不鮮明なものは除外することにより、アルツハイマー型認知症、レビー小体型認知症、パーキンソン病(これらを合わせて認知症群とする)の患者の発話を合わせて2356個、大うつ病、双極性障害、非定型うつ病(これらを気分障害群とする)の患者発話を合わせて1342個、健常者(健常者群)の発話を585個の合計4183個の発話が得られた。
 これら各発話について特徴的な音響パラメータを抽出し、その頻度、強度等、音響パラメータの特徴と当該被験者の疾患とを関連付けることにより、認知症群、気分所為うがい群と健常者の3種とそれに関連づけられた各種の音響パラメータ群が得られた。各疾患に対して特徴的な音響パラメータを選択し、さらに選択された音響パラメータの組合せを行うことにより、認知症群または気分障害群のいずれか、または健常者であるかを判別するための特徴量に基づく推定プログラム7を作成した。
 なお、推定プログラムを作成する際には、各群の発話を5分割し、5回交差検証を行った。
(推定プログラム7に基づく推定結果)
 健常者が発した585個の発話については、健常者と推定したものが364個、認知症群と推定したものが180個、気分障害群と推定したものが41個であった。従って、実際に健常者の発話のうち、健常者のものと推定した割合(感度、再現率:Recall)は、62.2%であった。
 また、健常者の発話と推定された558個の発話については、実際に健常者のものが364個、実際には認知症群のものが148個、実際には気分障害群のものが46個であった。従って、健常者のものと推定された発話の内、実際にも健常者のものの割合(精度、適合率:Precision)は、65.2%であった。
 また認知症群の患者が発した2356個の発話については、健常者と推定したものが148個、認知症群と推定したものが2126個、気分障害群と推定したものが82個であった。従って、実際に認知症群の患者の発話のうち、認知症群の患者のものと推定した割合(感度、再現率:Recall)は、90.2%であった。
 また、認知症群の患者の発話と推定された2389個の発話については、実際に認知症群の患者のものが2126個、実際には健常者のものが180個、実際には気分障害群の患者のものが83個であった。従って、認知症群の患者のものと推定された発話の内、実際にも認知症群の患者のものの割合(精度、適合率:Precision)は、89.0%であった。
 また、気分障害群の患者が発した1342個の発話については、健常者と推定したものが46個、認知症群と推定したものが83個、気分障害と推定したものが1213であった。従って、実際に気分障害群の患者の発話のうち、気分障害群の患者のものと推定した割合(感度、再現率:Recall)は、90.4%であった。
 また、気分障害群の患者の発話と推定された1336個の発話については、実際に気分市生涯群の患者のものが1213個、実際には健常者のものが41個、実際には認知症群の患者のものが82個であった。従って、気分障害群の患者のものと推定された発話の内、実際にも気分障害群の患者のものの割合(精度、適合率:Precision)は、90.8%であった。
 全体の正答率(Accuracy)は86.5%であった。
 この推定アルゴリズムにより、どの群に属する疾患に罹患しているかを推定することができる。
 推定プログラム7のような疾患群を推定するアルゴリズムも、推定プログラム6と同様に、健康診断により何からの精神疾患に罹患していないかをスクリーニングする場合や、一般の内科や総合診療医で初めて診察を受ける場合に好適に用いられる。そして、疾患群を推定したうえで、各疾患群について前述の推定プログラム2または後述する推定プログラム8等を用いることにより、精神・神経疾患のうち特定の疾患を推定することができる。
(推定プログラム8の作成)
 特徴量の生成のしかたによっては、いずれの音響パラメータを選択するかにより、精神・神経疾患のうち、アルツハイマー型認知症であるかあるいはそれ以外の疾患であるか、レビー小体型認知症であるかあるいはそれ以外の疾患であるか等、特定の1つの疾患とその他の疾患の2者択一の形式でいずれに属するかを推定することができる。
 例えば、レビー小体型認知症の音声データと、その他の疾患としてアルツハイマー型認知症、パーキンソン病を合わせた音声とを解析してこれらを判別可能な音響パラメータを選択することにより、認知症群の中からレビー小体型認知症であることを推定するプログラムを作成することができる。そして、推定対象者の音声データをこの推定プログラムによって算出すればレビー小体型認知症であるか、その他の認知症であるかを推定することができる。
 また、例えば、大うつ病の音声データと、その他の疾患として、レビー小体型認知症、アルツハイマー型認知症、パーキンソン病、非定型うつ病、双極性障害を合わせた音声とを解析してこれらを判別可能な音響パラメータを選択することにより、精神・神経疾患の中から大うつ病であることを推定するプログラムを作成することができる。そして、推定対象者の音声データをこの推定プログラムによって算出すれば大うつ病であるか、その他あるかを推定することができる。
(推定プログラム9の作成)
 推定プログラム1のように、特徴量の生成のしかたによっては、いずれの音響パラメータを選択するかにより、アルツハイマー型認知症、レビー小体型認知症、パーキンソン病、大うつ病、双極性障害、非定型うつ病、及び健常を判別することができるが、6つの疾患および健常を一旦判別したうえで、アルツハイマー型認知症、レビー小体型認知症、パーキンソン病の3つの疾患を合わせて認知症群とし、大うつ病、双極性障害、非定型うつ病の3つを合わせて気分障害群とし、その結果認知症群、気分障害群のいずれの疾患であるか、または健常であるかを推定することができる。
(推定プログラム10の作成)
 推定プログラム9と同様に、認知症群、気分障害群のいずれの疾患であるか、または健常であるかを推定するものであるが、各人ごとに複数の文章について、それぞれの文章毎に疾患を割り当てたのち、最も多数の文章について疾患を割り当てられたものを、その人の疾患と推定し、認知症群、気分障害群のいずれの疾患であるか、または健常であるかを推定する。
 アルツハイマー型認知症の患者15名、双極性障害の患者12名、非定型うつ病の患者14名、レビー小体型認知症の患者15名、大うつ病の患者15名、パーキンソン病の患者15名、健常者15名の各音声を学習用データとして用いた。
 アルツハイマー型認知症の患者5名、双極性障害の患者4名、非定型うつ病の患者5名、レビー小体型認知症の患者5名、大うつ病の患者5名、パーキンソン病の患者5名、健常者5名の各音声をテストデータとして用いた。
 なお、学習用データとテスト用データとへの振り分けはランダムに行った。
 学習用データに用いる音声は各患者及び健常者が、前述の17の文章(1番~13番までは各2回、14番~17番までは各1回)を発話し各人ごとに30個の発話を得た。
 これら各発話について特徴的な音響パラメータを抽出し、その頻度、強度等、音響パラメータの特徴と当該被験者の疾患とを関連付けることにより、上記の6疾患と健常者の7種とそれに関連づけられた各種の音響パラメータ群が得られた。
 各疾患に対して特徴的な音響パラメータを選択し、さらに選択された音響パラメータの組合せを行うことにより、各人の発話文章毎に、6疾患のいずれか、または健常者であるかを推定し、続いて認知症群、気分障害群のいずれの疾患であるか、または健常であるかを推定するための特徴量に基づく推定プログラム10を作成した。
(推定プログラム10に基づく推定結果)
 テストデータとしては、表1の17個の文章のうち、2「あいうえおかきくけこ」、3「本日は晴天なり」、6「とても元気です」、8「食欲があります」、9「心が穏やかです」、10「おこりっぽいです」、12「上を向いて歩こう」、13「がんばるぞー」の8つのフレーズ(各2回で計16個)を用いた。各発話について、いずれの疾患であるかまたは健常であるかを推定した。推定された疾患のうち、アルツハイマー型認知症、レビー小体型認知症、パーキンソン病の3つの疾患に推定されたものは、認知症群の疾患であると判定した。また、大うつ病、双極性障害、非定型うつ病の3つの疾患に推定されたものは、気分障害群の疾患であると判定した。
 ここで、各人ごとの16個の発話が、認知症群の疾患、気分障害群の疾患、健常のうちいずれに判定されたかを集計し、もっとも多くの数の判定を得たものを、最終的な判定結果とした。
(結果1)アルツハイマー型認知症の患者(患者コードAD03):
 認知症群の疾患と判定されたもの13個、気分障害群の疾患と判定されたもの1個、健常と判定されたもの2個であった。従って、最終的に認知症群の疾患と推定された。これは、実際の疾患であるアルツハイマー型認知症が属する認知症群と一致していた。
 同様に行った34名の判定結果を表14に示す。
Figure JPOXMLDOC01-appb-T000017
 推定プログラム10による正答率は85.3%であった。
(推定プログラム11の作成)
 各疾患のいずれに罹患しているかについて、確率として表現し、最も高い確率を示した疾患であると推定する。
 レビー小体型認知症の患者20名、大うつ病の患者20名、健常者20名の音声を学習用及びテスト用の両方に用いた。音声としては、表1の項目14の長母音「あーーー」を用いた。
 音響特徴量は7440個からlogistic回帰分析によって相関の高い上位13の音響特徴量まで絞り込み、これを用いてレビー小体型認知症の疾患の予測値、大うつ病の疾患の予測値、健常の疾患の予測値を、合計して1になるように計算した。
(推定プログラム11に基づく推定結果)
 表15に、各人の音声から、レビー小体型認知症、大うつ病、健常のうちのいずれに推定したかを示す。なお、表中の疾患の予測値は「メンタル値」と記載される。
Figure JPOXMLDOC01-appb-T000018
Figure JPOXMLDOC01-appb-I000019
 推定プログラム11による正答率は76.7%であった。
 以下、アメリカ精神医学会により出版されているDSM(精神障害の診断と統計マニュアル)における疾患群を示す。なお、2018年現在最新版はDSM-5である。
I.Neurodevelopmental Disorders 神経発達症群-神経発達障害群
II.Schizophrenia Spectrum and Other Psychotic Disorders  
III.Bipolar and Related Disorders 双極性障害および関連障害群
IV.Depressive Disorders 抑うつ障害群
V.Anxiety Disorders 不安症群 不安障害群
VI.Obsessive Compulsive and Related Disorders 強迫症および関連症群,強迫性障害および関連障害群
VII.Trauma and Stressor Related Disorders 心的外傷およびストレス因関連障害群
VIII.Dissociative Disorders 解離症群-解離性障害群
IX.Somatic Symptom and Related Disorders 身体症状症および関連症群
X.Feeding and Eating Disorders 食行動障害および摂食障害群
XI.Elimination Disorders ***症群
XII.Sleep-Wake Disorders 睡眠-覚醒障害群
XIII. Sexual Dysfunctions  性機能不全群
XIV. Gender Dysphoria  性別違和
XV. Disruptive, Impulse-Control, and Conduct Disorders 秩序破壊的・衝動制御・素行症群
XVI.Substance-Related and Addictive Disorders  物質関連障害および嗜癖性障害群
XVII.Neurocognitive Disorders 神経認知障害群
XVIII.Personality Disorders パーソナリティ障害群
XIX.Paraphilic Disorders パラフィリア障害群
 以下に、DSM-5における大うつ病とレビー小体型認知症の診断基準を記す。このように、精神神経疾患は、病変を直接または何らかの客観指標を介して観測することが未だ困難であり、症状により判定せざるを得ない。
1.大うつ病(Major Depressive Disorder)
A.以下の症状のうち5つ(またはそれ以上)が同じ2週間の間に存在し、病前の機能からの変化を起こしている。これらの症状のうち少なくとも1つは(1)抑うつ気分、または(2)興味または喜びの喪失である。
注:明らかに他の医学的疾患に起因する症状は含まない。
(1)その人自身の言葉(例:悲しみ、空虚感、または絶望を感じる)か、他者の観察(例:涙を流しているように見える)によって示される、ほとんど1日中、ほとんど毎日の抑うつ気分。
 注:子どもや青年では易怒的な気分もありうる。
(2)ほとんど1日中、ほとんど毎日の、すべて、またはほとんどすべての活動における興味または喜びの著しい減退(その人の説明、または他者の観察によって示される)。
(3)食事療法をしていないのに、有意の体重減少、または体重増加(例:1ヵ月で体重の5%以上の変化)。またはほとんど毎日の食欲の減退または増加。 注:子どもの場合、期待される体重増加が見られないことも考慮せよ。
(4)ほとんど毎日の不眠または過眠。
(5)ほとんど毎日の精神運動焦燥または制止(他者によって観察可能で、ただ単に落ち着きがないとか、のろくなったという主観的感覚ではないもの)。
(6)ほとんど毎日の疲労感、または気力の減退。
(7)ほとんど毎日の無価値感、または過剰であるか不適切な罪責感(妄想的であることもある。単に自分をとがめること、または病気になったことに対する罪悪感ではない)。
(8)思考力や集中力の減退、または決断困難がほとんど毎日認められる(その人自身の言明による、または他者によって観察される)。
(9)死についての反復思考(死の恐怖だけではない)。特別な計画はないが反復的な自殺念慮、または自殺企図、または自殺するためのはっきりした計画。
B. その症状は、臨床的に意味のある苦痛、または社会的、職業的、または他の重要な領域における機能の障害を引き起こしている。
C. そのエピソードは物質の生理学的作用、または他の医学的疾患によるものではない。
注:基準A~Cにより抑うつエピソードが構成される。
注:重大な喪失(例:親しい者との死別、経済的破綻、災害による損失、重篤な医学的疾患・障害)への反応は、基準Aに記載したような強い悲しみ、喪失の反芻、不眠、食欲不振、体重減少を含むことがあり、抑うつエピソードに類似している場合がある。これらの症状は、喪失に際し生じることは理解可能で、適切なものであるかもしれないが、重大な喪失に対する正常な反応に加えて、抑うつエピソードの存在も入念に検討すべきである。その決定には、喪失についてどのように苦痛を表現するかという点に関して、各個人の生活史や文化的規範に基づいて、臨床的な判断を実行することが不可欠である。
D. 抑うつエピソードは統合失調感情障害、統合失調症、統合失調様障害、妄想性障害、または他の特定および特定不能の統合失調症スペクトラム障害および他の精神病性障害群によってはうまく説明されない。
E. 躁病エピソード、または軽躁病エピソードが存在したことがない。
2.レビー小体型認知症(Major Neurocognitive Disorder with Lewy Bodies)
A.認知症の基準を満たす
B.その障害は潜行性に発症し緩徐に進行する
C.その障害は中核的特徴および示唆的特徴の組み合わせによるほぼ確実(Probable)なLewy小体病を伴う認知症または疑いのある(Possible)Lewy小体病を伴う認知症の基準を満たす。
 ほぼ確実(Probable)なLewy小体病を伴う認知症では、2つの中核的特徴、または1つ以上の中核的特徴と1つの示唆的特徴をもつ
 疑いのある(Possible)Lewy小体病を伴う認知症では、1つの中核的特徴のみ、または1つ以上の示唆的特徴をもつ
(1)中核的特徴
 (a)著しく変動する注意および覚醒度を伴う認知の動揺
 (b)よく形作られた詳細な、繰り返し出現する幻視
 (c)認知機能の低下に引き続いて起こる自然に発生したパーキンソニズム
(2)示唆的特徴
 (a)レム睡眠行動異常症の基準を満たす
 (b)重篤な神経遮断薬に対する過敏性
D.その障害は脳血管障害、他の神経変性疾患、物質の作用、または他の精神疾患、神経疾患、全身性疾患ではうまく説明されない。
 (第7実施形態)
 次に、第2の音響パラメータとして、ゼロ点交差率、ハースト指数を選択した場合の一実施形態について詳述する。なお、第1実施形態と説明が重複する箇所は記載を省略する。
 算出部122は、音声における波形の変化の激しさの度合いとしてゼロ点交差率を算出する。また、算出部122は、音声の波形における変化の相関性を示すハースト指数を算出する。算出部122は、算出した被験者のゼロ点交差率およびハースト指数を、推定部123に出力する。
 算出部122は、被験者のゼロ点交差率およびハースト指数から被験者の疾患の予測値(メンタル値と記載することがある)を推定部123が推定するために、うつ病等の病を患っていない健康な状態を示す健康の基準範囲を設定する。
 例えば、算出部122は、うつ病等の病を患っているか否かの健康状態が既知である複数の人の音声データを推定システム100の記録装置から読み出し、読み出した音声データから複数の人の各々のゼロ点交差率およびハースト指数を含む第2の音響パラメータを算出する。
 さらに、算出部122は、ゼロ点交差率とハースト指数との2次元空間において、算出部122により算出された複数の人のゼロ点交差率およびハースト指数の分布に対して、線形判別式やロジスティック回帰分析等の線形分類の処理を実行して、これらの線形モデルを基にして特徴量を作成する。
 次に、算出部122は、特徴量に基づいてうつ病等を患っている人の領域と、うつ病等を患っていない健康な人の基準範囲とを分ける境界線を設定する。決定した境界線を含む基準範囲から被験者のゼロ点交差率およびハースト指数のスコアがどの程度離れているのかを疾患の予測値として算出し、推定部123に出力される。
 推定部123は、被験者における疾患の予測値から疾患を推定する。そして、推定部123は、推定した健康状態を示す情報を通信端末200に出力する。
 図6は、図2に示した通信端末200を介して取得した音声データの一例である。図6は、通信端末200を介して取得した被験者が発話した音声の音圧の時間変化を示す。図6の横軸は時刻tを示し、縦軸は音圧を示す。
 図6では、被験者による発話の音声データのうち、“ありがとう”と発話した発話単位のデータを示す。時刻t0、t1、t2、t3、t4は、発話単位に含まれる“あ”、“り”、“が”、“と”、“う”の各語が発話された開始の時刻を示す。なお、“ありがとう”の発話単位のうち、“り”の語が発話された音声データに対する算出部122の算出処理について説明するが、算出部122は、“ありがとう”の他の語および他の発話単位に対しても、同一または同様に算出処理を実行する。
 算出部122は、通信端末200から取得した音声データを用いて、ゼロ点交差率およびハースト指数を、512等のサンプル数のウィンドウWD毎に算出する。図6に示すように、音圧は各語の発話において大きく変化するため、例えば、算出部122は、ゼロ点交差率を算出するために、ウィンドウWDより小さい30等のサンプル数のウィンドウWD1毎に音圧の平均値を算出し、各ウィンドウWD1で算出した平均値を各ウィンドウWD1の基準圧力とする。算出部122は、各ウィンドウWD1において、算出した基準圧力(平均値)を被験者の音圧が横切る回数を計測し、ゼロ点交差率を算出する。
 算出部122は、各ウィンドウWD1で算出したゼロ点交差率の平均値をウィンドウWDのゼロ点交差率ZCRとして算出する。
 一方、時刻tの音圧x(t)と時刻tから時間τ離れた音圧x(t+τ)との差分の標準偏差σ(τ)は、式(1)に示すように関係付けられる。また、時間間隔τと標準偏差σ(τ)の間には、式(2)に示すようなべき則の関係があることが知られている。そして、式(2)におけるHがハースト指数である。
Figure JPOXMLDOC01-appb-M000020
 例えば、ホワイトノイズのような音声データの場合、音声データの各データ間において互いに時間的な相関がないため、ハースト指数Hは“0”となる。また、音声データがホワイトノイズからピンクノイズやブラウンノイズになるに従い、すなわち音声の波形が時間的な相関性を有するに従い、ハースト指数Hは“0”より大きな値を示す。
 例えば、音声データがブラウンノイズの場合、ハースト指数Hは0.5となる。さらに、音声データがブラウンノイズより強い相関性を有する、すなわち音声データが過去の状態に依存する度合いが増すに従い、ハースト指数Hは、0.5から1の間の値を示す。
 算出部122は、例えば、ウィンドウWDにおいて、時間間隔τが1から15の間の各τに対して音声データの標準偏差σ(τ)を求め、求めた各時間間隔τの標準偏差σ(τ)に対して回帰分析を実行することによりハースト指数Hを算出する。
 算出部122は、ウィンドウWDの幅の4分の1等の所定の間隔でウィンドウWDを移動させて、各ウィンドウWDにおけるゼロ点交差率ZCRおよびハースト指数Hを算出する。そして、算出部122は、算出した全てのウィンドウWDのゼロ点交差率ZCRおよびハースト指数Hを平均し、平均したゼロ点交差率ZCRおよびハースト指数Hを被験者のゼロ点交差率およびハースト指数として推定部123に出力する。
 図7は、図1に示した算出部122により算出された複数の人のゼロ点交差率ZCRおよびハースト指数Hの分布の一例を示す。図7では、縦軸はゼロ点交差率ZCRを示し、横軸はハースト指数Hを示している。
 また、図7では、うつ病等の病を患っている人のゼロ点交差率ZCRおよびハースト指数Hをバツ印で示し、健康な人のゼロ点交差率ZCRおよびハースト指数Hを丸印で示す。なお、図7に示したゼロ点交差率ZCRおよびハースト指数Hの分布は、延べ1218人の音声データを用いて生成されている。そして、延べ1218人のうち、うつ病等の病を患っている人は延べ697人であり、健康な人は延べ521人である。
 算出部122は、図7に示した複数の人のゼロ点交差率ZCRおよびハースト指数Hの分布に対して、線形判別式やロジスティック回帰分析等の線形分類の処理を実行する。算出部122は、うつ病等の病を患っている人と、健康な人とを分ける破線で示した境界線を決定する。
 図7の場合、破線で示した境界線は、ZCR=-0.299H+0.299と表される。算出部122は、破線で示した境界線より下側の領域を基準範囲として、決定した境界線を含む基準範囲の情報を推定部123に出力し、推定部123に基準範囲を設定する。
 なお、図7では、ゼロ点交差率ZCRの縦軸およびハースト指数Hの横軸は、線形軸としたが、破線で示した境界線が指数関数やべき関数等で表される場合、境界線を直線で示すために対数軸にするのが好ましい。
 図8は、音声データの取得環境に応じたゼロ点交差率ZCRおよびハースト指数Hの分布の一例を示す。図8では、図7と同様に、縦軸はゼロ点交差率ZCRを示し、横軸はハースト指数Hを示す。また、図8は、図7に示したゼロ点交差率ZCRおよびハースト指数Hの分布から算出部122により決定された境界線を破線で示す。
 図8は、例えば、通信端末200が被験者の音声を11キロヘルツのサンプリング周波数でサンプリングした音声データを用いて算出されたゼロ点交差率ZCRおよびハースト指数Hの分布を黒色の三角で示す。
 図9は、1人の音声データを用いてウィンドウWDの各々において算出されたゼロ点交
差率ZCRおよびハースト指数Hの分布の一例を示す。図9では、縦軸はゼロ点交差率Z
CRを示し、横軸はハースト指数Hを示す。
 図9に示したゼロ点交差率ZCRおよびハースト指数Hの分布に対して、破線で示した一次関数ZCR=γH+εによる最小二乗法を実行し、傾きγおよび切片εを算出する。例えば、複数の人の各々について算出した傾きγおよび切片εを用いて、うつ病を患っている人の音声と、健康な人の音声とを分類する境界を示す閾値を健康領域として決定する。
 また、1人の音声データを用いてウィンドウWDの各々において算出されたゼロ点交差率ZCRおよびハースト指数Hを算出し、全区間のHEとZCRのデータから各々の平均値                                                  と   を求める。例えば、複数の人の各々について算出した   および   を用いて、パーキンソン病を患っている人の音声と、健康な人の音声とを分類するためのパーキンソン病指標PDVI=   +α   -βを決定する。図10の場合、α=0.23、β=0.215としている。
 ここで、切片εとPDVIを用いることによって、健常者、うつ病(軽度)、うつ病(重度)、パーキンソン病の音声データをプロットすると図11の様になる。
 一方、通信端末200は、例えば、ネットワークNWを介して音声データを推定システム100に送信するために、11キロヘルツでサンプリングした被験者の音声データを、8キロヘルツのサンプリング周波数でダウンサンプリングする。図8は、8キロヘルツにダウンサンプリングされた音声データを用いて算出されたゼロ点交差率ZCRおよびハースト指数Hの分布を白色の矩形で示す。
 図8に示すように、被験者のゼロ点交差率ZCRおよびハースト指数Hは、ダウンサンプリングによる音質の劣化(ノイズの増加)による影響を受けている。すなわち、ダウンサンプリングされた音声データのゼロ点交差率ZCRは、ノイズが増加し、音声の音圧が基準圧力を横切る回数が増加するため、11キロヘルツでサンプリングされた音声データのゼロ点交差率ZCRと比べて大きな値を示す。
 一方、ダウンサンプリングされた音声のハースト指数Hは、ノイズが増加することにより音声データがホワイトノイズに近づくため、11キロヘルツでサンプリングされた音声データのハースト指数Hと比べて小さな値を示す。
 しかしながら、ゼロ点交差率ZCRおよびハースト指数Hは、ダウンサンプリングによる影響を受けるが、互いに独立に変化するのではなく、関係性を有して変化する。すなわち、図8に示すように、ゼロ点交差率ZCRおよびハースト指数Hは、ダウンサンプリング等による音質の劣化に対して、互いの相関性を有しつつ破線で示した境界線に沿って変化する。
 このため、ダウンサンプリング等による音質の劣化は、被験者のゼロ点交差率ZCRおよびハースト指数Hが基準範囲に含まれるか否かを判定する推定部123の動作に影響を与えない。すなわち、ゼロ点交差率ZCRおよびハースト指数Hは、ダウンサンプリング等の音質の劣化に対してロバスト性を有する。そして、推定システム100は、音声データの取得環境に拘わらず、従来と比べて精度良く被験者の健康状態を推定できる。
 なお、推定システム100は、例えば、ロボット、人工知能や自動車、あるいはコールセンター、インターネット、スマートフォンやタブレット型端末等の携帯端末装置アプリケーションやサービス、検索システムへ応用されてもよい。また、推定システム100は、診断装置、自動問診装置、災害トリアージ等に応用されてもよい。
 以上の詳細な説明により、実施形態の特徴点および利点は明らかになるであろう。これは、特許請求の範囲がその精神および権利範囲を逸脱しない範囲で前述のような実施形態例の特徴点および利点にまで及ぶことを意図するものである。また、当該技術分野において通常の知識を有する者であれば、あらゆる改良および変更に容易に想到できるはずである。したがって、発明性を有する実施形態の範囲を前述したものに限定する意図はなく、実施形態に開示された範囲に含まれる適当な改良物および均等物に拠ることも可能である。
 被験者が発話する音声を推定し、被験者が患っている病気を判別・推定し、病気の重症化を予防し、また病気の的確な判別に基づいて患者が適切な治療をうけることを可能にする推定システム、推定プログラムおよび推定方法を提供することができる。
122…算出部
123…推定部
100…推定システム
200…通信端末

 

Claims (20)

  1.  精神・神経系疾患の推定システムであって、
     被験者の音声データを取得する取得部と、前記音声データをサーバに送信する第1送信部を備える、少なくとも1つの音声の入力部と、
     前記サーバにおいて推定された結果のデータを受信する第1の受信部と、前記データを表示する出力部を備える、結果の表示部と、
     前記第1送信部から前記音声データを受信する第2受信部と、前記被験者の音声データから抽出された少なくとも1つの音響特徴量の組合せに基づき、疾患の予測値を算出する算出部と、前記被験者の疾患を推定する推定部と、推定された前記結果のデータを前記表示部へ送信する第2送信部を備える、サーバを備え、
     前記サーバが、推定プログラムを実行するための演算処理装置と、前記推定プログラムを記録した記録装置を備え、前記推定プログラムにより、
      前記推定部が前記疾患の予測値を入力として、複数の疾患からなる群から選択される前記被験者の疾患を推定することを特徴とする、精神・神経系疾患の推定システム。
  2.  前記複数の疾患は、アルツハイマー型認知症、レビー小体型認知症、パーキンソン病、双極性障害、非定型うつ病および大うつ病を含むことを特徴とする、請求項1に記載の推定システム。
  3.  前記推定部に入力される前記疾患の予測値は、アルツハイマー型認知症、レビー小体型認知症、パーキンソン病、双極性障害、非定型うつ病または大うつ病を含む群から選択される任意の2つの疾患について、いずれの疾患であるかを判別可能な1つ以上の音響特徴量を抽出して組合せることにより算出される、
    請求項1に記載の推定システム。
  4.  前記2つの疾患が、アルツハイマー型認知症とレビー小体型認知症、レビー小体型認知症とパーキンソン病、大うつ病と双極性障害、または大うつ病と非定型うつ病の組み合わせである請求項3に記載の推定システム。
  5.  前記推定部に入力される前記疾患の予測値は、アルツハイマー型認知症、レビー小体型認知症、パーキンソン病、双極性障害、非定型うつ病または大うつ病を含む群から選択される任意の1つ以上の疾患について、その疾患であるかまたは健常であるかを判別可能な1つ以上の音響特徴量を抽出して組合せることにより算出される、
    請求項1に記載の推定システム。
  6.  1つの疾患が大うつ病またはレビー小体型認知症である、
    請求項5に記載の推定システム。
  7.  前記推定部に入力される前記疾患の予測値は、アルツハイマー型認知症、レビー小体型認知症、パーキンソン病、双極性障害、非定型うつ病または大うつ病を含む群から選択される任意の1つの疾患について、その疾患であるかまたは他のいずれかの疾患であるかを判別可能な1つ以上の音響特徴量を抽出して組合せることにより算出される、
    請求項1に記載の推定システム。
  8.  1つの疾患が大うつ病またはレビー小体型認知症である
    請求項7に記載の推定システム。
  9.  前記推定部に入力される前記疾患の予測値は、アルツハイマー型認知症、レビー小体型認知症、パーキンソン病、双極性障害、非定型うつ病または大うつ病を含む群から選択される1つ以上の疾患を判別可能な1つ以上の音響特徴量を抽出して組合せることにより算出される、
    請求項1に記載の推定システム。
  10.  前記推定部に入力される前記疾患の予測値は段階的に算出され、第1の段階として、
    アルツハイマー型認知症、レビー小体型認知症、およびパーキンソン病を含む第1の群と、
    大うつ病、双極性障害および非定型うつ病を含む第2の群
    を判別可能な1つ以上の音響特徴量を抽出して組合せることにより算出される、
    請求項1に記載の推定システム。
  11.  前記推定部に入力される前記疾患の予測値は段階的に算出され、第2の段階として、
    アルツハイマー型認知症と、レビー小体型認知症と、およびパーキンソン病
    を判別可能な1つ以上の音響特徴量を抽出して組合せることにより算出される、
    請求項10に記載の推定システム。
  12.   前記推定部に入力される前記疾患の予測値は段階的に算出され、第2の段階として、
    大うつ病と、双極性障害と、および非定型うつ病
    を判別可能な1つ以上の音響特徴量を抽出して組合せることにより算出される、
    請求項10に記載の推定システム。
  13.  被験者端末を有し、被験者端末は表示部を備え、表示された文章毎に音声データを取得するものである、請求項1~12のいずれか一項に記載の精神・神経系疾患の推定システム。
  14.  前記通信端末は、心理テスト及び/又は認知機能テストを表示し、被験者が回答する、請求項1~13のいずれか一項に記載の精神・神経系疾患の推定システム。
  15.  通信端末は、前記入力部および前記表示部を備え、ネットワークを介して前記サーバと
    接続されることを特徴とする、
    請求項1に記載の精神・神経系疾患の推定システム。
  16.  前記第2記録装置は、推定された前記結果に基づいて前記被験者に示すための助言データ集が更に記録されており、前記推定プログラムによって、
     前記推定部が、前記結果に基づき、前記第2記録装置の前記助言データ集の中から助言
    データを選択して、前記第2送信部が前記結果のデータと共に前記表示部へ送信すること
    を特徴とする、
    請求項1に記載の精神・神経系疾患の推定システム。
  17.  前記第2記録装置が、ストレスに関するアンケートに対する前記被験者の回答を記載した回答データを記録して、前記被験者の前記回答データからストレスの値をさらに算出し、
     前記推定部が、前記被験者の前記疾患の予測値と、前記ストレスの値に基づいて、前記被験者の疾患を推定することを特徴とする、
    請求項1に記載の精神・神経系疾患の推定システム。
  18.  前記第2記録装置が、被験者の検診データを記録して、前記被験者の検診データからフィジカルの値をさらに算出し、
     前記推定部が、前記被験者の前記疾患の予測値と、前記フィジカルの値に基づいて、前記被験者の疾患を推定することを特徴とする、
    請求項1に記載の精神・神経系疾患の推定システム。
  19.  前記第2記録装置が、認知機能に関するテストに対する前記被験者の回答を記載した回答データを記録して、前記被験者の前記回答データから認知スコアをさらに算出し、
     前記推定部が、前記被験者の前記疾患の予測値と、前記認知スコアに基づいて、前記被験者の疾患を推定することを特徴とする、
    請求項1に記載の精神・神経系疾患の推定システム。
  20.  請求項1に記載の推定システムに格納されるプログラムを記録した記録媒体。

     
PCT/JP2019/027607 2018-07-13 2019-07-11 精神・神経系疾患の推定システム、推定プログラムおよび推定方法 WO2020013302A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
EP19835135.5A EP3821815A4 (en) 2018-07-13 2019-07-11 Mental/nervous system disorder estimation system, estimation program, and estimation method
US17/257,975 US20210233660A1 (en) 2018-07-13 2019-07-11 Estimateence system, estimateence program and estimateence method for psychiatric/neurological diseases
JP2019543953A JPWO2020013302A1 (ja) 2018-07-13 2019-07-11 精神・神経系疾患の推定システム、推定プログラムおよび推定方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2018-133356 2018-07-13
JP2018133356 2018-07-13
JP2019-057353 2019-03-25
JP2019057353 2019-03-25

Publications (1)

Publication Number Publication Date
WO2020013302A1 true WO2020013302A1 (ja) 2020-01-16

Family

ID=69143047

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/027607 WO2020013302A1 (ja) 2018-07-13 2019-07-11 精神・神経系疾患の推定システム、推定プログラムおよび推定方法

Country Status (4)

Country Link
US (1) US20210233660A1 (ja)
EP (1) EP3821815A4 (ja)
JP (1) JPWO2020013302A1 (ja)
WO (1) WO2020013302A1 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210102860A (ko) * 2020-02-11 2021-08-20 고려대학교 산학협력단 불균형 데이터 처리 장치 및 방법
JP2022022204A (ja) * 2020-07-22 2022-02-03 アクティブレイン バイオ インコーポレイテッド 人工知能に基づく脳情報提供装置及び方法
KR102385176B1 (ko) * 2021-11-16 2022-04-14 주식회사 하이 심리 상담 장치 및 그 방법
TWI780396B (zh) * 2020-01-22 2022-10-11 長庚醫療財團法人嘉義長庚紀念醫院 基於多特徵磁振造影與人工智慧之自殺意念的評估方法及評估系統
WO2023095847A1 (ja) * 2021-11-25 2023-06-01 住友ファーマ株式会社 精神疾患の判定方法、プログラム、精神疾患の判定装置および精神疾患判定システム
EP4166079A4 (en) * 2020-07-15 2023-08-09 Emocog Co., Ltd. SCREENING METHOD AND DEVICE FOR CONVERSATIONAL MENTAL DISORDER
JP7466131B2 (ja) 2020-04-28 2024-04-12 Pst株式会社 情報処理装置、方法、及びプログラム
WO2024111065A1 (ja) * 2022-11-22 2024-05-30 日本電信電話株式会社 うつ症状推定装置、うつ症状学習装置、うつ症状推定方法、うつ症状学習方法及びプログラム

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7389421B2 (ja) * 2018-07-13 2023-11-30 Pst株式会社 精神・神経系疾患を推定する装置
WO2020128542A1 (en) * 2018-12-18 2020-06-25 Szegedi Tudományegyetem Automatic detection of neurocognitive impairment based on a speech sample
US11232570B2 (en) 2020-02-13 2022-01-25 Olympus Corporation System and method for diagnosing severity of gastritis
WO2024136223A1 (ko) * 2022-12-22 2024-06-27 주식회사 이모코그 알츠하이머병 진단 장치 및 방법
CN117373492B (zh) * 2023-12-08 2024-02-23 北京回龙观医院(北京心理危机研究与干预中心) 一种基于深度学习的精神***症语音检测方法及***

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006132159A1 (ja) 2005-06-09 2006-12-14 A.G.I. Inc. ピッチ周波数を検出する音声解析装置、音声解析方法、および音声解析プログラム
JP2007296169A (ja) 2006-05-01 2007-11-15 Agi:Kk 心的状態判定装置、およびプログラム
JP2011255106A (ja) * 2010-06-11 2011-12-22 Nagoya Institute Of Technology 認知機能障害危険度算出装置、認知機能障害危険度算出システム、及びプログラム
WO2013069645A1 (ja) 2011-11-10 2013-05-16 ヒューマン・メタボローム・テクノロジーズ株式会社 エタノールアミンリン酸の測定方法
US20150112232A1 (en) * 2013-10-20 2015-04-23 Massachusetts Institute Of Technology Using correlation structure of speech dynamics to detect neurological changes
JP2017196314A (ja) * 2016-04-28 2017-11-02 株式会社生命科学インスティテュート 健康推定装置、健康推定プログラム、健康推定方法および健康推定システム
JP2017532082A (ja) * 2014-08-22 2017-11-02 エスアールアイ インターナショナルSRI International 患者の精神状態のスピーチベース評価のためのシステム
JP6312014B1 (ja) * 2017-08-28 2018-04-18 パナソニックIpマネジメント株式会社 認知機能評価装置、認知機能評価システム、認知機能評価方法及びプログラム
JP2018133356A (ja) 2017-02-13 2018-08-23 株式会社ディスコ 研磨パッド
JP2019057353A (ja) 2017-09-22 2019-04-11 株式会社東芝 半導体記憶装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011502564A (ja) * 2007-11-02 2011-01-27 シーグベルト ワーケンチン, 発語分析による加齢脳および脳疾患によって誘発された脳機能障害の評価のためのシステムおよび方法
US10874340B2 (en) * 2014-07-24 2020-12-29 Sackett Solutions & Innovations, LLC Real time biometric recording, information analytics and monitoring systems for behavioral health management
WO2017031350A1 (en) * 2015-08-19 2017-02-23 Massachusetts Instutute Of Technology Assessing disorders through speech and a computational model
EP3394825B1 (en) * 2015-12-18 2024-05-22 Cognoa, Inc. Platform and system for digital personalized medicine
JP6241974B1 (ja) * 2017-01-11 2017-12-06 公立大学法人横浜市立大学 霊長類生体の脳内ampa受容体のイメージング方法、プログラム、及びスクリーニング方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006132159A1 (ja) 2005-06-09 2006-12-14 A.G.I. Inc. ピッチ周波数を検出する音声解析装置、音声解析方法、および音声解析プログラム
JP2007296169A (ja) 2006-05-01 2007-11-15 Agi:Kk 心的状態判定装置、およびプログラム
JP2011255106A (ja) * 2010-06-11 2011-12-22 Nagoya Institute Of Technology 認知機能障害危険度算出装置、認知機能障害危険度算出システム、及びプログラム
WO2013069645A1 (ja) 2011-11-10 2013-05-16 ヒューマン・メタボローム・テクノロジーズ株式会社 エタノールアミンリン酸の測定方法
US20150112232A1 (en) * 2013-10-20 2015-04-23 Massachusetts Institute Of Technology Using correlation structure of speech dynamics to detect neurological changes
JP2017532082A (ja) * 2014-08-22 2017-11-02 エスアールアイ インターナショナルSRI International 患者の精神状態のスピーチベース評価のためのシステム
JP2017196314A (ja) * 2016-04-28 2017-11-02 株式会社生命科学インスティテュート 健康推定装置、健康推定プログラム、健康推定方法および健康推定システム
JP2018133356A (ja) 2017-02-13 2018-08-23 株式会社ディスコ 研磨パッド
JP6312014B1 (ja) * 2017-08-28 2018-04-18 パナソニックIpマネジメント株式会社 認知機能評価装置、認知機能評価システム、認知機能評価方法及びプログラム
JP2019057353A (ja) 2017-09-22 2019-04-11 株式会社東芝 半導体記憶装置

Non-Patent Citations (11)

* Cited by examiner, † Cited by third party
Title
BECK ET AL.: "An Inventory for measuring depression", ARCH. GEN. PSYCHIATRY, vol. 4, 1961, pages 561 - 571
ISHITA JUNICHI : "You can see your health just by 'talking on your smartphone", 16 December 2015 (2015-12-16), pages 1 - 6, XP009525269, Retrieved from the Internet <URL:https://xtech.nikkei.com/dm/atcl/feature/15/327441/121400022/> *
KATAUKE YASUSHIOHNUKI NAOKO: "Development and Validation of Social Support Scales for Japanese College Students", RISSHO UNIVERSITY, ANNUAL REPORT OF THE JAPANESE PSYCHOLOGICAL ASSOCIATION, no. 5, 2014, pages 37 - 46
KEISUKE TAKANOYOSHIHIKO TANNO: "A study of development of Japanese-version Rumination-Reflection Questionnaire", THE JAPANESE JOURNAL OF PERSONALITY, vol. 16, 2008, pages 259 - 261
MARI HIRANO: "A study of classification of resilience qualitative factor and acquired factor", THE JAPANESE JOURNAL OF PERSONALITY, vol. 19, 2010, pages 94 - 106
See also references of EP3821815A4
SO MIRAI : "How far can depression be diagnosed with just 'voice'?, Verification of accuracy of depression screening function in which ensemble-type machine learning model is applied to speech emotion recognition technology", RIETI DISCUSSION PAPER SERIES 16-J-054, 1 September 2016 (2016-09-01), pages 1 - 24, XP055674803 *
TAKASHI YAMAUCHIANJU SUDOYOSHIHIKO TANNO: "Reliability and validity of Japanese-version Brief Core Schema Scale", THE JAPANESE PSYCHOLOGICAL ASSOCIATION, vol. 79, 2009, pages 498 - 505
TSUYOSHI HASHIMOTO: "A study of classification of interpersonal stress events in college students", THE JAPANESE SOCIETY OF SOCIAL PSYCHOLOGY, vol. 13, no. 1, 1997, pages 64 - 75
YUICHIRO UECHIKAZUHIRO MIYASHITA: "Narcissistic vulnerability, self-discrepancy, and self-esteem as predictors of prophensity for social phobia", THE JAPANESE JOURNAL OF PERSONALITY, vol. 17, 2009, pages 280 - 291
ZUNK ET AL.: "Self-Rating Depression Scale in an Outpatient Further Validation of the SDS", ARCH. GEN. PSYCHIATRY, vol. 13, 1965, pages 508 - 515

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI780396B (zh) * 2020-01-22 2022-10-11 長庚醫療財團法人嘉義長庚紀念醫院 基於多特徵磁振造影與人工智慧之自殺意念的評估方法及評估系統
KR20210102860A (ko) * 2020-02-11 2021-08-20 고려대학교 산학협력단 불균형 데이터 처리 장치 및 방법
KR102533084B1 (ko) * 2020-02-11 2023-05-18 고려대학교 산학협력단 불균형 데이터 처리 장치 및 방법
JP7466131B2 (ja) 2020-04-28 2024-04-12 Pst株式会社 情報処理装置、方法、及びプログラム
EP4166079A4 (en) * 2020-07-15 2023-08-09 Emocog Co., Ltd. SCREENING METHOD AND DEVICE FOR CONVERSATIONAL MENTAL DISORDER
JP7515934B2 (ja) 2020-07-15 2024-07-16 イモコグ インク. 会話ベースの精神障害選別方法及びその装置
JP2022022204A (ja) * 2020-07-22 2022-02-03 アクティブレイン バイオ インコーポレイテッド 人工知能に基づく脳情報提供装置及び方法
JP7323137B2 (ja) 2020-07-22 2023-08-08 アクティブレイン バイオ インコーポレイテッド 人工知能に基づく脳情報提供装置及び方法
KR102385176B1 (ko) * 2021-11-16 2022-04-14 주식회사 하이 심리 상담 장치 및 그 방법
WO2023090548A1 (ko) * 2021-11-16 2023-05-25 주식회사 하이 심리 상담 장치 및 그 방법
WO2023095847A1 (ja) * 2021-11-25 2023-06-01 住友ファーマ株式会社 精神疾患の判定方法、プログラム、精神疾患の判定装置および精神疾患判定システム
WO2024111065A1 (ja) * 2022-11-22 2024-05-30 日本電信電話株式会社 うつ症状推定装置、うつ症状学習装置、うつ症状推定方法、うつ症状学習方法及びプログラム

Also Published As

Publication number Publication date
JPWO2020013302A1 (ja) 2021-06-03
EP3821815A4 (en) 2021-12-29
US20210233660A1 (en) 2021-07-29
EP3821815A1 (en) 2021-05-19

Similar Documents

Publication Publication Date Title
WO2020013302A1 (ja) 精神・神経系疾患の推定システム、推定プログラムおよび推定方法
Lopez-de-Ipiña et al. On automatic diagnosis of Alzheimer’s disease based on spontaneous speech analysis and emotional temperature
Espinola et al. Detection of major depressive disorder using vocal acoustic analysis and machine learning—an exploratory study
Staiger et al. Oral motor abilities are task dependent: A factor analytic approach to performance rate
Howell Screening school-aged children for risk of stuttering
Yamada et al. Combining multimodal behavioral data of gait, speech, and drawing for classification of Alzheimer’s disease and mild cognitive impairment
Cordella et al. Slowed articulation rate is a sensitive diagnostic marker for identifying non-fluent primary progressive aphasia
Doan et al. Predicting dementia with prefrontal electroencephalography and event-related potential
Noffs et al. Acoustic speech analytics are predictive of cerebellar dysfunction in multiple sclerosis
Jang et al. Classification of Alzheimer’s disease leveraging multi-task machine learning analysis of speech and eye-movement data
Agurto et al. Analyzing acoustic and prosodic fluctuations in free speech to predict psychosis onset in high-risk youths
Farrús et al. Acoustic and prosodic information for home monitoring of bipolar disorder
Vescovelli et al. Well-being and distress of patients with Parkinson's disease: a comparative investigation
Benba et al. Voice signal processing for detecting possible early signs of Parkinson’s disease in patients with rapid eye movement sleep behavior disorder
Kishimoto et al. Understanding psychiatric illness through natural language processing (UNDERPIN): Rationale, design, and methodology
EP4179961A1 (en) Voice characteristic-based method and device for predicting alzheimer&#39;s disease
Kálmán et al. Temporal speech parameters detect mild cognitive impairment in different languages: validation and comparison of the Speech-GAP Test® in English and Hungarian
Alghowinem From joyous to clinically depressed: Mood detection using multimodal analysis of a person's appearance and speech
Näsström et al. Development of a method for assessment of dysarthria in a foreign language: A pilot study
Kashif Sr et al. Neurophysiological markers of internet gaming disorder: a literature review of electroencephalography studies
Paek Emotional valence affects word retrieval during verb fluency tasks in Alzheimer’s dementia
Kim et al. Electroencephalography-based classification of Alzheimer’s disease spectrum during computer-based cognitive testing
von Polier et al. Predicting adult attention deficit hyperactivity disorder (ADHD) using vocal acoustic features
Shinohara et al. Case studies of utilization of the mind monitoring system (MIMOSYS) using voice and its future prospects
Alghifari et al. Development of Sorrow Analysis Dataset for Speech Depression Prediction

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 2019543953

Country of ref document: JP

Kind code of ref document: A

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19835135

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2019835135

Country of ref document: EP

Effective date: 20210215