WO2024019567A1

WO2024019567A1 - 음향 정보에 기반하여 수면 상태를 예측하는 수면 분석 모델을 생성하기 위한 방법, 장치 및 컴퓨터 프로그램

Info

Publication number: WO2024019567A1
Application number: PCT/KR2023/010525
Authority: WO
Inventors: 홍준기; 트란홍하이; 김대우; 이동헌; 정진환; 김종목; 김형국
Original assignee: 주식회사 에이슬립
Priority date: 2022-07-20
Filing date: 2023-07-20
Publication date: 2024-01-25

Abstract

본 발명은 사용자의 수면 환경에서 감지되는 음향 정보에 기반하여 사용자의 수면 상태를 판별하는 인공신경망 모델을 제공한다. 상기 수면 분석 모델을 생성하는 방법은, 사용자의 수면 음향 정보를 획득하는 단계, 상기 수면 음향 정보에 대한 전처리를 수행하는 단계 및 상기 전처리된 수면 음향 정보에 대한 분석을 수행하여 수면 상태 정보를 획득하는 단계를 포함할 수 있다. 본 발명에 의할 경우, 사용자가 소지하는 사용자 단말(예컨대, 이동식 단말) 등을 통해 용이하게 수면 환경에 관련한 음향 정보를 획득하고, 획득한 음향 정보를 기반으로 사용자의 수면 단계를 분석하여 수면 상태를 판단할 수 있다.

Description

음향 정보에 기반하여 수면 상태를 예측하는 수면 분석 모델을 생성하기 위한 방법, 장치 및 컴퓨터 프로그램

본 발명은 사용자의 수면 상태를 분석하기 위한 것으로서, 보다 구체적으로, 사용자의 수면 환경에서 획득되는 음향 정보에 기초하여 수면 상태를 분석하기 위한 것이다.

건강을 유지하고 개선하는 방법에는 운동, 식이요법 등 다양한 방법이 있지만, 하루 중 약 30% 이상의 시간을 차지하는 수면을 잘 관리하는 것이 무엇보다 중요하다. 하지만, 현대인들은 기계의 단순한 노동 대체 및 삶의 여유에도 불구하고 불규칙한 식습관과 생활습관 및 스트레스로 인해 숙면을 취하지 못하고, 불면증, 과다수면, 수면 무호흡 증후군, 악몽, 야경증, 몽유병 등과 같은 수면 질환으로 고통받고 있다.

국민건강보험 공단에 따르면, 국내 수면장애 환자가 2014년부터 2018년까지 연 평균 약 8%씩 증가하는 것으로 나타났으며, 2018년 국내에서 수면장애로 진료받은 환자는 약 57만명에 달한다.

또한, 2019년 수면 관련 조사에 의하면 전세계 성인의 62%가 원하는 만큼 수면을 취하지 못하며, 성인의 67%가 매일 밤 최소 한 번 이상의 수면 장애를 겪는다. 그리고, 전 세계 성인 10명 중 8명은 수면을 개선하기 원하지만 60%는 의료 전문가의 도움을 구하지 못하는 실정이고, 전 세계 성인의 44%가 지난 5년 동안 수면의 질이 나빠졌다고 한다.

숙면이 신체적 또는, 정신적 건강에 영향을 미치는 중요한 요소로 인식되면서 숙면에 대한 관심이 증가하고 있지만, 수면 질환의 개선을 위해서는 전문 의료 기관을 직접 방문해야 하며, 별도의 검사 비용이 요구되고, 그리고 지속적인 관리가 어려움에 따라 치료에 대한 사용자들의 노력이 미비한 실정이다.

이와 같이 날로 심각해지는 수면 문제로 인하여 수면 건강 관리에 대한 니즈가 증가하고, 이에 따라 수면 문제를 기술로 해결하려는 슬립테크 시장도 빠르게 성장하고 있다.

또한, 수면 건강 관리를 위해 수면에 관한 정보를 분석하고 추론하는 것에 있어 하나의 데이터만을 사용하는 것 보다 멀티모달로 여러 종류의 데이터를 학습하고, 이를 통해서 보다 정확한 추론이 요구되고 있다.

대한민국 공개특허공보 제10-2003-0032529호는 사용자의 신체 정보를 입력받고, 수면 중 사용자의 신체 상태에 따라 반복적인 학습에 의해 검출한 주파수 대역의 진동 및/또는 초음파를 출력하여 최적의 수면 유도가 가능하도록 하는 취침 유도기 및 수면 유도 방법에 대해 개시하고 있다.

다만, 종래의 기술은 신체 착용형 장비로 인해 야기되는 불편함으로 수면의 질이 감소될 우려가 있으며, 장비의 주기적인 관리(예컨대, 충전 등)가 필요하다. 이에 따라, 최근에는 비접촉식으로 사용자의 수면을 모니터링하여 수면 상태를 추정하고, 추정된 수면 상태에 따라서 사용자의 수면을 관리하기 위한 연구들이 진행되고 있다.

특히, 최근에는 웨어러블 디바이스를 이용하여 사용자의 수면을 분석하는 방법이 제안되고 있다. 대한민국 공개특허공보 제10-2022-0015835호는 수면 질을 평가하기 위한 전자장치 및 그 전자 장치에서의 동작 방법에 관한 것으로, 수면 시간 동안 웨어러블 디바이스가 획득한 수면 관련 정보에 기초하여 수면 주기를 식별하고, 이에 따라 수면의 질을 평가하는 방법을 제시하고 있다.

하지만, 종래의 웨어러블 디바이스를 이용한 수면 분석 방법은 웨어러블 디바이스가 사용자 신체에 적절하게 접촉되지 않은 경우, 사용자가 웨어러블 디바이스를 착용하지 않은 경우에는 수면 분석이 불가능하다는 문제점이 있었다. 또한, 복수의 사용자가 같은 공간에서 수면을 취하는 경우, 웨어러블 디바이스 비착용자의 움직임 때문에 웨어러블 디바이스 착용자의 수면 분석에 지장이 생기게 될뿐만 아니라, 웨어러블 디바이스 비착용자에 대한 수면 분석은 불가능하다는 문제점이 있었다.

따라서, 별도의 장비를 구비하지 않더라도, 사용자가 소지하는 사용자 단말(예컨대, 이동식 단말)을 통해 용이하게 수면 환경에 관련한 음향 정보를 획득하고, 획득한 음향 정보를 기반으로 사용자의 수면 단계를 분석하여 수면 상태를 감지하고자 하는 기술에 대한 수요가 존재할 수 있다.

또한, PSG 환경, 병원 환경 또는 실험실 환경 등 제한된 환경이 아닌, 제한되지 않은 일반적인 환경(예컨대, 가정 환경 등)에서 별다른 장치 없이도 수면 상태를 간편하면서도 정확하게 분석하고자 하는 기술에 대한 수요가 존재할 수 있다.

또한, 수면 음향 정보 또는 다른 수면 환경 정보 중 적어도 하나 이상에 기초하여 사용자의 수면 상태를 감지하고자 하는 기술에 대한 수요가 존재할 수 있다.

또한, 사용자의 수면 음향 정보 또는 다른 수면 환경 정보 중 적어도 하나 이상에 기초하여 수면 상태를 실시간으로 감지하고자 하는 기술에 대한 수요가 존재할 수 있다.

본 발명은 전술한 배경 기술에 대응하여 안출된 것으로, 사용자의 수면 환경에서 감지되는 음향 정보 또는 수면 환경 정보 중 적어도 하나 이상에 기반하여 사용자의 수면 상태를 판별하는 인공신경망 모델을 제공하기 위함이다.

본 발명이 해결하고자 하는 과제들은 이상에서 언급된 과제로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.

상술한 과제를 해결하기 위한 본 발명의 일실시예에서 음향 정보에 기반하여 수면 상태를 예측하는 수면 분석 모델을 생성하기 위한 방법이 개시된다.

상기 수면 분석 모델을 생성하는 방법은, 사용자의 수면 음향 정보를 획득하는 단계, 상기 수면 음향 정보에 대한 전처리를 수행하는 단계 및 상기 전처리된 수면 음향 정보에 대한 분석을 수행하여 수면 상태 정보를 획득하는 단계를 포함할 수 있다.

본 발명의 일실시예에서, 상기 수면 상태 정보를 획득하는 단계는, 하나 이상의 네트워크 함수를 포함하는 수면 분석 모델을 이용하여 상기 수면 상태 정보를 획득하는 단계를 포함할 수 있다.

본 발명의 일실시예에서, 수면 분석 모델을 생성하는 방법은 진폭, 위상, 주파수를 가지는 시간 도메인상의 로우(raw) 음향 정보를, 그 주파수 성분의 시간 축에 따른 변화를 포함하는 정보로 변환하는 단계를 포함할 수 있다. 여기서, 본 발명의 일 실시예에 따르면, 변환된 정보는 시각화된 것일 수 있다.

또는, 본 발명의 일 실시예에서, 시간 도메인상의 로우 음향 정보를 진폭과 주파수를 가지는 주파수 도메인상의 정보로 변환하는 단계를 포함할 수 있다. 여기서, 본 발명의 일 실시예에 따르면, 변환된 주파수 도메인상의 정보는 시각화된 것일 수 있다.

본 발명의 일실시예에서, 음향 정보를 주파수 도메인상의 스펙트로그램 정보로 변환하는 단계를 포함할 수 있다.

본 발명의 일실시예에서, 스펙트로그램에 멜 스케일을 적용하여 멜 스펙트로그램으로 변환하는 단계를 포함할 수 있다.

본 발명의 일실시예에서, 시간 도메인상의 로우 음향 정보 또는 주파수 도메인상의 정보에 대한 전처리를 수행하는 단계를 포함할 수 있다.

본 발명의 일실시예에서, 상기 음향 정보에 대한 전처리를 수행하는 단계는, 스펙트랄 노이즈 게이팅 또는 딥러닝 기반의 노이즈 리덕션을 수행하는 단계를 포함할 수 있다.

본 발명의 일실시예에서, 주파수 도메인의 정보에 대하여 데이터 어그멘테이션을 수행하는 단계를 포함할 수 있다.

본 발명의 일실시예에서, 상기 데이터 어그멘테이션은 피치 시프팅(pitch shifting), TUT(Tile UnTile) 어그멘테이션, 또는 노이즈 부가 어그멘테이션 중 하나 이상을 수행하는 단계를 포함할 수 있다.

본 발명의 일실시예에서, 상기 노이즈 부가 어그멘테이션은 노이즈 정보와 수면 음향 정보를 주파수 도메인으로 각각 변환하여, 주파수 도메인 상에서 정보를 부가하는 방법을 포함할 수 있다.

본 발명의 일실시예에서, 상기 노이즈 부가 어그멘테이션은 노이즈 정보와 수면 음향 정보를 스펙트로그램으로 각각 변환하여, 스펙트로그램으로 변환한 도메인 상에서 정보를 부가하는 방법을 포함할 수도 있다.

본 발명의 일실시예에서, 상기 노이즈 부가 어그멘테이션은 수면 음향 정보와 노이즈 정보에 멜 스케일이 적용된 멜 스펙트로그램으로 변환한 도메인 상에서 정보를 부가하는 방법을 포함할 수도 있다.

본 발명의 일실시예에서, 주파수 도메인상의 정보에 대하여 정방형에 가까운 형태로 변환하는 단계를 포함할 수 있다.

본 발명의 일실시예에서, 상기 정방형에 가까운 형태로 변환하는 단계는 리세이핑(Reshaping), 리사이즈(Resize), 스플릿-캣(Split-cat) 방법 중 적어도 하나 이상을 포함할 수 있다.

본 발명의 일실시예에서, 주파수 도메인상의 정보 또는 스펙트로그램에 대하여 dB 스케일(로그스케일)로 변환하는 단계를 포함할 수 있다.

본 발명의 일실시예에서, 주파수 도메인상의 정보 또는 스펙트로그램에 대하여 전체 값의 평균이 0이 되고, 표준 편차가 1이 되도록 하는 정규화(Normalization) 과정을 수행하는 단계를 포함할 수 있다.

본 발명의 일실시예에서, 주파수 도메인상의 정보, 스펙트로그램 또는 멜 스펙트로그램 정보를 이미지로서 인공지능 모델의 입력으로 하는 단계를 포함할 수 있다.

본 발명의 일실시예에서 주파수 도메인상의 정보, 스펙트로그램 또는 멜 스펙트로그램을 30초 단위로 분할하여 복수개의 주파수 도메인상의 정보들, 스펙트로그램들 또는 멜 스펙트로그램들을 구성하는 단계를 포함할 수 있다.

본 발명의 일실시예에서 주파수 도메인상의 정보, 스펙트로그램 또는 멜 스펙트로그램이 30초 단위로 분할된 각각의 정보에 대응하는 수면 상태 정보를 추출하는 단계를 포함할 수 있다.

본 발명의 일실시예에서 30초 단위로 분할된 주파수 도메인상의 정보, 스펙트로그램 또는 멜 스펙트로그램이 복수 개로 구성된 일련의 정보를 딥러닝 모델의 입력으로 하여, 수면 상태 정보를 추출하는 단계를 포함할 수 있다.

본 발명의 일실시예에서 시계열 정보가 포함되어 있는 주파수 도메인상의 정보, 스펙트로그램 또는 멜 스펙트로그램을 인공지능 모델의 입력으로 하여 차원이 낮아진 벡터를 출력하는 단계를 포함할 수 있다.

본 발명의 일실시예에서 차원이 낮아진 벡터를 인공지능 모델의 입력으로 하여 시계열 정보가 함축된 벡터를 출력하는 단계를 포함할 수 있다.

본 발명의 일실시예에서 차원이 낮아진 벡터를 중간층(Intermediate Layer)의 입력으로 하여, 시계열 정보가 함축된 벡터를 출력하는 단계를 포함할 수 있다.

본 발명의 일실시예에서, 차원이 낮아진 벡터가 입력되는 중간층(Intermediate Layer)에는 벡터의 정보를 함축하는 선형화, 평균과 분산을 입력하기 위한 정규화, 또는 일부 노드를 비활성화하는 드롭아웃 단계를 수행하는 모델 중 적어도 하나 이상이 포함될 수 있다.

본 발명의 일실시예에서, 정답이 라벨링 되어있지 않은 언레이블드 데이터(Unlabeled data)를 사용하여 학습하는 비지도 학습모델을 활용하는 방법이 포함될 수 있다.

본 발명의 일실시예에서 활용되는 비지도 학습모델에는, 타겟 환경의 노이즈를 이용한 컨시스턴시 트레이닝(Consistency Training)모델이 포함될 수 있다.

본 발명의 일실시예에서 활용되는 컨시스턴시 트레이닝(Consistency Training)모델에는, 노이즈를 의도적으로 부가한 데이터와, 노이즈를 의도적으로 부가하지 않은 데이터를 가지고 학습을 수행하는 단계가 포함될 수 있다.

본 발명의 일실시예에서 활용되는 비지도 학습모델에는, 비지도 도메인 적응(Unsupervised Domain Adaptation, UDA)모델이 포함될 수 있다.

본 발명의 일실시예에서 활용되는 UDA 모델은, 언레이블드 데이터(unlabeled data)와 레이블드 데이터(labeled data)가 활용되는 1차 학습과, unlabeled data가 활용되는 2차 학습을 수행할 수 있다.

본 발명의 일실시예에 따른 UDA 모델의 1차 학습에서는 특정 환경에서 획득한 labeled data와, 다른 환경 또는 타겟 환경에서 획득한 unlabeled data를 활용하여 학습을 수행할 수 있다.

본 발명의 일실시예에 따른 UDA 모델의 1차 학습에서는 특정 환경에서 특정 환경에서 획득한 데이터와 다른 환경 또는 타겟 환경 에서 획득한 데이터 각각을 수면 분석 모델의 입력으로 하여 데이터간의 공통점을 추출하도록 학습하는 단계를 포함할 수 있다.

본 발명의 일실시예에 따른 UDA 모델의 1차 학습에서는 특정 환경에서 특정 환경에서 획득한 데이터와 다른 환경 또는 타겟 환경 에서 획득한 데이터 각각을 수면 분석 모델의 입력으로 하여 출력된 데이터간의 공통점을 판별자(Discriminator) 모델의 입력으로 하여, 입력된 데이터간의 차이점을 분류하기 위해 학습하는 단계를 포함할 수 있다.

본 발명의 일실시예에 따른 UDA 모델의 2차 학습에서는 Unlabeled data를 딥러닝 모델의 입력으로 하여 수면 분석 모델에서 출력된 수면 상태 정보의 예측값이 포함하고 있는 클래스 정보를 더 신뢰할 수 있도록 학습을 하는 단계를 포함할 수 있다.

본 발명의 일실시예에서 활용되는 슈도 라벨(pseudo label)을 이용한 반지도학습(Semi-Supervised learning)에서는 언레이블드 데이터(unlabeled data)를 딥러닝 모델의 입력으로 하여 출력된 데이터를 슈도 라벨(pseudo label)로 활용함으로써 딥러닝 모델의 학습을 수행하는 단계를 포함할 수 있다.

본 발명의 일실시예에서 활용되는 슈도 라벨(pseudo label)을 이용한 반지도학습(Semi-Supervised learning)에서는 이미지에 대한 어그멘테이션 전처리를 수행하는 단계를 포함할 수 있다.

본 발명의 일실시예에서 활용되는 슈도 라벨(pseudo label)을 이용한 반지도학습(Semi-Supervised learning)에서 수행되는 어그멘테이션 전처리 방법에는 이미지를 상대적으로 적게 변조시키는 Weakly-augmented 방법 또는 이미지를 상대적으로 많이 변조시키는 Strongly-augmented 방법 중 적어도 하나가 포함될 수 있다.

본 발명의 일실시예에서 활용되는 슈도 라벨(pseudo label)을 이용한 반지도학습(Semi-Supervised learning)에서 수행되는 어그멘테이션 전처리 기법으로는 데이터 어그멘테이션, 피치 시프팅(Pitch shifting) 어그멘테이션, TUT(Tile UnTile) 어그멘테이션, 또는 노이즈 부가 어그멘테이션 기법 중 하나 이상이 포함될 수 있다.

본 발명의 일실시예에서 활용되는 슈도 라벨(pseudo label)을 이용한 반지도학습(Semi-Supervised learning)은 이미지를 상대적으로 적게 변조시키는 Weakly-augmented 방법이 수행된 이미지 정보를 딥러닝 모델의 입력으로 하여 출력된 예측값을 슈도 라벨로 활용함으로써, 그것을 기반으로 학습을 수행하는 방법을 포함할 수 있다.

본 발명의 일실시예에서 활용되는 슈도 라벨(pseudo label)을 이용한 반지도학습(Semi-Supervised learning)에서 이동평균(Moving Average)기법, 가중평균(Weighted Average)기법, 가중이동평균(Weighted Moving Average)기법, 또는 지수가중이동평균(Exponential Weighted Moving Average)기법 중 하나 이상의 기법을 포함할 수 있다.

본 발명의 일실시예에서 활용되는 슈도 라벨(pseudo label)을 이용한 반지도학습(Semi-Supervised learning)은, 타겟 환경 또는 타겟 대상집단으로부터 획득한 데이터를 딥러닝 모델의 입력으로 하여 출력된 예측값의 분포가, 특정 환경 또는 비교대상집단으로부터 획득한 데이터를 딥러닝 모델의 입력으로 하여 출력된 예측값의 분포와 일치하는 방향으로 형성되게끔 튜닝(Tuning)하는 단계를 포함할 수 있다.

본 발명의 일실시예에서 활용되는 비지도학습 및/또는 반지도학습은 이미지 도메인에서 이미지 데이터에 label이 없더라도 이미지 정보에 대한 예측값의 신뢰도가 높아질 수 있도록 사전 학습을 수행하는 방법을 포함할 수 있다.

본 발명의 일실시예에서 활용되는 비지도학습 및/또는 반지도학습에는 이미지 정보의 일부분을 훼손한 뒤, 훼손된 이미지 정보 부분을 예측할 수 있도록 학습을 수행하는 방법을 포함할 수 있다.

또한, 본 발명의 일 실시예에 따라 수면 음향 정보와 수면 환경 정보를 멀티모달로 한 수면 상태 정보를 분석하기 위한 방법은, 수면 음향 정보와 수면 환경 정보를 모두 이용하여 수면 상태 정보를 분석하기 위한 방법으로, 사용자의 수면과 관련한 시간 도메인 상의 음향 정보를 획득하는 제1 정보 획득 단계; 사용자의 수면과 관련한 사용자 수면 환경 정보를 획득하는 제2 정보 획득 단계; 상기 제1 정보와 상기 제2 정보를 멀티모달 데이터로 결합하는 단계; 상기 멀티모달 데이터를 멀티모달 학습된 딥러닝 모델의 입력으로 하여, 피처를 추출하는 단계;및 상기 추출된 피처를 딥러닝 모델의 입력으로 하여 사용자 수면 상태 정보를 획득하는 단계를 포함하며, 수면 음향 정보와 수면 환경 정보를 멀티모달로 한 수면 상태 정보를 분석하기 위한 방법을 제공할 수 있다.

또한, 상기 제1 정보 획득 단계는 상기 획득된 제1 정보의 전처리를 수행하는 단계를 포함하고, 상기 제2 정보 획득 단계는 상기 획득된 제2 정보의 전처리를 수행하는 단계를 포함할 수 있다.

그리고, 상기 제1 정보의 전처리를 수행하는 단계는 상기 제1 정보에 기초하여 제1 정보 특징을 추출하는 단계를 포함하고, 상기 제2 정보의 전처리를 수행하는 단계는 상기 제2 정보에 기초하여 제2 정보 특징을 추출하는 단계를 포함할 수 있다.

또한, 상기 제1 정보의 전처리를 수행하는 단계는 상기 제1 정보의 데이터 어그멘테이션을 수행하는 단계를 포함하고, 상기 제2 정보의 전처리를 수행하는 단계는 상기 제2 정보의 데이터 어그멘테이션을 수행하는 단계를 포함할 수 있다.

그리고, 상기 사용자 수면 상태 정보를 획득하는 단계의 상기 딥러닝 모델은 자연어처리 기반의 딥러닝 모델일 수 있다.

또한, 상기 제1 정보의 전처리를 수행하는 단계는, 시간 도메인 상의 제1 정보를 주파수 도메인 상의 정보로 변환하는 단계를 포함할 수 있다.

본 발명의 목적 달성하기 위한 일 실시예에 따르면, 수면 음향 정보와 수면 환경 정보를 멀티모달로 한 수면 상태 정보를 분석하기 위해 하나 이상의 프로세서에 의해 실행되도록 구성된 하나 이상의 프로그램을 저장한 비일시적 컴퓨터 판독가능 저장 매체로서, 상기 하나 이상의 프로그램은 전술된 방법을 수행하라는 명령어들을 포함하는, 비일시적 컴퓨터 판독가능 저장 매체를 제공할 수 있다.

본 발명의 목적을 달성하기 위한 일 실시예에 따르면, 수면 음향 정보와 수면 환경 정보를 멀티모달로 한 수면 상태 정보를 분석하기 위한 스마트 장치에 있어서, 사용자의 수면과 관련한 시간 도메인 상의 음향 정보를 획득하는 제1 정보 획득부; 사용자의 수면과 관련한 사용자 수면 환경 정보를 획득하는, 제2 정보 획득부; 상기 제1 정보와 상기 제2 정보를 멀티모달 데이터로 결합하는 데이터 결합부; 상기 멀티모달 표현을 학습된 딥러닝 모델의 입력으로 하여, 피처를 추론하는 피처추론부; 및 상기 추론된 피처를 딥러닝 모델의 입력으로 하여 수면 상태 정보를 획득하는 사용자 수면 상태 정보 획득부;를 포함하는 수면 음향 정보와 수면 환경 정보를 멀티모달로 한 수면 상태 정보를 분석하기 위한 장치를 제공할 수 있다.

여기서, 상기 제1 정보의 전처리를 수행하는 제1 정보 전처리 수행부; 및

상기 제2 정보의 전처리를 수행하는 제2 정보 전처리 수행부를 더 포함할 수 있다.

그리고, 상기 제1 정보의 전처리를 수행부는 상기 제1 정보에 기초하여 제1 정보 특징을 추출하고, 상기 제2 정보의 전처리를 수행부는 상기 제2 정보에 기초하여 제2 정보 특징을 추출할 수 있다.

또한, 상기 제1 정보의 전처리 수행부는 상기 제1 정보의 데이터 어그멘테이션을 수행하고, 상기 제2 정보의 전처리 수행부는 상기 제2 정보의 데이터 어그멘테이션을 수행할 수 있다.

그리고, 상기 사용자 수면 상태 정보의 분석을 수행하기 위한 인공지능 모델은 자연어처리 기반의 인공지능 모델일 수 있다.

또한, 상기 제1 정보 전처리를 수행하는 전처리 수행부는, 시간 도메인 상의 제1 정보를 주파수 도메인 상의 정보로 변환할 수 있다. 여기서 주파수 도메인 상의 정보란, 시간 도메인 상의 제1 정보에 포함되어 있는 주파수 성분들의 시간 축에 따른 변화를 포함하는 정보일 수 있다.

본 발명의 목적을 달성하기 위하여 일 실시예에 따른, 수면 음향 정보와 수면 환경 정보를 멀티모달로 한 수면 상태 정보를 분석하기 위한 방법은, 사용자의 수면과 관련한 수면 음향 정보를 획득하는 제1 정보 획득 단계; 상기 수면 음향 정보를 딥러닝 모델의 입력으로 하여, 제1 수면 상태 정보를 추론하는 단계; 사용자의 수면과 관련한 사용자 수면 환경 정보를 획득하는 제2 정보 획득 단계; 상기 사용자 수면 환경 정보를 추론 모델의 입력으로 하여, 제2 수면 상태 정보를 추론하는 단계; 및 상기 제1 수면 상태 정보와 제2 수면 상태 정보를 결합하여 사용자 수면상태정보를 획득하는 사용자 수면 상태 정보 획득 단계를 포함하는 수면 음향 정보와 수면 환경 정보를 멀티모달로 한 수면 상태 정보를 분석하기 위한 방법을 제공할 수 있다

그리고, 상기 제1 정보 획득 단계는, 시간 도메인 상의 제1 정보를 주파수 도메인 상의 정보로 변환할 수 있다.

또한, 상기 제1 수면 상태 정보를 추론하는 단계는, 수면 단계를 표시하는 힙노그램(Hypnogram) 또는 수면 단계의 신뢰도를 확률로 표시하는 힙노덴시티 그래프(Hypnodensity graph)를 상기 제1 수면 상태 정보로 추론할 수 있다.

그리고, 상기 제2 수면 상태 정보를 추론하는 단계는, 수면 단계를 표시하는 힙노그램 또는 수면 단계의 신뢰도를 확률로 표시하는 힙노덴시티 그래프(Hypnodensity graph)를 상기 제2 수면 상태 정보로 추론하는 것을 특징으로 할 수 있다.

또한, 상기 사용자 수면 상태 정보 획득 단계는, 상기 제1 수면 상태 정보와 상기 제2 수면 상태 정보를 결합하는 수면 상태 정보 결합 단계를 더 포함하는 것을 특징으로 하는 수면 음향 정보와 수면 환경 정보를 멀티모달로 한 수면 상태 정보를 분석하기 위한 방법이 제공될 수 있다.

그리고, 상기 사용자 수면 상태 정보 획득 단계는, 상기 제1 수면 상태 정보와 상기 제2 수면 상태 정보를 활용하여 데이터 어그멘테이션을 진행하는 수면 상태 데이터 어그멘테이션 단계를 더 포함할 수 있다.

여기서, 상기 추론 모델은 인공지능 수면 정보 추론 모델일 수 있다.

그리고, 상기 사용자 수면 상태 정보 획득 단계는, 상기 사용자 수면 상태 정보를 획득하기 위해서 인공지능 학습 모델을 통해 사용자 수면 상태 정보 추론을 진행할 수 있다.

본 발명의 목적을 달성하기 위한 일실시예로서, 수면 음향 정보와 수면 환경 정보를 멀티모달로 한 수면 상태 정보를 분석하기 위해 하나 이상의 프로세서에 의해 실행되도록 구성된 하나 이상의 프로그램을 저장한 비일시적 컴퓨터 판독가능 저장 매체로서, 상기 하나 이상의 프로그램은 전술한 방법을 수행하라는 명령어들을 포함하는, 비일시적 컴퓨터 판독가능 저장 매체를 제공할 수 있다.

본 발명의 목적을 달성하기 위한 일실시예에 따른, 수면 음향 정보와 수면 환경 정보를 멀티모달로 한 수면 상태 정보를 분석하기 위한 스마트 장치에 있어서, 사용자의 수면과 관련한 수면 음향 정보를 획득하는, 제1 정보 획득부; 상기 수면 음향 정보를 딥러닝 모델의 입력으로 하여, 제1 수면 상태 정보를 추론하는, 제1 정보 추론부; 사용자의 수면과 관련한 사용자 수면 환경 정보를 획득하는, 제2 정보 획득부; 상기 사용자 수면 환경 정보를 추론 모델의 입력으로 하여, 제2 수면 상태 정보를 추론하는, 제2 수면 상태 정보 추론부; 및 상기 제1 수면 상태 정보와 제2 수면 상태 정보를 결합하여 사용자 수면상태정보를 획득하는, 사용자 수면 상태 정보 획득부를 포함하는 수면 음향 정보와 수면 환경 정보를 멀티모달로 한 수면 상태 정보를 분석하기 위한 장치를 제공할 수 있다.

여기서, 본 발명의 일 실시예에 따르면 상기 제1 정보 획득부는 시간 도메인 상의 제1 정보를 주파수 도메인 상의 정보로 변환하는 것을 특징으로 할 수 있다.

또한, 본 발명의 일 실시예에 따르면 상기 제1 수면 상태 정보 추론부는, 수면 단계를 표시하는 힙노그램 또는 수면 단계의 신뢰도를 확률로 표시하는 힙노덴시티 그래프를 상기 제1 수면 상태 정보로 추론하는 것을 특징으로 할 수 있다.

그리고, 본 발명의 일 실시예에 따르면 상기 제2 수면 상태 정보 추론부는, 수면 단계를 표시하는 힙노그램 또는 수면 단계의 신뢰도를 확률로 표시하는 힙노덴시티 그래프를 상기 제2 수면 상태 정보로 추론하는 것을 특징으로 할 수 있다.

또한, 본 발명의 일 실시예에 따르면 상기 사용자 수면 상태 정보 획득부는, 상기 제1 수면 상태 정보와 상기 제2 수면 상태 정보를 결합하는 수면 상태 정보 결합부를 포함할 수 있다.

그리고, 본 발명의 일 실시예에 따르면 상기 사용자 수면 상태 정보 획득부는, 상기 제1 수면 상태 정보와 상기 제2 수면 상태 정보를 활용하여 데이터 어그멘테이션을 진행하는 수면 상태 데이터 어그멘테이션부를 더 포함할 수 있다.

또한, 본 발명의 일 실시예에 따르면 상기 추론 모델은 인공지능 수면 정보 추론 모델일 수 있다.

그리고, 본 발명의 일 실시예에 따르면 상기 사용자 수면 상태 정보 획득부는, 상기 사용자 수면 상태 정보를 획득하기 위해서 인공지능 학습 모델을 통해 사용자 수면 상태 정보 추론을 진행할 수 있다.

한편, 본 발명의 목적을 달성하기 위한 일 실시예에 따른 수면 음향 정보와 수면 환경 정보를 멀티모달로 한 수면 상태 정보를 분석하기 위한 방법에 있어서, 사용자의 수면과 관련한 수면 음향 정보를 획득하는 제1 정보 획득 단계; 상기 수면 음향 정보를 딥러닝 모델의 입력으로 하여, 제1 수면 상태 정보를 추론하는 단계; 사용자의 수면과 관련한 사용자 수면 환경 정보를 획득하는 제2 정보 획득 단계; 상기 제1 수면 상태 정보와 제2 정보를 결합하여 사용자 수면 상태 정보를 획득하는 사용자 수면 상태 정보 획득 단계를 포함하는 수면 음향 정보와 수면 환경 정보를 멀티모달로 한 수면 상태 정보를 분석하기 위한 방법을 제공할 수 있다.

그리고, 본 발명의 일 실시예에 따르면 상기 제2 정보는 스마트 워치를 통해 얻어지는 사용자 정보일 수 있다.

또한, 본 발명의 일 실시예에 따르면 상기 제1 수면 상태 정보를 추론하는 단계는, 상기 획득된 제1 수면 정보를 제1 수면 정보의 전처리를 수행하는 단계를 포함할 수 있다.

그리고, 본 발명의 일 실시예에 따르면 상기 제1 정보의 전처리를 수행하는 단계는, 시간 도메인 상의 제1 정보를 주파수 도메인 상의 정보로 변환하는 단계를 포함할 수 있다.

또한, 본 발명의 일 실시예에 따르면 상기 사용자 수면 상태 정보 획득 단계는, 상기 제1 수면 상태 정보와 상기 제2 정보를 결합하는 수면 상태 정보 결합 단계를 더 포함할 수 있다.

그리고, 본 발명의 일 실시예에 따르면 상기 사용자 수면 상태 정보 획득 단계는, 상기 제1 수면 상태 정보와 상기 제2 정보를 활용하여 데이터 어그멘테이션을 진행하는 수면 상태 데이터 어그멘테이션 단계를 더 포함할 수 있다.

또한, 본 발명의 일 실시예에 따르면 상기 사용자 수면 상태 정보 획득 단계는, 상기 사용자 수면 상태 정보를 획득하기 위해서 인공지능 학습 모델을 통해 사용자 수면 상태 정보 추론을 진행할 수 있다.

한편, 본 발명의 목적에 달성하기 위한 일 실시예에 따른 수면 음향 정보와 수면 환경 정보를 멀티모달로 한 수면 상태 정보를 분석하기 위해 하나 이상의 프로세서에 의해 실행되도록 구성된 하나 이상의 프로그램을 저장한 비일시적 컴퓨터 판독가능 저장 매체로서, 상기 하나 이상의 프로그램은 전술한 방법 중 하나 이상의 방법을 수행하라는 명령어들을 포함하는, 비일시적 컴퓨터 판독가능 저장 매체를 제공할 수 있다.

또한, 본 발명의 목적을 달성하기 위한 일 실시예에 따른, 수면 음향 정보와 수면 환경 정보를 멀티모달로 한 수면 상태 정보를 분석하기 위한 장치에 있어서, 사용자의 수면과 관련한 수면 음향 정보를 획득하는 제1 정보 획득부; 상기 수면 음향 정보를 딥러닝 모델의 입력으로 하여, 제1 수면 상태 정보를 추론부; 사용자의 수면과 관련한 사용자 수면 환경 정보를 획득하는 제2 정보 획득부; 상기 제1 수면 상태 정보와 제2 정보를 결합하여 사용자 수면 상태 정보를 획득하는 사용자 수면 상태 정보 획득부를 포함하는 수면 음향 정보와 수면 환경 정보를 멀티모달로 한 수면 상태 정보를 분석하기 위한 장치를 제공할 수 있다.

또한, 본 발명의 일 실시예에 따르면 상기 제1 수면 상태 정보 추론부는, 상기 획득된 제1 수면 정보를 제1 수면 정보 전처리 수행부를 포함할 수 있다.

그리고, 본 발명의 일 실시예에 따르면 상기 제1 정보의 전처리 수행부는, 시간 도메인 상의 제1 정보를 주파수 도메인 상의 정보로 변환할 수 있다.

또한, 본 발명의 일 실시예에 따르면 상기 사용자 수면 상태 정보 획득부는, 상기 제1 수면 상태 정보와 상기 제2 정보를 결합하는 수면 상태 정보 결합부를 더 포함할 수 있다.

그리고, 본 발명의 일 실시예에 따르면 상기 사용자 수면 상태 정보 획득부는, 상기 제1 수면 상태 정보와 상기 제2 정보를 활용하여 데이터 어그멘테이션을 진행하는 수면 상태 데이터 어그멘테이션부를 더 포함할 수 있다.

또한, 본 발명의 일 실시예에 따르면 상기 사용자 수면 상태 정보 획득부는, 상기 사용자 수면 상태 정보를 획득하기 위해서 인공지능 학습 모델을 통해 사용자 수면 상태 정보 추론을 진행할 수 있다.

또한, 본 발명의 일 실시예에 따르면 수면 음향 정보 또는 수면 환경 정보 중 적어도 하나에 기초하여 실시간 수면 이벤트를 탐지하는 방법이 제공될 수 있다.

또한, 본 발명의 일 실시예에 따르면 비지도 학습 방법 또는 반지도 학습 방법에 의하여 수면 분석 인공지능 모델을 학습시키는 방법이 제공될 수 있다.

여기서, 본 발명의 실시예들에 따른 학습 방법에는 순차적 일관성 손실에 기초한 반지도 학습이 포함될 수 있다. 본 발명의 실시예에 따른 순차적 일관성 손실에 기초한 반지도 학습을 통해 음향 정보의 시계열적인 특성을 고려하도록 학습될 수 있다.

또는, 본 발명의 일 실시예에 따른 학습 방법에는 반지도 대조 손실에 기초한 학습이 포함될 수 있다. 본 발명의 실시예에 따른 반지도 대조 손실에 기초한 학습은 클래스 신뢰도 임계값을 설정하는 단계 및 상기 설정된 클래스 신뢰도 임계값에 기초하여 앵커 데이터를 기준으로 벡터 공간 상의 위치를 조정하는 단계가 포함될 수 있다.

여기서, 본 발명의 일 실시예에 따른 반지도 대조 손실에 기초한 학습에 사용되는 앵커 데이터는 수면 상태에 대한 라벨이 부여된 라벨링 데이터 또는 수면 상태에 대한 슈도 라벨이 부여된 슈도 라벨 데이터 중 적어도 하나 이상을 포함할 수 있다.

또한, 본 발명의 일 실시예에 따르면 음향 정보에 기초하여 멀티 태스크 학습을 통해 사용자의 수면 상태 정보를 분석하기 위한 딥러닝 모델이 제공될 수 있다.

여기서, 멀티 태스크 학습을 위하여 딥러닝 모델은 복수의 헤드를 갖는 것일 수 있으며, 이 경우 복수의 헤드에 포함되는 각각의 헤드는 복수의 태스크 중 서로 상이한 하나의 태스크를 수행할 수 있다.

본 발명의 실시예들에 따르면, 복수의 태스크는 멀티모달 학습, 수면 이벤트 분석, 수면 단계 분석 등의 태스크를 포함할 수 있다.

본 발명의 기타 구체적인 사항들은 상세한 설명 및 도면들에 포함되어 있다.

본 발명은 전술한 배경 기술에 대응하여 안출된 것으로, 사용자의 수면 환경에서 감지되는 음향 정보 또는 수면 환경 정보 중 적어도 하나 이상에 기반하여 사용자의 수면 상태를 판별하는 인공신경망 모델을 제공할 수 있다.

본 발명의 효과들은 이상에서 언급된 효과로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.

도 1a 내지 도 1c는 본 발명의 일실시예와 관련된 정보에 기반하여 수면 상태를 예측하는 수면 분석 모델을 생성하기 위한 다양한 양태가 구현될 수 있는 시스템을 나타낸 개념도이다.

도 2는 다양한 환경에서 획득되는 복수의 수면 음향 정보를 예시적으로 나타낸 예시도이다.

도 3은 본 발명의 일실시예와 관련된 정보에 기반하여 수면 상태를 예측하는 상기 수면 분석 모델을 생성하기 위한 컴퓨팅 장치의 블록 구성도이다.

도 4는 본 발명에 따른 수면 분석 방법에 있어서 수면 음향 정보를 획득하는 과정을 설명하기 위한 도면이다.

도 5는 본 발명에 따른 수면 분석 방법에 있어서 사용자로부터 추출된 수면 음향 정보에 대한 멜 스펙트로그램 변환을 이용한 프라이버시 보호 방법을 설명하기 위한 개념도이다.

도 6은 본 발명에 따른 수면 분석 방법에 있어서 수면 음향 정보에 대응하는 스펙트로그램을 획득하는 방법을 설명하기 위한 도면이다.

도 7은 본 발명에 따른 수면 분석 방법을 수행하기 위한 하나 이상의 네트워크 함수를 나타낸 개략도이다.

도 8은 본 발명에 따른 수면 분석 방법에 있어서 스펙트로그램을 이용한 수면 단계 분석을 설명하기 위한 도면이다.

도 9는 본 발명에 따른 수면 분석 방법에 있어서 스펙트로그램을 이용한 수면 이벤트 판단을 설명하기 위한 도면이다.

도 10은 본 발명에 따른 수면 분석 방법의 성능을 검증하기 위한 실험과정을 나타내는 도면이다.

도 11은 본 발명에 따른 수면 분석 방법의 성능을 검증한 그래프로, 수면다원검사(polysomnography, PSG) 결과(PSG result)와 본 발명에 따른 AI 알고리즘을 이용한 분석 결과(AI result)를 비교한 도면이다.

도 12는 본 발명에 따른 수면 분석 방법의 성능을 검증한 그래프로, 수면 무호흡증(apnea), 호흡저하(hypopnea)와 관련하여 수면다원검사(polysomnography, PSG) 결과(PSG result)와 본 발명에 따른 AI 알고리즘을 이용한 분석 결과(AI result)를 비교한 도면이다.

도 13은 본 발명의 일실시예에 따른 데이터 셋의 모식도이다.

도 14는 본 발명의 일실시예에 따른 노이즈 리덕션을 설명하기 위한 도면이다.

도 15는 본 발명의 일실시예에 따른 피치 시프팅(Pitch Shifting)을 설명하기 위한 도면이다.

도 16은 본 발명의 일실시예에 따라 주파수 도메인상의 정보 또는 스펙트로그램을 정방형에 가까운 형태로 변환하는 전처리 방법을 설명하기 위한 도면이다.

도 17a 및 도 17b는 본 발명의 일실시예에 따른 수면 분석 모델의 전체적인 구조를 설명하기 위한 도면이다.

도 18은 본 발명의 일실시예에 따른 피처 추출 모델과 피처 분류 모델을 설명하기 위한 도면이다.

도 19는 본 발명의 일실시예에 따른 수면 분석 모델의 동작을 자세히 설명하기 위한 도면이다.

도 20은 본 발명의 일실시예에 따른 비지도 또는 반지도 학습모델을 설명하기 위한 도면이다.

도 21은 본 발명의 일실시예에 따른 컨시스턴시 트레이닝(Consistency Training)을 설명하기 위한 도면이다.

도 22는 본 발명의 일실시예에 따른 UDA(Unsupervised Domain Adaptation)를 설명하기 위한 도면이다.

도 23은 본 발명의 일실시예에 따른 TUT(Tile UnTile) 어그멘테이션 방법을 설명하기 위한 도면이다.

도 24는 본 발명의 일실시예에 따른 자연어 처리 모델을 활용한 수면 분석 모델의 구조를 설명하기 위한 도면이다.

도 25는 본 발명의 일 실시예에 따른 음향 정보를 통해 사용자의 수면 상태를 분석하기 위한 방법을 예시적으로 나타낸 순서도를 도시한다.

도 26은 본 발명의 일실시예에 따른 수면 상태를 분석하기 위한 방법으로서, 수면 음향 정보와 수면 환경 정보를 멀티모달 데이터로 결합하는 과정을 포함하는 방법을 설명하기 위한 흐름도이다.

도 27은 본 발명의 일실시예에 따른 수면 상태를 분석하기 위한 방법으로서, 수면 음향 정보와 수면 환경 정보 각각을 추론한 것을 멀티모달 데이터로 결합하는 단계를 포함하는 방법을 설명하기 위한 흐름도이다.

도 28은 본 발명의 일실시예에 따른 수면 상태를 분석하기 위한 방법으로서, 수면 음향 정보를 추론한 것을 수면 환경 정보와 멀티모달 데이터로 결합하는 단계를 포함하는 방법을 설명하기 위한 흐름도이다.

도 29a 및 29b는 본 발명의 실시예들에 따른 수면 분석 방법에 있어서, 노이즈 부가 및, 수면 분석 모델의 수면 이벤트 판단의 성능을 설명하기 위한 도면이다.

도 30은 본 발명의 일 실시예에 따라, 시퀀스 내의 샘플의 수가 6인 경우의 일관성 손실 또는 순차적 일관성 손실에 기초한 학습 방법의 예시를 나타내는 도면이다.

도 31은 본 발명의 일 실시예에 따른 반지도 대조 손실에 기초한 학습 방법의 작동 메커니즘을 설명하기 위한 예시 도면이다.

도 32는 본 발명의 일 실시예에 따른 수면 분석 모델의 분석 결과와, 가정 환경에서의 PSG 테스트의 분석 결과를 비교한 표이다.

도 33은 PSG 오디오 데이터에 기반한 수면 분석 결과와, 본 발명의 일 실시예에 따른 수면 분석 모델의 분석 결과를 비교한 표이다.

도 34는 본 발명의 일 실시예에 따른, 수면 중 발생하는 수면 이벤트를 분석하기 위해 활용되는 선형회귀분석 함수를 설명하기 위한 도면이다.

전체적인 구성

본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나, 본 발명은 이하에서 개시되는 실시예들에 제한되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술 분야의 통상의 기술자에게 본 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.

본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성요소 외에 하나 이상의 다른 구성요소의 존재 또는 추가를 배제하지 않는다. 명세서 전체에 걸쳐 동일한 도면 부호는 동일한 구성 요소를 지칭하며, "및/또는"은 언급된 구성요소들의 각각 및 하나 이상의 모든 조합을 포함한다. 비록 "제1", "제2" 등이 다양한 구성요소들을 서술하기 위해서 사용되나, 이들 구성요소들은 이들 용어에 의해 제한되지 않음은 물론이다. 이들 용어들은 단지 하나의 구성요소를 다른 구성요소와 구별하기 위하여 사용하는 것이다. 따라서, 이하에서 언급되는 제1 구성요소는 본 발명의 기술적 사상 내에서 제2 구성요소일 수도 있음은 물론이다.

다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술분야의 통상의 기술자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있을 것이다. 또한, 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다.

명세서에서 사용되는 "부" 또는 "모듈"이라는 용어는 소프트웨어, FPGA 또는 ASIC과 같은 하드웨어 구성요소를 의미하며, "부" 또는 "모듈"은 어떤 역할들을 수행한다. 그렇지만 "부" 또는 "모듈"은 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. "부" 또는 "모듈"은 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 "부" 또는 "모듈"은 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로 코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 및 변수들을 포함한다. 구성요소들과 "부" 또는 "모듈"들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 "부" 또는 "모듈"들로 결합되거나 추가적인 구성요소들과 "부" 또는 "모듈"들로 더 분리될 수 있다.

본 명세서에서, 컴퓨터는 적어도 하나의 프로세서를 포함하는 모든 종류의 하드웨어 장치를 의미하는 것이고, 실시 예에 따라 해당 하드웨어 장치에서 동작하는 소프트웨어적 구성도 포괄하는 의미로서 이해될 수 있다. 예를 들어, 컴퓨터는 스마트폰, 태블릿 PC, 데스크톱, 노트북 및 각 장치에서 구동되는 사용자 클라이언트 및 애플리케이션을 모두 포함하는 의미로서 이해될 수 있으며, 또한 이에 제한되는 것은 아니다.

본 발명이 속하는 기술분야에서 통상의 지식을 가진 자들은 추가적으로 여기서 개시된 실시예들과 관련되어 설명된 다양한 예시적 논리적 블록들, 구성들, 모듈들, 회로들, 수단들, 로직들, 및 알고리즘 단계들이 전자 하드웨어, 컴퓨터 소프트웨어, 또는 양쪽 모두의 조합들로 구현될 수 있음을 인식해야 한다. 하드웨어 및 소프트웨어의 상호교환성을 명백하게 예시하기 위해, 다양한 예시적 컴포넌트들, 블록들, 구성들, 수단들, 로직들, 모듈들, 회로들, 및 단계들은 그들의 기능성 측면에서 일반적으로 위에서 설명되었다. 그러한 기능성이 하드웨어로 또는 소프트웨어로서 구현되는지 여부는 전반적인 시스템에 부과된 특정 어플리케이션(application) 및 설계 제한들에 달려 있다. 숙련된 기술자들은 각각의 특정 어플리케이션들을 위해 다양한 방법들로 설명된 기능성을 구현할 수 있다. 다만, 그러한 구현의 결정들이 본 발명내용의 영역을 벗어나게 하는 것으로 해석되어서는 안 된다.

이하, 첨부된 도면을 참조하여 본 발명의 실시예를 상세하게 설명한다.

본 명세서에서 설명되는 각 단계들은 컴퓨터에 의하여 수행되는 것으로 설명되나, 각 단계의 주체는 이에 제한되는 것은 아니며, 실시예에 따라 각 단계들의 적어도 일부가 서로 다른 장치에서 수행될 수도 있다.

도 1a 내지 도 1c는 본 발명의 일실시예와 관련된 정보에 기반하여 수면 상태를 예측하는 수면 분석 모델을 생성하기 위한 방법의 다양한 양태가 구현될 수 있는 시스템을 나타낸 개념도를 도시한다.

본 발명의 실시예들에 따른 시스템은 컴퓨팅 장치(100), 사용자 단말(10), 외부 서버(20) 및 네트워크를 포함할 수 있다.

여기서, 도 1a에 도시된 장치들은 본 발명을 구현하기 위한 시스템의 하나의 예시일 뿐이고, 그 구성이 도 1a에 도시된 실시예에 한정되는 것은 아니며, 필요에 따라 부가, 변경 또는 삭제될 수 있다.

한편, 도 1b 및 도 1c는 본 발명의 또 다른 실시예와 관련된 수면 분석 방법이 수행되는 다양한 양태가 구현될 수 있는 시스템을 나타낸 개념도를 도시한다.

먼저, 도 1a에 도시된 실시예에 따른 시스템에 대하여 설명하기로 한다.

도 1a에 도시된 바와 같이, 본 발명은 컴퓨팅 장치(100), 사용자 단말(10), 외부 서버(20)는 네트워크를 통해, 본 발명의 일실시예들에 따른 시스템을 위한 데이터를 상호 송수신할 수 있다.

본 발명의 일 실시예에 따르면, 컴퓨팅 장치(100) 또는 외부 서버(20)는 클라우드 컴퓨팅 서비스를 제공하는 서버일 수 있다. 보다 구체적으로, 컴퓨팅 장치(100) 또는 외부 서버(20)는 인터넷 기반 컴퓨팅의 일종으로 정보를 사용자의 컴퓨터가 아닌 인터넷에 연결된 다른 컴퓨터로 처리하는 클라우드 컴퓨팅 서비스를 제공하는 서버일 수 있다. 상기 클라우드 컴퓨팅 서비스는 인터넷 상에 자료를 저장해 두고, 사용자가 필요한 자료나 프로그램을 자신의 컴퓨터에 설치하지 않고도 인터넷 접속을 통해 언제 어디서나 이용할 수 있는 서비스일 수 있으며, 인터넷 상에 저장된 자료들을 간단한 조작 및 클릭으로 쉽게 공유하고 전달할 수 있다.

또한, 클라우드 컴퓨팅 서비스는 인터넷 상의 서버에 단순히 자료를 저장하는 것뿐만 아니라, 별도로 프로그램을 설치하지 않아도 웹에서 제공하는 응용프로그램의 기능을 이용하여 원하는 작업을 수행할 수 있으며, 여러 사람이 동시에 문서를 공유하면서 작업을 진행할 수 있는 서비스일 수 있다.

또한, 클라우드 컴퓨팅 서비스는 IaaS(Infrastructure as a Service), PaaS(Platform as a Service), SaaS(Software as a Service), 가상 머신 기반 클라우드 서버 및 컨테이너 기반 클라우드 서버 중 적어도 하나의 형태로 구현될 수 있다. 즉, 본 발명의 컴퓨팅 장치(100) 또는 외부 서버(20)는 상술한 클라우드 컴퓨팅 서비스 중 적어도 하나의 형태로 구현될 수 있다. 전술한 클라우드 컴퓨팅 서비스의 구체적인 기재는 예시일 뿐, 본 발명의 클라우드 컴퓨팅 환경을 구축하는 임의의 플랫폼을 포함할 수도 있다.

본 발명의 실시예들에 따른 네트워크는 공중전화 교환망(PSTN: Public Switched Telephone Network), xDSL(x Digital Subscriber Line), RADSL(Rate Adaptive DSL), MDSL(Multi Rate DSL), VDSL(Very High Speed DSL), UADSL(Universal Asymmetric DSL), HDSL(High Bit Rate DSL) 및 근거리 통신망(LAN) 등과 같은 다양한 유선 통신 시스템들을 사용할 수 있다. 또한, 여기서 제시되는 네트워크는 CDMA(Code Division Multi Access), TDMA(Time Division Multi Access), FDMA(Frequency Division Multi Access), OFDMA(Orthogonal Frequency Division Multi Access), SC-FDMA(Single Carrier-FDMA) 및 다른 시스템들과 같은 다양한 무선 통신 시스템들을 사용할 수 있다.

본 발명의 실시예들에 따른 네트워크는 유선 및 무선 등과 같은 그 통신 양태를 가리지 않고 구성될 수 있으며, 단거리 통신망(PAN: Personal Area Network), 근거리 통신망(WAN: Wide Area Network) 등 다양한 통신망으로 구성될 수 있다. 또한, 상기 네트워크는 공지의 월드와이드웹(WWW: World Wide Web)일 수 있으며, 적외선(IrDA: Infrared Data Association) 또는 블루투스(Bluetooth)와 같이 단거리 통신에 이용되는 무선 전송 기술을 이용할 수도 있다. 본 명세서에서 설명된 기술들은 위에서 언급된 네트워크들뿐만 아니라, 다른 네트워크들에서도 사용될 수 있다.

본 발명의 일실시예에 따르면, 사용자 단말(10)은 컴퓨팅 장치(100)와의 정보 교환을 통해 사용자의 수면과 관련한 정보를 제공받을 수 있는 단말로, 사용자가 소지한 단말을 의미할 수 있다. 예컨대, 사용자 단말(10)은 자신의 수면 습관에 관련한 정보들을 통해 건강을 증진시키고자 하는 사용자와 관련한 단말일 수 있다.

이러한 사용자 단말(10)은 외부 서버(20) 또는 컴퓨팅 장치(100)와 통신을 위한 메커니즘을 갖는 시스템에서의 임의의 형태의 엔티티(들)를 의미할 수 있다. 예를 들어, 이러한 사용자 단말(10)은 PC(personal computer), 노트북(note book), 모바일 단말기(mobile terminal), 스마트 폰(smartphone), 태블릿 PC(tablet pc), 인공지능(AI) 스피커 및 인공지능 TV 및 웨어러블 디바이스(wearable device), 가전기기 등을 포함할 수 있으며, 유/무선 네트워크에 접속할 수 있는 모든 종류의 단말을 포함할 수 있다. 또한, 사용자 단말(10)은 에이전트, API(Application Programming Interface) 및 플러그-인(Plug-in) 중 적어도 하나에 의해 구현되는 임의의 서버를 포함할 수도 있다. 또한, 사용자 단말(10)은 애플리케이션 소스 및/또는 클라이언트 애플리케이션을 포함할 수 있다.

본 발명의 일 실시예에 따르면, 외부 서버(20)는 신경망의 학습을 위한 복수의 학습 데이터에 대한 정보들을 저장하는 서버일 수 있다. 또는, 외부 서버(20)는 디지털 기기로서, 랩탑 컴퓨터, 노트북 컴퓨터, 데스크톱 컴퓨터, 웹 패드, 이동 전화기와 같이 프로세서를 탑재하고 메모리를 구비한 연산 능력을 갖춘 디지털 기기일 수 있다. 외부 서버(20)는 서비스를 처리하는 웹 서버일 수 있다. 전술한 서버의 종류는 예시일 뿐이며 본 발명은 이에 제한되지 않는다. 복수의 학습 데이터는 예컨대, 복수의 사용자 단말로부터 획득된 수면 음향 정보, 또는 병원에서 획득된 건강검진 정보 및 수면검진 정보 등을 포함할 수 있다. 학습 데이터셋에 대한 자세한 설명은 후술하도록 한다.

본 발명의 일 실시예에 따르면, 외부 서버(20)는 병원 서버 및 정부 서버 중 적어도 하나일 수 있으며, 복수의 수면다원검사 기록, 전자건강기록 및 전자의료기록 등에 관한 정보를 저장하는 서버일 수 있다. 예를 들어, 수면다원검사 기록은 수면검진 대상자의 수면 동안의 호흡 및 움직임 등에 대한 정보 및 해당 정보들에 대응하는 수면 진단 결과(예컨대, 수면 단계 등)에 대한 정보를 포함할 수 있다. 외부 서버(20)에 저장된 정보들은 본 발명에서의 신경망을 학습시키기 위한 학습 데이터, 검증 데이터 및 테스트 데이터로 활용될 수 있다.

또한, 본 발명의 일 실시예에 따른 외부 서버(20)는 수면 상태 정보를 분석하기 위한 인공지능 모델이 기록될 수 있다. 이 경우 사용자 단말(10) 등으로부터 수면 환경 정보를 획득하고, 외부 서버에 송신하면, 외부 서버에 실장된 인공지능 모델을 통해 수면 환경 정보에 기초하여 수면 상태 정보를 생성할 수 있다.

또는, 본 발명의 일 실시예에 따라 사용자 단말(10)에서 수면 환경 정보를 획득하고, 사용자 단말(10)에서 수면 환경 정보의 전처리를 통해 수면 음향 정보를 획득하면, 획득한 수면 음향 정보를 외부 서버에 송신하고, 외부 서버는 수신된 수면 음향 정보에 기초하여 수면 상태 정보를 생성할 수도 있다.

본 발명의 컴퓨팅 장치(100)는 외부 서버(20)로부터 복수의 수면 음향 정보, 건강검진 정보 또는 수면 검진 정보 등을 수신하고, 해당 정보들에 기초하여 학습 데이터 세트를 구축할 수 있다. 컴퓨팅 장치(100)는 학습 데이터 세트를 통해 하나 이상의 네트워크 함수에 대한 학습을 수행함으로써, 수면 음향 정보에 대응하여 수면 상태 정보를 산출하는 수면 분석 모델을 생성할 수 있다.

본 발명의 일 실시예에 따르면, 사용자 단말(10), 컴퓨팅 장치(100) 또는 외부 서버(20) 중 적어도 하나 이상이 수면 분석 모델을 생성할 수 있다. 수면 분석 모델은, 사용자의 수면 동안 비침습적으로 획득되는 사용자의 수면 음향에 관련한 정보에 기초하여 사용자의 수면 상태에 관한 정보를 예측하는 신경망 모델일 수 있다. 본 발명의 실시예들에 따른 전자장치들 중 적어도 하나 이상이 사용자의 수면 음향 정보를 입력으로 하여 사용자의 수면 상태 정보를 출력하는 수면 분석 모델을 생성할 수 있다. 본 발명의 신경망 학습을 위한 학습 데이터 세트를 구축하는 구성 및 학습 데이터 세트를 활용한 학습 방법, 수면 분석 모델의 생성 및 학습에 대한 구체적인 설명은 후술하도록 한다.

본 발명의 일 실시예에 따르면, 사용자는 사용자 단말(10)을 통해 자신의 수면에 관련한 모니터링 정보를 획득할 수 있다. 본 발명의 일 실시예에 따른 전자장치들 중 적어도 하나 이상은 수면 음향 정보를 획득 또는 수신하는 경우, 수면 음향 정보를 수면 분석 모델의 입력으로 처리하여, 수면 분석 모델로 하여금 수면 상태 정보를 출력하도록 할 수 있다.

한편, 본 발명의 일 실시예에 따르면, 사용자 단말(10) 등의 전자장치로부터 획득된 수면 음향 정보는 낮은 신호 대 잡음비(SNR)를 가질 수 있다. 일반적으로, 사용자가 소지한 사용자 단말(10)에 구비된 마이크 모듈은, 비교적 작은 크기의 사용자 단말(10)에 구비되어야 하므로 MEMS(Micro-Electro Mechanical Systems)로 구성될 수 있다. 사용자 단말(10)에 구비된 마이크 모듈은, 예컨대, Common microphone(저성능, 소형 마이크)일 수 있다. 이러한 마이크 모듈은 매우 소형으로 제작이 가능하나, 콘덴서 마이크(Condenser Microphone)나 다이나믹 마이크(dynamic microphone)에 비해 낮은 신호 대 잡음비를 가질 수 있다. 신호 대 잡음비가 낮다는 것은, 식별하고자 하는 음향 대비 식별하지 않고자 하는 음향인 잡음의 비율이 높은 것으로 음향의 식별이 용이하지 않음(즉, 불분명함)을 의미할 수 있다. 이러한 수면 음향 정보는, 사용자의 호흡 및 움직임 등 매우 작은 음향(즉, 구분이 어려운 음향)에 관한 정보이며, 수면 환경 동안 다른 음향들과 함께 획득되는 것이므로, 상기한 바와 같은 마이크 모듈(즉, 낮은 신호 대 잡음비를 갖는 마이크 모듈)을 통해 획득되는 경우, 정보 도출 및 분석이 매우 어려울 수 있다.

따라서, 본 발명의 일 실시예에 따르면, 다양한 전자장치들 중 적어도 하나는, 많은 노이즈를 포함하여 불명료하게 획득된 수면 음향 데이터를 분석이 가능한 데이터로 변환 및/또는 조정할 수 있으며, 변환 및/또는 조정된 데이터를 활용하여 인공 신경망에 대한 학습을 수행할 수 있다. 인공 신경망에 대한 사전 학습이 완료된 경우, 학습된 신경망(예컨대, 음향 분석 모델)은 수면 음향 정보에 대응하여 획득된(예컨대, 변환 및/또는 조정된) 데이터(예컨대, 로우(raw) 수면 음향 정보에 포함된 주파수 성분들의 시간 축에 따른 변화를 포함하는 정보, 주파수 도메인상의 정보 또는 스펙트로그램)에 기초하여 사용자의 수면 상태 정보를 획득할 수 있다.

본 발명의 일 실시예에 따르면, 컴퓨팅 장치(100)는 음향을 수집하도록 일반적으로 많이 보급된 사용자 단말(예컨대, 인공지능 스피커, 침실 IoT기기, 휴대폰 등)을 통해 낮은 신호 대 잡음비를 갖는 수면 음향 정보를 획득하는 경우, 이를 분석에 적절한 데이터로 가공하고, 가공된 데이터를 처리하여 수면 단계의 변화에 관련한 수면 상태 정보를 제공할 수 있다. 이는 명료한 음향 획득을 위해 사용자의 신체에 접촉식으로 마이크를 구비하지 않아도 되며, 또한, 높은 신호 대 잡음비를 가진 별도의 추가 디바이스를 구매하지 않고 소프트웨어 업데이트 만으로 일반적인 가정 환경에서 수면 상태를 모니터링할 수 있게 하여 편의성을 증대시키는 효과를 제공할 수 있다.

수면에 관련한 모니터링 정보는 예컨대, 사용자가 잠에 든 시점, 잠을 잔 시간, 잠에서 깨어난 시점 등에 관련한 수면 상태 정보 또는, 구체적으로는 수면 동안 수면 단계의 변화에 관련한 수면 단계 정보를 포함할 수 있다.

구체적인 예를 들어, 수면 단계 정보는, 사용자의 지난 밤 8시간 수면 동안 각 시점 별로 사용자의 수면이 얕은 수면, 보통 수면, 깊은 수면 또는 REM 수면 등으로 변화한 정보를 의미할 수 있다. 전술한 수면 단계 정보에 대한 구체적인 기재는 예시일 뿐, 본 발명은 이에 제한되지 않는다.

한편, 도 1b에 도시된 바와 같이, 별도의 컴퓨팅 장치가 없어도 사용자 단말(10) 또는 외부 서버(20)에서 본 발명에 따른 수면 분석이 수행될 수도 있다.

한편, 도 1c는 본 발명의 또 다른 실시예와 관련된 다양한 전자장치들의 다양한 양태가 구현될 수 있는 시스템을 나타낸 개념도를 도시한다.

도 1c에 도시된 전자장치들은, 본 발명의 실시예에 따른 다양한 장치들이 수행하는 동작들 중 적어도 하나 이상을 수행할 수 있다.

예를 들어, 본 발명의 실시예에 따른 다양한 장치들이 수행하는 동작들은, 수면 환경 정보 또는 환경 센싱 정보를 획득하는 동작, 수면 분석 모델을 학습하는 동작, 수면 분석 모델을 통해 수면 상태를 추론하는 동작, 수면 상태 정보를 획득하는 동작을 포함할 수 있다.

또는, 예컨대, 사용자의 수면과 관련한 정보 또는 수면 환경 정보를 제공받거나, 환경 센싱 정보를 송신 또는 수신하거나, 환경 센싱 정보를 판별하거나, 데이터를 처리 또는 가공하거나, 서비스를 처리하거나, 서비스를 제공하거나, 수면 상태를 분석하거나, 사용자의 수면과 관련한 정보에 기초하여 학습 데이터 세트를 구축하거나, 획득한 데이터 또는 신경망의 학습을 위한 복수의 학습 데이터에 대한 정보들을 저장하거나, 다양한 정보들을 송신 또는 수신하거나, 네트워크를 통해 본 발명의 실시예들에 따른 시스템을 위한 데이터를 상호 송수신하는 동작 등을 포함할 수도 있다.

도 1c에 도시된 전자장치들은, 상기 본 발명의 실시예에 따른 다양한 장치들이 수행하는 동작들을 개별적으로 수행할 수도 있으나, 하나 이상의 동작을 동시에 또는 시계열적으로 수행할 수도 있다.

도 1c를 참조하면, 전자장치(참조번호 1a 내지 1d)는 사용자의 움직임이나 또는 호흡에 관한 정보 등 객체 상태 정보를 획득할 수 있는 영역(11a)의 범위 내에 있는 전자장치일 수 있다. 이하, 편의상 사용자의 움직임이나 또는 호흡에 관한 정보 등의 객체 상태 정보 또는 환경 센싱 정보를 획득할 수 있는 영역(11a)을 "영역(11a)"이라 지칭하기로 한다.

한편, 도 1c를 참조하면, 전자장치(참조번호 1a 및 1d)는 2개 이상의 복수 개의 전자장치의 조합으로 이루어진 장치일 수 있다.

한편, 도 1c를 참조하면, 전자장치(참조번호 1a 및 1b)는 영역(11a) 내에서 네트워크와 연결된 전자장치일 수 있다.

한편, 도 1c를 참조하면, 전자장치(참조번호 1c 및 1d)는 영역(11a) 내에서 네트워크와 연결되지 않은 전자장치일 수 있다.

한편, 도 1c를 참조하면, 전자장치(참조번호 2a 내지 2b)는 영역(11a)의 범위 밖에 있는 전자장치일 수 있다.

한편, 도 1c를 참조하면, 영역(11a)의 범위 내에서 전자장치들과 상호작용하는 네트워크가 있을 수 있고, 영역(11a)의 범위 밖에서 전자장치들과 상호작용하는 네트워크가 있을 수 있다.

여기서, 영역(11a)의 범위 내에서 전자장치들과 상호작용하는 네트워크는 스마트 가전기기를 제어하기 위한 정보를 송수신하기 위한 역할을 수행할 수 있다.

또한, 영역(11a)의 범위 내에서 전자장치들과 상호작용하는 네트워크는 예를 들면, 근거리 네트워크 또는 로컬 네트워크일 수 있다. 여기서, 영역(11a)의 범위 내에서 전자장치들과 상호작용하는 네트워크는 예를 들면, 원거리 네트워크 또는 글로벌 네트워크일 수 있다.

도 1c에 도시된 네트워크들의 동작에 대한 구체적인 설명은 앞서 설명한 것과 동일하므로, 중복되는 기재는 생략하기로 한다.

한편, 도 1c를 참조하면, 영역(11a)의 범위 밖에서 네트워크를 통해 연결된 전자장치들은 하나 이상일 수 있으며, 이 경우의 전자장치들은 서로 데이터를 분산처리하거나 또는 하나 이상의 동작을 나누어 수행할 수도 있다.

또는, 영역(11a)의 범위 밖에서 네트워크를 통해 연결된 전자장치가 하나 이상인 경우 전자장치들은 서로 독립하여 다양한 동작을 수행할 수도 있다.

한편, 본 발명의 일 실시예에 따르면, 도 3에 도시된 바와 같이, 컴퓨팅 장치(100)는 네트워크부(110), 메모리(120) 및 프로세서(130)를 포함할 수 있다. 전술한 컴퓨팅 장치(100)에 포함된 컴포넌트들은 예시적인 것으로서 본 발명내용의 권리범위가 전술한 컴포넌트들로 제한되지 않는다. 즉, 본 발명내용의 실시예들에 대한 구현 양태에 따라서 추가적인 컴포넌트들이 포함되거나 또는 전술한 컴포넌트들 중 일부가 생략될 수 있다.

본 발명의 일 실시예에 따르면, 컴퓨팅 장치(100)는 사용자 단말(10) 및 외부 서버(20)와 데이터를 송수신하는 네트워크부(110)를 포함할 수 있다. 네트워크부(110)는 본 발명의 일 실시예에 따른 수면 음향 정보에 기반하여 수면 상태를 분석하기 위한 방법을 수행하기 위한 데이터 등을 다른 컴퓨팅 장치, 서버 등과 송수신할 수 있다. 즉, 네트워크부(110)는 컴퓨팅 장치(100)와 사용자 단말(10) 및 외부 서버(20) 간의 통신 기능을 제공할 수 있다. 예를 들어, 네트워크부(110)는 사용자 단말(10)로부터 수면 음향 정보를 수신할 수 있으며, 수신한 수면 음향 정보에 대응하는 수면 상태 정보를 사용자 단말(10)로 전송할 수 있다. 또한, 예를 들어, 네트워크부(110)는 병원 서버로부터 복수의 사용자들에 대한 수면검진기록 및 전자건강기록을 수신할 수 있다. 추가적으로, 네트워크부(110)는 컴퓨팅 장치(100)로 프로시저를 호출하는 방식으로 컴퓨팅 장치(100)와 사용자 단말(10) 및 외부 서버(20) 간의 정보 전달을 허용할 수 있다.

본 발명의 일 실시예에 따른 네트워크부(110)는 상술한 네트워크와 같은, 다양한 유선/무선 통신 시스템들을 사용할 수 있다. 네트워크에 대한 설명은 앞서 서술하였기 때문에, 중복되는 서술은 생략하기로 한다.

본 발명의 일 실시예에 따르면, 메모리(120)는 본 발명의 일 실시예에 따른 음향 정보에 기반하여 수면 상태를 예측하는 수면 분석 모델을 생성하기 위한 및 수면 음향 정보를 통해 수면 상태를 분석하기 위한 방법을 수행하기 위한 컴퓨터 프로그램을 저장할 수 있으며, 저장된 컴퓨터 프로그램은 프로세서(130)에 의하여 판독되어 구동될 수 있다. 또한, 메모리(120)는 프로세서(130)가 생성하거나 결정한 임의의 형태의 정보 및 네트워크부(110)가 수신한 임의의 형태의 정보를 저장할 수 있다. 또한, 메모리(120)는 사용자의 수면에 관련한 데이터를 저장할 수 있다. 예를 들어, 메모리(120)는 입/출력되는 데이터들(예를 들어, 사용자의 수면 환경에 관련한 수면 음향 정보, 수면 음향 정보에 대응하는 수면 상태 정보 등)을 임시 또는 영구 저장할 수도 있다.

본 발명의 일 실시예에 따르면, 메모리(120)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(Random Access Memory, RAM), SRAM(Static Random Access Memory), 롬(Read-Only Memory, ROM), EEPROM(Electrically Erasable Programmable Read-Only Memory), PROM(Programmable Read-Only Memory), 자기 메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다. 컴퓨팅 장치(100)는 인터넷(internet) 상에서 상기 메모리(120)의 저장 기능을 수행하는 웹 스토리지(web storage)와 관련되어 동작할 수도 있다. 전술한 메모리에 대한 기재는 예시일 뿐, 본 발명은 이에 제한되지 않는다.

본 발명의 일 실시예에 따르면, 프로세서(130)는 하나 이상의 코어로 구성될 수 있으며, 컴퓨팅 장치의 중앙 처리 장치(CPU: central processing unit), 범용 그래픽 처리 장치 (GPGPU: general purpose graphics processing unit), 텐서 처리 장치(TPU: tensor processing unit) 등의 데이터 분석, 머신 러닝 또는 딥 러닝을 위한 프로세서를 포함할 수 있다.

본 발명의 일 실시예에 따른 프로세서(130)는 메모리(120)에 저장된 컴퓨터 프로그램을 판독하여 모델의 학습을 위한 데이터 처리를 수행할 수 있다. 본 발명의 일 실시예에 따라 프로세서(130)는 신경망의 학습을 위한 연산을 수행할 수 있다. 프로세서(130)는 머신 러닝 또는 딥 러닝에서 학습을 위한 입력 데이터의 처리, 입력 데이터에서의 피처 추출, 오차 계산, 역전파(backpropagation)를 이용한 신경망의 가중치 업데이트 등의 신경망의 학습을 위한 계산을 수행할 수 있다.

또한, 프로세서(130)의 CPU, GPGPU, 및 TPU 중 적어도 하나가 네트워크 함수의 학습을 처리할 수 있다. 예를 들어, CPU 와 GPGPU가 함께 네트워크 함수의 학습, 네트워크 함수를 이용한 데이터 분류를 처리할 수 있다. 또한, 본 발명의 일 실시예에서 복수의 컴퓨팅 장치의 프로세서를 함께 사용하여 네트워크 함수의 학습, 네트워크 함수를 이용한 데이터 분류를 처리할 수 있다. 또한, 본 발명의 일 실시예에 따른 컴퓨팅 장치에서 수행되는 컴퓨터 프로그램은 CPU, GPGPU 또는 TPU 실행가능 프로그램일 수 있다.

본 명세서에서 네트워크 함수는 인공 신경망, 뉴럴 네트워크와 상호 교환 가능하게 사용될 수 있다. 본 명세서에서 네트워크 함수는 하나 이상의 뉴럴 네트워크를 포함할 수도 있으며, 이 경우 네트워크 함수의 출력은 하나 이상의 뉴럴 네트워크의 출력의 앙상블(ensemble)일 수 있다. 또한, 본 명세서에서 모델은 네트워크 함수를 포함할 수 있다. 모델은 하나 이상의 네트워크 함수를 포함할 수도 있으며, 이 경우 모델의 출력은 하나 이상의 네트워크 함수의 출력의 앙상블일 수 있다.

프로세서(130)는 메모리(120)에 저장된 컴퓨터 프로그램을 판독하여 본 발명의 일 실시예에 따른 수면 분석 모델을 실행할 수 있다. 본 발명의 일 실시예에 따라, 프로세서(130)는 수면 센싱 데이터에 기초하여 수면 분석 정보를 산출하기 위한 계산을 수행할 수 있다. 또는, 본 발명의 일 실시예에 따라 프로세서(130)는 수면 분석 모델을 학습시키기 위한 계산을 수행할 수 있다.

본 발명의 일 실시예에 따르면, 프로세서(130)는 통상적으로 컴퓨팅 장치(100)의 전반적인 동작을 처리할 수 있다. 프로세서(130)는 위에서 살펴본 구성요소들을 통해 입력 또는 출력되는 신호, 데이터, 정보 등을 처리하거나 메모리(120)에 저장된 응용 프로그램을 구동함으로써, 사용자 단말에게 적정한 정보 또는, 기능을 제공하거나 처리할 수 있다.

본 발명의 일 실시예에 따르면, 프로세서(130)는 신경망(또는 하나 이상의 네트워크 함수)에 대한 학습을 수행하기 위하여, 복수의 학습 데이터를 획득할 수 있다. 복수의 학습 데이터는 복수의 사용자 각각에 관련한 복수의 수면 음향 정보에 관련한 것일 수 있다. 프로세서(130)는 복수의 사용자의 수면과 관련한 복수의 수면 음향 정보를 획득할 수 있으며, 해당 복수의 수면 음향 정보를 포함하는 학습 데이터 세트를 통해 하나 이상의 네트워크 함수에 대한 학습을 수행하여 수면 분석 모델을 생성할 수 있다.

본 발명의 일 실시예에 따르면, 복수의 수면 음향 정보의 획득은, 메모리(120)에 저장된 수면 음향 정보를 획득하거나, 또는 로딩(loading)하는 것일 수 있다. 일 실시예에서, 네트워크부(110)를 통해 외부 서버(20)로부터 복수의 수면 음향 정보가 수신될 수 있으며, 수신된 수면 음향 정보들은 메모리(120)에 저장될 수 있다. 또한, 수면 음향 정보의 획득은, 유/무선 통신 수단에 기초하여 다른 저장 매체, 다른 컴퓨팅 장치, 또는 동일한 컴퓨팅 장치 내의 별도 처리 모듈로부터 데이터를 수신하거나 또는 로딩하는 것일 수 있다.

수면 상태 정보

한편, 본 발명에 있어서, 수면 상태 정보는 사용자가 수면을 취하고 있는지 여부에 관련한 정보일 수 있다. 구체적으로, 수면 상태 정보는, 사용자가 수면 전이라는 제1수면 상태 정보, 사용자가 수면 중이라는 제2수면 상태 정보 및 사용자가 수면 후라는 제3수면 상태 정보 중 적어도 하나를 포함할 수 있다. 다시 말해, 사용자에 관련하여 제1수면 상태 정보가 추론되는 경우, 프로세서(130)는 해당 사용자가 수면 전(즉, 취침 전)인 상태인 것으로 판단할 수 있으며, 제2수면 상태 정보가 추론되는 경우, 해당 사용자가 수면 중인 상태인 것으로 판단할 수 있고, 그리고 제3 수면 상태 정보가 획득되는 경우, 해당 사용자가 수면 후(즉, 기상)인 상태인 것으로 판단할 수 있다.

이러한 수면 상태 정보는, 환경 센싱 정보 또는 Actigraphy 등에 기초하여 획득될 수 있다. 환경 센싱 정보는, 비접촉 방식으로 사용자가 위치한 공간에서 획득되는 센싱 정보일 수 있다. 예를 들어, 프로세서(130)는 획득된 환경 센싱 정보(청소에 관련한 음향 정보, 음식 조리에 관련한 음향 정보, TV 시청에 관련한 음향 정보, 수면 중 획득되는 수면 음향 정보 등), Actigraphy, 생체정보 등에 기초하여 수면 상태 정보를 추출할 수 있다. 이때, 사용자의 수면 중 획득되는 수면 음향 정보는, 수면 중 사용자가 뒤척거림에 따라 발생되는 음향, 근육 움직임에 관련한 음향 또는 수면 중 호흡 사운드 등을 포함할 수 있다. 즉, 본 발명에서의 수면 음향 정보는 사용자의 수면 동안에 관련한 움직임 패턴 및 호흡 패턴에 관련한 음향 정보를 의미할 수 있다.

또한, 본 발명의 일 실시예에 따른 수면 상태 정보는, 수면 단계 정보 외에도 수면 중의 호흡과 관련한 정보, 이갈이 정보, 기침을 하는지 여부, 기침의 정도, 재채기 여부, 뒤척임 정보, 잠꼬대 정보 등, 수면 이벤트와 관련한 다양한 정보를 포함할 수 있다.

수면 단계 정보

일 실시예에 따르면, 프로세서(130)는 수면 단계 정보를 추출할 수 있다. 수면 단계 정보는 사용자의 환경 센싱 정보에 기초하여 추출될 수 있다. 수면 단계는 NREM(non-REM) 수면, REM(Rapid eye movement) 수면으로 구분될 수 있고, NREM 수면은 다시 복수(예: Light, Deep의 2단계, N1 내지 N4의 4단계)로 구분될 수 있다. 수면 단계의 설정은 일반적인 수면 단계로 정의될 수도 있지만, 설계자에 따라 다양한 수면 단계로 임의 설정될 수도 있다. 수면 단계 분석을 통하여 수면과 관련한 수면의 질 뿐만 아니라 수면 질환(예: 수면 무호흡증)과 그의 근본적인 원인(예: 코골이) 등, 다양한 수면 이벤트까지 예측할 수 있다.

수면 환경 정보

실시예에서, 사용자 단말(10)을 통해 본 발명의 수면 환경 정보가 획득될 수 있다. 수면 환경 정보는, 사용자가 위치한 공간에서 획득되는 수면과 관련한 정보를 의미할 수 있다. 수면 환경 정보는, 비접촉식 방법으로 사용자가 위치한 공간에서 획득되는 센싱 정보일 수 있다. 수면 환경 정보는, 스마트 워치, 스마트 가전 등에서 획득되는 사용자의 수면에 관련한 정보일 수 있다.

예를 들어, 수면 환경 정보는, 사용자가 수면을 취하는 침실에서 획득되는 음향 정보일 수 있다. 실시예에 따르면, 사용자 단말(10)을 통해 획득된 수면 환경 정보는, 본 발명에서 사용자의 수면 상태 정보를 획득하기 위한 기반이 되는 정보일 수 있다. 구체적인 예를 들어, 사용자의 활동에 관련하여 획득되는 수면 환경 정보를 통해 사용자가 수면 전인지, 수면 중인지 또는 수면 후인지 여부에 관련한 수면 상태 정보가 획득될 수 있다. 또 다른 구체적인 예를 들어, 수면 환경 정보는 사용자의 심박수, 사용자의 호흡, 사용자의 수면 환경에 관한 조도, 소음 정보 등, 다양한 정보를 포함할 수 있다.

또한, 수면 환경 정보는 일상생활에서 흔히 발생하는 노이즈 정보(청소에 관련한 음향 정보, 음식 조리에 관련한 음향 정보, TV 시청에 관련한 음향 정보, 고양이 소리, 강아지 소리, 새 소리, 차 소리, 바람 소리, 비 소리 등) 또는, 기타 생체 정보(심전도, 뇌파, 맥박 정보, 근육 움직임에 관한 정보 등) 중 적어도 하나 이상일 수 있다.

수면 분석을 위한 데이터

본 발명의 일 실시예에 따른 데이터는, 마이크로폰을 통해 수집된 로우(raw) 음향 정보일 수 있다. 여기서 로우 음향 정보는 진폭, 위상, 주파수를 가지는 시간 도메인상의 정보일 수 있다.

또한, 본 발명의 일 실시예에 따른 데이터는, 로우 음향 정보를, 로우 음향 정보의 주파수 성분들의 시간 축에 따른 변화를 포함하는 정보로 변환한 것일 수 있다.

또는, 본 발명의 일 실시예에 따른 데이터는, 로우 음향 정보를 시간 도메인상의 정보가 아닌, 주파수 도메인상의 정보로 변환한 것일 수 있다. 여기서 주파수 도메인상의 정보로 변환하기 위하여 푸리에 변환(Fourier Transform) 또는 웨이블릿 변환(Wavelet Transform)을 수행할 수 있다.

또한, 본 발명의 일 실시예에 따라 주파수 도메인으로 변환한 정보는 진폭과 주파수를 가지는 정보일 수 있다.

또한, 본 발명의 일 실시예에 따른 데이터는, 음향 정보를 주파수 도메인상의 정보로 변환한 것 중 스펙트로그램에 해당할 수 있다.

또는, 본 발명의 일 실시예에 따른 데이터는, 스펙트로그램에 멜 스케일을 적용한 멜 스펙트로그램일 수 있다. 구체적으로, 스펙트로그램에 대한 멜-필터 뱅크(Mel-Filter Bank)를 통해 멜 스펙트로그램(Mel-Spectrogram)을 획득할 수 있다. 일반적으로, 인간의 달팽이관은 음성 데이터의 주파수에 따라 진동하는 부위가 상이할 수 있다. 또한, 인간의 달팽이관은 주파수가 낮은 대역에서 주파수 변화를 잘 감지하며, 높은 대역에서의 주파수 변화를 잘 감지하지 못하는 특성을 가지고 있다. 이에 따라, 음성 데이터에 대한 인간의 달팽이관의 특성과 유사한 인식 능력을 갖도록 멜-필터 뱅크를 활용하여 스펙트로그램으로부터 멜 스펙트로그램을 획득할 수 있다. 즉, 멜-필터 뱅크는, 낮은 주파수 대역에서 적은 필터 뱅크를 적용하고, 고대역으로 갈수록 넓은 필터 뱅크를 적용하는 것 일 수 있다. 다시 말해, 프로세서(130)는 인간의 달팽이관의 특성과 유사하도록 음성 데이터를 인식하기 위해 멜-필터 뱅크를 스펙트로그램에 적용함으로써, 멜 스펙트로그램을 획득할 수 있다. 멜 스펙트로그램은 인간의 청각 특성이 반영된 주파수 성분을 포함할 수 있다. 즉, 본 발명에서 수면 음향 정보에 대응하여 생성되며, 신경망을 활용한 분석의 대상이 되는 스펙트로그램은, 전술한 멜 스펙트로그램을 포함할 수 있다.

여기서 본 발명의 일 실시예에 따른 스펙트로그램 또는 멜 스펙트로그램 등, 주파수 도메인상의 정보로 변환한 정보는 진폭, 주파수를 가지는 도메인으로서, 음향 정보의 주파수 성분들의 시간 축에 따른 변화를 포함하는 정보로 변환한 것일 수 있다.

또한, 본 발명의 실시예들에 따른 데이터는, 상술한 정보들을 시각화한 것으로서, 이미지 처리를 기반으로 하는 인공지능 모델에 입력될 수 있다. 예를 들어, 로우 음향 정보의 주파수 성분들의 시간 축에 따른 변화를 포함하는 정보로 변환한 것을 시각화하여 인공지능 모델의 입력으로 할 수 있다. 또는, 주파수 도메인으로 변환한 정보를 시각화하여 인공지능 모델의 입력으로 할 수 있다. 위 정보들이 입력되는 인공지능 모델은 이미지 처리 기반의 인공지능 모델일 수 있다.

한편, 본 발명의 실시예에 따르면, 수면 상태 정보 중 수면 음향 정보는 병원 환경에서의 수면다원검사(PSG,polysomnography)를 통해 수집될 수도 있고, 가정환경 등에서의 사용자가 웨어러블 디바이스 또는 스마트폰 등 사용자 단말에 내장된 마이크로폰을 통해 수집될 수도 있다.

본 발명의 실시예에 따른 데이터 셋은 수면다원검사(PSG) 중의 뇌파검사(Video-EEG, Video-electroencephalography) 또는, 수면다원검사(PSG)에서 마이크로폰을 통하여 수집 및 구성될 수 있다.

또는, 본 발명의 실시예에 따른 데이터 셋은, 사용자 단말 등의 전자기기에 내장된 마이크로폰을 통하여 수면 중에 발생하는 음향 신호를 수집하여 구성될 수도 있다.

수면 분석 결과 도출 방식

이하에서는, 프로세서(130)가 생체정보(Bio-Signal), 움직임정보(ACTIGRAPHY), 수면 음향 정보(SOUND)를 이용하여, 최종 수면 분석결과를 도출하는 방식에 대해 설명한다.

먼저, 프로세서(130)는 가중치를 이용하여 최종 수면 분석결과를 도출할 수 있다. 구체적으로, 프로세서(130)는 1차 수면 분석 결과와, 수면 음향 정보를 이용한 수면 분석 결과에 동일한 가중치를 적용하여 2차 수면 분석 결과를 도출할 수 있다. 이와 달리, 프로세서(130)는 1차 수면 분석 결과와, 수면 음향 정보를 이용한 수면 분석 결과에 상이한 가중치를 적용하여 2차 수면 분석 결과를 도출할 수도 있다. 예를 들어, HRV, Actigraphy에 기초한 접촉식 1차 수면 분석에는 30%의 가중치를 두고, 수면음향을 이용한 AI 분석에는 70%의 가중치를 두어 최종 2차 수면 분석 결과를 도출할 수 있다.

다른 실시예에서, 프로세서(130)는 1차 수면 분석 결과와 2차 수면 분석 결과에 있어서 수면단계가 완전히 일치하는 경우에만, 사용자가 해당 수면단계 진입한 것으로 판단하여, 최종 수면 분석결과를 도출할 수 있다.

또 다른 실시예에서, 프로세서(130)는 생체정보(Bio-Signal), 움직임정보(ACTIGRAPHY) 및 수면 음향 정보(SOUND)중 적어도 하나 이상을 입력으로 하는 AI 수면 분석 모델을 학습하는 방법을 이용할 수 있다. AI 수면 분석 모델의 학습방법은 아래에서 더욱 상세히 설명하겠지만, 간략히 설명하면, 인공지능 모델의 입력층에 하나 이상의 정보를 입력함으로써 하나 이상의 요인에 의하여 수면 분석을 수행하는 AI 수면 분석 모델이 생성될 수 있다.

다른 실시예에서, 프로세서(130)는 후술하는 AI 수면 분석 모델을 이용하여 수면 음향 정보(SOUND)를 이용해서 2차 수면 분석을 먼저 수행한 뒤, 각 시간대별 수면단계에 대한 AI 확신도를 부가적으로 추출한다. 추출된 확신도가 소정의 수치 이하인 경우, 해당 시간대의 수면단계는 1차 수면 분석에 의하여 도출된 수면단계 결과를 채택한다. 즉, 2차 수면 분석 결과를 중심으로, 1차 수면 분석 결과를 부가적으로 채택함으로써, 더욱 신뢰성 있는 수면 분석 결과를 도출할 수 있다.

또 다른 실시예에서, 프로세서(130)는 후술하는 AI 수면 분석 모델에서 실제 분석결과와 불일치하는 부분의 통계를 먼저 확보한다. 통계는 사용자에 의하여 입력될 수도 있지만, 다수의 사용자 데이터에 의하여 자체적으로 확보될 수도 있다. 프로세서(130)는 2차 수면 분석 결과(SOUND에 기초한 분석)를 중심으로, 확보된 통계에서 실제 분석결과와 불일치하는 부분에서는 1차 수면 분석 결과를 부가적으로 채택할 수 있다.

또 다른 실시예에서, 프로세서(130)는 생체정보(Bio-Signal), 움직임정보(ACTIGRAPHY)에 의하여 확보된 1차 수면 분석 결과와, 수면음향 정보(SOUND)에 기초한 AI 수면 분석 모델을 학습하는 방법을 이용할 수 있다. AI 수면 분석 모델의 학습방법은 아래에서 더욱 상세히 설명하겠지만, 간략히 설명하면, 인공지능 모델의 입력층에 2가지 정보(1차 수면 분석 결과 및 수면음향 정보)를 입력함으로써, 2가지 요인에 의하여 수면 분석을 수행하는 AI 수면 분석 모델이 생성될 수 있다.

수면단계는 NREM(non-REM) 수면, REM(Rapid eye movement) 수면으로 구분될 수 있고, NREM 수면은 다시 복수(예: Light, Deep의 2단계, N1 내지 N4의 4단계)로 구분될 수 있다. 수면단계의 설정은 일반적으로 통용되는 수면단계를 기준으로 정의될 수도 있지만, 설계자에 따라 다양한 방식으로 임의 설정될 수도 있다. 수면단계분석을 통해서는 수면의 질 뿐만 아니라 수면 질환(예: 수면 무호흡증)과 그의 근본적인 원인(예: 코골이)까지 예측할 수 있다.

본 발명의 실시예에 따른 복수의 수면 상태 정보를 학습 및 예측하는 방식에 대하여 예를 들어 설명하기로 한다. 다만, 이하 설명하는 수면상태와 관련한 구체적인 기재는 단순한 예시일 뿐, 본 발명은 이에 제한되는 것은 아니며, 언급되지 않은 다른 수면 상태 정보(예컨대, 움직임 정보, 코골이 정보, 수면질환 정보 등의 수면 이벤트 정보)중 적어도 하나 이상 및/또는 환경의 차이(예컨대, 인종 등)에 따른 수면 상태 정보의 차이에 대한 학습도 이루어질 수 있다는 것을 이해하여야 한다.

수면 단계 정보를 학습 또는 예측하기 위해 긴 시간 간격동안 획득한 음향 정보를 필요로 할 수 있다. 또한 수면 단계 정보 외의 수면 상태 정보(예컨대, 코골이 또는 무호흡증 정보 등의 수면 이벤트 정보)를 학습 또는 예측하기 위해서는 해당 수면상태가 발생하는 시점 전후로 상대적으로 짧은 시간 간격(예컨대, 1분)동안 획득한 음향 정보를 필요로 할 수 있다.

본 발명의 실시예에 따라 획득한 음향 정보를, 주파수 성분의 시간 축에 따른 변화를 포함하는 정보, 주파수 도메인상의 정보 또는 스펙트로그램으로 변환하여, 동일한 인공지능 모델의 입력으로 하였을 때 복수의 수면 상태 정보를 학습하도록 수행하는 방법을 포함할 수 있다. 또는, 획득한 음향 정보의 주파수 성분의 시간 축에 따른 변화를 포함하는 정보를 시각화하여 나타낸 것을 이미지 처리 기반의 인공지능 모델의 입력으로 하여 복수의 수면 상태 정보를 학습하도록 수행하는 방법을 포함할 수 있다.

예를 들어, 본 발명의 실시예에 따른 스펙트로그램의 정보를 동일한 피처 추출 모델의 입력으로 하여 출력된 정보가 각각 서로 다른 피처 분류 모델에 입력되어 학습을 수행할 수 있다.

이러한 방법을 통하여, 하나의 음향 정보를 기초로 다양한 수면 상태 정보를 예측할 수 있도록 학습이 수행될 수 있다.

또는, 이러한 방법을 통하여, 하나의 음향 정보를 기초로 다양한 수면 상태 정보를 상호보완적으로 학습을 수행할 수 있다. 예컨대, 수면단계만 학습하는 인공지능 모델은, 무호흡증 또는 코골이와 같이 큰 소음이 발생하는 상태가 인식된다면 이를 Wake 상태로 잘못 예측할 수 있는 문제가 발생할 수 있다. 반면, 복수의 수면 상태 정보를 학습하도록 설계된 인공지능 모델의 경우, 수면단계 외에 무호흡증 또는 코골이 등의 다른 수면 상태 정보에 대하여도 상호보완적으로 학습한 결과, 위와 같은 문제를 방지할 수 있다.

전술한 시간 간격에 관한 구체적인 기재 및 수면 상태 정보에 관련한 구체적인 기재는 단순히 본 발명을 설명하기 위한 예시일 뿐이며, 본 발명은 이에 제한되는 것은 아니다.

수면 음향 정보 획득

수면 음향 정보는 수면 음향에 관련한 정보로서, 예를 들어, 수면 동안 사용자가 뒤척거림에 따라 발생되는 음향, 근육의 움직임에 관련한 음향 또는 수면 동안 사용자의 호흡에 관련한 음향 등을 포함할 수 있다. 즉, 본 발명의 수면 음향 정보는, 사용자의 수면 동안에 관련한 움직인 패턴 및 호흡 패턴에 관련한 음향 정보를 포함할 수 있다.

본 발명에서 수면 음향 정보는, 호흡 및 몸 움직임에 관련한 음향에 관련한 것이므로, 매우 작은 소리일 수 있다. 이에 따라, 프로세서(130)는 수면 음향 정보를 로우(raw) 수면 음향 정보의 주파수 성분들의 시간 축에 따른 변화를 포함하는 정보 또는 스펙트로그램으로 변환하여 음향에 대한 분석을 수행할 수 있다. 이 경우, 변환된 정보는 전술한 바와 같이, 소리의 주파수 스펙트럼이 시간에 따라 어떻게 변환하는지 보여주는 정보를 포함하고 있으므로, 비교적 작은 음향(즉, 특징을 식별하는 것이 용이하지 않은 음향)에 관련한 호흡 또는 움직임 패턴을 용이하게 식별하도록 하여 분석의 효율을 향상시킬 수 있다.

본 발명의 일 실시예에 따르면, 도 8에 도시된 바와 같이, 다양한 수면 단계에 따라 각각의 스펙트로그램이 상이한 농도의 주파수 스펙트럼을 갖도록 구성될 수 있다. 즉, 수면 음향 정보의 에너지 레벨의 변화만으로는, 깨어있는 상태, REM 수면 상태, 얕은 수면 상태 및 깊은 수면 상태 중 적어도 하나인지를 예측하기 어려울 수 있으나, 수면 음향 정보를 스펙트로그램으로 변환함으로써, 각 주파수의 스펙트럼의 변화를 용이하게 감지할 수 있으므로, 작은 소리(예컨대, 호흡 및 몸 움직임)에 대응한 분석이 가능해질 수 있다. 즉, 음향을 이미지화하여 이미지 패턴을 분석함으로써, 퀄리티가 낮은 음향에 대한 분석이 가능해질 수 있다.

본 발명의 일 실시예에 따르면, 수면 상태 분석의 기반이 되는 정보인 수면 음향 정보는, 다양한 노이즈를 포함할 수 있다. 실시예에서, 복수의 사용자 각각에 대응하여 획득되는 수면 음향 정보는, 각 사용자 별 상이한 침실 환경에서 획득되는 것으로 각기 상이한 종류의 노이즈를 포함하고 있을 수 있다. 상기와 같은 다양한 종류의 노이즈의 영향에 의해 수면 분석 모델을 활용한 수면 음향 정보에 대한 일관적인 분석 또는 예측이 어려울 수 있다.

구체적으로, 사용자의 수면 음향이 동일하더라도 침실 환경 또는 음향 측정 기기에 따라 발생하는 다양한 노이즈로 인해 실제로 획득되는 수면 음향 정보가 상이해질 수 있으며, 이에 따라, 신경망 모델(즉, 수면 분석 모델)이 상이한 예측 정보(즉, 수면 상태 정보)를 출력할 수 있다. 예를 들어, 사용자의 수면 동안 발생된 수면 음향은 모두 동일할지라도, 사용자가 수면을 취하는 공간에 관련한 환경적인 요인과 수면 음향을 획득하는 기기 간의 차이에 따라, 도 2에 도시된 바와 같이, 상이한 수면 음향 정보가 획득될 수 있다. 도 2는 동일한 음향 정보가 다양한 수면 환경 및/또는 다양한 측정 기기를 통해 획득됨에 따라 상이한 형태의 수면 음향 정보가 획득됨을 예시적으로 나타낸다.

보다 구체적인 예를 들어, 사용자가 수면을 취하는 침실의 크기나 구조 등에 따라 획득되는 수면 음향 정보의 배경 노이즈가 상이해질 수 있다. 또한, 예를 들어, 사용자가 수면을 취하는 공간에서 발생되는 소리(예컨대, 에어컨, 선풍기, 애완동물 또는 냉장고 소리 등)에 관련한 다양한 노이즈로 인해 획득되는 수면 음향 정보가 상이해질 수 있다.

다른 예를 들어, 수면 음향 정보 획득에 활용되는 음향 측정 기기의 기종 상이함에 따라, 동일한 수면 음향에 대응하여 획득되는 수면 음향 정보가 상이해질 수 있다. 구체적인 예를 들어, 동일한 수면 음향에 대응하여 제1사용자 단말을 통해 제1수면 음향 정보를 획득하고, 제2사용자 단말을 통해 제2수면 음향 정보를 획득하는 경우, 양 기기에 구비된 마이크 모듈 간의 차이로 인해, 제1수면 음향 정보와 제2수면 음향 정보가 완벽히 동일하지 않을 수 있다. 기기마다 활용하는 마이크 모듈이 상이함에 따라 수면 음향 정보에는 다양한 형태의 노이즈가 포함될 수 있다.

즉, 사용자가 개인적으로 획득하여 분석하고자 하는 수면 음향 정보는 사용자 개개인 별로, 상이한 침실 환경과 상이한 음향 측정 기기를 통해 획득되는 것임에 따라 다양한 노이즈를 포함하고 있으므로, 수면 분석 모델을 활용한 일관적인 분석이 어려울 수 있다.

예컨대, 다양한 노이즈가 없는 환경에서 획득된 데이터들을 학습 데이터로 활용하여 신경망을 학습시켜 수면 분석 모델이 생성될 수 있다. 구체적인 예를 들어, 노이즈가 존재하지 않거나 또는 미리 정해진 노이즈만을 포함하며, 사전 결정된 성능의 음향 측정 기기가 구비된 공간(예컨대, 병원)에서 사용자가 수면을 취하고, 수면 동안 수면 음향 정보를 획득할 수 있는데, 이러한 방식으로 획득된 수면 음향 정보들은 전문 의료인(예컨대, 수면 기사)이 시계열적인 수면 음향의 각 시점에 대응하여 정답(즉, 수면 단계)이 라벨링될 수 있으며, 수면 음향 및 라벨링된 데이터를 통해 신경망에 대한 학습이 수행되어 수면 분석 모델이 생성될 수 있다.

다만, 상기와 같은 방식으로 생성된 수면 분석 모델은, 노이즈가 거의 존재하지 않거나, 미리 정의된 노이즈만을 포함하는 수면 환경, 그리고, 고성능의 마이크 모듈을 통해 획득된 수면 음향 정보들과 수면 음향 정보들에 대응하여 정답이 라벨링된 학습 데이터들을 통해 학습된 것이므로, 다양한 노이즈 환경에서 획득된 음향 데이터에 대해서도 견고한 성능을 기대하기 어렵다는 문제점을 가진다. 또한, 다양한 환경에서 강건성을 가질 수 있다고 단정하기 어려우므로, 수면 분석 모델의 일반화가 용이하지 않을 우려가 있다.

특히, 본원 발명은 사용자의 실생활에서 용이하게 수면 상태 정보를 제공하기 위한 것임에 따라, 각기 다른 개별 사용자의 침실 환경과 음향 측정 기기에 따라 다양한 노이즈를 포함하는 수면 음향 정보에도 정확한 분석이 가능해야 한다.

본 발명의 일 실시예에 따르면, 본 발명의 일 실시예에 따른 전자장치는 상이한 도메인에 관련한 수면 음향 정보들을 기반으로 신경망에 대한 적응적 학습을 통해 다양한 배경 노이즈를 포함하는 수면 음향 정보들에도 견고한 성능을 가진 수면 분석 모델을 생성할 수 있다. 상이한 도메인에 관련한 수면 음향 정보들이란, 서로 상이한 환경에서 상이한 방법으로 획득된 수면 음향 정보들을 의미할 수 있다.

본 발명의 일 실시예에 따른 전자장치가 상이한 도메인에 관련한 수면 음향 정보들을 기반으로 신경망에 대한 적응적 학습을 통해 다양한 배경 노이즈를 포함하는 수면 음향 정보들에도 견고한 성능을 가진 수면 분석 모델을 생성하는 구체적인 방법 및 수면 분석 모델을 통해 수면 상태 정보를 제공하는 구체적인 방법은, 자세하게 후술하도록 한다. 또한, 본 발명의 일 실시예에 따르면 노이즈를 제거 또는 완화(reduction)하는 전처리를 수행하거나, 노이즈가 부가된 음향 정보에 기초하여 수면 상태 정보를 획득하는 것이 가능한데, 이러한 방법들 역시 자세히 후술하도록 한다.

한편, 본 발명의 일 실시예에 따르면 프로세서(130)는 사용자 단말(10)로부터 획득되는 음향 정보, Actigraphy, 생체정보에 기초하여 수면상태 정보를 획득할 수 있다. 구체적으로, 프로세서(130)는 음향 정보에 기 설정된 패턴의 정보가 감지되는 특이점을 식별할 수 있다. 여기서 기 설정된 패턴의 정보는, 수면에 관련한 호흡 및 움직임 패턴에 관련한 것일 수 있다.

예컨대, 깨어있는 상태(wake)에서는 모든 신경계가 활성화되어 있기 때문에 호흡 패턴이 불규칙적이고 몸의 움직임이 많을 수 있다. 또한, 목 근육의 이완이 이루어지지 않기 때문에 호흡 소리가 매우 적을 수 있다. 반면, 사용자가 수면을 취하는 경우에는, 자율신경계가 안정화되어 호흡이 규칙적으로 변화하고 몸의 움직임 또한 적어질 수 있으며, 호흡음도 커질 수 있다. 즉, 프로세서(130)는 음향 정보에서, 규칙적인 호흡, 적은 몸의 움직임 또는 적은 호흡음 등에 관련한 기 설정된 패턴의 음향 정보가 감지되는 시점을 특이점으로 식별할 수 있다. 또한, 프로세서(130)는 식별된 특이점을 기준으로 획득되는 음향 정보에 기초하여 수면 음향 정보를 획득할 수 있다. 프로세서(130)는 시계열적으로 획득되는 음향 정보에서 사용자의 수면 시점에 관련한 특이점을 식별하고, 해당 특이점을 기준으로 수면 음향 정보를 획득할 수 있다.

도 4는 본 발명에 따른 수면 분석 방법에 있어서 수면 음향 정보를 획득하는 과정을 설명하기 위한 도면이다. 도 4를 참조하면, 프로세서(130)는 음향 정보(E)로부터 사용자의 수면에 관련한 특이점(P)을 식별할 수 있다. 프로세서(130)는 식별된 특이점(P)을 기준으로 해당 특이점(P) 이후에 획득되는 음향 정보들에 기초하여 수면 음향 정보(SS)를 획득할 수 있다. 도 4에서의 음향에 관련한 파형 및 특이점은 본 발명의 이해를 위한 예시에 불과할 뿐, 본 발명은 이에 제한되지 않는다.

즉, 프로세서(130)는 음향 정보로부터 사용자의 수면에 관련한 특이점(P)을 식별함으로써, 특이점(P)에 기초하여 방대한 양의 환경 센싱 정보(즉, 음향 정보)로부터 수면 음향 정보(SS)만을 추출하여 획득할 수 있다. 이는, 사용자가 자신의 수면 시간을 기록하는 과정을 자동화하도록 하여 편의성을 제공함과 동시에, 획득되는 수면 음향 정보의 정확성 향상에 기여할 수 있다.

또한, 실시예에서, 프로세서(130)는 음향 정보(E)로부터 식별된 특이점(P)을 기준으로 사용자가 수면 전인지 또는 수면 중인지 여부에 관련한 수면 상태 정보를 획득할 수 있다. 구체적으로, 프로세서(130)는 특이점(P)이 식별되지 않는 경우, 사용자가 수면 전인 것으로 판단할 수 있으며, 특이점(P)이 식별되는 경우, 해당 특이점(P) 이후 사용자가 수면 중이라고 판단할 수 있다. 또한, 프로세서(130)는 특이점(P)이 식별된 이후, 기설정된 패턴이 관측되지 않는 시점(예컨대, 기상 시점)을 식별하고, 해당 시점이 식별된 경우, 사용자가 수면 후, 즉 기상하였다고 판단할 수 있다.

즉, 프로세서(130)는 음향 정보(E)에서 특이점(P)이 식별되는지 여부 및 특이점이 식별된 이후, 수면이 지속적으로 감지되는지 여부에 기초하여 사용자가 수면 전인지, 중인지, 또는 후인지 여부에 관련한 수면 상태 정보를 획득할 수 있다.

한편, 프로세서(130)는 음향 정보(E)가 아닌, Actigraphy나 생체정보에 기초하여 수면 상태 정보를 획득할 수 있다. 사용자의 움직임정보는 신체에 접촉된 센서부를 통해 획득하는 것이 유리할 수 있다. 본 발명에서는 1차 수면 분석시 Actigraphy나 생체정보를 이용하여 사용자의 수면 상태 정보를 사전에 파악하기 때문에, 수면 상태에 대한 분석 신뢰성을 더욱 향상시킬 수 있다.

한편, 상술한 수면과 관련한 패턴의 정보 또는 특이점에 기초하여 수면 상태 정보를 획득하는 기술사상은 단순한 예시일 뿐이고, 본 발명은 기 설정된 패턴의 정보 또는 특이점에 기초하여 추론을 수행하는 것에 한정되지 않으며, 수면 상태 정보를 획득하기 위하여 생성된 인공지능 모델을 통해 추론을 수행하는 것을 포함할 수 있다.

다양한 환경에서 획득한 수면 음향 정보

본 발명의 일 실시에 따르면, 복수의 수면 음향 정보는, 서로 상이한 도메인에 관련한 수면 음향 정보들을 포함할 수 있다. 구체적으로, 복수의 수면 음향 정보는, 복수의 소스 데이터 및 복수의 타겟 데이터를 포함하여 구성될 수 있다. 복수의 소스 데이터 및 복수의 타겟 데이터는 서로 상이한 도메인에 관련한 수면 음향에 관한 정보로, 서로 상이한 수면 환경에서 획득된 것을 특징으로 할 수 있다.

일 예로, 복수의 소스 데이터는 전문적인 수면 측정 환경(예컨대, 수면 다원 검사)에서 획득된 음향 데이터들로 제1도메인에 관련할 수 있으며, 복수의 타겟 데이터는 개별 사용자들의 일상적인 수면 환경에서 획득된 음향 데이터들로 제2도메인에 관련한 것일 수 있다. 예컨대, 복수의 타겟 데이터는 컴퓨팅 장치(100)가 수면 분석 서비스를 제공함에 따라 다수의 사용자로부터 획득되는 다량의 데이터(즉, 수면 음향 정보)일 수 있다. 다른 예를 들어, 복수의 타겟 데이터는 사용자 단말(10)의 마이크 모듈을 통해 획득되는 수면 음향 정보일 수 있다.

본 발명의 실시예에서, 복수의 소스 데이터는, 노이즈가 존재하지 않거나 또는 미리 정해진 노이즈만을 포함하며, 사전 결정된 성능의 음향 측정 기기가 구비된 공간(예컨대, 병원)에서 획득되는 수면 음향 정보들일 수 있다. 또한, 본 발명의 일 실시예에서, 복수의 소스 데이터는 전문 의료인(예컨대, 수면 기사)에 의해 복수의 수면 상태에 관한 정보가 라벨링된 데이터이며, 미리 정의된 노이즈를 포함하는 데이터일 수 있다.

또한, 본 발명의 실시예에서, 복수의 타겟 데이터는, 개개인의 침실 환경에 따라 다양한 형태의 노이즈가 포함되거나 또는 서로 상이한 마이크 모듈을 구비하는 복수의 사용자 단말들 각각을 통해 획득되는 수면 음향 정보들일 수 있다. 또한, 본 발명의 일 실시예에서, 복수의 타겟 데이터는 복수의 수면 상태에 관한 정보가 라벨링되지 않은 데이터이며, 정의되지 않은 노이즈를 포함하는 데이터일 수 있다.

즉, 복수의 소스 데이터는, 전문 기관(예컨대, 병원)에서 노이즈가 최소화된 상태에서 설정된 장비를 통해 획득된 복수의 수면 음향 데이터에 관련한 데이터일 수 있으며, 복수의 타겟 데이터는, 개인 사용자들 각각으로부터 개별적으로 획득된 수면 음향 데이터에 관련한 데이터를 포함할 수 있다. 복수의 타겟 데이터는, 각 사용자의 침실 환경에 따라 상이한 방법으로 획득됨에 따라, 다양한 노이즈를 포함하고 있으며, 수면 상태(예컨대, 수면 단계)에 관한 정답이 라벨링되지 않은 음향 데이터들에 관련한 것일 수 있다.

복수의 타겟 데이터의 경우, 각 사용자의 침실 환경에 따라 다양한 노이즈를 포함할 수 있다. 예를 들어, 동일한 수면 음향이라도, 개별 사용자의 침실의 크기나 구조 그리고, 사용자와 음향 측정 기기 간의 거리 차이에 따라 획득되는 수면 음향 정보가 상이할 수 있다. 즉, 수면을 취하는 공간의 크기 및 형태와 사용자의 수면 시, 음향 측정 기기의 위치에 따라 상이한 배경 노이즈를 포함하는 수면 음향 정보들(즉, 복수의 타겟 데이터)이 획득될 수 있다.

또한, 예를 들어, 복수의 타겟 데이터는 사용자가 수면을 취하는 공간에서 발생되는 소리에 관련한 다양한 노이즈를 포함할 수 있다. 구체적인 예를 들어, 사용자가 수면을 취하는 공간에는, 에어컨, 선풍기 등 전자제품의 가동 소리나 반려 동물의 소리 등 다양한 노이즈가 포함될 수 있다.

다른 예를 들어, 복수의 타겟 데이터는, 수면 음향 정보 획득에 활용되는 음향 측정 기기의 기종에 따라 다양한 노이즈가 포함될 수 있다. 구체적인 예를 들어, 동일한 수면 음향에 대응하여 제1사용자 단말을 통해 제1수면 음향 정보를 획득하고, 제2사용자 단말을 통해 제2수면 음향 정보를 획득하는 경우, 양 기기에 구비된 마이크 모듈 간 스펙의 차이로 인해, 제1수면 음향 정보와 제2수면 음향 정보가 완벽히 동일하지 않을 수 있다. 기기 마다 활용하는 마이크 모듈이 상이함에 따라 수면 음향 정보에는 다양한 형태의 노이즈가 포함될 수 있다.

즉, 전술한 바와 같이, 복수의 타겟 데이터는, 복수의 사용자 각각의 개별적인 취침 환경에서 획득되는 음향 데이터들로, 보다 다양한 노이즈들을 포함하고 있을 수 있다.

실시예에 따르면, 복수의 타겟 데이터 각각은 사용자가 소지한 사용자 단말(10)을 통해 획득될 수 있다. 예컨대, 사용자 단말(10)에 구비된 마이크 모듈을 통해 사용자의 수면 환경에 관련한 수면 음향 정보가 획득될 수 있다.

일반적으로, 사용자가 소지한 사용자 단말(10)에 구비된 마이크 모듈은, 비교적 작은 크기의 사용자 단말(10)에 구비되어야 하므로 MEMS(Micro-Electro Mechanical Systems)로 구성될 수 있다. 이러한 마이크 모듈은 매우 소형으로 제작이 가능하나, 콘덴서 마이크(Condenser Microphone)나 다이나믹 마이크(dynamic microphone)에 비해 낮은 신호 대 잡음비(SNR)를 가질 수 있다. 신호 대 잡음비가 낮다는 것은, 식별하고자 하는 음향 대비 식별하지 않고자 하는 음향인 잡음의 비율이 높은 것으로 음향의 식별이 용이하지 않음(즉, 불분명함)을 의미할 수 있다. 따라서, 노이즈를 제거하거나 완화하는 것이 필요한데, 이하 자세히 설명한다.

노이즈 리덕션 전처리

도 14 또는 도 5에 도시된 바와 같이, 사용자로부터 추출된 음향 정보, 혹은 이로부터 추출된 수면 음향 정보(로우 데이터)는 노이즈 리덕션의 전처리 과정을 거친다. 노이즈 리덕션 과정에서는 로우 데이터에 포함된 노이즈(예: 화이트노이즈)가 제거된다. 노이즈 리덕션 과정은 백그라운드 노이즈(background noise)를 제거하기 위한 스펙트럴 게이팅(spectral gating), 스펙트럴 서브스트랙션(spectral substraction) 등의 알고리즘을 이용하여 이루어질 수 있다. 나아가, 본 발명에서는 딥러닝 기반의 노이즈 리덕션 알고리즘을 이용하여 노이즈 제거 과정을 수행할 수 있다. 딥러닝 기반의 노이즈 리덕션 알고리즘은 사용자의 숨소리, 호흡소리에 특화된, 다시 말해, 사용자의 숨소리나 호흡소리를 통해 학습된(learned) 노이즈 리덕션 알고리즘을 이용할 수 있다.

전처리는 수면 상태 정보의 학습과정에서 수행될 수도 있고, 추론과정에서 수행될 수도 있다. 이하 노이즈 리덕션의 전처리 과정의 예시에 대하여 설명한다.

스펙트럴 노이즈 게이팅

스펙트럴 게이팅(spectral gating) 또는 스펙트럴 노이즈 게이팅(spectral noise gating)은 음향 정보에 대한 전처리 방법이다. 획득한 음향 정보 전체에 대하여 노이즈 리덕션을 수행할 수 있으나, 일정한 시간 간격으로(예컨대, 5분 등) 스플릿(split)을 수행한 뒤, 스플릿된 음향 정보에 대하여 각각 노이즈 리덕션을 수행할 수도 있다. 일정한 시간 간격으로 스플릿이 수행된 음향 정보에 대하여 노이즈 리덕션을 수행하기 위해서, 우선 각각의 프레임에 대하여 스펙트럼을 산출하는 방법을 포함할 수 있다.

이에 산출된 각각의 스펙트럼 프레임 중에서 에너지가 가장 작은 진동수 스펙트럼(frequency spectrum)을 갖는 프레임을 특정할 수 있다.

각각의 스펙트럼 프레임 중에서 에너지가 가장 작은 진동수 스펙트럼을 갖는 프레임을 스태틱 노이즈(static noise)로 가정하고, 스태틱 노이즈로 가정한 진동수 스펙트럼 프레임이 갖는 주파수를 스펙트럼 프레임에서 감쇄하는 방법을 포함할 수 있다.

한편, 본 발명의 일 실시예에 따라, 복수의 데이터들에 대한 노이즈 리덕션 전처리를 수행하는 경우, 수면 음향 정보를 하나 이상의 음향 프레임으로 분류할 수 있다. 여기서, 하나 이상의 음향 프레임 각각의 에너지 레벨에 기초하여 최소 에너지 레벨을 갖는 최소 음향 프레임을 식별할 수 있다. 이에 따라, 최소 음향 프레임에 기초하여 음향 데이터에 대한 노이즈 제거 또는 리덕션을 수행할 수 있다.

구체적인 예를 들어, 프로세서(130)는 30초의 수면 음향 정보(예컨대, 타겟 데이터)를 매우 짧은 40ms 크기의 하나 이상의 음향 프레임으로 분류할 수 있다. 또한, 프로세서(130)는 40ms 크기에 관련한 복수의 음향 프레임 각각의 크기를 비교하여 최소 에너지 레벨을 갖는 최소 음향 프레임을 식별할 수 있다.

프로세서(130)는 전체 수면 음향 정보(즉, 30초의 수면 음향 정보)에서 식별된 최소 음향 프레임 성분을 제거할 수 있다. 예컨대, 도 14를 참조하면, 수면 음향 정보에서 최소 음향 프레임 성분이 제거됨에 따라, 전처리된 수면 음향 정보가 획득될 수 있다. 즉, 프로세서(130)는 최소 음향 프레임을 백그라운드 노이즈 프레임으로써 식별하여 원본 신호(즉, 수면 음향 정보)에서 노이즈 제거 또는 리덕션을 수행할 수 있다. 상술한 시간 간격에 대한 구체적인 수치 기재는 단순한 예시일 뿐, 이에 한정되는 것은 아니다.

딥러닝 기반 노이즈 리덕션

한편, 본 발명의 일 실시예에 따른 노이즈 리덕션 전처리를 수행하기 위하여, 주파수 도메인이 아닌 시간 도메인상의 로우(raw) 음향 정보에 대하여 수행되는 딥러닝 기반 노이즈 리덕션 방법을 이용할 수도 있다. 딥러닝 기반 노이즈 리덕션을 위하여, 수면 분석 모델의 입력으로 하기 위하여 필요한 정보인 수면 음향 정보 등의 정보는 유지하고, 그 이외의 음향은 감쇄하는 방식이 이용될 수 있다.

PSG 검사 결과를 통해 획득한 음향 정보뿐만 아니라, 스마트폰 등 사용자 단말에 내장된 마이크로폰을 통해 획득한 음향 정보에 대하여도 노이즈 리덕션을 수행할 수도 있다.

로우(raw)음향 정보를 주파수 도메인상의 정보로 변환

본 발명에 따른 수면 분석 방법은 음향 정보의 심층학습을 통해 추론모델을 생성하며, 추론모델은 사용자의 수면 상태 및 수면단계를 추출한다. 다시 간략히 설명하면, 수면 음향 정보 등을 포함하는 환경 센싱 정보(음향 정보)는 음향 정보의 주파수 성분들의 시간 축에 따른 변화를 포함하는 정보 또는, 주파수 도메인상의 정보로 변환되며, 변환된 정보에 기초하여 추론 모델이 생성될 수 있다.

또는 본 발명의 일 실시예에 따르면, 수면 음향 정보 등을 포함하는 환경 센싱 정보는 주파수 도메인상의 정보 또는 스펙트로그램으로 변환되며, 변환된 주파수 도메인상의 정보 또는 스펙트로그램에 기초하여 추론 모델이 생성된다. 여기서 주파수 도메인상의 정보란, 로우(raw) 수면 음향 정보의 주파수 성분들의 시간 축에 따른 변화를 포함하는 정보일 수 있다.

음향 정보를 이용하는 수면 분석에 있어서 사용자의 프라이버시 보호를 간과할 수 없고, 본 발명은 사용자의 프라이버시 보호를 위하여 음향 정보를 전처리하는 과정을 이용한다.

이때, 로우 음향 정보에서 페이즈를 제외한 앰플리튜드만에 기초하여 주파수 도메인상의 정보 또는 스펙트로그램으로 변환하는 방식을 이용할 수 있고, 이러한 방식을 통하여 프라이버시를 보호할 뿐만 아니라, 데이터 용량을 낮추어 처리 속도를 향상시킬 수 있다. 다만, 다른 실시예에서는 페이즈와 앰플리튜드 모두를 이용하여 스펙트로그램을 생성하는 것도 가능하다.

본 발명의 일실시예는 수면 음향 정보(SS)에 기초하여 변환된 스펙트로그램(SP)을 이용하여 수면 분석 모델을 생성할 수 있다.

오디오 데이터로 표현되는 수면 음향 정보를 그대로 이용하게 되면 정보량이 매우 많기 때문에 연산량, 연산시간이 큰 폭으로 증가하게 되며, 원치 않는 신호까지 포함되어 있기 때문에 연산 정밀도가 저하될 뿐만 아니라, 사용자의 모든 오디오 신호가 서버로 전송되는 경우 프라이버시 침해의 우려가 있다.

따라서 본 발명의 일 실시예는 상술한 방법으로 수면 음향 정보의 노이즈를 제거한 뒤, 이를 주파수 도메인상의 정보 또는 스펙트로그램(Spectrogram)으로 변환하고, 스펙트로그램을 학습시켜 수면 분석 모델을 생성하기 때문에, 연산량, 연산 시간을 줄일 수 있고, 개인의 프라이버시 보호까지 도모할 수 있게 된다.

예를 들어, 마이크로폰 등을 통해 획득한 음향 정보에는 수면단계분석에 필요한 수면 음향 정보(예컨대, 사용자의 숨소리 등)이 다른 노이즈보다 상대적으로 작을 수 있으나, 스펙트로그램으로 변환하면 주변의 다른 노이즈에 비하여 상대적으로 수면 음향 정보의 식별이 우수해질 수 있다.

한편, 본 발명의 실시예에 따른 스펙트로그램으로 변환을 하는 경우, 주파수 도메인의 해상도를 낮게 변환함으로써 개인정보를 식별하지 못하게 되는데, 일정 개수(예컨대, 20개) 이하의 주파수 해상도(frequency bins)로 구성한 경우 복원 신호로부터 개인정보를 식별할 수 없게 된다.

또한, 본 발명의 실시예에 따르면 획득한 음향 정보를 실시간으로 스펙트로그램으로 변환하는 방법을 포함할 수 있다.

또한, 스펙트로그램의 주파수 해상도의 압축을 서버나 클라우드가 아닌 유저의 스마트폰에서 수행할 수 있게 됨에 따라 개인정보의 유출을 방지할 수도 있다.

이때, 사운드 데이터의 비식별화는 자연어 및 호흡음에 대하여 이루어질 수 있고, 이는 각각 자연어 변환 스펙트로그램, 호흡음 변환 스펙트로그램 등으로 변환될 수 있다. 본 발명에 따른 수면 분석에서는 분석모델에 필요한 정보만을 활용하여 연산속도를 향상시키고, 연산부하를 감소시킬 수 있다. 한편, 본 발명의 실시예에 따른 스펙트로그램은 멜 스케일이 적용된 멜 스펙트로그램일 수 있다.

로우(raw) 수면 음향 정보의 변환 방법

프로세서(130)는, 도 6에 도시된 바와 같이, 수면 음향 정보(SS)에 대응하여 스펙트로그램(SP)을 생성할 수 있다. 스펙트로그램(SP) 생성의 기초가 되는 로우 데이터(시간 도메인상의 로우 음향 정보)를 입력받을 수 있는데, 본 발명에 따른 로우 데이터는 병원 환경에서의 수면다원검사(PSG,polysomnography)를 통해 수집될 수도 있고, 가정환경 등에서의 사용자가 웨어러블 디바이스 또는 스마트폰 등 사용자 단말에 내장된 마이크로폰을 통해 수집될 수도 있다.

또한, 로우 데이터는 사용자가 입력한 시작시점부터 종료시점까지 웨어러블 디바이스 또는 스마트폰 등 사용자 단말(10)을 통해 획득되거나, 사용자의 디바이스 조작(예: 알람 설정)이 이루어진 시점부터 디바이스 조작(예: 알람 설정 시간)에 대응되는 시점까지 획득되거나, 사용자의 수면 패턴에 기초하여 자동적으로 시점이 선택되어 획득될 수도 있고, 사용자의 수면의도시점을 사운드(사용자 말소리, 호흡소리, 주변기기(TV, 세탁기) 소리 등)나 조도 변화 등에 기초하여 자동적으로 시점을 결정하여 획득될 수도 있다.

프로세서(130)는 수면 음향 정보(SS)에 대한 고속 푸리에 변환을 수행하여, 수면 음향 정보의 주파수 성분들의 시간 축에 따른 변화를 포함하는 정보로 변환할 수 있다. 구체적으로, 이러한 정보는 주파수 도메인상의 정보일 수 있으며, 스펙트로그램 또는 멜 스케일이 적용된 멜 스펙트로그램일 수 있다. 이러한 주파수 성분들의 시간 축에 따른 변화를 포함하는 정보, 주파수 도메인상의 정보 또는 스펙트로그램(SP)은 소리나 파동을 시각화하여 파악하기 위한 것으로, 파형(waveform)과 스펙트럼(spectrum)의 특징이 조합된 것일 수 있다.

또한, 이러한 정보들은 음향 정보의 주파수 성분들의 시간 축에 따른 정보들을, 시간 축과 주파수 축의 변화에 따라 진폭의 차이를 인쇄 농도 또는, 표시 색상의 차이로 나타냄으로써 시각화한 것일 수 있다. 이렇게 시각화하는 경우, 이미지 처리 기반의 인공지능 모델의 입력으로 하여 수면 상태 정보를 획득할 수 있게 된다. 이러한 방법을 통하여, 소리 신호를 이미지 신호로 변환함으로써 상대적으로 긴 시간 동안의 데이터를 활용하여 시계열적인 수면 분석이 가능하고, 로우(raw) 수면 음향 정보를 기초로 분석하는 것보다 수면 분석의 정확성이 더 높아질 수 있다는 장점이 있다.

전처리된 음향 관련 로우 데이터는 30초 단위로 잘려 스펙트로그램으로 변환될 수 있다. 이에 따라, 30초의 스펙트로그램은 20 frequency bin x 1201 time step의 차원을 갖게 된다. 본 발명에서는 직사각형의 스펙트로그램을 정방형에 가까운 형태로 바꾸기 위하여 리세이핑(Reshaping), 리사이즈(Resize), 스플릿-캣(split-cat) 등 다양한 방식을 이용함으로써 정방형에 가까운 형태로 변환할 수 있다. 또는 이러한 방식을 이용함으로써 정보량을 보존할 수 있게 된다.

한편, 본 발명은 클린한 숨소리에 가정환경에서 발생하는 다양한 노이즈를 더해 다양한 가정환경에서 측정된 숨소리를 시뮬레이션하는 방법을 이용할 수 있다. 소리는 애디티브(additive)한 성질을 가지고 있기 때문에 서로 더해지는 것이 가능하다. 하지만, mp3나 pcm 등의 원본 음향 신호를 더하고 스펙트로그램으로 변환하면 컴퓨팅 자원의 소모가 매우 커지게 된다. 따라서, 본 발명은 숨소리, 노이즈를 각각 스펙트로그램으로 변환하여 더하는 방법을 제시한다. 이를 통해, 다양한 가정환경에서 측정된 숨소리를 시뮬레이션하여 딥러닝 모델 학습에 활용함으로써 다양한 가정환경에서의 수면 분석의 강건성(robustness)을 확보할 수 있게 된다.

변환된 정보의 전처리

본 발명의 일실시예에 따른 데이터를 주파수 성분들의 시간 축에 따른 변화를 포함하는 정보, 또는 주파수 도메인상의 정보 또는, 스펙트로그램으로 변환하기 위한 목적은, 수면 분석 모델의 입력으로 하여 해당 변환된 정보에서의 패턴이 어떤 수면 상태 또는 어떤 수면 단계와 대응되는지 학습된 모델을 통해 추론하기 위한 것인데, 이렇게 수면 분석 모델의 입력으로 하기 전에 몇몇 전처리 과정들이 필요할 수 있다.

또한, 본 발명의 일 실시예에 따르면, 변환된 정보는 음향 정보가 이미지 처리 기반의 인공지능 모델의 입력으로 되도록 변환된 것이므로, 입력으로 하기 전에 이러한 전처리 과정을 통해 음향 정보가 시각화될 수도 있다.

이러한 전처리 과정들은 학습 과정에서만 이루어질 수도 있고, 학습 과정뿐만 아니라 추론 과정에서도 이루어질 수도 있다. 혹은 추론 과정에서만 이루어질 수도 있다.

데이터 어그멘테이션 전처리

본 발명의 실시예에 따르면, 스펙트로그램에 대하여 데이터 어그멘테이션(Data augmentation)을 수행하는 전처리 방법이 포함될 수 있다.

데이터 어그멘테이션은 충분한 학습 데이터 셋의 양을 확보하거나, 또는 다양하고 변칙적인 환경을 가정하여 충분한 학습을 진행하기 위함이다.

본 발명의 실시예에 따른 데이터 어그멘테이션 전처리 방법에는 스펙트로그램에 가우시안 노이즈를 부가하여 데이터의 양을 부풀리거나, 전체적인 음향 정보의 피치(pitch)를 조금씩 올리거나 내리는 피치 시프팅(pitch shifting) 방법, 스펙트로그램 또는 멜 스펙트로그램이 학습과정에서 벡터로 변환되고, 변환된 벡터를 하나의 노드(뉴런)의 입력 단계에서 무작위(random)하게 자르고(Tile) 노드(뉴런)의 출력 후 다시 결합하는(Untile) TUT(Tile UnTile) 어그멘테이션 방법이 포함될 수도 있다.

또한, 본 발명의 실시예에 따른 데이터 어그멘테이션 전처리 방법에는 가우시안 노이즈가 아닌 다양한 환경에서 발생하는 노이즈(예컨대, 외부의 소리, 자연의 소리, fan이 돌아가는 소리, 문이 열리거나 닫히는 소리, 동물이 내는 소리, 사람이 대화하는 소리, 움직임 소리 등)를 부가하는 노이즈 부가 어그멘테이션(noise addition augmentation) 방법이 포함될 수도 있다.

본 발명의 실시예에 따른 노이즈 부가 어그멘테이션은 스펙트로그램을 학습 모델의 입력으로 할 때 학습 시간을 단축하기 위하여, 노이즈 정보를 스펙트로그램으로 변환한 뒤, 수면 음향 정보와 스펙트로그램 상에서 인위적으로 부가하는 방법을 포함할 수 있다. 이 경우 원래의 음향 정보 도메인 상에서 수면 음향 정보에 노이즈 정보를 부가한 전체를 변환한 스펙트로그램과, 수면 음향 정보와 노이즈 정보 각각을 스펙트로그램으로 변환한 도메인 상에서 부가한 경우의 스펙트로그램에 큰 차이가 없을 수 있다.

또한, 본 발명의 실시예에 따른 노이즈 부가 어그멘테이션은 스펙트로그램으로부터 원 신호로 다시 변환이 어렵게끔 하여 사용자의 프라이버시를 보호하기 위하여, 수면 음향 정보와 노이즈 정보 각각의 스펙트로그램에서 진폭과 위상 중 진폭만을 유지하고, 위상은 임의의 위상으로 만들어서 부가함으로써, 스펙트로그램으로부터 원 신호로 다시 변환이 어렵게끔 할 수 있다.

또는, 본 발명의 실시예에 따른 노이즈 부가 어그멘테이션은 음향 정보를 스펙트로그램으로 변환한 도메인 상에서 부가하는 방법뿐만 아니라, 멜 스케일이 적용된 멜 스펙트로그램으로 변환한 도메인 상에서 부가하는 방법을 포함할 수도 있다.

또한, 본 발명의 실시예에 따라 멜 스케일에서 부가하는 방법에 의하면 하드웨어가 데이터를 처리하는 데에 소요되는 시간이 단축될 수 있다.

한편, 전술한 노이즈의 종류에 관한 구체적인 기재는 본 발명의 노이즈 부가 어그멘테이션을 설명하기 위한 단순한 예시일 뿐이며, 본 발명은 이에 제한되는 것은 아니다.

본 발명의 실시예에 따른 TUT(Tile UnTile) 어그멘테이션은 스펙트로그램을 학습 모델의 입력으로 할 때 다양한 패턴의 학습 데이터 양을 늘리기 위해서 노드(뉴런)의 입력과 출력단계에서 스펙트로그램 또는 벡터를 무작위로 자르고, 결합하는 단계를 포함할 수 있다. 노드(뉴런)의 입력 단계에서 무작위로 잘라진 스펙트로그램 또는 벡터는 잘라지지 않은 해당 신경망(Neural Network)의 레이어(layer)에 입력되는 스펙트로그램 또는 벡터의 정보보다 데이터의 누락이 있거나 또는 정보의 양에 손실이 있을 수 있다. 이 경우, 제한적인 정보가 노드(뉴런)에 입력되어 학습될 수 있다. 잘라진 스펙트로그램 또는 벡터를 입력으로 하는 노드(뉴런)는 연산 후 벡터를 출력으로 할 수 있다. 이 때, 다음 신경망 레이어(Neural Network Layer)의 노드(뉴런)의 입력으로 하기 전 다시 잘랐던 방식과 동일하게 결합(Untile)할 수도 있다.

또한, 본 발명의 실시예에 따른 TUT 어그멘테이션은 스펙트로그램 또는 벡터를 노드(뉴런)의 입력과 출력단계에서 무작위로 자르고, 동일한 방식으로 합침으로써 정보의 누락이 있는 데이터의 학습을 유도하여, 학습모델의 정확도 또는 신뢰도를 높이는데 기여할 수 있다.

정방형에 가까운 형태로 변환하는 전처리

본 발명의 실시예에 따르면, 상술한 피치 시프팅(Pitch shifting), 노이즈 부가 어그멘테이션, 또는 TUT 어그멘테이션 등, 주파수 도메인상의 정보 또는 스펙트로그램의 데이터 어그멘테이션 전처리 과정을 거친 후에 주파수 도메인상의 정보 또는 스펙트로그램을 정방형에 가까운 형태로 변환하는 전처리 방법을 수행할 수도 있다.

본 발명의 일실시예에 따르면, 데이터 어그멘테이션이 수행된 주파수 도메인상의 정보 또는 스펙트로그램을 딥러닝 모델인 CNN, Transformer, Vision Transformer(ViT), Mobile Vision Transformer(MobileViT)의 입력으로 하기 전에, 정방형에 가까운 형태로 변환한 뒤에 그러한 정방형에 가까운 형태로 변환된 주파수 도메인상의 정보 또는 스펙트로그램을 딥러닝 모델인 AI의 입력으로 할 수 있다.

본 발명의 실시예에 따라 주파수 도메인상의 정보 또는 스펙트로그램을 정방형에 가까운 형태로 변환하는 전처리를 수행함에 있어서, 리세이핑(Reshaping), 리사이즈(Resize), 스플릿-캣(Split-cat) 등 다양한 방식으로 정방형에 가까운 형태로 변환할 수 있다.

본 발명의 실시예에 따라 리사이즈 방식으로 정방형에 가까운 형태로 변환하는 전처리를 수행하는 경우, x축은 해상도를 낮추고, y축은 값을 복사하여 해상도를 늘리는 방법이 수행될 수 있다.

또한, 본 발명의 실시예에 따라 20 frequency bin Х 1201 time step의 차원을 갖는 30초의 스펙트로그램 전체에 대하여 리사이즈 방식으로 한 번에 정방형에 가까운 형태로 변환하는 전처리 방법을 수행하면서, 누락된 정보를 보간법을 활용하여 보충할 수 있다.

본 발명의 실시예에 따른 스플릿-캣(Split-cat) 전처리 방식은, 스펙트로그램을 일정한 크기로 스플릿(Split) 한 뒤에 concatenation 함수를 이용하여 데이터를 정방형에 가까운 형태로 합치는(cat) 방법을 포함할 수 있다. 다시 말해, 스플릿-캣 방법은, Vit(Vision Transformer) 또는 Mobile Vit(Mobile Vision Transformer) 기반의 딥러닝 모델에서 patch 단위로 학습을 수행하기 위해서, 하나의 스펙트로그램을 patch에 대응될 수 있도록 스플릿한 뒤, patch 단위로 정방형에 가까운 형태로 합치는 방법을 의미한다.

예를 들어, 본 발명의 일실시예에 따르면, 20 frequency bin Х 1201 time step의 차원을 갖는 30초의 스펙트로그램을 150 frequency bin Х 160 time step의 차원으로 변환할 수 있다. 그 후, 150 frequency bin Х 160 time step의 차원을 갖는 30초의 스펙트로그램에 리사이즈 기법을 이용하여 160 frequency bin Х 160 time step에 가까운 차원으로 변환할 수 있다. 이러한 과정에 따라, 매 30초 간격에 해당하는 스펙트로그램을 정방형에 가까운 형태로 변환할 수 있게 된다.

정방형에 가까운 형태로 변환한 스펙트로그램을 입력으로 하여 학습을 수행하는 경우, Transformer 학습 모델 기반의 딥러닝 모델에서 더욱 향상된 학습 성능을 보일 수 있다. 전술한 스펙트로그램의 빈(bin), 분할 시간 단위 및 분할 개수 등에 대한 구체적인 수치적 기재는 예시일 뿐, 본 발명은 이에 제한되지 않는다.

스케일 변환 및 정규화 전처리

본 발명의 실시예에 따른 주파수 도메인상의 정보 또는 스펙트로그램은, 그 값이 매우 작아서 다른 스케일로 변환하지 않으면 값이 일정 수준보다 큰 부분에서는 매우 밝게 표현되는 반면, 나머지 부분에서는 매우 어둡게 표현되므로 딥러닝 모델의 입력으로 하기에 부적절할 수 있다. 이에 따라 본 발명의 실시예에 따른 주파수 도메인상의 정보 또는 스펙트로그램을 딥러닝 모델의 입력으로 하기 전에 dB 스케일(로그스케일)로 변환하는 전처리 과정을 수행할 수 있다.

본 발명의 실시예에 따른 로그스케일 변환 전처리를 수행함에 있어서, 로그값의 최대치를 0으로 설정하여 기본 베이스값으로 설정하고, 나머지 값들에 대해 로그값으로 변환할 수 있다.

본 발명의 실시예에 따라 로그값으로 변환된 스펙트로그램에 대하여, 전체 값의 평균이 0이 되고, 표준 편차가 1이 되도록 하는 정규화(Normalization) 전처리를 추가적으로 수행한 뒤에 딥러닝 모델의 입력으로 할 수도 있다.

이렇게 전처리된 데이터를 이미지 처리 딥러닝 모델의 입력으로 하여, 스펙트로그램에 대한 이미지 분석을 통해 수면 상태 정보 등의 정보를 학습 또는 추론할 수 있게 된다. 전술한 스펙트로그램의 로그값 최대치 등에 대한 구체적인 수치적 기재는 예시일 뿐, 본 발명은 이에 제한되지 않는다.

수면 분석 모델

본 발명의 일 실시예에 따르면, 상기 방법은, 사용자의 수면과 관련한 수면 음향 정보를 획득하는 단계(S10)를 포함할 수 있다.

본 발명의 일 실시예에 따르면, 상기 방법은, 수면 음향 정보에 대한 전처리를 수행하는 단계(S20)를 포함할 수 있다.

본 발명의 일 실시예에 따르면, 상기 방법은, 전처리된 수면 음향 정보에 대한 분석을 수행하여 수면 상태 정보를 획득하는 단계(S30)를 포함할 수 있다.

전술한 도 25에 도시된 단계들은 필요에 의해 순서가 변경될 수 있으며, 적어도 하나 이상의 단계가 생략 또는 추가될 수 있다. 즉, 전술한 단계는 본 발명의 일 실시예에 불과할 뿐, 본 발명의 권리 범위는 이에 제한되지 않는다.

본 발명에 있어서, 수면 상태 정보는 음향 정보(수면 음향 정보)에 기초하여 사용자의 수면단계를 분석하는 수면 분석 모델을 통해 획득될 수 있다.

본 발명에서 수면 음향 정보(SS)는, 사용자의 수면 시간 동안 획득되는 호흡 및 몸 움직임에 관련한 음향이기 때문에 매우 작은 소리일 수 있고, 이에 따라 본 발명은 상술한 바와 같이 수면 음향 정보(SS)를 스펙트로그램(SP)으로 변환하여 음향에 대한 분석을 수행할 수 있다. 이 경우, 스펙트로그램(SP)은 소리의 주파수 스펙트럼이 시간에 따라 어떻게 변화하는지 보여주는 정보를 포함하고 있으므로, 비교적 작은 음향에 관련한 호흡 또는 움직임 패턴을 용이하게 식별할 수 있어 분석의 효율이 향상될 수 있다. 구체적으로, 수면 음향 정보의 에너지 레벨의 변화만으로는, 깨어있는 상태, REM 수면 상태, 얕은 수면 상태 및 깊은 수면 상태 중 적어도 하나인지를 예측하기 어려울 수 있으나, 수면 음향 정보를 스펙트로그램으로 변환함으로써, 각 주파수의 스펙트럼의 변화를 용이하게 감지할 수 있으므로, 작은 소리(예컨대, 호흡 및 몸 움직임)에 대응한 분석이 가능해질 수 있다.

프로세서(130)는 본 발명의 실시예에 따라 변환된 주파수 도메인상의 정보 또는 스펙트로그램(SP)을 수면 분석 모델의 입력으로 처리하여 수면 상태 정보를 획득할 수 있다. 여기서 수면 분석 모델은, 사용자의 수면단계 변화에 관련한 수면 상태 정보를 획득하기 위한 모델로, 사용자의 수면 동안 획득된 수면 음향 정보를 입력으로 하여 수면 상태 정보를 출력할 수 있다. 실시예에서, 수면 분석 모델은, 하나 이상의 네트워크 함수를 통해 구성되는 신경망 모델을 포함할 수 있다.

네트워크 함수

수면 분석 모델은 하나 이상의 네트워크 함수로 구성되며, 하나 이상의 네트워크 함수는 일반적으로 '노드'라 지칭될 수 있는 상호 연결된 계산 단위들의 집합으로 구성될 수 있다. 이러한 '노드'들은 '뉴런(neuron)'들로 지칭될 수도 있다. 하나 이상의 네트워크 함수는 적어도 하나 이상의 노드들을 포함하여 구성된다. 하나 이상의 네트워크 함수를 구성하는 노드(또는 뉴런)들은 하나 이상의 '링크'에 의해 상호 연결될 수 있다.

도 7은 본 발명에 따른 수면 분석 방법을 수행하기 위한 하나 이상의 네트워크 함수를 나타낸 개략도이다. 딥 뉴럴 네트워크(DNN: deep neural network, 심층신경망)는 입력 레이어와 출력 레이어 외에 복수의 히든 레이어를 포함하는 신경망을 의미할 수 있다. 딥 뉴럴 네트워크를 이용하면 데이터의 잠재적인 구조(latent structures)를 파악할 수 있다. 즉, 사진, 글, 비디오, 음성, 음악의 잠재적인 구조(예를 들어, 어떤 물체가 사진에 있는지, 글의 내용과 감정이 무엇인지, 음성의 내용과 감정이 무엇인지 등)를 파악할 수 있다. 딥 뉴럴 네트워크는 컨벌루셔널 뉴럴 네트워크(CNN: convolutional neural network), 리커런트 뉴럴 네트워크(RNN: recurrent neural network), 오토 인코더(auto encoder), GAN(Generative Adversarial Networks), 제한 볼츠만 머신(RBM: restricted boltzmann machine), 심층 신뢰 네트워크(DBN: deep belief network), Q 네트워크, U 네트워크, 샴 네트워크, Transformer, ViT(Vision Transformer), Mobile ViT(Mobile Vision Transformer) 등을 포함할 수 있다. 전술한 딥 뉴럴 네트워크의 기재는 예시일 뿐이며 본 발명은 이에 제한되지 않는다.

본 발명에서 네트워크 함수는 오토 인코더를 포함할 수도 있다. 오토 인코더는 입력 데이터와 유사한 출력 데이터를 출력하기 위한 인공신경망의 일종일 수 있다. 오토 인코더는 적어도 하나의 히든 레이어를 포함할 수 있으며, 홀수 개의 히든 레이어가 입출력 레이어 사이에 배치될 수 있다. 각각의 레이어의 노드의 수는 입력 레이어의 노드의 수에서 병목 레이어(인코딩)라는 중간 레이어로 축소되었다가, 병목 레이어에서 출력 레이어(입력 레이어와 대칭)로 축소와 대칭되어 확장될 수도 있다. 차원 감소 레이어와 차원 복원 레이어의 노드는 대칭일 수도 있고 아닐 수도 있다. 오토 인코더는 비선형 차원 감소를 수행할 수 있다. 입력 레이어 및 출력 레이어의 수는 입력 데이터의 전처리 이후에 남은 센서들의 수와 대응될 수 있다. 오토 인코더 구조에서 인코더에 포함된 히든 레이어의 노드의 수는 입력 레이어에서 멀어질수록 감소하는 구조를 가질 수 있다. 병목 레이어(인코더와 디코더 사이에 위치하는 가장 적은 노드를 가진 레이어)의 노드의 수는 너무 작은 경우 충분한 양의 정보가 전달되지 않을 수 있으므로, 특정 수 이상(예를 들어, 입력 레이어의 절반 이상 등)으로 유지될 수도 있다.

뉴럴 네트워크는 지도 학습(supervised learning), 비지도 학습(unsupervised learning), 및 반지도학습(semi supervised learning) 중 적어도 하나의 방식으로 학습될 수 있다. 뉴럴 네트워크의 학습은 출력의 오류를 최소화하기 위한 것이다. 뉴럴 네트워크의 학습에서 반복적으로 학습 데이터를 뉴럴 네트워크에 입력시키고 학습 데이터에 대한 뉴럴 네트워크의 출력과 타겟의 에러를 계산하고, 에러를 줄이기 위한 방향으로 뉴럴 네트워크의 에러를 뉴럴 네트워크의 출력 레이어에서부터 입력 레이어 방향으로 역전파(backpropagation)하여 뉴럴 네트워크의 각 노드의 가중치를 업데이트 하는 과정이다. 지도 학습의 경우 각각의 학습 데이터에 정답이 라벨링되어 있는 학습 데이터를 사용하며(즉, 라벨링된 학습 데이터), 비지도 학습의 경우는 각각의 학습 데이터에 정답이 라벨링되어 있지 않을 수 있다. 즉, 예를 들어 데이터 분류에 관한 지도 학습의 경우의 학습 데이터는 학습데이터 각각에 카테고리가 라벨링 된 데이터 일 수 있다. 라벨링된 학습 데이터가 뉴럴 네트워크에 입력되고, 뉴럴 네트워크의 출력(카테고리)과 학습 데이터의 라벨을 비교함으로써 오류(error)가 계산될 수 있다. 다른 예로, 데이터 분류에 관한 비지도 학습의 경우 입력인 학습 데이터가 뉴럴 네트워크 출력과 비교됨으로써 오류가 계산될 수 있다. 계산된 오류는 뉴럴 네트워크에서 역방향(즉, 출력 레이어에서 입력 레이어 방향)으로 역전파 되며, 역전파에 따라 뉴럴 네트워크의 각 레이어의 각 노드들의 연결 가중치가 업데이트 될 수 있다. 업데이트 되는 각 노드의 연결 가중치는 학습률(learning rate)에 따라 변화량이 결정될 수 있다. 입력 데이터에 대한 뉴럴 네트워크의 계산과 에러의 역전파는 학습 사이클(epoch)을 구성할 수 있다. 학습률은 뉴럴 네트워크의 학습 사이클의 반복 횟수에 따라 상이하게 적용될 수 있다. 예를 들어, 뉴럴 네트워크의 학습 초기에는 높은 학습률을 사용하여 뉴럴 네트워크가 빠르게 일정 수준의 성능을 확보하도록 하여 효율성을 높이고, 학습 후기에는 낮은 학습률을 사용하여 정확도를 높일 수 있다.

뉴럴 네트워크의 학습에서 일반적으로 학습 데이터는 실제 데이터(즉, 학습된 뉴럴 네트워크를 이용하여 처리하고자 하는 데이터)의 부분집합일 수 있으며, 따라서, 학습 데이터에 대한 오류는 감소하나 실제 데이터에 대해서는 오류가 증가하는 학습 사이클이 존재할 수 있다. 과적합(overfitting)은 이와 같이 학습 데이터에 과하게 학습하여 실제 데이터에 대한 오류가 증가하는 현상이다. 예를 들어, 노란색 고양이를 보여 고양이를 학습한 뉴럴 네트워크가 노란색 이외의 고양이를 보고는 고양이임을 인식하지 못하는 현상이 과적합의 일종일 수 있다. 과적합은 AI 알고리즘의 오류를 증가시키는 원인으로 작용할 수 있다. 이러한 과적합을 막기 위하여 다양한 최적화 방법이 사용될 수 있다. 과적합을 막기 위해서는 학습 데이터를 증가시키거나, 정칙화 또는 정규화(regularization), 학습의 과정에서 네트워크의 노드 일부를 생략하는 드롭아웃(dropout) 등의 방법이 적용될 수 있다.

본 명세서에 걸쳐, 연산 모델, 신경망, 네트워크 함수, 뉴럴 네트워크(neural network)는 동일한 의미로 사용될 수 있다. (이하에서는 신경망으로 통일하여 기술한다.) 데이터 구조는 신경망을 포함할 수 있다. 그리고 신경망을 포함한 데이터 구조는 컴퓨터 판독가능 매체에 저장될 수 있다. 신경망을 포함한 데이터 구조는 또한 신경망에 입력되는 데이터, 신경망의 가중치, 신경망의 하이퍼 파라미터, 신경망으로부터 획득한 데이터, 신경망의 각 노드 또는 레이어와 연관된 활성 함수, 신경망의 학습을 위한 손실 함수를 포함할 수 있다. 신경망을 포함한 데이터 구조는 상기 개시된 구성들 중 임의의 구성 요소들을 포함할 수 있다. 즉, 신경망을 포함한 데이터 구조는 신경망에 입력되는 데이터, 신경망의 가중치, 신경망의 하이퍼 파라미터, 신경망으로부터 획득한 데이터, 신경망의 각 노드 또는 레이어와 연관된 활성 함수, 신경망의 트레이닝을 위한 손실 함수 등 전부 또는 이들의 임의의 조합을 포함하여 구성될 수 있다. 전술한 구성들 이외에도, 신경망을 포함한 데이터 구조는 신경망의 특성을 결정하는 임의의 다른 정보를 포함할 수 있다. 또한, 데이터 구조는 신경망의 연산 과정에 사용되거나 발생되는 모든 형태의 데이터를 포함할 수 있으며 전술한 사항에 제한되는 것은 아니다. 컴퓨터 판독 가능 매체는 컴퓨터 판독가능 기록 매체 및/또는 컴퓨터 판독가능 전송 매체를 포함할 수 있다. 신경망은 일반적으로 노드라 지칭될 수 있는 상호 연결된 계산 단위들의 집합으로 구성될 수 있다. 이러한 노드들은 뉴런(neuron)들로 지칭될 수도 있다. 신경망은 적어도 하나 이상의 노드들을 포함하여 구성된다.

신경망 내에서, 링크를 통해 연결된 하나 이상의 노드들은 상대적으로 입력 노드 및 출력 노드의 관계를 형성할 수 있다. 입력 노드 및 출력 노드의 개념은 상대적인 것으로서, 하나의 노드에 대하여 출력 노드 관계에 있는 임의의 노드는 다른 노드와의 관계에서 입력 노드 관계에 있을 수 있으며, 그 역도 성립할 수 있다. 전술한 바와 같이, 입력 노드 대 출력 노드 관계는 링크를 중심으로 생성될 수 있다. 하나의 입력 노드에 하나 이상의 출력 노드가 링크를 통해 연결될 수 있으며, 그 역도 성립할 수 있다.

하나의 링크를 통해 연결된 입력 노드 및 출력 노드 관계에서, 출력 노드는 입력 노드에 입력된 데이터에 기초하여 그 값이 결정될 수 있다. 여기서 입력 노드와 출력 노드를 상호연결하는 노드는 가중치(weight)를 가질 수 있다. 가중치는 가변적일 수 있으며, 신경망이 원하는 기능을 수행하기 위해, 사용자 또는 알고리즘에 의해 가변될 수 있다. 예를 들어, 하나의 출력 노드에 하나 이상의 입력 노드가 각각의 링크에 의해 상호 연결된 경우, 출력 노드는 상기 출력 노드와 연결된 입력 노드들에 입력된 값들 및 각각의 입력 노드들에 대응하는 링크에 설정된 가중치에 기초하여 출력 노드 값을 결정할 수 있다.

전술한 바와 같이, 신경망은 하나 이상의 노드들이 하나 이상의 링크를 통해 상호연결 되어 신경망 내에서 입력 노드 및 출력 노드 관계를 형성한다. 신경망 내에서 노드들과 링크들의 개수 및 노드들과 링크들 사이의 연관관계, 링크들 각각에 부여된 가중치의 값에 따라, 신경망의 특성이 결정될 수 있다. 예를 들어, 동일한 개수의 노드 및 링크들이 존재하고, 링크들 사이의 가중치 값이 상이한 두 신경망이 존재하는 경우, 두 개의 신경망들은 서로 상이한 것으로 인식될 수 있다.

신경망을 구성하는 노드들 중 일부는, 최초 입력 노드로부터의 거리들에 기초하여, 하나의 레이어(layer)를 구성할 수 있다. 예를 들어, 최초 입력 노드로부터 거리가 n인 노드들의 집합은, n레이어를 구성할 수 있다. 최초 입력 노드로부터 거리는, 최초 입력 노드로부터 해당 노드까지 도달하기 위해 거쳐야 하는 링크들의 최소 개수에 의해 정의될 수 있다. 그러나, 이러한 레이어의 정의는 설명을 위한 임의적인 것으로서, 신경망 내에서 레이어의 차수는 전술한 것과 상이한 방법으로 정의될 수 있다. 예를 들어, 노드들의 레이어는 최종 출력 노드로부터 거리에 의해 정의될 수도 있다.

최초 입력 노드는 신경망 내의 노드들 중 다른 노드들과의 관계에서 링크를 거치지 않고 데이터가 직접 입력되는 하나 이상의 노드들을 의미할 수 있다. 또는, 신경망 네트워크 내에서, 링크를 기준으로 한 노드 간의 관계에 있어서, 링크로 연결된 다른 입력 노드들 가지지 않는 노드들을 의미할 수 있다. 이와 유사하게, 최종 출력 노드는 신경망 내의 노드들 중 다른 노드들과의 관계에서, 출력 노드를 가지지 않는 하나 이상의 노드들을 의미할 수 있다. 또한, 히든 노드는 최초 입력 노드 및 최후 출력 노드가 아닌 신경망을 구성하는 노드들을 의미할 수 있다. 본 발명의 일실시예에 따른 신경망은 입력 레이어의 노드가 출력 레이어에 가까운 히든 레이어의 노드보다 많을 수 있으며, 입력 레이어에서 히든 레이어로 진행됨에 따라 노드의 수가 감소하는 형태의 신경망일 수 있다.

신경망은 하나 이상의 히든 레이어를 포함할 수 있다. 히든 레이어의 히든 노드는 이전의 레이어의 출력과 주변 히든 노드의 출력을 입력으로 할 수 있다. 각 히든 레이어 별 히든 노드의 수는 동일할 수도 있고 상이할 수도 있다. 입력 레이어의 노드의 수는 입력 데이터의 데이터 필드의 수에 기초하여 결정될 수 있으며 히든 노드의 수와 동일할 수도 있고 상이할 수도 있다. 입력 레이어에 입력된 입력 데이터는 히든 레이어의 히든 노드에 의하여 연산될 수 있고 출력 레이어인 풀리 커넥티드 레이어(FCL: fully connected layer)에 의해 출력될 수 있다.

피처 추출 모델 및 피처 분류 모델

본 발명에 이용되는 수면 분석 모델은 미리 정해진 에폭 별 하나 이상의 피처를 추출하는 피처 추출 모델 및 피처 추출 모델을 통해 추출된 피처들 각각을 하나 이상의 수면단계로 분류하여 수면 상태 정보를 생성하는 피처 분류 모델을 포함할 수 있다. 피처 추출 모델은, 스펙트로그램(SP)의 시계열적 주파수 패턴을 분석하여 호흡음, 호흡패턴, 움직임 패턴에 관련한 피처들을 추출할 수 있다. 일실시예에서, 피처 추출 모델은 학습 데이터 세트를 통해 사전 학습된 신경망 모델의 일부를 통해 구성될 수 있다.

본 발명에 이용되는 수면 분석 모델은 피처 추출 모델 및 피처 분류 모델을 포함할 수 있다. 피처 추출 모델은 주어진 데이터의 시계열적 연관성을 학습할 수 있는 자연어처리 모델 기반의 딥러닝 학습 모델일 수 있다. 피처 분류 모델은 주어진 데이터의 시계열적 연관성을 학습할 수 있는 자연어처리 모델 기반의 학습 모델일 수 있다. 여기서, 시계열적 연관성을 학습할 수 있는 자연어처리 모델 기반의 딥러닝 학습 모델은 Tarnsformer, ViT, MobileViT, MobileViT2을 포함할 수 있으나, 이에 한정되지 않는다.

본 발명의 일실시예에 따른 학습 데이터 세트는, 주파수 도메인상의 데이터 및 각 데이터에 대응하는 복수의 수면 상태 정보로 구성될 수 있다.

또는, 본 발명의 일실시예에 따른 학습 데이터 세트는 복수의 스펙트로그램 및 각 스펙트로그램에 대응하는 복수의 수면 상태 정보로 구성될 수 있다.

또는, 본 발명의 일실시예에 따른 학습 데이터 세트는 복수의 멜 스펙트로그램 및 각 멜 스펙트로그램에 대응하는 복수의 수면 상태 정보로 구성될 수 있다.

이하 설명의 편의를 위하여 본 발명의 일실시예에 따른 수면 분석 모델의 구성 및 수행에 대하여 스펙트로그램의 데이터 세트를 기반으로 자세히 설명하나, 본 발명의 수면 분석 모델에 활용되는 학습 데이터는 스펙트로그램에 제한되는 것은 아니고, 주파수 도메인상의 정보, 스펙트로그램 또는 멜 스펙트로그램이 학습 데이터로서 활용될 수 있다.

본 발명의 실시예에 따른 수면 분석 모델 중 피처 추출 모델은, 하나의 스펙트로그램이 입력되어, 하나의 스펙트로그램에 해당하는 수면 상태 정보를 예측하도록 학습되는 One-to-one 프록시 태스크(Proxy task)에 의해서 사전 학습(Pre training)될 수 있다. 본 발명의 실시예에 따른 피처 추출 모델에 CNN 딥러닝 모델을 채용하는 경우에, FC(Fully Connected Layer) 또는 FCN(Fully Connected Neural Network)의 구조를 채택하여 학습을 수행할 수도 있다. 본 발명의 실시예에 따른 피처 추출 모델에 MobileViTV2 딥러닝 모델을 채용하는 경우에는, 중간층(Intermediate Layer)의 구조를 채택하여 학습을 수행할 수도 있다.

본 발명의 일 실시예에 따른 수면 분석 모델 중 피처 분류 모델은, 복수의 연속된 스펙트로그램이 입력되어, 각각의 스펙트로그램의 수면 상태 정보를 예측하고, 복수의 연속된 스펙트로그램의 시퀀스를 분석하여 전체적인 수면 상태 정보를 예측 또는 분류하도록 학습될 수 있다.

또한, 본 발명의 실시예에 따라 피처 추출 모델에 대한 One-to-one 프록시 태스크를 통해 사전 학습을 수행한 뒤, 사전 학습된 피처 추출 모델과 피처 분류 모델에 대한 Many-to-many 태스크를 통하여 파인 튜닝(Fine tuning)을 수행할 수 있다. 예컨대, 40개의 연속된 스펙트로그램의 시퀀스를, One-to-one 프록시 태스크로 학습한 복수 개의 피처 추출 모델에 입력하여 20개의 수면 상태 정보를 출력함으로써 수면 단계를 추론할 수도 있다. 전술한 스펙트로그램의 개수와 피처 추출 모델의 개수 및 수면 상태 정보의 개수와 관련한 구체적 수치적 기재는 단순한 예시일 뿐, 본 발명은 이에 제한되지는 않는다.

이하, 본 발명의 일 실시예에 따라 변환된 스펙트로그램에 기초하여 생성 또는 학습되는 피처 추출 모델 및 피처 분류 모델에 대하여 자세히 설명하기로 한다. 한편, 본 발명의 수면 분석 모델은 스펙트로그램에 기초하여 생성 또는 학습되는 것만으로 한정되는 것은 아니며, 앞서 서술했듯이, 로우(raw) 음향 정보의 주파수 성분들의 시간 축에 따른 변화를 포함하는 정보 또는, 주파수 도메인상의 정보에 기초하여 생성 또는 학습되는 것일 수 있다. 또한, 수면 분석 모델을 통한 수면 상태 정보의 추론도 마찬가지로 로우(raw) 음향 정보의 주파수 성분들의 시간 축에 따른 변화를 포함하는 정보 또는, 주파수 도메인상의 정보로 변환된 것에 기초하여 수행될 수 있다.

도 29a 및 도 29b는 본 발명에 따른 수면 분석 방법에 있어서 스펙트로그램을 이용하여 수면 장애 판단과 노이즈 부가의 성능을 설명하기 위한 도면이다.

도 29a 및 도 29b에 도시된 바와 같이, 본 발명의 일 실시예에 따른 수면 분석 모델에 의하면, 소음에 의해서 스펙트로그램이 손상된 경우에도 무호흡을 높은 신뢰도로 감지할 수 있다.

피처 추출 모델

피처 추출 모델은, 학습 데이터 세트를 통해 학습된 독자적인 딥러닝 모델로 구성될 수 있다. 피처 추출 모델은 지도 학습 또는 비지도 학습 방식을 통해 학습될 수 있다. 피처 추출 모델은 학습 데이터 세트를 통해 입력 데이터와 유사한 출력 데이터를 출력하도록 학습될 수 있다. 자세히 설명하면, 입력된 스펙트로그램의 핵심 특징 데이터(또는 피처)만을 히든 레이어를 통해 학습할 수 있다. 이 경우, 디코더를 통한 디코딩 과정에서 히든 레이어의 출력 데이터는 완벽한 복사 값이 아닌 입력 데이터(즉, 스펙트로그램)의 근사치일 수 있다.

학습 데이터 세트에 포함된 복수의 스펙트로그램 각각에는, 수면 상태 정보가 태깅될 수 있다. 복수의 스펙트로그램 각각을 피처 추출 모델에 입력될 수 있으며, 각 스펙트로그램에 대응하는 출력은 태깅된 수면 상태 정보와 매칭하여 저장될 수 있다. 구체적으로 제1수면 상태 정보(예컨대, 얕은 수면)가 태깅된 제1학습 데이터 세트들(즉, 복수의 스펙트로그램)을 입력으로 하는 경우, 해당 입력에 대한 출력에 관련한 피처들은 제1수면 상태 정보와 매칭하여 저장될 수 있다. 실시예에서, 출력에 관련한 하나 이상의 피처는 벡터 공간 상에 표시될 수 있다. 이 경우, 제1학습 데이터 세트들을 각각에 대응하여 출력된 특징 데이터들은 제1수면단계에 관련한 스펙트로그램을 통한 출력이므로, 벡터 공간 상에서 비교적 가까운 거리에 위치할 수 있다. 즉, 각 수면단계에 대응하여 복수의 스펙트로그램들이 유사한 피처를 출력하도록 학습이 수행될 수 있다.

전술한 학습 과정을 통한 피처 추출 모델은 스펙트로그램(예컨대, 수면 음향 정보에 대응하여 변환된 스펙트로그램)을 입력으로 하는 경우, 해당 스펙트로그램에 대응하는 피처를 추출할 수 있다.

실시예에서, 프로세서(130)는 수면 음향 정보(SS)에 대응하여 생성된 스펙트로그램(SP)을 피처 추출 모델의 입력으로 처리하여 피처를 추출할 수 있다. 여기서, 수면 음향 정보(SS)는 사용자의 수면 동안 시계열적으로 획득되는 시계열 데이터이므로, 프로세서(130)는 스펙트로그램(SP)을 미리 정해진 에폭으로 분할할 수 있다. 예컨대, 프로세서(130)는 수면 음향 정보(SS)에 대응하는 스펙트로그램(SP)을 30초 단위로 분할하여 복수 개의 스펙트로그램들을 획득할 수 있다. 예를 들어, 사용자의 7시간(즉, 420분) 수면 동안 수면 음향 정보가 획득된 경우, 프로세서(130)는 30초 단위로 스펙트로그램을 분할하여 840개의 스펙트로그램을 획득할 수 있다. 전술한 수면 시간, 스펙트로그램의 분할 시간 단위 및 분할 개수에 대한 구체적인 수치적 기재는 예시일 뿐, 본 발명은 이에 제한되지 않는다.

프로세서(130)는 분할된 복수 개의 스펙트로그램들 각각을 피처 추출 모델의 입력으로 처리하여 복수 개의 스펙트로그램들 각각에 대응하는 복수의 피처를 추출할 수 있다. 예컨대, 복수 개의 스펙트로그램들의 개수가 840개인 경우, 이에 대응하여 피처 추출 모델이 추출하는 복수의 피처의 개수 또한 840개일 수 있다. 전술한 스펙트로그램 및 복수의 피처의 개수에 관련한 구체적인 수치적 기재는 예시일 뿐, 본 발명은 이에 제한되지 않는다.

한편, 본 발명의 실시예에 따른 피처 추출 모델은 One-to-one 프록시 태스크에 의해 학습을 수행할 수도 있다. 또한, 하나의 스펙트로그램에 대한 수면 상태 정보를 추출하도록 학습하는 과정에 있어서, 피처 추출 모델과 또 다른 NN(Neural Network)을 결합하여 수면 상태 정보를 추출하도록 학습될 수도 있다.

본 발명의 실시예에 따라, 사전 학습된 간단한 Neural Network를 거쳐서 거쳐서 학습을 수행한다면, 피처 추출 모델의 학습 시간을 단축하거나 또는 학습의 효율을 높일 수 있다.

예를 들어, 본 발명의 일실시예에 따라 30초 단위로 분할된 하나의 스펙트로그램이 피처 추출 모델의 입력으로 하여 출력된 벡터가 다른 NN의 입력으로 하여 수면 상태 정보를 출력하도록 학습될 수도 있다.

한편, 본 발명의 일 실시예에 따르면, 프로세서(130)는 복수의 소스 데이터를 활용하여 피처 추출 모델을 생성할 수 있다. 또한, 피처 추출 모델은 차원 감소 네트워크 함수(예컨대, 인코더(Encoder))를 포함할 수도 있다.

실시예에서, 학습 데이터로 활용되는 복수의 주파수 도메인상의 정보 또는 스펙트로그램(즉, 복수의 소스 데이터에 대응하는 복수의 변환된 정보) 각각에는, 수면 단계 정보가 라벨링될 수 있다. 예컨대, 복수의 소스 데이터는 특정 공간(예컨대, 병원)에서 획득되는 수면 음향에 관한 정보이며, 복수의 수면 상태(즉, 수면 단계)에 관한 정보가 사전 라벨링되어 있을 수 있다.

변환된 복수의 정보들 각각은 차원 감소 네트워크 함수에 입력될 수 있으며, 각 변환된 정보에 대응하는 출력은 라벨링된 수면 단계 정보와 매칭될 수 있다. 구체적으로 제1수면 단계 정보(예컨대, 얕은 수면)가 라벨링된 제1학습 데이터 세트들(예컨대, 소스 데이터에 관련한 복수의 스펙트로그램)을 차원 감소 네트워크 함수의 입력으로 하는 경우, 해당 입력에 대한 차원 감소 네트워크 함수의 출력에 관련한 피처들은 제1수면 단계 정보와 매칭될 수 있다.

실시예에서, 차원 감소 네트워크 함수의 출력에 관련한 하나 이상의 피처는 벡터 공간 상에 표시될 수 있다. 이 경우, 제1학습 데이터 세트들 각각에 대응하여 출력된 특징 데이터들은 제1수면 단계에 관련한 스펙트로그램을 통한 출력(예컨대, 동일한 클래스에 해당하는 스펙트로그램을 통한 출력)이므로, 벡터 공간 상에서 비교적 가까운 거리에 위치할 수 있다.

즉, 각 수면 단계에 대응하여 복수의 스펙트로그램들이 유사한 피처를 출력하도록 차원 감소 네트워크 함수의 학습이 수행될 수 있으나, 차원 감소 네트워크의 구체적인 학습 방법은 제한되지 않는다.

전술한 학습 과정을 통해 피처 추출 모델은 수면 음향 정보에 대응하여 변환된 정보를 입력으로 하는 경우, 해당 변환된 정보에 대응하는 피처를 추출할 수 있다.

피처 분류 모델

본 발명의 일 실시예에 따라, 프로세서(130)는 피처 추출 모델을 통해 출력된 복수의 피처를 피처 분류 모델의 입력으로 처리하여 수면 상태 정보를 획득할 수 있다. 실시예에서, 피처 분류 모델은 피처에 대응하여 수면단계를 예측하도록 모델링된 신경망 모델일 수 있다. 예컨대, 피처 분류 모델은 fully connected layer를 포함하여 구성되며, 피처를 수면단계들 중 적어도 하나로 분류하는 모델일 수 있다. 예를 들어, 피처 분류 모델은 제1스펙트로그램에 대응하는 제1피처를 입력으로 하는 경우, 해당 제1피처를 얕은 수면으로 분류할 수 있다. 또는, 예를 들어, 피처 분류 모델은 제2스펙트로그램에 대응하는 제2피처를 입력으로 하는 경우, 해당 제2피처를 깊은 잠으로 분류할 수 있다. 또는, 피처 분류 모델은 제3스펙트로그램에 대응하는 제3피처를 입력으로 하는 경우, 해당 제3피처를 렘 수면으로 분류할 수 있다. 또는, 예를 들어, 피처 분류 모델은 제4스펙트로그램에 대응하는 제4피처를 입력으로 하는 경우, 해당 제4피처를 깸으로 분류할 수 있다.

또한, 본 발명의 일 실시예에서, 피처 분류 모델은 피처에 대응하여 수면에서 발생하는 사건(이벤트)을 예측하도록 모델링된 신경망 모델일 수 있다. 예컨대, 피처 분류 모델은 풀리 커넥티드 레이어(fully connected layer)를 포함하여 구성되며, 피처를 수면에서 발생하는 사건 중 적어도 하나로 분류하는 모델일 수 있다. 예를 들어, 피처 분류 모델은 제1스펙트로그램에 대응하는 제1피처를 입력으로 하는 경우, 해당 제1피처를 수면 무호흡증 사건 발생으로 분류할 수 있다. 예를 들어, 피처 분류 모델은 제2스펙트로그램에 대응하는 제2피처를 입력으로 하는 경우, 해당 제2피처를 수면 저호흡증 사건 발생으로 분류할 수 있다. 예를 들어, 피처 분류 모델은 제3스펙트로그램에 대응하는 제3피처를 입력으로 하는 경우, 해당 제3피처를 수면 상태 정상으로 분류할 수 있다. 예를 들어, 피처 분류 모델은 제4스펙트로그램에 대응하는 제4피처를 입력으로 하는 경우, 해당 제4피처를 수면 중 코골이 사건으로 분류할 수 있다. 예를 들어, 피처 분류 모델은 제5스펙트로그램에 대응하는 제5피처를 입력으로 하는 경우, 해당 제5피처를 수면 중 잠꼬대 사건으로 분류할 수 있다.

본 발명의 일 실시예에 따라, 피처 분류 모델은 복수의 피처에 대한 분류를 수행할 수 있다. 피처 분류 모델은 복수의 피처 각각을 복수의 수면 단계 중 적어도 하나로 분류할 수 있다. 또한, 본 발명의 일 실시예에 따르면, 피처 추출 모델은 피처 분류 모델로 하여금 어떠한 수면 단계에 해당하는지 분류가 용이하도록 피처를 추출하고, 피처 분류 모델은 피처 추출 모델로부터 전달된 피처를 보다 잘 분류하도록(즉, 특정 수면 단계로 잘 분류하도록) 학습될 수 있다. 다시 말해, 적대적 학습을 통해 피처 분류 모델은 피처 추출 모델로부터 전달된 피처들을 보다 잘 분류할 수 있게 된다. 일 실시예에서, 피처 분류 모델은 피처에 대응하여 수면 단계 분류 또는 수면 이벤트 분류를 잘 수행하기 위해, 피처 간의 클래스 분류가 용이하도록 학습될 수 있다.

본 발명의 일 실시예에 따라, 프로세서(130)는 피처 추출 모델과 피처 분류 모델의 학습 수행 결과에 따라, 피처 추출 모델과 피처 분류 모델 간 제1 로스에 관련한 제1학습 정보를 통해 피처 추출 모델을 업데이트할 수 있다. 이에 따라, 업데이트된 피처 추출 모델은 피처 분류 모델이 클래스(즉, 수면 단계)를 잘 분류하도록 하는 피처를 추출할 수 있다. 다시 말해, 업데이트된 피처 추출 모델은 동일한 수면 단계에 관련한 피처들 각각이 군집화되도록 피처를 추출할 수 있다.

일 실시예에 따르면, 판별자 모델은 피처 추출 모델로부터 전달된 복수의 피처 각각이 소스 데이터에 관련한 피처인지 또는 타겟 데이터에 관련한 피처인지 여부를 구별하는 신경망 모델일 수 있다. 예컨대, 판별자 모델은 입력에 관련한 피처가 병원에서 획득한 수면 음향 정보에 대응하는 피처인지 또는, 개별 사용자의 실생활에서 획득한 수면 음향 정보에 대응하는 피처인지 여부를 판별할 수 있다. 즉, 판별자 모델은 복수의 피처 중 적어도 하나를 입력으로 하여 입력에 관련한 피처가 소스 데이터에 관련한 피처인지 또는 타겟 데이터에 관련한 피처인지 여부를 구별할 수 있다. 판별자 모델을 활용한 수면 분석 모델의 학습은 이하 자세히 후술하도록 한다.

피처 분류 모델은 여러 에폭에 관련한 스펙트로그램을 입력으로 하여 여러 에폭의 수면단계를 예측하는 멀티 에폭 분류를 수행할 수 있다. 멀티 에폭 분류란, 단일 에폭의 스펙트로그램(즉, 30초에 해당하는 하나의 스펙트로그램)에 대응하여 하나의 수면단계분석 정보를 제공하는 것이 아닌, 복수의 에폭에 해당하는 스펙트로그램들(즉, 각각 30초에 해당하는 스펙트로그램들의 조합)을 입력으로 하여 여러 수면단계들(예컨대, 시간 변화에 따른 수면단계들의 변화)를 한 번에 추정하기 위한 것일 수 있다. 예컨대, 호흡 패턴 또는 움직임 패턴은 뇌파 신호 또는 다른 생체 신호에 비해 천천히 변화하기 때문에, 과거와 미래의 시점에서 패턴이 어떻게 변화하는지를 관찰해야 정확한 수면단계 추정이 가능할 수 있다. 구체적인 예를 들어, 피처 분류 모델은, 40개의 스펙트로그램(예컨대, 각각 30초에 해당하는 스펙트로그램이 40개)을 입력으로 하여, 가운데에 위치한 20개의 스펙트로그램에 대한 예측을 수행할 수 있다. 즉, 1 내지 40의 스펙트로그램을 모두를 살펴보나, 10 내지 20에 대응하는 스펙트로그램에 대응하는 분류를 통해 수면단계를 예측할 수 있다. 전술한 스펙트로그램의 개수에 대한 구체적인 수치적 기재는 예시일 뿐, 본 발명은 이에 제한되지 않는다.

즉, 수면 상태 정보를 추론하는 과정에서, 단일 스펙트로그램 각각에 대응하여 수면 상태 정보의 예측을 수행하는 것이 아닌, 과거와 미래에 관련한 정보를 모두 고려할 수 있도록 복수의 에폭에 해당하는 스펙트로그램들을 입력으로 활용하도록 함으로써, 출력의 정확도 향상을 도모할 수 있다. 한편, 스펙트로그램 뿐 아니라, 복수의 에폭에 해당하는 주파수 성분의 시간 축에 따른 변화를 포함하는 정보들 또는 주파수 도메인상의 정보들을 입력으로 하여 추론을 수행함으로써, 출력의 정확도 향상을 도모할 수 있다.

도 8은 본 발명에 따른 수면 분석 방법에 있어서 스펙트로그램을 이용한 수면단계분석을 설명하기 위한 도면이다.

본 발명의 일실시예에 따르면, Actigraphy 및 HRV에 기초한 1차 수면 분석 이후, 수면 음향 정보에 기초한 2차 분석은 상술한 바와 같은 수면 분석 모델을 이용하게 되며, 도 8에 도시된 바와 같이, 사용자의 수면 음향 정보가 입력되면 그에 대응되는 수면단계(Wake, REM, Light, Deep)가 즉각적으로 추론될 수 있다. 이에 더하여, 수면 음향 정보에 기초한 2차 분석은 수면단계에 대응하는 멜 스펙트럼의 특이점을 통해 수면장애(수면무호흡, 과호흡)나 코골이 등이 발생한 시점을 추출할 수 있다.

도 9에 도시된 바와 같이, 하나의 변환된 주파수 도메인상의 정보 또는 스펙트로그램 또는 멜 스펙트로그램에 있어서 호흡 패턴을 분석하고, 수면무호흡(apnea)이나 과호흡(hyperpnea) 이벤트에 대응하는 특성이 감지되면 해당 시점을 수면 이벤트가 발생한 시점으로 판단할 수 있다. 이때, 주파수 분석을 통해서 수면무호흡(apnea)이나 과호흡(hyperpnea)이 아닌 코골이로 분류하는 과정을 더 포함할 수도 있다.

도 10에 도시된 바와 같이, 사용자의 수면 영상과 수면음향이 실시간으로 획득되며, 획득된 수면 음향 정보는 스펙트로그램으로 즉각 변환된다. 이때, 수면 음향 정보의 전처리과정이 이루어질 수 있다. 스펙트로그램은 수면 분석 모델에 입력되어 즉각적으로 수면단계가 분석될 수 있다.

또한, 본 발명의 일실시예에 따른 피처 분류 모델에 CNN 또는 트랜스포머(Transformer) 기반의 딥러닝 모델을 채용하는 경우의 동작은 다음과 같이 수행될 수도 있다.

본 발명의 일실시예에 따라 시계열 정보가 포함되어 있는 스펙트로그램이 CNN 기반의 딥러닝 모델의 입력으로 하여, 차원이 낮아진 벡터를 출력할 수 있다. 이렇게 차원이 낮아진 벡터를 Transformer 기반의 딥러닝 모델의 입력으로 하여, 시계열 정보가 함축된 벡터가 출력될 수 있다.

본 발명의 실시예에 따라 Transformer 기반의 딥러닝 모델의 출력 벡터에 대하여 평균 풀링(Average pooling) 기법이 적용될 수 있도록 1D CNN(1D Convolutional Neural Network)에 입력하여, 시계열 정보에 대한 평균화 작업을 통해, 시계열 정보가 함축된 N차원의 벡터로 변환하는 과정을 수행할 수도 있다. 이 경우 시계열 정보가 함축된 N차원의 벡터는 입력 데이터와의 해상도 차이가 있을 뿐, 여전히 시계열 정보를 포함하고 있는 데이터에 해당한다.

본 발명의 실시예에 따라 출력된 시계열 정보가 함축된 N차원의 벡터들의 조합에 대한 멀티 에폭 분류를 수행하여, 여러 수면단계들에 대한 예측을 수행할 수 있다. 이 경우 Transformer 기반의 딥러닝 모델들의 출력 벡터들을 복수 개의 FC(Fully Connected layer)의 입력으로 하여 연속적인 수면 상태 정보의 예측을 수행할 수도 있다.

또한, 본 발명의 일실시예에 따른 피처 분류 모델에 ViT 또는 Mobile ViT 기반의 딥러닝 모델을 채용하는 경우 동작은 다음과 같이 수행될 수 있다. 도 24는 본 발명의 일실시예에 따른 자연어 처리 모델을 활용한 수면 분석 모델의 구조를 설명하기 위한 도면이다.

본 발명의 일실시예에 따라 시계열 정보가 포함되어 있는 스펙트로그램이 Mobile ViT기반의 딥러닝 모델의 입력으로 하여, 차원이 낮아진 벡터를 출력할 수 있다.

또한, 본 발명의 실시예에 따라 Mobile ViT기반의 딥러닝 모델의 출력으로 각각의 스펙트로그램에서 피처를 추출할 수 있다.

본 발명의 실시예에 따라서 차원이 낮아진 벡터를 Intermediate Layer의 입력으로 하여, 시계열 정보가 함축된 벡터가 출력될 수 있다. Intermediate Layer 모델에서는 벡터의 정보를 함축하는 선형화 단계(Lnearization), 평균과 분산을 입력하기 위한 레이어 정규화(Layer Normalization)단계 또는 일부 노드를 비활성화하는 드롭아웃(dropout)단계 중 적어도 하나 이상의 단계가 포함될 수 있다.

본 발명의 실시예에 따라서 차원이 낮아진 벡터를 Intermediate Layer의 입력으로 하여 시계열 정보가 함축된 벡터를 출력하는 과정을 수행함으로써, 과적합(overfitting)을 방지할 수 있다.

본 발명의 실시예에 따라서 Intermediate Layer의 출력 벡터를 ViT기반의 딥러닝 모델의 입력으로 하여 수면 상태 정보를 출력할 수 있다. 이 경우 시계열 정보가 포함되어 있는 주파수 도메인상의 정보, 스펙트로그램, 또는 멜 스펙트로그램에 대응하는 수면 상태 정보를 출력할 수 있다.

또한, 본 발명의 일실시예에 따라서 시계열 정보가 포함되어 있는 주파수 도메인상의 정보, 스펙트로그램, 또는 멜 스펙트로그램의 일련의 구성에 대응하는 수면 상태 정보를 출력할 수 있다.

한편, 본 발명의 실시예에 따른 피처 추출 모델 또는 피처 분류 모델에는 상기 언급된 AI 모델 외에도 다양한 인공지능 모델이 채용되어 학습 또는 추론을 수행할 수도 있으며, 전술한 인공지능 모델의 종류와 관련한 구체적 기재는 단순한 예시일 뿐, 본 발명은 이에 제한되는 것은 아니다.

본 발명의 실시예들에 따른 수면 분석 모델의 비지도 또는 반지도 학습방법

본 발명의 실시예에 따른 데이터 셋은 특정 환경(바람직하게는, 수면다원검사 환경)에서 획득한 레이블드 데이터(labeled data)로 구성된 것일 수도 있으나, 다른 환경(바람직하게는, 수면다원검사 이외의 환경 등)에서 획득한 언레이블드 데이터(unlabeled data)로 구성된 것일 수도 있다. 전술한 환경에 대한 구체적인 기재는 단순히 예시일 뿐, 본 발명은 이에 제한되지 않는다.

정답이 라벨링 되어있는 라벨링 학습 데이터인 labeled data를 사용하여 학습하는 경우에 지도 학습이 가능하지만, 정답이 라벨링 되어있지 않은 unlabeled data를 사용하여 학습하는 경우에 비지도 학습이 필요한데, 이하 본 발명의 실시예에 따른 비지도 학습모델 등에 대하여 설명한다.

타겟 환경의 노이즈를 이용한 Consistency Training

컨시스턴시 트레이닝(Consistency Training)은 반지도학습(Semi-Supervised learning)모델의 하나의 종류로서, 본 발명의 실시예에 따른 Consistency Training은 하나의 데이터에 대하여 노이즈를 의도적으로 부가한 것과, 노이즈를 의도적으로 부가하지 않은 데이터를 가지고 학습을 수행하는 방법일 수 있다.

또한, 본 발명의 실시예에 따른 Consistency Training은 타겟 환경의 노이즈를 이용하여 가상의 수면 환경의 데이터를 생성하여 학습을 수행하는 방법일 수 있다.

본 발명의 실시예에 따라 의도적으로 부가되는 노이즈는 타겟 환경의 노이즈일 수 있는데, 여기서 타겟 환경의 노이즈는 예컨대 수면다원검사 이외의 환경에서 획득된 노이즈일 수 있다.

이하 편의상, 노이즈를 의도적으로 부가한 데이터를 Corrupted data로 지칭한다. Corrupted data는 바람직하게는 의도적으로 타겟 환경의 노이즈를 부가한 데이터를 의미할 수 있다.

또한, 이하 편의상, 노이즈를 의도적으로 부가하지 않은 데이터를 Clean data로 지칭하기로 한다. 여기서 Clean data에는 의도적으로 노이즈를 부가하지 않았을 뿐, 실질적으로 노이즈가 포함될 수도 있다.

본 발명의 일실시예에 따른 Consistency Training에 이용되는 Clean data는, 특정 환경(바람직하게는, 수면다원검사 환경)에서 획득한 데이터일 수 있고, Corrupted data는 다른 환경 또는 타겟 환경(바람직하게는, 수면다원검사 이외의 환경)에서 획득한 데이터일 수 있다.

본 발명의 일실시예에 따른 Corrupted data는 다른 환경 또는 타겟 환경(바람직하게는, 수면다원검사 이외의 환경)에서 획득한 노이즈를 Clean data에 의도적으로 부가한 데이터일 수 있다.

Consistency Training에서, 동일한 딥러닝 모델에 Clean data와 Corrupted data를 각각 입력한 경우에 각각의 출력이 서로 같아지도록 손실 함수 또는 일관성 손실(consistency loss)을 정의하여, 일관된 예측(consistent prediction)을 도모하도록 학습이 수행될 수 있다.

본 발명의 실시예에 따라 Corrupted data를 획득하기 위해, 노이즈를 부가하는 과정에서, 획득한 노이즈마다 길이가 다르다는 문제가 발생할 수도 있는데, 이 경우 여러 스펙트로그램에 대한 학습을 수행함에 있어 노이즈 샘플링 방법에 대하여 서술한다.

본 발명의 실시예에 따른 노이즈의 종류는 적어도 9종 이상일 수 있으며, 각 종류의 노이즈마다 수천개 이상의 음향 정보를 적용할 수도 있다.

본 발명의 실시예에 따른 복수 개의 스펙트로그램이 입력될 때에, 각각의 스펙트로그램이 30초 단위로 분할되어 40개(총 20분의 시간 간격에 해당하는 데이터)가 딥러닝 모델의 입력으로 될 수도 있다. 이러한 입력 데이터와 시간 간격을 맞추기 위하여, 노이즈를 20분에 해당하는 시간 간격에 해당하도록 임의로 샘플링을 진행할 수 있다(예컨대, 5분, 9분, 4분, 7분... 등). 만약 샘플링한 노이즈들의 총 시간 간격이 20분이 넘어가는 경우에는, 20분을 넘어가는 부분을 제외할 수도 있다.

본 발명의 실시예에 따른 Clean data인 스펙트로그램의 시간 간격과 동일한 시간 간격(예컨대, 20분)에 해당하는 노이즈들에 대하여도 스펙트로그램으로 변환하는 과정을 수행하고, Clean data인 스펙트로그램에 임의적으로 부가함으로써, Corrupted data를 획득할 수 있다.

본 발명의 실시예에 따라 스펙트로그램에 임의적으로 노이즈를 부가하는 과정에 있어서, 스펙트로그램은 멜 스케일이 적용된 멜 스펙트로그램일 수 있다. 한편, 본 발명의 실시예에 따라 노이즈를 부가하는 과정에 있어서, 노이즈는 음향 정보와 동일한 도메인의 노이즈 또는 스펙트로그램 또는 멜 스케일을 적용한 멜 스펙트로그램과 동일한 도메인의 노이즈일 수 있다. 여기서 음향 정보의 도메인은 진폭, 위상, 주파수를 가지는 도메인일 수 있다.

또한, 본 발명의 실시예에 따른 스펙트로그램 또는 멜 스펙트로그램의 도메인은 진폭, 주파수를 가지는 도메인일 수 있다.

본 발명의 실시예에 따라 노이즈를 스펙트로그램 또는 멜 스펙트로그램과 동일한 도메인으로 변환하여 부가하는 경우에는, 노이즈에 임의의 Phase를 부여하여 부가과정을 진행할 수 있는데, 이를 통해 멜 상태의 데이터의 역산이 어려워짐을 통해서, 데이터의 비식별화를 유지하여 개인의 프라이버시를 보호할 수 있는 한 편, 학습의 연산량을 낮추어 학습시간을 단축할 수 있다.

획득한 Corrupted data와 Clean data를 동일한 딥러닝 모델의 입력으로 하였을 때, 출력이 서로 같아지도록 학습을 시키는 것이 Consistency Training 방법이라고 할 수 있다. 한편, 전술한 시간 간격 및 스펙트로그램의 개수 등과 관련한 구체적 기재는 본 발명의 이해를 돕기 위한 예시일 뿐, 본 발명은 이에 제한되는 것은 아니다.

Unsupervised Domain Adaptation (UDA)

도 22는 본 발명의 일실시예에 따른 UDA(Unsupervised Domain Adaptation)를 설명하기 위한 도면이다. 본 발명의 일 실시예에 따르면, 프로세서(130)는, 피처 추출 모델, 피처 분류 모델 및 판별자 모델을 포함하는 인공지능 모델에 대한 학습을 수행할 수 있다.

본 발명의 실시예에 따른 UDA는 labeled data를 이용한 Supervised learning을 통해서 AI 모델을 충분히 학습시킨 뒤에, 추가적으로 주어지는 unlabeled data만으로 추가 학습을 시킬 수 있다.

또는, 본 발명의 일실시예에 따른 UDA는 1차 학습과 2차 학습으로 구성 및 수행될 수 있다.

본 발명의 일실시예에 따른 UDA의 1차 학습에서는 unlabeled data와 labeled data를 활용할 수 있다.

본 발명의 일실시예에 따른 UDA의 2차 학습에서는 unlabeled data를 활용할 수 있다.

본 발명의 일실시예에 따른 UDA의 1차 학습은, 서로 다른 환경에서 획득한 데이터를 하나의 수면 분석 모델의 입력으로 하여 데이터간의 공통점을 추출해낼 수 있도록 학습을 수행하는 것을 포함할 수 있다. 또한, 서로 다른 환경에서 획득한 데이터를 하나의 수면 분석 모델의 입력으로 하여 추출한 데이터간의 공통점을 딥러닝 모델의 입력으로 하여, 입력된 데이터간의 차이점을 구별하여 분류하도록 학습을 수행하는 것을 포함할 수 있다. 본 발명의 일실시예에 따른 UDA의 1차 학습은 labeled data와 unlabeled data 중 공통된 데이터(예컨대, 사람의 수면 음향 정보)를 피처 추출 모델을 이용하여 추출하도록 학습하는 것을 포함할 수 있다.

본 발명의 일실시예에 따른 UDA의 1차 학습에 이용되는 labeled data는, 특정 환경(바람직하게는, 수면다원검사 환경)에서 획득한 데이터일 수 있고, unlabeled data는 다른 환경 또는 타겟 환경 (바람직하게는, 수면다원검사 이외의 환경)에서 획득한 데이터일 수 있다.

본 발명의 일실시예에 따른 UDA의 1차 학습에 이용되는 labeled data는, 특정 인종(예컨대, 한국인)으로부터 획득한 수면 음향 정보일 수 있고, unlabeled data는 다른 인종(예컨대, 황인종, 흑인종, 백인종, 히스패닉 등)으로부터 획득한 수면 음향 정보일 수 있다.

본 발명의 일실시예에 따른 UDA의 1차 학습에 이용되는 labeled data는 특정 성별(예컨대, 남자)로부터 획득한 수면 음향 정보일 수 있고, unlabeled data는 다른 성별(예컨대, 여자)로부터 획득한 수면 음향 정보일 수 있다.

본 발명의 일실시예에 따른 UDA의 1차 학습에 이용되는 labeled data는 특정 연령대(예컨대, 20대)로부터 획득한 수면 음향 정보일 수 있고, unlabeled data는 다른 연령대(예컨대, 10대, 30대, 40대 등)로부터 획득한 수면 음향 정보일 수 있다.

본 발명의 일실시예에 따른 UDA의 1차 학습에 이용되는 labeled data는 특정 신체구성지수집단(예컨대, 체질량지수 BMI 25이상인 집단)으로부터 획득한 수면 음향 정보일 수 있고, unlabeled data는 다른 신체구성지수집단(예컨대, 체질량지수 BMI 25미만인 집단)으로부터 획득한 수면 음향 정보일 수 있다.

본 발명의 일실시예에 따른 UDA의 1차 학습에 이용되는 labeled data는 수면 질환이 있는 집단(예컨대, 수면무호흡증 질환자 집단)으로부터 획득한 수면 음향 정보일 수 있고, unlabeled data는 수면 질환이 없는 집단(예컨대, 수면무호흡증 질환이 없는 집단)으로부터 획득한 수면 음향 정보일 수 있다.

본 발명의 일실시예에 따른 UDA의 1차 학습에 이용되는 labeled data는 호흡기 질환이 있는 집단(예컨대, 천식 질환자 집단)으로부터 획득한 수면 음향 정보일 수 있고, unlabeled data는 호흡기 질환이 없는 집단(예컨대, 천식 질환이 없는 집단)으로부터 획득한 수면 음향 정보일 수 있다.

본 발명의 일실시예에 따른 UDA의 1차 학습에 이용되는 labeled data는 상술한 각각의 환경 또는 특성을 개별적으로 적용하는 것에 제한되지 않고, 하나 이상의 환경 또는 특성을 나타내는 대상집단의 조합으로부터 획득한 음향 정보일 수 있다.

또한, 본 발명의 일실시예에 따른 UDA의 1차 학습에 이용되는 unlabeled data는 상술한 각각의 환경 또는 특성을 개별적으로 적용하는 것에 제한되지 않고, 하나 이상의 환경 또는 특성을 나타내는 대상집단의 조합으로부터 획득한 음향 정보일 수 있다.

또한, 본 발명의 일실시예에 따른 UDA의 1차 학습은, 특정 환경에서 획득한 데이터와 다른 환경 또는 타겟 환경 에서 획득한 데이터 각각을, 피처 추출 모델의 입력으로 하여 추출한 공통된 데이터를 판별자(Discriminator) 모델의 입력으로 하여, 입력된 데이터가 특정 환경으로부터 획득된 것인지, 다른 환경 또는 타겟 환경으로부터 획득된 것인지 여부를 분류하기 위해 학습하는 것을 포함할 수 있다.

이 경우, 본 발명의 일실시예에 따른 UDA의 1차 학습에서, 피처 추출 모델은 입력된 데이터간의 공통점만 출력하도록 학습되므로, 특정 환경으로부터 획득한 데이터와, 다른 환경 또는 타겟 환경으로부터 획득한 데이터간의 분류를 약화하는 역할을 수행할 수 있고, 판별자 모델은 데이터간의 분류를 강화하는 역할을 수행할 수 있으므로, 이를 위해 각각의 모델에 적용되는 loss를 반대로 설정할 수도 있다.

본 발명의 실시예에서, 특정 환경으로부터 획득한 데이터와는 달리 다른 환경 또는 타겟 환경으로부터 획득한 데이터에는 수면 상태 정보와 관련한 라벨링이 없을 수 있다. 따라서, 특정 환경(예컨대, 수면다원검사 환경)으로부터 획득한, 수면 상태 정보가 라벨링된 데이터를 피처 추출 모델 또는 피처 분류 모델을 통해 수면 상태 정보의 학습을 별도로 수행할 수도 있다. 여기서는 위 라벨링된 데이터가 입력되어 수면 상태 정보에 대한 학습을 수행하는 피처 추출 모델 또는 피처 분류 모델을 편의상 Classifier로 지칭하기로 한다.

이와 같은 학습이 적절히 수행된다면, 피처 추출 모델은 특정 환경으로부터 획득한 데이터와, 다른 환경 또는 타겟 환경으로부터 획득한 데이터를 입력으로 하여, 입력된 데이터간의 공통점만 추출하도록 학습이 수행되기 때문에, 피처 추출 모델의 출력 데이터 중 다른 환경 또는 타겟 환경으로부터 획득한, 라벨링되지 않은 데이터의 출력값을 Classifier에 입력하더라도 수면 상태 정보가 출력될 수 있다.

정리하면, 본 발명의 실시예에 따른 UDA의 1차 학습은, 피처 추출 모델을 통해서 특정 환경(예컨대, 수면다원검사 환경) 또는 다른 환경 또는 타켓 환경(예컨대, 수면다원검사 이외의 환경)으로부터 획득한 데이터의 공통된 피처를 추출 또는 출력하고, 출력된 공통된 피처를 판별자 모델에 입력하여 특정 환경으로부터 획득한 데이터와, 다른 환경 또는 타겟 환경으로부터 획득한 데이터의 차이점을 분류할 수 있도록 학습을 수행하는 한 편, 특정 환경으로부터 획득한 데이터로부터 수면 상태 정보를 획득하는 Classifier를 학습시킴으로써, 다른 환경 또는 타겟 환경으로부터 획득한 데이터를 상기 피처 추출 모델에 입력하여 추출된 정보를 Classifier에 입력하면, 비록 라벨링 되어있지 않은 데이터라 할지라도 수면 상태 정보를 출력하도록 학습이 수행될 수 있다.

또한, 본 발명의 실시예에 따른 판별자 모델의 출력 데이터는, UDA의 1차 학습에 재활용될 수도 있고, Classifier의 최종 출력에 대한 보정값으로 사용되는 등 다양한 방법으로 활용될 수도 있다.

본 발명의 실시예에 따른 UDA의 1차 학습 중, Classifier가 특정 환경으로부터 획득한 데이터로부터 수면 상태 정보를 학습하는 과정에서는, 다른 환경 또는 타겟 환경(예컨대, 가정 환경 등)으로부터 획득한 데이터를 입력 받지 않으며, 또한 다른 환경 또는 타겟 환경으로부터 획득한 데이터에는 수면단계에 대한 label이 없기 때문에, 위 다른 환경 또는 타겟 환경으로부터 획득한 데이터를 이용한 학습이 이루어지지 않을 수 있다.

본 발명의 실시예에 따른 UDA의 1차 학습을 이상적으로 수행한 경우에는 피처 추출 모델이 데이터간의 공통점을 추출해낼 수 있으므로, 출력된 공통점을 입력으로 하는 Classifier가 수면 상태 정보를 출력함에 있어서 군집화(Clustering)를 통해, 입력으로 된 데이터에 해당하는 수면 단계가 REM 수면인지, Light 수면인지, Wake 상태인지, 또는 Deep 수면 단계인지 여부를 잘 구분해낼 수 있지만, 그러한 군집화를 더 잘 수행할 수 있도록 Conditional Entropy 등의 기법을 이용하여 2차 학습을 수행할 수도 있다.

본 발명의 실시예에 따른 UDA의 2차 학습에서는, unlabeled data를 딥러닝 모델의 입력으로 하여 학습을 수행할 수 있다.

라벨링이 되어있지 않은 데이터를 딥러닝 모델에 입력하면 예측값(Prediction), 신뢰도(Confidence) 등의 정보가 출력될 수 있다. 여기서 신뢰도가 높을수록 예측값이 포함하고 있는 클래스 정보를 더 신뢰할 수 있는 것을 의미할 수 있다.

본 발명의 실시예에 따른 UDA의 2차 학습에서는, loss를 이용해서 Classifier의 수면 상태 정보 또는 수면단계정보의 예측값이 포함하고 있는 클래스 정보를 더 신뢰할 수 있도록 학습을 하는 과정이 수행되며, 이 경우 라벨링이 되어있지 않은 출력 데이터를 이용하여 스스로 학습하는 방법을 포함할 수 있다.

상술한 다양한 환경 또는 특성에 대한 구체적 기재는 단순히 예시일 뿐이며, 본 발명은 이에 제한되지는 않는다.

또한, 본 발명의 일 실시예에 따르면, 프로세서(130)는 피처 추출 모델을 활용하여 복수의 소스 데이터 및 복수의 타겟 데이터 각각에 대응하는 복수의 피처를 추출할 수 있다. 프로세서(130)는 복수의 소스 데이터에 대응하는 복수의 변환된 정보(예컨대, 주파수 도메인상의 정보 또는 스펙트로그램) 및 복수의 타겟 데이터에 대응하는 복수의 변환된 정보(예컨대, 주파수 도메인상의 정보 또는 스펙트로그램)을 피처 추출 모델의 입력으로 처리하여 복수의 피처를 추출할 수 있다. 즉, 피처 추출 모델의 출력에 관련한 복수의 피처는, 소스 데이터에 관련한 복수의 피처 및 타겟 데이터에 관련한 복수의 피처를 포함할 수 있다.

일 실시예에서, 복수의 소스 데이터 및 복수의 타겟 데이터는 서로 상이한 도메인에 관련한 데이터임에 따라, 복수의 소스 데이터에 대응하는 변환된 정보(예컨대, 주파수 도메인상의 정보 또는 스펙트로그램)들은 각 에폭 별 추출된 피처들에 수면 단계에 대한 정보가 라벨링되어 있으나, 복수의 타겟 데이터에 대응하는 정보들에는 각 에폭 별 추출된 피처들에 수면 단계에 대한 정보가 라벨링되어 있지 않을 수 있다. 즉, 다양한 노이즈를 포함하는 타겟 데이터에 대응하는 피처들은 라벨링된 정보가 없기 때문에, 수면 단계 분류가 어려울 수 있다.

이에 따라, 본 발명의 일 실시예에 따르면, 프로세서(130)는 복수의 소스 데이터에 대응하는 복수의 제1피처들 및 복수의 타겟 데이터에 대응하는 복수의 제2피처들 각각을 벡터 공간 상에서 인접 배치되게 하되, 복수의 제1피처들 및 복수의 제2피처들 각각이 클래스 별로 군집화하여 배치되도록 할 수 있다.

본 발명의 일 실시예에 따르면, 복수의 소스 데이터에 대응하는 제1피처들과, 복수의 타겟 데이터에 대응하는 제2피처들은 각각 다양한 피처(예컨대, 얕은 수면, REM 수면등의 수면 단계의 피처)에 대한 정보를 포함할 수 있다. 여기서, 복수의 타겟 데이터에 대응하는 제2피처들은 라벨링된 정보가 없지만, 복수의 소스 데이터에 대응하는 제1피처들을 기준으로 잘 섞이는 경우, 제1피처들이 분류됨에 따라, 제2피처들에 대한 분류도 가능해질 수 있으므로, 다양한 노이즈를 포함하는 수면 음향 정보(즉, 복수의 타겟 데이터)에 대한 분석 또한 가능해질 수 있다. 즉, 제2피처들은, 라벨링된 정보가 존재하는 제1피처들을 기준으로, 해당 제1피처들과 잘 섞이되 클래스 간의 분류가 용이하도록 매핑되는 것이 중요할 수 있다.

구체적으로, 제2피처들은 클래스 간 분류가 용이하게 맵핑될 수 있다. 예컨대, 제1피처들과 제2피처들이 벡터 공간 상에서 멀리 떨어져있는 경우, 제1피처들의 라벨링 정보를 기준으로 각 클래스를 분류할 때(예컨대, 가상의 선을 통해 제1피처들의 클래스를 분류하는 경우), 제2피처들의 상이한 클래스에 해당하는 피처들이 서로 동일한 클래스로 분류되거나, 동일한 클래스에 해당하는 피처들이 서로 상이한 클래스로 분류될 수 있다. 다시 말해, 본원 발명은 제1피처들과 제2피처들 각각이 벡터 공간 상에서 인접 배치되게 하되, 각 피처들이 클래스 별로 군집화하여 배치되도록 피처 추출 모델을 학습시킬 수 있다.

이를 위해, 프로세서(130)는 복수의 피처를 피처 분류 모델 및 판별자 모델 각각으로 전달할 수 있다.

일 실시예에 따르면, 피처 분류 모델은 복수의 피처를 하나 이상의 수면 단계 각각으로 분류하는 신경망 모델일 수 있다. 피처 분류 모델은 피처에 대응하여 수면 단계를 예측하도록 학습된 신경망 모델일 수 있다. 실시예에서, 프로세서(130)는 피처들 각각에 매칭된 라벨 정보를 활용하여 신경망에 대한 학습을 수행하여 피처 분류 모델을 생성할 수 있다. 예컨대, 피처 분류 모델은 풀리 커넥티드 레이어(fully connected layer)를 포함하여 구성될 수 있으며, 피처를 수면 단계들 중 적어도 하나로 분류하는 모델일 수 있다. 예를 들어, 피처 분류 모델은 제1스펙트로그램에 대응하는 피처를 입력으로 하는 경우, 해당 피처를 얕은 수면(예컨대, 제1수면 단계)으로 분류할 수 있다.

한편, 본 발명의 일 실시예에 따라, 프로세서(130)는 피처 추출 모델과 피처 분류 모델의 학습 수행 결과에 따라, 피처 추출 모델과 피처 분류 모델 간 제1 로스에 관련한 제1학습 정보를 통해 피처 추출 모델을 업데이트할 수 있다.

일 실시예에 따르면, 프로세서(130)는 판별자 모델로부터 제2학습 정보를 획득할 수 있다. 제2학습 정보는, 피처 추출 모델 및 판별자 모델 간의 적대적 학습에 관련한 것일 수 있다.

프로세서(130)는 피처 추출 모델과 판별자 모델의 제2 로스를 통한 학습을 수행할 수 있다. 제2 로스는, 피처 추출 모델과 판별자 모델 간의 적대적 학습에 관련한 로스를 의미할 수 있다.

구체적인 예를 들어, 판별자 모델은 소스 데이터에 대응하는 제1피처를 입력으로 하는 경우, 1에 가까운 확률값을 출력하고, 타겟 데이터에 대응하는 제2피처를 입력으로 하는 경우, 0에 가까운 확률값을 출력하도록 학습될 수 있다. 제1피처를 입력했을 때의 출력값과 1의 차이, 그리고 제2피처를 입력했을 때의 출력값과 0과의 차이, 두 경우의 합이 판별자 모델의 로스(또는 손실 함수)일 수 있다. 피처 추출 모델의 목적은 판별자 모델을 속이는 것(즉, 제1피처와 제2피처 간 구분이 어렵도록)으로, 피처 추출 모델이 생성한 피처를 판별자 모델에 입력했을 때 1에 가깝게 나오도록 학습될 수 있다. 해당 출력값과 1의 오차가 피처 추출 모델의 로스일 수 있다. 즉, 프로세서(130)에 의해 각 모델은 로스가 최소화되는 방향으로 학습될 수 있다. 다시 말해, 프로세서(130)는 적대 로스가 최소화되는 방향으로 피처 추출 모델 및 판별자 모델의 파라미터를 업데이트하여 적대 신경망에 대한 학습을 수행할 수 있다.

또한, 본 발명의 일 실시예에서, 프로세서(130)는 피처 추출 모델을 통해 최대한 제1피처에 가까운 제2피처를 생성하도록 하고, 판별자 모델을 통해 제2피처를 타겟 데이터에 관련한 피처로 판별될 확률이 높도록 각 모델의 파라미터를 업데이트할 수 있다.

즉, 프로세서(130)는 피처 추출 모델 및 판별자 모델 간의 제2적대 로스를 제2학습 정보로 활용하여 피처 추출 모델의 파라미터를 업데이트함으로써, 피처 추출 모델이 양 도메인에 관련한 스펙트로그램에 대응하여 유사한 피처(즉, 벡터 공간 상에 위치가 근접한 피처)를 출력하도록 할 수 있다. 다시 말해, 제2학습 정보를 통해 업데이트된 피처 추출 모델은, 도메인에 상관없이 소스 데이터에 관련한 제1피처들 및 타겟 데이터에 관련한 제2피처들을 구분 없이 잘 섞이도록 벡터 공간 상에 추출할 수 있다.

전술한 바와 같이, 프로세서(130)는 제1학습 정보 및 제2학습 정보를 통해 업데이트된 피처 추출 모델은 소스 데이터 및 타겟 데이터에 관련한 스펙트로그램을 입력으로 하는 경우, 제1피처들과 제2피처들 각각이 벡터 공간 상에서 인접 배치되게 하되, 각 피처들이 클래스 별로 군집화하여 배치되도록 할 수 있다.

본 발명의 일 실시예에 따르면, 라벨링 정보가 있는 제1피처들을 기준으로 라벨링 정보가 없는 제2피처들이 적절히 배치되도록 함으로써, 제1피처들을 분류됨에 따라, 제2피처들에 대한 분류도 가능해질 수 있다. 이에 따라, 다양한 노이즈를 포함하는 수면 음향 정보(즉, 복수의 타겟 데이터)에 대한 분석 또한 가능해질 수 있다.

본 발명의 일 실시예에 따르면, 프로세서(130)는 복수의 소스 데이터 및 복수의 타겟 데이터 각각을 미리 정해진 샘플 단위로 분할하여 복수의 소스 서브 데이터 및 복수의 타겟 서브 데이터를 생성할 수 있다.

또한, 본 발명의 일 실시예에서, 프로세서(130)는 복수의 소스 서브 데이터 및 복수의 타겟 서브 데이터 각각에 대응하는 주파수 도메인상의 정보 또는 스펙트로그램을 피처 추출 모델의 입력으로 처리하여 하나 이상의 샘플 피처를 생성할 수 있다.

구체적으로, 프로세서(130)는 소스 데이터 및 타겟 데이터 각각에 대응하는 주파수 도메인상의 정보 또는 스펙트로그램을 피처 추출 모델의 입력으로 처리하는 것이 아닌, 각 데이터를 샘플 단위로 분할하고, 분할된 샘플 단위에 대응하는 복수의 주파수 도메인상의 정보 또는 스펙트로그램을 복수 개의 피처 추출 모델 각각의 입력으로 처리할 수 있다. 실시예에서, 복수 개의 피처 추출 모델 각각은 파라미터를 공유하는 것을 특징으로 할 수 있다. 즉, 복수 개의 피처 추출 모델은 동일한 성능을 갖도록 업데이트된 것일 수 있다.

각 샘플에 대응하는 스펙트로그램들은, 각 피처 추출 모델을 독립적으로 통과함에 따라 피처들이 생성될 수 있으며, 생성된 피처들 각각은 판별자 모델에 전달될 수 있다. 이 경우, 판별자 모델은 샘플 단위에 대응하는 피처들 각각을 전달받게 된다.

본 발명의 실시예들에 따른 로우(raw) 수면 음향 정보는, 시간에 따른 시퀀셜(또는 시계열) 데이터이며, 이는 큰 용량의 데이터일 수 있다. 시퀀셜 데이터에 기반하여 그 주파수 성분들의 시간 축에 따른 변화를 포함하는 정보 또는 주파수 도메인상의 정보(예컨대, 스펙트로그램)을 생성하고, 생성된 스펙트로그램을 판별자 모델로 전달하는 경우, 판별자 모델은 전달된 스펙트로그램을 에폭 단위로 분할하고, 각 에폭 단위에 대응하는 판단(예컨대, 소스 데이터에 관련한 피처인지, 타겟 데이터에 관련한 피처인지 판단)을 수행하여야 하므로 배우고자 하는 학습 정보(또는 학습량)가 가중될 수 있다. 다시 말해, 샘플 단위로 분할되지 않은 전체 스펙트로그램에 대응하여 피처를 추출하고, 이를 판별자 모델로 전달하는 경우, 판별자 모델의 학습의 효율이 저하될 수 있다.

따라서, 프로세서(130)는 데이터(예컨대, 스펙트로그램)를 샘플 단위로 분할하고, 각 샘플에 대응하여 피처들이 추출되도록 하고, 각 샘플 별 피처가 판별자 모델로 입력되도록 할 수 있다. 이는, 샘플 투 샘플(Sample to sample)을 통해 더 적은 데이터로 판별자 모델의 학습을 가능하도록 하며, 효율적인 학습을 통해 전체적인 모델의 성능 향상을 야기시킬 수 있다.

본 발명의 일 실시예에 따르면, 프로세서(130)는 복수의 타겟 데이터를 활용한 의사결정 경계 반복 정제 학습을 통해 피처 분류 모델을 정제시킬 수 있다. 피처 분류 모델의 정제는, 피처들을 각 클래스로 분류 과정에서, 소스 데이터에 대응하는 피처들 보다 우선적으로 타겟 데이터에 대응하는 피처들을 분류 기준으로 활용하도록 하는 것을 의미할 수 있다. 다시 말해, 소스 데이터에 대응하는 피처들의 결정 경계(즉, 분류 경계)를 타겟 데이터에 대응하는 피처들을 기준으로 하는 경계로 변형하는 것을 의미할 수 있다. 프로세서(130)는 타겟 측 클러스터 가정 위반 손실을 최소화함으로써, 결정 경계를 데이터 밀도 영역에서 점차적으로 밀어낼 수 있다.

구체적으로, 프로세서(130)는 교사 네트워크를 활용하여 의사결정 경계 반복 정제 학습을 수행할 수 있다. 의사결정 경계 반복 정제 학습은, 교사 네트워크 및 학생 네트워크 각각의 출력에 관련한 조건부 엔트로피를 최소화하는 것에 기초하여 결정 경계의 배치를 개선하도록 하는 학습일 수 있다. 구체적인 실시예에서, 프로세서(130)는 복수의 타겟 데이터에 대응하는 스펙트로그램을 학생 네트워크 및 교사 네트워크 각각에 입력할 수 있다. 이 경우, 학생 네트워크 및 교사 네트워크 각각은, 피처 추출 모델 및 피처 분류 모델을 포함하여 구성될 수 있다. 프로세서(130)는 학생 네트워크의 출력과 교사 네트워크의 출력에 관련한 조건부 엔트로피를 통해 결정 경계의 배치가 개선되도록 학습시킬 수 있다.

이에 따라, 피처 분류 모델은 소스 데이터에 대응하는 피처들의 결정 경계를 기반으로 수행하던 분류를 타겟 데이터에 대응하는 피처들의 기준으로 분류를 수행하도록 결정 경계를 변형하도록 정제될 수 있다. 본 발명의 수면 분석 모델은 일반 사용자들의 실생활에서 노이즈가 많이 포함된 음향에 대한 분석 정보를 제공하도록 구비되어야 하기 때문에, 전술한 바와 같이, 타겟 데이터에 대응하는 피처들이 결정 경계에 기반이 되는 경우, 수면 상태 정보 산출에 정확도가 향상될 수 있다. 다시 말해, 의사결정 경계 반복 정제 학습을 통해 피처 분류 모델은 다양한 노이즈를 포함하는 수면 음향 정보에 관련한 피처들에 대응하여 향상된 정확도의 수면 상태 정보를 출력할 수 있다.

본 발명의 일 실시예에 따르면, 프로세서(130)는 학습 완료 시점에 대응하여 학습 모델을 통해 수면 분석 모델을 생성할 수 있다. 구체적으로, 피처 추출 모델과 피처 분류 모델 간의 적대 학습 및 피처 추출 모델과 판별자 모델 간의 적대 학습을 통해 업데이트된 학습 모델에 기반하여, 학습된 피처 추출 모델과 피처 분류 모델을 기초로 수면 분석 모델을 생성할 수 있다. 즉, 수면 분석 모델은 도 17a 또는 도 17b에 도시된 바와 같이, 업데이트된 학습 모델에서 피처 추출 모델 및 피처 분류 모델을 통해 구성될 수 있다.

본 발명의 일 실시예에 따른 수면 분석 모델은 적응적 학습 과정 즉, 제1학습 정보 및 제2학습 정보를 통해 업데이트된 트레이닝 모델을 통해 생성됨에 따라, 다양한 노이즈를 포함하는 음향 데이터에도 향상된 정확도를 통해 수면 상태를 예측할 수 있다.

본 발명의 일 실시예에 프로세서(130)는 사용자 단말(10)로부터 수면 음향 정보를 획득할 수 있으며, 획득된 수면 음향 정보에 대응하는 수면 상태 정보를 제공할 수 있다. 프로세서(130)는 수면 분석 모델을 활용하여 수면 음향 정보에 대응하는 수면 상태 정보를 생성할 수 있다.

이 경우, 수면 분석 모델은 전술한 적응적 학습을 통해 다양한 노이즈를 포함하는 다양한 노이즈를 포함하는 음향 데이터에도 견고한 예측을 수행할 수 있으므로, 사용자로 하여금 자신의 일상 환경에서 용이하게 자신의 수면 상태에 대한 분석 정보를 획득할 수 있게 한다는 장점이 있다. 다시 말해, 전문 의료 기관을 직접 방문하거나, 비용이 들지 않으며, 음향 획득이 가능한 장비를 제외한 별도의 특수 장비를 구비하거나, 특수한 수면 환경을 조성하지 않더라도, 일반적인 가정 환경에서 자신의 수면 상태에 관한 분석 정보를 제공받을 수 있다.

슈도 라벨(pseudo label)을 이용한 Semi-Supervised learning

본 발명의 실시예에 따른 Semi-Supervised learning은 라벨링이 되어있지 않은 데이터를 입력한 딥러닝 모델이 출력한 데이터를 pseudo label로 활용함으로써 딥러닝 모델의 학습을 수행하는 것을 의미할 수 있다.

라벨링이 되어있지 않은 데이터를 딥러닝 모델에 입력하여 예측값(Prediction), 신뢰도(Confidence) 등의 정보가 출력될 수 있다. 여기서 신뢰도가 높을수록 예측값이 포함하고 있는 클래스 정보를 더 신뢰할 수 있는 것을 의미할 수 있다.

본 발명의 실시예에 따른 Semi-Supervised learning은, 라벨링이 되어있지 않은 데이터를 딥러닝 모델에 입력하였을 때, 딥러닝 모델에서 출력되는 예측값(Prediction)을 새로운 label(pseudo label)로 취급하여 그것을 기초로 수면 상태 정보에 대한 학습을 수행할 수 있다.

본 발명의 실시예에 따른 Semi-Supervised learning은, 학습을 수행하기 위해서 이미지에 대한 어그멘테이션 전처리를 할 수 있다. 어그멘테이션 전처리는 weakly-augmented 방식 또는 strongly-augmented 방식일 수 있다.

본 발명의 실시예에 따르면, weakly-augmented 방식은 이미지를 상대적으로 적게 변조시키는 방법으로서, 하나 이상의 어그멘테이션 기법이 사용될 수 있다. Weakly-augmented 방식의 어그멘테이션 기법으로는 데이터 어그멘테이션 또는 Pitch shifting 어그멘테이션 기법(바람직하게는, 10% 내지 20%의 범위에서 pitch가 shifting 되는 기법)이 포함될 수 있다.

본 발명의 실시예에 따르면, strongly-augmented 방식은 이미지를 상대적으로 많이 변조시키는 방법으로서, 하나 이상의 어그멘테이션 기법이 사용될 수 있다. Strongly-augmented 방식의 어그멘테이션 기법으로는 데이터 어그멘테이션, TUT 어그멘테이션 또는 노이즈 부가 어그멘테이션 기법 중 하나 이상이 포함될 수 있다.

본 발명의 실시예에 따른 학습 방법에는, 이미지에 대한 어그멘테이션 전처리 과정을 거친 뒤, 그것을 딥러닝 모델의 입력으로 하여 학습시키는 방법을 포함할 수 있다.weakly-augmentated된 이미지 정보를 딥러닝 모델의 입력으로 하여 출력된 예측값(Prediction)을 슈도 라벨(pseudo label)로 활용함으로써, 그것을 기반으로 다시 학습을 진행하는 방법을 포함할 수 있다. 본 발명의 실시예에 따른 Weakly-augmented 방식의 어그멘테이션 기법을 활용하여 학습이 진행되는 중, 중간단계의 학습 정보를 최종 학습모델에 반영하기 위해서 이동평균(Moving Average)기법, 가중평균(Weighted Average)기법, 가중이동평균(Weighted Moving Average)기법, 또는 지수가중이동평균(Exponential Weighted Moving Average)기법 등을 활용할 수 있다.

본 발명의 실시예에 따라, Weakly-augmented 방식의 어그멘테이션 기법을 활용한 데이터를 딥러닝 모델의 입력으로 하여 추론을 진행함으로써 생성될 수 있는 신뢰도 높은 슈도 라벨(pseudo label)을 얻을 수 있다.

본 발명의 실시예에 따른 학습 방법에는, weakly-augmented 방식의 데이터 어그멘테이션을 통해 비지도학습을 진행하여 얻어지는 슈도 라벨(pseudo label)을 데이터의 라벨로 활용하여 strongly-augmented 데이터 어그멘테이션을 통해 지도학습(supervised learning)을 진행할 수 있다. 슈도 라벨(pseudo label)을 이용한 지도학습(supervised learning)을 진행함으로써, 이미지가 상대적으로 많이 변조된 것을 입력으로 하여 더 많은 정보에 대해서 학습할 수 있다. 또한, 데이터의 라벨링 작업 없이도 지도학습을 진행하여 더 많은 데이터에 대한 학습을 수행할 수 있다.

또한, 본 발명의 실시예에 따른 학습 방법에는, 타겟 환경(예컨대, 수면다원검사 이외의 환경 등)또는 타겟 대상집단(예컨대, 수면 질환이 없는 대상집단 등)으로부터 획득한 데이터를 딥러닝 모델의 입력으로 하여 학습을 시킨 결과로 출력되는 수면상태의 예측값(예컨대, REM 수면단계의 예측값, Wake 상태의 예측값, light 수면단계의 예측값, deep 수면단계의 예측값 등)의 분포(distribution)가, 특정 환경(예컨대, 수면다원검사 환경 등)또는 비교대상집단(예컨대, 수면 질환자 대상 집단 등)으로부터 획득한 데이터를 딥러닝 모델의 입력으로 하여 학습을 시킨 결과로 출력되는 수면상태의 예측값의 분포와 일치하도록 형성되게끔 튜닝(tuning)을 수행하는 방법을 포함할 수 있다.

이 경우, 특정 환경(예컨대, 수면다원검사 환경 등)에서 획득한 데이터를 딥러닝 모델의 입력으로 하여 출력된 수면상태의 예측값의 분포가 다른 환경 또는 타켓 환경(예컨대, 수면다원검사 이외의 환경 등)에서 획득한 예측값의 분포가 서로 완전히 일치하지는 않을 수도 있지만, 모델링 데이터가 서로 일치하는 방향으로 형성되게끔 tuning하는 방법을 포함할 수 있다.

Un/Self-Supervised learning

본 발명의 실시예에 따른 Un-Supervised learning 또는 Self-Supervised learning은 이미지 도메인에서 이미지 정보에 label이 없더라도 딥러닝으로 하여금 이미지 정보에 대한 예측값의 신뢰도가 높아질 수 있도록 사전 학습을 수행하는 방법을 의미할 수 있다. 이 경우 이미지 정보의 일부분을 훼손한 뒤, 훼손된 이미지 정보 부분을 예측할 수 있도록 학습을 수행하는 방법을 포함할 수 있다.

본 발명의 실시예에 따른 학습 방법은 unlabeled data를 딥러닝 모델의 입력으로 하여 사전 학습을 먼저 수행한 뒤에, labeled data를 입력으로 하여 추가 학습을 수행하는 방법을 포함할 수 있다.

본 발명의 실시예에 따른 Un-Supervised learning 또는 Self-Supervised learning 방법에 따른 사전 학습을 수행한 딥러닝 모델에 더 적은 수의 labeled data를 입력하여 원래 목적했던 task를 수행하도록 학습을 시킨 결과, 사전 학습된 딥러닝 모델의 예측값에 대한 신뢰도가 더욱 높아질 수 있다.

한편, 음향 정보를 기반으로 한 수면 상태 정보의 분석으로는, 호흡 및 신체 움직임 등, 수면 음향에 대한 패턴 식별 단계가 포함될 수 있다. 그러나, 수면 음향의 패턴의 특성은 시간의 흐름에 걸쳐 반영되는 것이기 때문에, 특정 시점의 짧은 음향 데이터 스냅샷(Snap-shot)만으로는 완전히 파악하기 어려울 수 있다. 따라서 음향 정보를 모델링하기 위해서는 음향 정보의 시계열 특성에 기초하여 분석이 수행되어야 하고, 이러한 시계열 데이터에 반지도 학습 방법을 적용하는 것에 대한 수요가 있어 왔다.

또한, 라벨(label)이 지정되지 않은 음향 정보에는 사용자가 사용자 단말(10)을 통하여 획득한 음향 정보인 환경 센싱 정보가 포함될 수 있는데, 이러한 환경 센싱 정보에는 라벨이 지정되지 않은 데이터(예컨대, 생활 소음, 여러 사람으로부터 야기되는 소리, 음악 소리, 자연의 소리 등)가 포함될 수 있고, 이렇게 품질 관리가 제대로 이루어지지 않을 우려가 있는 환경에서 획득한 데이터 모델링에 대한 새로운 접근 방식의 수요가 있어 왔다.

이에, 본 발명의 일 실시예에 따르면, 수면 음향 정보의 시계열적인 특성을 고려하는 순차적 일관성 손실(sequential consistency loss)에 기초한 반지도 학습(Semi-supervised learning) 방법이 제공될 수 있다.

또한, 실시예에서, 라벨(label)이 지정되지 않은 정보로부터 분포 외(OOD: Out-of-distribution) 데이터를 처리하는 반지도 대조 학습(SSCL: Semi- supervised contrastive learning) 방법이 제공될 수 있다.

본 발명의 실시예들에 따른 반지도 학습 및 반지도 대조 학습 방법을, 라벨(label)이 지정된 음향 데이터 세트 및 수면 다원 검사(PSG)의 음향 데이터 세트를 포함한 다양한 데이터 세트에 기초하여 평가한 결과, 수면 분석 모델의 성능이 실제 환경에서도 견고하다는 효과가 있고, 본 발명의 실시예에 따른 수면 분석 모델의 일반화 가능성이 있다는 것을 알 수 있었다. 이하 노이즈 특성과 시계열 특성을 모두 포함하는 실제 환경에서의 수면 음향 정보를 처리하기 위한 반지도 학습과, 반지도 대조 학습 방법에 대하여 도면 및 수식을 이용하여 자세히 설명한다.

시간적 분석 또는 시계열적 정보에 대한 분석을 필요로 하는 음향 정보 기반의 수면 분석 방법은 시퀀스 예측 작업으로 구성될 수 있다. 여기서

로 표시되는 일련의 멜 스펙트로그램 샘플이 입력되어, 이에 대응되는 수면 단계 라벨의 시퀀스인

가 예측 또는 출력될 수 있다. 여기서 x_i 및 y_i는 각각 일련의 정보인 x 및 y의 i번째 샘플을 의미하고, N_s는 시퀀스 내의 샘플의 수를 의미한다.

수면 단계의 레이블인 y_i는 깸(Wake) 단계, 렘(REM) 수면 단계, 라이트(Light) 수면 단계, 딥(Deep) 수면 단계의 네 가지 가능한 수면 단계 정보의 클래스로 나타날 수 있고, 원-핫 라벨(one-hot label)로 표현될 수 있다. 한편, 본 발명의 일 실시예에 따르면, 낮은 수준의 특징 추출을 위한 백본(backbone) 네트워크와 멜 스펙트로그램 간의 시계열적 상관관계를 학습하기 위한 헤드로 구성되는 시퀀스 투 시퀀스(sequence-to-sequence) 모델을 이용할 수 있다.

실시예에 따르면, 이를 기반으로 백본 네트워크와 헤드(head) 네트워크를 각각 도 17b에 도시된 바와 같이, MobileViTV2 및 ViT 등, 트랜스포머 기반의 인공지능 모델로 교체할 수 있다. 이러한 모델은 시퀀스

로 나타나는 수면 단계 로짓(logit)에 대한 예측을 생성하고, 지도 학습 기준선(Supervised baseline)은 교차 엔트로피 손실(L_SUP: cross-entorpy loss)을 사용하여 독점적으로 훈련된다.

순차적 일관성 손실(Sequential Consistency Loss)에 기초한 학습 방법

실험실 또는 병원 환경이 아닌 실제 일상생활에서의 환경에서 고성능을 달성하기 위해서는, 라벨이 지정되지 않은 데이터(

)를 사용하는 것이 중요하다. 본 발명의 일 실시예에 따른 컨시스턴시 트레이닝을 위해서, u_i로부터 두 개의 서로 다른 증강(augmented) 샘플인

를 생성하고, 수면 분석 모델은 각 샘플에 대응되는 수면 단계의 로짓인

를 출력할 수 있다. 여기에 아래 [수학식 1]과 같은 샘플별 일관성 손실(L_C: consistency loss)이 사용될 수 있다. [수학식 1]에서 Jensen-Shannon 발산이 사용될 수 있고, B_u는 라벨이 지정되지 않은 언레이블드 시퀀스의 배치 크기를 의미한다.

[수학식 1]

한편, 일관성 손실(L_C: consistency loss)은 샘플 별 수면 단계의 예측에 대하여 수면 분석 모델의 일반화가 더 가능하도록 할 수는 있지만, 수면 음향 정보 및 해당 라벨의 시간적 상관 관계 또는 시계열적 정보를 활용하기 어려울 수 있다. 따라서, 본 발명의 일 실시예에 따르면, 아래 [수학식 2]와 같이, 예측 시퀀스의 유사도를 매칭하는 순차적 일관성 손실(L_SC: sequential consistency loss)를 이용할 수 있다. [수학식 2]에서 °는 아다마르 거듭제곱(Hadamard power)이고, ⊙는 값으로 평균화되는 두 행렬의 원소별 곱을 의미한다.

[수학식 2]

본 발명의 일 실시예에 따르면, 시간 경과에 따른 수면 단계 변동의 정도를 예측하기 위하여 순서대로 i번째 샘플과 j번째 샘플의 로짓 사이에 코사인 유사도(cosine similarity)가 채택될 수 있다. 코사인 유사도는 두 벡터의 내적값을 두 벡터의 크기의 곱으로 나누어 계산되는 것으로서, 내적공간의 두 벡터간 각도의 코사인값을 이용하여 측정된 벡터간의 유사한 정도 또는 관계성을 나타내는 정도일 수 있다.

및

는 동일한 시퀀스인 u_s로부터 생성된 두개의 서로 다른 증강 시퀀스의

대칭 코사인 유사도 행렬을 의미한다. 또한, 아래 [수학식 3]과 같이 먼 샘플 쌍보다 가까운 샘플 쌍에 더 높은 가중치를 부여하는 가중 마스크 행렬 W를 정의할 수 있다.

[수학식 3]

[수학식 3]에서 w_min은 가장 먼 쌍의 최소 가중치 값을 의미한다. 따라서, 본 발명의 일 실시예에 따르면, 손실(loss)은 동일한 시퀀스에서 나온 두 가지 다른 증강(augmentation) 결과에 대한 예측이 유사한 시퀀스적 경향을 갖도록 강제될 수 있다.

도 30은 본 발명의 일 실시예에 따라, 시퀀스 내의 샘플의 수가 6인 경우의 일관성 손실 또는 순차적 일관성 손실에 기초한 학습 방법의 예시를 나타내는 도면이다. 도 30에서, 두 일관성 손실에 대하여 용이하게 이해할 수 있도록 C^a와 W의 상삼각 행렬(Upper triangular matrices)이 표시되어 있다.

도 30의 상단 부분에 도시된 시퀀셜

에 포함된

내지

각각은 수면 분석 모델의 에폭 별 예측값이다. 마찬가지로, 도 30의 하단 부분에 도시된 시퀀셜

에 포함된

내지

각각은 수면 분석 모델의 에폭 별 예측값이다. 도 30에 도시된

및

는 동일한 언레이블드 시퀀셜에 대한 예측을 수행한 결과일 수 있다. Consistency Loss를 이용한 모델의 학습은, 이러한 두 결과값에 대한 일관성을 유지하도록 Loss를 설정하여 수면 분석 모델을 학습시키는 것이다.

한편, 데이터가 시계열적인 시퀀스를 이루는 경우에는, 각 에폭 별 특징을 분석하는 경우 시퀀스 내에서의 관계성이 중요할 수 있다. 따라서, 하나의 시퀀스 내에서의 각 예측값 간 관계를 C로 나타낼 수 있다. 예를 들어,

는

및

간의 관계성을 나타낸 것이다. 이를

내지

각각에 모두 적용하면,

내지

까지의 상삼각 행렬이 구성될 수 있다(이를

라고 표현할 수 있다). 마찬가지로,

내지

각각으로부터

내지

까지의 상삼각 행렬이 구성될 수 있다(이를

라고 표현할 수 있다).

예컨대, 1번 에폭과 2번 에폭의 예측값은

시퀀스 내에서도 관계성을 갖고 있을 수 있고,

시퀀스 내에서도 관계성을 갖고 있을 수 있는데, 그러한 관계성끼리의 일관성을 유지할 수 있도록 손실(Loss)를 설정하여 수면 분석 모델을 학습시키는 것이다.

한편, 도 30의 W로 표현되는 상삼각 행렬은 중요도에 따른 가중치를 나타낸 것이다. 같은 시퀀스 내에서도 샘플의 순서가 멀면 멀수록 연관성은 떨어질 수 있기 때문에, 가중치를 작게 설정할 수 있다. 본 발명의 일 실시예에서는 W의 상삼각 행렬에 표현된 것과 같이, 0부터 1의 가중치 중에서, 0.5, 0.625, 0.75, 0.875, 1.0의 가중치를 설정하였지만, 이는 단순한 예시일 뿐, 본 발명은 이에 제한되는 것은 아니다. 예컨대, 시퀀셜 내에 포함된 샘플의 개수가 많을수록, 가중치 값들 간의 차이를 작게 설정할 수도 있다. 또한, 가중치의 최소값을 0.5가 아닌, 다른 값으로 설정할 수도 있으며, 가중치 값들 사이의 차이는 반드시 일정하지 않을 수도 있다.

또한, 도 30에 표시된 시퀀셜 내의 샘플의 수는 단순한 예시일 뿐, 본 발명은 이에 한정되는 것은 아니다. 예컨대, 40개의 샘플로 구성될 수도 있고, 14개의 샘플로 구성될 수도 있다. 이는 수면 분석 모델이 어떤 수면 상태 정보에 대한 예측을 수행하는지 여부에 따라 달라질 수도 있으며, 절대적인 것은 아니다.

반지도 대조 손실(Semi-supervised Contrastive Loss)에 기초한 학습 방법

이하, 본 발명의 실시예에 따른 반지도 대조 학습 방법에 대하여 수학식 및 도면 등을 이용하여 자세히 설명한다. 본 발명의 일 실시예에 따르면, 분포 외(OOD) 샘플을 포함할 수 있는 라벨링되지 않은 언레이블드 데이터(Unlabeled data)를 완전히 활용하기 위해서, 클래스 인식 대조 반지도 학습(CCSSL: Class-aware Contrastive Semi-Supervised Learning) 방법이 채택될 수 있다.

한편, 본 발명의 일 실시예에 따르면, 라벨이 지정되지 않은 언레이블드 데이터(unlabeled data)끼리만 밀고당기기를 수행하는 것뿐만 아니라, 레이블된 데이터(labeled data)도 포함하여 밀고당기기를 수행할 수 있다. 이러한 CCSSL 방법을 수행하는 경우에는, 분포 외(OOD: out-of-distribution)라고 판단되는 데이터는 확실하게 밀어지도록 학습이 수행될 수 있다. 한편, 실시예에 따르면, 데이터 간 밀고당기기를 수행하는 과정에서 레이블된 데이터가 포함되어 있는 경우, 레이블된 데이터는 움직이지 않고 가만히 정지해있는 앵커의 역할을 수행할 수 있고, 언레이블드 데이터만이 움직일 수 있다. 이와 같이 레이블된 데이터를 활용하여 CCSSL 방법을 수행하는 경우에는, 분포 내(In-Distribution)에 속한다고 판단되는 데이터가 더욱 잘 당겨지고, 분포 외(OOD: Out-of-Distribution)라고 판단되는 데이터를 더욱 잘 밀어낼 수 있기 때문에 수면 분석 모델의 학습 수행 효과가 더욱 향상될 수 있다.

도 31을 참고하면, x1는 딥(Deep) 수면 단계라는 라벨이 부여된 정보로서, 앵커의 역할을 수행할 수 있다. 본 발명의 실시예에 따른 반지도 대조 학습 방법에서, u1가 명확하고 규칙적인 호흡 패턴으로 인하여 딥(Deep) 수면 단계의 클래스에 대한 충분히 높은 신뢰도를 갖기 때문에, u1를 앵커 x1로 당길 수 있다. 이 때, 일정 수준의 임계 값(threshold)을 슈도 라벨의 분포 내(In-Distribution)의 임계 값으로 보아, 신뢰도가 그 임계 값을 넘는 경우에는 당기는 것으로 판단할 수 있다.

반면, u3는 딥(Deep) 수면 단계 클래스로의 증거(evidence)가 없기 때문에, 다른 클래스 또는 분포 외(OOD: Out-of-Distribution) 데이터일 가능성이 있어서, u3를 앵커 x1로부터 밀어낼 수 있다. 이 때, 일정 수준의 임계 값(threshold)을 슈도 라벨의 분포 내(In-distribution)의 임계 값으로 보아, 그 임계 값을 넘지 못하는 경우에는 밀어내는 것으로 판단할 수 있다. 즉, 이러한 방식을 통하여 분포 외(OOD: Out-of-Distribution)에 속한다고 판단되는 데이터는 밀어낼 수 있는 것이다.

한편, u2와 같이, 앵커와의 유사성이 높지도, 낮지도 않다고 판단되는 경우에는, 자칫 같은 클래스에 속하는 데이터를 밀거나, 다른 클래스에 속하는 데이터를 당길 우려가 있기 때문에, 밀고 당기기를 수행하지 않을 수도 있다.

CCSSL 방법은 위와 같이 레이블드 데이터 또는 슈도 라벨(pseudo label)을 활용하여, 언레이블드 데이터(Unlabeled data) 샘플들 간의 지도 대조 손실(Supervised contrastive loss)를 계산하고, 클래스 내의 피처를 표현한 군집에서 OOD 샘플을 배제할 수 있다.

B_u개의 언레이블드 시퀀스에는 총

개의 샘플이 있으며, CCSSL은 각각의 언레이블드 샘플 u_i에 대하여 두 가지 스트롱 어그멘테이션(Strong Augmentation) 방법을 적용할 수 있다. 본 발명의 일 실시예에 따르면, 임의의 어그멘테이션 샘플의 인덱스를

로 나타낸다면, CCSSL의 대조 손실은

로 정의될 수 있다. 여기서, 앵커 i의 손실은 아래 수학식 4와 같이 나타낼 수 있다.

[수학식 4]

여기서, 도 17b를 참조하면, z_i는 트랜스포머 기반의 인공지능 모델(또는 ViT)를 통해 얻은 앵커 i의 임베딩이고,

은 동일한 언레이블드 샘플에서 유래된 다른 증강 샘플의 임베딩이다. 다시 말해, z_i는 입력되는 데이터(예컨대, 이미지 정보) 하나에 해당되는 피처를 의미하는 것이고,

는 z_i에 데이터 어그멘테이션을 수행한 것을 의미할 수 있다.

한편, ·은 내적을 나타내는 연소 기호이다. 또한, τ는 온도를 나타내며,

는 동일한 슈도 라벨과 연관된 증강 샘플의 인덱스를 나타낸다. 또한,

는 재가중 요소(re-weighting factor)이다.

[수학식 4]에서 알 수 있듯이, 좌변의 손실값을 낮추도록 계산하면, 우변의

항에서의 log의 진수의 분자에 해당하는

부분은 서로 당기는 샘플을 표현한 것이고, log의 진수의 분모에 해당하는

부분은 서로 밀어내는 샘플을 표현한 것으로 해석할 수 있다. 즉, 위 항의

부분에서,

는 z_i에 데이터 어그멘테이션을 수행한 것이기 때문에, z_i와 서로 동일한 클래스의 데이터(예컨대, 이미지)에 기반한 것이라고 이해될 수 있는데, 이렇게 동일한 클래스의 데이터로부터 기반하여 출력된 샘플은 서로 당기도록 학습이 수행될 수 있다. 또한, 위 항의

부분에서, z_i와 z_j는 서로 다른 클래스의 데이터(예컨대, 이미지)로부터 기반한 것이라고 이해될 수 있는데, 이렇게 서로 다른 클래스의 데이터로부터 기반하여 출력된 샘플은 서로 밀도록 학습이 수행될 수 있는 것이다.

한편, [수학식 4]에서의 우변의

항에서

의 의미는 서로 같은 클래스라고 판단된다는 것인데, 이렇게 같은 클래스라고 판단되는 z_i와 z_k는 서로 당기도록 학습이 수행되기 때문에,

가 log의 진수의 분자 부분에 위치한다. 반면, 분모

부분에서는, 첫번째 항의 분모와 마찬가지로, 서로 다른 클래스의 데이터로부터 기반한 z_i와 z_j가 서로 밀어내도록 학습이 수행되게끔 기재된 것이라고 이해할 수 있다.

[수학식 4]에서 알 수 있듯이, 위와 같은 방식에 따라 라벨이 지정되지 않았지만 슈도 라벨이 지정된 샘플에 대해서는 당기도록 학습이 수행될 수 있는 것이다.

한편, 심하게 오염된 언레이블드 데이터가 존재하는 경우에, 언레이블드 데이터에서의 OOD 샘플이 높은 신뢰도로 샘플링되어, 클래스 클러스터링(clustering)에서 혼란을 야기할 수 있기 때문에, CCSSL은 신뢰할 수 없을 수 있다. 따라서, 본 발명의 일 실시예에 따르면, 이러한 문제를 해결하기 위해서, 신뢰할 수 있는 레이블된 데이터를 클래스 클러스터링의 앵커 포인트로 활용하는 반지도 대조 학습(SSCL: Semi-Supervised Contrastive Learning) 방법이 제공될 수 있다.

본 발명의 일 실시예에 따른 반지도 대조 학습(SSCL)에서는, 레이블된 샘플을 앵커로 고려함으로써, 신뢰할 수 있는 양성(positive) 및 음성(negative) 샘플을 사용할 수 있다. 여기서 양성 샘플이란, 분포 내(In-Distribution) 데이터라는 임계 값(threshold)을 넘는 샘플을 의미하는 것으로서, 같은 클래스라고 판단되는 샘플에 해당한다. 양성 샘플은 레이블된 샘플에 당겨지도록 학습이 수행될 수 있다. 또한, 음성 샘플이란, 분포 내(In-Distribution) 데이터라는 임계 값(threshold)을 넘지 않는 샘플을 의미하는 것으로서, 레이블된 샘플과 서로 다른 클래스라고 판단되는 샘플에 해당한다. 음성 샘플은 레이블된 샘플로부터 밀어지도록 학습이 수행될 수 있다. 이에 따라, 본 발명의 일 실시예에 따른 SSCL 방법은 클래스 내의 임베딩 클러스터(군집)에서 OOD 샘플을 밀어내도록 학습이 수행될 수 있는 것이다. 한편, 샘플의 클래스가 앵커와의 관계에서 양성인지 또는 음성인지 여부가 명확하다고 판단되지 않는 경우에는, 밀고 당기는 학습이 수행되지 않을 수 있다.

한편, 레이블된 앵커 m에 대한 대조 손실(contrastive loss)은 다음 [수학식 5]와 같이 정의될 수 있다. 여기에서, m은 B_l개의 레이블된 시퀀스 배치에서의 샘플의 인덱스를 나타내며,

는 i번째의 증강된 언레이블드 샘플 i와, m번째 앵커의 클래스 y_m 사이의 유사도를 의미한다.

[수학식 5]

본 발명의 일 실시예에 따르면, 높은 신뢰도를 갖는 슈도 라벨만을 이용하여 양성 및 음성 샘플이 구성될 수 있다. 즉,

및

을 각각 양성 및 음성 증강된 언레이블드 샘플의 집합으로 정의할 수 있다. 여기서, 도 31을 참조하면,

및

은 각각 필터링 임계값을 의미한다. 결과적으로, SSCL의 대조 손실은 아래 [수학식 6]의 L_SSCL로 얻을 수 있다. [수학식 6]에서, B_l은 레이블된 시퀀스의 배치 크기를 의미한다.

[수학식 6]

본 발명의 일 실시예에 따르면, SSCL에서는 레이블된 임베딩 z_m의 그래디언트(gradient)를 분리(detach)할 수 있다. 이는 SSCL의 목표가 레이블된 샘플의 특성을 훈련시키는 것이 아니라, 언레이블드 시퀀스에서의 OOD 샘플을 레이블된 샘플로부터 멀리 밀어내는 것이기 때문이다.

최종적으로, 본 발명의 일 실시예에 따른 전체적인 훈련 손실은 [수학식 7]과 같이 나타낼 수 있다. 여기에서,

는 대응되는 손실 L_A에 적용되는 가중치 값을 의미한다.

[수학식 7]

반지도 학습에 따른 수면 분석 모델의 성능

본 발명의 일 실시예에 따른 수면 분석 모델은 약 3천개의 연구실 환경의 PSG 검사로부터 얻은 레이블된 데이터와, 약 3천개의 자가 수집된 가정에서의 언레이블드 데이터에 기초하여 학습 또는 훈련되었다.

또한, 본 발명의 일 실시예에 따른 수면 분석 모델은 연구실 환경의 PSG, 가정 환경의 PSG, PSG 오디오 데이터에 기초하여 평가되었다. 여기서 수면 분석 모델의 일반화 능력은 주로 무호흡 환자 데이터로 구성된 오픈 데이터셋인 PSG 오디오 데이터(PSG-Auido)와 비교하였을 때의 성능을 평가함으로써 테스트되었다.

구체적으로, 본 발명의 일 실시예에 따른 수면 분석 모델의 결과를 평가하기 위하여, 시퀀스 내의 샘플의 수인 N_S 값을 40으로 설정하였으며, 병원 환경에서 이루어지는 PSG 검사에서 수면 분석 기술자가 30초 단위마다 레이블을 할당할 때 보통 ±10분 정도를 확인하는 것을 고려하여, 그와 동일한 방법으로 평가되었다.

또한, 레이블된 배치 크기(B_l)와 언레이블드 배치 크기(B_u)는 각각 4로 설정하였다. 각 비지도 학습 손실의 가중치 값인

,

및

은 각각 1.5, 0.1, 0.1 및 0.1로 설정되었고, 비지도 훈련을 위해

와

의 필터링 임계값은 각각 0.9와 0.2로 설정되었다. 한편, 언급한 구체적인 수치의 기재는 단순한 예시일 뿐, 본 발명은 이에 제한되지 않는다.

도 32는 본 발명의 일 실시예에 따른 수면 분석 모델의 분석 결과와, 가정 환경에서의 PSG 테스트의 분석 결과를 비교한 표이다. 도 32의 SoundSleepNet 행은 본 발명의 일 실시예에 따라 낮은 수준의 특징 추출을 위한 백본(backbone) 네트워크와 멜 스펙트로그램 간의 시계열적 상관관계를 학습하기 위한 헤드로 구성되는 시퀀스 투 시퀀스(sequence-to-sequence) 수면 분석 모델을 가정 환경에서의 PSG 테스트에 적용한 결과를 의미한다. 또한, 도 32의 SleepFormer 행은 본 발명의 일 실시예에 따른 비지도학습 및/또는 반지도학습 방법을 반영한 수면 분석 모델을 의미한다. 한편, C, SC, CC, SS 및 WA는 각각 일관성(consistency), 순차적 일관성(sequential consistency), CCSSL, SSCL 및 가중 평균(weight average)을 나타낸다.

또한, 도 33은 PSG 오디오 데이터에 기반한 수면 분석 결과와, 본 발명의 일 실시예에 따른 수면 분석 모델의 분석 결과를 비교한 표이다. 도 33의 상단의 표는 PSG-Audio에 기반한 수면 분석 결과와 비교한 표이고, 도 33의 하단의 표는 실험실 환경에서의 PSG 데이터에 기반한 수면 분석 결과와 비교한 표이다.

먼저, 도 32에 따른 분석 결과 비교 표에 도시된 바와 같이, 본 발명의 일 실시예에 따른 반지도 학습 방법을 하나씩 적용하여 성능의 변화를 평가하였다. 지도 기준선인 SleepFormer 모델은 트랜스포머 기반의 인공지능 모델을 활용하여 구성된 것인데, F1 점수(F1 Score)가 0.6332로서, SoundSleepNet와 비교하여 0.0614 만큼 더 향상된 것을 확인하였다. 또한, 일관성 손실(C: consistency loss)과 순차적 일관성 손실(SC: Sequential consistency loss)을 추가함으로써, F1 점수가 각각 0.6597 및 0.6751로 훨씬 더 많이 향상되는 것을 확인하였다.

또한, 본 발명의 일 실시예에 따른 SS(SSCL)을 도입함으로써, F1 점수가 0.6780으로 크게 향상되었고, 서로 다른 시드로 훈련된 세 개의 모델의 가중치를 평균화하여 비교하였을 때(WA)에는 총 최종적으로 0.1085만큼 개선된 0.6804의 점수를 달성한 것을 확인하였다.

한편, 도 33에 도시된 표와 같이, PSG 오디오 데이터에 기반한 수면 분석 결과와, 본 발명의 일 실시예에 따른 수면 분석 모델의 분석 결과를 비교하였다. 도 33의 각 표의 첫 번째 행인 Supervissed는 본 발명의 일 실시예에 따른 수면 분석 모델에 PSG 오디오 데이터를 입력하여 수면 상태 정보를 예측한 것의 결과이고, 두 번째 행인 Ours는 본 발명의 일 실시예에 따른 반지도 학습(Semi-supervised learning)에 기반한 수면 분석 모델에 PSG 오디오 데이터를 입력하여 수면 상태 정보를 예측한 것의 결과이다.

여기서, 도 33의 상단에 도시된 표에서 수면 분석 모델의 입력으로 되는 PSG-Audio데이터셋은 훈련 중에 수면 분석 모델이 접하지 않은, 즉 노출되지 않았던 데이터 분포이고, 이러한 데이터 셋은 새로운 데이터와 노출되지 않은 데이터에 대한 수면 분석 모델의 일반화 성능을 평가하는 데 사용될 수 있다. 한편, PSG-Audio 데이터셋은 주로 중증 무호흡 환자로 구성되어 수면 단계 클래스 분포가 균형이 잡히지 않을 수 있다.

또한, 도 33의 하단에 도시된 표에서 수면 분석 모델의 입력으로 되는 실험실 환경에서의 PSG 데이터 셋은, 레이블된 소스의 분포를 대표하는 것일 수 있다.

도 33에서 도시된 바와 같이, PSG-Audio 데이터셋을 Supervised 모델과 Semi-supervised 모델에 입력하여 예측한 결과의 정확성을 비교해보았을 때, Semi-supervised 모델의 경우 정확성이 0.0437 향상된 것을 확인하였다. 한편, 실험실 환경에서의 PSG 데이터셋에서의 정확성 향상 정도는 상대적으로 작았는데, 이는 본 발명의 실시예에 따른 지도 기준선(Supervised baseline)이 이미 레이블된 소스 분포 데이터에서 0.7000점으로 좋은 성능을 달성했기 때문이다.

이러한 반지도 학습 방법에 의하여, 실제 수면 환경에서의 시계열적인 수면 음향 정보의 처리를 통해, 수면 분석 모델이 더욱 개선될 수 있다. 간략하게 정리하자면, 순차적 일관성 손실(Sequential consistency loss)에 의하여 수면 분석 모델의 시간적 상관관계가 향상되고, 반지도 대조 손실(semi-supervised contrastive loss)은 레이블된 샘플이 있는 피처 표현 군집을 개선함으로써 분포 외 데이터인 OOD(Out-of-Distribution) 샘플을 효과적으로 걸러냄으로써 정확성이 향상될 수 있다. 또한, 본 발명의 실시예에 따른 수면 분석 모델은 가정 환경에서의 데이터, 노출되지 않은 데이터, 레이블된 데이터 셋 모두에서 상당하고 일관된 개선 효과를 보일 수 있는 것을 확인하였다.

수면 정보들을 멀티모달로 한 수면 상태 정보를 분석하기 위한 방법

멀티모달로 한 수면 상태 정보 분석 방법의 일 실시예 (CONCEPT-A)

도 26은 본 발명의 일실시예에 따른 수면 음향 정보와 수면 환경 정보를 멀티모달 데이터로 결합하는 과정을 포함하는 한 수면 상태 정보를 분석하기 위한 방법을 설명하기 위한 흐름도이다.

본 발명의 목적을 달성하기 위하여 일 실시예에 따르면, 수면 음향 정보와 수면 환경 정보를 멀티모달로 한 수면 상태 정보를 분석하기 위한 방법은 사용자의 수면과 관련한 시간 도메인 상의 음향 정보를 획득하는 제1 정보 획득 단계(S100), 제1 정보의 전처리를 수행하는 단계(S102), 사용자의 수면과 관련한 사용자 수면 환경 정보를 획득하는 제2 정보 획득 단계(S110), 제2 정보의 전처리를 수행하는 단계(S112), 멀티모달로 데이터를 결합하는 결합단계(S120), 멀티모달 데이터를 딥러닝 모델의 입력하는 단계(S130), 딥러닝 모델의 출력으로 수면 상태 정보를 획득하는 단계(S140)을 포함할 수 있다.

본 발명의 실시예에 따라서, 제1 정보 획득 단계(S100)은 사용자 단말(10)에서 사용자의 수면과 관련한 시간 도메인 상의 음향 정보를 획득할 수 있다. 사용자의 수면과 관련한 시간 도메인 상의 음향 정보는 사용자 단말(10)의 음원 탐지부에서 얻어지는 음원 정보를 포함할 수 있다.

본 발명의 실시예에 따라서, 제1 정보의 데이터 전처리를 수행하는 단계(S102)에서는 시간 도메인 상의 수면 음향 정보를, 주파수 성분의 시간 축에 따른 변화를 포함하는 정보 또는, 주파수 도메인 상의 정보로 변환할 수 있다. 또한, 주파수 도메인 상의 정보는 스펙트로그램으로 표현될 수 있으며, 멜 스케일이 적용된 멜 스펙트로그램일 수 있다. 스펙트로그램으로 변환함으로써, 사용자의 프라이버시 보호 및 데이터 가공량을 줄일 수 있다. 또한, 시간 도메인 상의 수면 음향 정보를 변환한 정보는 시각화한 것으로서, 이러한 경우 이미지 처리 기반의 인공지능 모델의 입력으로 함으로써 이미지 분석을 통해 수면 상태 정보를 획득할 수 있다.

본 발명의 실시예에 따라서, 제1 정보의 데이터 전처리를 수행하는 단계(S102)에서는 음향 정보에 기초하여 특징을 추출하는 단계를 더 포함할 수 있다. 예를 들어, 획득된 시간 도메인 상의 음향 정보에 기초하여 사용자의 수면 호흡 패턴을 추출할 수 있다. 예를 들어, 획득된 시간 도메인 상의 음향 정보를, 주파수 성분의 시간 축에 따른 변화를 포함하는 정보로 변환하고, 변환된 정보에 기초하여 사용자의 호흡 패턴을 추출할 수 있다. 또는, 시간 도메인상의 음향 정보를 주파수 도메인 상의 정보로 변환하고, 주파수 도메인 상의 음향 정보에 기초하여 사용자의 수면 호흡 패턴을 추출할 수 있다.

이 경우 변환된 정보들은 시각화된 것으로서, 이미지 처리 기반의 인공지능 모델의 입력으로 하여 사용자의 호흡 패턴 등의 정보를 출력하도록 할 수 있다.

본 발명의 실시예에 따라서, 제1 정보의 데이터 전처리를 수행하는 단계(S102)에서는 수면 음향 정보를 딥러닝 모델에 입력 시키기 위한 충분한 양의 유의미한 데이터를 얻기 위한 데이터 어그멘테이션 과정을 포함할 수 있다. 데이터 어그멘테이션 기법에는 피치 시프팅(Pitch Shifting) 어그멘테이션, TUT(Tile UnTile) 어그멘테이션 어그멘테이션 및 노이즈 부가 어그멘테이션을 포함할 수 있다. 전술한 어그멘테이션 기법은 단순한 예시일 뿐이며, 본 발명은 이에 제한되는 것은 아니다.

본 발명의 실시예에 따라 멜 스케일에서 부가하는 방법에 의하면 하드웨어가 데이터를 처리하는 데에 소요되는 시간이 단축될 수 있다.

본 발명의 실시예에 따라서, 사용자의 수면과 관련한 사용자 수면 환경 정보를 획득하는 제2 정보 획득 단계(S110)는 사용자 단말(10), 외부서버 또는 네트워크를 통해서 사용자 수면 환경 정보를 획득할 수 있다. 사용자의 수면 환경 정보는 사용자가 위치한 공간에서 획득되는 수면과 관련한 정보를 의미할 수 있다. 수면 환경 정보는, 비접촉식 방법으로 사용자가 위치한 공간에서 획득되는 센싱 정보일 수 있다. 수면 환경 정보는, 레이더를 통해 측정되는 호흡 운동 및 신체 움직임 정보일 수 있다. 수면 환경 정보는, 스마트 워치, 스마트 가전 등에서 획득되는 사용자의 수면에 관련한 정보일 수 있다. 수면 환경 정보는, 광혈류 측정 신호(PhotoPlethysmoGraphy)일 수 있다. 수면 환경 정보는 광혈류 측정 신호(PhotoPlethysmoGraphy, PPG)를 통해 얻어지는 심박 변이도(Heart Rate Variability, HRV), 심박수(Heart Rate)일 수 있으며, 광혈류 측정 신호는 스마트 워치 및 스마트 링에 의해서 측정될 수 있다. 수면 환경 정보는, 뇌파 신호(Electro Encephalo Graphy, EEG)일 수 있다. 수면 환경 정보는 수면 중 측정되는 Actigraphy 신호 일 수 있다.

본 발명의 실시예에 따라서, 제2 정보의 전처리를 진행하는 단계(S112)는 사용자의 수면 환경 정보의 데이터를 딥러닝 모델에 입력시키기 위한 충분한 양의 유의미한 데이터를 얻기 위한 데이터 어그멘테이션 과정을 포함할 수 있다.

본 발명의 일 실시예에 따라서, 제2 정보의 전처리를 진행하는 단계(S112)는 사용자의 수면 환경 정보의 데이터를 가공하여 특징을 추출하는 단계를 포함할 수 있다. 예를 들어, 제2 정보가 광혈류 측정 신호(PPG)인 경우, 광혈류 측정 신호에서 심박변이도(HRV)와 심박수(Heart Rate)를 추출할 수 있다.

본 발명의 일 실시예에 따라서, 제2 정보의 전처리를 진행하는 단계(S112)는 사용자의 수면 환경 정보의 데이터가 이미지 정보로 얻어지는 경우, 이미지 정보를 TUT(Tile UnTile) 어그멘테이션및 노이즈 부가 어그멘테이션을 포함할 수 있다. 전술한 어그멘테이션 기법은 이미지 정보의 어그멘테이션 기법에 관한 단순한 예시일 뿐이며, 본 발명은 이에 제한되는 것은 아니다. 사용자의 수면 환경 정보는 다양한 저장 형태의 방식의 정보일 수 있다. 사용자의 수면 환경 정보의 어그멘테이션 방법은 다양한 방식이 채용될 수 있다.

본 발명의 실시예에 따라서, 데이터 전처리 과정을 거친 제1 정보와 제2 정보를 멀티모달 데이터로 결합하는 단계(S120)은 딥 러닝 모델에 멀티모달 데이터를 입력하기 위하여 데이터를 결합한다.

본 발명의 일 실시예에 따라서, 멀티모달 데이터로 결합하는 방법은 전처리된 제1 정보와 전처리된 제2 정보를 동일한 형식의 데이터로 결합하는 것일 수 있다. 구체적으로, 제1 정보는 주파수 도메인 상에서의 음향 이미지 정보이고, 제2 정보는 스마트 워치에서 얻어지는 시간 도메인 상에서의 심박 이미지 정보일 수 있다. 이 때, 제1 정보와 제2 정보는 도메인이 동일하지 않기 때문에, 동일한 도메인으로 변환하여 결합할 수 있다.

본 발명의 일 실시예에 따라서, 멀티모달 데이터로 결합하는 방법은 전처리된 제1 정보와 전처리된 제2 정보를 동일한 형식의 데이터로 결합하는 것일 수 있다. 구체적으로, 제1 정보는 주파수 도메인 상에서의 음향 이미지 정보이고, 제2 정보는 스마트 워치에서 얻어지는 시간 도메인 상에서의 심박 이미지 정보일 수 있다. 이 때, 딥러닝 모델의 입력으로 사용하기 위해 제1 정보와 제2 정보는 도메인이 동일하지 않기 때문에, 각각의 데이터를 제1 정보와 제2 정보에 관한 것이라고 라벨링 할 수 있다.

본 발명의 일 실시예에 따라서, 멀티모달 데이터로 결합하는 단계(S120)은 제1 정보 어그멘테이션을 진행하고, 제2 정보 어그멘테이션을 진행한 후 결합할 수 있다. 예를 들어, 제1 정보는 사용자의 시간 도메인 상의 음향 정보일 수 있고, 제2 정보는 광혈류 측정 신호(PPG)일 수 있고, 이를 멀티모달 데이터로 결합할 수 있다. 예를 들어, 제1 정보는 사용자의 시간 도메인 상의 음향 정보 또는 시간 도메인 상의 음향 정보를 주파수 도메인 상의 음향 정보로 변환한 스펙트로그램일 수 있고, 제2 정보는 광혈류 측정 신호(PPG)일 수 있고, 이를 멀티모달 데이터로 결합할 수 있다.

본 발명의 일 실시예에 따라서, 멀티모달 데이터로 결합하는 단계(S120)은 제1 정보 어그멘테이션을 진행하고, 제2 정보 어그멘테이션 및 특징을 추출을 진행하여 결합할 수 있다. 예를 들어, 제1 정보는 사용자의 시간 도메인 상의 음향 정보 또는 시간 도메인 상의 음향 정보를 주파수 도메인 상의 음향 정보로 변환한 스펙트로그램일 수 있고, 제2 정보는 광혈류 측정 신호(PPG)에서 얻어지는 심박변이도(HRV) 또는 심박수(Heart Rate)일 수 있고, 이를 멀티모달 데이터로 결합할 수 있다. 본 발명의 일 실시예에 따라서, 멀티모달 데이터로 결합하는 단계(S120)은 제1 정보 어그멘테이션 및 특징 추출을 진행하고, 제2 정보 어그멘테이션을 진행하여 결합할 수 있다. 예를 들어, 예를 들어, 제1 정보는 사용자의 음향 정보에 기초하여 추출된 사용자 호흡 패턴 일 수 있고, 제2 정보는 광혈류 측정 신호(PPG)에서 얻어지는 심박변이도(HRV) 또는 심박수(Heart Rate)일 수 있고, 이를 멀티모달 데이터로 결합할 수 있다.

본 발명의 일 실시예에 따라서, 멀티모달 데이터로 결합하는 단계(S120)은 제1 정보 어그멘테이션 및 특징 추출을 진행하고, 제2 정보 어그멘테이션 및 특징을 추출을 진행하여 결합할 수 있다. 예를 들어, 제1 정보는 사용자의 음향 정보에 기초하여 추출된 사용자 호흡 패턴 일 수 있고, 제2 정보는 광혈류 측정 신호(PPG)에서 얻어지는 심박변이도(HRV) 또는 심박수(Heart Rate)일 수 있고, 이를 멀티모달 데이터로 결합할 수 있다.

본 발명의 실시예에 따라서, 딥러닝 모델에 멀티모달 결합 데이터를 입력하는 단계(S130)은 멀티모달 결합 데이터를 입력하기 위해 딥러닝 모델의 입력하기 위해 요구되는 정합하는 형태로 데이터를 가공할 수 있다.

본 발명의 실시예에 따라서, 딥러닝 모델의 출력으로 수면 상태 정보를 획득하는 단계(S140)은 멀티모달 결합 데이터를 수면 상태 정보를 추론하기 위한 딥러닝 모델의 입력으로 하여, 수면 상태 정보를 추론할 수 있다. 수면 상태 정보는 사용자의 수면의 상태에 관한 정보일 수 있다.

본 발명의 일 실시예에 따라서, 사용자의 수면 상태 정보는 사용자의 수면을 단계로서 표현하는 수면 단계 정보를 포함할 수 있다. 수면의 단계는 NREM(non-REM) 수면, REM(Rapid eye movement) 수면으로 구분될 수 있고, NREM 수면은 다시 복수(예: Light, Deep의 2단계, N1 내지 N4의 4단계)로 구분될 수 있다. 수면 단계의 설정은 일반적인 수면 단계로 정의될 수도 있지만, 설계자에 따라 다양한 수면 단계로 임의 설정될 수도 있다.

본 발명의 일 실시예에 따라서, 사용자의 수면 상태 정보는 사용자의 수면에서 발생하는 수면과 관련한 질환이나 수면 중 행동을 표현하는 수면 이벤트 정보를 포함할 수 있다. 구체적으로, 사용자의 수면 중에서 발생하는 수면 이벤트 정보는 사용자의 수면 질환에 의한 수면 무호흡증 및 저호흡증 정보를 포함할 수 있다. 또한, 구체적으로는, 사용자의 수면 중에서 발생하는 수면 이벤트 정보는 사용자의 코골이 여부, 코골이 지속 시간, 잠꼬대 여부, 잠꼬대 지속 시간, 뒤척임 여부 및 뒤척임 지속 시간을 포함할 수 있다. 서술된 사용자의 수면 이벤트 정보는 사용자의 수면 중에 발생하는 사건을 표현하기 위한 예시에 불과하며, 이에 한정되지 않는다.

멀티모달로 한 수면 상태 정보 분석 방법의 일 실시예 (CONCEPT-B)

도 27은 본 발명의 일실시예에 따른 수면 음향 정보와 수면 환경 정보 각각을 추론 한 것을 멀티모달 데이터로 결합하는 단계를 포함하는 수면 상태 정보를 분석하기 위한 방법을 설명하기 위한 흐름도이다.

본 발명의 목적을 달성하기 위하여 일 실시예에 따르면, 수면 음향 정보와 수면 환경 정보를 멀티모달로 한 수면 상태 정보를 분석하기 위한 방법은 사용자의 수면과 관련한 시간 도메인 상의 음향 정보를 획득하는 제1 정보 획득 단계(S200), 제1 정보의 전처리를 수행하는 단계(S202), 제1 정보를 딥러닝 모델의 입력으로 하여 수면에 관한 정보를 추론하는 단계(S204), 사용자의 수면과 관련한 사용자 수면 환경 정보를 획득하는 제2 정보 획득 단계(S210), 제2 정보의 전처리를 수행하는 단계(S212), 제2 정보를 딥러닝 모델의 입력으로 하여 수면에 관한 정보를 추론하는 단계(S214), 멀티모달로 데이터를 결합하는 결합단계(S220) 및 멀티모달 데이터의 결합으로 수면 상태 정보를 획득하는 단계(S230)을 포함할 수 있다.

본 발명의 실시예에 따라서, 제1 정보 획득 단계(S200)은 사용자 단말(10)에서 사용자의 수면과 관련한 시간 도메인 상의 음향 정보를 획득할 수 있다. 사용자의 수면과 관련한 시간 도메인 상의 음향 정보는 사용자 단말(10)의 음원 탐지부에서 얻어지는 음원 정보를 포함할 수 있다.

본 발명의 실시예에 따라서, 제1 정보의 데이터 전처리를 수행하는 단계(S202)에서는 시간 도메인 상의 시간 음향 정보를, 주파수 성분의 시간 축에 따른 변화를 포함하는 정보 또는, 주파수 도메인 상의 정보로 변환할 수 있다. 또한, 주파수 도메인 상의 정보는 스펙트로그램으로 표현될 수 있으며, 멜 스케일이 적용된 멜 스펙트로그램일 수 있다. 스펙트로그램으로 변환함으로써, 사용자의 프라이버시 보호 및 데이터 가공량을 줄일 수 있다.

본 발명의 실시예에 따라서, 제1 정보의 데이터 전처리를 수행하는 단계(S202)에서는 수면 음향 정보를 딥러닝 모델에 입력시키기 위한 충분한 양의 유의미한 데이터를 얻기 위한 데이터 어그멘테이션 과정을 포함할 수 있다. 데이터 어그멘테이션 기법에는 피치 시프팅(Pitch Shifting) 어그멘테이션, TUT(Tile UnTile) 어그멘테이션 어그멘테이션 및 노이즈 부가 어그멘테이션을 포함할 수 있다. 전술한 어그멘테이션 기법은 단순한 예시일 뿐이며, 본 발명은 이에 제한되는 것은 아니다.

본 발명의 실시예에 따라서, 사용자의 수면과 관련한 사용자 수면 환경 정보를 획득하는 제2 정보 획득 단계(S210)는 사용자 단말(10), 외부서버 또는 네트워크를 통해서 사용자 수면 환경 정보를 획득할 수 있다. 사용자의 수면 환경 정보는 사용자가 위치한 공간에서 획득되는 수면과 관련한 정보를 의미할 수 있다. 수면 환경 정보는, 비접촉식 방법으로 사용자가 위치한 공간에서 획득되는 센싱 정보일 수 있다. 수면 환경 정보는, 레이더를 통해 측정되는 호흡 운동 및 신체 움직임 정보일 수 있다. 수면 환경 정보는, 스마트 워치, 스마트 가전 등에서 획득되는 사용자의 수면에 관련한 정보일 수 있다. 수면 환경 정보는, 광혈류 측정 신호(PhotoPlethysmoGraphy, PPG)를 통해 얻어지는 심박 변이도(Heart Rate Variability, HRV), 심박수(Heart Rate)일 수 있으며, 광혈류 측정 신호는 스마트 워치 및 스마트 링에 의해서 측정될 수 있다. 수면 환경 정보는, 뇌파 신호(Electro Encephalo Graphy, EEG)일 수 있다. 수면 환경 정보는 수면 중 측정되는 Actigraphy 신호 일 수 있다.

본 발명의 실시예에 따라서, 제2 정보의 전처리를 진행하는 단계(S212)는 사용자의 수면 환경 정보의 데이터를 딥러닝 모델에 입력 시키기 위한 충분한 양의 유의미한 데이터를 얻기 위한 데이터 어그멘테이션 과정을 포함할 수 있다.

본 발명의 일 실시예에 따라서, 제2 정보의 전처리를 진행하는 단계(S212)는 사용자의 수면 환경 정보의 데이터가 이미지 정보로 얻어지는 경우, 이미지 정보를 TUT(Tile UnTile) 어그멘테이션 어그멘테이션 및 노이즈 부가 어그멘테이션을 포함할 수 있다. 전술한 어그멘테이션 기법은 이미지 정보의 어그멘테이션 기법에 관한 단순한 예시일 뿐이며, 본 발명은 이에 제한되는 것은 아니다. 사용자의 수면 환경 정보는 다양한 저장 형태의 방식의 정보일 수 있다. 사용자의 수면 환경 정보의 어그멘테이션 방법은 다양한 방식이 채용될 수 있다.

본 발명의 실시예에 따라서, 전처리 된 제1 정보를 딥러닝 모델의 입력으로 하여 수면에 관한 정보를 추론하는 단계(S204)는 기 학습된 딥러닝 모델의 입력으로 하여 수면에 관한 정보를 추론할 수 있다.

본 발명의 실시예에 따라서, 기 학습된 딥러닝 모델은 추론되는 데이터를 통한 자가 학습을 위하여 추론되는 데이터를 입력으로 사용할 수 있다.

본 발명의 실시예에 따라서, 수면 음향에 관한 제1정보를 입력으로 하여 수면에 관한 정보를 추론하는 딥러닝 수면 분석 모델은 피처 추출 모델과 피처 분류 모델을 포함할 수 있다.

본 발명의 실시예에 따른 딥러닝 수면 분석 모델 중 피처 추출 모델은, 하나의 스펙트로그램이 입력되어, 하나의 스펙트로그램에 해당하는 수면 상태 정보를 예측하도록 학습되는 One-to-one 프록시 태스크(Proxy task)에 의해서 사전 학습(Pre training)될 수 있다. 본 발명의 실시예에 따른 피처 추출 모델에 CNN 딥러닝 모델을 채용하는 경우에, FC(Fully Connected Layer) 또는 FCN(Fully Connected Neural Network)의 구조를 채택하여 학습을 수행할 수도 있다. 본 발명의 실시예에 따른 피처 추출 모델에 MobileViTV2 딥러닝 모델을 채용하는 경우에는, 중간층(Intermediate Layer)의 구조를 채택하여 학습을 수행할 수도 있다.

본 발명의 실시예에 따른 딥러닝 수면 분석 모델 중 피처 분류 모델은, 복수의 연속된 스펙트로그램이 입력되어, 각각의 스펙트로그램의 수면 상태 정보를 예측하고, 복수의 연속된 스펙트로그램의 시퀀스를 분석하여 전체적인 수면 상태 정보를 예측 또는 분류하도록 학습될 수 있다.

본 발명의 실시예에 따라서, 전처리된 제2 정보를 추론 모델의 입력으로 하여 수면에 관한 정보를 추론하는 단계(S214)는 기 학습된 추론 모델의 입력으로 하여, 수면에 관한 정보를 추론할 수 있다. 기 학습된 추론 모델은, 상술한 수면 딥러닝 수면 분석 모델일 수 있으나 이에 한정되지 아니하고, 기 학습된 추론 모델은 목적을 달성하기 위한 다양한 형태의 방식의 추론 모델 일 수 있다. 기 학습된 추론 모델은 다양한 방식이 채용될 수 있다.

본 발명의 실시예에 따라서, 데이터 전처리 과정을 거친 제1 정보와 제2 정보를 멀티모달 데이터로 결합하는 단계(S220)은 정보를 결합하여 수면 상태 정보를 결정하기 위하여 데이터를 결합한다.

본 발명의 일 실시예에 따라서, 멀티모달 데이터로 결합하는 방법은 전처리된 제1 정보를 통해 추론된 수면 정보와 전처리된 제2 정보를 통해 추론된 정보를 동일한 형식의 데이터로 결합하는 것일 수 있다.

본 발명의 실시예에 따라서, 멀티모달 데이터 결합으로 수면 상태 정보를 획득하는 단계(S230)는 멀티모달로 얻은 데이터를 결합하여 이를 통해서 사용자의 수면 상태 정보를 결정할 수 있다. 수면 상태 정보는 사용자의 수면의 상태에 관한 정보일 수 있다.

본 발명의 일 실시예에 따라서, 멀티모달 데이터 결합으로 수면 상태 정보를 획득하는 단계(S230)은 전처리 된 제1 정보를 딥러닝 모델의 입력으로 하여 수면에 관한 정보를 추론하는 단계(S204)에서 추론된 사용자의 수면에 관한 힙노그램(hypnogram)과 전처리된 제2 정보를 추론 모델의 입력으로 하여 수면에 관한 정보를 추론하는 단계(S214)에서 추론된 사용자의 수면에 관한 힙노그램(hypnogram)를 결합할 수 있다. 예를 들어, 각 힙노그램(hypnogram)을 중첩시켜 일치하는 부분에 대한 수면단계에 대한 정보를 채용하고, 일치하지 않는 부분에 대한 수면단계에 대한 정보는 가중치를 부여하여 채용여부를 결정함으로써 수면 상태 정보를 획득할 수 있다.

본 발명의 일 실시예에 따라서, 멀티모달 데이터 결합으로 수면 상태 정보를 획득하는 단계(S230)은 전처리 된 제1 정보를 딥러닝 모델의 입력으로 하여 수면에 관한 정보를 추론하는 단계(S204)에서 추론된 사용자의 수면에 관한 힙노덴시티 그래프(hypnodensity graph)와 전처리된 제2 정보를 추론 모델의 입력으로 하여 수면에 관한 정보를 추론하는 단계(S214)에서 추론된 사용자의 수면에 관한 힙노덴시티 그래프(hypnodensity graph)를 결합할 수 있다. 예를 들어, 각 힙노덴시티 그래프(hypnodensity graph)의 확률을 수식에 대입하여, 각 시각마다 가장 높은 신뢰도를 가지는 수면 단계를 사용자의 수면 단계 정보로 얻을 수 있다. 예를 들어, 각 힙노덴시티 그래프(hypnodensity graph)에서 시간에 따른 신뢰도가 기 설정된 신뢰도 임계치를 넘는 경우는 사용자의 수면 단계 정보로 채용하고, 시간에 따른 신뢰도가 기 설정된 신뢰도 임계치를 넘는 수면 단계 정보가 없는 경우 가중치를 통해 수면 단계 정보로 채용함으로써, 수면 상태 정보를 획득할 수 있다.

본 발명의 일 실시예에 따라서, 멀티모달 데이터 결합으로 수면 상태 정보를 획득하는 단계(S230)은 전처리 된 제1 정보를 딥러닝 모델의 입력으로 하여 수면에 관한 정보를 추론하는 단계(S204)에서 추론된 사용자의 수면에 관한 힙노그램(hypnogram)과 전처리된 제2 정보를 추론 모델의 입력으로 하여 수면에 관한 정보를 추론하는 단계(S214)에서 추론된 사용자의 수면에 관한 힙노덴시티 그래프(hypnodensity graph)를 결합할 수 있다. 예를 들어, 힙노그램에 표시되는 수면 단계와 힙노덴시티 그래프의 신뢰도가 기 설정된 임계치를 넘는 경우에는, 사용자의 수면 단계로 채용함으로써, 사용자의 수면 상태 정보를 획득할 수 있다. 예를 들어, 힙노그램에 표시되는 수면 단계와 힙노덴시티 그래프의 신뢰도가 기 설정된 임계치를 넘지 않는 경우 가중치를 부과하여 계산하여 사용자의 수면 단계로 채용함으로써, 신뢰도 높은 사용자의 수면 상태 정보를 획득할 수 있다.

본 발명의 일 실시예에 따라서, 사용자의 수면 상태 정보는 사용자의 수면을 단계로서 표시하는 수면 단계 정보를 포함할 수 있다. 수면의 단계를 표시하는 방법은 수면 단계를 그래프에 표시하는 힙노그램(Hypnogram) 및 각 수면 단계의 확률을 그래프에 표시하는 힙노덴시티 그래프(Hypnodensity graph)를 포함할 수 있으나, 표시하는 방법은 이에 한정되지 않는다.

멀티모달로 한 수면 상태 정보 분석 방법의 일 실시예 (CONCEPT-C)

도 28은 본 발명의 일실시예에 따른 수면 음향 정보를 추론한 것을 수면 환경 정보와 멀티모달 데이터로 결합하는 단계를 포함하는 수면 상태 정보를 분석하기 위한 방법을 설명하기 위한 흐름도이다.

본 발명의 목적을 달성하기 위하여 일 실시예에 따르면, 수면 음향 정보와 수면 환경 정보를 멀티모달로 한 수면 상태 정보를 분석하기 위한 방법은 사용자의 수면과 관련한 시간 도메인 상의 음향 정보를 획득하는 제1 정보 획득 단계(S300), 제1 정보의 전처리를 수행하는 단계(S302), 제1 정보를 딥러닝 모델의 입력으로 하여 수면에 관한 정보를 추론하는 단계(S304), 사용자의 수면과 관련한 사용자 수면 환경 정보를 획득하는 제2 정보 획득 단계(S310), 멀티모달로 데이터를 결합하는 결합단계(S320) 및 멀티모달 데이터의 결합으로 수면 상태 정보를 획득하는 단계(S330)을 포함할 수 있다.

본 발명의 실시예에 따라서, 제1 정보 획득 단계(S300)은 사용자 단말(10)에서 사용자의 수면과 관련한 시간 도메인 상의 음향 정보를 획득할 수 있다. 사용자의 수면과 관련한 시간 도메인 상의 음향 정보는 사용자 단말(10)의 음원 탐지부에서 얻어지는 음원 정보를 포함할 수 있다.

본 발명의 실시예에 따라서, 제1 정보의 데이터 전처리를 수행하는 단계(S302)에서는 시간 도메인 상의 시간 음향 정보를 주파수 도메인 상의 정보로 변환할 수 있다. 또한, 주파수 도메인 상의 정보는 스펙트로그램으로 표현될 수 있으며, 멜 스케일이 적용된 멜 스펙트로그램일 수 있다. 스펙트로그램으로 변환함으로써, 사용자의 프라이버시 보호 및 데이터 가공량을 줄일 수 있다.

본 발명의 실시예에 따라서, 제1 정보의 데이터 전처리를 수행하는 단계(S302)에서는 수면 음향 정보를 딥러닝 모델에 입력시키기 위한 충분한 양의 유의미한 데이터를 얻기 위한 데이터 어그멘테이션 과정을 포함할 수 있다. 데이터 어그멘테이션 기법에는 피치 시프팅(Pitch Shifting) 어그멘테이션, TUT(Tile UnTile) 어그멘테이션 어그멘테이션 및 노이즈 부가 어그멘테이션을 포함할 수 있다. 전술한 어그멘테이션 기법은 단순한 예시일 뿐이며, 본 발명은 이에 제한되는 것은 아니다.

본 발명의 실시예에 따라서, 사용자의 수면과 관련한 사용자 수면 환경 정보를 획득하는 제2 정보 획득 단계(S310)는 사용자 단말(10), 외부서버 또는 네트워크를 통해서 사용자 수면 환경 정보를 획득할 수 있다. 사용자의 수면 환경 정보는 사용자가 위치한 공간에서 획득되는 수면과 관련한 정보를 의미할 수 있다. 수면 환경 정보는, 비접촉식 방법으로 사용자가 위치한 공간에서 획득되는 센싱 정보일 수 있다. 수면 환경 정보는, 레이더를 통해 측정되는 호흡 운동 및 신체 움직임 정보일 수 있다. 수면 환경 정보는, 스마트 워치, 스마트 가전 등에서 획득되는 사용자의 수면에 관련한 정보일 수 있다. 수면 환경 정보는, 광혈류 측정 신호(PhotoPlethysmoGraphy, PPG)를 통해 얻어지는 심박 변이도(Heart Rate Variability, HRV), 심박수(Heart Rate)일 수 있으며, 광혈류 측정 신호는 스마트 워치 및 스마트링에 의해서 측정될 수 있다. 수면 환경 정보는, 뇌파 신호(Electro Encephalo Graphy, EEG)일 수 있다. 수면 환경 정보는 수면 중 측정되는 Actigraphy 신호 일 수 있다. 수면 환경 정보는, 사용자의 정보를 표상하는 라벨링 데이터일 수 있다. 구체적으로, 라벨링 데이터는 사용자의 나이, 질병여부, 신체조건, 인종, 키, 몸무게 및 체질량 지수를 포함할 수 있고, 이는 사용자의 정보를 표상하는 라벨링 데이터의 예시일 뿐 이에 한정되지 않는다. 상술한 수면 환경 정보는 사용자의 수면에 영향을 미칠 수 있는 정보의 예시에 불과하며 이에 한정되지 않는다.

본 발명의 실시예에 따라서, 전처리 된 제1 정보를 딥러닝 모델의 입력으로 하여 수면에 관한 정보를 추론하는 단계(S304)는 기 학습된 딥러닝 모델의 입력으로 하여 수면에 관한 정보를 추론할 수 있다.

본 발명의 실시예에 따른 딥러닝 수면 분석 모델 중 피처 분류 모델은, 복수의 연속된 스펙트로그램이 입력되어, 각각의 스펙트로그램의 수면 상태 정보를 예측하고, 복수의 연속된 스펙트로그램의 시퀀스를 분석하여 시계열적인 수면 상태 정보를 예측 또는 분류하도록 학습될 수 있다.

본 발명의 실시예에 따라서, 데이터 전처리 과정을 거친 제1 정보와 제2 정보를 멀티모달 데이터로 결합하는 단계(S320)은 딥 러닝 모델에 멀티모달 데이터를 입력하기 위하여 데이터를 결합한다.

본 발명의 실시예에 따라서, 멀티모달 데이터 결합으로 수면 상태 정보를 획득하는 단계(S330)은 멀티모달로 얻은 데이터를 결합하여 이를 통해서 사용자의 수면 상태 정보를 결정할 수 있다. 수면 상태 정보는 사용자의 수면의 상태에 관한 정보일 수 있다.

본 발명의 실시예에 따른 실시간 수면 분석

본 발명의 실시예에 따른, 음향 정보를 기반으로 한 수면 상태 정보의 분석으로는 수면 이벤트(예컨대, 무호흡, 저호흡, 코골이, 잠꼬대 등)에 대한 탐지 단계가 포함될 수 있다. 그러나, 수면 음향 패턴의 특성은 시간의 흐름에 걸쳐 반영되는 것이기 때문에, 특정 시점의 짧은 음향 데이터만으로는 파악하기 어려울 수 있다. 따라서, 음향 정보를 모델링 하기 위해서는 음향 정보의 시계열 특성에 기초하여 분석이 수행되어야 한다.

또한, 수면 중 발생하는 수면 이벤트(예컨대, 무호흡, 저호흡, 코골이, 잠꼬대 등)은 수면 이벤트와 관련된 다양한 특징들을 가지고 있다. 예를 들어, 무호흡 이벤트 동안에는 소리가 없지만, 무호흡 이벤트가 끝나면 공기가 다시 통과하면서 큰 소리가 발생할 수 있고, 무호흡 이벤트의 특징을 시계열적으로 학습하여 수면 이벤트를 탐지할 수 있다.

실시간 수면 이벤트 탐지를 위한 딥 뉴럴 네트워크의 차이점

본 발명의 실시예에 따른, 수면 중 발생하는 수면 이벤트를 탐지하기 위해서, 상술한 수면 단계를 분석하기 위한 딥 뉴럴 네트워크 구조를 변경하여 사용할 수 있다. 구체적으로, 수면 단계 분석은 수면 음향에 대한 시계열적인 학습이 필요하지만, 수면 이벤트 탐지는 평균적으로 10초에서 60초사이에 발생하므로, 30초를 단위로 하는 1 에폭(epoch) 또는 2 에폭(epoch)을 정확하게 탐지하는 것으로 충분하다. 따라서, 본 발명의 일 실시예에 따른 수면 단계를 분석하기 위한 딥 뉴럴 네트워크 구조는 수면 단계 분석을 위한 딥 뉴럴 네트워크 구조의 입력량과 출력량을 감소시킬 수 있다. 예를 들어, 수면 단계를 분석하기 위한 딥 뉴럴 네트워크 구조는 40개의 멜 스펙트로그램을 처리하여 20 에폭의 수면 단계를 출력한다면, 수면 이벤트를 탐지하기 위한 딥 뉴럴 네트워크 구조는 14개의 멜 스펙트로그램을 처리하여 10 에폭의 수면 이벤트 레이블을 출력할 수 있다. 여기에서, 수면 이벤트 레이블은 이벤트 없음, 무호흡, 저호흡, 코골이 있음, 뒤척임 등을 포함할 수 있으나, 여기에 한정되지 않는다.

또한, 본 발명의 실시예에 따른, 수면 중 발생하는 수면 이벤트를 탐지하기 위한 딥 뉴럴 네트워크 구조는 피처 추출 모델과 피처 분류 모델을 포함할 수 있다. 구체적으로, 피처 추출 모델은 각 멜 스펙트로그램에서 발견되는 수면 이벤트의 특징을 추출하고, 피처 분류 모델은 복수의 에폭을 감지하여 수면 이벤트를 포함하는 에폭을 찾아 이웃하는 특징을 분석하여 시계열적으로 수면 이벤트의 유형을 예측하고 분류할 수 있다.

실시간 수면 이벤트 탐지를 위한 클래스 가중치(Class Weights)

본 발명의 일 실시예에 따른, 수면 중 발생하는 수면 이벤트를 탐지하기 위한 방법은 각 수면 이벤트의 클래스 불균형 문제를 해결하기 위해서 클래스 가중치(Class weights)를 부여할 수 있다. 구체적으로, 수면 중 발생하는 수면 이벤트 중 “이벤트 없음”은 전체 수면 길이에 있어서 지배적인 영향을 미칠 수 있어서, 수면 이벤트 학습 효율 저하를 발생시킬 수 있다. 따라서, “이벤트 없음” 보다 높은 가중치를 다른 수면 이벤트에 부여하여, 학습 효율 및 정확성을 향상시킬 수 있다. 예를 들어, 수면 이벤트 클래스가 “이벤트 없음”, “무호흡”, “저호흡” 3가지로 분류되는 경우, “이벤트 없음”이 학습에 미치는 영향을 감소시키기 위해서, “이벤트 없음”에는 1.0, “무호흡”에는 1.3, “저호흡”에는 2.1의 가중치를 부여할 수 있다.

실시간 수면 이벤트 탐지를 위한 컨시스턴시 트레이닝

그리고, 도 21은 본 발명의 일실시예에 따른 컨시스턴시 트레이닝(Consistency Training)을 설명하기 위한 도면이다. 본 발명의 실시예에 따른, 수면 중 발생하는 수면 이벤트를 탐지하는 단계는 가정 환경 및 소음 환경에서의 수면 중 발생하는 수면 이벤트를 탐지하기 위해서, 상술한 바와 같이 도 21에 도시된 바와 같이 컨시스턴시 트레이닝(Consistency Training)을 활용할 수 있다. 컨시스턴시 트레이닝(Consistency Training)은 반지도학습(Semi-Supervised learning)모델의 하나의 종류로서, 본 발명의 실시예에 따른 Consistency Training은 하나의 데이터에 대하여 노이즈를 의도적으로 부가한 것과, 노이즈를 의도적으로 부가하지 않은 데이터를 가지고 학습을 수행하는 방법일 수 있다.

본 발명의 실시예에 따라 의도적으로 부가되는 노이즈는 타겟 환경의 노이즈일 수 있는데, 여기서 타겟 환경의 노이즈는 예컨대 수면다원검사 이외의 환경에서 획득된 노이즈일 수 있다. 구체적으로, 수면 이벤트를 탐지하는 데 있어서, 실제 사용자의 환경과 유사하게 하기 위해서 SNR과 소음의 종류를 조절함을 통해서, 다양한 노이즈를 부가할 수 있다. 이를 통해서 다양한 실험실에서 얻어지는 노이즈의 종류와 실제 가정환경에서 발생하는 노이즈에 대해서 수집하고, 학습할 수 있다.

본 발명의 실시예들에 따르면, 편의상, 노이즈를 의도적으로 부가한 데이터를 Corrupted data로 지칭한다. Corrupted data는 바람직하게는 의도적으로 타겟 환경의 노이즈를 부가한 데이터를 의미할 수 있다.

또한, 편의상, 노이즈를 의도적으로 부가하지 않은 데이터를 Clean data로 지칭하기로 한다. 여기서 Clean data에는 의도적으로 노이즈를 부가하지 않았을 뿐, 실질적으로 노이즈가 포함될 수도 있다.

홈 노이즈 컨시스턴시 트레이닝

본 발명의 일 실시예에 따른, 수면 중 발생하는 수면 이벤트(예컨대, 무호흡, 저호흡, 코골기, 잠꼬대 등) 탐지는 가정환경에서의 일관성 학습(Home Noise Consistency Training)을 포함할 수 있다. 가정환경에서의 일관성 학습은 모델이 집에서의 소음에도 강건하게 동작하도록 만둘 수 있다. 가정환경에서의 일관성 학습은 모델이 소음이 있든 없든 비슷한 예측을 출력하도록 일관성 학습을 진행하여 소음에 강건해질 수 있다.

본 발명의 일 실시예에 따른, 수면 중 발생하는 수면 이벤트 탐지는 가정환경에서의 일관성 학습을 진행할 수 있다. 가정환경에서의 일관성 학습은 일관성 손실함수를 포함할 수 있다. 예를 들어, 일관성 손실(Consistency loss)은 깨끗한 수면 호흡 소리의 예측과 그 소리의 손상된 버전의 예측 사이의 평균 제곱 오차(MSE)로 정의될 수 있다.

본 발명의 일 실시예에 따른, 가정환경에서의 일관성 학습은 손상된 소리를 생성하기 위해, 훈련 소음에서 무작위로 데이터를 샘플링하고, -20에서 5 사이의 무작위 SNR로 깨끗한 수면 호흡 소리에 노이즈를 부가할 수 있다.

본 발명의 일 실시예에 따른, 가정환경에서의 일관성 학습은 입력 시퀀스의 길이가 14 epochs, 총 샘플링된 소음의 길이가 7분 이상이 되도록 학습될 수 있다. 이를 통해, 본 발명에 따른 수면 이벤트를 탐지는 본 발명에 따른 수면 단계 분석에 비해 짧은 시간 내의 정보를 탐지하는 것으로, 수면 이벤트 탐지의 정확도가 상승될 수 있다.

이벤트 탐지로부터 AHI 값 추정을 위한 회귀분석

도 34는 본 발명의 일 실시예에 따른, 수면 중 발생하는 수면 이벤트를 통해 수면 무호흡증 발생 지수인 AHI 분석하기 위해 활용하는 선형회귀분석 함수를 설명하기 위한 도면이다.

본 발명의 일 실시예에 따른, 단위시간(예컨대, 1시간)당 발생하는 호흡 사건의 횟수를 의미하는 AHI 지수는 수면 단계 분석과는 별도로 하나의 수면 단계 분석을 위한 에폭(epoch)의 길이와 독립적으로 분석을 할 수 있다. 구체적으로, 하나의 에폭(epoch)동안 2개 또는 3개의 짧은 수면 이벤트가 포함될 수 있고, 복수의 에폭(epoch)동안 1개의 긴 수면 이벤트가 포함될 수 있다.본 발명의 일실시예에 따른, 수면 중 발생하는 수면 이벤트가 발생한 에폭(epoch)의 개수로부터 실제 이벤트가 발생한 횟수를 추정하기 위하여 회귀분석 함수를 사용할 수 있다. 예컨대, RANSAC(Random Sample Consensus) 회귀 분석 모델을 사용할 수 있다. RANSAC 회귀 분석 모델은 근사 모델(Fitting Model)의 파라미터를 추정하는 방법 중 하나이며, 무작위로 샘플 데이터를 뽑은 다음 최대로 일치하는 모델을 선택하는 방법이다.

멀티 헤드를 통한 멀티 태스크 분석

본 발명의 일 실시예에 따른, 수면 상태를 분석하기 위한 방법은 딥 러닝 모델을 통한 분석을 포함할 수 있다. 본 발명의 일 실시예에 따른 딥 러닝 모델은 멀티 태스크 학습 및/또는 멀티 태스크 분석을 할 수 있다. 구체적으로, 멀티 태스크 학습 및 멀티 태스크 분석은 상술한 본 발명에 따른 실시예들(예컨대, 멀티모달 학습, 실시간 수면 이벤트 분석, 수면 단계 분석 등)에 따른 태스크를 동시에 학습할 수 있다.

본 발명의 일 실시예에 따른, 수면 상태를 분석하기 위한 딥 러닝 모델은 멀티 태스크 학습 및 멀티 태스크 분석을 할 수 있다. 구체적으로, 멀티 태스크 학습 및 분석을 위해서, 딥 러닝 모델은 복수의 헤드를 갖는 구조를 채택할 수 있다. 복수의 헤드 각각은 특정 작업 또는 태스크(예컨대, 멀티모달 학습, 실시간 수면 이벤트 분석, 수면 단계 분석 등)를 각각 담당할 수 있다. 예를 들어, 딥 러닝 모델은 제1 헤드, 제2 헤드 및 제3 헤드로 총 3개의 헤드를 갖는 구조를 가질 수 있고, 제1 헤드는 수면 단계 정보에 대한 추론 및/또는 분류를 수행하고, 제2 헤드는 수면 이벤트 중 수면 무호흡과 저호흡에 대한 탐지 및/또는 분류를 수행하고, 제3 헤드는 수면 이벤트 중 코골이에 대한 탐지 및 분류를 수행할 수 있다. 상술한 헤드의 특정 작업 또는 태스크에 대한 구체적인 기재는 본 발명을 설명하기 위한 예시에 불과할 뿐, 이에 한정되지 않는다. 본 발명에 따른 딥 러닝 모델은 복수의 헤드를 갖는 구조를 통해서 멀티 태스크 학습 및 분석을 진행할 수 있고, 데이터 효율성을 높임으로써 복수의 태스크 또는 특정 작업을 최적화할 수 있다.

본 발명에 따른 수면 분석 방법의 효과

수면다원검사(polysomnography, PSG) 결과와 비교하면, 수면 음향 정보를 입력으로 하는 수면 분석 모델 결과값이 매우 정확하다는 것을 확인할 수 있었다.

기존 수면 분석 모델은 ECG(Electrocardiogram)이나, HRV(Heart Rate Variability)를 입력으로 하여 수면단계를 예측하였으나, 본 발명은 수면 음향 정보를 주파수 도메인으로 변환한 정보, 스펙트로그램, 또는 멜 스펙트로그램으로 변환하여 입력으로 하여 수면단계 분석 및 추론을 진행할 수 있다. 따라서, 수면 음향 정보를 주파수 도메인으로 변환한 정보, 스펙트로그램, 또는 멜 스펙트로그램으로 변환하여 입력으로 하기 때문에 기존 수면 분석 모델과 달리 수면 패턴의 특이성 분석을 통해서 실시간으로 수면 단계를 센싱(sensing) 또는 획득할 수 있다.

도 11에 도시된 바와 같이, 본 발명에 따라 획득된 수면 분석 결과는 수면다원검사와 매우 일치할 뿐만 아니라, 오히려 수면단계(Wake, Light, Deep, REM)와 관련한 더욱 정밀하고도 유의미한 정보를 포함한다. 도 10의 가장 아래에 도시된 힙노그램(hypnogram)은 사용자 수면 음향 정보를 입력받아 수면단계를 예측할 때, 30초 단위로 4개의 클래스(Wake, Light, Deep, REM) 중 어디에 속하는지에 대한 확률을 나타낸다. 여기서 4개의 클래스는 각각 깨어 있는 상태, 가볍게 잠이 든 상태, 깊게 잠이 든 상태, REM 수면 상태를 의미한다.

도 12는 본 발명에 따른 수면 분석 방법의 성능을 검증한 그래프로, 수면 무호흡증(apnea), 호흡저하(hypopnea)와 관련하여 수면다원검사(polysomnography, PSG) 결과(PSG result)와 본 발명에 따른 AI 알고리즘을 이용한 분석 결과(AI result)를 비교한 도면이다. 도 12의 가장 아래에 도시된 힙노그램(hypnogram)은 사용자 수면 음향 정보를 입력받아서 수면 질환을 예측할 때, 30초 단위로 2개의 질환(수면 무호흡증, 호흡저하) 중 어디에 속하는지에 대한 확률을 나타낸다. 본 발명에 따른 수면 분석을 이용하면, 도 12에 도시된 바와 같이, 본 발명에 따라 획득된 수면 상태 정보는 수면다원검사와 매우 일치할 뿐만 아니라, 무호흡증과 호흡저하와 관련한 더욱 정밀한 분석 정보를 포함한다.

본 발명은 사용자의 수면 분석을 실시간으로 분석하면서 수면장애(수면무호흡, 수면과호흡, 수면저호흡)가 발생한 지점을 파악할 수 있다. 수면장애가 발생한 순간 사용자에게 자극(촉각적, 자극 청각적 자극, 후각적 자극 등)을 제공하면, 수면장애가 일시적으로 완화될 수 있다. 즉, 본 발명은 수면장애와 관련한 정확한 이벤트탐지를 바탕으로 사용자의 수면장애를 중단시키고, 수면장애의 빈도를 감소시킬 수 있다. 또한, 본 발명에 따르면 수면 분석을 멀티모달로 수행함으로써 매우 정확한 수면 분석이 가능하다는 효과도 있다.

본 발명의 추론단계 사후처리

학습을 통해서 수면 단계를 추론하는 추론단계에서, 수면은 학습 데이터와 같이 일정시간(예컨대, 30초, 20분 등)으로 구성되는 것뿐만 아니라 수면시간(예컨대, 5시간, 8시간 등)으로 구성될 수도 있다. 수면단계에 대한 정확한 추론을 진행하기 위해서, 수면 지속 시간에 비추어 추론의 정확성을 올리기 위해 사후처리를 진행할 수 있다. 상술한 시간 간격과 관련한 구체적인 수치는 단순한 예시일 뿐, 본 발명은 이에 제한되는 것은 아니다.

본 발명의 일실시예에 따르면, 수면지속시간에 따른 수면의 깊이에 관한 추론을 의학적 정보를 활용하여 사후처리를 진행할 수 있다.

본 발명의 일실시예에 따르면, 수면지속 시간에 따른 수면단계 정보 데이터를 활용하여 인공지능학습을 통해서 사후처리를 진행할 수 있다.

본 발명의 실시예와 관련하여 설명된 방법 또는 알고리즘의 단계들은 하드웨어로 직접 구현되거나, 하드웨어에 의해 실행되는 소프트웨어 모듈로 구현되거나, 또는 이들의 결합에 의해 구현될 수 있다. 소프트웨어 모듈은 RAM(Random Access Memory), ROM(Read Only Memory), EPROM(Erasable Programmable ROM), EEPROM(Electrically Erasable Programmable ROM), 플래시 메모리(Flash Memory), 하드 디스크, 착탈형 디스크, CD-ROM, 또는 본 발명이 속하는 기술 분야에서 잘 알려진 임의의 형태의 컴퓨터 판독가능 기록매체에 상주할 수도 있다.

본 발명의 구성 요소들은 하드웨어인 컴퓨터와 결합되어 실행되기 위해 프로그램(또는 애플리케이션)으로 구현되어 매체에 저장될 수 있다. 본 발명의 구성 요소들은 소프트웨어 프로그래밍 또는 소프트웨어 요소들로 실행될 수 있으며, 이와 유사하게, 본 발명의 실시예들은 데이터 구조, 프로세스들, 루틴들 또는 다른 프로그래밍 구성들의 조합으로 구현되는 다양한 알고리즘을 포함하여, C, C++, 자바(Java), 어셈블러(assembler) 등과 같은 프로그래밍 또는 스크립팅 언어로 구현될 수 있다. 기능적인 측면들은 하나 이상의 프로세서들에서 실행되는 알고리즘으로 구현될 수 있다.

본 발명의 기술 분야에서 통상의 지식을 가진 자는 여기에 개시된 실시예들과 관련하여 설명된 다양한 예시적인 논리 블록들, 모듈들, 프로세서들, 수단들, 회로들 및 알고리즘 단계들이 전자 하드웨어, (편의를 위해, 여기에서 "소프트웨어"로 지칭되는) 다양한 형태들의 프로그램 또는 설계 코드 또는 이들 모두의 결합에 의해 구현될 수 있다는 것을 이해할 것이다. 하드웨어 및 소프트웨어의 이러한 상호 호환성을 명확하게 설명하기 위해, 다양한 예시적인 컴포넌트들, 블록들, 모듈들, 회로들 및 단계들이 이들의 기능과 관련하여 위에서 일반적으로 설명되었다. 이러한 기능이 하드웨어 또는 소프트웨어로서 구현되는지 여부는 특정한 애플리케이션 및 전체 시스템에 대하여 부과되는 설계 제약들에 따라 좌우된다. 본 발명의 기술 분야에서 통상의 지식을 가진 자는 각각의 특정한 애플리케이션에 대하여 다양한 방식들로 설명된 기능을 구현할 수 있으나, 이러한 구현 결정들은 본 발명의 범위를 벗어나는 것으로 해석되어서는 안 될 것이다.

여기서 제시된 다양한 실시예들은 방법, 장치, 또는 표준 프로그래밍 및/또는 엔지니어링 기술을 사용한 제조 물품(article)으로 구현될 수 있다. 용어 "제조 물품"은 임의의 컴퓨터-판독가능 장치로부터 액세스 가능한 컴퓨터 프로그램, 캐리어, 또는 매체(media)를 포함한다. 예를 들어, 컴퓨터-판독가능 매체는 자기 저장 장치(예를 들면, 하드 디스크, 플로피 디스크, 자기 스트립, 등), 광학 디스크(예를 들면, CD, DVD, 등), 스마트 카드, 및 플래쉬 메모리 장치(예를 들면, EEPROM, 카드, 스틱, 키 드라이브, 등)를 포함하지만, 이들로 제한되는 것은 아니다. 또한, 여기서 제시되는 다양한 저장 매체는 정보를 저장하기 위한 하나 이상의 장치 및/또는 다른 기계-판독가능한 매체를 포함한다. 용어 "기계-판독가능 매체"는 명령(들) 및/또는 데이터를 저장, 보유, 및/또는 전달할 수 있는 무선 채널 및 다양한 다른 매체를 포함하지만, 이들로 제한되는 것은 아니다.

제시된 프로세스들에 있는 단계들의 특정한 순서 또는 계층 구조는 예시적인 접근들의 일례임을 이해하도록 한다. 설계 우선순위들에 기반하여, 본 발명의 범위 내에서 프로세스들에 있는 단계들의 특정한 순서 또는 계층 구조가 재배열될 수 있다는 것을 이해하도록 한다. 첨부된 방법 청구항들은 샘플 순서로 다양한 단계들의 엘리먼트들을 제공하지만 제시된 특정한 순서 또는 계층 구조에 한정되는 것을 의미하지는 않는다.

제시된 실시예들에 대한 설명은 임의의 본 발명의 기술 분야에서 통상의 지식을 가진 자가 본 발명을 이용하거나 또는 실시할 수 있도록 제공된다. 이러한 실시예들에 대한 다양한 변형들은 본 발명의 기술 분야에서 통상의 지식을 가진 자에게 명백할 것이며, 여기에 정의된 일반적인 원리들은 본 발명의 범위를 벗어남이 없이 다른 실시예들에 적용될 수 있다. 그리하여, 본 발명은 여기에 제시된 실시예들로 한정되는 것이 아니라, 여기에 제시된 원리들 및 신규한 특징들과 일관되는 최광의의 범위에서 해석되어야 할 것이다.

[부호의 설명]

10: 사용자 단말

100: 컴퓨팅 장치

110: 네트워크부

120: 메모리

130: 프로세서

20: 외부 서버

11a: 객체 상태 정보 또는 환경 센싱 정보를 획득할 수 있는 영역

1a: 영역(11a) 내에서 네트워크와 연결된 전자장치

1b: 영역(11a) 내에서 네트워크와 연결된 전자장치

1c: 영역(11a) 내에서 네트워크와 연결되지 않은 전자장치

1d: 영역(11a) 내에서 네트워크와 연결되지 않은 전자장치

2a: 영역(11a)의 범위 밖에 있는 전자장치

2b: 영역(11a)의 범위 밖에 있는 전자장치

E: 음향 정보

P: 사용자의 수면에 관련한 특이점

SS: 수면 음향 정보

SP: 스펙트로그램

Claims

음향 정보를 통해 사용자의 수면 상태 정보를 분석하기 위한 방법에 있어서,

사용자의 수면과 관련한 시간 도메인상의 음향 정보를 획득하는 단계;

상기 음향 정보에 대한 전처리를 수행하는 단계; 및

상기 전처리된 정보를 딥러닝 모델의 입력으로 하여 수면 상태 정보 추출 또는 분류 중 적어도 하나를 수행하는 단계;

를 포함하며,

상기 전처리된 정보는 상기 획득된 음향 정보의 주파수 성분의 시간 축에 따른 변화를 시각화한 것이고,

상기 딥러닝 모델은 자연어처리 기반의 인공지능 모델인,

음향 정보를 통해 사용자의 수면 상태 정보를 분석하기 위한 방법.
음향 정보를 통해 사용자의 수면 상태 정보를 분석하기 위한 방법에 있어서,

사용자의 수면과 관련한 시간 도메인상의 음향 정보를 획득하는 단계;

상기 음향 정보에 대한 전처리를 수행하는 단계; 및

상기 전처리된 정보를 딥러닝 모델의 입력으로 하여 수면 상태 정보 추출 또는 분류 중 적어도 하나를 수행하는 단계;

를 포함하며,

상기 딥러닝 모델은 일관성 손실에 기초한 학습을 수행한 것인,

음향 정보를 통해 사용자의 수면 상태 정보를 분석하기 위한 방법.
음향 정보를 통해 사용자의 수면 상태 정보를 분석하기 위한 방법에 있어서,

사용자의 수면과 관련한 시간 도메인상의 음향 정보를 획득하는 단계;

상기 음향 정보에 대한 전처리를 수행하는 단계; 및

상기 전처리된 정보를 딥러닝 모델의 입력으로 하여 수면 상태 정보 추출 또는 분류 중 적어도 하나를 수행하는 단계;

를 포함하며,

상기 딥러닝 모델은 상기 음향 정보의 시계열적인 특성을 고려할 수 있도록 순차적 일관성 손실에 기초한 반지도 학습을 수행한 것인,

음향 정보를 통해 사용자의 수면 상태 정보를 분석하기 위한 방법.
음향 정보를 통해 사용자의 수면 상태 정보를 분석하기 위한 방법에 있어서,

사용자의 수면과 관련한 시간 도메인상의 음향 정보를 획득하는 단계;

상기 음향 정보에 대한 전처리를 수행하는 단계; 및

상기 전처리된 정보를 딥러닝 모델의 입력으로 하여 수면 상태 정보 추출 또는 분류 중 적어도 하나를 수행하는 단계;

를 포함하며,

상기 딥러닝 모델은 반지도 대조 손실에 기초한 학습을 수행한 것인,

음향 정보를 통해 사용자의 수면 상태 정보를 분석하기 위한 방법.
제4항에 있어서,

상기 반지도 대조 손실에 기초한 학습은,

클래스 신뢰도 임계값을 설정하는 단계; 및

상기 설정된 클래스 신뢰도 임계값에 기초하여 앵커 데이터를 기준으로 벡터 공간 상의 위치를 조정하는 단계;

를 포함하는,

음향 정보를 통해 사용자의 수면 상태 정보를 분석하기 위한 방법.
제5항에 있어서,

상기 앵커 데이터는 수면 상태에 대한 라벨이 부여된 라벨링 데이터 또는 수면 상태에 대한 슈도 라벨이 부여된 슈도 라벨 데이터 중 적어도 하나 이상을 포함하는 것을 특징으로 하는,

음향 정보를 통해 사용자의 수면 상태 정보를 분석하기 위한 방법.
음향 정보를 통해 사용자의 수면 상태 정보를 분석하기 위한 방법에 있어서,

사용자의 수면과 관련한 시간 도메인상의 음향 정보를 획득하는 단계;

상기 음향 정보에 대한 전처리를 수행하는 단계; 및

상기 전처리된 정보를 딥러닝 모델의 입력으로 하여 수면 상태 정보 추출 또는 분류 중 적어도 하나를 수행하는 단계;

를 포함하며,

상기 딥러닝 모델은 비지도 도메인 적응(UDA) 방법에 기초한 학습을 수행한 것인,

음향 정보를 통해 사용자의 수면 상태 정보를 분석하기 위한 방법.
음향 정보를 통해 사용자의 수면 상태 정보를 분석하기 위한 방법에 있어서,

사용자의 수면과 관련한 시간 도메인상의 음향 정보를 획득하는 단계;

상기 음향 정보에 대한 전처리를 수행하는 단계; 및

상기 전처리된 정보를 딥러닝 모델의 입력으로 하여 수면 상태 정보 추출 또는 분류 중 적어도 하나를 수행하는 단계;

를 포함하며,

상기 딥러닝 모델은 라벨링이 되어 있지 않은 음향 정보에 대한 예측값을 슈도 라벨로 취급하여 상기 슈도 라벨을 기초로 학습된 것인,

음향 정보를 통해 사용자의 수면 상태 정보를 분석하기 위한 방법.
음향 정보를 통해 사용자의 수면 상태 정보를 분석하기 위한 방법에 있어서,

사용자의 수면과 관련한 시간 도메인상의 음향 정보를 획득하는 단계;

상기 음향 정보에 대한 전처리를 수행하는 단계; 및

상기 전처리된 정보를 딥러닝 모델의 입력으로 하여 수면 상태 정보 추출 또는 분류 중 적어도 하나를 수행하는 단계;

를 포함하며,

상기 딥러닝 모델은 상기 음향 정보에 기초하여 수면 이벤트를 추론하도록 학습 -상기 수면 이벤트 추론 학습 방법에서는 각 수면 이벤트 클래스의 불균형 문제를 해소하도록 클래스 가중치를 부여함- 된 것인,

음향 정보를 통해 사용자의 수면 상태 정보를 분석하기 위한 방법.
음향 정보를 통해 사용자의 수면 상태 정보를 분석하기 위한 방법에 있어서,

사용자의 수면과 관련한 시간 도메인상의 음향 정보를 획득하는 단계;

상기 음향 정보에 대한 전처리를 수행하는 단계; 및

상기 전처리된 정보를 딥러닝 모델의 입력으로 하여 수면 상태 정보 추출 또는 분류 중 적어도 하나를 수행하는 단계;

를 포함하며,

상기 딥러닝 모델은 상기 음향 정보에 기초하여 멀티 태스크 학습 -상기 멀티 태스크 학습을 위해서 상기 딥러닝 모델은 복수의 헤드를 갖는 구조를 가짐- 된 것인,

음향 정보를 통해 사용자의 수면 상태 정보를 분석하기 위한 방법.
제10항에 있어서,

상기 복수의 헤드에 포함되는 각각의 헤드는 복수의 태스크 중 서로 상이한 하나의 태스크를 수행하고,

상기 복수의 태스크는 멀티모달 학습, 수면 이벤트 분석, 수면 단계 분석 중 적어도 하나 이상을 포함하는 것을 특징으로 하는,

음향 정보를 통해 사용자의 수면 상태 정보를 분석하기 위한 방법.
음향 정보를 통해 사용자의 수면 상태 정보를 분석하기 위한 방법에 있어서,

사용자의 수면과 관련한 시간 도메인상의 음향 정보를 획득하는 제1 정보 획득 단계;

사용자의 수면과 관련한 사용자 수면 환경 정보를 획득하는 제2 정보 획득 단계;

상기 제1 정보와 상기 제2 정보를 멀티모달 데이터로 결합하는 단계;

상기 멀티모달 데이터를 멀티모달 학습된 딥러닝 모델의 입력으로 하여, 피처를 추출하는 단계; 및

상기 추출된 피처를 딥러닝 모델의 입력으로 하여 사용자의 수면 상태 정보를 획득하는 단계;

를 포함하는,

음향 정보를 통해 사용자의 수면 상태 정보를 분석하기 위한 방법.
음향 정보를 통해 사용자의 수면 상태 정보를 분석하기 위한 방법에 있어서,

사용자의 수면과 관련한 수면 음향 정보를 획득하는 제1 정보 획득 단계;

상기 획득된 제1 정보를 딥러닝 모델의 입력으로 하여, 제1 수면 상태 정보를 추론하는 단계;

사용자의 수면과 관련한 사용자 수면 환경 정보를 획득하는 제2 정보 획득 단계;

상기 획득된 제2 정보를 추론 모델의 입력으로 하여, 제2 수면 상태 정보를 추론하는 단계; 및

상기 추론된 제1 수면 상태 정보 및 상기 추론된 제2 수면 상태 정보를 결합하여 사용자의 수면 상태 정보를 획득하는 단계;

를 포함하는,

음향 정보를 통해 사용자의 수면 상태 정보를 분석하기 위한 방법.
음향 정보를 통해 사용자의 수면 상태 정보를 분석하기 위한 방법에 있어서,

사용자의 수면과 관련한 수면 음향 정보를 획득하는 제1 정보 획득 단계;

상기 획득된 제1 정보를 딥러닝 모델의 입력으로 하여 제1 수면 상태 정보를 추론하는 단계;

사용자의 수면과 관련한 사용자 수면 환경 정보를 획득하는 제2 정보 획득 단계; 및

상기 추론된 제1 수면 상태 정보와 상기 획득된 제2 정보를 결합하여 사용자의 수면 상태 정보를 획득하는 단계;

를 포함하는,

음향 정보를 통해 사용자의 수면 상태 정보를 분석하기 위한 방법.