CN104464741B - 一种音频信号转视觉颜色信息的方法及*** - Google Patents

一种音频信号转视觉颜色信息的方法及*** Download PDF

Info

Publication number
CN104464741B
CN104464741B CN201410833247.1A CN201410833247A CN104464741B CN 104464741 B CN104464741 B CN 104464741B CN 201410833247 A CN201410833247 A CN 201410833247A CN 104464741 B CN104464741 B CN 104464741B
Authority
CN
China
Prior art keywords
audio signal
brightness
frame
color
rgb
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410833247.1A
Other languages
English (en)
Other versions
CN104464741A (zh
Inventor
徐永键
陆许明
刘志敏
谭洪舟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SYSU HUADU INDUSTRIAL SCIENCE AND TECHNOLOGY INSTITUTE
Sun Yat Sen University
Original Assignee
SYSU HUADU INDUSTRIAL SCIENCE AND TECHNOLOGY INSTITUTE
Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SYSU HUADU INDUSTRIAL SCIENCE AND TECHNOLOGY INSTITUTE, Sun Yat Sen University filed Critical SYSU HUADU INDUSTRIAL SCIENCE AND TECHNOLOGY INSTITUTE
Priority to CN201410833247.1A priority Critical patent/CN104464741B/zh
Publication of CN104464741A publication Critical patent/CN104464741A/zh
Application granted granted Critical
Publication of CN104464741B publication Critical patent/CN104464741B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Auxiliary Devices For Music (AREA)
  • Spectrometry And Color Measurement (AREA)

Abstract

本发明提供一种音频信号转视觉颜色信息的方法及***,方法包括S1:对音频信号进行采样;S2:计算音频信号的亮度V;S3:计算音频信号的色相H和饱和度S;S4:将亮度V、色相H和饱和度S进行RGB颜色格式转换;S5:将S4中得到的RGB值进行颜色混合最终提取音频信号的颜色值。本发明通过将采集的音频信号量化处理,计算出其能量值来代表亮度,通过FFT处理来计算其代表的色相和饱和度,再将得到的亮度、色相和饱和度转换成RGB颜色格式,整个方法都是依据科学原理计算推演,过程都是一个的量化处理过程,没有人的主观意思的表达,科学严谨。

Description

一种音频信号转视觉颜色信息的方法及***
技术领域
本发明涉及音频信号处理领域,更具体地,涉及一种音频信号转视觉颜色信息的方法及***。
背景技术
音乐和美术都是艺术的重要组成部分。就像绘画需要各种颜色一样,音乐的音色也是多种多样的。在很早以前人们就把音乐的音色和颜色联系在一起,比如十七世纪的德国人基歇尔,他曾提出:音乐是光线的模仿,二者是可以互为表达的。后来这一理论由法国人卡斯特尔所证实,他在1720 年出版了《音乐与色彩》一书,并在1734年设计了一种“视觉哈普西科德”,即将音阶按光谱的位置排列分配,一个键连接一种颜色,按键演奏乐谱,光线就从透明色彩带传出。后来也有许多科学家、艺术家甚至是文学家把音乐和色彩联系在一起,1876年,当时著名音乐家波萨科特提出了一个音乐家们可以接受的比拟:弦乐、人声——黑色;铜管、鼓——红色;木管——蓝色。而指挥家高得弗来提出的见解是:长笛——蓝色;单簧管——玫瑰色;铜管——红色。这种比拟在当时得到更多人的赞同,但显然它是带有浓厚的个人主观色彩的。十八世纪伟大的科学家牛顿发现了光的粒子性,而后人们又发现了光的波动性,并通过三棱镜析出了七种颜色:红橙黄绿青蓝紫。这样一来,就有人将音乐中的七个音和这七种色彩联系起来,同样的这种对应关系显然是机械性的,并没有多大意义。
如今,人们对音乐和颜色的联系有了跟进一步的认识。北京中星微电子有限公司的一篇专利《一种音乐控制发光灯组的亮度和颜色的方法》中提到,通过建立查找表的方式建立音乐和色彩的联系,所述查找表的每一行均存储有一组发光灯的控制参数,所述发光灯的控制参数与多色发光灯组显示的颜色和亮度相对应。显然,这种对应关系是有限的,是一种不太严谨的对应规律。《哈尔滨理工大学学报》第6期第18卷的论文《基于音频信号频谱分析的混合光效设计与实现》中提到:“对于RGB混合光效,可以明显观测到在不同的频率下,不同的幅值下,光的颜色和光强各不相同,这就是利用了PWM的不同占空比形成的。”但它并没有详细分析音乐(音频信号)与颜色之间的具体的映射关系。基于以上分析,本发明根据模拟音频信号的时域和频域分析将从音乐中提取颜色信息,实现音乐的彩色化效果。
一直到现今大部分的艺术家都是根据人们的感情因素将音乐和颜色联系在一起的,但这是并没有一个有效的有规律的映射方法。随着科学技术发展,人们对声音和光有了新的认识,虽然声音属于机械波,光波属于电磁波,但它们都有波的一切特性,如:都能产生反射、折射、干涉、衍射等现象。另外,他们都具有波的一些基本属性,如:波速、波长、频率之间的关系,我们就会很容易地将声音的频率和光的频率联系在一起。比如,将人的耳朵能听到的声音的频率范围联系到可见光的频率范围,最典型的是从白色光中析出了七种色彩对应七个基本音阶,这种映射关系是有一定的道理,它大致符合了音色和颜色的对应关系,但这种映射关系是有限的,并不够严谨。
发明内容
本发明提供一种映射关系严谨的音频信号转视觉颜色信息的方法。
本发明的又一目的在于提供一种音频信号转视觉颜色信息的***。
为了达到上述技术目的,本发明的技术方案如下:
一种音频信号转视觉颜色信息的方法,包括以下步骤:
S1:对音频信号进行采样;
S2:计算音频信号的亮度V;
S3:计算音频信号的色相H和饱和度S;
S4:将亮度V、色相H和饱和度S进行RGB颜色格式转换;
S5:将S4中得到的RGB值进行颜色混合最终提取音频信号的颜色值。
进一步地,所述步骤S1中的音频信号包括模拟音频信号和数字音频信号;
对模拟音频信号进行采样的过程如下:
在单位时间T内采样N个点为一帧信号,N=2M,M为正整数;
对数字音频信号进行采样的过程如下:
对数字音频信号进行重采样,根据音频的采样率与重采样的频率选择增采样或减采样倍数,获取单位时间T内N个点为一帧的采样信号,N=2M,M为正整数。
进一步地,所述步骤S2中计算音频信号的亮度V的过程如下:
单位时间T内的音频信号的平均能量:
设音频信号的最大能量为Emax,一帧采样信号对应的亮度V:
进一步地,所述步骤S3的过程如下:
对采样后的音频信号进行实时FFT得到一帧音频信号的音频频谱,令一帧音频频谱中第i个采样点的频率为f i ,该采样点的色相H i 为:
令一帧音频频谱中幅度F的最大值是F max ,最小值是F min ,一帧音频频谱中第i个采样点的颜色饱和度S i 与幅度F i 的关系为:
进一步地,所述步骤S4的过程如下:
一帧音频频谱中第i个采样点的颜色向量 (Ri,Gi,Bi)为:
进一步地,所述步骤S5的过程如下:
一帧音频频谱中N个采样点的RGB的平均值为:
一种音频信号转视觉颜色信息***,包括:
信号采样模块,用于采集模拟音频信号或数字音频信号;
亮度值计算模块,用于计算采集到的音频信号的亮度值V;
色相和饱和度计算模块,用于计算采集到的音频信号的色相H和饱和度S;
HSV转RGB模块,用于将亮度V、色相H和饱和度S进行RGB颜色格式转换;
RGB颜色混合模块,用于将HSV转RGB模块中得到的得到的RGB值进行颜色混合最终提取音频信号的颜色值。
与现有技术相比,本发明技术方案的有益效果是:
本发明通过将采集的音频信号量化处理,计算出其能量值来代表亮度,通过FFT处理来计算其代表的色相和饱和度,再将得到的亮度、色相和饱和度转换成RGB颜色格式,整个方法都是依据科学原理计算推演,过程都是一个的量化处理过程,没有人的主观意思的表达,科学严谨。
附图说明
图1为本发明方法总流程图;
图2为本发明方法音频信号采样流程图;
图3为本发明方法求取音频信号色相和饱和度流程图;
图4为可见光谱与切割后的色相环对应图;
图5为本发明***结构图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例1
如图1所示,一种音频信号转视觉颜色信息的方法,包括以下步骤:
S1:对音频信号进行采样;
S2:计算音频信号的亮度V;
S3:计算音频信号的色相H和饱和度S;
S4:将亮度V、色相H和饱和度S进行RGB颜色格式转换;
S5:将S4中得到的RGB值进行颜色混合最终提取音频信号的颜色值。
本实施例中,如图2所示,步骤S1中的音频信号包括模拟音频信号和数字音频信号;
对模拟音频信号进行采样的过程如下:
在单位时间T内采样N个点为一帧信号,N=2 M M为正整数;
对数字音频信号进行采样的过程如下:
对数字音频信号进行重采样,根据音频的采样率与重采样的频率选择增采样或减采样倍数,获取单位时间T内N个点为一帧的采样信号,N=2 M M为正整数。
本实施例中,步骤S2中计算音频信号的亮度V的过程如下:
单位时间T内的音频信号的平均能量:
设音频信号的最大能量为Emax,一帧采样信号对应的亮度V:
本实施例中,如图3所示,步骤S3的过程如下:
对采样后的音频信号进行实时FFT得到一帧音频信号的音频频谱,针对实时采样的一帧N点信号u(n)进行FFT:
由于人的眼睛只能看见可见光谱,由红色变化到紫色波长范围约为780nm-380nm,对应频率范围是430THz-750THz。但是人眼能看到的颜色并不一定都落在可见光谱上,比如***,但它可以以红色(R)和蓝色(B)按照一定比例混合而成。为了能更好的反映可听声频率范围和可见光谱相对应的关系,以及可听声频率范围与可度量的色度的对应关系,如图4所示,本实施例将本来完整的色相环(0~360°)分割为对应0~270°色相,即从红色到紫色去掉了270°~360°的“红紫色部分”这样便符合可见光谱所具有的颜色。
令一帧音频频谱中第i个采样点的频率为f i,该采样点的色相H i 为:
令一帧音频频谱中幅度F的最大值是F max ,最小值是F min ,一帧音频频谱中第i个采样点的颜色饱和度S i 与幅度F i 的关系为:
本实施例中,RGB色彩模式是工业界的一种颜色标准,是通过对红(R)、绿(G)、蓝(B)三个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色的,RGB即是代表红、绿、蓝三个通道的颜色,这个标准几乎包括了人类视力所能感知的所有颜色,是目前运用最广的颜色***之一。
而HSV是基于人的眼睛对色彩的识别,是一种从视觉的角度定义的颜色模式。是将色彩分解为色调,饱和度及亮度。通过调整色调,饱和度及亮度得到颜色和变化。因此,本实施例将对音乐的直观感受与HSV模式的颜色联系在一起。但是为了能充分表达所有的组合颜色,同时为了方便以下所述的“颜色混合”,本实施例中将HSV模式转为工业界的颜色标准RGB颜色:
一帧音频频谱中第i个采样点的颜色向量 (Ri,Gi,Bi)为:
本实施例中,在单位时间内的音频信号所包含的不同的色相、饱和度、亮度的颜色信息进行颜色混合,一帧音频信号求N个点的RGB的平均值:
本方法通过将采集的音频信号量化处理,计算出其能量值来代表亮度,通过FFT处理来计算其代表的色相和饱和度,再将得到的亮度、色相和饱和度转换成RGB颜色格式,整个方法都是依据科学原理计算推演,过程都是一个的量化处理过程,没有人的主观意思的表达,科学严谨。
实施例2
如图5所示,一种音频信号转视觉颜色信息***,包括:
信号采样模块,用于采集模拟音频信号或数字音频信号;
亮度值计算模块,用于计算采集到的音频信号的亮度值V;
色相和饱和度计算模块,用于计算采集到的音频信号的色相H和饱和度S;
HSV转RGB模块,用于将亮度V、色相H和饱和度S进行RGB颜色格式转换;
RGB颜色混合模块,用于将HSV转RGB模块中得到的得到的RGB值进行颜色混合最终提取音频信号的颜色值。
相同或相似的标号对应相同或相似的部件;
附图中描述位置关系的用于仅用于示例性说明,不能理解为对本专利的限制;
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (4)

1.一种音频信号转视觉颜色信息的方法,其特征在于,包括以下步骤:
S1:对音频信号进行采样;
S2:计算音频信号的亮度V;
S3:计算音频信号的色相H和饱和度S;
S4:将亮度V、色相H和饱和度S进行RGB颜色格式转换;
S5:将S4中得到的RGB值进行颜色混合最终提取音频信号的颜色值;
其中,音频信号包括模拟音频信号和数字音频信号;
对模拟音频信号进行采样的过程如下:
在单位时间T内采样N个点为一帧信号,N=2M,M为正整数;
对数字音频信号进行采样的过程如下:
对数字音频信号进行重采样,根据音频的采样率与重采样的频率选择增采样或减采样倍数,获取单位时间T内N个点为一帧的采样信号,N=2M,M为正整数;
音频信号的亮度V的过程如下:
单位时间T内的音频信号的平均能量:
其中,u(n)是采样的一帧N点信号;
设音频信号的最大能量为Emax,一帧采样信号对应的亮度V:
对采样后的音频信号进行实时FFT得到一帧音频信号的音频频谱,令一帧音频频谱中第i个采样点的频率为f i ,该采样点的色相Hi为:
令一帧音频频谱中幅度F的最大值是Fmax,最小值是Fmin,一帧音频频谱中第i个采样点的颜色饱和度Si与幅度Fi的关系为:
2.根据权利要求1所述的音频信号转视觉颜色信息的方法,其特征在于,所述步骤S4的过程如下:
一帧音频频谱中第i个采样点的颜色向量 (Ri,Gi,Bi)为:
3.根据权利要求2所述的音频信号转视觉颜色信息的方法,其特征在于,所述步骤S5的过程如下:
一帧音频频谱中N个采样点的RGB的平均值为:
4.一种实现如权利要求1-3任一项所述的音频信号转视觉颜色信息方法的***,其特征在于,包括:
信号采样模块,用于采集模拟音频信号或数字音频信号;
亮度值计算模块,用于计算采集到的音频信号的亮度值V;
色相和饱和度计算模块,用于计算采集到的音频信号的色相H和饱和度S;
HSV转RGB模块,用于将亮度V、色相H和饱和度S进行RGB颜色格式转换;
RGB颜色混合模块,用于将HSV转RGB模块中得到的得到的RGB值进行颜色混合最终提取音频信号的颜色值。
CN201410833247.1A 2014-12-29 2014-12-29 一种音频信号转视觉颜色信息的方法及*** Active CN104464741B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410833247.1A CN104464741B (zh) 2014-12-29 2014-12-29 一种音频信号转视觉颜色信息的方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410833247.1A CN104464741B (zh) 2014-12-29 2014-12-29 一种音频信号转视觉颜色信息的方法及***

Publications (2)

Publication Number Publication Date
CN104464741A CN104464741A (zh) 2015-03-25
CN104464741B true CN104464741B (zh) 2018-04-06

Family

ID=52910686

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410833247.1A Active CN104464741B (zh) 2014-12-29 2014-12-29 一种音频信号转视觉颜色信息的方法及***

Country Status (1)

Country Link
CN (1) CN104464741B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105205304A (zh) 2015-06-30 2015-12-30 胡国生 音乐色彩通感可视化方法
CN108541098B (zh) * 2018-01-29 2019-12-27 杭州电子科技大学 基于音频差异值提取色调方法的音乐灯光***
CN112857560B (zh) * 2021-02-06 2022-07-22 河海大学 一种基于声音频率的声学成像方法
CN113766695A (zh) * 2021-08-25 2021-12-07 北京奕斯伟计算技术有限公司 Led灯的亮度控制方法、芯片及***
CN114416610B (zh) * 2021-12-02 2023-11-10 深圳市乐升半导体有限公司 Pwm信号生成方法、芯片和电子设备
CN114828337B (zh) * 2022-07-01 2022-09-27 杭州罗莱迪思科技股份有限公司 户外led染色灯控制方法及其应用

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1229759C (zh) * 1999-08-18 2005-11-30 哈茉尼彩色音技术开发公司 声音颜色的互换方法与装置及选择音源位置的方法和装置
CN1977569A (zh) * 2004-06-30 2007-06-06 皇家飞利浦电子股份有限公司 来自视频内容的环境照明和伴随受感知规律和用户偏好影响的发射
CN101916569A (zh) * 2010-08-03 2010-12-15 北京中星微电子有限公司 一种显示声音的方法和装置
CN102096822A (zh) * 2010-12-24 2011-06-15 华为终端有限公司 颜色识别方法和装置
CN102289778A (zh) * 2011-05-10 2011-12-21 南京大学 一种图像至音乐的转换方法
CN103685683A (zh) * 2012-09-03 2014-03-26 中兴通讯股份有限公司 语音涂鸦的实现方法、装置以及终端
JP2014095905A (ja) * 2013-12-04 2014-05-22 Seiko Epson Corp 表示装置、プログラムおよび情報記憶媒体

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080183474A1 (en) * 2007-01-30 2008-07-31 Damion Alexander Bethune Process for creating and administrating tests made from zero or more picture files, sound bites on handheld device

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1229759C (zh) * 1999-08-18 2005-11-30 哈茉尼彩色音技术开发公司 声音颜色的互换方法与装置及选择音源位置的方法和装置
CN1977569A (zh) * 2004-06-30 2007-06-06 皇家飞利浦电子股份有限公司 来自视频内容的环境照明和伴随受感知规律和用户偏好影响的发射
CN101916569A (zh) * 2010-08-03 2010-12-15 北京中星微电子有限公司 一种显示声音的方法和装置
CN102096822A (zh) * 2010-12-24 2011-06-15 华为终端有限公司 颜色识别方法和装置
CN102289778A (zh) * 2011-05-10 2011-12-21 南京大学 一种图像至音乐的转换方法
CN103685683A (zh) * 2012-09-03 2014-03-26 中兴通讯股份有限公司 语音涂鸦的实现方法、装置以及终端
JP2014095905A (ja) * 2013-12-04 2014-05-22 Seiko Epson Corp 表示装置、プログラムおよび情報記憶媒体

Also Published As

Publication number Publication date
CN104464741A (zh) 2015-03-25

Similar Documents

Publication Publication Date Title
CN104464741B (zh) 一种音频信号转视觉颜色信息的方法及***
CN1229759C (zh) 声音颜色的互换方法与装置及选择音源位置的方法和装置
CN107437073A (zh) 基于深度学习与生成对抗网路的人脸肤质分析方法及***
CN102123546A (zh) 一种全彩声光转换控制方法及***
CN107204034B (zh) 一种图像处理方法及终端
CN105657901B (zh) 音视频信号及灯光控制***
EA200600324A1 (ru) Система и способ для совместной визуализации множества атрибутов в реальном масштабе времени
CN102231281B (zh) 基于集成特征和神经网络的语音可视化方法
CN109640465A (zh) 自动识别音乐的灯光控制方法、装置、设备及存储介质
WO2017119915A1 (en) Method and apparatus for converting audio data into a visual representation
CN109886214A (zh) 一种基于图像处理的鸟鸣声特征强化方法
KR20150112048A (ko) 모바일 앱 기반의 실시간 영상의 배경음악 생성방법
CN108960250A (zh) 图像至旋律的转换方法、装置与计算机可读存储介质
CN105810226B (zh) 一种控制音乐表现效果的方法和***
CN108459714A (zh) 基于mi和ssvep双范式的少通道异步控制脑机接口***
CN108541098A (zh) 基于音频差异值提取色调方法的音乐灯光***
Bologna et al. On the use of the auditory pathway to represent image scenes in real-time
CN107742280A (zh) 一种图像锐化方法及装置
CN105678208B (zh) 提取人脸纹理的方法及装置
Bologna et al. Blind navigation along a sinuous path by means of the See ColOr interface
CN102820037A (zh) 基于组合特征的汉语声韵母可视化方法
Pun et al. Sonification of colour and depth in a mobility aid for blind people
EP3678369A1 (en) Image processing method and device
CN107423765A (zh) 基于稀疏编码反馈网络的自底而上显著目标检测方法
CN205902039U (zh) 一种亮度随音乐律动的发光线

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant