| 一种图像向音乐转化的方法 |
| 类别:消费电子 |
| 作者:北京航空航天大学电子工程系(100083)
毛 峡
丁玉宽 田 耕 来源:《电子技术应用》
一种图像向音乐转化的方法 摘 要 对图像与音乐之间的映射关系及映射规律进行了探讨 利用图像与音乐之间的对应关系 根据一定的科学与艺术规则 提出相应的算法将图像的原始信息转化为MIDI音乐。 关键词 图像 音乐 图像向音乐转化 同构联觉 MIDI音乐 自古以来书画和音乐就是一对孪生姐妹,当人们陶醉于世界大师笔下的美术与摄影作品的水墨丹青之时,一首基于该作品的美妙音乐似乎就萦绕在耳旁。例如,在欣赏“奔腾黄河”的画卷时,人们似乎能听到黄河的咆哮声;在欣赏“山林晨曲”的画卷时,人们又好象听到了山间小溪的潺潺流水声、林中小鸟委婉动听的歌唱声。本研究受以上联想的启发,根据一定的科学与艺术规则,探索图像与音乐之间的映射关系和映射规律,将图像信息转化为MIDI音乐,使人们第一次感受到“听画”的惊喜 1 图像与音乐的对应关系
无论是西方社会还是东方社会,都有人把音乐与颜色对应起来。例如,早在十七世纪物理学家牛顿就曾以赤、橙、黄、绿、青、蓝、紫对应于C、D、 音乐是在时间中展开、以诉诸听觉的声音为基本材料的艺术。因此时间及表示声音基本特征的音调、音强、音色就构成了音乐的基本要素。在人的体验中,听觉的高频音和视觉中明亮的色调具有一种潜在的联系,这种联系给人以“上升的感觉”;反之,听觉中的低频音与视觉中黑暗的色调由于与“下沉的感觉”相类似而被联系在一起。音调越‘低沉’,体验到的颜色越‘深’;反之,较‘高’的音调会引起‘浅’亮的感觉。因此可以看出,音乐与颜色有着明显的直觉类比关系。因此直觉体验方向上的相同就使不同感觉视觉与听觉之间发生同构联觉。
图像向音乐转化的系统框图如图1所示,首先将图像文件中的数据读入文本文件;再对文本文件中的数据进行处理;然后将处理后的数据转化成规定好的“音乐符号”;最后将“音乐符号”转换成MIDI音乐。 由于音乐与颜色之间存在直觉类比关系,所以本文中图像信息向音乐的转换不是指通常意义上的多媒体技术,而是利用图像与音乐之间的对应关系,根据一定的科学与艺术规则提出相应的算法,对图像的原始信息进行处理后转化为MIDI音乐。 2.1 图像数据的读取与颜色模型 本论文是用24位真彩BMP文件格式存放图像RGB的灰度值,但由于HSV(色彩H、饱和度S、明度V)模型是直接与艺术家使用颜色的直观表现相联系的,所以为了更贴近人的感觉,本系统进行处理的图像数据采用的是颜色模型HSV中的色彩(H)信息。这里通过式(1)所示的RGB模型与HSV模型之间的转换关系式将RGB模型的灰度值数据转换为HSV模型的数据。
图像与音乐的最大区别是:图像是在二维空间展开,而音乐则是一维时基类媒体中展开的。由于音符必须有一个时间延续方向才能组成乐曲,所以按照大多数人欣赏书画的习惯,本论文采用图像的纵向(由上而下)为数据的处理方向,即为音乐的前进方向。
2.2 图像数据处理 根据图像中的色彩与音乐中的音调的对应关系,考虑到图像各部分色彩的过渡性及色彩过渡的模糊性,即相邻像素间的相关性和图像界限的不确定性,以及14个可用的标准MIDI通道(共有16个通道,其中两个为其它特殊用途)。将图像在横向上近似平均分成14个部分(每个部分都有n列像素),将图像的色彩数据进行处理。首先将第1部分的各列数据按列求算术平均值后,作为第1列数据;然后将第1、2两部分数据求算术平均值后作为第2列数据;再将第1、2、3三部分数据求算术平均值后作为第3列数据;依此类推···,将图像中所有列数据求算术平均值后得到第14列数据。即第i列第j行数据为 2.3 数据向音符的转化
参照钢琴的键盘将音调分为高、中、低三个音区,规定用“c、d、e、f、g、a、b”表示低音区的七个音名;用“1、2、3、4、5、6、7”表示中音区的七个音名;用“C、D、E、F、G、A、B”表示高音区的七个音名。在音名前的“/”表示升八度;“\”表示降八度;空白则表示不升也不降。紧跟音名后的“b”表示降半音;“#”表示升半音。从低到高依次分为大字二组、大字一组、大字组、小字组、小字一组、小字二组、小字三组、小字四组、小字五组等九个音组。除了大字二组仅含有三种音调与小字五组仅含有一种音调之外,其余七组均含有七个基本音(钢琴的白键)和五个半音(钢琴的黑键)等十二种音调。又由于有些音如“c”,它的升半音“#c”与其相邻音“d”的降半音“bd”相同。所以我们统一规定均用前一个音的升半音表示。则一组完整的音组就由“1、2、3、4、5、6、7”七个全音加上“#1、#2、#4、#5、#6”五个半音组成。这样就可以将音符和图像色彩对应起来:
式中Ton:音调;Hun:像素的色彩值;MaxHue:所有像素色彩值中的最小值MaxHue:所有像素色彩值中的最大值。
节奏是音乐中的重要要素,它涉及与“时间”有关的所有因素,是音在强弱和长短两方面千变万化的组织形态 式中:Speed:节奏速度Difference:相邻两元素色彩差值的绝对值;MinDifference:相邻两元素色彩差值绝对值中的最小值;MaxDifference:相邻两元素色彩的差值绝对值中的最大值。 节拍采用对音长进行分类统计的算法来确定,几分音符的数量最多,就规定几分音符为一拍。
每分钟节拍数,即演奏速度与每列数据的变化快慢也有很大关系,所以我们统计出所有相邻列数据的差,找出最大差值(MaxSpeed),最小差值(MinSpeed)以及数目最多的差值(Flag)。采用式(5)进行转换:
2.4 音符文本向MIDI音乐的转化 由于MIDI文件包含头块和音轨块两部分(5),其格式一般如下: MIDI文件头结构 struct MH { char MIDIld long length 头块结构信息长度 int format; 存放的格式 int nTracks; 音轨数目 int PerPaiNum; 每节计数器值 }; 音轨头结构 struct TH { char Trackld long length; 信息长度 } 按照MIDI文件格式的规定,将音符翻译成MIDI事件代码,加上文件头和音轨头,写入MIDI文件,加上适当的硬件设备就可将其播放出来。 本研究初步探索出了图像与音乐之间的映射关系和映射规律,提出了一种图像向音乐转化的算法,对图像向音乐的转化进行了大胆的尝试,使人们用听觉感受到了视觉享受的效果。再则本研究还具有广阔的应用领域,例如,“听名画”、“听名景”将可能成为21世纪的一种高雅文化;另外由于MIDI文件容量较小,随着世界网络化的不断发展,图像情报的音乐加密可以作为一种很好的加密手段。
|
- 电容补偿在低压配电..
- 2008-1-21
- 基于CH365芯片..
- 2008-1-9
- 基于NDK的数字电..
- 2007-12-3
- 基于SAA7214..
- 2007-11-5
- Java虚拟机应用..
- 2007-11-1
- 西门子在烟草制丝电..
- 2007-10-29
- 现代电子技术
- 2007-10-29
- 西门子公司及其高中..
- 2007-10-27
- SIMATICPC..
- 2007-10-22
- 蓝牙与红外线的区别
- 2007-8-30
- LM4610及其应用
- 2007-8-9
- 闭路电视数字视频编..
- 2007-8-9
- SRS 3D立体声..
- 2007-8-7
- 一种面向DVB-C..
- 2007-8-9
- 基于DSP的H.3..
- 2007-8-9
- 全数字化语言教学实..
- 2007-8-9
- 电子快门含集成电路..
- 2007-7-29
- D类功放控制IC芯..
- 2007-8-9
- DTMF电话语音接..
- 2007-8-9
- 基于DSP的广播级..
- 2007-8-9




2
图像向音乐的转化