CN101656837A - 可携式电子装置及其影像与音频数据合成方法 - Google Patents
可携式电子装置及其影像与音频数据合成方法 Download PDFInfo
- Publication number
- CN101656837A CN101656837A CN200810042014A CN200810042014A CN101656837A CN 101656837 A CN101656837 A CN 101656837A CN 200810042014 A CN200810042014 A CN 200810042014A CN 200810042014 A CN200810042014 A CN 200810042014A CN 101656837 A CN101656837 A CN 101656837A
- Authority
- CN
- China
- Prior art keywords
- image
- voice data
- portable electronic
- electronic devices
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Mobile Radio Communication Systems (AREA)
Abstract
本发明揭露一种可携式电子装置,其包含一储存单元、一操作接口、一辨识单元以及一处理单元。储存单元用以储存至少一影像数据及至少一音频数据,操作接口用以对上述影像数据及音频数据进行选择。辨识单元用以将所选的音频数据转换成一文字信息,而处理单元合成上述文字信息及所选的影像数据以产生一合成影像。因此,本发明的可携式电子装置,例如手机或数码相机,可将所录制或所通讯的音频数据转换为文字信息,并合成于影像数据之中,进而达到提升可携式电子装置的数据储存量,以及快速为影像数据加注文字信息的功效。
Description
【技术领域】
本发明是有关于一种可携式电子装置及其影像与音频数据合成方法,特别是有关于一种在可携式装置上方便于影像上标注文字的技术领域。
【背景技术】
人们旅游并且拍照,用图片记载着生活的点点滴滴。当人们出门旅行并沿途纪录当地风景之后,很有可能希望在照片上附加拍摄地点等信息。此外,当人们取得一张图片时,例如新闻图片、艺术照片、或医疗用的X-光片,也需要在图片上加注适当的说明。而目前在实体图片上加注说明的方式,往往是在实体图片之上或背面,以书写的方式为之。在电子图片上加注说明的方式,则往往必须透过触控板、键盘输入等手动方式为之。
此外,一般人使用手机等通讯装置与其它人进行沟通时,是通过通话者传送音频数据的方式给接收者来进行通话。而有时候通话传送的音频数据内容为简单的数字和文字信息,如电话号码、识别号码、密码、及地址等信息。而目前使用的通讯装置,对于上述的音频数据并无法有效的加以记录,而使得通话者及接收者必须使用纸笔的方式记录上述的信息。若通话者及接收者忘记携带纸笔时,将无法纪录上述的信息,使得目前使用的通讯装置实用性大打折扣。
为此,目前市面上有业者提供可录制音频的通讯装置,提供使用录制上述的数字和文字信息,但受限于通讯装置内建储存内存或硬盘容量的大小,无法进行长时间的录制,导致此可录制音频的通讯装置于实用上受到限制。因此,若将上述的口述内容辨识技术引入通讯装置,应可大幅提升储存内存或硬盘容量的使用效率。
有鉴于现有技朮的各项问题,为了能够兼顾解决之,本发明人基于多年研究开发与诸多实务经验,提出一种可携式电子装置及其影像与音频数据合成方法,以作为改善上述缺点的实现方式与依据。
【发明内容】
本发明的主要目的就是在于提供一种可携式电子装置及其影像与音频数据合成方法,其利用语音内容辨识技术的方式来为电子图片加注说明,以提高操作便利性。
根据本发明的主要目的,提出一种可携式电子装置,其包含一储存单元、一操作接口、一辨识单元以及一处理单元。储存单元用以储存至少一影像数据及至少一音频数据,操作接口用以对上述影像数据及音频数据进行选择;辨识单元用以将所选的音频数据转换成一文字信息,处理单元用以合成上述文字信息及所选的影像数据以产生一合成影像。
此外,本发明更提出一种影像与音频数据合成方法,其包含下列步骤,首先透过一影像获取单元自外部获取一影像数据。然后,透过一麦克风自外部接收一声音。然后,利用一录音单元将此声音转换为一音频数据。之后,再将前述音频数据转换为一文字信息。最后,合成文字信息于影像数据之中以产生一合成影像。
此外,本发明再提出一种影像与音频数据合成方法,其包含下列步骤,首先,自一储存单元中取得一所选影像。然后,透过一无线通讯单元自外部接收一无线信号。然后,利用一录音单元将上述无线信号转换为一音频数据。然后,利用一操作接口自上述音频数据中获取一音频片段。然后,将上述音频片段转换为一文字信息。最后,合成上述文字信息与上述所选图片以产生一合成影像。
与现有技朮相比较,依本发明的可携式电子装置及其影像与音频数据合成方法,可以直接将使用者口述的一段话,转换为文字格式,并附加于一数字影像之上。因此,本发明可通过辨识单元将音频数据转换成文字信息,由于在相同信息量的文字信息与音频数据相比较下,文字信息所需的储存空间远小于音频数据所需的储存空间,因此,本发明的可携式电子装置亦可储存更多信息量。此外,本发明的可携式电子装置亦可透过口述的方式,为一段影像附加旁白或字幕,进而达到快速编辑一数字影像的目的。
【附图说明】
图1是本发明的可携式电子装置的方块图;
图2是本发明的可携式电子装置的实施例的方块图;
图3是本发明的合成影像的范例的示意图;
图4是本发明的合成影像的另一范例的示意图;
图5是本发明的影像与音频数据合成方法的步骤流程图;以及
图6是本发明的影像与音频数据合成方法的另一步骤流程图。
【具体实施方式】
以下将参照相关图式,说明依本发明较佳实施例的可携式电子装置及其影像与音频数据合成方法,为使便于理解,下述实施例中的相同组件以相同的符号标示来说明。
请参阅图1,其为本发明的可携式电子装置的功能方块图。本发明的可携式电子装置100包含一储存单元110、一操作接口120、一辨识单元130以及一处理单元150。储存单元110用以储存至少一影像数据111及至少一音频数据112,操作接口120用以对上述影像数据111及音频数据112进行选择。辨识单元130用以将所选的音频数据112转换成一文字信息140,处理单元150用以合成上述文字信息140及所选的影像数据111以产生一合成影像151。因此,本发明的可携式电子装置100可将音频数据112转换为文字信息140,并合成于影像数据111之中,进而达到提升可携式电子装置100的数据储存量,以及快速为影像数据111加注文字信息140的功效。影像数据111可为一静态图片、一动态图片或一视频(video)。
其中,可携式电子装置100更可包含一影像获取单元,用以自外部获取影像作为影像数据111;亦或,可携式电子装置100更可包含一麦克风及一录音单元,用以自外部接收一声音来录制成音频数据112;亦或,可携式电子装置100更可包含一无线通讯单元及一录音单元,用以自外部接收一无线信号来录制成音频数据112。
请继续参阅图2,其为本发明的可携式电子装置的实施例的方块图。在此实施例中,可携式电子装置101包括一麦克风113及一录音单元114。麦克风113可接收使用者的口述旁白,或使用者想输入此可携式电子装置100的声音。而录音单元114则将收到的声音转换为音频数据112,然后储存在储存单元110之中。而上述的音频数据112可为一包含数字和文字等信息的电话号码、一个人识别号、一密码或一地址等信息。辨识单元130较佳的是以一音源/音效处理应用程序的软件方式来实现,或采用具有语音辨识功能的单芯片来实现。因此,辨识单元130可以透过波形比对等方式将音频数据112转换为一文字信息140。因此,透过辨识单元130的口述内容辨识(Speech To Text)功能,本发明的可携式电子装置100可储存更多信息量。此外,辨识单元130更可过滤音频资料112的背景声音,进而避免背景音乐或噪声干扰文字信息的辨识度,例如仅采样频率介于OHz到4kHz的人声。
本发明的可携式电子装置101视需要更可包含一无线通讯单元115。并透过无线通讯单元115来接收一无线信号,然后再用录音单元114来将无线信号转换为音频数据112,再储存于储存单元110之中。因此,本发明的可携式电子装置101可为一可携式通讯装置、一个人数字助理(Personal digital assistant,PDA)、一MP3播放机或其它类似装置。
从另一个角度观之,本发明的可携式电子装置100的实施例中更可包含一影像获取单元116。影像获取单元116用以自外部获取多个影像来做为影像数据111,并将这些影像数据111储存于储存单元110。影像获取单元116可包含一镜头117及一传感器118,由镜头117接收外部环境的光学信号,再由传感器118将光学信号转换成电子信号,因此来获取外部环境的影像。其中,传感器118可为一CCD传感器或一CMOS传感器。因此,本发明的可携式电子装置100的实施例中亦可为一数码相机或一摄影机。
承上所述,本发明的可携式电子装置100于一实施例中亦可为一行动数字电视。此时,无线通讯单元115可包含一数字电视信号接收芯片,以符合美规的ATSC8-VSB无线数字电视传输标准、欧规的DVB-T COFDM无线数字电视传输标准或日规的ISDB-T COFDM无线数字电视传输标准;并透过内建的影像获取单元116来获取正在播放的图框(Frame)。因此,本发明的可携式电子装置100可以适当的获取影像数据111及音频数据112,并透过辨识单元130将音频数据112转换为文字信息140,再将文字信息140与影像数据111合成为合成影像151。因此,使用者可以在一段时间之后,再透过合成影像151来进行回忆或追踪此影像数据111的出处。
此外,操作接口120可包括一音频触发单元121,音频触发单元121可于被触发后开始选择上述的音频数据112。举例而言,音频触发单元121可为一弹簧按钮开关,并于使用者压下弹簧按钮开关后,开始节录音频数据112,当使用者放开弹簧按钮开关后,则中止节录音频资料112,因此,使用者可以从音频数据112中选择所需的片段来进行语音辨识。
此外,本发明的可携式电子装置100亦可以应用于视频字幕的制作。当影像数据111为一视频(video)时,则文字信息140可以字幕方式与视频相结合。因此,本发明的可携式电子装置100可以透过口述的方式,为一段影像附加旁白或字幕,进而达到快速编辑一段影像的目的。
此外,本发明的可携式电子装置101更可包含一编辑单元160,以进一步编辑合成影像151。举例而言,请参考图3,其为本发明一实施例的合成影像的示意图。图中,合成影像200包含一影像信息210及一文字信息220。而文字信息220与影像信息210的相对位置可以预设为文字信息220在影像信息210之上或之下,亦可以透过编辑单元160修改默认值、加入其它参数或小图示(icon)、修改亮度及彩度等。
举例而言,请参考图4,当使用者已将一第一文字信息320与一影像信息310合成为一合成影像200后;可再将合成影像200当作影像信息310,再与第二文字信息330合成,来产生合成影像300。此时,使用者可透过编辑单元160预先设定第一文字信息320、第二文字信息330与影像信息310的相对位置。
归纳上述,本发明的可携式电子装置100,通过辨识单元130将音频数据112转换成文字信息140,不但可准确纪录音频数据112,也可方便使用者不须用纸笔的方式记录音频数据112。且本发明的可携式电子装置100,由于文字信息140所需的储存容量远小于音频数据112所需的储存容量,所以能储存更多音频数据112所包括的信息量。更进一步的说,本发明的可携式电子装置100,可避免使用者使用纸张记录个人机密数据,如账号,密码,及识别号码等信息时,会因不慎漏失纸张而造成秘密外泄。
请参阅图5,其为本发明的影像与音频数据合成方法的步骤流程图。图中,此方法包含下列步骤:首先,如步骤S11所示,透过一影像获取单元自外部获取一影像数据。然后,如步骤S12所示,透过一麦克风自外部接收一声音。然后,如步骤S13所示,利用一录音单元将此声音转换为一音频数据。之后,如步骤S14所示,再将前述音频数据转换为一文字信息。最后,如步骤S15所示,合成文字信息于影像数据之中以产生一合成影像。
此外,本发明的影像与音频数据合成方法于一实施例中,更包括将音频数据纪录于一储存单元之中。而且,上述的影像获取单元至少包含一镜头及一传感器;亦即,此影像获取单元较佳可为一摄影机。此外,为了提升文字辨识度,本实施例更包括过滤音频资料的背景声音,而仅聚焦于人声辨识。最后,本实施例更可利用一编辑单元来编辑视频字幕,以收尽善尽美之效。
因此,本发明的影像与音频数据合成方法可较佳地应用于广播教育。亦即,本发明的影像与音频数据合成方法可透过摄影机取得教学画面,并透过麦克风取得与教学画面相关的讲解内容。再透过辨识单元快速地将讲解内容转换为文字信息,并附加于教学画面之上。
请继续参考图6,其为本发明的影像与音频数据合成方法的另一步骤流程图。其包含下列步骤:首先,如步骤S21所示,自一储存单元中取得一所选影像。然后,如步骤S22所示,透过一无线通讯单元自外部接收一无线信号。然后,如步骤S23所示,利用一录音单元将上述无线信号转换为一音频数据。然后,如步骤S24所示,利用一操作接口自上述音频数据中获取一音频片段。然后,如步骤S25所示,将上述音频片段转换为一文字信息。之后,如步骤S26所示,合成上述文字信息与上述所选影像以产生一合成影像。最后,如步骤S27所示,再储存上述的合成影像。
承上所述,本发明的影像与音频数据合成方法于一实施例中,上述的操作接口更包括一音频触发单元,音频触发单元可于被触发后开始节录音频数据,并于终止触发后取得音频片段,因此节录使用者真正想要的音频片段。因此,音频触发单元较佳可为一弹簧按钮开关。此外,本实施例更包括利用一影像获取单元来自外部获取多个图片,并将这些图片储存于储存单元之中。影像获取单元至少包含一镜头及一传感器,传感器可采用CCD传感器或CMOS传感器。为了提升文字辨识度,本实施例更包括过滤音频片段的背景声音,进而避免背景音乐或噪声干扰文字信息的辨识度。最后,本实施例更包括利用一编辑单元来编辑合成影像,以收图文并茂之功。
Claims (20)
1.一种可携式电子装置,其特征在于包含:
一储存单元,用以储存至少一影像数据及至少一音频数据;
一操作接口,用以对该影像数据及该音频数据进行选择;
一辨识单元,用以将该所选的音频数据转换成一文字信息;以及
一处理单元,用以合成该文字信息及该所选的影像数据以产生一合成影像。
2.根据权利要求1所述的可携式电子装置,其特征在于:更包括一麦克风及一录音单元,该麦克风用以自外部接收一声音,该录音单元将该声音转换为该音频数据,并储存于该储存单元之中。
3.根据权利要求1所述的可携式电子装置,其特征在于:更包括一无线通讯单元及一录音单元,该无线通讯单元用以自外部接收一无线信号,该录音单元将该无线信号转换为该音频数据,并储存于该储存单元之中。
4.根据权利要求3所述的可携式电子装置,其特征在于:该可携式电子装置为一可携式通讯装置。
5.根据权利要求1所述的可携式电子装置,其特征在于:更包括一影像获取单元,用以自外部获取该若干影像数据。
6.根据权利要求5所述的可携式电子装置,其特征在于:该影像获取单元包含一镜头及一传感器。
7.根据权利要求5所述的可携式电子装置,其特征在于:该可携式电子装置为一数码相机或一摄影机。
8.根据权利要求1所述的可携式电子装置,其特征在于:其中该操作接口包括一音频触发单元,一使用者可透过触发该音频触发单元自该音频数据中获取一音频片段。
9.根据权利要求8所述的可携式电子装置,其特征在于:该音频触发单元可为一弹簧按钮开关。
10.根据权利要求1所述的可携式电子装置,其特征在于:其中若该影像数据为一视频(video),则该文字信息可以字幕方式或跑马灯方式与该视频结合。
11.根据权利要求1所述的可携式电子装置,其特征在于:其中该辨识单元更可过滤该音频资料的一背景声音。
12.根据权利要求1所述的可携式电子装置,其特征在于:更包括一编辑单元,以编辑该合成影像。
13.一种影像与音频数据合成方法,其特征在于包含下列步骤:
透过一影像获取单元自外部获取一影像数据;
透过一麦克风自外部接收一声音;
利用一录音单元将该声音转换为一音频数据;
将该音频数据转换为一文字信息;以及
合成该文字信息于该影像数据以产生一合成影像。
14.根据权利要求13所述的影像与音频数据合成方法,其特征在于:该影像获取单元包含一镜头及一传感器。
15.根据权利要求13所述的影像与音频数据合成方法,其特征在于:更包括过滤该音频资料的一背景声音。
16.一种影像与音频数据合成方法,其特征在于包含下列步骤:
自一储存单元中取得一所选影像;
透过一无线通讯单元自外部接收一无线信号;
利用一录音单元将该无线信号转换为一音频数据;
利用一操作接口自该音频数据中获取一音频片段;
将该音频片段转换为一文字信息;以及
合成该文字信息与该所选影像以产生一合成影像。
17.根据权利要求16所述的影像与音频数据合成方法,其特征在于:该操作接口包括一音频触发单元,当该音频触发单元被触发后该音频数据方开始节录,并于终止触发后取得该音频片段。
18.根据权利要求17所述的影像与音频数据合成方法,其特征在于:该音频触发单元可为一弹簧按钮开关。
19.根据权利要求16所述的影像与音频数据合成方法,其特征在于:更包括利用一影像获取单元自外部获取若干图片,并将该若干图片储存于该储存单元。
20.根据权利要求19所述的影像与音频数据合成方法,其特征在于:该影像获取单元包含一镜头及一传感器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810042014A CN101656837A (zh) | 2008-08-22 | 2008-08-22 | 可携式电子装置及其影像与音频数据合成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810042014A CN101656837A (zh) | 2008-08-22 | 2008-08-22 | 可携式电子装置及其影像与音频数据合成方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101656837A true CN101656837A (zh) | 2010-02-24 |
Family
ID=41710898
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200810042014A Pending CN101656837A (zh) | 2008-08-22 | 2008-08-22 | 可携式电子装置及其影像与音频数据合成方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101656837A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103338330A (zh) * | 2013-06-18 | 2013-10-02 | 腾讯科技(深圳)有限公司 | 一种图像处理方法、装置和终端 |
CN103346955A (zh) * | 2013-06-18 | 2013-10-09 | 腾讯科技(深圳)有限公司 | 一种图像处理方法、装置及终端 |
CN103702168A (zh) * | 2013-12-12 | 2014-04-02 | 乐视网信息技术(北京)股份有限公司 | 一种显示视频列表的方法及视频客户端 |
CN103810610A (zh) * | 2012-11-08 | 2014-05-21 | 叶宏尧 | 数字影音处理装置及其数字伴唱机服务帐户*** |
WO2015196552A1 (zh) * | 2014-06-23 | 2015-12-30 | 中兴通讯股份有限公司 | 一种消息处理方法、装置及终端 |
CN111695691A (zh) * | 2019-03-12 | 2020-09-22 | 纬创资通股份有限公司 | 推论方法、推论装置与显示器 |
-
2008
- 2008-08-22 CN CN200810042014A patent/CN101656837A/zh active Pending
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103810610A (zh) * | 2012-11-08 | 2014-05-21 | 叶宏尧 | 数字影音处理装置及其数字伴唱机服务帐户*** |
CN103338330A (zh) * | 2013-06-18 | 2013-10-02 | 腾讯科技(深圳)有限公司 | 一种图像处理方法、装置和终端 |
CN103346955A (zh) * | 2013-06-18 | 2013-10-09 | 腾讯科技(深圳)有限公司 | 一种图像处理方法、装置及终端 |
WO2014201953A1 (en) * | 2013-06-18 | 2014-12-24 | Tencent Technology (Shenzhen) Company Limited | Methods, apparatus, and terminal devices of image processing |
CN103346955B (zh) * | 2013-06-18 | 2016-08-24 | 腾讯科技(深圳)有限公司 | 一种图像处理方法、装置及终端 |
CN103702168A (zh) * | 2013-12-12 | 2014-04-02 | 乐视网信息技术(北京)股份有限公司 | 一种显示视频列表的方法及视频客户端 |
WO2015196552A1 (zh) * | 2014-06-23 | 2015-12-30 | 中兴通讯股份有限公司 | 一种消息处理方法、装置及终端 |
CN105323361A (zh) * | 2014-06-23 | 2016-02-10 | 中兴通讯股份有限公司 | 一种消息处理方法、装置及终端 |
CN111695691A (zh) * | 2019-03-12 | 2020-09-22 | 纬创资通股份有限公司 | 推论方法、推论装置与显示器 |
CN111695691B (zh) * | 2019-03-12 | 2023-12-15 | 纬创资通股份有限公司 | 推论方法、推论装置与显示器 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100606060B1 (ko) | 휴대단말기의 데이터를 외부장치로 출력하는 장치 및 방법 | |
KR100726258B1 (ko) | 휴대단말의 사진파일 및 음성파일을 이용한 영상물 제작방법 | |
CN102609968B (zh) | 实现有声图片的方法及*** | |
CN101656837A (zh) | 可携式电子装置及其影像与音频数据合成方法 | |
CN101232542A (zh) | 移动终端实现语音备忘功能的方法及应用其的移动终端 | |
CN102348086A (zh) | 一种在录像过程中加载背景音的方法及移动终端 | |
JP2008515307A (ja) | 視聴覚呼び出し確認手段、移動通信装置および呼び出し確認手段を形成するための方法 | |
JP2007243302A (ja) | 番組録画装置、携帯端末、番組録画・再生システム、録画番組表示方法 | |
JP4804465B2 (ja) | 録画装置 | |
US7684828B2 (en) | Mobile terminal and method for outputting image | |
KR20100041108A (ko) | Udta 정보를 이용한 MP4 동영상 연속 촬영 방법 및 이를 지원하는 휴대 단말기 | |
KR20090063608A (ko) | 휴대 단말기의 화상 회의 방법 및 장치 | |
US20050254517A1 (en) | Digital camera and digital video recorder for storing multimedia message | |
KR100597669B1 (ko) | 멀티미디어 콘텐츠의 재생이 가능한 이동통신단말기 및 그재생방법 | |
CN201114207Y (zh) | 3d商务信息电话机 | |
KR20070094055A (ko) | 썸네일 재생 방법 및 이를 이용한 단말기 | |
JP2004357092A (ja) | 情報機器、デジタルカメラおよびデータ表示方法 | |
KR20080032751A (ko) | 휴대 단말기의 동영상 생성 방법 및 콘텐츠 제공 방법 | |
JP4047834B2 (ja) | 携帯情報端末 | |
TW200939797A (en) | Portable electronic device and image and audio data combining method | |
KR20070113393A (ko) | 특수문자와 예약어를 이용한 멀티미디어 메시지 전송서비스 제공 장치 및 방법 | |
KR100690754B1 (ko) | 이동통신 단말기의 음성 녹음 방법 | |
KR100744476B1 (ko) | 휴대 단말기에서 사용자 데이터 정보 저장 방법 및 장치 | |
KR101314565B1 (ko) | 위치 관련 정보를 제공하는 촬영장치 및 그 제어방법 | |
JP5102231B2 (ja) | 音声記録装置及び通信端末 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20100224 |