WO2015032308A1

WO2015032308A1 - 一种图像识别方法及用户终端

Info

Publication number: WO2015032308A1
Application number: PCT/CN2014/085761
Authority: WO
Inventors: 徐丹华; 汪运斌; 龙志明
Original assignee: 华为终端有限公司
Priority date: 2013-09-05
Filing date: 2014-09-02
Publication date: 2015-03-12
Also published as: CN109902687B; CN104424472B; CN104424472A; CN109902687A

Abstract

本发明实施例公开了一种图像识别方法及用户终端，本发明实施例方法包括：用户终端检测用户在图像上进行标记的操作，然后确定用户在图像上的标记的区域，用户终端识别标记的区域的标记内容，然后放大显示标记内容，能够对用户感兴趣的内容进行放大显示。

Description

一种图像识别方法及用户终端

本申请要求于 2013年 09月 05日提交中国专利局，申请号为 CN 201310400604.0、发明名称为 "一种图像识别方法及用户终端"的中国专利申请，其全部内容通过引用结合在本申请中。技术领域

本发明涉及通信领域，尤其涉及一种图像识别方法及用户终端。背景技术

通常，人们在看书、报纸或者大街上的广告语的时候，看见自己感兴趣的内容会想要存储下来，特别是在室外时，没有纸笔无法记录下来。

现有的光学字符识别（OCR, Optical Character Recognition )技术，可以将文本内容透过光学仪器，如影像扫描仪、传真机或任何摄影器材，将影像转入计算机、手机等终端，然后对文本内容进行识别进而显示在计算机、手机等终端中，然而，由于终端设备的屏幕较小，所需显示的一页内容又较多，无法清晰查看用户较为关注的内容。发明内容

本发明提供一种图像识别方法及用户终端，能够解决用户无法清晰查看较为关注的内容。

第一方面，提供了一种图像识别方法，包括：

所述用户终端检测所述用户在所述图像上进行标记的操作；所述用户终端确定所述用户在所述图像上的标记的区域；

所述用户终端识别所述标记的区域的标记内容；

所述用户终端放大显示所述标记内容。

结合第一方面，在第一方面的第一种实施方式中，所述用户终端确定用户在所述图像上的标记的区域的具体步骤包括：

所述用户终端通过所述标记的轨迹坐标确定所述图像的所述标记的区域。结合第一方面的第一种实施方式，在第一方面的第二种实施方式中，所述用户终端通过所述标记的轨迹坐标确定所述图像的所述标记的区域的具体步骤包括：

若所述标记的轨迹为封闭轨迹，所述用户终端确定封闭轨迹内的区域为所述标记的区域。

结合第一方面的第一种实施方式，在第一方面的第三种实施方式中，所述用户终端通过所述标记的轨迹坐标确定所述图像的所述标记的区域的具体步骤包括：

第二方面，提供了一种用户终端，所述用户终端包括：

检测单元，用于检测所述用户在所述图像上进行标记的操作；

确定单元，用于确定所述用户在所述图像上的标记的区域；

识别单元，用于识别所述标记的区域的标记内容；

显示控制单元，用于控制显示器放大显示所述标记内容。

结合第二方面，在第二方面的第一种实施方式中，包括：

所述确定单元，用于通过所述标记的轨迹坐标确定所述图像的所述标记的区域。

结合第二方面的第一种实施方式，在第二方面的第二种实施方式中，包括：所述确定单元，用于所述标记的轨迹为封闭轨迹，所述用户终端确定封闭轨迹内的区域为所述标记的区域。

结合第二方面的第一种实施方式，在第二方面的第三种实施方式中，包括：所述确定单元，用于所述标记的轨迹为非封闭轨迹，所述用户终端确定非封闭轨迹的上方为所述标记的区域。

结合第二方面，或第二方面的第一种实施方式，或第二方面的第二种实施方式，或第二方面的第三种实施方式，在第二方面的第四种实施方式中，所述显示控制单元包括：

摘取模块，用于将识别得到的所述标记内容进行摘取；

处理模块，用于对摘取到的所述标记内容进行处理，并保存处理后的所述标记内容；

显示控制模块，用于控制所述显示器对处理后的所述标记内容进行放大显示。

从以上技术方案可以看出，本发明实施例具有以下优点：

本发明实施例中，用户终端检测用户在图像上进行标记的操作，然后确定用户在图像上所做的标记的区域，用户终端对标记的区域中的标记内容进行识别，然后对识别后的标记内容进行放大显示，能够对用户感兴趣的内容进行放大显示。附图说明

图 1为本发明实施例中图像识别方法一个实施例示意图; 图 2为本发明实施例中图像识别方法另一实施例示意图；

图 3为本发明实施例中用户终端一个实施例结构参考图；

图 4为本发明实施例中用户终端另一实施例示意图；

图 5为本发明实施例中用户终端的另一实施例示意图。具体实施方式本发明实施例提供一种图像识别方法及用户终端，能够实现用户终端只对标记的区 i或内的标记内容放大显示。

请参照图 1 , 本发明实施例中图像识别方法一个实施例包括：

101、用户终端检测用户在图像上进行标记的操作；

本实施例中，用户终端可以检测用户在图像上进行标记的操作，用户可以通过手指在图像上做标记，也可以通过手写笔在图像上做标记，此处不做限定，该图像的获取方式不做限定，可以是用户终端通过摄像头拍摄后生产的图像，也可以为用户终端从其它电子设备下载的图像。

102、用户终端确定用户在图像上标记的区域；

本实施例中，在步骤 101检测用户在图像上进行标记之后，用户终端可以确定用户在图像上所做的标记的区域。

103、用户终端识别标记的区域的标记内容；

本实施例中，用户终端在确定标记的区域后，可以识别标记的区域的标记内容，使得用户可以通过用户终端的屏幕查看识别得到的标记内容。

104、用户终端放大显示标记内容。

本实施例中，用户终端可以对在步骤 103中识别后的标记内容放大显示在用户终端的屏幕上。

本实施例中，用户终端检测用户在图像上进行标记，然后确定用户在图像上所做的标记的区域，用户终端识别标记的区域的标记内容，然后放大显示识别后的标记内容，实现了用户终端只对标记的区域中的标记内容进行识别，进而能够对用户感兴趣的内容进行放大显示。

为了便于理解，下面以一具体实例对本发明实施例中的图像识别方法进行描述，请参阅图 2 , 本发明实施例中图像识别方法另一实施例包括：

201、用户终端检测用户在图像上进行标记的操作；

本实施例中，用户终端检测用户在图像上进行标记，图像的获取方式可以为用户终端通过摄像头拍摄后生产的图像，也可以为用户终端从其它电子设备下载的图像，例如，当用户在读书、报纸或者在室外看到广告标语的时候，看到自己感兴趣的文字内容或图案，用户可以向用户终端发出指令，用户终端根据用户的指令进行拍照，并在拍照后生成图像，用户的指令为指示用户终端拍摄用户感兴趣的文字内容或图案，拍照后生成的图像中包含用户感兴趣的文字内容或图案，用户终端可以先将图像显示在用户终端的屏幕上，用户可以在图像上标记出感兴趣的内容，用户在图像上的标记方式不做限定，用户可以通过手指在图像上做标记，也可以通过手写笔在图像上做标记，当然本领域技术人员还可以根据手指和手写笔两种标记方式所显而易见其它标记方式，本实施例中以对文字内容进行标记为例进行说明。

在实际应用中，用户终端可以开启预设的标记界面来供用户在图像上进行标记，当用户标记完成后，用户可以通过点击 "完成" 虚拟按键的方式来告知用户终端完成标记，用户也可以通过语音命令来告知用户终端完成标记，此处告知用户终端完成标记的方式不做限定，当然用户终端可以预先设定阔值 A, 当用户在图像上标记的时间大于或等于该阔值 A时，用户终端可以发出提示信息来询问用户是否完成标记。

202、用户终端通过标记的轨迹坐标确定图像中的标记的区域；

本实施例中，用户在图像上所做的标记不做限定，可以为直线、或曲线、或椭圓形、或矩形、或圓形，在实际应用中，用户终端识别标记的轨迹为现有技术，由于用户对用户终端的屏幕中的图像进行标记，用户终端可以检测到用户在屏幕上的触摸点，识别出触摸点的轨迹坐标，用户终端通过标记的轨迹坐标确定图像中的标记的区域，若标记的轨迹为封闭轨迹（如，椭圓形、矩形或圓形），用户终端可以预先设定封闭轨迹内的区域为标记的区域，若标记的轨迹为非封闭轨迹（如，直线或曲线），用户终端可以预先设定非封闭轨迹上方为标记的区域，在实际应用中，用户终端可以预先设定最靠近非封闭轨迹上方 N 行的文字区域作为标记的区域，若图像中包括图案（如，人物、物体）时，用户终端可以提示用户选择封闭轨迹进行标记，当然还可以根据用户的习惯自行设定标记的区域，例如，非封闭轨迹的下方为标记的区域。

203、用户终端识别标记的区域的标记内容；

本实施例中，以标记内容为文字为例，用户终端可以通过 OCR仅识别标记的区域的标记内容， OCR技术是通过检查纸上打印的字符，并检测暗、亮的模式确定字符的形状，然后用字符识别方法将形状翻译成计算机文字的技术， OCR 具体的实现方式为公知技术，此处不做详述。

204、用户终端将识别得到的标记内容进行摘取；

205、用户终端对摘取到的标记内容进行处理，并保存处理后的标记内容；

206、用户终端放大显示标记内容。

本实施例中，用户终端对步骤 203中得到的标记内容进行摘取，若标记内容为文字，则对摘取到的标记内容进行重新排版，将重新排版后的标记内容进行保存并向用户进行显示，若标记内容为图案，则对该图案的大小、色调等参数进行处理，然后用户终端放大显示处理后的标记内容，在实际应用中，用户可以将保存在用户终端中的标记内容分享给其它用户。

本实施例中，用户终端检测用户在图像上进行标记的操作，用户终端通过标记的轨迹坐标确定图像中的标记的区域，用户终端识别标记的区域的标记内容，用户终端将识别得到的标记内容进行摘取，用户终端对摘取到的标记内容进行处理，并保存处理后的标记内容，用户终端对处理后的标记内容进行显示，实现了用户终端只对标记的区域内的标记内容放大显示，进而方便用户查看感兴趣的内容，而且用户终端将摘取到的标记内容进行保存可以有效的节省了存储的空间，进而使用户随时都可以查找自己感兴趣的内容并分享给其它用户。

下面对用于执行上述图像识别方法的本发明实施例的用户终端进行说明，其基本逻辑结构参考图 3 , 本发明实施例中用户终端一个实施例包括：

检测单元 301、确定单元 302、识别单元 303和显示控制单元 304;

检测单元 301 , 用于检测用户在图像上进行标记的操作；

确定单元 302 , 用于确定用户在图像上的标记的区域；

识别单元 303 , 用于识别标记的区域的标记内容；

显示控制单元 304 , 用于控制显示器放大显示识别后的标记内容。

本实施例中，检测单元 301检测用户在图像上进行标记的操作，确定单元 302 确定用户在图像上标记的区域，识别单元 303识别标记的区域的标记内容，显示控制单元 304控制显示器放大显示识别单元 303识别后的标记内容，实现了用户终端只对标记的区域的标记内容进行识别，进而能够对用户感兴趣的内容进行放大显示。为了更好的理解上述的实施例，下面以具体实施例对用户终端中包括的各个模块及单元间的交互对用户终端中的数据交互方式进行说明，请参阅图 4, 本发明实施例中用户终端的另一实施例包括：

检测单元 401、确定单元 402、识别单元 403、显示控制单元 404;

其中显示控制单元 404包括：摘取模块 4041、处理模块 4042和显示控制模块 4043;

检测单元 401检测用户在图像上进行标记，在实际应用中，图像的获取方式可以为通过摄像头拍摄后生产的图像，也可以为用户终端从其它电子设备下载的图像，例如，当用户在读书、报纸或者在室外看到广告标语的时候，看到自己感兴趣的文字内容或图案，用户可以向用户终端发出指令，用户终端根据用户的指令进行拍照，并在拍照后生成图像，用户的指令为指示用户终端拍摄用户感兴趣的文字内容或图案，拍照后生成的图像中包含用户感兴趣的文字内容或图案，用户终端可以先将图像显示在用户终端的屏幕上，用户可以在图像上标记出感兴趣的文字内容，用户在图像上的标记方式不做限定，用户可以通过手指在图像上做标记，也可以通过手写笔在图像上做标记，当然本领域技术人员还可以根据手指和手写笔两种标记方式所显而易见其它标记方式，检测单元 401可以告知确定单元 402检测完毕，并将图像发送至确定单元 402；

确定单元 402通过标记的轨迹坐标确定图像的标记的区域，其中用户在图像上的标记不 ^1限定，可以为直线、或曲线、或椭圓形、或矩形、或圓形，在实际应用中，标记的区域识别标记的轨迹为现有技术，由于用户对用户终端的屏幕中的图像进行标记，确定单元 402可以检测到用户的触摸点，识别出触摸点的轨迹坐标，然后确定单元 402通过标记的轨迹坐标确定图像中的标记的区域，若标记的轨迹为封闭轨迹（如，椭圓形、矩形或圓形），确定单元 402确定封闭轨迹内的区域为标记的区域，若标记的轨迹为非封闭轨迹（如，直线或曲线），

(如，人物、物体）时，可以提示用户选择封闭轨迹进行标记，当然还可以根据用户的习惯自行设定标记的区域，例如，非封闭轨迹的下方为标记的区域，确定单元 402将确定后的图像发送至识别单元 403 , 并告知识别单元 403图像中的标记的区 i或；

识别单元 403识别标记的区域的标记内容，若标记内容为文字时，可以通过 OCR仅识别标记的区域的标记内容， OCR技术是通过检查纸上打印的字符，并检测暗、亮的模式确定字符的形状，然后用字符识别方法将形状翻译成计算机文字的技术， OCR具体的实现方式为公知技术，此处不做详述，识别单元 403发送图像至摘取模块 4041 , 并将识别出的标记内容告知摘取模块 4041；

摘取模块 4041对图像中的标记的区域中的标记内容进行摘取，并将摘取到的标记内容发送至处理模块 4042;

若标记内容为文字，处理模块 4042对摘取到的标记内容进行重新排版，将重新排版后的标记内容进行保存并向用户进行显示，若标记内容为图案，处理模块 4042对该图案的大小、色调等参数进行处理，处理模块 4042保存处理后的标记内容，在实际应用中，用户可以将保存在用户终端中的标记内容分享给其它用户，处理模块 4042将处理后的标记内容发送至显示控制模块 4043 ;

显示控制模块 4043控制显示器放大显示处理后的标记内容。

本实施例中，检测单元 401检测用户在图像上进行标记的操作，确定单元 402 通过标记的轨迹坐标确定图像的标记的区域，识别单元 403识别标记的区域的标记内容，摘取模块 4041将识别得到的标记内容进行摘取，处理模块 4042对摘取到的标记内容进行处理，并保存处理后的标记内容，显示控制模块 4043控制显示器放大显示处理后的标记内容，实现了用户终端只对标记的区域内的标记内容放大显示，进而方便用户查看感兴趣的内容，而且用户终端通过处理模块 4042 将摘取到的标记内容进行保存可以有效的节省了存储的空间，进而使用户随时都可以查找自己感兴趣的内容并分享给其它用户。

下面对本发明实施例中用户终端的进一步说明，请参阅图 5 , 本发明实施例中用户终端另一实施例包括：处理器 501、用于生产图像的摄像头 502、显示器 503以及用于存储图像的存储器 504。

处理器 501检测用户在图像上进行标记的操作，确定用户在图像上的标记的区域，然后识别标记的区域的标记内容；

显示器 503放大显示标记内容。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的***，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

以上所述，以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换，而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

权利要求书

1、一种图像识别方法，其特征在于，包括：

所述用户终端检测所述用户在所述图像上进行标记的操作；

所述用户终端确定所述用户在所述图像上的标记的区域；

所述用户终端识别所述标记的区域的标记内容；

所述用户终端放大显示所述标记内容。

2、根据权利要求 1所述的方法，其特征在于，所述用户终端确定用户在所述图像上的标记的区域的具体步骤包括：

所述用户终端通过所述标记的轨迹坐标确定所述图像的所述标记的区域。

3、根据权利要求 2所述的方法，其特征在于，所述用户终端通过所述标记的轨迹坐标确定所述图像的所述标记的区域的具体步骤包括：

4、根据权利要求 2所述的方法，其特征在于，所述用户终端通过所述标记的轨迹坐标确定所述图像的所述标记的区域的具体步骤包括：

若所述标记的轨迹为非封闭轨迹，所述用户终端确定非封闭轨迹的上方为所述标记的区域。

5、一种用户终端，其特征在于，所述用户终端包括：

确定单元，用于确定所述用户在所述图像上的标记的区域；

识别单元，用于识别所述标记的区域的标记内容；

显示控制单元，用于控制显示器放大显示所述标记内容。

6、根据权利要求 5所述的用户终端，其特征在于，

7、根据权利要求 6所述的用户终端，其特征在于，

所述确定单元，用于所述标记的轨迹为封闭轨迹，所述用户终端确定封闭轨迹内的区域为所述标记的区域。

8、根据权利要求 6所述的用户终端，其特征在于，

所述确定单元，用于所述标记的轨迹为非封闭轨迹，所述用户终端确定非封闭轨迹的上方为所述标记的区域。

9、根据权利要求 5-8任一项所述的用户终端，其特征在于，所述显示控制单元包括：

摘取模块，用于将识别得到的所述标记内容进行摘取；

显示控制模块，用于控制所述显示器对处理后的所述标记内容进行放大显