CN106776533B - 用于分析一段文本的方法和*** - Google Patents

用于分析一段文本的方法和*** Download PDF

Info

Publication number
CN106776533B
CN106776533B CN201510953092.XA CN201510953092A CN106776533B CN 106776533 B CN106776533 B CN 106776533B CN 201510953092 A CN201510953092 A CN 201510953092A CN 106776533 B CN106776533 B CN 106776533B
Authority
CN
China
Prior art keywords
text
block units
unique
block
computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510953092.XA
Other languages
English (en)
Other versions
CN106776533A (zh
Inventor
梁伟峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chrysus Intellectual Properties Ltd
Original Assignee
Chrysus Intellectual Properties Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chrysus Intellectual Properties Ltd filed Critical Chrysus Intellectual Properties Ltd
Publication of CN106776533A publication Critical patent/CN106776533A/zh
Application granted granted Critical
Publication of CN106776533B publication Critical patent/CN106776533B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B7/00Electrically-operated teaching apparatus or devices working with questions and answers
    • G09B7/02Electrically-operated teaching apparatus or devices working with questions and answers of the type wherein the student is expected to construct an answer to the question which is presented or wherein the machine gives an answer to the question presented by a student
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/226Validation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Business, Economics & Management (AREA)
  • Educational Technology (AREA)
  • Educational Administration (AREA)
  • Tourism & Hospitality (AREA)
  • Databases & Information Systems (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • General Business, Economics & Management (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明提供一种以计算机实现的用于分析一段文本的方法。该方法包括将该文本的一个或多个字符截取为分别具有至少一个字符的一个或多个块单元。该方法包括从一个或多个块单元中分选一个或多个独特块单元,并且将该一个或多个独特块单元与分级数据库进行比较,由此向一个或多个独特块单元的每个指配等级。文本段的总等级可基于向一个或多个独特块单元的每个所指配的等级的一个或多个来确定。文本的总等级可从文本连续截取增加大小的块单元,以及连续处理这类块单元来得出。

Description

用于分析一段文本的方法和***
技术领域
本发明涉及以计算机实现的用于分析一段文本的方法和***。
背景技术
信息和计算机技术的进步对包括教育在内的我们生活的各个方面产生显著影响。使用电子化学习资源作为课堂内外的教学的媒介已经成为全球趋势。随着电子化普及率的扩大,开发了大量包括电子文本和电子教科书的电子教学资源。
然而,与传统学习资料相似,教育工作者和家长所面临的一个困难在于,通常难以评估电子资源是于合适程度以满足特定教学或学习要求。而且还难以确定电子资源的内容是否能满足所需的特定学习目的。通常这些都是根据教育工作者和家长的经验进行评估,这容易受到主观看法的影响,因此可能是不准确的。
发明目的
本发明的一个目的是提供以计算机实现的用于分析一段电子文本的方法和***。
本发明的另一目的是在某种程度上缓解或消除与已知电子文本分析产品关联的一个或多个问题,或者至少提供有用的备选方案。
上述目的通过独立权利要求的特征的组合来实现;从属权利要求公开了本发明的其他有利实施例。
本领域的技术人员将从以下描述中得出本发明的其他目的。因此,以上目的陈述不是穷尽的,而是只用来说明本发明的许多目的。
发明内容
总体上,本发明提供一种以计算机实现的用于分析一段文本方法。该方法包括将文本的一个或多个字符截取为分别具有至少一个字符的一个或多个块单元。该方法包括从一个或多个块单元中分选一个或多个独特块单元,并且将该一个或多个独特块单元与分级数据库进行比较,由此向一个或多个独特块单元的每个指配等级。文本段的总等级可基于一个或多个向一个或多个独特块单元的每个所指配的等级来确定。文本的总等级可从以下得出:文本连续截取增加大小的块单元,和对该块单元的连续处理。
在第一主要方面,本发明提供一种以计算机实现的用于分析一段文本的方法,该方法包括下列步骤:将文本的一个或多个字符截取成一个或多个分别具有至少一个字符的块单元;从一个或多个块单元中分选一个或多个独特块单元;并且将一个或多个独特块单元与分级数据库进行比较,由此向一个或多个独特块单元的每个指配等级。
在第二主要方面,本发明提供一种处理存储机器可读指令的计算机可读介质的方法,其中该机器可读指令在处理器上实现时,实现第一方面的方法中的步骤。
在第三主要方面,本发明提供一种包括用于存储数据的存储器和用于运行计算机可读指令的处理器的***,其中在用于实现第一方面的方法时,该处理器通过计算机可读指令来配置。
本发明内容部分不是必然公开定义本发明的必不可少的全部特征;本发明可在于所公开特征的子组合来实现。
附图说明
通过仅作为举例结合附图来提供的对优选实施例的以下描述,本发明的以上和其他特征将是显而易见的,附图包括:
图1是示出按照本发明、用于分析一段文本的以计算机实现的方法和***的示意框图。
具体实施方式
以下描述仅作为示例性的优选实施例而不是对实施本发明所必需的特征的组合进行限制。
本说明书中提到“一个实施例”或“实施例”表示结合该实施例所述的具体特征、结构或特性包含在本发明的至少一个实施例中。词语“在一个实施例中”在本说明书的各个位置中的出现不一定都表示同一个实施例,也不是对其他实施例互斥的独立或备选实施例。此外,描述了可由某些实施例而没有由其他实施例来呈现的各种特征。类似地,描述了各种要求,其对于某些实施例是需要的,而对于其他实施例则是不需要的。
应当理解,附图所示的元件可通过各种形式的硬件、软件或者其组合来实现。优选地,这些元件通过可包括处理器、存储器和输入/输出界面的一个或多个适当编程的通用装置上以硬件和软件的组合来实现。
参照图1,所示的是用于分析一段文本的***的示意框图。文本段可为任何形式的文字,例如任何种类的文章、评论、故事、诗歌或文献。在本说明书的上下文中,文本可包括任何语言的一个或多个字符以及,可选的,一个或多个符号,例如标点符号。术语“字符”将被给予广泛含意,以包含“字母”、“字”、“数字”、“表意文字”等。
该方法能够在采取任何已知形式(包括台式计算机、笔记本电脑、平板电脑、智能手机或者任何便携电子智能装置)的计算机装置10中实现。优选地,计算机装置10可经由用于交换信息或数据的通信模块16与专用或公共的网络100(例如互联网)连接。
具体来说,计算机装置10包括用于输入待分析的文本的输入界面20。不同的输入路线在图1中通过虚线示出。例如,用户可经由计算机输入部件12(其可包括例如键盘或触摸屏面板)来输入文本。用户还可开启预先键入的、扫描的或保存的文本(例如采取.txt、.doc、.pdf或.jpg格式等),其已经事先准备并且保存在计算机装置10的存储器14中。用户还可经由通信模块16从互联网100下载目的电子文件(E-article)(例如采取.txt、.doc或.pdf格式或者用于电子装置的任何其他格式)。在一个实施例中,用户还可经由任何已知语音识别装置通过语音来输入文本。
所输入的文本段随后将由处理器30来处理和分析。首先,处理器30将通过将文本的一个或多个字符截取成分别具有第一预定义的N个字符的一个或多个块单元来处理文本,其中N为整数并且大于或等于1。截取步骤在图1中示为A。在一个实施例中,例如,在第一轮截取期间,将文本的字符截取成多个分别具有一(1)个字符的块单元中。然后这些块单元将被分选为一个或多个独特、即非重复的块单元。能够通过例如沿文本逐一扫描多个块单元,并且随后阻挡、去除或忽略所识别的任何重复块单元,来执行该分选步骤。备选地,还能够通过搜索多个块单元中的任何重复块单元并且随后阻挡、去除或忽略重复块单元进行分选。因此,每个已分选的块单元应当是独特并且相互不同的。分选步骤在图1中示为B。在一个实施例中,各独特块单元的重复数量能够被输出和/或向用户显示。
已分选的,独特的块单元然后将与分级数据库120进行比较,分级数据库120可存储在计算机装置10的存储器14中或者优选地如图所示位于远程网络100中。比较步骤在图1中示为C。分级数据库120可包括由例如相关教育团体或机构或者其他服务供应商所提供的一个或多个数据库,其单独或者组合地包含独特块单元的一个或多个字符的分级信息或者块单元本身。当开发或发现新字符、字、成语或字符串或者要求分级的修订时,分级数据库120可选地可由***管理员和/或相干教育团体或机构或者其他服务提供商来更新。
通过将该独特块单元与分级数据库120的分级信息进行比较,能够向独特块单元的每个指配等级。该指配步骤在图1中示为D。在一个实施例中,每个独特块单元的所指配的等级能够由输出界面40来输出并且向用户显示。输出界面40还可按照统计格式、例如图表来输出每个所指配的等级中的独特块单元的总数,以便为用户提供关于分级的相对指示。基于向每个独特块单元所指配的等级的一个或多个,或者优选的全部的,等级和/或各等级中的独特块单元的数量,则能够采用基于具有特定数量的字符(其在上述示例中为1)的独特块单元的分析来确定文本段的整体的总等级。
同样地,取决于来自用户的具体设定和指令,能够将文本截取为具有不同数量的字符的块单元。例如,该块单元具有分别用于分析2字词语、3字词语、4字词语或多字词语(例如成语或诗歌)的2、3、4或更多的字符。
在一个实施例中,能够执行连续截取,以便提供关于文本的分级的总体分析。例如,在处理各具有N个字符(在前一示例中N=1)的块单元的这一轮截取之后,文本则能够截取为分别具有预定义的M个字符的多个块单元,其中M为整数并且大小比第一预定义的N要大。例如,文本的字符然后在第二轮截取期间截取成分别具有两个字符(M=N+1)的多个块单元。两个字符的这些块单元将分选为一个或多个独特块单元,并且随后如上所述与分级数据库120来匹配和比较。该过程继续以各块单元中增加数量的字符来重复这些步骤。文本连续截取为增加大小的块单元,以及这类块单元的连续处理将产生该文本的总等级。
可理解,一段文本将包括句子之间的标点符号,因此截取的规则可被例如在词语或句子末尾的逗号或句号所影响。在这种情况下,标点符号之前产生于上一截取的块单元可能具有比预定数量要少的字符数量。这个块单元将仍然在与其他块单元相同的处理步骤下处理。
在另一个实施例中,在分选步骤之后,已分选的独特块单元的每个将在与分级数据库120来比较以进行分级之前与一个或多个特性领域关联。一个或多个特性领域可涉及一个或多个特性,包括但不限于下列至少一个:独特块单元的(i)结构;(ii)含意;(iii)性质;以及(iv)发音。这些特性的示例可包括但不限于:(i)结构:成分、成分的定位和/或成分的数量(例如笔划数)等;(ii)含意:同义词和/或反义词等;(iii)性质:语法性质,例如词性(例如名词、动词、形容词等)等;以及(iv)发音:标音(例如拼音)等。关联步骤在图1中示为E。
在关联步骤期间,该特性将通过来自一个或多个特性数据库140的特性数据来确定或定义。例如,可通过与特性数据库140进行比较以确认组成块单元的字符给予块单元可能或适当的含意,来首先识别独特块单元的“含意”。如果发现块单元只是没有特定含意的不相关字符的随机组合,则这个块单元将不作进一步处理。另一方面,如果发现块单元具有按照特性数据库140的含意,则这个块单元将进入下一步骤,以用于与分级数据库120进行比较,并且随后指配有等级。
具体来说,与一个或多个特性领域(例如i、ii、iii、iv)关联的独特块单元然后将与分级数据库120的多个领域集(例如,如图1所示的I、II、III、IV)进行比较,其中领域集按照一个或多个特性领域来分类。例如,具有5笔划结构的一个字符的独特块单元将与分级数据库120的对应领域集(即,结构)进行比较,以便基于字符的结构的相对复杂度向块单元指配等级。具有带含意(如通过与特性数据库140进行比较所定义或确定)的两个字符的另一个独特块单元将与分级数据库120的对应领域集(即,含意)进行比较,以便基于含意的相对难度向块单元指配等级。
可选地,来自关联步骤的结果、即具有对应特性的一个或多个独特块单元之间的关联能够存储在计算机装置10的存储器单元14中。这是有利的,因为在另一段文本的分析期间来分选具有相同的一个或多个字符的独特块单元时,相干关联能够立即从存储器14来检索,因而协助对处理器30的总处理时间加速。
在关联、比较和指配步骤之后,各等级的各特性领域中的一个或多个独特块单元的总数能够经由输出界面40按照统计格式(例如图表)来输出,以便基于各种特性领域来为用户提供关于文本的分级的相对指示。
与分级数据库120相似,特性数据库140能够存储在计算机装置10的存储器14中,或者优选地如图所示位于远程网络100中。特性数据库140可包括由相关教育团体或机构或者其他服务提供商所提供的一个或多个数据库,其单独或组合地包含用于表征和定义一个或多个字符的信息。可选地,当开发或发现一个或多个字符的新特性或定义时,特性数据库140可由***管理员和/或相关教育团体或机构或者其他服务提供商来更新。在一个实施例中,特性数据库是一个或多个词典数据库。
在另一实施例中,包括截取、分选、关联、比较和指配步骤的至少一个的处理步骤能够在本地服务器或远程服务器180而不是计算机装置10的处理器30中执行。例如,文本能够上传到网页,并且处理步骤能够在网页中进行。
本发明还涉及存储机器可读指令的计算机可读介质,该机器可读指令在处理器30上实现时能实现如上所述方法的步骤。
本发明还涉及一种***,其包括用于存储数据的存储器14和用于运行计算机可读介质的处理器30的,其中该处理器30在用于实现如上所述的方法时被计算机可读指令设置。
本发明的有利之处在于,它提供一段文本的有效和***分析及评估,其中结果按照易于理解的格式、例如分级来呈现。通过将文本的内容与识别的,授权的信息来源进行比较进行评估,而无需涉及用户的任何主观判断。因此,结果是可靠、客观和无偏见的。方法和***在快速、有效和用户友好的计算机界面中实现。在一个实施例中,本发明能够应用于教育、例如电子化学***。本发明能够易于在课堂和家庭学习环境中用于让教师、家长和学生测定学习进度。在另一个实施例中,本发明还能够应用于一般涉及写作、编辑和出版等的任何非***门。
本发明按照计算有效方式来实现文本的有效、快速和高效分析以便于分级,因为它的一个或多个步骤或例程能防止或减少对数据的不必要处理。例如,具有数百或数千字的一段文献的详细分析能够在数秒钟内处理。另外,多个文本也能够同时处理和分析。
本描述说明本发明的原理。因此将会理解,本领域的技术人员将能够设计各种布置,其虽然没有在本文中进行明确描述或说明,但是体现了本原理,并且包含在它的精神和范围之内。
此外,本文中描述本发明的原理、方面和实施例的所有陈述及其具体示例预计包含其结构和功能等效方面。另外,应理解这类等效方案包括当前已知的等效方案以及将来开发的等效方案、即所开发的执行相同功能的任何元件,而与结构无关。
虽然在附图和以上描述中详细示出和描述了本发明,但是其在性质上将被理解为说明性的而不是限制性的,还应理解,仅示例性实施例被示出和描述,它们不会以任何方式来限制本发明的范围。能够理解,本文所述特征的任一个可与任何实施例配合使用。说明性实施例并不是互斥的,或者不排除本文没有叙述的其他实施例。相应地,本发明还提供包括上述说明性实施例的一个或多个的组合的实施例。能够进行如本文所提出的本发明的修改和变更,而没有背离其精神和范围,并且因此仅应当如所附权利要求书所示来施加这类限制。
在所附权利要求书中,任何表示为用于执行特定功能的装置的元件预计包含执行该功能的任何方式,例如包括:a)执行该功能的电路元件的组合;或者b)任何形式的软件,因此包括固件、微码等,与适当电路相组合以用于运行执行该功能的软件。通过本权利要求书所限定的本发明在于如下事实:按照权利要求书所要求的方式来组合和集中各种所述部件所提供的功能性。因此认为能够提供那些功能性的任何部件与本文所示部件是等效的。
在以下权利要求书和本发明的先前描述中,除了上下文因表达语言或必要暗示而要求之外,术语“包括”或者其变形体按照包含意义来使用,即,指定所述特征的存在,但是并不排除本发明的各个实施例中的其他特征的存在或添加。
要理解,如果本文中参照任何现有技术公开物,则这种参照并不构成对于该公开物形成本领域的一部分公知常识的认可。

Claims (12)

1.一种以计算机实现的用于分析一段文本的方法,所述方法包括下列步骤:
将所述文本的一个或多个字符截取为分别具有第一预定义的N个字符的一个或多个第一块单元,其中N为整数,并且N大于或等于1;
通过沿所述文本扫描所述第一块单元,并且随后阻挡、去除或忽略任何重复的第一块单元以仅留下非重复的独特第一块单元,来分选所述一个或多个第一块单元以识别非重复的一个或多个独特第一块单元;
将所述一个或多个独特第一块单元的每个与一个或多个特性领域相关联;以及
将所述一个或多个独特第一块单元与具有按照所述一个或多个特性领域分类的多个领域集的分级数据库进行比较,由此向所述一个或多个独特第一块单元的每个指配等级;
将所述文本连续截取为分别具有第二预定义的M个字符的一个或多个第二块单元,其中M为整数,并且大小比第一数量N至少增加1;以及
重复所述分选、关联和比较步骤以处理所述第二块单元,从而基于所述一个或多个特性领域提供所述一段文本的总等级。
2.如权利要求1所述的方法,还包括输出所述一个或多个独特块单元的每个的所指配的等级的步骤。
3.如权利要求1所述的方法,还包括输出所述指配等级或者每个指配等级中的所述一个或多个独特块单元的总数的步骤。
4.如权利要求1所述的方法,还包括基于向所述一个或多个独特块单元的每个所指配的一个或多个等级来确定所述文本段的总等级的步骤。
5.如权利要求1所述的方法,其特征在于,所述一个或多个特性领域涉及包括独特块单元的结构、含意、性质和发音的至少一个的一个或多个特性。
6.如权利要求5所述的方法,其特征在于,所述一个或多个特性通过来自一个或多个特性数据库的数据来定义。
7.如权利要求1所述的方法,还包括输出各等级的各特性领域中的一个或多个独特块单元的总数的步骤。
8.如权利要求1所述的方法,其特征在于,所述步骤由计算机装置的处理器来实现。
9.如权利要求1所述的方法,其特征在于,所述步骤由网络服务器来实现。
10.如权利要求1所述的方法,还包括把来自关联步骤的结果存储在存储器单元中的步骤。
11.一种存储机器可读指令的计算机可读介质,所述机器可读指令在处理器上实现时实现如权利要求1所述的方法的步骤。
12.一种以计算机实现的***,包括用于存储数据的存储器和用于运行计算机可读指令的处理器,其特征在于,在用于实现如权利要求1所述的方法时,所述处理器通过所述计算机可读指令来配置。
CN201510953092.XA 2015-11-20 2015-12-16 用于分析一段文本的方法和*** Active CN106776533B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
HK15111493.2 2015-11-20
HK15111493.2A HK1210371A2 (zh) 2015-11-20 2015-11-20 種分析文本的方法和系統

Publications (2)

Publication Number Publication Date
CN106776533A CN106776533A (zh) 2017-05-31
CN106776533B true CN106776533B (zh) 2021-05-07

Family

ID=55747663

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510953092.XA Active CN106776533B (zh) 2015-11-20 2015-12-16 用于分析一段文本的方法和***

Country Status (10)

Country Link
US (1) US10755594B2 (zh)
JP (1) JP6693032B2 (zh)
CN (1) CN106776533B (zh)
CA (1) CA2926953C (zh)
HK (1) HK1210371A2 (zh)
MY (1) MY195702A (zh)
PH (1) PH12018550064A1 (zh)
SG (1) SG10201509744UA (zh)
TW (1) TWI686714B (zh)
WO (1) WO2017084238A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190317979A1 (en) * 2017-12-14 2019-10-17 Sang C. Lee Tripartite poetry paradigm
CN111914093A (zh) * 2019-05-09 2020-11-10 深圳中兴飞贷金融科技有限公司 数据处理方法和装置,存储介质和电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000148767A (ja) * 1998-11-05 2000-05-30 Nippon Telegr & Teleph Corp <Ntt> 文書重要文ランキング方法、文書重要文ランキング装置、及び文書重要文ランキングプログラムを記録した記録媒体
CN1673996A (zh) * 2004-03-24 2005-09-28 无敌科技股份有限公司 一种识别语言文本难易度的***及其方法
US7165264B1 (en) * 2001-07-26 2007-01-16 Digeo, Inc. Client-side tool for splitting or truncating text strings for interactive television
CN101539923A (zh) * 2008-03-18 2009-09-23 北京搜狗科技发展有限公司 从文档中提取正文片段的方法及装置
CN104615772A (zh) * 2015-02-16 2015-05-13 重庆大学 一种用于电子商务的文本评价数据专业程度分析方法

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5870608A (en) * 1994-06-03 1999-02-09 Synopsys, Inc. Method and apparatus for displaying text including context sensitive information derived from parse tree
US5724498A (en) * 1995-06-07 1998-03-03 Adobe Systems Incorporated Method and apparatus for concealing character modifications made for text composition purposes
US5794177A (en) * 1995-07-19 1998-08-11 Inso Corporation Method and apparatus for morphological analysis and generation of natural language text
US6154757A (en) * 1997-01-29 2000-11-28 Krause; Philip R. Electronic text reading environment enhancement method and apparatus
TW364966B (en) * 1997-07-15 1999-07-21 Inventec Corp Automatic syntax analysis method for Chinese
US6120297A (en) * 1997-08-25 2000-09-19 Lyceum Communication, Inc. Vocabulary acquistion using structured inductive reasoning
US7069508B1 (en) * 2000-07-13 2006-06-27 Language Technologies, Inc. System and method for formatting text according to linguistic, visual and psychological variables
US6658377B1 (en) * 2000-06-13 2003-12-02 Perspectus, Inc. Method and system for text analysis based on the tagging, processing, and/or reformatting of the input text
US7103848B2 (en) * 2001-09-13 2006-09-05 International Business Machines Corporation Handheld electronic book reader with annotation and usage tracking capabilities
US7313513B2 (en) * 2002-05-13 2007-12-25 Wordrake Llc Method for editing and enhancing readability of authored documents
US20050069849A1 (en) * 2003-09-30 2005-03-31 Iode Design Computer-based method of improving reading comprehension
JP4304146B2 (ja) 2004-12-01 2009-07-29 株式会社東芝 辞書登録装置、辞書登録方法および辞書登録プログラム
US8608477B2 (en) * 2006-04-06 2013-12-17 Vantage Technologies Knowledge Assessment, L.L.C. Selective writing assessment with tutoring
JP2008129475A (ja) * 2006-11-23 2008-06-05 Osamu Asai 音声教材
TW200825778A (en) * 2006-12-12 2008-06-16 Inventec Besta Co Ltd Hand-held reading device and the reading assistant method thereof
GB2446427A (en) * 2007-02-07 2008-08-13 Sharp Kk Computer-implemented learning method and apparatus
US20090228777A1 (en) * 2007-08-17 2009-09-10 Accupatent, Inc. System and Method for Search
US8306356B1 (en) * 2007-09-28 2012-11-06 Language Technologies, Inc. System, plug-in, and method for improving text composition by modifying character prominence according to assigned character information measures
US8136034B2 (en) * 2007-12-18 2012-03-13 Aaron Stanton System and method for analyzing and categorizing text
US8463594B2 (en) * 2008-03-21 2013-06-11 Sauriel Llc System and method for analyzing text using emotional intelligence factors
CN101540041B (zh) 2008-03-21 2012-06-27 中国科学院计算技术研究所 一种扫描文档浏览适配方法
US8320674B2 (en) 2008-09-03 2012-11-27 Sony Corporation Text localization for image and video OCR
US8606796B2 (en) * 2008-09-15 2013-12-10 Kilac, LLC Method and system for creating a data profile engine, tool creation engines and product interfaces for identifying and analyzing files and sections of files
JP2010256821A (ja) * 2009-04-28 2010-11-11 Sci-Tec:Kk 学習支援システム
US20100311030A1 (en) * 2009-06-03 2010-12-09 Microsoft Corporation Using combined answers in machine-based education
US20110123967A1 (en) * 2009-11-24 2011-05-26 Xerox Corporation Dialog system for comprehension evaluation
US8892421B2 (en) * 2010-12-08 2014-11-18 Educational Testing Service Computer-implemented systems and methods for determining a difficulty level of a text
JP2012208143A (ja) * 2011-03-29 2012-10-25 Hideki Aikawa オンライン学習システム
CN102497270B (zh) 2011-12-24 2014-07-16 桂林电子科技大学 一类规范化文档的加密方法
CN103186911B (zh) 2011-12-28 2015-07-15 北大方正集团有限公司 一种处理扫描书数据的方法及装置
CN102662952B (zh) 2012-03-02 2015-04-15 成都康赛信息技术有限公司 一种基于层次的中文文本并行数据挖掘方法
CN104462207B (zh) * 2014-11-03 2017-07-11 陕西师范大学 面向分布式学习环境的多片段学习资源标注方法
RU2580424C1 (ru) * 2014-11-28 2016-04-10 Общество С Ограниченной Ответственностью "Яндекс" Способ выявления незначащих лексических единиц в текстовом сообщении и компьютер
US9563613B1 (en) * 2015-01-23 2017-02-07 Sprint Communications Company L.P. System and method for dynamic portable document file generation
CN107291683A (zh) * 2016-04-11 2017-10-24 珠海金山办公软件有限公司 一种拼写检查方法及装置
US11615104B2 (en) * 2016-09-26 2023-03-28 Splunk Inc. Subquery generation based on a data ingest estimate of an external data system
US11250371B2 (en) * 2016-09-26 2022-02-15 Splunk Inc. Managing process analytics across process components
US11604795B2 (en) * 2016-09-26 2023-03-14 Splunk Inc. Distributing partial results from an external data system between worker nodes
US11106681B2 (en) * 2018-09-28 2021-08-31 Splunk Inc. Conditional processing based on inferred sourcetypes

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000148767A (ja) * 1998-11-05 2000-05-30 Nippon Telegr & Teleph Corp <Ntt> 文書重要文ランキング方法、文書重要文ランキング装置、及び文書重要文ランキングプログラムを記録した記録媒体
US7165264B1 (en) * 2001-07-26 2007-01-16 Digeo, Inc. Client-side tool for splitting or truncating text strings for interactive television
CN1673996A (zh) * 2004-03-24 2005-09-28 无敌科技股份有限公司 一种识别语言文本难易度的***及其方法
CN101539923A (zh) * 2008-03-18 2009-09-23 北京搜狗科技发展有限公司 从文档中提取正文片段的方法及装置
CN104615772A (zh) * 2015-02-16 2015-05-13 重庆大学 一种用于电子商务的文本评价数据专业程度分析方法

Also Published As

Publication number Publication date
CN106776533A (zh) 2017-05-31
MY195702A (en) 2023-02-06
TWI686714B (zh) 2020-03-01
CA2926953A1 (en) 2017-05-20
SG10201509744UA (en) 2017-06-29
US10755594B2 (en) 2020-08-25
HK1210371A2 (zh) 2016-04-15
US20170148337A1 (en) 2017-05-25
JP2018538615A (ja) 2018-12-27
WO2017084238A1 (en) 2017-05-26
JP6693032B2 (ja) 2020-05-13
PH12018550064A1 (en) 2018-11-12
TW201719450A (zh) 2017-06-01
CA2926953C (en) 2022-08-09

Similar Documents

Publication Publication Date Title
US7983902B2 (en) Domain dictionary creation by detection of new topic words using divergence value comparison
US8463598B2 (en) Word detection
US9910886B2 (en) Visual representation of question quality
US9208144B1 (en) Crowd-sourced automated vocabulary learning system
CN106796594B (zh) 从句子生成高级别问题
JP5379138B2 (ja) 領域辞書の作成
Eika et al. Assessing the reading level of web texts for WCAG2. 0 compliance—can it be done automatically?
JP6626917B2 (ja) 英語の音節計算法に基づいた可読性評価方法及びシステム
Deny et al. Selecting and creating a word list for English language teaching
CN116685966A (zh) 调整查询生成模式
CN106776533B (zh) 用于分析一段文本的方法和***
Putri et al. Software feature extraction using infrequent feature extraction
CN112559711A (zh) 一种同义文本提示方法、装置及电子设备
Frankenberg-Garcia et al. ColloCaid: a tool to help academic English writers find the words they need
JP2021096395A (ja) 文法学習システム、サーバー装置、データ検索方法、及び検索プログラム
Toyoda Usage and efficacy of electronic dictionaries for a language without word boundaries
US20230281388A1 (en) A Method and System for Analyzing a Piece of Text Comprising Chinese Characters
Wu Phrasal verbs in European Parliament conference English: a corpus-based pedagogical list
Hassan et al. Connectives in the world wide web Arabic Corpus
Prys et al. Quantifying the use of digital Welsh-language language resources
Yeh et al. Spelling checking using conditional random fields with feature induction for secondary language learners
Flor et al. Mapping of American English vocabulary by grade levels
KR20150141109A (ko) 사용자 맞춤 온라인 학습방법
Da A web-based vocabulary profiler for Chinese language teaching and research
Krasna et al. Problems of search engine in" phraseology" linguistic software project

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1232633

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: Room G, 22 floor, 4 Hyun court, Hai Yi Peninsula, Hongkong, China.

Applicant after: Fortune asset Company Limited

Address before: 601 / F, Malaysia Building, 50 Gloucester Road, Wanchai, Hongkong, China 601

Applicant before: Fortune asset Company Limited

GR01 Patent grant
GR01 Patent grant
CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: Room 15a, 15 / F, building 1, Furong garden, Mongkok, Kowloon, Hong Kong, China

Patentee after: Chrysus Intellectual Properties Ltd.

Address before: Room G, 22 floor, 4 Hyun court, Hai Yi Peninsula, Hongkong, China.

Patentee before: Chrysus Intellectual Properties Ltd.