CN102708205A - 一种供机器运用语言规律识别语言信息的方法 - Google Patents

一种供机器运用语言规律识别语言信息的方法 Download PDF

Info

Publication number
CN102708205A
CN102708205A CN2012101567551A CN201210156755A CN102708205A CN 102708205 A CN102708205 A CN 102708205A CN 2012101567551 A CN2012101567551 A CN 2012101567551A CN 201210156755 A CN201210156755 A CN 201210156755A CN 102708205 A CN102708205 A CN 102708205A
Authority
CN
China
Prior art keywords
language
speech
machine
sentence
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012101567551A
Other languages
English (en)
Inventor
徐文和
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN2012101567551A priority Critical patent/CN102708205A/zh
Publication of CN102708205A publication Critical patent/CN102708205A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

本发明涉及一种机器语言信息处理技术,为了使机器模拟人的逻辑思维方法理解语言,掌握语法功能,即从主语、谓语、宾语、定语、状语、补语的句子结构到名词、动词、形容词、数量词及副词、虚词的理论及其运用,并且可以把每一部分的功能分析过程都演示出来,做为语言教学示范,提供语言学***台上,使机器不仅能识别语言信息,而且可以运用语言信息,在各语种之间进行互译互换。

Description

一种供机器运用语言规律识别语言信息的方法
技术领域:
本发明涉及一种机器语言信息处理技术,尤其是用于机器模拟人的思维分析方式,通过分析、判断识别语言信息。
背景技术:
目前的机器语言信息处理技术,仅能依靠文字的形状进行文字交换处理,对文字所携带语音、语义信息根本没有涉及。由于机器本身没有识别语义的功能,所以当输入“公差(gōngchāi)”或“公差(gōngchā)”、“倒(dǎo)”或“倒(dào)”时,其识别结果是一样的。现在的机器无论是以语音识别还是以键盘录入进行文字输入,其处理文字的过程都只是依靠“字形”。
另外,我们提供给机器的词库存在一词多义、多词一义的现象,而机器本身没有分析、判断等语法功能,所以对于由多个词汇组成的语言信息,机器根本无法理解成完整的语义,只能分别对单一词汇做出判断并连接,用这样的结果发出指令、处理任何事物,其结果错误率至少在百分之五十以上,而且词组句子越长错误概率越高。这不仅是中文面临的问题,在其他语种也都普遍存在,这也是目前信息化发展最大的瓶颈,只有从根本上彻底解决上述问题,才能真正实现机器自动互换互译、实现各种语言信息交流无障碍的可能。
发明内容:
针对上述情况,本发明提供了一种机器模拟人的语言逻辑思维方法,对语言信息进行处理,实现机器对语言信息识别和理解的目的。
本发明的一个方面,提供了用于机器运用词态组成的规律,其中所述的“词态”与“词性”不一样,它侧重分析构成词与词之间的关系所形成的规律。例如:处所、方向、物称范围词从词性分析都是名词,但是与其它词链接时却各有差异。以链接动词为例,处所名词可以接带有方向或趋向类动词,像“飞到沈阳、来到沈阳等”,而物称范围词像“书、电视、矿石”则不能这样使用,名词的不同词态对链接的动词有不同的要求;动态词中的“动作动词”及物类可以直接带多项名词链接,而不及物类则不行,像“休息、毕业、送行”需要借助其他的虚词;又如,形态词大部分可以受“程度副词”修饰,却很少链接“频率副词”,动词却恰恰相反等等,总之各种词态之间的组合都有必然规律,把这种规律编译成机器可识别的代码,供机器对语言信息进行综合处理,其结果就是机器模拟人的思维识别语言信息。
本发明的另一个方面,提供了用于机器对各类词态之间固有的特性、所形成的结构规律,作为机器对语言信息分析判断的第一步。例如:构成语言的句义组成成分、从语法角度分析语义的方法,任何入学习一门新的语言,都要同步学习词与语法,要想使机器能够模拟人的思维方式,同样需要它同时具备词与语法的判断功能。通过词代码与词态链接码组合句子成分,例如以动词判断宾语,以副词判断谓语,利用这样的规则构成序码,让机器从语义角度分析句子类型,如陈述句、祈使句、疑问句等句子特征,从句子成分分析词性特征,如名词、代词、数词、量词可以充当主语,动词和形容词充当谓语以及其他构成宾语、定语、状语、补语的词性组成,它们之间所形成的必然规律是判断、理解语言信息、句型结构的关键,所以只有把它设置成为机器可识别、可运算的,才能达到让机器理解语义的目的。
另外,每一种语言都有语法规则,各语种间的语法规则既有相同也有不同,例如中国人习惯说“他吃饭了吗?”,而韩、日则习惯说“他饭吃了吗?”。当机器掌握了这种语法功能,就可以从语序方面进行调整,通过“宾语提前”完成语序交换。
本发明的另一个方面,提供了用于机器对语言信息从句型结构组成方面来分析词性、词义。如果从语义角度分析,绝大多数词汇都具有多个词性、语义。例如“跳水”一词同时具备名词、动词及形容词词性,并且在动词词性下也代表不同语义。而当它们进入句型结构后,可以根据前后词汇的词性,依据特性组成的句型结构规律,确定这个词汇的词性和语义。也就是说机器可以根据句子信息判断出所含词性,在句子中确认词汇的词性,并自动显示出来,同时依据句型代码形成公式供机器识别、运算的语言,用于确定语义依据的另一个方面。
本发明的另一个方面,提供了用于机器对语言信息从语言环境方面分析词性、语义。同一词在不同环境下表达的词性、词义不同,很多专业范畴如军事、考古、医疗等都有很多的专业术语、行业专用语,例如“人参”这个词汇,从词性判断是名词,但是并不能确定是植物还是药物,这样的盲点机器是无法判断的。为了解除这一盲点,数据库模拟各种行业设置一种虚拟环境,把相关行业用语与专用关联词语归纳到同一虚拟行业内,命令机器利用行业用语、相关连接语言判断语义。例如:颗、培植、根茎、叶片、开花、结果等语言可判断为植物相关,克、切片、研磨、包装、药与药房等可判断为药物相关。这种关联具有普遍性,机器利用链接语义判断选择词性、词义,这是机器利用虚拟环境内的行业用语、相关连接语言判断语义的另一个方面。
本发明的另一个方面,提供了用于机器对语言信息从语音角度识别同型异声文字,例如中文里的倒(dào)、倒(dǎo),看(kān)、看(kàn),落(luò)、落(là),差(chā)、差(chāi)、差(cī)等,目前所有的文字输入、语音输入,都不能使机器准确识别上述类型的语义,所以造成许多语言信息具有两种以上含义。例如:“王大妈看小孩。”、“他正在倒车。”,前者的“看”有“瞧”和“监视”两层语义,后者的“倒”有“换乘”和“把车向后退”两层语义。这种情况不仅中文存在,其他语言也有类似现象。例如英语里,单词“desert”读/di`z:t/时,为动词,意为“离开;放弃;背弃”;当读/`dezt/时,为名词,意为“沙漠”。而单词minute,当读/`minit/时,为名词,意为“分,分钟;一会儿,片刻”;读/mai`nju:t/时,为形容词,意为“微细的,微小的;详细的”。日语单词“旅人”发音为“たびにん”时,意为“游侠,走江湖的人”,当发音为“たびびと”,意为“游客,行路的客人”。词汇“損する”的发音为“そんする”时,为名词,意为“损失,亏损”,而发音为“そんずる”时,为动词,意为“损伤。损坏,伤害”。为了使机器能够准确识别上述类型语义,必须彻底解决同型异声字问题,而解决办法只有一个,就是把所有同型异声字进行标记。例如看①、看④(可以用任何符号标记),当语音或者文字输入后,机器会分别提示出来,以目前文字输入法输入的文字,四声字无法确认,只有靠机器从词态关系分析、句子类型分析、句型结构分析、词性词义分析、行业用语分析,它可以对每一条信息,从语法规律分析提示,遇到上述情况机器会自动提示两种情况以供选择,用于判断、确定语义的另一个方面。
本发明的另一个方面,提供了用于机器对语言信息、对自定义语言的语义识别方法。因为很多的固有词汇都可以被人为的用作名称,例如“张跳跳、李蹦蹦”这些绰号,按照现有的机器切分方法只能切成姓与动词,又如“桃花、银杏”是植物名词,但它们也可能是某个人的姓名,企业名、地名、商标名等都有类似的情况。对这样的自定义名词,机器是无法判断的,必须设置一种方法,每当机器检索到姓、企事业名称、物称、处所等关键词时,就会自动提示人称、企事业名称、物称、处所等相关用语范围,实现人机对话通知机器确定语义的另一个方面。
本发明的另一个方面,提供了用于机器分析、判断识别语言信息的方法,特别是机器运用词态组合、正向分析句型、语言环境、词性确定、词义确定,语言信息确定、句子类型确定等,这是因为我们的数据库是专门为适应机器判断识别而设置的。人与机器的思维不同,现代汉语语法把所有词汇划分为十二种就可以完全满足语法功能的需要,因为词汇间可自由组合,不同的词性也可组成短语,例如动词和名词、副词和动词都可以组成短语,人对这些语言现象可以理解和判断,但如果是机器单一运用这一规则,它就会判断“吃黄金,穿苹果,非常学习,太劳动”是正确的,这充分说明现代语法规则对机器来讲,是完全不适用的。为了使机器也能运用语法规则准确掌握和应用语言文字关系,所以本发明设置的词必须细划到符合词态要求,如上述例子,只要把动词划分若干种动词词态,使它们定向链接,就会自动排除歧义,后两个例子只需设置程度副词不能修饰动作动词就可以排除这种搭配。词的划分越细、设置的机器编码越多,机器程序就越多,但是识别准确率也就越高,以名词为例,如果划分到200种,机器运算方式就会超过万亿条,但其识别准确性可以大大提升。
如果机器设置逆向选择分析句型、句义,当输入语言信息不符合上述词态链接要求时,机器会自动提示纠正并提供标准的相关词义以供选择,例如:动词前后出现程度副词,如果出现“非常学习、太劳动”时,机器就会显示错误并提供“经常、偶尔、有时”等相关词供选择。
机器虚拟专业用语数据库的工作原理如下:
表1(姓)
表2(亲称)
表3(姻称)
Figure BSA00000719677800052
表1、表2、表3是根据本发明所述,利用语言的自然规律划分的各种具有相同链接功能的词态。它与语法有相同部分,也有不同的部分。从语法角度分析,它们都是名词,但它们的链接却明显不同。表1可链接前缀词,如大、老、小,也可以加形容词,如胖王、瘦张、瘸柺李,还可以加职称,如瓦匠李、剃头刘……,但所有这些都不适用表2、表3。如果不对这三类词加以区分,机器就无法确定准确链接,这就是我们所述的机器与人不同的地方,它理解事物是非常死板的,给什么条件,它就按什么条件工作,所以只有划分的越细,才能工作的越仔细、准确。根据我们的经验总结,名词至少要划分到2000类以上,动词不少于2000类,形容词则要500类以上才能达到理想标准。
表4(形态)
Figure BSA00000719677800053
表4为形容词部分,从图中可以看出,虽然仅列出了四个词,但它们语义就明显不同。前两个属于同一个语义范围,但是语义相反,后两个属于另一个语义范围,语义也相反。
表5(动态)
Figure BSA00000719677800061
表5为动态词,在这一范围内多音字最多,表中仅五个字就有两个字同音不同义。它们的两个词态链接码分别为频率、时态。
表6(频率)
表7(程度)
表6与表7虽然同属副词,但它们的语义及链接作用互不相关,两个图中的“老”字,前者语义表示经常,后者语义表示非常。
表8(水果)
Figure BSA00000719677800071
表8为固体食物,与它相联的关键动词:吃、啃、咬、嚼、吞、咽,但不能用喝、吸、饮。
表9-1(中草药——发汗解表药)
Figure BSA00000719677800072
表9-2(中草药——清热解毒药)
Figure BSA00000719677800073
表9-3(中草药——消食健胃药)
Figure BSA00000719677800074
表9-1、表9-2、表9-3所示语言环境下的专业用语,其中所述的名称词虽然都是植物,但使用范围更趋向于药材,与植物已经关联甚少,因此它们链接的是搬运、加工、服用类动词,而真正的植物链接的词应该在栽培、花、根、茎、叶等范围内。
从所有表中可以看出,其中所列的序码、词态链接码、词代码是机器识别与计算的主要依据。其中词代码是句型的排列组合,以“王妈妈看小孩”为例,用现代语法分析为名词、动词、名词的组合,机器以这种规律判断“王妈妈吃小孩”也是正确的,而运用词代码就可以判断出“王妈妈吃小孩”是错误的结果。这从语法上分析正确但从词代码上分析就是错误的。具体的说就是语法分析确定了句子的广泛语义,而词代码由于词态链接码限制,缩小了句子的语义范围。
另外,表中经常出现“同义词”,是指两个以上的词所代表的语义相同,像“经常、常常、时常等”(见表6)。近义词是指两个以上的词语义相近,一种语言区分,而另一种语言不区分,例如“姑”和“姨”,中文认为两词语义不同,但是英文却不需要明确区分,同义词与近义词是供机器做优先级选择的。测试词则是选用外语对照,当机器分析结果出来后,用另一种语言验证。
附图说明:
图1为本发明流程结构图,其中:
A:信息输入
B:机器信息中心检测提示
B1:人称
B2;企事业名称
B3:物称
B4:处所名称
B5:多音字
C:过滤后信息
D:测试语义(翻译结果对照)
E:语法分析
E1:句型类别
E2:句子语法成分
E3:句子词性分析
F1:E1分析结果
F2:E2分析结果
F3:E3分析结果
图2、图2-1为图1中B的工作截面图
图3为图1中F2的工作截面图
图4、图5为图1中F3的截面图
图6为F2的检测语截面图
图7为F3的检测语截面图
具体实施方式:
本发明的重点是利用语言规律所设定的词与词之间的必然关系,也就是我们所说的词态、语境、语义之间的联系,利用机器的工作性能,通过设置的词代码、词态链接码以及序码来实现机器以识别语义为目的的发明。
1、所谓机器的语言分析,就是机器根据语法规则设置句义公式代码,把各种可能的语言规律都设成适合机器运用分析、判断句义公式。例如图2-1的句子“王妈妈老看小孩”,按现代语法分析是“名词+名词+副词+动词+名词”,这种公式机器根本不适用,因为副词“老”字有两种意义,“经常”与“很”按现代语法无法判断。而按照本发明表中设置的词公式代码为:“Maaaaa+Maabce+Fabeeb+Dbdaaed+Maabce”(表1、2、5、6),运用发明原理即可判断为“经常”。
实践证明,词代码越长,准确率越高,运算过程越长。实际上,我们目前将代码设定为四位,总运算程序已达三千亿项,六位代码预计会超过一万亿项,如果各种语言都达到这个目标,那么各语言之间交换会达到非常高的准确率。
2、通过机器对语言信息的切分,可形成多种可能性,经过数据库内设置的各种词态、语境分析,通过词态链接点关系确认(时态词和频率词多链接动词,形容词、量词多链接名词,程度词主要链接形容词以及前缀词、量词更多地链接数词的链接关系)词性,所有语言信息中的词汇在语句中都可以被最终确认下唯一的词性。
3、词性确定后,机器会自动根据词组关系以构成主、谓、宾、定、状、补的要素关系,主语部分是对谓语部分而言,宾语是对谓语动词而言,补语对谓语形容词或动词而言,状语修饰谓语,定语修饰主语、宾语,判断出主语、谓语、宾语、定语、状语以及补语。
下面结合附图做进一步说明:
图1为本发明的总体结构流程:信息从A进入机器,经过B:中心处理器分析、检测,当关联字含有下列情况,即B1人称、B2企事业名称、B3物称、B4处所名称、B5多音字(绝大多数已被自动识别,只有极少数无法判断)时自动提示,前四种情况只点击该名称范围,多音字则选择其中之一,经过整理后的信息C可进入另一种语言D进行检测、翻译、判断机器是否准确理解语义,C和D都可以进入到E进行语法分析,可以全选E1、E2、E3,也可以单选,选择后结果为F1、F2、F3
图2为B1、B2、B3信息中心检测提示工作截面图。
图2-1为B5信息中心检测提示工作截面图。
图3为例句“我们通过这次活动积累了许多经验”句子语法成分分析工作流程A→B→C→E→E2→F2的分析结果图。
图4为例句“1.他是公司的领导。2.他领导整个公司。”句子词性分析工作流程A→B→C→E→E3→F3的分析结果图。
图5为例句“我们经常去李连贵饭店”句子词性分析工作流程A→B→C→E→E3→F3的分析结果图。
图6为例句“我们通过这次活动积累了许多经验”句子语法成分分析工作流程A→B→C→D→E→E2→F2的分析结果图。
图7为例句“我们通过这次活动积累了许多经验”句子词性分析工作流程A→B→C→D→E→E3→F3的分析结果图。

Claims (8)

1.一种供机器运用语言规律识别语言信息的方法,其特征是:利用语言固有的词态组合的自然规律,对语言的结构组成规律,语言信息词性组成的规律,由语言环境确定的语义,由语音声调确定的语义,由人机对话自定义确定的语义,使机器利用上述规律,分析、判断、识别语言信息。
2.根据权利要求1所述的一种供机器运用语言规律识别语言信息的方法,其特征是:其中所述利用语言固有的词态组合的自然规律,是指以语义分类所形成的动态词、形态词、时态词、状态词、情态词、行业态词、辅助态词之间固定的搭配关系,把这种关系归纳组成编码标识供机器识别的方法。
3.根据权利要求1所述的一种供机器运用语言规律识别语言信息的方法,其特征是:其中所述对语言的结构组成规律,是指构成语言的句义结构成分,从句子类型:陈述句、疑问句、祈使句到组成句子结构成分:主语、谓语、宾语、定语、状语、补语的规律分析判断并识别语言信息。
4.根据权利要求1所述的一种供机器运用语言规律识别语言信息的方法,其特征是:其中所述语言信息的词性组成,是指构成语言信息词组的成分的词性组成,确定名词、动词、形容词、代词、数词、量词以及副词的词性成分及语义。
5.根据权利要求1所述的一种供机器运用语言规律识别语言信息的方法,其特征是:其中所述的由语言环境确定的语义,是指依靠语言环境确定语义的专用语言,由体育、金融、商业、外贸以及各种行业的专业语言组成行业语言数据库,机器通过词态规律、句子类型、结构成分、词性成分,在各专业数据之间分析、比对并确定语义。
6.根据权利要求1所述的一种供机器运用语言规律识别语言信息的方法,其特征是:其中所述的由语音声调确定的语义,是指同型异声字存在读音不同而代表语义不同,尤其中文的四声,不同声调代表不同语义,人在文字信息中可以依靠从上下文判断,但是机器没有办法识别,解决办法是把所有同型异声字进行标记,通过机器检测一旦发现歧义会自动提示,人机确认后确定语义。
7.根据权利要求1所述的一种供机器运用语言规律识别语言信息的方法,其特征是:其中所述人机对话自定义方法,是指非理论性确定的词性,如人名、企事业单位名、商标物品名、处所名,与理论词性不一致,所选词无论原属何种词性、语义,在这里只能是名称,必须通过特定方法实现人机对话与机器沟通,确定语义。
8.根据权利要求1所述的一种供机器运用语言规律识别语言信息的方法,其特征是:其中所述分析、判断识别语言信息,是指机器运用上述规律,可自动把语言信息从语义上分析理解,同时还可以在信息处理过程中进行提示,可以对行业态词、动态词、形态词前后的修饰语提示恰当的选择性词语。
CN2012101567551A 2012-05-21 2012-05-21 一种供机器运用语言规律识别语言信息的方法 Pending CN102708205A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012101567551A CN102708205A (zh) 2012-05-21 2012-05-21 一种供机器运用语言规律识别语言信息的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012101567551A CN102708205A (zh) 2012-05-21 2012-05-21 一种供机器运用语言规律识别语言信息的方法

Publications (1)

Publication Number Publication Date
CN102708205A true CN102708205A (zh) 2012-10-03

Family

ID=46900971

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012101567551A Pending CN102708205A (zh) 2012-05-21 2012-05-21 一种供机器运用语言规律识别语言信息的方法

Country Status (1)

Country Link
CN (1) CN102708205A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105320650A (zh) * 2014-07-31 2016-02-10 崔晓光 一种机器翻译方法及其***
CN107247731A (zh) * 2017-05-04 2017-10-13 深圳哇哇鱼网络科技有限公司 一种语义识别推荐图形方法
CN108351869A (zh) * 2015-07-30 2018-07-31 Pat公司 用于计算机执行语言学分析的基于集解析
CN109902673A (zh) * 2019-01-28 2019-06-18 北京明略软件***有限公司 表格中表头信息识别和整理方法、***、终端和存储介质
CN110164449A (zh) * 2019-04-26 2019-08-23 安徽美博智能科技有限公司 语音识别的空调机控制方法及装置
CN110892406A (zh) * 2017-02-02 2020-03-17 语言探索爱路泰达有限公司 多语言交流***以及消息发送方法
CN112148838A (zh) * 2020-09-23 2020-12-29 北京中电普华信息技术有限公司 一种业务源对象提取方法与装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105320650A (zh) * 2014-07-31 2016-02-10 崔晓光 一种机器翻译方法及其***
CN108351869A (zh) * 2015-07-30 2018-07-31 Pat公司 用于计算机执行语言学分析的基于集解析
CN110892406A (zh) * 2017-02-02 2020-03-17 语言探索爱路泰达有限公司 多语言交流***以及消息发送方法
CN110892406B (zh) * 2017-02-02 2024-06-07 语言探索爱路泰达有限公司 多语言交流***以及消息发送方法
CN107247731A (zh) * 2017-05-04 2017-10-13 深圳哇哇鱼网络科技有限公司 一种语义识别推荐图形方法
CN109902673A (zh) * 2019-01-28 2019-06-18 北京明略软件***有限公司 表格中表头信息识别和整理方法、***、终端和存储介质
CN110164449A (zh) * 2019-04-26 2019-08-23 安徽美博智能科技有限公司 语音识别的空调机控制方法及装置
CN112148838A (zh) * 2020-09-23 2020-12-29 北京中电普华信息技术有限公司 一种业务源对象提取方法与装置
CN112148838B (zh) * 2020-09-23 2024-04-19 北京中电普华信息技术有限公司 一种业务源对象提取方法与装置

Similar Documents

Publication Publication Date Title
Hawkins et al. Criterial features in learner corpora: Theory and illustrations
Meurers Learner corpora and natural language processing
CN102708205A (zh) 一种供机器运用语言规律识别语言信息的方法
Cao et al. Toward gender-inclusive coreference resolution: An analysis of gender and bias throughout the machine learning lifecycle
Yin et al. An exploration of embeddings for generalized phrases
US9646512B2 (en) System and method for automated teaching of languages based on frequency of syntactic models
Seraji Morphosyntactic corpora and tools for Persian
Anbananthen et al. Comparison of stochastic and rule-based POS tagging on Malay online text
Massung et al. Non-native text analysis: A survey
CN110134766B (zh) 一种面向中医古籍文献的分词方法和装置
Sawalha et al. A standard tag set expounding traditional morphological features for Arabic language part-of-speech tagging
Singha et al. Part of speech tagging in Manipuri with hidden markov model
Wilson The creation of a corpus of English metalanguage
Lin et al. Developing a chunk-based grammar checker for translated English sentences
Boulaknadel et al. Amazighe Named Entity Recognition using a A rule based approach
Pal et al. Anaphora resolution in Hindi: Issues and challenges
Deksne A new phase in the development of a grammar checker for Latvian
Jitta et al. “nee intention enti?” towards dialog act recognition in code-mixed conversations
Muischnek et al. Estonian particle verbs and their syntactic analysis
Florea et al. Improving writing for Romanian language
Kumar et al. A comparative analysis of sarcasm detection
Fonseca et al. Adapting an entity centric model for portuguese coreference resolution
Simkó et al. An empirical evaluation of automatic conversion from constituency to dependency in Hungarian
Mesfar Towards a cascade of morpho-syntactic tools for arabic natural language processing
Zaghouani et al. Using ambiguity detection to streamline linguistic annotation

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20121003