CN111400506B - 古诗词命题方法及*** - Google Patents

古诗词命题方法及*** Download PDF

Info

Publication number
CN111400506B
CN111400506B CN202010179316.7A CN202010179316A CN111400506B CN 111400506 B CN111400506 B CN 111400506B CN 202010179316 A CN202010179316 A CN 202010179316A CN 111400506 B CN111400506 B CN 111400506B
Authority
CN
China
Prior art keywords
poetry
question
model
semantic features
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010179316.7A
Other languages
English (en)
Other versions
CN111400506A (zh
Inventor
施淼元
刘欢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sipic Technology Co Ltd
Original Assignee
Sipic Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sipic Technology Co Ltd filed Critical Sipic Technology Co Ltd
Priority to CN202010179316.7A priority Critical patent/CN111400506B/zh
Publication of CN111400506A publication Critical patent/CN111400506A/zh
Application granted granted Critical
Publication of CN111400506B publication Critical patent/CN111400506B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)

Abstract

本发明实施例提供一种古诗词命题方法。该方法包括:基于知识图谱提取诗词训练集中各诗词的至少一个关键字,确定为各诗词的语义特征,利用神经网络对各诗词的语义特征进行建模,得到输入为诗词的语义特征,输出为语义相似的其他语义特征的诗词模型;利用知识图谱对诗词训练集进行知识建模,得到诗词训练集内诗词信息的结构化模型;基于各诗词的语义特征关联诗词模型和结构化模型,将预设题型输入至关联后的诗词模型和结构化模型中,输出与预设题型相对应的题目。本发明实施例还提供一种古诗词命题***。本发明实施例使用诗词语义特征进行建模,可以区分出诗词的关系词语,通过将诗词的信息结构化,可以得到丰富的诗词信息,生成质量更高的题目。

Description

古诗词命题方法及***
技术领域
本发明涉及自然语言处理领域,尤其涉及一种古诗词命题方法及***。
背景技术
随着自然语言处理技术的在各个领域的应用, 已经有很多在教育和问答领域做命题***的方法。古诗词作为中国文化的象征之一, 因为涉及到发音,韵律,抽象意向,典故等高难度又复杂的任务,一直是自然语言处理方向的难点。现在已经有些专家利用神经网络技术, 对古诗词进行语义理解并抽取抽象特征,进而衍生除了阅读理解,命题,生成诗句等产品。基于神经网络本身的缺点, 上述任务仍然只能实现简单,基本的功能。
在实现本发明过程中,发明人发现相关技术中至少存在如下问题:
由于神经网络是基于表示学习的,所以在神经网络中不可解释型是现在无法攻克的难关。在神经网络对于语义的表示中,例如“荷花”,“莲花”,“菊花”,“梅花”这几者之间的表示是很接近的。神经网络因为没有外部知识的介入, 是很难区分上述几种花有什么区别。那么在命题***中, 当想出“跟荷花相关的题目”又或者“接天莲叶无穷碧,映日荷花别样红”描述同一种植物的诗句时,很容易将其他无法区分的花的诗句也选入。无论是基于神经网络还是基于传统的自然语言特征,很多模型都是基于统计的概率模型。在概率模型中,相似词、句的生成都是有一定概率去表示生成的几率的。在一般的文本识别或者文本匹配中,90%已经是现在自然语言处理的瓶颈。而诗歌又是非常凝练的语言,通用的词义在诗歌领域中也常常有不同的意义。这就导致在诗歌领域的文本阅读理解、匹配、语义理解等任务很难。如果单纯用这些模型就去命题, 会有大量的错题出现, 而在命题领域错题几乎是不能容忍的。
由于神经网络只对字面本身的意思作表示而无法联系到实体,意向背后的意思就会导致出题往往只能对题目的字面本身出题。这样就导致如果用了神经网络等模型做特征提取, 是很难区分相近的实体词, 近义词, 反义词, 否定词等关系的。
单纯基于神经网络的模型是无法理解实体与实体之间的关联的。由于没有知识的模型是不知道实体背后所隐含的意义的。如果没有额外的知识的介入,那么就完全无法知道菊花开在八九月的秋天,梅花开在寒冬腊月。也就无法出关于诗歌内部的知识点的题型了。
单纯的数据库和神经网络的结合无法体现知识内部的关联,用这样的方法只能找到跟某句诗或者某个词相似的词句, 而无法知道词句不相似,知识或者内容详细的诗歌的。如果没有这样的背景知识,那么很有可能出一道低质量题:商女不知亡国恨,隔江犹唱___。A.***花 B. 海棠花 C.山茶花D.牡丹花。
发明内容
为了至少解决现有技术中单纯用神经网络模型命题, 会有大量的错题出现,无法区分相近的关系词语,无法出关于诗歌内部知识点的提醒,会出现低质量的题的问题。
第一方面,本发明实施例提供一种古诗词命题方法,包括:
基于知识图谱提取诗词训练集中各诗词的至少一个关键字,确定为所述各诗词的语义特征,利用神经网络对所述各诗词的语义特征进行建模,得到输入为诗词的语义特征,输出为语义相似的其他语义特征的诗词模型;
利用所述知识图谱对所述诗词训练集进行知识建模,得到所述诗词训练集内诗词信息的结构化模型,其中所述诗词训练集内诗词信息至少包括:诗句,注释,语义特征,格律,主题类型和诗词意向中的一种;
基于所述各诗词的语义特征关联所述诗词模型和所述结构化模型,将预设题型输入至关联后的诗词模型和所述结构化模型中,输出与所述预设题型相对应的题目。
第二方面,本发明实施例提供一种古诗词命题***,包括:
诗词模型创建程序模块,用于基于知识图谱提取诗词训练集中各诗词的至少一个关键字,确定为所述各诗词的语义特征,利用神经网络对所述各诗词的语义特征进行建模,得到输入为诗词的语义特征,输出为语义相似的其他语义特征的诗词模型;
信息结构化模型创建程序模块,用于利用所述知识图谱对所述诗词训练集进行知识建模,得到所述诗词训练集内诗词信息的结构化模型,其中所述诗词训练集内诗词信息至少包括:诗句,注释,语义特征,格律,主题类型和诗词意向中的一种;
诗词命题程序模块,用于基于所述各诗词的语义特征关联所述诗词模型和所述结构化模型,将预设题型输入至关联后的诗词模型和所述结构化模型中,输出与所述预设题型相对应的题目。
第三方面,提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例的古诗词命题方法的步骤。
第四方面,本发明实施例提供一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现本发明任一实施例的古诗词命题方法的步骤。
本发明实施例的有益效果在于:使用诗词的语义特征进行建模,可以区分出诗词的关系词语,通过将诗词的信息结构化,可以得到更加丰富的诗词信息,从而生成质量更高的题目。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例提供的一种古诗词命题方法的流程图;
图2是本发明一实施例提供的一种古诗词命题***的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示为本发明一实施例提供的一种古诗词命题方法的流程图,包括如下步骤:
S11:基于知识图谱提取诗词训练集中各诗词的至少一个关键字,确定为所述各诗词的语义特征,利用神经网络对所述各诗词的语义特征进行建模,得到输入为诗词的语义特征,输出为语义相似的其他语义特征的诗词模型;
S12:利用所述知识图谱对所述诗词训练集进行知识建模,得到所述诗词训练集内诗词信息的结构化模型,其中所述诗词训练集内诗词信息至少包括:诗句,注释,语义特征,格律,主题类型和诗词意向中的一种;
S13:基于所述各诗词的语义特征关联所述诗词模型和所述结构化模型,将预设题型输入至关联后的诗词模型和所述结构化模型中,输出与所述预设题型相对应的题目。
在本实施方式中,与步骤S11,当想出“跟荷花相关的题目”又或者“接天莲叶无穷碧,映日荷花别样红”描述同一种植物的诗句时,如果直接对诗句使用神经网络进行建模,例如卷积神经网络或者其他神经网络,会由于诗句本身字少但是信息量大的原因, 神经网络压缩和表示出的语义很难理解和匹配。当应用这种方法去选取跟该句具有高相似度的诗句时, 出来的候选诗句往往跟原句差距很大, 只是2个句子在向量空间上距离远. 得出来的句子可能是菊花, 桃花,甚至是红,蓝,绿等跟原句实际上不相关的句子。直接对句子建模想要获得精确的语义表示在现在的神经网络技术中不可能,没有外部的知识图谱,神经网络对句子相似度的表示只是空间上的向量距离。
所以目的是要抽取诗句的语义特征, 应用关键词抽取等方法, 抽取出 “接天莲叶无穷碧,映日荷花别样红”中的“荷花”作为语义特征。在语义提取中只要出现的问题是关键词和实体标注的精度问题,有可能把类似关键词的词语标注出来,比如“商女不知亡国恨,隔江犹唱***花”标注出“***花”。但是应用知识图谱的知识查询功能(***花不属于植物,查询不到),可以在对诗句进行语义特征标注时,将一部分的错误标注过滤掉。通过语义特征的诗词建模,就可以避免出现A.***花 B. 海棠花 C.山茶花D.牡丹花。这样低质量的题。
对于步骤S12,利用知识图谱对诗歌做知识建模, 主要包括诗歌的: 题目, 作者,内容, 注释, 实体, 格律, 意向,主题, 近反义词, 诗歌中的人物,地点等实体和关系。现有的知识图谱的特征非常的离散,如果不用诗歌的语义特征结合知识图谱进行建模,就获取不了精确的结构化信息。对于知识图谱可以使用普通的知识图谱,也可以针对性的使用诗词领域的定制的诗词知识图谱。
通过诗词训练集内诗词信息的结构化模型可以得到:
诗歌题目: 晓出净慈寺送林子方
作者:杨万里 朝代:宋
内容:毕竟西湖六月中,风光不与四时同。接天莲叶无穷碧,映日荷花别样红。
实体:西湖,六月,荷花。
近义词: 西湖,杭州西湖,荷花,莲花,荷叶。
主题:风景。
地点:西湖(进行知识图谱关联)。
其中,参数名称如下。
内容:诗歌里面的诗句。
注释:诗歌自带的注释。
实体:抽取出的诗歌语义特征。
格律:五言七言,绝句律诗,乐府,词牌名等。
主题:诗歌的类型,如风景,思乡等,获取方式是对诗句使用分类算法。
意向:实体和主题的映射关系:荷花-风景,西湖-风景,故乡-思乡。
对于步骤S13,将诗词模型和结构化模型进行结合,从中抽取出诗歌的语义特征进行链接。对于简单的实体,如荷花,西湖等就是在将知识图谱内的信息与关系与诗歌做链接。如将诗句中的荷花链接到知识图谱内的荷花。
作为一种实施方式,所述基于所述各诗词的语义特征关联所述诗词模型和所述结构化模型包括:
基于所述各诗词的语义特征,按照实体链接算法关联所述诗词模型和所述结构化模型。
在本实施方式中,对于困难的实体,需要用到实体链接算法(entity link),如莲花是荷花的同义词,则通过近义词匹配,将莲花也链接到荷花。再比如苏堤是西湖内的景点,属于上下位关系,将苏堤也链接到西湖。
将诗词模型和结构化模型关联后,将预设题型输入至关联后的诗词模型和所述结构化模型中,输出与所述预设题型相对应的题目。
通过该实施方式可以看出,使用诗词的语义特征进行建模,可以区分出诗词的关系词语,通过将诗词的信息结构化,可以得到更加丰富的诗词信息,从而生成质量更高的题目。
作为一种实施方式,在本实施例中,所述预设题型包括诗词选择;
当所述预设题型为诗词选择时,所述关联后的诗词模型和所述结构化模型选取任一诗词的关键字或关键词确定为题目的出题点;
将所述出题点输入至所述关联后的诗词模型和所述结构化模型,生成所述题目的题干、基准答案以及与所述出题点语义相关的多个备选项;
将所述题目的题干以及多个备选项向进行反馈。
在本实施方式中,对于诗词填空的选择题时,对诗词中空缺的内容进行选择填空。
在确定出选择题后,任选一首诗词的关键字或者关键词确定为题目的出题点。例如,“稻花乡里说丰年,听取蛙声一片”。将“稻花”作为诗词的关键字为该题目的出题点。
将“稻花”、“稻花乡里说丰年,听取蛙声一片”输入至关联后的诗词模型和所述结构化模型,生成题目的提干“__乡里说丰年, 听取蛙声一片”,基准答案为“稻花”,以及多个备选项“稻花”,“稻穗”,“稻米”,“稻田”
其中,用到的知识点包括: 要用户填“稻花”2个字, 这道题目用到了分词的技术。必须保证让用户填的是合理的几个字。不能随便选取如“声一”,“里说”等无意义的字词去填。
在确定了稻花之后, 要生成基于稻花的干扰项。利用知识图谱和神经网络表示特征结合的方式, 可以提取出B.稻穗 C.稻米 D.稻田这些相似词作为候选答案的干扰项的。稻穗是稻花开花前的部分,这个候选答案就是基于知识图谱找到的。
在诗词选择中,还有其他类型的选择,例如关联选择类型的题目。选取诗词的步骤不再赘述。例如,“白日依山尽,黄河入海流”的作者写过下列哪些诗。
这道题目的选项只能通过诗歌和作者进行关联。
如果单纯通过数据库检索的方式,是能找到作者王之涣的所有的诗句的, 但是如果拿“汉家天子今神武,不肯和亲归去来”这样的冷门诗句作为答案,就会使题目变的特别难,而且题干和答案之间也没有什么内部的关联,就像是单纯的数据库检索一般,失去了趣味性。
通过知识图谱和神经网络等特征可以在找到王之涣的所有诗句的基础上,找到跟题干比较相关的诗句的, 比如同样提到了黄河的句子:“黄河远上白云间,一片孤城万仞山。”这句诗作为候选答案,命题的质量就大大提高了。
对选择类型进行进一步的深入,对诗歌和地点进行复杂的关联出题。生成所述题目的题干的步骤不再赘述。例如,“欲把西湖比西子, 淡妆浓抹总相宜”中的“西湖”位于下列诗的哪个位置。
故人西辞黄鹤楼,烟花三月下扬州
烟笼寒水月笼沙, 夜泊秦淮近酒家
日照香炉生紫烟,遥看瀑布挂前川
暖风熏得游人醉,直把杭州作汴州
这道“诗地”关联题是用到了复杂的“诗地”关联和景点关联的。第一,问的是题干中的西湖是在哪个位置, 所以得通过知识图谱才能知道西湖是属于杭州的景点。第二,找到描写杭州的句子作为答案。第三,必须得同样出包含地点且跟杭州同样属于地点范围而不是景点的诗句作为干扰项, 如本题中的扬州,庐山,秦淮。这样通过语义就可以得到相关性强备选项。而如果单纯按照普通诗词模型出一道景点等相关的“黄河远上白云间, 一片孤城万仞山”那么候选答案的质量和相关性就非常差了。
在选择类型的题目当中,还包括诗歌内容和词义注释关联的选择。例如:“莲叶何田田”中“田田”的意思是: A. 稀疏,长得不茂盛 B. 莲叶茂盛的样子 C. 一片田地 D. 像田字型一样。这道题主要是对诗词内容的语义进行了知识图谱的关联才能出来。在已知答案是 B的情况下, 要给“田田”这样一个冷门词出相近的意思是很困难的。通过本方法知识图谱构建了词和字的基本释义, 还构建了词和字的近反义词等。所以这道题目的ACD 干扰项就是通过知识图谱得到的。知道了“田田”的反义词,然后根据反义词取出了“稀疏,长得不茂盛”这个答案,刚好跟茂盛形成反义,是一个高质量的干扰项。其次根据“田田”的近义词“田”找到了答案C和D,同样是跟词义高度相关的答案。由此就可以用知识图谱进行高质量的注释出题了。
通过该实施方式可以看出,在确定题型后,确保在选关键字时,不会随意选取无意义的词语。进一步的,在设计备选项中的干扰项时,使用语义相似的词语作为答案的干扰项,从而提高出题的质量。
作为一种实施方式,在本实施例中,所述预设题型还包括:诗词排序、诗词填空、试卷模式;
当所述预设题型为试卷模式时,关联后的诗词模型和所述结构化模型输出多道至少与所述诗词排序和/或诗词填空和/或诗词选择相对应的题目以及基准答案,其中,各题目间的语义特征无关联。
在本实施方式中,关联后的诗词模型和所述结构化模型除了可以生成上述步骤的特殊选择题,还可以进行一些基础的题型,例如“诗词内容排序”以及“诗词内容填空”的题型。
在此基础上,有了多种题型,就可以提供试卷模式。一般的出题往往是出一堆选择题,一堆填空体等。且题目之间是没有关联的。基于题目的题型,主题,作者,难易度等特征可以类似于出试卷一样。
通过该实施方式可以看出,使用试卷模式,提供了多种题型进行命题,避免给了出题的枯燥与乏味,也丰富的考点和考察的范围。
作为一种实施方式,在本实施例中,在输出多道题目以及基准答案之后,所述方法还包括:
确定所述多道题目的难易度,根据所述难易度对所述多道题目进行排序;
输出排序后的多道题目。
在本实施方式中,在试卷模式中,提出了多道题目后,确定出这些题目的难易度,通过排序,将这些题目按照由易到难的向用户进行输出。从而提高用户的答题体验。
作为一种实施方式,在本实施例中,所述确定所述多道题目的难易度包括:
当题目的题型为诗词排序或诗词填空时,基于所述诗词模型确定出题点与题干之间的语义相似度,确定为所述题目的难易维度;
当题目的题型为诗词选择时,基于所述诗词模型确定各备选项之间的语义相似度,确定为所述题目的第一难易维度;
基于所述诗词模型确定基准答案与各备选项的语义相似度,确定为所述题目的第二难易维度;
基于所述诗词模型确定题干与各备选项的语义相似度,确定为所述题目的第三难易维度;
根据所述第一难易维度、第二难易维度、第三难易维度确定所述题目的难易度。
在本实施方式中,由于“诗词内容排序”以及“诗词内容填空”的题型较为基础,涉及的难点并不多,只需考虑出题点与题干之间的语义相似度。例如,填空题:“__乡里说丰年, 听取蛙声一片”,仅需要用户填补空缺的内容。进而确定出题点与题干之间的语义相似度,例如,“丰年”,“蛙声”与“稻花”有一定的语义相似,进而该题的难易维度较低。
对于较为复杂的选择题时,需要考虑各选项之间的语义相似度,如果各选项间语义相似度较高,则表明选择题中备选项间的难易维度较高。还考虑到了基准答案和备选项之间的语义相似度,则表明备选项和基准答案的语义相似度较高,对于用户来说,则难易维度较高。还考虑了题干与备选项之间的语义相似度,如果该语义相似度较高,则说明用户可以通过题干直接推断出选项,难易维度较低。
通过该实施方式可以看出,考虑到题目中各参数(备选项、基准答案、题干)之间的相似度来判断题目的难易度,从而可以对题目进行打分,通过分数可以进行排序输出。
作为一种实施方式,在本实施例中,所述方法还包括:
实时采集不同的用户对每道题目的答题时间、答案;
动态记录每道题目的平均答题时间以及错题率;
通过预设标准确定每道题目的平均答题时间以及错题率的综合动态得分,当题目的综合动态得分小于预设分值时,将所述题目向开发者反馈,以供开发者对所述诗词模型以及所述信息结构化模型进行优化。
在本实施方式中,对题目进行二次评估和动态打分:在大量用户使用时,在大量用户使用数据的基础上,可以收集用户的思考时长,错题数量和分布,爱好的作者和朝代等特征。利用这些特征,可以对题目和试卷进行动态的打分。如原本10分的题目变为8分, 或者5分的题目。这样动态的线上调节,更加有助于命题和试卷的优化。
如图2所示为本发明一实施例提供的一种古诗词命题***的结构示意图,该***可执行上述任意实施例所述的古诗词命题方法,并配置在终端中。
本实施例提供的一种古诗词命题***10包括:诗词模型创建程序模块11,信息结构化模型创建程序模块12和诗词命题程序模块13。
其中,诗词模型创建程序模块11用于基于知识图谱提取诗词训练集中各诗词的至少一个关键字,确定为所述各诗词的语义特征,利用神经网络对所述各诗词的语义特征进行建模,得到输入为诗词的语义特征,输出为语义相似的其他语义特征的诗词模型;信息结构化模型创建程序模块12用于利用所述知识图谱对所述诗词训练集进行知识建模,得到所述诗词训练集内诗词信息的结构化模型,其中所述诗词训练集内诗词信息至少包括:诗句,注释,语义特征,格律,主题类型和诗词意向中的一种;诗词命题程序模块13用于基于所述各诗词的语义特征关联所述诗词模型和所述结构化模型,将预设题型输入至关联后的诗词模型和所述结构化模型中,输出与所述预设题型相对应的题目。
本发明实施例还提供了一种非易失性计算机存储介质,计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的古诗词命题方法;
作为一种实施方式,本发明的非易失性计算机存储介质存储有计算机可执行指令,计算机可执行指令设置为:
基于知识图谱提取诗词训练集中各诗词的至少一个关键字,确定为所述各诗词的语义特征,利用神经网络对所述各诗词的语义特征进行建模,得到输入为诗词的语义特征,输出为语义相似的其他语义特征的诗词模型;
利用所述知识图谱对所述诗词训练集进行知识建模,得到所述诗词训练集内诗词信息的结构化模型,其中所述诗词训练集内诗词信息至少包括:诗句,注释,语义特征,格律,主题类型和诗词意向中的一种;
基于所述各诗词的语义特征关联所述诗词模型和所述结构化模型,将预设题型输入至关联后的诗词模型和所述结构化模型中,输出与所述预设题型相对应的题目。
作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本发明实施例中的方法对应的程序指令/模块。一个或者多个程序指令存储在非易失性计算机可读存储介质中,当被处理器执行时,执行上述任意方法实施例中的古诗词命题方法。
非易失性计算机可读存储介质可以包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需要的应用程序;存储数据区可存储根据装置的使用所创建的数据等。此外,非易失性计算机可读存储介质可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,非易失性计算机可读存储介质可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本发明实施例还提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例的古诗词命题方法的步骤。
本申请实施例的客户端以多种形式存在,包括但不限于:
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机、多媒体手机、功能性手机,以及低端手机等。
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等,例如平板电脑。
(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器,掌上游戏机,电子书,以及智能玩具和便携式车载导航设备。
(4)其他具有语音交互的电子装置。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”,不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种古诗词命题方法,包括:
基于知识图谱提取诗词训练集中各诗词的至少一个关键字,确定为所述各诗词的语义特征,利用神经网络对所述各诗词的语义特征进行建模,得到输入为诗词的语义特征、输出为语义相似的其他语义特征的诗词模型;
利用所述知识图谱对所述诗词训练集进行知识建模,得到所述诗词训练集内诗词信息的结构化模型,其中所述诗词训练集内诗词信息至少包括:诗句,注释,语义特征,格律,主题类型和诗词意向中的一种;
基于所述各诗词的语义特征关联所述诗词模型和所述结构化模型,将预设题型输入至关联后的诗词模型和所述结构化模型中,输出与所述预设题型相对应的题目。
2.根据权利要求1所述的方法,其中,所述预设题型包括诗词选择;
当所述预设题型为诗词选择时,所述关联后的诗词模型和所述结构化模型选取任一诗词的关键字或关键词确定为题目的出题点;
将所述出题点输入至所述关联后的诗词模型和所述结构化模型,生成所述题目的题干、基准答案以及与所述出题点语义相关的多个备选项;
将所述题目的题干以及多个备选项向进行反馈。
3.根据权利要求2所述的方法,其中,所述预设题型还包括:诗词排序、诗词填空、试卷模式;
当所述预设题型为试卷模式时,关联后的诗词模型和所述结构化模型输出多道至少与所述诗词排序和/或诗词填空和/或诗词选择相对应的题目以及基准答案,其中,各题目间的语义特征无关联。
4.根据权利要求3所述的方法,其中,在输出多道题目以及基准答案之后,所述方法还包括:
确定所述多道题目的难易度,根据所述难易度对所述多道题目进行排序;
输出排序后的多道题目。
5.根据权利要求4所述的方法,其中,所述确定所述多道题目的难易度包括:
当题目的题型为诗词排序或诗词填空时,基于所述诗词模型确定出题点与题干之间的语义相似度,确定为所述题目的难易维度;
当题目的题型为诗词选择时,基于所述诗词模型确定各备选项之间的语义相似度,确定为所述题目的第一难易维度;
基于所述诗词模型确定基准答案与各备选项的语义相似度,确定为所述题目的第二难易维度;
基于所述诗词模型确定题干与各备选项的语义相似度,确定为所述题目的第三难易维度;
根据所述第一难易维度、第二难易维度、第三难易维度确定所述题目的难易度。
6.根据权利要求1所述的方法,其中,所述基于所述各诗词的语义特征关联所述诗词模型和所述结构化模型包括:
基于所述各诗词的语义特征,按照实体链接算法关联所述诗词模型和所述结构化模型。
7.根据权利要求1所述的方法,其中,所述方法还包括:
实时采集不同的用户对每道题目的答题时间、答案;
动态记录每道题目的平均答题时间以及错题率;
通过预设标准确定每道题目的平均答题时间以及错题率的综合动态得分,当题目的综合动态得分小于预设分值时,将所述题目向开发者反馈,以供开发者对所述诗词模型以及所述信息结构化模型进行优化。
8.一种古诗词命题***,包括:
诗词模型创建程序模块,用于基于知识图谱提取诗词训练集中各诗词的至少一个关键字,确定为所述各诗词的语义特征,利用神经网络对所述各诗词的语义特征进行建模,得到输入为诗词的语义特征、输出为语义相似的其他语义特征的诗词模型;
信息结构化模型创建程序模块,用于利用所述知识图谱对所述诗词训练集进行知识建模,得到所述诗词训练集内诗词信息的结构化模型,其中所述诗词训练集内诗词信息至少包括:诗句,注释,语义特征,格律,主题类型和诗词意向中的一种;
诗词命题程序模块,用于基于所述各诗词的语义特征关联所述诗词模型和所述结构化模型,将预设题型输入至关联后的诗词模型和所述结构化模型中,输出与所述预设题型相对应的题目。
9.一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述方法的步骤。
10.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-7中任一项所述方法的步骤。
CN202010179316.7A 2020-03-13 2020-03-13 古诗词命题方法及*** Active CN111400506B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010179316.7A CN111400506B (zh) 2020-03-13 2020-03-13 古诗词命题方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010179316.7A CN111400506B (zh) 2020-03-13 2020-03-13 古诗词命题方法及***

Publications (2)

Publication Number Publication Date
CN111400506A CN111400506A (zh) 2020-07-10
CN111400506B true CN111400506B (zh) 2022-07-08

Family

ID=71428793

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010179316.7A Active CN111400506B (zh) 2020-03-13 2020-03-13 古诗词命题方法及***

Country Status (1)

Country Link
CN (1) CN111400506B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111967255A (zh) * 2020-08-12 2020-11-20 福建师范大学协和学院 一种基于互联网的语言自动组卷评测方法和存储介质
CN112101040B (zh) * 2020-08-20 2024-03-29 淮阴工学院 一种基于知识图谱的古代诗词语义检索方法
CN112632386A (zh) * 2020-12-29 2021-04-09 广州视源电子科技股份有限公司 诗词推荐方法、装置、设备及存储介质
CN113361238B (zh) * 2021-05-21 2022-02-11 北京语言大学 一种语块重组题型的自动命题的方法及装置
CN113326696B (zh) * 2021-08-03 2021-11-05 北京世纪好未来教育科技有限公司 文本生成方法和装置
CN117274006B (zh) * 2023-11-21 2024-03-12 山东山大鸥玛软件股份有限公司 一种命题方法、***、设备及存储介质
CN117829137A (zh) * 2024-03-06 2024-04-05 北京万物成理科技有限公司 汉语语素题目生成方法、装置、电子设备和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101470692A (zh) * 2007-12-27 2009-07-01 英业达股份有限公司 多媒体诗词评价***及其方法
US7693705B1 (en) * 2005-02-16 2010-04-06 Patrick William Jamieson Process for improving the quality of documents using semantic analysis

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7693705B1 (en) * 2005-02-16 2010-04-06 Patrick William Jamieson Process for improving the quality of documents using semantic analysis
CN101470692A (zh) * 2007-12-27 2009-07-01 英业达股份有限公司 多媒体诗词评价***及其方法

Also Published As

Publication number Publication date
CN111400506A (zh) 2020-07-10

Similar Documents

Publication Publication Date Title
CN111400506B (zh) 古诗词命题方法及***
CN107944027B (zh) 创建语义键索引的方法及***
CN110008354B (zh) 一种基于知识图谱的对外汉语学习内容的构建方法
US20180307667A1 (en) Travel guide generating method and system
CN102262634B (zh) 一种自动问答方法及***
CN110929045B (zh) 诗歌-语义知识图谱的构建方法及***
CN109635295B (zh) 一种基于语义分析的诗词检索方法及***
CN109271459B (zh) 基于Lucene和文法网络的聊天机器人及其实现方法
CN111274776B (zh) 一种基于关键词的文章生成方法
CN112131472A (zh) 信息推荐方法、装置、电子设备和存储介质
CN112417100A (zh) 辽代历史文化领域知识图谱及其智能问答***的构建方法
CN110059177A (zh) 一种基于用户画像的活动推荐方法及装置
CN113268606A (zh) 知识图谱构建的方法和装置
CN109977382A (zh) 诗句生成模型的训练方法、自动写诗方法及装置
CN113360598A (zh) 基于人工智能的匹配方法、装置、电子设备及存储介质
CN113342948A (zh) 一种智能问答方法及装置
CN111553138A (zh) 用于规范内容结构文档的辅助写作方法及装置
CN117556802B (zh) 一种基于大语言模型的用户画像方法、装置、设备及介质
Kuang et al. [Retracted] Popular Song Composition Based on Deep Learning and Neural Network
Wurth et al. The life of texts: an introduction to literary studies
CN109508449A (zh) 一种宣传片文案在线生成***及其生成方法
CN113407766A (zh) 视觉动画显示方法及相关设备
CN116362331A (zh) 一种基于人机协同构建知识图谱的知识点填充方法
CN110059179A (zh) 一种基于深度学习的歌曲文本命名实体识别方法
Hang et al. The Social Function of the Dong Grand Song in Southeast Guizhou, China

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 215123 building 14, Tengfei Innovation Park, 388 Xinping street, Suzhou Industrial Park, Suzhou City, Jiangsu Province

Applicant after: Sipic Technology Co.,Ltd.

Address before: 215123 building 14, Tengfei Innovation Park, 388 Xinping street, Suzhou Industrial Park, Suzhou City, Jiangsu Province

Applicant before: AI SPEECH Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant