CN109635073A - 论坛社区应用管理方法、装置、设备及计算机可读存储介质 - Google Patents

论坛社区应用管理方法、装置、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN109635073A
CN109635073A CN201811213006.1A CN201811213006A CN109635073A CN 109635073 A CN109635073 A CN 109635073A CN 201811213006 A CN201811213006 A CN 201811213006A CN 109635073 A CN109635073 A CN 109635073A
Authority
CN
China
Prior art keywords
user
information
forum
community application
participle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811213006.1A
Other languages
English (en)
Inventor
宋红喜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
OneConnect Smart Technology Co Ltd
Original Assignee
OneConnect Smart Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by OneConnect Smart Technology Co Ltd filed Critical OneConnect Smart Technology Co Ltd
Priority to CN201811213006.1A priority Critical patent/CN109635073A/zh
Priority to PCT/CN2018/122746 priority patent/WO2020077825A1/zh
Publication of CN109635073A publication Critical patent/CN109635073A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种论坛社区应用管理方法、装置、设备及计算机可读存储介质,包括:接收到加入论坛社区应用的请求时,获取请求对应的用户信息,并根据用户信息对用户进行审核;在用户审核通过时,授予用户加入论坛社区应用的权限,并实时监测用户是否发布信息;在监测到所述用户发布信息时,对信息进行分词处理及语义分析,获得所述信息的分词;根据所述分词提取所述信息的标签或者关键词,并将所述标签或者关键词与所述论坛社区应用的知识体系库进行对比;若所述论坛社区应用的知识体系库中包括所述标签或者所述关键词,则允许用户发布所述信息,否则,禁止用户发布所述信息。本发明能够提高论坛社区应用的管理效率,保证论坛社区应用的知识质量。

Description

论坛社区应用管理方法、装置、设备及计算机可读存储介质
技术领域
本发明涉及知识管理领域,尤其涉及一种论坛社区应用管理方法、装置、设备及计算机可读存储介质。
背景技术
随着社会的进步,人们对知识的获取越来越注重,而知识量非常庞大,因此在获取时,用户需要进行筛选识别,由此论坛社区应用应运而生,论坛社区应用是一个知识交易的APP平台,然而,现有的论坛社区应用分享类目比较繁杂,用户在加入之前无法甄别论坛里面的发布主题的质量,而且用户在论坛社区应用发布内容时,通常不进行审核,用户喜好比较多,造成发布的内容类别不统一,无法实现同一论坛社区应用中的知识类别为相同或相似的类别;或者只是通过人工进行审核,造成审核速度较慢,用户发布内容的效率下降,用户体验不高。
发明内容
本发明的主要目的在于提出一种论坛社区应用管理方法、装置、设备及计算机可读存储介质,旨在解决现有的论坛社区应用分享类目比较繁杂,无法实现同一论坛社区应用中的知识为同一主题的技术问题。
为实现上述目的,本发明提供一种论坛社区应用管理方法,所述方法包括:
接收到加入论坛社区应用的请求时,获取所述请求对应的用户信息,并根据所述用户信息对用户进行审核;
在所述用户审核通过时,授予所述用户加入所述论坛社区应用的权限,并实时监测所述用户是否发布信息;
在监测到所述用户发布信息时,对所述信息进行分词处理及语义分析,获得所述信息的分词;
根据所述分词提取所述信息的标签或者关键词,并将所述标签或者关键词与所述论坛社区应用的知识体系库进行对比;
若所述论坛社区应用的知识体系库中包括所述标签或者所述关键词,则允许用户发布所述信息,否则,禁止用户发布所述信息。
此外,为实现上述目的,本发明还提供一种论坛社区应用管理装置,所述装置包括:
获取模块,用于接收到加入论坛社区应用的请求时,获取所述请求对应的用户信息,并根据所述用户信息对用户进行审核;
权限授予模块,用于在所述用户审核通过时,授予所述用户加入所述论坛社区应用的权限,并实时监测所述用户是否发布信息;
分词模块,用于在监测到所述用户发布信息时,对所述信息进行分词处理及语义分析,获得所述信息的分词;
提取模块,用于根据所述分词提取所述信息的标签或者关键词,并将所述标签或者关键词与所述论坛社区应用的知识体系库进行对比;若所述论坛社区应用的知识体系库中包括所述标签或者所述关键词,则允许用户发布所述信息,否则,禁止用户发布所述信息。
此外,为实现上述目的,本发明还提供一种论坛社区应用管理设备,所述论坛社区应用管理设备包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的论坛社区应用管理程序,所述论坛社区应用管理程序被所述处理器执行时实现如上所述的论坛社区应用管理方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有论坛社区应用管理程序,所述论坛社区应用管理程序被处理器执行时实现如上所述的论坛社区应用管理方法的步骤。
本发明提出的论坛社区应用管理方法、装置、设备及计算机可读存储介质,在接收到加入论坛社区应用的请求时,获取所述请求对应的用户信息,并根据所述用户信息对用户进行审核;在所述用户审核通过时,授予所述用户加入所述论坛社区应用的权限,并实时监测所述用户是否发布信息;在监测到所述用户发布信息时,对所述信息进行分词处理及语义分析,获得所述信息的分词;根据所述分词提取所述信息的标签或者关键词,并将所述标签或者关键词与所述论坛社区应用的知识体系库进行对比;若所述论坛社区应用的知识体系库中包括所述标签或者所述关键词,则允许用户发布所述信息,否则,禁止用户发布所述信息,从而保证用户发布的内容与论坛社区应用的知识主题一致,避免其他用户在获取知识时,需要在不相关的知识中进行筛选,提高了用户获取知识的效率,同时也提高了对论坛社区应用的管理效率。
附图说明
图1为本发明论坛社区应用管理方法第一实施例的流程示意图;
图2为本发明论坛社区应用管理方法中获取所述请求对应的用户信息,并根据所述用户信息对用户进行审核的步骤的细化流程示意图;
图3为本发明论坛社区应用管理方法第二实施例的流程示意图;
图4为本发明论坛社区应用管理方法第三实施例的流程示意图;
图5为本发明论坛社区应用管理方法第四实施例的流程示意图;
图6为本发明实施例方案涉及的硬件运行环境的设备结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种论坛社区应用管理方法。
参照图1,图1为本发明论坛社区应用管理方法第一实施例的流程示意图。
在本实施例中,该方法包括:
步骤S10,接收到加入论坛社区应用的请求时,获取所述请求对应的用户信息,并根据所述用户信息对用户进行审核;
在本实施例中,本发明各个实施例可以应用在对论坛社区、知识星球等应用中,以便对知识进行甄别分类,具体地,在接收到加入论坛社区应用的请求时,为了保证加入论坛社区应用的用户的质量,避免不良用户加入论坛社区应用,造成论坛社区应用中的质量下降,比如经常发布不良广告、违规内容发的用户加入,首先获取所述请求对应的用户信息,然后根据所述用户信息对用户进行审核;
具体地,参照图2,步骤S10中的获取所述请求对应的用户信息,并根据所述用户信息对用户进行审核包括:
步骤S11,通过全切分算法对所述用户信息进行分词处理,获得所述用用户信息的分词;
步骤S12,通过神经网络语言模型对所述用户信息的分词进行量化处理,获得所述用户信息的分词的词向量;
步骤S13,将所述用户信息的分词的词向量输入至预设数据库模型中,获得所述用户信息的分词的词向量与所述预设数据库中的词向量的欧式距离;
步骤S14,根据所述用户信息的分词的词向量与所述预设数据库中的词向量的欧式距离分析所述用户信息的语义,并根据所述用户信息的语义提取对应的违规内容数据库;
步骤S15,若所述违规内容数据库包含所述用户信息,则确定所述用户审核不通过,否则确定所述用户审核通过。
在本实施例中,用户的具体信息可以包括用户名,用户ID等,然后根据用户ID或用户名获取用户在其他论坛社区应用或者其他网站的相关内容,比如发布的文字,视频、发表的主题,根据获取到的相关内容判断用户是否发布过违规内容;具体地,可以通过页面爬取,获取用户在其他论坛社区应用或者其他网站发布的文字,视频、发表的主题,具体通过将用户ID或用户名作为爬取条件进行输入,然后进行爬取,即可获得用户发布的文字,视频、发表的主题,然后将获得的用户发布的文字,视频、发表的主题进行语义分析,具体可以通过全切分算法对所述用户发布的文字和主题进行分词处理,获得所述用户发布的文字和主题的分词;具体地,首先将用户发布的文字和主题切分出与预设词库匹配的所有可能的词,再运用统计语言模型决定最优的切分结果,首先进行词条检索(一般用Trie存储),找到匹配的所有词条,以词网格(word lattices)形式表示,接着做路径搜索,基于统计语言模型(例如n-gram)找到最优路径,即可计算得到最优的切分结果,从而获得分词结果;在获得分词结果之后,即可将分词输入至神经网络语言模型中,通过神经网络语言模型对所述分词进行量化处理,具体地,通过神经网络语言模型的输入层将分词进行输入,即可输出分词的词向量,进一步地,为了提高分词输出的词向量的准确性,可以预先对神经网络语言模型进行训练,具体地,选取与本论坛社区应用相关的语料,然后将选取的语料输入至神经网络语言模型中进行训练,通过迭代算法(Baum-welch算法)对该神经网络语言模型的参数进行更新,并对选取的语料进行迭代训练,不断地循环迭代,直到达到先前设置的迭代次数或已经收敛,此时,可得到该神经网络语言模型的最优模型参数,即可完成神经网络语言模型的训练。具体地,在获得所述分词的词向量之后,即可将所述词向量输入至预设数据库模型中,通过预设数据库模型计算分词的词向量与预设数据库中的词向量的欧式距离,从而获得所述分词的词向量与所述预设数据库中的词向量的欧式距离;
进一步地,具体地,将所述分词的词向量输入至预设数据库模型中,通过公式计算分词的词向量与所述预设数据库中的词向量的欧式距离,其中,x1k表示所述用户发布内容的分词的词向量的1k个坐标,x2k表示所述预设数据库中的词向量的2k个坐标,d12表示欧式距离。然后根据所述用户发布的文字和主题的分词的词向量与所述预设数据库中的词向量的欧式距离分析所述用户发布的文字和主题的具体内容;在计算得到所述用户发布的文字和主题的分词的词向量与所述预设数据库中的词向量的欧式距离之后,将计算得到的欧式距离与预设阈值的欧式距离进行对比,获得大于预设阈值的欧式距离,然后将大于预设阈值的用户发布的文字和主题的分词的词向量与所述预设数据库中的词向量的欧式距离作为分析查询语句的具体内容的目标欧式距离,具体地,提取目标欧式距离对应的预设数据库中的词向量的文本内容,并将提取到的文本内容作为用户发布的文字和主题的具体内容。然后判断所述用户发布的文字和主题的具体内容是否包含违规内容,具体可以将用户发布的文字和主题的具体内容与违规内容数据库中的内容进行对比,若所述违规内容数据库包含所述用户信息,则确定所述用户审核不通过,否则确定所述用户审核通过。
步骤S20,在所述用户审核通过时,授予所述用户加入论坛社区应用的权限,并实时监测所述用户是否发布信息;
步骤S30,在监测到所述用户发布信息时,对所述用户发布信息进行分词处理及语义分析,获得所述用户发布信息的分词;
在用户审核通过后,若当前论坛社区应用为付费应用,则在接收到用户的付款之后,赋予用户加入本论坛社区应用的权限,若当前论坛社区应用为免费应用,则直接赋予用户加入本论坛社区应用的权限,从而保证加入论坛社区应用的用户质量。然后在用户使用论坛社区应用过程中,为了保证用户在论坛社区应用的发布的内容与论坛社区应用的主题一致,需要实时监测所述用户是否发布信息,在监测到所述用户发布信息时,对所述用户发布信息进行分词处理及语义分析;
步骤S40,根据所述分词提取所述信息的标签或者关键词,并将所述标签或者关键词与所述论坛社区应用的知识体系库进行对比;
步骤S50,若所述论坛社区应用的知识体系库中包括所述标签或者关键词,则授予用户进行发布信息,否则,禁止用户进行发布信息。
在通过分词处理及语义分析,获得所述用户发布信息的分词之后,然后根据所述分词提取所述用户发布信息的标签或者关键词,并将所述标签或者关键词论坛社区应用的知识体系库进行对比;若所述论坛社区应用的知识体系库中包括所述标签或者关键词,则授予用户进行发布信息,否则,禁止用户进行发布内容,从而保证了用户发布或者分享的内容与本论坛社区应用的知识类别体系一致,避免其他用户在获取知识时,需要在不相关的知识中进行筛选,提高了用户获取知识的效率。
本实施例提出的论坛社区应用管理方法,在接收到加入论坛社区应用的请求时,获取所述请求对应的用户信息,并根据所述用户信息对用户进行审核;在所述用户审核通过时,授予所述用户加入所述论坛社区应用的权限,并实时监测所述用户是否发布信息;在监测到所述用户发布信息时,对所述信息进行分词处理及语义分析,获得所述信息的分词;根据所述分词提取所述信息的标签或者关键词,并将所述标签或者关键词与所述论坛社区应用的知识体系库进行对比;若所述论坛社区应用的知识体系库中包括所述标签或者所述关键词,则允许用户发布所述信息,否则,禁止用户发布所述信息,从而保证用户发布的内容与论坛社区应用的知识主题一致,避免其他用户在获取知识时,需要在不相关的知识中进行筛选,提高了用户获取知识的效率,同时也提高了对论坛社区应用的管理效率。
进一步地,参照图3,基于本发明论坛社区应用管理方法第一实施例提出论坛社区应用管理方法第二实施例。
在本实施例中,所述步骤S50之后的步骤,还包括:
步骤S60,根据各个用户的账号或ID对用户的浏览记录、提问记录以及回答记录的信息进行采集;
步骤S70,根据采集到的信息分析所述各个用户的喜好,其中,所述各个用户的喜好包括浏览的知识类型,回答的知识类别,并根据所述各个用户的喜好构建对应的用户画像;
在本实施例中,可以根据用户的ID地址或者用户账号查找用户记录,其中用户记录具体包括浏览记录、发表记录和提问回答记录等,具体地,首先选择用户ID,以便根据用户ID进行查找用户记录;然后启动论坛社区应用***中添加的数据采集器,其中所述数据采集器也可以为安装在浏览器中的数据采集器,其中,数据采集器是用来批量采集网页,论坛等的内容,直接保存到数据或发布到网络的一种信息化工具。可以根据用户设定的规则自动采集原网页,获取格式网页中需要的内容,现在发展成也可以对数据进行处理的工具(***)。如SQL Server 2008性能数据采集器可以让我们创建一个中心数据库来存储性能数据;它包含三个内置数据收集组来收集和存储数据;为了帮助我们识别和排除SQLServer性能相关的问题,我们可以使用其内置的三个报表来查看收集存储的数据。然后根据接收到的爬取条件,选取用户记录,即可获取用户在论坛社区应用***中的记录,即可获得用户在论坛社区应用***中的记录的信息,然后根据采集到的信息分析所述各个用户的喜好,其中,所述各个用户的喜好包括浏览的知识类型,回答的知识类别,然后获取预设的知识类别特征标签,并根据所述预设的知识类别特征标签,从所述用户的记录的信息中抓取对应的用户知识类别特征标签数据项,然后将所述知识类别特征标签与抓取到的用户知识类别特征标签数据项进行关联,获得用户知识类别特征标签;在获得知识类别特征标签之后,可以进一步获取用户知识类别特征标签对应的标签分值,并将所述用户知识类别特征标签对应的标签分值配置与预设的用户画像模板,生成用户画像。即将所述用户知识类别特征标签对应的标签分值配置与预设的用户画像模板,其中,所述用户画像模板可以为表格,或者数据库、页签等,在此不做限制,然后将用户知识类别特征标签以及所述知识类别特征标签对应的标签分值与用户账户或用户ID进行关联,即可得到用户画像。
步骤S80,在接收到其他用户的提问时,分析所述其他用户提问对应的知识类别,并将所述知识类别与用户画像中的各个知识类别进行对比,获得其他用户提问的知识类别与各个用户之间的匹配度;
步骤S90,将用户的提问推送至匹配度最高的用户进行回答。
在接收到用户提问时,分析所述用户提问对应的知识类别,具体可以为对用户的提问进行内容分析,即可获取知识类别,然后将所述知识类别与用户画像中的各个知识类别进行对比,即可获得用户提问的知识类别与各个用户之间的匹配度,然后将用户的提问推送至匹配度最高的用户进行回答,从而使得提问用户获得的答案更精准,对回答用户而言,由于是用户擅长的领域,也减少了回答用户的回答时间,提高了用户体验。
本实施例提出的论坛社区应用管理方法,通过构建用户画像,然后在接收到其他用户的提问时,分析所述其他用户提问对应的知识类别,并将所述知识类别与用户画像中的各个知识类别进行对比,获得其他用户提问的知识类别与各个用户之间的匹配度,将用户的提问推送至匹配度最高的用户进行回答,使得提问用户获得的答案更精准,对回答用户而言,由于是用户擅长的领域,也减少了回答用户的回答时间,提高了用户体验。
进一步地,参照图4,基于本发明论坛社区应用管理方法第二实施例提出论坛社区应用管理方法第三实施例。
在本实施例中,所述步骤S80之前的步骤,还包括:
步骤S100,当接收到的提问为语音查询时,获取所述其他用户输入的第一语音数据,并对所述第一语音数据进行分割得到对应的音节,其中所述音节包括声母和韵母;
在本实施例中,用户还可以通过输入语音进行答案查询,具体地,当接收到语音查询时,获取其他用户输入的第一语音数据,然后对所述第一语音数据进行分割得到对应的音节,其中音节包括声母和韵母。其中,对于第一语音数据的分割方法可以基于时域特征参数的方法进行分割,时域参数包括短时平均能量En、短时过零率Zn、平均能量过零数积A=En*Zn及平均能量过零数比B=En/Zn。也可以基于频域特征参数的方法进行分割,通过利用语音信号的谱特征如LPC(Linear Predictive Coding,线性预测编码)倒谱、MFCC(MelFrequency Cepstrum Coefficient,梅尔频率倒谱系数)倒谱等,利用清、浊音频谱的能量分布及谱值幅度不同,可用判别出清、浊音,进一步得到音节分割的结果。语音数据的自动分割是汉语语音识别的关键步骤之一,通过上述基于时域特征参数或基于频域特征参数的分割方法,可将声母和韵母分隔开来,从而有利于后续的语音分析和识别。
步骤S110,通过训练好的语音识别模型对所述声母和韵母进行识别,得到对应的语音识别结果,并根据所述语音识别结果分析所述其他用户提问对应的知识类别。
在将第一语音数据分割成声母和韵母后,通过训练好的语音识别模型对分割后的声母和韵母进行识别,得到对应的语音识别结果,并将所述语音识别结果转换为查询语句,具体的,训练好的语音识别模型对所述声母和韵母的识别过程可以为:对声母或韵母对应的语音数据进行预处理(包括预加重、加窗分帧处理、端点检测和降噪处理),然后提取经过预处理的声母或韵母对应的语音数据的语音特征,然后根据该语音特征,通过训练好的语音识别模型进行识别,即可得到对应的语音识别结果,语音识别结果包括通过训练好的语音识别模型识别出的声母/韵母及其对应的识别概率。
进一步地,参照图5,基于本发明论坛社区应用管理方法第一至第三任一实施例提出论坛社区应用管理方法第四实施例。
在本实施例中,所述步骤S50之后的步骤,还包括:
步骤S120,根据用户的账号或ID对用户在论坛社区应用的浏览时间进行记录;
步骤S130,当监测到用户单次浏览时长超过第一时间阈值时,获取与用户画像相关的直播,并向用户进行推送;
步骤S140,在接收到用户确认点击播放指令之后,对用户的播放时间进行记录,当监测到用户的播放时长达到第二时间阈值时,向用户发送关闭视频播放的提示信息。
在本实施例中,在用户使用论坛社区应用或者知识星球过程中,由于有些用户需要浏览的内容,获取的知识较多,因此使用论坛社区应用或者知识星球的时间会较长,因此可以对用户单次使用论坛社区应用或者知识星球的时长进行记录,当记录到用户单次使用论坛社区应用或者知识星球的时长超过第一时间阈值时,可以获取跟用户知识特征相关的直播,并向用户进行推送,避免用户长时间进行枯燥的浏览,可以理解的是,向用户进行推送的直播,也可以单纯是搞笑放松直播,以便用户进行放松,在用户确认点击播放之后,为了避免用户长时间沉迷与直播,需要进一步记录用户的播放时间,当用户的播放时长达到第二时间阈值时,向用户发送提示信息,以便用户关闭视频播放,继续进行浏览知识。
本实施例提出的论坛社区应用管理方法,通过根据用户的账号或ID对用户在论坛社区应用的浏览时间进行记录;当监测到用户单次浏览时长超过第一时间阈值时,获取与用户画像相关的直播,并向用户进行推送;在接收到用户确认点击播放指令之后,对用户的播放时间进行记录,当监测到用户的播放时长达到第二时间阈值时,向用户发送关闭视频播放的提示信息,从而使得论坛社区应用的更加多样化,增强了用户与论坛社区应用之间的粘性。
本发明实施例进一步提供一种论坛社区应用管理装置,所述装置包括:
获取模块,用于接收到加入论坛社区应用的请求时,获取所述请求对应的用户信息,并根据所述用户信息对用户进行审核;
权限授予模块,用于在所述用户审核通过时,授予所述用户加入所述论坛社区应用的权限,并实时监测所述用户是否发布信息;
分词模块,用于在监测到所述用户发布信息时,对所述信息进行分词处理及语义分析,获得所述信息的分词;
提取模块,用于根据所述分词提取所述信息的标签或者关键词,并将所述标签或者关键词与所述论坛社区应用的知识体系库进行对比;若所述论坛社区应用的知识体系库中包括所述标签或者所述关键词,则允许用户发布所述信息,否则,禁止用户发布所述信息。
需要说明的是,论坛社区应用管理装置的各个实施例与上述论坛社区应用管理方法的各实施例基本相同,在此不再详细赘述。
此外,本发明实施例还提供一种论坛社区应用管理设备。如图6所示,图6是本发明实施例方案涉及的硬件运行环境的结构示意图。
需要说明的是,图6即可为论坛社区应用管理设备的硬件运行环境的结构示意图。本发明实施例论坛社区应用管理设备可以是PC,便携计算机等终端设备。
如图6所示,该论坛社区应用管理设备可以包括:处理器1001,例如CPU,网络接口1004,存储器1005,用户接口1003,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,论坛社区应用管理设备还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。
本领域技术人员可以理解,图6中示出的论坛社区应用管理设备结构并不构成对论坛社区应用管理设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图6所示,作为一种计算机存储介质的存储器1005中可以包括操作***、网络通信模块、用户接口模块以及论坛社区应用管理程序。其中,操作***是管理和控制论坛社区应用管理设备硬件和软件资源的程序,支持论坛社区应用管理程序以及其它软件或程序的运行。
在图6所示的论坛社区应用管理设备中,用户接口1003主要用于获取待传输数据,以及输出提示信息等,网络接口1004主要用于连接接收端,与接收端进行数据通信;处理器1001可以用于调用存储器1005中存储的论坛社区应用管理程序,并执行如上所述的论坛社区应用管理方法的步骤。
本发明论坛社区应用管理设备具体实施方式与上述论坛社区应用管理方法各实施例基本相同,在此不再赘述。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有论坛社区应用管理程序,所述论坛社区应用管理程序被处理器执行时实现如上所述的论坛社区应用管理方法的步骤。
本发明计算机可读存储介质具体实施方式与上述论坛社区应用管理方法各实施例基本相同,在此不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种论坛社区应用管理方法,其特征在于,所述方法包括以下步骤:
接收到加入论坛社区应用的请求时,获取所述请求对应的用户信息,并根据所述用户信息对用户进行审核;
在所述用户审核通过时,授予所述用户加入所述论坛社区应用的权限,并实时监测所述用户是否发布信息;
在监测到所述用户发布信息时,对所述信息进行分词处理及语义分析,获得所述信息的分词;
根据所述分词提取所述信息的标签或者关键词,并将所述标签或者关键词与所述论坛社区应用的知识体系库进行对比;
若所述论坛社区应用的知识体系库中包括所述标签或者所述关键词,则允许用户发布所述信息,否则,禁止用户发布所述信息。
2.如权利要求1所述的论坛社区应用管理方法,其特征在于,所述获取所述请求对应的用户信息,并根据所述用户信息对用户进行审核的步骤包括:
通过全切分算法对所述用户信息进行分词处理,获得所述用用户信息的分词;
通过神经网络语言模型对所述用户信息的分词进行量化处理,获得所述用户信息的分词的词向量;
将所述用户信息的分词的词向量输入至预设数据库模型中,获得所述用户信息的分词的词向量与所述预设数据库中的词向量的欧式距离;
根据所述用户信息的分词的词向量与所述预设数据库中的词向量的欧式距离分析所述用户信息的语义,并根据所述用户信息的语义提取对应的违规内容数据库;
若所述违规内容数据库包含所述用户信息,则确定所述用户审核不通过,否则确定所述用户审核通过。
3.如权利要求2所述的论坛社区应用管理方法,其特征在于,所述将所述用户信息的分词的词向量输入至预设数据库模型中,获得所述用户信息的分词的词向量与所述预设数据库中的词向量的欧式距离的步骤包括:
将所述用户信息的分词的词向量输入至预设数据库模型中,通过公式计算用户信息的分词的词向量与所述预设数据库中的词向量的欧式距离,其中,x1k表示所述用户信息的分词的词向量的1k个坐标,x2k表示所述预设数据库中的词向量的2k个坐标,d12表示欧式距离。
4.如权利要求1所述的论坛社区应用管理方法,其特征在于,所述若所述论坛社区应用的知识体系库中包括所述标签或者所述关键词,则允许用户发布所述信息,否则,禁止用户发布所述信息的步骤之后,还包括:
根据各个用户的账号或ID对用户的浏览记录、提问记录以及回答记录的信息进行采集;
根据采集到的信息分析所述各个用户的喜好,其中,所述各个用户的喜好包括浏览的知识类型,回答的知识类别,并根据所述各个用户的喜好构建对应的用户画像;
在接收到其他用户的提问时,分析所述其他用户提问对应的知识类别,并将所述知识类别与用户画像中的各个知识类别进行对比,获得其他用户提问的知识类别与各个用户之间的匹配度;
将用户的提问推送至匹配度最高的用户进行回答。
5.如权利要求4所述的论坛社区应用管理方法,其特征在于,所述分析所述其他用户提问对应的知识类别,并将所述知识类别与用户画像中的各个知识类别进行对比,获得其他用户提问的知识类别与各个用户之间的匹配度的步骤之前,还包括:
当接收到的提问为语音查询时,获取所述其他用户输入的第一语音数据,并对所述第一语音数据进行分割得到对应的音节,其中所述音节包括声母和韵母;
通过训练好的语音识别模型对所述声母和韵母进行识别,得到对应的语音识别结果,并根据所述语音识别结果分析所述其他用户提问对应的知识类别。
6.如权利要求1-5任一项所述的论坛社区应用管理方法,其特征在于,所述若所述论坛社区应用的知识体系库中包括所述标签或者所述关键词,则允许用户发布所述信息,否则,禁止用户发布所述信息的步骤之后,还包括:
根据用户的账号或ID对用户在论坛社区应用的浏览时间进行记录;
当监测到用户单次浏览时长超过第一时间阈值时,获取与用户画像相关的直播,并向用户进行推送;
在接收到用户确认点击播放指令之后,对用户的播放时间进行记录,当监测到用户的播放时长达到第二时间阈值时,向用户发送关闭视频播放的提示信息。
7.一种论坛社区应用管理装置,其特征在于,所述装置包括:
获取模块,用于接收到加入论坛社区应用的请求时,获取所述请求对应的用户信息,并根据所述用户信息对用户进行审核;
权限授予模块,用于在所述用户审核通过时,授予所述用户加入所述论坛社区应用的权限,并实时监测所述用户是否发布信息;
分词模块,用于在监测到所述用户发布信息时,对所述信息进行分词处理及语义分析,获得所述信息的分词;
提取模块,用于根据所述分词提取所述信息的标签或者关键词,并将所述标签或者关键词与所述论坛社区应用的知识体系库进行对比;若所述论坛社区应用的知识体系库中包括所述标签或者所述关键词,则允许用户发布所述信息,否则,禁止用户发布所述信息。
8.一种论坛社区应用管理设备,其特征在于,所述论坛社区应用管理设备包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的论坛社区应用管理程序,所述论坛社区应用管理程序被所述处理器执行时实现如下步骤:
接收到加入论坛社区应用的请求时,获取所述请求对应的用户信息,并根据所述用户信息对用户进行审核;
在所述用户审核通过时,授予所述用户加入所述论坛社区应用的权限,并实时监测所述用户是否发布信息;
在监测到所述用户发布信息时,对所述信息进行分词处理及语义分析,获得所述信息的分词;
根据所述分词提取所述信息的标签或者关键词,并将所述标签或者关键词与所述论坛社区应用的知识体系库进行对比;
若所述论坛社区应用的知识体系库中包括所述标签或者所述关键词,则允许用户发布所述信息,否则,禁止用户发布所述信息。
9.如权利要求8所述的论坛社区应用管理设备,其特征在于,所述论坛社区应用管理程序被所述处理器执行时还实现如下步骤:
通过全切分算法对所述用户信息进行分词处理,获得所述用用户信息的分词;
通过神经网络语言模型对所述用户信息的分词进行量化处理,获得所述用户信息的分词的词向量;
将所述用户信息的分词的词向量输入至预设数据库模型中,获得所述用户信息的分词的词向量与所述预设数据库中的词向量的欧式距离;
根据所述用户信息的分词的词向量与所述预设数据库中的词向量的欧式距离分析所述用户信息的语义,并根据所述用户信息的语义提取对应的违规内容数据库;
若所述违规内容数据库包含所述用户信息,则确定所述用户审核不通过,否则确定所述用户审核通过。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有论坛社区应用管理程序,所述论坛社区应用管理程序被处理器执行时实现如权利要求1至6中任一项所述的论坛社区应用管理方法的步骤。
CN201811213006.1A 2018-10-18 2018-10-18 论坛社区应用管理方法、装置、设备及计算机可读存储介质 Pending CN109635073A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201811213006.1A CN109635073A (zh) 2018-10-18 2018-10-18 论坛社区应用管理方法、装置、设备及计算机可读存储介质
PCT/CN2018/122746 WO2020077825A1 (zh) 2018-10-18 2018-12-21 论坛社区应用管理方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811213006.1A CN109635073A (zh) 2018-10-18 2018-10-18 论坛社区应用管理方法、装置、设备及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN109635073A true CN109635073A (zh) 2019-04-16

Family

ID=66066375

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811213006.1A Pending CN109635073A (zh) 2018-10-18 2018-10-18 论坛社区应用管理方法、装置、设备及计算机可读存储介质

Country Status (2)

Country Link
CN (1) CN109635073A (zh)
WO (1) WO2020077825A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110929055A (zh) * 2019-11-15 2020-03-27 北京达佳互联信息技术有限公司 多媒体质量检测方法、装置、电子设备及存储介质
CN111488555A (zh) * 2020-04-02 2020-08-04 上海七印信息科技有限公司 版权认证方法、装置、计算机设备和存储介质
CN111523062A (zh) * 2020-04-24 2020-08-11 浙江口碑网络技术有限公司 多维度信息展示方法及装置
CN111901622A (zh) * 2020-07-31 2020-11-06 联想(北京)有限公司 一种控制方法、装置及电子设备
WO2020253350A1 (zh) * 2019-06-17 2020-12-24 深圳壹账通智能科技有限公司 网络内容发布的审核方法、装置、计算机设备及存储介质
CN114896967A (zh) * 2022-06-06 2022-08-12 山东浪潮爱购云链信息科技有限公司 一种采购平台中论坛问题的处理方法、设备、存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103347009A (zh) * 2013-06-20 2013-10-09 新浪网技术(中国)有限公司 一种信息过滤方法及装置
JP2013250931A (ja) * 2012-06-04 2013-12-12 Canon Inc 情報取得システム、プログラム、サーバ、情報取得方法
CN103744881A (zh) * 2013-12-20 2014-04-23 百度在线网络技术(北京)有限公司 一种问答平台的问题分发方法和问题分发***
CN106095801A (zh) * 2016-05-30 2016-11-09 海智(天津)大数据服务有限公司 一种基于大数据技术所见即所得的名称申报***及方法
CN106204156A (zh) * 2016-07-20 2016-12-07 天涯社区网络科技股份有限公司 一种用于网络论坛的广告投放方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102214227B (zh) * 2011-06-23 2013-03-20 华南理工大学 基于互联网层次结构存储的自动舆情监控方法
US20140379719A1 (en) * 2013-06-24 2014-12-25 Tencent Technology (Shenzhen) Company Limited System and method for tagging and searching documents

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013250931A (ja) * 2012-06-04 2013-12-12 Canon Inc 情報取得システム、プログラム、サーバ、情報取得方法
CN103347009A (zh) * 2013-06-20 2013-10-09 新浪网技术(中国)有限公司 一种信息过滤方法及装置
CN103744881A (zh) * 2013-12-20 2014-04-23 百度在线网络技术(北京)有限公司 一种问答平台的问题分发方法和问题分发***
CN106095801A (zh) * 2016-05-30 2016-11-09 海智(天津)大数据服务有限公司 一种基于大数据技术所见即所得的名称申报***及方法
CN106204156A (zh) * 2016-07-20 2016-12-07 天涯社区网络科技股份有限公司 一种用于网络论坛的广告投放方法及装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020253350A1 (zh) * 2019-06-17 2020-12-24 深圳壹账通智能科技有限公司 网络内容发布的审核方法、装置、计算机设备及存储介质
CN110929055A (zh) * 2019-11-15 2020-03-27 北京达佳互联信息技术有限公司 多媒体质量检测方法、装置、电子设备及存储介质
CN111488555A (zh) * 2020-04-02 2020-08-04 上海七印信息科技有限公司 版权认证方法、装置、计算机设备和存储介质
CN111523062A (zh) * 2020-04-24 2020-08-11 浙江口碑网络技术有限公司 多维度信息展示方法及装置
CN111523062B (zh) * 2020-04-24 2024-02-27 浙江口碑网络技术有限公司 多维度信息展示方法及装置
CN111901622A (zh) * 2020-07-31 2020-11-06 联想(北京)有限公司 一种控制方法、装置及电子设备
CN111901622B (zh) * 2020-07-31 2021-11-16 联想(北京)有限公司 一种控制方法、装置及电子设备
CN114896967A (zh) * 2022-06-06 2022-08-12 山东浪潮爱购云链信息科技有限公司 一种采购平台中论坛问题的处理方法、设备、存储介质
CN114896967B (zh) * 2022-06-06 2024-01-19 山东浪潮爱购云链信息科技有限公司 一种采购平台中论坛问题的处理方法、设备、存储介质

Also Published As

Publication number Publication date
WO2020077825A1 (zh) 2020-04-23

Similar Documents

Publication Publication Date Title
CN109635073A (zh) 论坛社区应用管理方法、装置、设备及计算机可读存储介质
WO2021169400A1 (zh) 基于人工智能的命名实体识别方法、装置及电子设备
KR102455616B1 (ko) 멀티 모달리티를 기반으로 하는 주제 분류 방법, 장치, 기기 및 저장 매체
CN106897428B (zh) 文本分类特征提取方法、文本分类方法及装置
CN110020104B (zh) 新闻处理方法、装置、存储介质及计算机设备
WO2021203581A1 (zh) 基于精标注文本的关键信息抽取方法、装置及存储介质
CN109783651B (zh) 提取实体相关信息的方法、装置、电子设备和存储介质
CN108304375B (zh) 一种信息识别方法及其设备、存储介质、终端
CN110888990B (zh) 文本推荐方法、装置、设备及介质
CN113822067A (zh) 关键信息提取方法、装置、计算机设备及存储介质
CN109508458B (zh) 法律实体的识别方法及装置
CN109451147B (zh) 一种信息展示方法及装置
CN107844533A (zh) 一种智能问答***及分析方法
CN107943792B (zh) 一种语句分析方法、装置及终端设备、存储介质
CN109670166A (zh) 基于语音识别的催收辅助方法、装置、设备和存储介质
CN111160007B (zh) 基于bert语言模型的搜索方法、装置、计算机设备及存储介质
CN110414004A (zh) 一种核心信息提取的方法和***
CN110287364B (zh) 语音搜索方法、***、设备及计算机可读存储介质
CN109582954A (zh) 用于输出信息的方法和装置
CN112507167A (zh) 一种识别视频合集的方法、装置、电子设备及存储介质
CN109271624B (zh) 一种目标词确定方法、装置及存储介质
CN109815396A (zh) 搜索词权重确定方法及装置
CN111291551B (zh) 文本处理方法、装置、电子设备及计算机可读存储介质
CN112820314A (zh) 一种智能语音控制大屏显示方法、***及其相关组件
CN107424612A (zh) 处理方法、装置和机器可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190416

WD01 Invention patent application deemed withdrawn after publication