CN107194617A - 一种app软件工程师软技能分类***及方法 - Google Patents

一种app软件工程师软技能分类***及方法 Download PDF

Info

Publication number
CN107194617A
CN107194617A CN201710544531.0A CN201710544531A CN107194617A CN 107194617 A CN107194617 A CN 107194617A CN 201710544531 A CN201710544531 A CN 201710544531A CN 107194617 A CN107194617 A CN 107194617A
Authority
CN
China
Prior art keywords
short sentence
soft skill
soft
skill
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710544531.0A
Other languages
English (en)
Other versions
CN107194617B (zh
Inventor
贾经冬
刘熙
陈祖鹏
杜孝平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianhang Changying (Jiangsu) Technology Co.,Ltd.
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN201710544531.0A priority Critical patent/CN107194617B/zh
Publication of CN107194617A publication Critical patent/CN107194617A/zh
Application granted granted Critical
Publication of CN107194617B publication Critical patent/CN107194617B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Human Resources & Organizations (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Educational Administration (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Development Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Game Theory and Decision Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)

Abstract

本发明涉及一种app软件工程师软技能分类***及方法,用于分类从app软件开发工程师招聘广告中提取出的软技能。本发明从软件工程师技能招聘要求中提取软技能,首先对招聘广告信息进行数据收集和清理,然后对其中信息进行预处理提取短句和词语,用TF‑IDF方法标识每一个词语的权重,之后依据每个短句中的词语权重定义短句相似度计算公式,最后以短句相似度为参考对软技能进行聚类,从聚类结果提取关键词作为分类规则构造分类器,最终将移动软件开发工程师软技能分类为13类。

Description

一种app软件工程师软技能分类***及方法
技术领域
本发明提出一种app软件工程师软技能分类***和方法,使用层次聚类算法将移动开发软件工程师的软技能需求分类为13类。
背景技术
一般来说,开发人员的技能分为两个方面:硬技能和软技能。硬技能是一个人应该拥有的技术要求和知识,其用来执行任务;它们包括一个人应该专门执行计划任务的理论基础和实践经验。软技能是非技术技能,融入心理现象,如社会互动能力,沟通,创新与协作。开发人员通常被认为是技术人才,因此,他们的技术能力在实际工作和研究中被强调。然而软件开发是脑力密集产业,且是基于团队合作的,所以开发人员的软技能,如沟通和协作等,也应该受到相同程度的关注。目前国内外对传统软件开发的研究中,已有部分研究揭示了软件开发中哪些软技能有很高的要求,并且提出了全球软件开发背景下软件工程师应该具有的软技能要求,但是那些软技能的重要性排序被忽略了。而且这些研究只与传统软件开发有关,传统软件开发与移动应用软件开发存在开发方式和管理方式上的差异,因此传统软件开发环境中提出的软技能需求可能不适合移动应用软件开发环境。此外,这些软技能的分类不够全面,不能多方位体现软技能的类别。
现有的研究中将软技能分为9个类别,包括沟通技巧,人际关系技能,分析和解决问题能力,团队合作精神,组织能力,快速学习能力,独立工作能力,创新能力和适应能力。但是其中没有涉及责任意识和主动性问题,而这也是现代移动应用软件开发工作人员必不可少的软技能。软技能文本是典型的非结构化数据,传统的分析方法是采用人工分析方法,效率低下,并且没有数据支持,主要取决于人的经验和主观意识,可靠性较低。
发明内容
本发明解决问题:填补移动应用软件开发中软技能研究内容空缺,提出一种app软件工程师软技能分类***及方法,使用文本挖掘技术和层次聚类算法来实现软技能提取和分类功能,这是针对非结构化数据应用较为广泛的方法,可以快速提取用户感兴趣的信息,解决传统人工提取软技能方法的效率低下、准确率低问题,同时以大量文本数据为依托,增加了软技能提取分类的可靠性。
本发明技术解决方案:一种app软件工程师软技能分类***,包括数据收集和清理模块、全文预处理模块和建立类别模块;其中:
数据收集和清理模块,实现从数据源招聘网站收集数据及数据过滤筛选的功能,最终得到包含移动软件开发人员技能需求的文本数据。首先构建了一组搜索关键字:移动开发、安卓/Android工程师、IOS工程师;搜索并使用Python语言编写的网页抓取工具获取了众多个招聘广告。招聘网站上发布的招聘广告中主要包含四方面内容,分别是职位名称、职位诱惑、工作描述和职位要求,只爬取职位名称中含有所定义的关键词的招聘广告,因为这些广告才和移动开发紧密相关;因为部分招聘广告中不包含职位要求,而本发明主要使用的数据就是职位要求,所以在数据集中进行查找操作,找出不包含职位要求的广告,将其从数据集中删除;最终,得到了包含职位要求的文本数据集,用于在下一模块全文预处理中继续分析;
全文预处理模块,得到数据收集和清理模块的文本数据集,从数据集中职位要求句子中筛选软技能词语。首先,从广告中提取出职位要求副标题和工作地址之间的文本,这部分文本为包括移动软件开发软技能和硬技能的职位要求;然后,依据编程语言关键字进行过滤操作,删除掉包含此类编程语言关键字的语句,从而得到纯软技能语句;接下来进行分割操作,以逗号、句号和分号为分割点将语句分割为短句;最后使用分词工具对短句进行分词,得到软技能词语数据集,将本模块得到的短句和词语数据集作为软技能分类模块的直接数据集供其调用。
建立类别模块,根据全文预处理模块得到的软技能短句和词语数据集,据此建立软技能分类和从分类结果中提取规则。首先,依据TF-IDF方法计算软技能词语在数据集中的权重,词语出现频率越高则权重越低;然后,计算软技能短句间的语义相似度,此阶段依据词语权重进行计算;接下来使用层次聚类算法,对软技能短句进行聚类操作,得到软技能分类结果;最后,构造分类器,从分类结果中提取规则作为分类器类的代表。
一种app软件工程师软技能分类方法,步骤如下:
(1)使用的原始数据为从在线招聘网站拉勾网中提取出来的,首先构建了一组搜索关键字:移动开发、安卓/Android工程师、IOS工程师。搜索并使用Python语言编写的网页抓取工具获取了职位名称中包含所定义关键字的众多个招聘广告。接下来从招聘广告中筛选出不包含职位要求的数据文本,将其丢弃,将剩余数据集交至全文预处理模块使用。
(2)本发明提取各个广告的职位要求中的文本存储到数据库中。考虑到每个记录中可能包括一个以上的软技能要求,根据三种标点符号,即逗号,分号和句号将这些长句缩短为短句,以确保每句短句涉及最小的技能要求;之后过滤职位要求文本中的硬技能,使用编程语言的名字如C,JAVA,Python和PHP等作为关键字进行过滤;最后,使用分词工具JieBa对已获得的短句进行分词。JieBa分词工具使用Trie Tree结构实现高效的字图扫描,通过动态规划方法搜索词语分割的最大概率路径,并使用HMM模型对未记录的词语进行更好的自动识别。通过采用JieBa分词工具,我们最终得到每个短句的词语、语句集和词语集供建立类别模块调用。
(3)通过得到全文预处理模块的数据集,获得了每个招聘广告软技能要求和每个句子的名词词语相关的短句;然后,根据不同句子中词语的相似度,对这些短句进行聚类分析。首先,提出了一种计算词语权重的方法。根据TF-IDF方法,词语出现的次数越多,则词语的权重越低;之后,如果一个短句a包含与另一个短句b相同的词语,那么它们具有很高的相似性,依据词语权重计算短句的相似性。为了进行聚类,设置了一个阈值0.8,根据多个聚类实验的结果进行选择;如果短句隶属度大于0.8,可以确定其属于该类,因为可能存在几个类别,所以计算了每个类别中此短句的隶属度,并发现了最大隶属度;如果最大值小于阈值,则生成一个新类别,此短句将是新类别的第一个元素。否则,将归于隶属度最大值相对应的类别。因为在聚类算法中只考虑了同一个词的频率信息,而未考虑不同词语语义信息的影响,所以,根据语义相似度手动的归并了一些类别;最后,为了获得由一组词语或短句规则表示的最终软技能分类,构建了一个分类器;对于每个软技能分类,从上一步获得的每个类别中的短句中提取关键词作为分类器的规则。
本发明的优点在于:
(1)在现有关于移动软件应用开发的研究中,没有关于开发人员的软技能的内容,本发明创新性地提出了一种移动应用软件开发工程师软技能分类***和方法,并根据获取的招聘信息从中提取了13个软技能类别,可以从聚类结果的出现频次分析企业对各软技能的重视程度。
(2)本发明将层次聚类算法应用于招聘广告当中,通过招聘广告中的职位要求分析应聘者所需技能。提供了一种跨学科的思维,将聚类算法应用于招聘广告文本中,借助这一分析方法分析感兴趣的信息。
附图说明
图1为本发明实现流程图;
图2为本发明中数据全文预处理模块的处理例图;
图3为本发明中建立类别模块的流程图和数据流图。
具体实施方式
如图1所示,本发明一种app软件工程师软技能分类***,包括三个模块:数据收集和清理、全文预处理和建立类别,具体的技术方案描述如下:
1.数据的收集和清理
本文使用的原始数据为从在线招聘网站拉勾网中提取出来的。首先构建了一组搜索关键字:移动开发、安卓/Android工程师、IOS工程师。搜索并使用Python语言编写的网页抓取工具获取了许多个招聘广告,这些广告的职位名称中包含所定义的关键字。接下来根据广告内容构成从招聘广告中筛选出不包含职位要求的文本数据,将其丢弃。
2.全文预处理
本发明提取各个广告的职位要求中的文本存储到数据库中。考虑到每个记录中可能包括一个以上的软技能要求,根据三种标点符号(逗号,分号和句号)将这些长句缩短为短句,以确保每个短句涉及最小的技能要求。之后过滤职位要求文本中的硬技能,使用编程语言的名字如C,JAVA,Python和PHP等作为关键字进行过滤;最后,使用分词工具JieBa对已获得的短句进行分词。JieBa分词工具使用Trie Tree结构实现高效的字图扫描,通过动态规划方法搜索词语分割的最大概率路径,并使用HMM模型对未记录的词语进行更好的自动识别。通过采用JieBa分词工具,我们最终得到每个短句的词语,语句集和词语集供建立类别模块调用。本过程处理例图如图2所示。
3.构建软技能类别
通过上述数据预处理,获得了每个招聘广告软技能要求和每个句子的名词词语相关的短句。然后,根据不同句子中词语的相似度,对这些短句进行聚类分析。
首先,提出了一种计算词语权重的方法。根据TF-IDF方法,词语出现的次数越多,则词语的重量越低。根据TF-IDF方法,权重计算方程式如下:
其中,wi代表短句Swi中的词语,S代表短句集,Swi代表一组包括wi的短句,count(S)代表短句集S中词语数量之和,count(Swi)代表短句Swi中的词语数量之和,IDFwi代表wi的权重。
之后,如果一个短句a包含与另一个短句b相同的词语,那么它们具有很高的相似性。定义一个变量Sim(a,b)来表示两个短句a,b的相似度。根据每个词语的贡献,相似度计算公式如下:
其中wi和zi分别代表短句a和短句b中词语的交集和并集中的任意一个元素,故上述公式中分子部分代表对短句a和短句b中词语的交集中每个元素权重求和;分母代表对短句a和短句b中词语的并集中每个元素权重求和。
根据短句的相似性,将他们聚类以获得软技能的初步类别,该过程是通过循环迭代完成的。从第一个到最后一个短句,判断每个句子是属于现有类别还是新类别,该类别是基于相似性动态构建的。
定义Class来表示一个现有的类别集合,Classj为其中第j类;并且si表示一组短句候选人中的一个短句,其没有被分类。因此,首先定义一个隶属函数Membership(si,Classj)来表示si相对于类Classj的隶属度。方程式如下:
其中bk是Classj中的第k个短句,count(Classj)意味着计算Classj中有多少个短句。
为了进行聚类,设置了一个阈值0.8,根据多个聚类实验的结果进行选择。如果si相对于Classj的隶属度大于0.8,可以确定si可以属于Classj。因为可能存在几个类别,所以计算了si相对于每个类别的隶属度,并找到最大隶属度。如果最大值小于阈值,则生成一个新类别,si将是此新类别的第一个元素。否则,将把si归于最大隶属度相对应的类别。
因为在聚类算法中只考虑了同一个词的频率信息,而未考虑不同词语语义信息的影响。所以,根据语义相似度手动的归并了一些类别。
到目前为止,类别中的元素仍然是类似的短句。为了获得由一组词语或短句规则表示的最终软技能类别,同时方便分析以后收集的数据,需要有一个基于规则的分类器。本次收集的数据将对分类器进行初始化工作,在之后的研究中分类器规则将可能增长以包含未被分类器识别但符合要求的类别短语,所以以此构建了一个分类器。对于每个软技能分类,从上一步获得的每个类别中的短句中提取关键词作为分类器的规则。显然,一个类别可能会产生多个规则。确保每个短句至少符合一条规则。
例如,发现类n(善于表达)具有与类1(沟通能力好)相似的含义,将它们归并到交流技能类别中。合并之后的类别,通过抽取类别规则来代表该类别,比如,在上述类别中得到了沟通技巧要求类别,然后提取了“沟通能力”和“善于交流”这两个规则组合作为这个类的代表。同时为了保证每个类别中的短句均被正确识别,需要对类别短句进行分类器筛选,以保证类别里的每一个短句都被规则正确区分。
数据预处理中的脏数据(脏数据是指通过硬技能筛选无法过滤掉,但是和软技能无关的职位要求,例如“简历请附作品”这种字样)在预处理中无法清除,因此添加了一个脏类,以处理脏数据,并为其构建分类器规则,但此类不会在分类中显示。在聚类中所有不相关的类都将被添加到此类别中,用于在下一个循环中进行聚类。
重复聚类和提取规则的过程,直到没有分组的数据为空,或者最终结果缓慢改进,类别数量和规则数量缓慢增加。图3是聚类和规则提取的流程图和数据流图。最终,我们获得了移动开发人员软技能要求的分类,软技能类别结果如表1所示。实施中爬取了5423条招聘广告,表1中数量一列表示有多少个招聘广告包含此技能。
表1软技能类别
序号 内容 数量 比例
1 沟通能力 2668 61.33%
2 团队合作 2608 59.95%
3 分析和解决问题能力 2039 46.87%
4 责任感 1683 38.69%
5 快速学习能力 1458 33.51%
6 开展挑战性工作 1138 26.16%
7 编码习惯 930 21.38%
8 承受压力 704 16.18%
9 独立工作 558 12.83%
10 积极的工作态度 471 10.83%
11 组织能力 339 7.79%
12 创新能力 326 7.49%
13 英文阅读能力 278 6.39%
提供以上实施例仅仅是为了描述本发明的目的,而并非要限制本发明的范围。本发明的范围由所附权利要求限定。不脱离本发明的精神和原理而做出的各种等同替换和修改,均应涵盖在本发明的范围之内。

Claims (2)

1.一种app软件工程师软技能分类***,其特征在于:包括数据收集和清理模块、全文预处理模块和建立类别模块;其中:
数据收集和清理模块,实现从数据源招聘网站收集数据及数据过滤筛选的功能,最终得到包含移动软件开发人员技能需求的文本数据;招聘网站上发布的招聘广告一般包括四方面核心内容:职位名称、职位诱惑、工作描述和职位要求,其后是工作地址;首先构建一组搜索关键字:移动开发、安卓/Android工程师、IOS工程师;搜索并采用网页抓取工具,获得职位名称中含有所定义关键字的众多个招聘广告;招聘广告中包含的内容形成数据集;在数据集中进行查找操作,找出不包含职位要求的广告,并将不包含职位要求的广告从数据集中删除,最终得到包含职位要求的数据集,用于全文预处理中继续分析;
全文预处理模块,从包含职位要求的数据集中有关职位要求的句子中筛选软技能词语;首先,提取出职位要求副标题和工作地址之间的文本,所述文本为包括移动软件开发软技能和硬技能的职位要求;然后进行分割操作,以逗号、句号和分号为分割点将职位要求部分语句分割为短句;然后,依据和编程语言相关的关键字进行过滤操作,删除掉包含此类关键字的硬技能语句,从而得到纯软技能短句;最后通过对纯软技能短句进行分词,得到软技能词语集合,软技能词语集合包括软技能短句和软技能词语数据集,将软技能短句和软技能词语数据集作为直接数据集供建立类别模块调用;
建立类别模块,根据全文预处理模块得到的软技能短句和软技能词语数据集,实现据此建立软技能类别和从类别结果中提取规则的功能;首先,依据TF-IDF方法计算软技能词语在数据集中的权重,词语出现频率越高则权重越低;然后,计算软技能短句间的语义相似度,此阶段依据词语权重进行计算;再使用层次聚类算法,对软技能短句进行聚类操作,得到软技能聚类结果;最后构造分类器,从聚类结果中提取规则作为分类器类的代表。
2.一种app软件工程师软技能分类方法,其特征在于步骤如下:
(1)数据收集和清理步骤:使用的原始数据是从在线招聘网站拉勾网中获取的,首先通过构建了一组搜索关键字:移动开发、安卓/Android工程师、IOS工程师,搜索并采用网页抓取工具,获得众多个含有所定义关键字的移动开发类招聘广告;接下来在数据集中查找,从招聘广告中筛选出不包含职位要求的数据文本,将其丢弃,将剩余数据集交至全文预处理步骤使用;
(2)全文预处理步骤:提取各个广告的职位要求中的文本存储到数据库中,以逗号、句号和分号为分割点将这些长句缩短为短句;之后,使用与编程语言相关的关键字过滤掉职位要求文本中的硬技能,得到软技能短句数据集;最后,使用分词工具对已获得的短句进行分词,最终得到每个短句的词语数据集,软技能短句和软技能词语数据集供建立类别模块调用;
(3)建立类别步骤:得到全文预处理步骤的软技能短句和软技能词语数据集后,根据不同短句中词语的相似度进行聚类分析操作;首先,提出了一种计算词语权重的方法,根据TF-IDF方法,词语出现的次数越多,则词语的权重越低;之后,依据词语权重计算短句的相似性;设置了阈值0.8,如果短句隶属度大于阈值,确定短句属于该类;如果隶属度小于阈值,则生成一个新类别,此短句将是新类别的第一个元素;然后,根据语义相似度手动地归并了一些类别;最后,通过聚类结果构建了基于规则分类器以方便之后的研究分析,从上一步获得的每个类别集合中的短句中提取关键词作为分类器的规则代表。
CN201710544531.0A 2017-07-06 2017-07-06 一种app软件工程师软技能分类***及方法 Active CN107194617B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710544531.0A CN107194617B (zh) 2017-07-06 2017-07-06 一种app软件工程师软技能分类***及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710544531.0A CN107194617B (zh) 2017-07-06 2017-07-06 一种app软件工程师软技能分类***及方法

Publications (2)

Publication Number Publication Date
CN107194617A true CN107194617A (zh) 2017-09-22
CN107194617B CN107194617B (zh) 2020-11-24

Family

ID=59881385

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710544531.0A Active CN107194617B (zh) 2017-07-06 2017-07-06 一种app软件工程师软技能分类***及方法

Country Status (1)

Country Link
CN (1) CN107194617B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107506389A (zh) * 2017-07-27 2017-12-22 北京德塔精要信息技术有限公司 一种提取职位技能需求的方法和装置
CN108460699A (zh) * 2017-12-20 2018-08-28 卓智网络科技有限公司 教学计划优化方法和装置
CN108549640A (zh) * 2018-04-24 2018-09-18 易联众信息技术股份有限公司 一种基于统计学的企业名称相似度计算方法
CN109934302A (zh) * 2019-03-23 2019-06-25 大国创新智能科技(东莞)有限公司 新类别识别方法和基于模糊理论和深度学习的机器人***
CN110033022A (zh) * 2019-03-08 2019-07-19 腾讯科技(深圳)有限公司 文本的处理方法、装置和存储介质
CN110377907A (zh) * 2019-07-18 2019-10-25 中科鼎富(北京)科技发展有限公司 一种招聘信息标准化方法及装置
CN112434211A (zh) * 2020-11-04 2021-03-02 广州视源电子科技股份有限公司 一种数据处理方法、装置、存储介质及设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102622373A (zh) * 2011-01-31 2012-08-01 中国科学院声学研究所 一种基于tf*idf算法的统计学文本分类***及方法
CN102708096A (zh) * 2012-05-29 2012-10-03 代松 一种基于语义的网络智能舆情监测***及其工作方法
WO2013085102A1 (ko) * 2011-12-09 2013-06-13 (주)네오위즈게임즈 온라인 게임의 캐릭터 운용방법 및 장치
CN104866572A (zh) * 2015-05-22 2015-08-26 齐鲁工业大学 一种网络短文本聚类方法
CN105468713A (zh) * 2015-11-19 2016-04-06 西安交通大学 一种多模型融合的短文本分类方法
CN105512864A (zh) * 2016-01-28 2016-04-20 丁沂 一种基于互联网的岗位职业能力需求的自动获取方法
US20160109257A1 (en) * 2004-11-16 2016-04-21 Microsoft Technology Licensing, Llc Methods for automated and semiautomated composition of visual sequences, flows, and flyovers based on content and context
WO2017014124A1 (ja) * 2015-07-21 2017-01-26 東亞合成株式会社 硬化性組成物
CN106570076A (zh) * 2016-10-11 2017-04-19 深圳大学 一种计算机文本分类***

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160109257A1 (en) * 2004-11-16 2016-04-21 Microsoft Technology Licensing, Llc Methods for automated and semiautomated composition of visual sequences, flows, and flyovers based on content and context
CN102622373A (zh) * 2011-01-31 2012-08-01 中国科学院声学研究所 一种基于tf*idf算法的统计学文本分类***及方法
WO2013085102A1 (ko) * 2011-12-09 2013-06-13 (주)네오위즈게임즈 온라인 게임의 캐릭터 운용방법 및 장치
CN102708096A (zh) * 2012-05-29 2012-10-03 代松 一种基于语义的网络智能舆情监测***及其工作方法
CN104866572A (zh) * 2015-05-22 2015-08-26 齐鲁工业大学 一种网络短文本聚类方法
WO2017014124A1 (ja) * 2015-07-21 2017-01-26 東亞合成株式会社 硬化性組成物
CN105468713A (zh) * 2015-11-19 2016-04-06 西安交通大学 一种多模型融合的短文本分类方法
CN105512864A (zh) * 2016-01-28 2016-04-20 丁沂 一种基于互联网的岗位职业能力需求的自动获取方法
CN106570076A (zh) * 2016-10-11 2017-04-19 深圳大学 一种计算机文本分类***

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107506389A (zh) * 2017-07-27 2017-12-22 北京德塔精要信息技术有限公司 一种提取职位技能需求的方法和装置
CN107506389B (zh) * 2017-07-27 2020-05-19 北京德塔精要信息技术有限公司 一种提取职位技能需求的方法和装置
CN108460699A (zh) * 2017-12-20 2018-08-28 卓智网络科技有限公司 教学计划优化方法和装置
CN108549640A (zh) * 2018-04-24 2018-09-18 易联众信息技术股份有限公司 一种基于统计学的企业名称相似度计算方法
CN110033022A (zh) * 2019-03-08 2019-07-19 腾讯科技(深圳)有限公司 文本的处理方法、装置和存储介质
CN109934302A (zh) * 2019-03-23 2019-06-25 大国创新智能科技(东莞)有限公司 新类别识别方法和基于模糊理论和深度学习的机器人***
CN110377907A (zh) * 2019-07-18 2019-10-25 中科鼎富(北京)科技发展有限公司 一种招聘信息标准化方法及装置
CN110377907B (zh) * 2019-07-18 2023-09-08 鼎富智能科技有限公司 一种招聘信息标准化方法及装置
CN112434211A (zh) * 2020-11-04 2021-03-02 广州视源电子科技股份有限公司 一种数据处理方法、装置、存储介质及设备

Also Published As

Publication number Publication date
CN107194617B (zh) 2020-11-24

Similar Documents

Publication Publication Date Title
CN110597735B (zh) 一种面向开源软件缺陷特征深度学习的软件缺陷预测方法
CN107194617A (zh) 一种app软件工程师软技能分类***及方法
CN109189901B (zh) 一种智能客服***中自动发现新分类以及对应语料的方法
CN109783639B (zh) 一种基于特征提取的调解案件智能分派方法及***
CN112699246B (zh) 基于知识图谱的领域知识推送方法
CN107239529A (zh) 一种基于深度学习的舆情热点类别划分方法
CN107315738B (zh) 一种文本信息的创新度评估方法
CN109189942A (zh) 一种专利数据知识图谱的构建方法及装置
CN106777043A (zh) 一种基于lda的学术资源获取方法
CN109271477A (zh) 一种借助互联网构建分类语料库的方法及***
CN107992633A (zh) 基于关键词特征的电子文档自动分类方法及***
CN102194013A (zh) 一种基于领域知识的短文本分类方法及文本分类***
CN107885793A (zh) 一种微博热点话题分析预测方法及***
CN106021410A (zh) 一种基于机器学习的源代码注释质量评估方法
US10387805B2 (en) System and method for ranking news feeds
CN111737485A (zh) 基于知识图谱、深度学习的人岗匹配方法、人岗匹配***
CN108595525A (zh) 一种律师信息处理方法和***
CN115952292B (zh) 多标签分类方法、装置及计算机可读介质
CN108681548A (zh) 一种律师信息处理方法和***
CN110046943A (zh) 一种网络消费者细分的优化方法及优化***
Scrivens et al. Sentiment-based classification of radical text on the web
CN110910175A (zh) 一种旅游门票产品画像生成方法
CN114265935A (zh) 一种基于文本挖掘的科技项目立项管理辅助决策方法及***
CN116108191A (zh) 一种基于知识图谱的深度学习模型推荐方法
CN108681977A (zh) 一种律师信息处理方法和***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220126

Address after: 215488 No. 301, building 11, phase II, Taicang University Science Park, No. 27, Zigang Road, science and education new town, Taicang City, Suzhou City, Jiangsu Province

Patentee after: Tianhang Changying (Jiangsu) Technology Co.,Ltd.

Address before: 100191 No. 37, Haidian District, Beijing, Xueyuan Road

Patentee before: BEIHANG University

TR01 Transfer of patent right