CN108255957A - 一种基于创投领域精准数据化推荐匹配方法 - Google Patents
一种基于创投领域精准数据化推荐匹配方法 Download PDFInfo
- Publication number
- CN108255957A CN108255957A CN201711394613.8A CN201711394613A CN108255957A CN 108255957 A CN108255957 A CN 108255957A CN 201711394613 A CN201711394613 A CN 201711394613A CN 108255957 A CN108255957 A CN 108255957A
- Authority
- CN
- China
- Prior art keywords
- score value
- project
- investor
- keyword
- investment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/06—Asset management; Financial planning or analysis
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- Operations Research (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Human Resources & Organizations (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种基于创投领域精准数据化推荐匹配方法,可以高效地将创业者的项目与投资人的需求进行对接。创业者通过客户端向服务器上传项目的结构化信息,投资人通过客户端向服务器上传投资偏好信息;服务器将提取的所有文字内容拼接后的内容打散成关键词;将关键词的词频除以逆词频,得出该关键词在项目中重要性分值;通过领域和关键词的关联关系,得出投资人分词分值;将关键词在项目中重要性分值和投资人分词分值组成向量,然后进行向量余弦夹角计算得出领域分值;计算投资人最终对项目分值=领域分值×a%+城市分值×b%+融资阶段分值×c%;根据各投资人最终对项目分值进行从高到低排序,得出排名靠前的投资人,就是匹配到的结果。
Description
技术领域
本发明涉及一种基于创投领域精准数据化推荐匹配方法。
背景技术
创投是创业投资的简称。创业投资是指专业投资人员(创业投资家)为以高科技为基础的创新公司提供融资的活动。与一般的投资家不同,创业投资家不仅投入资金,而且用他们长期积累的经验、知识和信息网络帮助企业管理人员更好地经营企业。
创业者将项目推荐给投资人的途径非常重要。创业者在投递项目的过程中,并不了解哪些投资人会对自己的项目感兴趣,盲目的投递项目,效率低下;而对于投资人来说,收到大量其不感兴趣的项目,需要浪费大量的时间对这些项目进行筛选和处理,投资人主动去查找项目,面对海量的项目,筛选也是一个耗费精力的事情。目前,还没有一种高效的方法将创业者的项目与投资人的需求进行对接。
发明内容
本发明的目的在于克服现有技术中存在的上述不足,而提供一种设计合理的基于创投领域精准数据化推荐匹配方法,可以高效地将创业者的项目与投资人的需求进行对接。
本发明解决上述问题所采用的技术方案是:一种基于创投领域精准数据化推荐匹配方法,其特征在于:步骤为:
一、创业者通过客户端向服务器上传项目的结构化信息,结构化信息包括项目的所属城市、融资阶段、融资金额、项目材料,服务器收集这些结构化信息;
投资人通过客户端向服务器上传投资偏好信息,投资偏好信息包括投资领域、投资城市、投资阶段、投资金额;服务器收集这些投资偏好信息;
二、服务器从项目材料中提取项目的文字内容;
三、服务器将提取的所有文字内容拼接;
四、服务器将拼接后的内容打散形成关键词,关键词根据在拼接后内容中的词频从高到底排列;
五、循环每一个步骤四中的关键词,查找其出现在通用词库中的词频,关键词在通用词库中的词频称之为逆词频;
六、关键词的词频除以逆词频,得出该关键词在项目中重要性分值,按重要性分值从高到低,取靠前的数个关键词;
七、将关键词跟领域进行关联;
八、通过领域和关键词的关联关系,得出投资人分词分值;
九、将关键词在项目中重要性分值和投资人分词分值组成向量,然后进行向量余弦夹角计算得出领域分值;
十、将项目的所属城市设为一固定分值,将投资人的投资城市设为某一分值,将两个分值组成向量,并进行向量余弦夹角计算得出城市分值;将项目的融资阶段设为一固定分值,与投资人的投资阶段设为某一分值,将两个分值组成向量,并进行向量余弦夹角计算得出融资分值,再计算投资人最终对项目分值=领域分值×a%+城市分值×b%+融资阶段分值×c%;
十一、根据各投资人最终对项目分值进行从高到低排序,得出排名靠前的投资人,就是匹配到的结果,再将匹配结果中投资金额大于融资金额的投资人反馈给创业者。
本发明所述的项目材料包括简介、一句话介绍、商业计划书。
本发明所述的a为70,b为20,c为10。
本发明与现有技术相比,具有以下优点和效果:帮助创业者快速发现对自己项目感兴趣的投资人,提高对接效;帮助投资人挖掘感兴趣的项目,提高工作效率;实现了精准数据化的推荐匹配。
具体实施方式
下面通过实施例对本发明作进一步的详细说明,以下实施例是对本发明的解释而本发明并不局限于以下实施例。
实施例。
本实施例步骤为:
一、创业者通过APP等客户端向服务器上传项目的结构化信息,结构化信息包括项目的所属城市、融资阶段、融资金额、项目材料,项目材料包括简介、一句话介绍、商业计划书等文字材料;服务器收集这些结构化信息;
投资人通过APP等客户端向服务器上传投资偏好信息,投资偏好信息包括投资领域、投资城市、投资阶段、投资金额;服务器收集这些投资偏好信息;
二、服务器使用Apache的pdfbox库提取项目材料中商业计划书的文字内容;
三、服务器将简介、一句话介绍和商业计划书这些项目材料里提取的所有文字内容拼接,拼接方法为按页提取,串行拼接;
四、服务器将上面拼接后的内容通过汉语言处理库HanLP中的TextRank关键词方法打散成大于2个字、小于5个字的关键词,关键词根据在拼接后内容中的词频从高到底排列;
五、循环每一个步骤四中的关键词,查找其出现在通用词库(如Google搜索结果)中的词频,关键词在通用词库中的词频称之为逆词频;
六、关键词的词频除以逆词频,得出该关键词在项目中重要性分值,按重要性分值从高到低,取靠前的10个关键词;
七、将步骤六取出的关键词跟领域进行关联,通过人工审核,判断该关键词是否属于当前领域,建立一对一的关联关系;
八、通过领域和关键词的关联关系,计算出投资人对关键词的喜好程度的分值,如果领域和关键词有关联关系,则投资人对领域的喜好程度的分值则为投资人对关键词的喜好程度的分值,比如:投资人对领域A的喜好程度是8分,而领域A跟关键词b有关联关系,则得出投资人对关键词b的喜好程度也为8分;投资人对关键词的喜好程度的分值即为投资人分词分值;投资人对某领域的喜好程度的分值是对投资人偏好某个领域程度的一个数字量化,由投资人自己填写或者IR人员维护得出,或者通过***对投资人对某领域的关注度进行加权计算得出;
九、将步骤六取出的关键词在项目中重要性分值和投资人分词分值组成向量,然后进行向量余弦夹角计算得出领域分值;
十、将项目的所属城市设为一固定分值,将投资人的投资城市设为某一分值,将两个分值组成向量,并进行向量余弦夹角计算得出城市分值;将项目的融资阶段设为一固定分值,与投资人的投资阶段设为某一分值,将两个分值组成向量,并进行向量余弦夹角计算得出融资分值,再计算投资人最终对项目分值=领域分值×a%+城市分值×b%+融资阶段分值×c%;投资城市和投资阶段由人工进行维护调整;
十一、根据各投资人最终对项目分值进行从高到低排序,得出排名靠前的投资人,就是匹配到的结果,再将匹配结果中投资金额大于融资金额的投资人反馈给创业者。
此外,需要说明的是,本说明书中所描述的具体实施例,其零、部件的形状、所取名称等可以不同,本说明书中所描述的以上内容仅仅是对本发明结构所作的举例说明。凡依据本发明专利构思所述的构造、特征及原理所做的等效变化或者简单变化,均包括于本发明专利的保护范围内。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离本发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。
Claims (3)
1.一种基于创投领域精准数据化推荐匹配方法,其特征在于:步骤为:
一、创业者通过客户端向服务器上传项目的结构化信息,结构化信息包括项目的所属城市、融资阶段、融资金额、项目材料,服务器收集这些结构化信息;
投资人通过客户端向服务器上传投资偏好信息,投资偏好信息包括投资领域、投资城市、投资阶段、投资金额;服务器收集这些投资偏好信息;
二、服务器从项目材料中提取项目的文字内容;
三、服务器将提取的所有文字内容拼接;
四、服务器将拼接后的内容打散形成关键词,关键词根据在拼接后内容中的词频从高到底排列;
五、循环每一个步骤四中的关键词,查找其出现在通用词库中的词频,关键词在通用词库中的词频称之为逆词频;
六、关键词的词频除以逆词频,得出该关键词在项目中重要性分值,按重要性分值从高到低,取靠前的数个关键词;
七、将关键词跟领域进行关联;
八、通过领域和关键词的关联关系,得出投资人分词分值;
九、将关键词在项目中重要性分值和投资人分词分值组成向量,然后进行向量余弦夹角计算得出领域分值;
十、将项目的所属城市设为一固定分值,将投资人的投资城市设为某一分值,将两个分值组成向量,并进行向量余弦夹角计算得出城市分值;将项目的融资阶段设为一固定分值,与投资人的投资阶段设为某一分值,将两个分值组成向量,并进行向量余弦夹角计算得出融资分值,再计算投资人最终对项目分值=领域分值×a%+城市分值×b%+融资阶段分值×c%;
十一、根据各投资人最终对项目分值进行从高到低排序,得出排名靠前的投资人,就是匹配到的结果,再将匹配结果中投资金额大于融资金额的投资人反馈给创业者。
2.根据权利要求1所述的基于创投领域精准数据化推荐匹配方法,其特征在于:所述的项目材料包括简介、一句话介绍、商业计划书。
3.根据权利要求1所述的基于创投领域精准数据化推荐匹配方法,其特征在于:所述的a为70,b为20,c为10。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711394613.8A CN108255957A (zh) | 2017-12-21 | 2017-12-21 | 一种基于创投领域精准数据化推荐匹配方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711394613.8A CN108255957A (zh) | 2017-12-21 | 2017-12-21 | 一种基于创投领域精准数据化推荐匹配方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108255957A true CN108255957A (zh) | 2018-07-06 |
Family
ID=62723725
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711394613.8A Pending CN108255957A (zh) | 2017-12-21 | 2017-12-21 | 一种基于创投领域精准数据化推荐匹配方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108255957A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109118362A (zh) * | 2018-07-26 | 2019-01-01 | 北京洪泰同创信息技术有限公司 | 商业性投融资交易的方法和装置 |
CN110134761A (zh) * | 2019-04-16 | 2019-08-16 | 深圳壹账通智能科技有限公司 | 判决文书信息检索方法、装置、计算机设备和存储介质 |
CN112488842A (zh) * | 2020-12-14 | 2021-03-12 | 天津北晟企业服务有限公司 | 投资机构推荐方法和装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101515361A (zh) * | 2008-02-18 | 2009-08-26 | 熊一 | 一种利用互联网的快速融资方法 |
CN103825951A (zh) * | 2014-02-28 | 2014-05-28 | 惠州学院 | 一种云计算协同创新平台及其实施方法 |
CN104361102A (zh) * | 2014-11-24 | 2015-02-18 | 清华大学 | 一种基于群组匹配的专家推荐方法及*** |
CN105205719A (zh) * | 2014-05-30 | 2015-12-30 | 武汉元宝创意科技有限公司 | 一种基于项目相关度的筹资的方法与*** |
CN106201465A (zh) * | 2016-06-23 | 2016-12-07 | 扬州大学 | 面向开源社区的软件项目个性化推荐方法 |
CN106372772A (zh) * | 2015-07-23 | 2017-02-01 | 张海霞 | 一种创业伙伴匹配*** |
CN106776881A (zh) * | 2016-11-28 | 2017-05-31 | 中国科学院软件研究所 | 一种基于微博平台的领域信息推荐***及方法 |
-
2017
- 2017-12-21 CN CN201711394613.8A patent/CN108255957A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101515361A (zh) * | 2008-02-18 | 2009-08-26 | 熊一 | 一种利用互联网的快速融资方法 |
CN103825951A (zh) * | 2014-02-28 | 2014-05-28 | 惠州学院 | 一种云计算协同创新平台及其实施方法 |
CN105205719A (zh) * | 2014-05-30 | 2015-12-30 | 武汉元宝创意科技有限公司 | 一种基于项目相关度的筹资的方法与*** |
CN104361102A (zh) * | 2014-11-24 | 2015-02-18 | 清华大学 | 一种基于群组匹配的专家推荐方法及*** |
CN106372772A (zh) * | 2015-07-23 | 2017-02-01 | 张海霞 | 一种创业伙伴匹配*** |
CN106201465A (zh) * | 2016-06-23 | 2016-12-07 | 扬州大学 | 面向开源社区的软件项目个性化推荐方法 |
CN106776881A (zh) * | 2016-11-28 | 2017-05-31 | 中国科学院软件研究所 | 一种基于微博平台的领域信息推荐***及方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109118362A (zh) * | 2018-07-26 | 2019-01-01 | 北京洪泰同创信息技术有限公司 | 商业性投融资交易的方法和装置 |
CN110134761A (zh) * | 2019-04-16 | 2019-08-16 | 深圳壹账通智能科技有限公司 | 判决文书信息检索方法、装置、计算机设备和存储介质 |
CN112488842A (zh) * | 2020-12-14 | 2021-03-12 | 天津北晟企业服务有限公司 | 投资机构推荐方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108255957A (zh) | 一种基于创投领域精准数据化推荐匹配方法 | |
CN107657056B (zh) | 基于人工智能展示评论信息的方法和装置 | |
CN102682120B (zh) | 一种网络评论精华文本的获取方法和装置 | |
CN105975453A (zh) | 评论标签提取方法和装置 | |
CN104991890A (zh) | 一种基于汉越词对齐语料构建越南语依存树库的方法 | |
CN103246603A (zh) | 一种缺陷跟踪***的软件缺陷报告自动分发方法 | |
CN108009248A (zh) | 一种数据分类方法和*** | |
CN106339486A (zh) | 一种基于大规模词汇树的增量学习的图像检索方法 | |
CN106649732A (zh) | 一种信息推送方法及装置 | |
CN103309851A (zh) | 短文本的垃圾识别方法及*** | |
CN108563688B (zh) | 一种影视剧本人物情绪识别方法 | |
CN109189910A (zh) | 一种面向移动应用问题报告的标签自动推荐方法 | |
CN104537128A (zh) | 一种网页信息提取方法及装置 | |
CN114443632A (zh) | 一种学分银行学分智能转换方法及***、计算机设备 | |
Hansson | How to produce quality theses at universities in a large scale: SciPro IT system—Supporting the Scientific Process | |
Putri et al. | The use of slang among american youths as related to the rise of hip hop culture: a sociolinguistics analysis | |
Cetto et al. | Organized access to the Ibero-American quality journals: The PPL experience | |
Susanto et al. | OPTIMALISASI STRATEGI PEMASARAN PEMBIAYAAN MURABAHAH DALAM MENINGKATKAN JUMLAH ANGGOTA KOPERASI SYARIAH | |
Rostika et al. | Pelatihan Technopreneurship melalui Social Commerce dan Branded Content Management bagi Mahasiswa Pendidikan Multimedia | |
Gao et al. | A Study on the Correlation between English Translation and Rural E-commerce under the Background of Cross-border E-commerce | |
CN106203676A (zh) | 一种基于云计算架构的业务流程优化方法 | |
Sudiono et al. | KUMANDANG SHOLAWAT DI SEKOLAH KRISTEN: A POLICY ON AN INTER-FAITH DIALOGUE IN A CHRISTIAN SCHOOL | |
DE102011055672A1 (de) | Verfahren zur Extraktion und Übersetzung eines Sprachinhalts, Vorrichtung auf dem das Verfahren durchführbar gespeichert ist und Verwendung eines dezentralen Netzwerks zur Durchführung des Verfahrens | |
Suputra et al. | Development Curriculum Management Office Integrated Independent Campus Program to Optimize 21st Century Learning for Management Students | |
Dehshiri et al. | The Impact of Tourism Policy on Cultural Diplomacy of the Islamic Republic of Iran in Central Asia (1990-2017) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180706 |