JP6941803B1 - 検索システム、検索方法及び検索プログラム - Google Patents
検索システム、検索方法及び検索プログラム Download PDFInfo
- Publication number
- JP6941803B1 JP6941803B1 JP2021111717A JP2021111717A JP6941803B1 JP 6941803 B1 JP6941803 B1 JP 6941803B1 JP 2021111717 A JP2021111717 A JP 2021111717A JP 2021111717 A JP2021111717 A JP 2021111717A JP 6941803 B1 JP6941803 B1 JP 6941803B1
- Authority
- JP
- Japan
- Prior art keywords
- company
- search
- words
- feature
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
これまで取引がない新しいビジネスパートナーをインターネットで探す場合、検索ユーザはパーソナルコンピュータ等の画面に表示されるWebブラウザ上でキーワードを入力し、そのキーワードがヒットした企業をビジネスパートナーの候補としてリストアップする。この際に用いられるキーワードの多くは、商材やその特徴等の製品や材料に関する単語であるが、検索ユーザの経験や知識に基づいて選択されるため、ユーザのスキルや経験の差が検索結果に表れてしまうことが多い。そこで、入力されたキーワードに関連するキーワード技術を企業情報から抽出して両者の類似度を算出した上で企業を検索する技術が知られている(例えば、特許文献1参照)。
図1は、本発明の一実施形態に係る検索システム1の構成図である。図1に示すように、本実施形態に係る検索システム1は、複数のユーザ端末10と管理サーバ20で構成され、それぞれインターネット等の有線又は無線のネットワーク30で通信可能に接続されている。以下では、ビジネスパートナー企業の探索を含む企業マッチングサービスを提供する企業(以下、「管理企業」という)に上記検索システム1が導入され、SaaS(Software as a Service)型のクラウドサービスによって以下で詳述するビジネスパートナー候補企業の検索やその他の各種処理が行われるものとする。
管理サーバ20のデータベース構築部26は、ユーザ端末10によるキーワード検索に先立って、ユーザ端末10又はその他の外部装置(不図示)等から候補企業の公開企業情報及び非公開企業情報を取得し、その情報を企業ごとに企業データベース221に新規に記憶又は既存情報の更新を行う。
管理サーバ20のデータベース構築部26は、さらにユーザ端末10によるキーワード検索に先立って各企業が保有する潜在的な技術特徴等をタグ付けするための基礎となる技術タグ情報をユーザ端末10又はその他の外部装置(不図示)から取得し、技術タグデータベース222に新規に記憶又は既存情報を更新する。本実施形態では、上記企業データベース221の構築と同時又はそれと前後して技術タグ情報を取得し、技術タグデータベース222を構築する。技術タグ情報には、前述のように、規格タグ、設備タグ及び受賞歴タグが含まれる。
管理サーバ20の特徴語生成部27は、企業データベース221の企業情報(テキストデータ)から企業ごとに特徴語とそのスコアを生成して、それらを特徴語データベース223に新規に記憶又は既存情報を更新する。
なお、スコアの指標や次元数についてはこれに限定されるものではなく、実装するシステムの性質や目的によって適宜変更するようにしてもよい。
管理サーバ20の学習モデル生成部28は、製造業に関する技術文書中に含まれる特徴語を周辺の特徴語から予測させる深層学習を行ってそれぞれの特徴語を高次元ベクトルの分散表現で構築した学習モデル(学習済みモデル)を生成し、学習モデルデータベース224に特徴語ごとに新規に記憶又は記憶情報を更新する。
ビジネスパートナー候補企業のリストアップをキーワード検索に基づいて行う場合、通常は複数の異なるキーワードを同時に、又は逐次入力し、適切な候補企業がリストアップされるように検索結果を絞り込んでいくという作業が発生する。そこで、本実施形態では、ビジネスパートナー候補企業のリストアップを行うユーザが、ユーザ端末10で一つ目のキーワードを入力し、そのキーワードと一致するテキストデータが企業データベース221に記憶された企業情報に含まれているか、そのキーワードに対応する特徴語が特徴語データベース223に保持されている企業をリストアップする(ステップS12)。この際、管理サーバ20は、入力されたキーワードに基づいて候補企業のリストを生成するが、そのリストに候補企業が持つ複数の特徴語を含めることで、そのユーザが候補企業の絞り込み検索を行う際のキーワード候補をユーザ端末10を介してユーザに示唆することができる。図7は、本発明の一実施形態に係る検索システム1の管理サーバ20における新たなキーワード候補(特徴語)の生成処理(ステップS12)の詳細を説明するためのフローチャートである。
上述の処理により、ユーザは二つのキーワード「樹脂成型」及び「試作」を用いてビジネスパートナー候補企業のリストアップを行うことを決定する。
次に、類似度計算部24は、取得した2つのキーワードと検索された企業との類似度を計算する(ステップS15)。図9は、本発明の一実施形態に係る検索システム1の管理サーバ20における類似度計算処理(ステップS15)の詳細を説明するためのフローチャートである。
ここで、上述した類似度はそのままのレーティングだけではビジネスマッチングシステムとしての信頼性は低い可能性がある。これは単に公開情報等のキーワードだけで類似度を見ているためである。そこで、本実施形態では、過去のビジネスパートナー探索において取得されたプロジェクト案件での入力情報や、さらに実際に発注企業と受注候補企業とが面談に進んでいる等の付加情報を非公開企業情報として企業データベース221に記憶させ、それらを含む結合テキストデータから特徴語を生成することで、より高い信頼性を持つ検索システムを構築している。
ここでは、データベース構築部26による非公開企業情報の取得及び企業データベース221への記憶処理の詳細について説明する。
上述の実施形態では、企業検索のために入力されるキーワード(ステップS121で管理サーバ20が取得するキーワード)と、その取得キーワードに基づいてステップS122で検索され、ステップS123でその取得キーワードとの類似度が計算される候補企業が保有する特徴語との間の類似度を考慮しているが、入力されるキーワードの周辺キーワード(入力キーワードに類似するキーワード)との類似語は考慮していない。そこで、上記類似度計算処理(ステップS123)に代えて、入力されるキーワードの周辺キーワードと候補企業が保有する特徴語との間の類似度を計算する別の実施形態も考えられる。
前述したコサイン類似度計算(ステップS153)を通じた候補企業リスト生成では、各企業の特徴語に重み付けがされていないため、幅広く企業をリストアップしたい場合に有効である。一方、上記の各企業の特徴語を基底としたベクトルを用いた類似度計算を通じた候補企業リストの生成は、よりマッチング確度が高い企業を探す場合に有効である。
また、ユーザ端末10で入力されたキーワードに対応する特徴語や学習モデルが記憶部22内に記憶されていない場合、管理サーバ20はユーザ端末10にエラーを返すような設定にすることができる。このような場合は、エラーが出たキーワードを優先的に特徴語として記憶し、その学習モデルを生成する処理を行うようにすることができる。例えば、入力されたキーワードが学習モデルに登録されていない場合は、そのキーワードを含むコーパス(テキスト)を入力として追加学習する。
10 ユーザ端末
20 管理サーバ
21 通信部
22 記憶部
23 検索部
24 類似度計算部
25 リスト生成部
26 データベース構築部
27 特徴語生成部
28 学習モデル生成部
30 ネットワーク
221 企業データベース
222 技術タグデータベース
223 特徴語データベース
224 学習モデルデータベース
Claims (6)
- ビジネスパートナー探索を目的として企業リストを生成する検索システムであって、
所定の期間内に企業から情報のアップロードを受け付ける受付手段と、
過去に実施されたビジネスパートナー探索における前記企業に関する情報及び前記受付手段でアップロードが受け付けられた前記情報から抽出された前記企業の特徴を表す複数の特徴語を企業ごとに記憶する特徴語記憶手段と、
前記複数の特徴語から一の特徴語を予測する機械学習を行って得られる前記特徴語の分散表現を特徴語ごとに記憶して学習モデルとする学習モデル記憶手段と、
入力装置から入力されたキーワードを取得する取得手段と、
前記キーワードに対応する特徴語を持つ企業を前記特徴語記憶手段から検索する検索手段と、
前記検索手段で検索された前記企業が持つ複数の特徴語に基づく分散表現と前記キーワードに対応する特徴語に基づく分散表現との類似度を計算する類似度計算手段と、
前記類似度を考慮して前記検索手段で検索された前記企業が持つ複数の特徴語を含む企業リストを生成するリスト生成手段と
を備えることを特徴とする検索システム。 - 前記類似度計算手段は、前記検索手段で検索された前記企業が持つ複数の特徴語のそれぞれの分散表現を合成した合成分散表現と前記キーワードに対応する特徴語の分散表現との類似度を計算することを特徴とする請求項1に記載の検索システム。
- 前記特徴語記憶手段は、前記複数の特徴語のそれぞれについて該特徴語の出現頻度に基づくスコアを対応付けて記憶しており、
前記類似度計算手段は、前記キーワードに対応する特徴語に類似する特徴語を前記学習モデルに基づいて計算し、前記キーワードに対応する特徴語及び該特徴語に類似する複数の特徴語とそれらの前記スコアを含む第1のベクトルと、各企業が保有する特徴語とその前記スコアを含む第2のベクトルとの類似度を計算することを特徴とする請求項1に記載の検索システム。 - 前記類似度計算手段は、前記第1のベクトルと前記第2のベクトルに含まれる同一の特徴語間のスコアの積の総和に基づいて前記類似度を計算することを特徴とする請求項3に記載の検索システム。
- ビジネスパートナー探索を目的として企業リストを生成する検索サーバにおける検索方法であって、
所定の期間内に企業から情報のアップロードを受け付ける受付工程と、
入力装置から入力されたキーワードを取得する取得工程と、
前記キーワードに対応する特徴語を持つ企業を、過去に実施されたビジネスパートナー探索における前記企業に関する情報及び前記受付工程でアップロードが受け付けられた前記情報から抽出された前記企業の特徴を表す複数の特徴語を企業ごとに記憶する特徴語データベースから検索する検索工程と、
前記複数の特徴語から一の特徴語を予測する機械学習を行って得られる前記特徴語の分散表現を特徴語ごとに記憶して学習モデルとする学習モデルデータベースを参照して、前記検索工程で検索された前記企業が持つ複数の特徴語に基づく分散表現と前記キーワードに対応する特徴語に基づく分散表現との類似度を計算する類似度計算工程と、
前記類似度を考慮して前記検索工程で検索された前記企業が持つ複数の特徴語を含む企業リストを生成するリスト生成工程と
を有することを特徴とする検索方法。 - ビジネスパートナー探索を目的として企業リストを生成する検索サーバに、
所定の期間内に企業から情報のアップロードを受け付ける受付手順と、
入力装置から入力されたキーワードを取得する取得手順と、
前記キーワードに対応する特徴語を持つ企業を、過去に実施されたビジネスパートナー探索における前記企業に関する情報及び前記受付手順でアップロードが受け付けられた前記情報から抽出された前記企業の特徴を表す複数の特徴語を企業ごとに記憶する特徴語データベースから検索する検索手順と、
前記複数の特徴語から一の特徴語を予測する機械学習を行って得られる前記特徴語の分散表現を特徴語ごとに記憶して学習モデルとする学習モデルデータベースを参照して、前記検索手順で検索された前記企業が持つ複数の特徴語に基づく分散表現と前記キーワードに対応する特徴語に基づく分散表現との類似度を計算する類似度計算手順と、
前記類似度を考慮して前記検索手順で検索された前記企業が持つ複数の特徴語を含む企業リストを生成するリスト生成手順と
を実行させるためのコンピュータ読み取り可能な検索プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021111717A JP6941803B1 (ja) | 2021-07-05 | 2021-07-05 | 検索システム、検索方法及び検索プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021111717A JP6941803B1 (ja) | 2021-07-05 | 2021-07-05 | 検索システム、検索方法及び検索プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6941803B1 true JP6941803B1 (ja) | 2021-09-29 |
JP2023008285A JP2023008285A (ja) | 2023-01-19 |
Family
ID=77847128
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021111717A Active JP6941803B1 (ja) | 2021-07-05 | 2021-07-05 | 検索システム、検索方法及び検索プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6941803B1 (ja) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5398413B2 (ja) * | 2009-08-12 | 2014-01-29 | 株式会社野村総合研究所 | 銘柄推奨システム及び銘柄推奨プログラム |
JP2019211974A (ja) * | 2018-06-04 | 2019-12-12 | 株式会社野村総合研究所 | 企業分析装置 |
US20200233872A1 (en) * | 2019-01-18 | 2020-07-23 | International Business Machines Corporation | System and method for discovering synergistic companies |
-
2021
- 2021-07-05 JP JP2021111717A patent/JP6941803B1/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2023008285A (ja) | 2023-01-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8082264B2 (en) | Automated scheme for identifying user intent in real-time | |
Teso et al. | Application of text mining techniques to the analysis of discourse in eWOM communications from a gender perspective | |
US20170097940A1 (en) | Analytical Search Engine | |
CN109753635A (zh) | 使用优质示例的自动化文档助手 | |
JP6646184B2 (ja) | 検索用資料情報記憶装置 | |
US12008047B2 (en) | Providing an object-based response to a natural language query | |
KR20010007715A (ko) | 감성 지수를 이용한 맞춤 정보 제공 시스템 및 그 방법 | |
US20160299951A1 (en) | Processing a search query and retrieving targeted records from a networked database system | |
Wang et al. | CROWN: a context-aware recommender for web news | |
US9058328B2 (en) | Search device, search method, search program, and computer-readable memory medium for recording search program | |
JP6941802B1 (ja) | 検索システム、検索方法及び検索プログラム | |
JP6941803B1 (ja) | 検索システム、検索方法及び検索プログラム | |
JP6941801B1 (ja) | 検索システム、検索方法及び検索プログラム | |
US20230054187A1 (en) | Methods and apparatus for keyword search term recommendations for taxonomy enrichment | |
CN110717008A (zh) | 基于语意识别的搜索结果排序方法及相关装置 | |
JP2020067864A (ja) | 知識検索装置、知識検索方法、および、知識検索プログラム | |
JP2020091539A (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
McCloskey et al. | Natural language processing analysis of online reviews for small business: extracting insight from small corpora | |
KR102547098B1 (ko) | 면세점 건강식품 온라인 해외직구 서비스 방법 및 이를 지원하는 시스템 | |
JP7498876B1 (ja) | 検索支援システム、検索支援方法及びプログラム | |
JP7490905B1 (ja) | 求職支援システム、求職支援方法及びプログラム | |
CN113254622B (zh) | 知识点查询方法、装置及服务器 | |
Mir et al. | An Adaptive Classification Framework for Handling the Cold Start Problem in Case of News Items | |
JP7234079B2 (ja) | 検索支援システム、検索支援方法、及びプログラム | |
US20230281745A1 (en) | Rule watch system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210706 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20210706 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210729 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210804 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210812 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210820 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6941803 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |