JP7013957B2 - 生成プログラム、生成方法、情報処理装置および情報処理システム - Google Patents
生成プログラム、生成方法、情報処理装置および情報処理システム Download PDFInfo
- Publication number
- JP7013957B2 JP7013957B2 JP2018044476A JP2018044476A JP7013957B2 JP 7013957 B2 JP7013957 B2 JP 7013957B2 JP 2018044476 A JP2018044476 A JP 2018044476A JP 2018044476 A JP2018044476 A JP 2018044476A JP 7013957 B2 JP7013957 B2 JP 7013957B2
- Authority
- JP
- Japan
- Prior art keywords
- code information
- vector
- word
- unit
- code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3347—Query execution using vector based model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
受け付けた前記複数の符号情報に基づき、前記複数の符号情報のうち、出現頻度が基準を超える複数の符号情報を特定し、
単語に対応するベクトルを、前記単語に対応する符号情報に関連付けて記憶する記憶部を参照して、特定した前記複数の符号情報にそれぞれ関連付けられた複数のベクトルを取得し、
取得した前記複数のベクトルに基づき、前記複数のベクトルを代表する代表ベクトルを生成する
処理をコンピュータに実行させることを特徴とする生成プログラム。
テキストデータに含まれる複数の単語にそれぞれ対応する複数の符号情報を受け付け、
受け付けた前記複数の符号情報に基づき、前記複数の符号情報のうち、出現頻度が基準を超える複数の符号情報を特定し、
単語に対応するベクトルを、前記単語に対応する符号情報に関連付けて記憶する記憶部を参照して、特定した前記複数の符号情報にそれぞれ関連付けられた複数のベクトルを取得し、
取得した前記複数のベクトルに基づき、前記複数のベクトルを代表する代表ベクトルを生成する
処理を実行することを特徴とする生成方法。
受け付けた前記複数の符号情報に基づき、前記複数の符号情報のうち、出現頻度が基準を超える複数の符号情報を特定し、単語に対応するベクトルを、前記単語に対応する符号情報に関連付けて記憶する記憶部を参照して、特定した前記複数の符号情報にそれぞれ関連付けられた複数のベクトルを取得し、取得した前記複数のベクトルに基づき、前記複数のベクトルを代表する代表ベクトルを生成する特定部と
を有することを特徴とする情報処理装置。
前記第1演算装置は、
テキストデータに含まれる複数の単語にそれぞれ対応する複数の符号情報を前記第2演算装置に転送する第1転送部と、
前記複数の符号情報に基づき、前記複数の符号情報のうち、出現頻度が基準以下となる複数の第1符号情報を特定し、単語に対応するベクトルを、前記単語に対応する前記第1符号情報に関連付けて記憶する第1記憶部を参照して、特定した前記複数の第1符号情報にそれぞれ関連付けられた複数のベクトルを取得する第1特定部と、
前記第2演算装置から転送される代表ベクトルと、前記複数のベクトルとを統合したベクトルデータを生成する統合部と、を有し、
前記第2演算装置は、
前記第1演算装置の前記第1転送部から、前記複数の符号情報を受け付ける受付部と、
受け付けた前記複数の符号情報に基づき、前記複数の符号情報のうち、出現頻度が基準を超える複数の第2符号情報を特定し、単語に対応するベクトルを、前記単語に対応する第2符号情報に関連付けて記憶する第2記憶部を参照して、特定した前記複数の符号情報にそれぞれ関連付けられた複数のベクトルを取得し、取得した前記複数のベクトルに基づき、前記複数のベクトルを代表する代表ベクトルを生成する第2特定部と、
前記代表ベクトルを前記第1演算装置に転送する第2転送部とを有することを特徴とする情報処理システム。
55 コード変換部
100 第1演算部
150 メインメモリ
155,255 転送部
160 補助記憶部
161,251 ベクトルテーブル
170 制御部
171 受付部
172 特定部
173 統合部
200 第2演算部
Claims (7)
- テキストデータに含まれる複数の単語にそれぞれ対応する複数の符号情報を受け付け、
受け付けた前記複数の符号情報に基づき、前記複数の符号情報のうち、出現頻度が基準を超える複数の符号情報を特定し、
単語に対応するベクトルを、前記単語に対応する符号情報に関連付けて記憶する記憶部を参照して、特定した前記複数の符号情報にそれぞれ関連付けられた複数のベクトルを取得し、
取得した前記複数のベクトルに基づき、前記複数のベクトルを代表する代表ベクトルを生成する
処理をコンピュータに実行させることを特徴とする生成プログラム。 - 前記特定する処理は、符号情報の特定ビット位置の情報を基にして、出現頻度が基準を超える符号情報を、受け付けた複数の符号情報から特定することを特徴とする請求項1に記載の生成プログラム。
- 出現頻度が基準を超える符号情報のベクトルを示す高頻度ベクトルテーブルを補助記憶部から読み込み、前記高頻度ベクトルテーブルを前記記憶部に常駐させる処理を更にコンピュータに実行させることを特徴とする請求項1または2に記載の生成プログラム。
- コンピュータが実行する生成方法であって、
テキストデータに含まれる複数の単語にそれぞれ対応する複数の符号情報を受け付け、
受け付けた前記複数の符号情報に基づき、前記複数の符号情報のうち、出現頻度が基準を超える複数の符号情報を特定し、
単語に対応するベクトルを、前記単語に対応する符号情報に関連付けて記憶する記憶部を参照して、特定した前記複数の符号情報にそれぞれ関連付けられた複数のベクトルを取得し、
取得した前記複数のベクトルに基づき、前記複数のベクトルを代表する代表ベクトルを生成する
処理を実行することを特徴とする生成方法。 - テキストデータに含まれる複数の単語にそれぞれ対応する複数の符号情報を受け付ける受付部と、
受け付けた前記複数の符号情報に基づき、前記複数の符号情報のうち、出現頻度が基準を超える複数の符号情報を特定し、単語に対応するベクトルを、前記単語に対応する符号情報に関連付けて記憶する記憶部を参照して、特定した前記複数の符号情報にそれぞれ関連付けられた複数のベクトルを取得し、取得した前記複数のベクトルに基づき、前記複数のベクトルを代表する代表ベクトルを生成する特定部と
を有することを特徴とする情報処理装置。 - 第1演算装置と第2演算装置とを有する情報処理システムであって、
前記第1演算装置は、
テキストデータに含まれる複数の単語にそれぞれ対応する複数の符号情報を前記第2演算装置に転送する第1転送部と、
前記複数の符号情報に基づき、前記複数の符号情報のうち、出現頻度が基準以下となる複数の第1符号情報を特定し、単語に対応するベクトルを、前記単語に対応する前記第1符号情報に関連付けて記憶する第1記憶部を参照して、特定した前記複数の第1符号情報にそれぞれ関連付けられた複数のベクトルを取得する第1特定部と、
前記第2演算装置から転送される代表ベクトルと、前記複数のベクトルとを統合したベクトルデータを生成する統合部と、を有し、
前記第2演算装置は、
前記第1演算装置の前記第1転送部から、前記複数の符号情報を受け付ける受付部と、
受け付けた前記複数の符号情報に基づき、前記複数の符号情報のうち、出現頻度が基準を超える複数の第2符号情報を特定し、単語に対応するベクトルを、前記単語に対応する第2符号情報に関連付けて記憶する第2記憶部を参照して、特定した前記複数の符号情報にそれぞれ関連付けられた複数のベクトルを取得し、取得した前記複数のベクトルに基づき、前記複数のベクトルを代表する代表ベクトルを生成する第2特定部と、
前記代表ベクトルを前記第1演算装置に転送する第2転送部とを有することを特徴とする情報処理システム。 - 前記第1転送部は、前記複数の符号情報から、前記複数の第1符号情報を除いた残りの符号情報を、前記第2演算装置に転送することを特徴とする請求項6に記載の情報処理システム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018044476A JP7013957B2 (ja) | 2018-03-12 | 2018-03-12 | 生成プログラム、生成方法、情報処理装置および情報処理システム |
US16/284,281 US20190278791A1 (en) | 2018-03-12 | 2019-02-25 | Non-transitory computer readable recording medium, method for generating, information processing device, and information processing system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018044476A JP7013957B2 (ja) | 2018-03-12 | 2018-03-12 | 生成プログラム、生成方法、情報処理装置および情報処理システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019159699A JP2019159699A (ja) | 2019-09-19 |
JP7013957B2 true JP7013957B2 (ja) | 2022-02-01 |
Family
ID=67843980
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018044476A Active JP7013957B2 (ja) | 2018-03-12 | 2018-03-12 | 生成プログラム、生成方法、情報処理装置および情報処理システム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20190278791A1 (ja) |
JP (1) | JP7013957B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005275880A (ja) | 2004-03-25 | 2005-10-06 | Getronics Japan Ltd | 字句をデータに変換する装置、方法及びプログラム |
JP2009277100A (ja) | 2008-05-15 | 2009-11-26 | Nippon Telegr & Teleph Corp <Ntt> | 文書特徴表現計算装置、及びプログラム |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05324730A (ja) * | 1992-05-27 | 1993-12-07 | Hitachi Ltd | 文書情報検索装置 |
JP2823761B2 (ja) * | 1992-12-24 | 1998-11-11 | シャープ株式会社 | 文書検索装置 |
JP3019286B2 (ja) * | 1993-10-21 | 2000-03-13 | シャープ株式会社 | 文書検索装置 |
JPH07182354A (ja) * | 1993-12-24 | 1995-07-21 | Fujitsu Ltd | 電子文書の作成方法 |
JP2000201080A (ja) * | 1999-01-07 | 2000-07-18 | Fujitsu Ltd | 付加コ―ドを用いたデ―タ圧縮/復元装置および方法 |
CN102141977A (zh) * | 2010-02-01 | 2011-08-03 | 阿里巴巴集团控股有限公司 | 一种文本分类的方法及装置 |
JP6118838B2 (ja) * | 2014-08-21 | 2017-04-19 | 本田技研工業株式会社 | 情報処理装置、情報処理システム、情報処理方法、及び情報処理プログラム |
US10740678B2 (en) * | 2016-03-31 | 2020-08-11 | International Business Machines Corporation | Concept hierarchies |
-
2018
- 2018-03-12 JP JP2018044476A patent/JP7013957B2/ja active Active
-
2019
- 2019-02-25 US US16/284,281 patent/US20190278791A1/en not_active Abandoned
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005275880A (ja) | 2004-03-25 | 2005-10-06 | Getronics Japan Ltd | 字句をデータに変換する装置、方法及びプログラム |
JP2009277100A (ja) | 2008-05-15 | 2009-11-26 | Nippon Telegr & Teleph Corp <Ntt> | 文書特徴表現計算装置、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2019159699A (ja) | 2019-09-19 |
US20190278791A1 (en) | 2019-09-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104008064A (zh) | 用于多级存储器压缩的方法和*** | |
CN107919943A (zh) | 二进制数据的编码、解码方法和装置 | |
US20150261990A1 (en) | Method and apparatus for compressing dna data based on binary image | |
JP2011134102A (ja) | 情報処理装置及び情報処理方法 | |
KR20160016744A (ko) | 플래시 메모리 장치에 데이터를 기록하는 방법, 플래시 메모리 장치, 및 저장 시스템 | |
US10755073B2 (en) | Biological-image processing unit and method and program for processing biological image | |
CN108171189A (zh) | 一种视频编码方法、视频编码装置及电子设备 | |
EP3119002B1 (en) | Encoding program, encoding method, information processsing device, replacement program, and replacement method | |
JP7013957B2 (ja) | 生成プログラム、生成方法、情報処理装置および情報処理システム | |
CN102339240B (zh) | 检测设备上的状态丢失 | |
JP2017163429A (ja) | 時系列データ圧縮装置 | |
US8688947B1 (en) | Aligned data access | |
CN108416425A (zh) | 一种卷积方法及装置 | |
EP3070615A1 (en) | Information processing apparatus, and data management method | |
EP3404839A1 (en) | Encoding program, encoding device, and encoding method | |
CN115293076A (zh) | 生成电路的方法、电子设备及存储介质 | |
JP4382744B2 (ja) | 画像情報抽出方法及び画像情報検索方法及びプログラム | |
JP4836915B2 (ja) | アドレス処理 | |
CN113239852A (zh) | 一种基于隐私保护的隐私图像处理方法、装置及设备 | |
US9135009B2 (en) | Apparatus and method for compressing instructions and a computer-readable storage media therefor | |
KR101268452B1 (ko) | 가상 세계를 기술하는 데이터 송수신 방법 및 장치 | |
CN112580297B (zh) | 一种编解码数据的方法、电子设备及存储介质 | |
JP5895229B2 (ja) | 配置決定装置、配置決定方法、データ構造、メモリ、アクセス装置及びメモリアクセス方法 | |
KR100987028B1 (ko) | 무작위 데이터가 가지는 정렬 구조의 불확실성을 산출하는 장치 및 그 방법, 상기 방법을 구현하는 프로그램이 기록된기록매체 | |
EP3358748B1 (en) | Coding program, coding method, coding device, decoding program, decoding method and decoding device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201210 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211022 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211116 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211207 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211221 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220103 |