CN104731941A - 一种基于xbrl技术从非结构化财务报告抓取数据的方法 - Google Patents
一种基于xbrl技术从非结构化财务报告抓取数据的方法 Download PDFInfo
- Publication number
- CN104731941A CN104731941A CN201510146654.XA CN201510146654A CN104731941A CN 104731941 A CN104731941 A CN 104731941A CN 201510146654 A CN201510146654 A CN 201510146654A CN 104731941 A CN104731941 A CN 104731941A
- Authority
- CN
- China
- Prior art keywords
- xbrl
- financial
- report
- data
- dimension
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000005516 engineering process Methods 0.000 title claims abstract description 26
- 238000004458 analytical method Methods 0.000 claims abstract description 14
- 238000006243 chemical reaction Methods 0.000 claims abstract description 5
- 230000008878 coupling Effects 0.000 claims description 6
- 238000010168 coupling process Methods 0.000 claims description 6
- 238000005859 coupling reaction Methods 0.000 claims description 6
- 238000013145 classification model Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 abstract 1
- 238000003745 diagnosis Methods 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
- G06F16/337—Profile generation, learning or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
Description
Claims (7)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510146654.XA CN104731941B (zh) | 2015-03-31 | 2015-03-31 | 一种基于xbrl技术从非结构化财务报告抓取数据的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510146654.XA CN104731941B (zh) | 2015-03-31 | 2015-03-31 | 一种基于xbrl技术从非结构化财务报告抓取数据的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104731941A true CN104731941A (zh) | 2015-06-24 |
CN104731941B CN104731941B (zh) | 2018-02-23 |
Family
ID=53455828
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510146654.XA Active CN104731941B (zh) | 2015-03-31 | 2015-03-31 | 一种基于xbrl技术从非结构化财务报告抓取数据的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104731941B (zh) |
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105160015A (zh) * | 2015-09-24 | 2015-12-16 | 四川长虹电器股份有限公司 | 基于Flex映射XBRL数据关系的方法 |
CN105224512A (zh) * | 2015-09-24 | 2016-01-06 | 四川长虹电器股份有限公司 | 基于xbrl智能报告平台数据关系生成实例文档的方法 |
CN105243582A (zh) * | 2015-09-24 | 2016-01-13 | 四川长虹电器股份有限公司 | 基于财务云的xbrl会计软件标准数据接口***及方法 |
CN105320742A (zh) * | 2015-09-24 | 2016-02-10 | 四川长虹电器股份有限公司 | 将传统财务报表的科目信息映射至xbrl分类标准格式的方法 |
CN105320744A (zh) * | 2015-09-24 | 2016-02-10 | 四川长虹电器股份有限公司 | Xbrl分类标准自定义链接库的解析方法 |
CN105335461A (zh) * | 2015-09-24 | 2016-02-17 | 四川长虹电器股份有限公司 | 快速写入xbrl实例文档事实值的***及方法 |
CN105335353A (zh) * | 2015-11-30 | 2016-02-17 | 浪潮通用软件有限公司 | 一种xbrl格式财务报告分析方法和装置 |
CN105354213A (zh) * | 2015-09-24 | 2016-02-24 | 四川长虹电器股份有限公司 | 基于数据点模型建立xbrl财务报告业务模型的方法 |
CN106022944A (zh) * | 2016-05-27 | 2016-10-12 | 中国石油天然气股份有限公司 | 油藏数值模拟中常规与流线模型的数据体转换方法及装置 |
CN106372044A (zh) * | 2016-09-13 | 2017-02-01 | 济南浪潮高新科技投资发展有限公司 | 一种基于报表生成类型化维度xbrl报告的方法 |
CN106649769A (zh) * | 2016-12-27 | 2017-05-10 | 中国科学院大学 | 一种基于语义的xbrl数据到owl数据的转换方法 |
CN106940693A (zh) * | 2017-02-28 | 2017-07-11 | 广东智源信息技术有限公司 | 实验室原始记录单结构化处理方法 |
CN107943785A (zh) * | 2017-11-06 | 2018-04-20 | 广东广业开元科技有限公司 | 一种基于大数据的pdf文档处理方法及装置 |
CN108073678A (zh) * | 2017-11-06 | 2018-05-25 | 广东广业开元科技有限公司 | 应用于大数据分析中的文档解析处理方法、***及装置 |
CN108121691A (zh) * | 2017-11-23 | 2018-06-05 | 国家电网公司 | 管理输变电工程工程量清单的方法及*** |
CN108170697A (zh) * | 2017-07-12 | 2018-06-15 | 信号旗智能科技(上海)有限公司 | 一种国际贸易文件处理方法、***以及一种服务器 |
CN108228549A (zh) * | 2017-06-20 | 2018-06-29 | 上海吉贝克信息技术有限公司 | 一种数据采集方法及***、服务器 |
CN108961035A (zh) * | 2018-05-29 | 2018-12-07 | 阿里巴巴集团控股有限公司 | 一种业务过渡户的账龄分析方法和装置 |
CN109376191A (zh) * | 2018-09-18 | 2019-02-22 | 深圳壹账通智能科技有限公司 | 财报数据处理方法、装置、计算机设备和存储介质 |
CN111767691A (zh) * | 2020-06-30 | 2020-10-13 | 北京百度网讯科技有限公司 | 计算方法、装置、设备及存储介质 |
CN112581247A (zh) * | 2020-12-24 | 2021-03-30 | 中国建设银行股份有限公司 | 一种财务报告生成方法和装置 |
IT202200007820A1 (it) | 2022-04-20 | 2022-07-20 | Orma Lab Srl | Sistema e metodo per il suggerimento automatico di strumenti di finanza agevolata con miglioramento della performance reputazionale |
CN116821325A (zh) * | 2023-06-30 | 2023-09-29 | 广东铭太信息科技有限公司 | 一种非结构化报告的信息提取方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101288095A (zh) * | 2005-04-08 | 2008-10-15 | 科格洛斯公司 | 使用多维xbrl引擎的企业软件*** |
CN101652774A (zh) * | 2007-04-03 | 2010-02-17 | 微软公司 | 用于财务文档转换的*** |
US20110258167A1 (en) * | 2010-04-20 | 2011-10-20 | Xbrl Cloud, Inc. | Xbrl service system and method |
WO2014010068A1 (ja) * | 2012-07-12 | 2014-01-16 | 富士通株式会社 | プログラム、文書変換装置および文書変換方法 |
CN103885999A (zh) * | 2013-03-28 | 2014-06-25 | 中国证券监督管理委员会信息中心 | 一种定义xbrl和业务对应关系的标引模板 |
-
2015
- 2015-03-31 CN CN201510146654.XA patent/CN104731941B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101288095A (zh) * | 2005-04-08 | 2008-10-15 | 科格洛斯公司 | 使用多维xbrl引擎的企业软件*** |
CN101652774A (zh) * | 2007-04-03 | 2010-02-17 | 微软公司 | 用于财务文档转换的*** |
US20110258167A1 (en) * | 2010-04-20 | 2011-10-20 | Xbrl Cloud, Inc. | Xbrl service system and method |
WO2014010068A1 (ja) * | 2012-07-12 | 2014-01-16 | 富士通株式会社 | プログラム、文書変換装置および文書変換方法 |
CN103885999A (zh) * | 2013-03-28 | 2014-06-25 | 中国证券监督管理委员会信息中心 | 一种定义xbrl和业务对应关系的标引模板 |
Non-Patent Citations (1)
Title |
---|
中国财政经济出版社: "《企业会计准则通用分类标准讲解》", 30 April 2012, 中国财政经济出版社 * |
Cited By (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105354213A (zh) * | 2015-09-24 | 2016-02-24 | 四川长虹电器股份有限公司 | 基于数据点模型建立xbrl财务报告业务模型的方法 |
CN105224512A (zh) * | 2015-09-24 | 2016-01-06 | 四川长虹电器股份有限公司 | 基于xbrl智能报告平台数据关系生成实例文档的方法 |
CN105243582A (zh) * | 2015-09-24 | 2016-01-13 | 四川长虹电器股份有限公司 | 基于财务云的xbrl会计软件标准数据接口***及方法 |
CN105320742A (zh) * | 2015-09-24 | 2016-02-10 | 四川长虹电器股份有限公司 | 将传统财务报表的科目信息映射至xbrl分类标准格式的方法 |
CN105320744A (zh) * | 2015-09-24 | 2016-02-10 | 四川长虹电器股份有限公司 | Xbrl分类标准自定义链接库的解析方法 |
CN105335461A (zh) * | 2015-09-24 | 2016-02-17 | 四川长虹电器股份有限公司 | 快速写入xbrl实例文档事实值的***及方法 |
CN105160015A (zh) * | 2015-09-24 | 2015-12-16 | 四川长虹电器股份有限公司 | 基于Flex映射XBRL数据关系的方法 |
CN105335353B (zh) * | 2015-11-30 | 2017-11-28 | 浪潮通用软件有限公司 | 一种xbrl格式财务报告分析方法和装置 |
CN105335353A (zh) * | 2015-11-30 | 2016-02-17 | 浪潮通用软件有限公司 | 一种xbrl格式财务报告分析方法和装置 |
CN106022944A (zh) * | 2016-05-27 | 2016-10-12 | 中国石油天然气股份有限公司 | 油藏数值模拟中常规与流线模型的数据体转换方法及装置 |
CN106372044A (zh) * | 2016-09-13 | 2017-02-01 | 济南浪潮高新科技投资发展有限公司 | 一种基于报表生成类型化维度xbrl报告的方法 |
CN106372044B (zh) * | 2016-09-13 | 2019-04-02 | 济南浪潮高新科技投资发展有限公司 | 一种基于报表生成类型化维度xbrl报告的方法 |
CN106649769A (zh) * | 2016-12-27 | 2017-05-10 | 中国科学院大学 | 一种基于语义的xbrl数据到owl数据的转换方法 |
CN106649769B (zh) * | 2016-12-27 | 2020-10-30 | 中国科学院大学 | 一种基于语义的xbrl数据到owl数据的转换方法 |
CN106940693A (zh) * | 2017-02-28 | 2017-07-11 | 广东智源信息技术有限公司 | 实验室原始记录单结构化处理方法 |
CN106940693B (zh) * | 2017-02-28 | 2020-09-01 | 广东智源信息技术有限公司 | 实验室原始记录单结构化处理方法 |
CN108228549A (zh) * | 2017-06-20 | 2018-06-29 | 上海吉贝克信息技术有限公司 | 一种数据采集方法及***、服务器 |
CN108170697B (zh) * | 2017-07-12 | 2021-08-20 | 信号旗智能科技(上海)有限公司 | 一种国际贸易文件处理方法、***以及一种服务器 |
CN108170697A (zh) * | 2017-07-12 | 2018-06-15 | 信号旗智能科技(上海)有限公司 | 一种国际贸易文件处理方法、***以及一种服务器 |
CN108073678A (zh) * | 2017-11-06 | 2018-05-25 | 广东广业开元科技有限公司 | 应用于大数据分析中的文档解析处理方法、***及装置 |
CN108073678B (zh) * | 2017-11-06 | 2020-08-28 | 广东广业开元科技有限公司 | 应用于大数据分析中的文档解析处理方法、***及装置 |
CN107943785A (zh) * | 2017-11-06 | 2018-04-20 | 广东广业开元科技有限公司 | 一种基于大数据的pdf文档处理方法及装置 |
CN108121691A (zh) * | 2017-11-23 | 2018-06-05 | 国家电网公司 | 管理输变电工程工程量清单的方法及*** |
CN108961035A (zh) * | 2018-05-29 | 2018-12-07 | 阿里巴巴集团控股有限公司 | 一种业务过渡户的账龄分析方法和装置 |
CN109376191A (zh) * | 2018-09-18 | 2019-02-22 | 深圳壹账通智能科技有限公司 | 财报数据处理方法、装置、计算机设备和存储介质 |
CN111767691A (zh) * | 2020-06-30 | 2020-10-13 | 北京百度网讯科技有限公司 | 计算方法、装置、设备及存储介质 |
CN111767691B (zh) * | 2020-06-30 | 2024-05-07 | 北京百度网讯科技有限公司 | 计算方法、装置、设备及存储介质 |
CN112581247A (zh) * | 2020-12-24 | 2021-03-30 | 中国建设银行股份有限公司 | 一种财务报告生成方法和装置 |
IT202200007820A1 (it) | 2022-04-20 | 2022-07-20 | Orma Lab Srl | Sistema e metodo per il suggerimento automatico di strumenti di finanza agevolata con miglioramento della performance reputazionale |
CN116821325A (zh) * | 2023-06-30 | 2023-09-29 | 广东铭太信息科技有限公司 | 一种非结构化报告的信息提取方法 |
CN116821325B (zh) * | 2023-06-30 | 2024-03-26 | 广东铭太信息科技有限公司 | 一种非结构化报告的信息提取方法 |
Also Published As
Publication number | Publication date |
---|---|
CN104731941B (zh) | 2018-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104731941A (zh) | 一种基于xbrl技术从非结构化财务报告抓取数据的方法 | |
US8799772B2 (en) | System and method for gathering, indexing, and supplying publicly available data charts | |
Rastan et al. | TEXUS: A unified framework for extracting and understanding tables in PDF documents | |
CN109522452B (zh) | 一种海量半结构化数据的处理方法 | |
CN103605651A (zh) | 一种基于olap多维分析的数据处理展现方法 | |
CN102999524B (zh) | 一种文档关联检索方法及*** | |
CN104915334A (zh) | 一种基于语义分析的招投标项目关键信息自动化提取方法 | |
CN103440232A (zh) | 一种科技论文标准化自动检测编辑方法 | |
CN111125116B (zh) | 定位业务表中代码字段及对应代码表的方法及*** | |
CN103440233A (zh) | 一种科技论文标准化自动检测编辑*** | |
CN102169491B (zh) | 一种多数据集中重复记录动态检测方法 | |
CN102508901A (zh) | 基于内容的海量图像检索方法和*** | |
CN112258061B (zh) | 一种项目全过程风险智能分析预警***及预警方法 | |
CN104133839A (zh) | 一种具有智能检测功能的数据处理方法及*** | |
CN104133838A (zh) | 一种具有***检测功能的数据处理方法及*** | |
CN111427725A (zh) | 一种大数据的数据存储***及方法 | |
CN104133870A (zh) | 一种网页相似度计算方法及装置 | |
CN103455527A (zh) | 手写文件检索装置、方法以及记录介质 | |
CN103020083B (zh) | 需求识别模板的自动挖掘方法、需求识别方法及对应装置 | |
CN100562872C (zh) | 针对结构化网页的自动模板信息定位方法 | |
CN107562949A (zh) | 实现合并报表Excel模板写入数据库的方法 | |
CN104408097A (zh) | 一种基于字符段热更新的混合索引方法及*** | |
Rastan et al. | Automated table understanding using stub patterns | |
CN110990376B (zh) | 一种基于多因子混合排序机制的学科分类自动标引方法 | |
TWI396990B (zh) | 引用文獻記錄擷取系統、方法及程式產品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20180807 Address after: 250100 S06 tower, 1036, Chao Lu Road, hi tech Zone, Ji'nan, Shandong. Patentee after: Shandong wave cloud Mdt InfoTech Ltd Address before: No. 1036, Shandong high tech Zone wave road, Ji'nan, Shandong Patentee before: Inspur Group Co., Ltd. |
|
TR01 | Transfer of patent right | ||
CP03 | Change of name, title or address |
Address after: 250100 No. 1036 Tidal Road, Jinan High-tech Zone, Shandong Province, S01 Building, Tidal Science Park Patentee after: Inspur cloud Information Technology Co., Ltd Address before: 250100 Ji'nan science and technology zone, Shandong high tide Road, No. 1036 wave of science and Technology Park, building S06 Patentee before: SHANDONG LANGCHAO YUNTOU INFORMATION TECHNOLOGY Co.,Ltd. |
|
CP03 | Change of name, title or address |