JP5051764B2 - 遺伝子発現モジュール探索装置、遺伝子発現モジュール探索方法及び遺伝子発現モジュール探索プログラム - Google Patents
遺伝子発現モジュール探索装置、遺伝子発現モジュール探索方法及び遺伝子発現モジュール探索プログラム Download PDFInfo
- Publication number
- JP5051764B2 JP5051764B2 JP2007320636A JP2007320636A JP5051764B2 JP 5051764 B2 JP5051764 B2 JP 5051764B2 JP 2007320636 A JP2007320636 A JP 2007320636A JP 2007320636 A JP2007320636 A JP 2007320636A JP 5051764 B2 JP5051764 B2 JP 5051764B2
- Authority
- JP
- Japan
- Prior art keywords
- discrete
- expression
- module
- gene
- expression profile
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000014509 gene expression Effects 0.000 title claims description 480
- 238000000034 method Methods 0.000 title claims description 60
- 108090000623 proteins and genes Proteins 0.000 claims description 167
- 239000011159 matrix material Substances 0.000 claims description 108
- 230000004186 co-expression Effects 0.000 claims description 100
- 238000007906 compression Methods 0.000 claims description 61
- 230000006835 compression Effects 0.000 claims description 54
- 230000004927 fusion Effects 0.000 claims description 36
- 229920006395 saturated elastomer Polymers 0.000 claims description 34
- 230000008569 process Effects 0.000 claims description 26
- 238000007499 fusion processing Methods 0.000 claims description 14
- 238000013500 data storage Methods 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000004519 manufacturing process Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 description 42
- 238000002474 experimental method Methods 0.000 description 20
- 238000003860 storage Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 8
- 238000007796 conventional method Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 238000009826 distribution Methods 0.000 description 6
- 230000037353 metabolic pathway Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000002493 microarray Methods 0.000 description 2
- 238000004321 preservation Methods 0.000 description 2
- 238000013138 pruning Methods 0.000 description 2
- 101150084750 1 gene Proteins 0.000 description 1
- 101150076489 B gene Proteins 0.000 description 1
- 101150111062 C gene Proteins 0.000 description 1
- 101150097493 D gene Proteins 0.000 description 1
- 101150013191 E gene Proteins 0.000 description 1
- 101150090421 GO gene Proteins 0.000 description 1
- 208000028782 Hereditary disease Diseases 0.000 description 1
- 101150010487 are gene Proteins 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000011712 cell development Effects 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
遺伝子1、離散ラベルL:アイテムB
遺伝子2、離散ラベルH:アイテムC
遺伝子2、離散ラベルL:アイテムD
遺伝子3、離散ラベルH:アイテムE
遺伝子3、離散ラベルL:アイテムF
「遺伝子a、実験4を含む行および列」に関して、
“遺伝子aの行のノイズ率”=1/4=0.25
“実験4の列のノイズ率”=1/5=0.2
「遺伝子e、実験1を含む行および列」に関して、
“遺伝子eの行のノイズ率”=1/4=0.25
“実験1の列のノイズ率”=1/5=0.2
3 プロファイル入力部
5 発現プロファイルデータベース記憶部
7 離散発現プロファイルデータベース生成部
9 離散発現プロファイルデータベース記憶部
11 クエリ入力部
13 クエリ離散発現プロファイル生成部
15 モジュール探索部
17 モジュール情報出力部
21 発現順位データ生成部
23 発現順位データ記憶部
25 離散発現プロファイル生成部
31 離散値行列生成部
33 離散値行列圧縮部
35 バイクラスタリング処理部
37 モジュール融合部
Claims (12)
- 遺伝子セットの発現値を有する発現プロファイルのデータベースから、遺伝子サブセットと発現プロファイルサブセットで構成されており共通する発現パタンが現れる共発現モジュールを探索する遺伝子発現モジュール探索装置であって、
モジュール探索源である多数の発現プロファイルからそれぞれ生成された多数の離散発現プロファイルを有し、各々の離散発現プロファイルは、プロファイル中の各遺伝子の発現値が属する離散的ランクを表す離散ラベルのセットである離散発現プロファイルデータベースと、
モジュール探索のクエリとなる発現プロファイルであるクエリ発現プロファイルを取得するクエリ取得部と、
前記クエリ発現プロファイルに対応する離散発現プロファイルであるクエリ離散発現プロファイルを生成するクエリ離散発現プロファイル生成部と、
前記離散発現プロファイルデータベースから、前記クエリ離散発現プロファイル中の遺伝子サブセットで構成されており共通する離散ラベルパタンが現れるモジュールを探索し、探索したモジュールを共発現モジュールとするモジュール探索部とを備え、
前記モジュール探索部は、
前記クエリ離散発現プロファイル及び前記離散発現プロファイルデータベースの多数の離散発現プロファイルで構成される離散値行列を生成する離散値行列生成部と、
前記クエリ離散発現プロファイルに基づいて、モジュール探索の前処理として前記離散値行列を圧縮する離散値行列圧縮部を有し、
前記離散値行列圧縮部は、モジュールを構成しない離散ラベルとして予め定められた所定の非モジュール離散ラベルが前記クエリ離散発現プロファイル内で付された遺伝子のデータを削除することにより前記離散値行列を圧縮し、圧縮後の前記離散値行列から前記共発現モジュールが探索されることを特徴とする遺伝子発現モジュール探索装置。 - 前記離散値行列生成部は、前記離散値行列を生成する際、各離散発現プロファイルから、前記クエリ離散発現プロファイルに含まれない遺伝子についてのデータを削除することを特徴とする請求項1に記載の遺伝子発現モジュール探索装置。
- 前記離散値行列圧縮部は、さらに、前記モジュール探索部により探索されるべき前記共発現モジュールの最小遺伝子数に基づき、前記非モジュール離散ラベル以外の離散ラベルの数が前記最小遺伝子数未満である前記離散発現プロファイルを前記離散値行列から削除することを特徴とする請求項1又は2に記載の遺伝子発現モジュール探索装置。
- 前記モジュール探索部は、前記離散値行列内で共通パタンが現れるバイクラスタを探索するバイクラスタリング処理を行って、探索されたバイクラスタを前記共発現モジュールとすることを特徴とする請求項1〜3のいずれかに記載の遺伝子発現モジュール探索装置。
- 前記モジュール探索部の前記バイクラスタリング処理は、飽和アイテム集合列挙法に基づくバイクラスタリング処理であり、前記離散値行列に含まれる遺伝子と離散ラベルの各組合せをアイテムとし、前記離散値行列から前記アイテムで構成されるトランザクションデータベースを生成し、前記トランザクションデータベースにおいて複数の離散発現プロファイルに共通に存在するアイテムの最大集合である飽和アイテム集合を列挙し、各飽和アイテム集合に対応するバイクラスタを求めることを特徴とする請求項4に記載の遺伝子発現モジュール探索装置。
- 前記モジュール探索部は、前記非モジュール離散ラベル以外の離散ラベルに対応するアイテムで構成される前記トランザクションデータベースを生成することを特徴とする請求項5に記載の遺伝子発現モジュール探索装置。
- 前記離散値行列圧縮部は、前記クエリ離散発現プロファイルの遺伝子の離散ラベルと各離散発現プロファイルの同一遺伝子の離散ラベルとが相違する場合に、前記離散発現プロファイルの前記遺伝子の離散ラベルを前記非モジュール離散ラベルに変換することを特徴とする請求項6に記載の遺伝子発現モジュール探索装置。
- 前記モジュール探索部は、探索された複数の共発現モジュールを融合して融合モジュールを生成するモジュール融合部を有し、前記モジュール融合部は、前記融合モジュール内でパタンが相違する部分であるノイズが、予め設定された許容ノイズ以下になる範囲で、融合処理を行うことを特徴とする請求項1〜7のいずれかに記載の遺伝子発現モジュール探索装置。
- 多数の遺伝子発現プロファイルにおける遺伝子毎の多数の発現値から生成された発現順位データを記憶する発現順位データ記憶部を有し、前記発現順位データは、遺伝子毎に、各遺伝子の前記多数の発現値に順位を付したときの、前記離散ランクのランク境界順位を有しており、前記離散発現プロファイルデータベースの各離散発現プロファイル及び前記クエリ離散発現プロファイルは、前記発現順位データの前記ランク境界順位に基づいて判定された離散ランクの離散ラベルで構成されていることを特徴とする請求項1〜8のいずれかに記載の遺伝子発現モジュール探索装置。
- 前記発現順位データの前記ランク境界順位は、同一遺伝子の発現値データ数における比率に基づいて規定されており、発現値の最大値側に1以上の高発現ランクが設定され、発現値の最小値側に1以上の低発現ランクが設定され、前記高発現ランクと前記低発現ランクの間の領域が、共発現モジュールを構成しない前記非モジュール離散ラベルに対応するランクであることを特徴とする請求項9に記載の遺伝子発現モジュール探索装置。
- 遺伝子セットの発現値を有する発現プロファイルのデータベースから、遺伝子サブセットと発現プロファイルサブセットで構成されており共通する発現パタンが現れる共発現モジュールを探索する遺伝子発現モジュール探索方法であって、
モジュール探索源である多数の発現プロファイルからそれぞれ生成された多数の離散発現プロファイルを有し、各々の離散発現プロファイルは、プロファイル中の各遺伝子の発現値が属する離散的ランクを表す離散ラベルのセットである離散発現プロファイルデータベースを用意し、
モジュール探索のクエリとなる発現プロファイルであるクエリ発現プロファイルを取得し、
前記クエリ発現プロファイルに対応する離散発現プロファイルであるクエリ離散発現プロファイルを生成し、
前記離散発現プロファイルデータベースから、前記クエリ離散発現プロファイル中の遺伝子サブセットで構成されており共通する離散ラベルパタンが現れるモジュールを探索し、探索したモジュールを共発現モジュールとし、
前記探索ステップは、
前記クエリ離散発現プロファイル及び前記離散発現プロファイルデータベースの多数の離散発現プロファイルで構成される離散値行列を生成するステップと、
前記クエリ離散発現プロファイルに基づいて、モジュール探索の前処理として前記離散値行列を圧縮するステップを有し、
前記圧縮ステップは、モジュールを構成しない離散ラベルとして予め定められた所定の非モジュール離散ラベルが前記クエリ離散発現プロファイル内で付された遺伝子のデータを削除することにより前記離散値行列を圧縮し、圧縮後の前記離散値行列から前記共発現モジュールが探索されることを特徴とする遺伝子発現モジュール探索方法。 - 遺伝子セットの発現値を有する発現プロファイルのデータベースから、遺伝子サブセットと発現プロファイルサブセットで構成されており共通する発現パタンが現れる共発現モジュールを探索する処理をコンピュータに実行させる遺伝子発現モジュール探索プログラムであって、
モジュール探索源である多数の発現プロファイルからそれぞれ生成された多数の離散発現プロファイルを有し、各々の離散発現プロファイルは、プロファイル中の各遺伝子の発現値が属する離散的ランクを表す離散ラベルのセットである離散発現プロファイルデータベースを用意し、
モジュール探索のクエリとなる発現プロファイルであるクエリ発現プロファイルを取得し、
前記クエリ発現プロファイルに対応する離散発現プロファイルであるクエリ離散発現プロファイルを生成し、
前記離散発現プロファイルデータベースから、前記クエリ離散発現プロファイル中の遺伝子サブセットで構成されており共通する離散ラベルパタンが現れるモジュールを探索し、探索したモジュールを共発現モジュールとする処理を前記コンピュータに実行させ、
前記探索ステップは、
前記クエリ離散発現プロファイル及び前記離散発現プロファイルデータベースの多数の離散発現プロファイルで構成される離散値行列を生成するステップと、
前記クエリ離散発現プロファイルに基づいて、モジュール探索の前処理として前記離散値行列を圧縮するステップを有し、
前記圧縮ステップは、モジュールを構成しない離散ラベルとして予め定められた所定の非モジュール離散ラベルが前記クエリ離散発現プロファイル内で付された遺伝子のデータを削除することにより前記離散値行列を圧縮し、圧縮後の前記離散値行列から前記共発現モジュールが探索されることを特徴とする遺伝子発現モジュール探索プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007320636A JP5051764B2 (ja) | 2007-12-12 | 2007-12-12 | 遺伝子発現モジュール探索装置、遺伝子発現モジュール探索方法及び遺伝子発現モジュール探索プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007320636A JP5051764B2 (ja) | 2007-12-12 | 2007-12-12 | 遺伝子発現モジュール探索装置、遺伝子発現モジュール探索方法及び遺伝子発現モジュール探索プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009146028A JP2009146028A (ja) | 2009-07-02 |
JP5051764B2 true JP5051764B2 (ja) | 2012-10-17 |
Family
ID=40916590
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007320636A Active JP5051764B2 (ja) | 2007-12-12 | 2007-12-12 | 遺伝子発現モジュール探索装置、遺伝子発現モジュール探索方法及び遺伝子発現モジュール探索プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5051764B2 (ja) |
-
2007
- 2007-12-12 JP JP2007320636A patent/JP5051764B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2009146028A (ja) | 2009-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4382526B2 (ja) | 文章分類装置および方法 | |
US6654744B2 (en) | Method and apparatus for categorizing information, and a computer product | |
JP2007004233A (ja) | 文章分類装置、文章分類方法、およびプログラム | |
JP5588811B2 (ja) | データ分析支援システム及び方法 | |
JPWO2010061537A1 (ja) | 検索装置、検索方法、及びプログラム | |
KR20150103509A (ko) | Lda를 이용한 특허 문헌 분석 방법 | |
KR20160050729A (ko) | 특허 정보를 이용한 특허 로드맵 생성 방법 및 시스템 | |
CN110647995A (zh) | 规则训练方法、装置、设备及存储介质 | |
US20070239663A1 (en) | Parallel processing of count distinct values | |
KR102345410B1 (ko) | 빅데이터 지능형 수집 방법 및 장치 | |
US20140035809A1 (en) | Hexahedral Mesh Generator | |
JP7473389B2 (ja) | 学習モデル生成システム、及び学習モデル生成方法 | |
US9639073B2 (en) | Information processing apparatus for discriminating between combined results of plurality of elements, program product and method for same | |
JP5439235B2 (ja) | 文書分類方法、文書分類装置、およびプログラム | |
US7882114B2 (en) | Data processing method and data processing program | |
KR101035037B1 (ko) | 동적 임계값이 적용된 유사문서 분류화 장치 및 방법 | |
JP5051764B2 (ja) | 遺伝子発現モジュール探索装置、遺伝子発現モジュール探索方法及び遺伝子発現モジュール探索プログラム | |
CN107609110B (zh) | 基于分类树的最大多样频繁模式的挖掘方法及装置 | |
Kabir et al. | Association rule mining for both frequent and infrequent items using particle swarm optimization algorithm | |
Zaman et al. | Knowledge Mapping for Research Papers | |
Vijayalakshmi et al. | An efficient count based transaction reduction approach for mining frequent patterns | |
Bhiwani | K-Mean Evaluation in Weka Tool and Modifying It using Standard Score Method | |
Liu et al. | Interactive visual decision tree classification | |
JP4004584B2 (ja) | クラスタリング装置及び方法 | |
Cinar et al. | Clustering of short time-course gene expression data with dissimilar replicates |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100325 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120717 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120719 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5051764 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150803 Year of fee payment: 3 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |