CN113490843A - 采用拉曼光谱确定病毒滴度的方法 - Google Patents
采用拉曼光谱确定病毒滴度的方法 Download PDFInfo
- Publication number
- CN113490843A CN113490843A CN201980092894.2A CN201980092894A CN113490843A CN 113490843 A CN113490843 A CN 113490843A CN 201980092894 A CN201980092894 A CN 201980092894A CN 113490843 A CN113490843 A CN 113490843A
- Authority
- CN
- China
- Prior art keywords
- sample
- wavenumber ranges
- wavenumber
- vip
- listed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 262
- 241000700605 Viruses Species 0.000 title claims abstract description 146
- 238000001069 Raman spectroscopy Methods 0.000 title claims abstract description 136
- 230000003612 virological effect Effects 0.000 claims abstract description 239
- 238000012545 processing Methods 0.000 claims abstract description 22
- 238000001237 Raman spectrum Methods 0.000 claims description 147
- 238000004519 manufacturing process Methods 0.000 claims description 65
- 230000003595 spectral effect Effects 0.000 claims description 51
- 239000002245 particle Substances 0.000 claims description 39
- 238000004422 calculation algorithm Methods 0.000 claims description 38
- 238000011529 RT qPCR Methods 0.000 claims description 33
- 241000713666 Lentivirus Species 0.000 claims description 25
- 238000004611 spectroscopical analysis Methods 0.000 claims description 25
- 238000005259 measurement Methods 0.000 claims description 24
- 238000010238 partial least squares regression Methods 0.000 claims description 22
- 238000004458 analytical method Methods 0.000 claims description 20
- 230000008569 process Effects 0.000 claims description 19
- 238000011065 in-situ storage Methods 0.000 claims description 14
- 208000015181 infectious disease Diseases 0.000 claims description 14
- 238000003762 quantitative reverse transcription PCR Methods 0.000 claims description 14
- 241000713772 Human immunodeficiency virus 1 Species 0.000 claims description 13
- 238000007781 pre-processing Methods 0.000 claims description 13
- 230000004044 response Effects 0.000 claims description 12
- 238000002965 ELISA Methods 0.000 claims description 11
- 230000008859 change Effects 0.000 claims description 10
- 238000013528 artificial neural network Methods 0.000 claims description 8
- 241000702421 Dependoparvovirus Species 0.000 claims description 7
- 230000003044 adaptive effect Effects 0.000 claims description 7
- 238000011002 quantification Methods 0.000 claims description 7
- 230000036961 partial effect Effects 0.000 claims description 6
- 239000001963 growth medium Substances 0.000 claims description 5
- 238000004393 prognosis Methods 0.000 claims description 4
- 210000002966 serum Anatomy 0.000 claims description 4
- 206010036790 Productive cough Diseases 0.000 claims description 3
- 208000036142 Viral infection Diseases 0.000 claims description 3
- 210000004369 blood Anatomy 0.000 claims description 3
- 239000008280 blood Substances 0.000 claims description 3
- 210000001175 cerebrospinal fluid Anatomy 0.000 claims description 3
- 210000002381 plasma Anatomy 0.000 claims description 3
- 210000003296 saliva Anatomy 0.000 claims description 3
- 210000003802 sputum Anatomy 0.000 claims description 3
- 208000024794 sputum Diseases 0.000 claims description 3
- 210000002700 urine Anatomy 0.000 claims description 3
- 230000009385 viral infection Effects 0.000 claims description 3
- 210000003608 fece Anatomy 0.000 claims description 2
- 230000006641 stabilisation Effects 0.000 claims description 2
- 238000011105 stabilization Methods 0.000 claims description 2
- 238000000479 surface-enhanced Raman spectrum Methods 0.000 claims 1
- 238000012544 monitoring process Methods 0.000 abstract description 13
- 239000000523 sample Substances 0.000 description 141
- 210000004027 cell Anatomy 0.000 description 33
- 238000001228 spectrum Methods 0.000 description 25
- 239000013603 viral vector Substances 0.000 description 24
- 238000012549 training Methods 0.000 description 21
- 239000013598 vector Substances 0.000 description 18
- 238000003556 assay Methods 0.000 description 15
- 108090000623 proteins and genes Proteins 0.000 description 15
- 239000012491 analyte Substances 0.000 description 14
- 238000012360 testing method Methods 0.000 description 13
- 238000010361 transduction Methods 0.000 description 11
- 230000026683 transduction Effects 0.000 description 11
- 238000002790 cross-validation Methods 0.000 description 10
- 238000001514 detection method Methods 0.000 description 10
- 150000001875 compounds Chemical class 0.000 description 8
- 230000002458 infectious effect Effects 0.000 description 8
- 239000013612 plasmid Substances 0.000 description 8
- 102000004169 proteins and genes Human genes 0.000 description 8
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 7
- 238000010276 construction Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 239000008103 glucose Substances 0.000 description 7
- 239000000203 mixture Substances 0.000 description 7
- 239000000758 substrate Substances 0.000 description 7
- 241001164825 Adeno-associated virus - 8 Species 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 6
- 238000012937 correction Methods 0.000 description 6
- 230000007423 decrease Effects 0.000 description 6
- 238000001415 gene therapy Methods 0.000 description 6
- 238000004806 packaging method and process Methods 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- 238000004113 cell culture Methods 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 230000002829 reductive effect Effects 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 238000004416 surface enhanced Raman spectroscopy Methods 0.000 description 5
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 4
- 101000596041 Homo sapiens Plastin-1 Proteins 0.000 description 4
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 4
- 102100035181 Plastin-1 Human genes 0.000 description 4
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 4
- 239000012472 biological sample Substances 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 239000006143 cell culture medium Substances 0.000 description 4
- 238000002659 cell therapy Methods 0.000 description 4
- 238000007405 data analysis Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000011066 ex-situ storage Methods 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 239000002609 medium Substances 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 4
- 238000000746 purification Methods 0.000 description 4
- 238000010187 selection method Methods 0.000 description 4
- 238000001890 transfection Methods 0.000 description 4
- 238000003146 transient transfection Methods 0.000 description 4
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 3
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 3
- 108010067390 Viral Proteins Proteins 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000011109 contamination Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000000835 fiber Substances 0.000 description 3
- 230000001900 immune effect Effects 0.000 description 3
- 238000012625 in-situ measurement Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000012627 multivariate algorithm Methods 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 238000004448 titration Methods 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 2
- 108091093088 Amplicon Proteins 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- 238000003841 Raman measurement Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000001724 coherent Stokes Raman spectroscopy Methods 0.000 description 2
- 238000002082 coherent anti-Stokes Raman spectroscopy Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 238000013499 data model Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000005283 ground state Effects 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000011031 large-scale manufacturing process Methods 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 239000002207 metabolite Substances 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 108020004707 nucleic acids Proteins 0.000 description 2
- 102000039446 nucleic acids Human genes 0.000 description 2
- 150000007523 nucleic acids Chemical class 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- 238000001945 resonance Rayleigh scattering spectroscopy Methods 0.000 description 2
- 229910052594 sapphire Inorganic materials 0.000 description 2
- 239000010980 sapphire Substances 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 238000004793 spatially offset Raman spectroscopy Methods 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 210000002845 virion Anatomy 0.000 description 2
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- KVZLHPXEUGJPAH-UHFFFAOYSA-N 2-oxidanylpropanoic acid Chemical compound CC(O)C(O)=O.CC(O)C(O)=O KVZLHPXEUGJPAH-UHFFFAOYSA-N 0.000 description 1
- 241001655883 Adeno-associated virus - 1 Species 0.000 description 1
- 241000702423 Adeno-associated virus - 2 Species 0.000 description 1
- 241001634120 Adeno-associated virus - 5 Species 0.000 description 1
- HJCMDXDYPOUFDY-WHFBIAKZSA-N Ala-Gln Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O HJCMDXDYPOUFDY-WHFBIAKZSA-N 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 108090000565 Capsid Proteins Proteins 0.000 description 1
- 101710132601 Capsid protein Proteins 0.000 description 1
- 102100023321 Ceruloplasmin Human genes 0.000 description 1
- 101710094648 Coat protein Proteins 0.000 description 1
- 108020004414 DNA Proteins 0.000 description 1
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 1
- 238000008157 ELISA kit Methods 0.000 description 1
- 241000353621 Eilat virus Species 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 239000012739 FreeStyle 293 Expression medium Substances 0.000 description 1
- 241001663880 Gammaretrovirus Species 0.000 description 1
- 208000031886 HIV Infections Diseases 0.000 description 1
- 101000596046 Homo sapiens Plastin-2 Proteins 0.000 description 1
- 241000725303 Human immunodeficiency virus Species 0.000 description 1
- 241000713340 Human immunodeficiency virus 2 Species 0.000 description 1
- 238000004566 IR spectroscopy Methods 0.000 description 1
- 101150117564 ITR2 gene Proteins 0.000 description 1
- 102100021244 Integral membrane protein GPR180 Human genes 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 229930182816 L-glutamine Natural products 0.000 description 1
- 239000012124 Opti-MEM Substances 0.000 description 1
- 238000009004 PCR Kit Methods 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 102100035182 Plastin-2 Human genes 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 108020000999 Viral RNA Proteins 0.000 description 1
- 229910008760 WITec Inorganic materials 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 238000013019 agitation Methods 0.000 description 1
- 150000001413 amino acids Chemical class 0.000 description 1
- 229910021529 ammonia Inorganic materials 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 239000008364 bulk solution Substances 0.000 description 1
- 210000000234 capsid Anatomy 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 238000005056 compaction Methods 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 239000013583 drug formulation Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005281 excited state Effects 0.000 description 1
- 238000013401 experimental design Methods 0.000 description 1
- 238000000684 flow cytometry Methods 0.000 description 1
- 108010027225 gag-pol Fusion Proteins Proteins 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 238000003018 immunoassay Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010949 in-process test method Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- AMGQUBHHOARCQH-UHFFFAOYSA-N indium;oxotin Chemical compound [In].[Sn]=O AMGQUBHHOARCQH-UHFFFAOYSA-N 0.000 description 1
- 239000012678 infectious agent Substances 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 230000031700 light absorption Effects 0.000 description 1
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 238000002705 metabolomic analysis Methods 0.000 description 1
- 230000001431 metabolomic effect Effects 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 239000007758 minimum essential medium Substances 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 238000012372 quality testing Methods 0.000 description 1
- 238000012207 quantitative assay Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 238000013515 script Methods 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000001774 stimulated Raman spectroscopy Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 239000002352 surface water Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000002463 transducing effect Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 238000004929 transmission Raman spectroscopy Methods 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 238000002460 vibrational spectroscopy Methods 0.000 description 1
- 235000012431 wafers Nutrition 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/63—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
- G01N21/65—Raman scattering
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01J—MEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
- G01J3/00—Spectrometry; Spectrophotometry; Monochromators; Measuring colours
- G01J3/28—Investigating the spectrum
- G01J3/44—Raman spectrometry; Scattering spectrometry ; Fluorescence spectrometry
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/569—Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
- G01N33/56983—Viruses
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2201/00—Features of devices classified in G01N21/00
- G01N2201/12—Circuits of general importance; Signal processing
- G01N2201/129—Using chemometrical methods
- G01N2201/1293—Using chemometrical methods resolving multicomponent spectra
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2201/00—Features of devices classified in G01N21/00
- G01N2201/12—Circuits of general importance; Signal processing
- G01N2201/129—Using chemometrical methods
- G01N2201/1296—Using chemometrical methods using neural networks
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2333/00—Assays involving biological materials from specific organisms or of a specific nature
- G01N2333/005—Assays involving biological materials from specific organisms or of a specific nature from viruses
- G01N2333/01—DNA viruses
Landscapes
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Immunology (AREA)
- Chemical & Material Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Analytical Chemistry (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Virology (AREA)
- Theoretical Computer Science (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Hematology (AREA)
- Molecular Biology (AREA)
- Urology & Nephrology (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Food Science & Technology (AREA)
- Algebra (AREA)
- Computational Mathematics (AREA)
- Cell Biology (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Biotechnology (AREA)
- Pure & Applied Mathematics (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Tropical Medicine & Parasitology (AREA)
- Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
公开了拉曼光谱用于监测和评估病毒滴度的用途。一种采用拉曼光谱定量样本中病毒滴度的方法,包括以下步骤:(a)提供样本并用光源照射样本;(b)测量多个波数范围中的每一个内的拉曼散射光的总强度以获得样本的波数强度数据集,其中多个波数范围是预先选择的并且表征样本中的病毒;(c)对波数强度数据执行数学数据处理步骤;和(d)基于数学数据处理步骤的输出定量病毒滴度。
Description
技术领域
本发明涉及拉曼光谱在监测和评估病毒滴度中的用途。
背景技术
病毒载体制造是许多细胞和基因疗法生产的关键过程步骤,该行业的增长已导致对病毒载体供应的需求增加。鉴于此,重要的是分析工具是可利用的,以确保可以监控和优化病毒载体生产过程,并且可以定量和表征病毒载体产品。对病毒载体的需求和生产成本都对生产过程中获得良好的病毒载体滴度具有特别重要的影响。目前,物理病毒滴度测量通常通过标准分析技术进行,例如对于慢病毒滴度,经常使用ELISA(酶联免疫吸附测定)来评估p24或qPCR以测量病毒RNA,对于AAV,经常使用带有靶向ITR的引物的RT qPCR。然而,这些方法耗时、通常不准确并且需要对介质进行采样。因此,这些方法仅提供病毒浓度的回顾性测量。因此,需要新的测量病毒滴度的方法。
拉曼光谱是一种振动形式的光谱,其已被证明在需要分子信息的过程分析技术(PAT)应用中具有特殊的实用性。该技术基于检测光子中的波数偏移,该光子已被样本中存在的分子非弹性散射(其中此类光子的波数差异与光子因特定分子的振动状态从基态改变为第一激发态引起的能量损失有关,或者与光子从去激发分子自激发振动态到基态所获得的能量有关)。与以前用于PAT应用的方法相比,该技术具有许多优势,最显著的是与其他***相比,相对较弱的信号是由水产生的,这有助于生物过程监测、细胞培养分析和溶液中的蛋白质分析。例如,拉曼光谱已被用于方差检验和确定原材料和细胞培养基的身份;表征大分子产品;分析药物配方、批次间的可变性、污染、培养基降解、细胞密度(包括活细胞密度和总细胞密度)、蛋白质结构和蛋白质稳定性;用于聚合物和纤维分析;用于材料ID测试和用于葡萄糖、谷氨酰胺、乳酸(lactate)和氨的定量。Buckley和Ryder(2017)对拉曼光谱的适用性进行了综述。
然而,传统的拉曼光谱与弱信号的产生有关,据报道弱信号影响其在生物领域中经常需要的敏感定量分析的使用。事实上,据报道,使用传统拉曼光谱检测葡萄糖的浓度极限为0.6mM,据报道检测苯丙氨酸的浓度极限为1.1mM(Buckley和Ryder,2017,AppliedSpectroscopy,71,p1085-1116)(估计为分别相当于0.11mg/ml和0.18mg/ml)。鉴于此,本领域主要使用传统的拉曼光谱来评估细胞培养基和细胞生长,并且在需要更灵敏的测量时采用了其他方法,例如检测在所报告的传统拉曼光谱检测限值以下的实体,如病毒颗粒。在这方面,Lee等人(2015)描述了使用表面增强拉曼光谱(Surface Enhanced RamanSpectroscopy,SERS)检测HIV-1。SERS与传统拉曼不同,它提供来自附着在纳米级粗糙金属表面的分子(例如Ag、Cu或Au)的增强信号。在Lee等人中,包含结合的抗gp120抗体片段的Au纳米点制造的铟锡氧化物基底用于特异性结合HIV-1病毒样颗粒,以确保产生增强的信号用于HIV-1病毒样颗粒检测。然而,SERS与限制有关,限制包括需要预先准备具有适当免疫相互作用分子的底物(其限制了该技术的一般应用)以及与此相关的成本增加。此外,要求与感兴趣实体相结合,鉴于这一性质,SERS在样本中始终是侵入性的。
因此,需要其他的方法来表征和评估可能与敏感或弱信号相关的实体,例如病毒,并原位评估此类实体。
发明内容
令人惊奇的是,与本领域的教导形成直接对比,发明人已经证明,传统拉曼光谱可以用于准确地且灵敏地原位实时定量病毒滴度。发明人已经证明,通过传统拉曼光谱测定的病毒滴度与离线滴度测量值(例如,如通过诸如RT-qPCR和p24 ELISA的离线试验测量的)相当,并且传统拉曼光谱可以提供替代的快速且可靠的评估病毒滴度的方法。如前所述,鉴于下述现有技术,该发现尤其出乎意料:现有技术中,传统拉曼光谱与弱信号的产生相关,且溶液中病毒的低浓度将被理解为低于使用传统拉曼光谱检测的典型下限,例如当应用于本体溶液***,尤其是那些具有较大散射变化且存在不需要的荧光背景信号的***时。
特别地,发明人已经确定了一系列光谱变量,这些变量对于使用处理实时拉曼光谱数据的模型进行预测以实现实时病毒滴度的测量是重要的。发明人已经建立了具有不同重要性阈值的数量不断增加的变量的分层范围,以便在使用拉曼光谱时为准确预测病毒滴度提供变量范围。发明人已经证明,拉曼光谱可用于识别病毒生产过程的开始、生产阶段和结束。
本发明因此涉及拉曼光谱用于监测和/或评估样本中病毒滴度的用途。替代地,本发明涉及一种用于监测和/或评估样本中病毒滴度的方法,包括采用多元模型分析包含病毒的样本的拉曼光谱并测定病毒滴度的步骤。这种方法还可以包括对样本进行拉曼光谱,即获得光谱的步骤。
本发明进一步具体地涉及拉曼光谱用于监测和/或评估病毒生产过程的开始、生产阶段和/或结束的用途。发明人已经确定拉曼光谱可以用于确定病毒滴度(如上所述),并且特别地发明人已经确定了需要为此目的评估的特定波数范围。此类峰的强度可在本发明的方法中确定,其中此类峰的强度可导致指纹的产生,该指纹可用多元模型评估以确定病毒滴度。在本发明的一个优选实施方案中,监测和/或评估的病毒滴度是慢病毒滴度。
本发明的一个优点是可以实时连续监测病毒滴度。不需要从培养基中取样来生成对病毒滴度的估算,如果需要,可以在原位进行测量。因此,可以在没有污染风险的情况下产生更准确的病毒滴度趋势。本发明的方法因此比离线方法更快且更简单。特别地,可以更准确地测量培养物的生产阶段,使病毒生产的结束/收获阶段的计时更加准确,从而允许在适当的时间点停止该过程,潜在地降低了生产过程的成本。
因此,本发明提供了一种采用拉曼光谱定量样本中病毒滴度的方法,所述方法包括以下步骤:
(a)提供样本并用光源照射所述样本;
(b)测量多个波数范围中的每一个波数范围内的拉曼散射光的总强度,以获得所述样本的波数强度数据集,其中所述多个波数范围是预先选择的并且表征样本中的病毒;
(c)对所述波数强度数据执行数学数据处理步骤;和
(d)基于所述数学数据处理步骤的输出定量所述病毒滴度。
在上述定义的方法中,进行数学数据处理和定量病毒滴度的步骤可以包括:
(i)任选地,通过采用一种或多种预处理分析方法对所述信号强度数据预处理来使所述波数信号强度数据归一化,预处理分析方法例如一阶导数法、二阶导数法、标准正态变量(SNV)法、多项式拟合法、多元多项式拟合法(multi-polynomial fitting method)、软化子法(mollifier method)、分段多项式拟合(PPF)法或自适应迭代重加权惩罚最小二乘(adaptive iteratively reweighted Penalized Least Squares,airPLS)法;
(ii)通过对所述波数信号强度数据应用多元回归算法来获得模型参数,所述多元回归算法诸如偏最小二乘(PLS)回归算法,任选地其中PLS算法是非线性迭代偏最小二乘(NIPALS)回归算法或神经网络;和
(iii)采用通过将所述多元回归算法应用于所述信号强度数据获得的模型参数来定量所述病毒滴度。
在任何上述定义的方法中,用于照射样本的光源可以是激光并且可以用波长为785nm的光照射样本。
在任何上述定义的方法中,可以使用电荷耦合器件(CCD)检测所述拉曼散射光。
在上述方法的一个实施方案中,所测量的拉曼光谱中的多个波数范围可以包括表1中所列的波数范围1至28中的5个或更多个,并且其中变量重要性投影(VIP)≥1.00;或者,所测量的拉曼光谱中的多个波数范围可以包括表1中所列的波数范围1至28中的10个或更多个,并且其中VIP≥1.00;或者,所测量的拉曼光谱中的多个波数范围可以包括表1中所列的波数范围1至28中的15个或更多个,并且其中VIP≥1.00;或者,所测量的拉曼光谱中的多个波数范围可以包括表1中所列的波数范围1至28中的20个或更多个,并且其中VIP≥1.00;或者,所测量的拉曼光谱中的多个波数范围可以包括表1中所列的波数范围1至28中的25个或更多个,并且其中VIP≥1.00;或者,所测量的拉曼光谱中的多个波数范围可以包括表1中列出的波数范围1至28中的所有28个,并且其中VIP≥1.00。在这些方法中的任一种中,所测量的病毒滴度可以优选地是慢病毒滴度。
替代地,所测量的拉曼光谱中的多个波数范围可以包括表1中所列的波数范围29至59中的5个或更多个,并且其中变量重要性投影(VIP)≥1.25;或者,所测量的拉曼光谱中的多个波数范围可以包括表1中所列的波数范围29至59中的10个或更多个,并且其中VIP≥1.25;或者,所测量的拉曼光谱中的多个波数范围可以包括表1中所列的波数范围29至59中的15个或更多个,并且其中VIP≥1.25;或者,所测量的拉曼光谱中的多个波数范围可以包括表1中所列的波数范围29至59中的20个或更多个,并且其中VIP≥1.25;或者,所测量的拉曼光谱中的多个波数范围可以包括表1中所列的波数范围29至59中的25个或更多个,并且其中VIP≥1.25;或者,所测量的拉曼光谱中的多个波数范围可以包括表1中所列的波数范围29至59中的30个,并且其中VIP≥1.25;或者,所测量的拉曼光谱中的多个波数范围可以包括表1中所列的波数范围29至59中的所有31个,并且其中VIP≥1.25。在这些方法中的任一种中,所测量的病毒滴度可以优选地是慢病毒滴度。
替代地,所测量的拉曼光谱中的多个波数范围可以包括表1中所列的波数范围60至81中的5个或更多个,并且其中变量重要性投影(VIP)≥1.50;或者,所测量的拉曼光谱中的多个波数范围可以包括表1中所列的波数范围60至81中的10个或更多个,并且其中VIP≥1.50;或者,所测量的拉曼光谱中的多个波数范围可以包括表1中所列的波数范围60至81中的15个或更多个,并且其中VIP≥1.50;或者,所测量的拉曼光谱中的多个波数范围可以包括表1中所列的波数范围60至81中的20个或更多个,并且其中VIP≥1.50;或者,所测量的拉曼光谱中的多个波数范围可以包括表1中所列的波数范围60至81中的所有22个,并且其中VIP≥1.50。在这些方法中的任一种中,所测量的病毒滴度可以优选地是慢病毒滴度。
在上述方法的另一个实施方案中,所测量的拉曼光谱中的多个波数范围可以包括表2中所列的波数范围1至12中的4个或更多个,其中VIP≥1.00。所测量的拉曼光谱中的多个波数范围可以包括表2中所列的波数范围1至12中的6个或更多个,并且其中VIP≥1.00。所测量的拉曼光谱中的多个波数范围可以包括表2中所列的波数范围1至12中的8个或更多个,并且其中VIP≥1.00。所测量的拉曼光谱中的多个波数范围可以包括表2中所列的波数范围1至12中的10个或更多个,并且其中VIP≥1.00。所测量的拉曼光谱中的多个波数范围可以包括表2中所列的波数范围1至12中的所有12个,并且其中VIP≥1.00。在这些方法中的任一种中,所测量的病毒滴度可以优选地是腺相关病毒(AAV)的滴度。
所测量的拉曼光谱中的多个波数范围可以包括表2中所列的波数范围13至22中的4个或更多个,并且其中VIP≥1.25。所测量的拉曼光谱中的多个波数范围可以包括表2中所列的波数范围13至22中的6个或更多个,并且其中VIP≥1.25。所测量的拉曼光谱中的多个波数范围可以包括表2中所列的波数范围13至22中的8个或更多个,并且其中VIP≥1.25。所测量的拉曼光谱中的多个波数范围可以包括表2中所列的波数范围13至22中的所有10个,并且其中VIP≥1.25。在这些方法中的任一种中,所测量的病毒滴度可以优选地是腺相关病毒(AAV)的滴度。
所测量的拉曼光谱中的多个波数范围可以包括表2中所列的波数范围23至30中的4个或更多个,并且其中VIP≥1.50。所测量的拉曼光谱中的多个波数范围可以包括表2中所列的波数范围23至30中的6个或更多个,并且其中VIP≥1.50。所测量的拉曼光谱中的多个波数范围可以包括表2中所列的波数范围23至30中的所有8个,并且其中VIP≥1.50。在这些方法中的任一种中,所测量的病毒滴度可以优选地是腺相关病毒(AAV)的滴度。
在任何上述定义的方法中,所测得的病毒滴度可为物理病毒滴度。
在任何上述定义的方法中,所测得的病毒滴度可为功能性病毒滴度。
在任何上述定义的方法中,所测得的病毒滴度可以不是HIV-1的滴度或HIV-1病毒样颗粒(HIV-1VLP)的滴度。
在任何上述定义的方法中,不处理样本以使得样本内待检测的病毒颗粒固定在表面上。因此,在任何上述定义的方法中,病毒颗粒没有固定在表面上。
在任何上述定义的方法中,拉曼光谱都不是表面增强拉曼光谱(SERS)。
在任何上述定义的方法中,样本可以是病毒培养物,并且可以从培养物获得的波数强度数据集原位定量病毒滴度。
在任何上述定义的方法中,样本可以是从病毒培养物的培养基获得的样本,并且病毒滴度可以从由样本获得的波数强度数据集定量。
在任何上述定义的方法中,该方法可以包含在第一时间点定量样本中的病毒滴度的第一步骤和在稍后的时间点定量样本中的病毒滴度的一个或多个另外的步骤,并且该方法还可以包括测量在时间点之间样本中病毒滴度的变化,其中每个定量步骤通过任何上述定义的方法进行,优选地其中每个定量步骤通过相同的方法进行。在任何这样的方法中,可以在一个时间段内重复定量病毒滴度以实时提供对病毒滴度变化的测量。在任何此类方法中,样本中病毒滴度的变化可用于确定病毒生产过程的起始阶段、生产阶段和/或稳定阶段。
在任何上述定义的方法中,该方法可用于确定病毒生产过程的最佳条件。
在任何上述定义的方法中,该方法可用于评估病毒生产过程下游的过程。
在任何上述定义的方法中,该方法可以包括将由此获得的病毒滴度与通过替代方法从相同样本获得的病毒滴度进行比较的步骤,任选地其中替代方法是RT-qPCR或p24ELISA。
本发明还提供了一种采用拉曼光谱确定个体中病毒感染程度的方法,该方法包括通过执行上述任何定量样本中病毒滴度的方法来定量样本中的病毒滴度,其中样本是先前已从个体获得的样本。在任何此类方法中,样本可以是血液、唾液、痰、血浆、血清、脑脊液、尿液或粪便的样本。在任何此类方法中,可以将来自受试者的样本中的病毒滴度与一个或多个先前已针对个体感染获得的病毒滴度测量值进行比较,以提供个体的感染阶段的预后(prognosis)。
本发明还提供了一种采用拉曼光谱定量样本中的病毒滴度的方法,该方法包括以下步骤:
(a)提供所述样本的波数强度数据集,其中所述数据集已通过用光源照射所述样本并测量多个波数范围中的每一个波数范围内的拉曼散射光的总强度而获得,其中在所述拉曼光谱中所述多个波数范围已被选为表征所述样本中的病毒;
(b)对所述波数强度数据执行数学数据处理步骤;和
(c)基于所述数学数据处理步骤的输出定量所述病毒滴度。
该特定方法可以根据在任一上述定义的定量样本中病毒滴度的方法中限定的步骤来执行。
本发明还提供了一种建立多元数据处理模型的方法,该模型能够从针对样本获得的拉曼光谱波数强度数据集提供样本中病毒滴度的定量,该方法包括:
(a)提供样本并用光源照射样本;
(b)测量多个波数范围中的每一个波数范围内的拉曼散射光的总强度,以获得所述样本的波数强度数据集;
(c)通过采用预处理分析方法对所述信号强度数据预处理获得归一化的波数信号强度数据,所述预处理分析方法例如一阶导数法、二阶导数法、标准正态变量(SNV)法、多项式拟合法、多元多项式拟合法、软化子法、分段多项式拟合(PPF)法或自适应迭代重加权惩罚最小二乘(airPLS)法;
(d)通过对预处理的信号强度数据应用多元回归算法来获得模型参数,所述多元回归算法诸如偏最小二乘(PLS)回归算法,任选地其中PLS算法是非线性迭代偏最小二乘(NIPALS)回归算法或神经网络,其中执行校准,其中将所述预处理的信号强度数据与采用诸如qPCR和p24 ELISA的非拉曼光谱方法对于相同样本条件获得的病毒滴度数据进行比较;
(e)采用从预处理的数据获得的所述模型参数推断响应值;和
(f)执行变量选择,任选地变量重要性投影(VIP),并鉴定拉曼光谱变量;和
(g)任选地,通过重新应用步骤(d)到(f)来执行一轮或多轮进一步的建模,其中除去不重要的变量;并且
其中,样本中的病毒滴度采用针对已鉴定的拉曼光谱变量获得的模型参数进行定量,所述已鉴定的拉曼光谱变量源自所述多元数据处理模型。
在上述定义的构建多元数据处理模型的方法中,不处理样本以使得样本中待检测的病毒颗粒固定在表面上。因此,在上述定义的构建多元数据处理模型的方法中,病毒颗粒没有固定在表面上。在上述定义的构建多元数据处理模型的方法中,拉曼光谱不是表面增强拉曼光谱(SERS)。
本发明还提供了拉曼光谱在定量样本中的病毒滴度中的用途。
在任何此类用途中,所述样本是病毒培养物或来自病毒培养物的样本,并且所述病毒滴度可基于从所述样本获得的拉曼散射光的强度的测量值来原位定量,其中拉曼散射光的强度是从拉曼光谱中的多个波数范围测得的,所述多个波数范围表征所述样本中的病毒。
在任何此类用途中,样本中的病毒滴度可以在第一时间点和一个或多个稍后的时间点定量,并且其中计算时间点之间样本中的病毒滴度的变化。样本中的病毒滴度可以重复定量以实时提供对病毒滴度变化的测量。样本中的病毒滴度可以通过进行任何上述定义的使用拉曼光谱定量样本中的病毒滴度的方法来定量。
在任何此类用途中,不处理样本以使得样本内待检测的病毒颗粒固定在表面上。因此,在任何此类用途中,病毒颗粒并未固定在表面上。在任何此类用途中,拉曼光谱不是表面增强拉曼光谱(SERS)。
附图说明
图1:示出红外吸收/发射的量子能量跃迁的雅布隆斯基(Jablonski)图。该图显示具有斯托克斯(Stokes)跃迁和反斯托克斯(anti-Stokes)跃迁的瑞利(Rayleigh)(弹性散射)和拉曼(非弹性散射)。
图2:来自VV拉曼项目慢病毒生物反应器运行的预处理拉曼光谱示例。插图是1000cm-1区域的放大图。在CCD读出时间大约15分钟后,采集光谱10秒,累计75次,总积分时间约为12分30秒。
图3:示出病毒载体拉曼项目中生物反应器转染的代表性qPCR慢病毒滴度结果的条形图,cp数=拷贝数。
图4:示出预测均方误差(MSEPCV)在10倍交叉验证和20次蒙特卡洛重复后如何随PLS潜在变量/分量(在光谱变量选择之前)的数量变化的图表。
图5(A):根据初始10个分量PLS-R模型计算的变量重要性投影(VIP)的图。圆圈表示VIP>1.5的光谱变量,该信息用于确定图5(B)中所示的范围。图5(C):VIP>1.5的光谱变量表,范围按重要性排序。
图6:示出交叉验证后预测均方误差随潜在变量或分量的数量变化的图。在使用VIP>1.5的保守谱变量减少后获得。
图7:示出光谱变量减少(VIP>1.5)后慢病毒运行1次生物反应器4的拉曼拷贝数/mL PLS-R预测(10LV)以及离线qPCR数据的图。T表示“转染”且NT表示“未转染”。
图8:示出光谱变量减少(VIP>1.5)后慢病毒运行2次生物反应器1-4的拉曼拷贝数PLS-R预测(10LV)以及离线qPCR数据的图。
图9:示出光谱变量减少后慢病毒运行3次生物反应器1-4的PLS-R预测(10LV)以及离线qPCR数据的图。
图10:比较RT-qPCR和p24 ELISA结果。p24 ELISA分析仅用于获得少量离线样本的慢病毒滴度。
图11:应用实时拉曼派生的病毒滴度模型来识别病毒生产过程的开始、生产阶段和结束的示例。根据模型(黑色实线),一组3个指标也是实时计算的。连同对病毒滴度的模型估算,指标曲线的形状告知病毒生产的各个阶段(如叠加到图表的文本中所解释的)。使用RT-qPCR和/或ELISA方法回顾性计算的物理滴度与图表(正方形和虚线)重叠,以显示实时数据和回顾性离线数据之间的总体一致性。包含来自拉曼光谱的附加峰可以提高拉曼模型的质量,但是该图是使用鉴定病毒生产主要阶段所需的最少区域数生成的。
图12:示出用于定量病毒滴度的公式的概要示意图。该公式应用于模型参数(在这种情况下是回归系数),这些参数从应用于归一化的拉曼信号强度数据的多元回归算法中获得。
图13:示出R2(1-残差平方和/总平方和)随着波数范围数量变化的图,以证明提供低病毒滴度估算所需的波数范围的最小数量。
图14:来自AAV拉曼项目生物反应器运行的预处理拉曼光谱示例。插图是1000-1200cm-1区域的放大图。在CCD读出时间大约15分钟后,采集光谱10秒,累计75次,总积分时间约为12分30秒。
图15:示出AAV拉曼项目中生物反应器转染的代表性qPCR AAV病毒滴度结果的条形图。
图16:示出预测均方误差(MSEPCV)在10倍交叉验证和20次蒙特卡洛重复后如何随PLS潜在变量/分量(在光谱变量选择之前)的数量变化的图表。
图17(A):根据初始15个分量PLS-R模型计算的变量重要性投影(VIP)的图。圆圈表示VIP≥1.0的光谱变量,该信息用于确定图17(B)中所示的范围。图17(C):VIP≥1.0的光谱变量表,范围按重要性排序。
图18:示出交叉验证后预测均方误差随潜在变量或分量的数量变化的图。在使用VIP≥1.0的光谱变量减少后获得。
图19:示出光谱变量减少后运行4次生物反应器1-4的拉曼拷贝数PLS-R预测(9LV)以及离线qPCR数据的图。
图20:示出R2(1-残差平方和/总平方和)随着波数范围数量变化的图,以证明提供AAV病毒滴度估算所需的波数范围的最小数量。
具体实施方案
应当理解,所公开方法的不同应用可以根据本领域的具体需要进行调整。还应理解,本文所用的术语仅用于描述本发明的特定实施方案的目的,而非旨在进行限制。
此外,在本说明书和所附权利要求书中使用的单数形式“一”、“一个”和“所述”包括复数指代,除非文中另有明确规定。
本文无论是上文还是下文所引用的所有出版物、专利和专利申请,均通过引用整体并入本文。
病毒滴度
本发明涵盖拉曼光谱监测和评估病毒滴度的用途。
本文所定义的“病毒滴度”是指给定体积中存在的病毒量。本发明可以评估任何类型的病毒滴度,例如可以评估物理病毒滴度、功能性病毒滴度(又称感染性病毒滴度)或转导病毒滴度。在一个特定的实施方案中,可以评估物理病毒滴度。物理病毒滴度是样本中病毒颗粒浓度的量度,且通常基于病毒蛋白(如p24)或病毒核酸的存在。物理滴度可以表示为每毫升中的病毒颗粒(VP/mL)、每毫升中的病毒基因组(vg/mL)、每毫升中的病毒拷贝数或每毫升中的RNA拷贝数,测量物理滴度的现有技术分析包括用于p24的ELISA(例如,Lenti-Xp24快速滴度试剂盒(Takara)或慢病毒相关的p24 ELISA试剂盒(Cell Biolabs,Inc))、qPCR或ddPCR(例如,AAV实时PCR滴定试剂盒(Takara)或Adeno X qPCR滴定试剂盒(Takara))。物理滴度测量并不总是区分空的或有缺陷的病毒颗粒和能够感染细胞的颗粒。因此,物理病毒滴度可以区别于功能性滴度或感染滴度(功能性滴度或感染滴度决定了产生的颗粒有多少可以感染细胞)并且区别于转导病毒滴度(转导病毒滴度决定了有多少功能性病毒颗粒包含感兴趣的基因(例如对于病毒载体的生产,转导病毒滴度可能是相关的))。因此,物理滴度的测定不等同于功能性滴度的确定,除非样本中的所有颗粒都具有功能性。事实上,功能性滴度通常比物理滴度小100到1000倍。
或者,如上所述,可以用本发明测量或评估功能性或感染性滴度,其中功能性或感染性滴度是特定体积中存在的能够感染靶细胞的病毒颗粒的量的量度。功能性滴度可以表示为每毫升中的斑块形成单位(pfu/mL)或每毫升中的感染单位(ifu/mL)。可用于测量功能性或感染性滴度的离线测定包括斑块测定、病灶形成测定、终点稀释测定或流式细胞术。如上所述,转导滴度是特定体积中存在的能够感染靶细胞并且包含感兴趣的基因的病毒颗粒的量的量度。转导滴度可以表示为转导单位/mL,并且可以使用用于评估上述功能性滴度的测定以及任何已知的可以确定感兴趣基因的存在的测定(例如PCR)来进行评估。本领域技术人员将理解,功能性滴度或转导滴度可以通过按比例缩小获得的物理滴度的任何值来确定。如上所述,物理滴度和功能性滴度或转导滴度之间的倍数差异是本领域熟知的。因此,在本发明的一个方面,功能性滴度或转导滴度可以通过本发明的方法间接确定(例如通过按比例缩小获得的物理滴度值)。因此,本发明的方法可以包括按比例缩小物理滴度的确定值以确定功能性滴度或转导滴度的附加步骤。
本领域技术人员将理解,本发明的方法能够确定任何血清型的任何病毒的病毒滴度,例如,如慢病毒(例如HIV-1和HIV-2)和γ逆转录病毒等逆转录病毒;腺病毒和腺相关病毒(例如AAV1-11,特别是AAV1、AAV2、AAV5和AAV8,以及自身互补型AAV)。尽管通常在本发明中可以评估单一病毒类型的病毒滴度,但是本发明的方法将能够评估混合病毒样本的滴度,例如,包含两种或更多种病毒类型的样本的滴度。
在这方面,根据本发明产生的拉曼光谱可以直接检测病毒、间接检测病毒或既直接又间接检测病毒。因此,在拉曼光谱上产生和显示的波数峰可以指示与病毒相关的多种不同化合物或分子中的任何一种。本技术人员将理解,对于本发明的实施,没有必要准确地鉴定所鉴定的每个波数峰与哪些化合物/分子相关。相反,光谱在特定条件下(例如培养条件、病毒、生产细胞系和待测量的病毒滴度类型等)充当指纹,其中病毒滴度可通过使用特定多元模型(通常是在相同或类似条件下产生的模型)分析本文公开的每个波数范围内的信号强度来确定。本文更详细地描述了多元模型。因此,在特定波数下针对特定拉曼光谱获得的峰可能对应于病毒性的分子/化合物(例如衣壳蛋白等),或可能对应于非病毒性的分子/化合物(例如培养物中的代谢物,例如由病毒产生细胞产生)。这样,本发明中使用的拉曼光谱可以检测与病毒滴度间接相关的化合物,或者替代地,检测与病毒滴度直接相关的化合物。
预计虽然每个波数范围的信号强度可能不同并且可能差异化地对应于在不同条件下(例如,使用不同的生产细胞系或利用不同的培养基或生物反应器,来生产不同的病毒)获得的拉曼光谱中的病毒滴度,但是可评估的波数范围(例如,已确定与病毒滴度相关的波数范围)将保持相同。此外,应当理解,对于任何给定的条件集,用户将能够基于本文描述的和本领域已知的原理创建多元模型,并在分析来自本文所述相同波数范围的且是使用相同的条件集随后生成的不同信号强度数据时,应用该模型。这意味着用户可以使用本文所述的波数范围通过拉曼光谱计算病毒滴度,其中数据是在应用不同条件的***中生成的。
如本文所用的波数范围的慢病毒评估已鉴定了在评估病毒滴度中重要的范围。由于已知慢病毒在其化学组成方面是一种特别复杂的病毒,因此具有慢病毒中存在的部分成分的较简单病毒的化学成分很可能会产生落在所鉴定的波数范围的一部分内的相关信号(如果任何一个或多个波数范围直接检测病毒),例如至少5个已鉴定的波数范围。因此,本文提供的波数范围的子集可用于评估慢病毒以外的病毒的滴度。此外,如果被鉴定与病毒滴度相关的一个或多个波数范围间接检测到病毒,那么,由于任何病毒转染都可能导致培养物中类似的代谢组学变化,此类波数范围可能对评估任何***中的病毒滴度有用。
在本发明的一个具体实施方案中,监测和评估慢病毒滴度。一方面,病毒可以不是HIV-1或HIV-1病毒样颗粒。
“病毒”通常是一种小的感染原(infectious agent)(通常比细菌小),其只能在另一种生物体的活细胞内复制。病毒可具有基于RNA或DNA的基因组。如本文所用,“病毒”是指任何病毒、修饰病毒或病毒载体。因此,尽管可以根据本发明评估任何野生型病毒的病毒滴度,但是应当理解,本发明的效用可以特别扩展到突变病毒或修饰病毒(即与野生型或天然存在的病毒相比,包含一个或多个核酸取代、***、缺失或易位,或缺少编码病毒蛋白的大部分遗传物质)或病毒载体的病毒滴度的评估。虽然病毒载体可能基于野生型病毒,但与野生型病毒相比,它们通常经过修饰并且通常用于将遗传物质引入靶细胞(例如治疗用途的基因)。因此,病毒载体具有特殊的效用,例如用于基因疗法、细胞疗法或其他分子应用,且它们的生产对基因疗法和细胞疗法行业非常重要。可以很好地理解,例如,可以进行修饰以提高用于基因和/或细胞疗法的病毒载体的安全性或提高例如可以由载体携带的基因的大小。为创建病毒载体而进行的修饰可以包括删除对复制至关重要的部分病毒基因组,从而产生能够感染细胞但需要存在辅助病毒以提供产生新病毒体所需的缺失蛋白质的病毒载体。其他修饰可以包括用于降低病毒载体对其靶细胞的毒性和/或提高病毒稳定性的修饰,例如以减少基因组的重排。
病毒载体通常可以通过用编码病毒蛋白并携带所需遗传物质的多个质粒之一转导包装细胞系而在包装细胞系(例如HEK293细胞)中产生。例如,对于慢病毒生产,可以用一个或多个质粒转导HEK293细胞,例如用3或4个编码病毒体蛋白(例如衣壳和逆转录酶)并携带由载体传递的遗传物质的质粒。这被转录以产生单链RNA病毒基因组,并以psi序列的存在为标志,这确保基因组随后被包装到病毒体中。因此,特别地,慢病毒载体可以通过在生产细胞系中转化和表达三个(对于第二代***)或四个(对于第三代***)质粒来产生。用于生产病毒载体的质粒可商购获得,例如Lenti-Pac和AAV Prime(GeneCopoeia)。
特别地,可以通过本发明的方法监测或评估由包装细胞系产生的病毒载体的滴度。如前所述,在基因疗法和细胞疗法领域,能够以灵敏的方式测量产生的滴度特别重要,例如以便可以准确监控和管理生产过程,例如来自生产细胞系的生产。因此,对于通过本发明的方法监测或评估,病毒不需要是完全功能性的或野生型的。
如上所述,本发明的方法可以“监测或评估”病毒滴度。因此,本发明的方法能够确定病毒滴度,例如样本中存在的病毒颗粒的水平、量或浓度。特别地,该方法因此可以确定病毒的水平、量或浓度随时间增加还是平稳(例如通过在不同时间点测定样本),或与不同样本(例如在相同或等效的时间点测定的样本)相比是否变化(例如增加、减少或等同)。以此方式,本发明的方法可用于例如评估病毒的生产方法的效率,例如,其中检测或确定高水平的病毒可表示一种有效的方法,而低水平的病毒可表示一种次优的生产方法,或可用于确定特定因素在病毒生产方法中的重要性,例如,通过与其他改良生产方法期间测量的病毒滴度进行比较(针对相同或不同的病毒)。预期通过本文所述的方法检测到的物理滴度值在1x1010颗粒/mL至1x1011颗粒/mL的范围内。预计通过本文所述的方法检测到的感染性滴度值在1x108颗粒/mL至1x109颗粒/mL的范围内。因此,可以确定导致所测量的病毒滴度差异的因素的改变对于生产方法是重要的(例如,导致所测量的病毒滴度至少5%、10%、20%、30%、40%或50%差异的因素的改变)。这类因素可以包括孵育温度,使用的培养基,培养基中使用的葡萄糖或氨基酸的百分比,使用的搅拌的存在、不存在或量,或使用的培养瓶或体积等。
因此,本发明的方法可用于确定病毒生产的最佳条件,包括评估可用于培养可产生病毒的生产细胞的不同***,例如摇瓶、Quantum***(Terumo)、Ambr***(例如Ambr 15或250(TAP Biosystems))。
本发明的方法可进一步用于评估病毒生产过程下游的任何过程,例如用于确定任何此类过程是否已影响病毒滴度。特别地,本发明的方法可用于评估可采用的纯化方法,例如用于确定此类纯化方法是否已对滴度有任何影响,例如与纯化前样本中存在的病毒滴度相比,在此类纯化后滴度是否增加、减少或保持相等。本发明的方法还可用于评估病毒的大规模制造,例如病毒载体的大规模制造,这对于制造用于基因疗法的病毒载体可能特别重要。
如本文所用的病毒滴度的增加可以是与病毒滴度与测量值相比,增加了超过5%、10%、20%、30%、40%、50%、60%、70%、80%或90%,并且如本文所用的病毒滴度的降低可以是病毒滴度与测量值相比,降低了超过5%、10%、20%、30%、40%、50%、60%、70%、80%或90%。等效的病毒滴度可在与测量值相比,病毒滴度的5%以内。
在这方面,应当理解,出于某些目的,可能需要在执行方法之前以及方法之后和/或方法期间评估病毒滴度,以确定是否已经出现病毒滴度的任何改变或变化。本发明的方法还可以包括比较病毒滴度的步骤,例如与不同样本(在相同或不同的时间点)或与同一样本在不同时间点的病毒滴度比较。
在本发明的另一个实施方案中,该方法可用于确定受试者中病毒感染的程度,例如用于确定感染是否得到成功治疗或减少。在这种方法中,可能需要比较样本中的病毒滴度,例如受试者的来自不同时间点的相同类型的样本,以确定随着时间的推移,病毒滴度增加、减少还是保持相等。替代地或另外地,可能需要将来自个体样本中的病毒滴度与先前针对病症已获得的并且例如可指示感染阶段和/或预后的病毒滴度测量值进行比较。
或者,本发明的方法可以不确定样本中病毒的实际的量、水平或浓度,但可以确定该量、水平或浓度是高于还是低于可接受的阈值,例如对于生产方法,该阈值可以确定样本中是否存在可接受水平的病毒颗粒。如上所述,本发明的方法可以确定病毒滴度的水平与先前测定的样本的病毒滴度水平相比是增加、减少还是相当,因此应当理解,对于特定应用,可能没有必要确定实际的病毒滴度(例如存在的病毒的量或浓度)。
本发明涵盖使用拉曼光谱监测和/或评估样本中的病毒滴度,从而可以鉴定病毒生产过程的开始、生产阶段和结束中的任何一个。应当理解,不同量或浓度的病毒和/或代谢物将存在于不同生产阶段的样本中。例如,在生产开始时,病毒滴度,特别是物理病毒滴度,可以在0-105的范围内;在活性病毒生产期间,病毒滴度,特别是物理病毒滴度,可以在105-109的范围内;在病毒产生末期,病毒滴度,特别是物理病毒滴度,可以在109-1012的范围内。然而,一般来说,随着时间的推移对病毒滴度的监测可以鉴定例如特定的包装细胞系中的特定病毒的不同生产阶段,其中增加的量或峰值量可能与过程的生产阶段相关,早期的低量可能与过程的开始相关,而晚期的稳定量可能与过程的结束相关。如前所述,该信息可用于特定的过程,以确保在生产趋于稳定、减少(例如,与峰值生产点相比至少减少50%)或终止后,培养物不会得到维持。
本发明的方法还可用于支持适应性制造并进一步增加***中的病毒滴度生产。在这方面,可以比较在不同条件和使用不同***下获得的病毒滴度,以确定病毒生产的最佳条件。
如本文所用,术语“样本”是指包含病毒的任何样本(例如包含病毒载体的任何样本)。具体地,在本发明中,可以通过拉曼光谱实时、原位对样本的病毒滴度进行测量,或非原位(ex situ)对样本进行病毒滴度测量。
“原位”是指在能够生产病毒颗粒的培养物中获得拉曼散射光强度的测量是从生产病毒颗粒的原代培养环境中进行的,而不是从原代培养环境中提取的样本中进行的。因此,进行“原位”测量,不需要液体处理步骤。因此,对于本发明的特定应用,从其环境中移除样本可不是必需的,并且可以是优选样本的原位测量。样本的原位测量可以允许对样本中的病毒滴度进行定期评估,而无需实际的取样步骤,在实际取样步骤中一部分样本会被移除。在这方面的病毒滴度评估可以准确而灵敏地实时测量,而无需可能引入成本和误差的额外步骤。如下文进一步详细讨论的,例如拉曼光谱提供了一种探针,该探针可以放置在样本内部或外部,从而允许在需要的时候进行原位测量。
或者,本发明的方法可针对样本非原位进行。“非原位”是指在能够生产病毒颗粒的培养物中获得拉曼散射光强度的测量是从生产病毒颗粒的原代培养环境中提取的样本进行的,之后进行一个或多个液体处理步骤。在特定实施方案中,本发明的方法可包括取样步骤。
本发明方法中使用的样本的来源可以是生产病毒的细胞培养物。因此,样本可以是培养基中的一种(例如DMEM、MEM或SFII,任选地包括血清、L-谷氨酰胺和/或其他成分),所述培养基可以另外包含包装细胞(例如HEK293细胞),例如如果样本是在病毒生产过程中采集;或者样本可以是用于医疗用途的病毒样本,例如其需要质量测试,例如在营销、销售或使用之前。样本还可以是来自疑似被病毒感染的受试者(例如人类或哺乳动物受试者)的样本,例如血液、唾液、痰、血浆、血清、脑脊液、尿液或粪便样本。其他样本源包括来自地表水(open water)或公共供水。
拉曼光谱
拉曼光谱测量被样本散射的单色光的波数变化,以提供有关其化学组成、物理状态和环境的信息。这可能是因为入射光光子与构成样本的分子中存在的振动模式相互作用的方式。这些模式在一组给定的物理条件下具有特定的振动频率和散射强度,并且这使得定量给定的感兴趣分析物的量成为可能。与红外吸收光谱——其中测量从宽带光源对不同能量的光的吸收——不同,在拉曼光谱中,测量单色入射光与散射光的能量差异(图1),这被称为拉曼位移。
通常,当测量的信号在环境温度更强时,监测斯托克斯散射光。图2示出一些示例性光谱;不同的峰代表不同振动模式的存在;一些波段是几个潜在峰的重叠区域。对于简单的混合物,可以鉴定n-1个分析物特有的特定条带,从而测量它们在固定温度和压力下的强度变化,以在适当校准后对组成进行完全定量。然而,对于诸如生物介质等复杂***,无法严格应用这种简单的方法,存在太多的重叠带,这阻碍了直接分配。替代地,除了对原始数据矩阵进行建模之外,还必须使用先进化学计量模型,以获得变量(波长/波数)的线性组合,从而使与感兴趣分析物浓度的协方差最大化。然后可以预测新样本的组成。
拉曼光谱提供“分子指纹”,使得能够进行例如生物样本等样本的定性和定量分析。拉曼光谱通常对诸如温度和pH等物理条件的变化敏感。通常从生物样本中获得的拉曼光谱可包含背景荧光信号,因为这些样本经常含有天然荧光团。在传统的拉曼光谱中,该背景应该受到最佳激光波数选择和通过使用几种传统可用算法之一去除的任何剩余荧光的限制。
拉曼光谱是本领域已知的技术。在本发明中,实时拉曼光谱可以如上所述进行原位使用,从而允许连续测量病毒滴度。
本文所用的“拉曼光谱”是指不需要底物和感兴趣靶分子(例如待通过拉曼检测的分子)之间的结合(例如免疫相互作用)的所有类型的拉曼光谱。底物和靶分子之间的结合可直接发生,或使用任何类型的结合分子、链霉亲和素/生物素等或抗体片段间接发生。“免疫相互作用”包括使用抗体或抗体片段(例如scFv等),其可以连接到底物以特异性结合样本中的感兴趣分子。特别地,本文所用的“拉曼光谱”不包括表面增强拉曼光谱(SERS),例如需要底物之间免疫相互作用的SERS,例如可包含金属纳米点(例如Au)的SERS。SERS要求待检测的分析物固定在表面上。在本发明的方法中,不进行拉曼光谱来检测样本中已经固定在表面上的分析物。特别地,不进行拉曼光谱来检测样本中或来自样本的已固定在表面上的病毒颗粒。
SERS不同于根据本发明的拉曼光谱,特别是SERS需要特定的实验设计来将感兴趣的分析物固定或结合至表面,这导致使用SERS方法时增强的信号强度。然而,分析物的这种固定需要对样本进行处理,这可能导致污染或干扰生物反应器内部的条件,包括在从这样的***中获取样本的情况下。一般而言,SERS更适合涉及包含感兴趣分析物的“简单”样本的方法,其中样本中几乎没有污染物,而不是涉及复杂的成分混合物的方法,所述成分诸如在用于根据本文定义的方法处理病毒的生物反应器或生物样本中发现的成分。因此,SERS并非设计用于直接监测、或在线或原位监测复杂样本(包括用于评估病毒滴度的含有病毒颗粒的样本),而是适用于分析已经处理过且其中待检测的分析物已经被纯化然后固定在表面上的样本。
此外,众所周知,SERS不能提供可重现的结果。使用SERS时信号的增强是可重现的,但该增强的幅度可变化很大。已知,即使已在高度受控的环境中制造成对的SERS探针表面/基板(例如,在洁净室中蚀刻的硅晶片),这种可变性也是会发生的。这种再现性的缺乏尤其是定量方法的一个缺点,例如本发明所设想的那些定量方法。
相比之下,使用本文定义的拉曼光谱的本发明的方法可以在线/原位检测样本中的分析物,特别是病毒颗粒,而样本中存在的任何分析物没有表面附着,特别是没有病毒颗粒的表面附着或固定。因此,与涉及使用SERS的方法相比,本文定义的本发明提供更大程度的灵活度。
本发明所定义的拉曼光谱特别是包括传统类型的拉曼光谱和其他类型的拉曼光谱,如受激拉曼光谱(SRS)、皮秒拉曼(pico Raman)、空间偏移拉曼(SORS)、逆SORS、透视拉曼光谱、相干反斯托克拉曼光谱(CARS)、相干斯托克斯拉曼光谱(CSRS)、共振拉曼光谱(RR光谱)和全内反射拉曼光谱(TIR)拉曼。拉曼光谱的设备可以从各种供应商处获得,例如Renishaw、WITec、Horiba和ThermoFisher Scientific。另请参阅:http:// www.optiqgain.com/、https://www.timegate.com/和https://www.newport.com/。
数据处理和多元建模
本文使用的“多元”数据是指对每个样本测量多个变量的数据,“多元模型”是使用这种多元数据建立的模型。拉曼光谱(例如,在一段时间内从细胞培养物生成)包括多元数据,其中对于每个样本或测量的时间点,可以记录多个波数下的强度。
在本发明中,由培养物中病毒生产的原位监测产生的拉曼光谱和构成光谱的多元数据,已被分析以鉴定一系列光谱变量,所述变量对于使模型预测实现实时病毒滴度的测量是最重要的。创建了从10或12个分量多元模型计算的变量重要性投影(VIP)的图,并建立了波数变量的重要性,例如与表1中列出的数据相关。创建了从8或15个分量多元模型计算的变量重要性投影(VIP)的图,并建立了波数变量的重要性,例如与表2中列出的数据相关。因此,本发明人使用来自拉曼光谱测量的多元数据,连同来自现有技术试验的与病毒滴度相关的离线数据,来鉴定在确定病毒滴度时可以评估的波数范围,并进一步建立多元模型,该模型能够从特定条件下含有病毒的样本获得的任何拉曼光谱中分析在指定波数范围下的信号强度,以确定病毒滴度。可以使用本发明的方法确定本文所述的任何类型的病毒滴度,条件是已经使用与相关类型的病毒滴度相关的离线数据建立了用于预测滴度的多元模型。
在复杂的生物样本中,将波数范围明确分配给特定分析物通常是困难的或不可能的。也存在分析物浓度低的问题,因为信号可能会因其他高浓度化合物(如细胞培养基中的水或葡萄糖)而变模糊。如果模糊信号变得太强,则与它们相关的噪声大于源自感兴趣的基础分析物的测量变化,并且感兴趣组分的信号强度降至低于检测限。通过对拉曼光谱的分析、所获得的数据的建模以及使用离线病毒滴度测量校准数据,发明人已经确定了与样本中病毒滴度的增加相关的一系列波数范围。由于这些波数范围随着时间的推移显示出与病毒滴度的一致的强的相关性,因此没有必要将这些范围分配给特定的分析物。因此,对于当前方法来说,信号被高浓度化合物模糊的问题不是这样的问题。
为了鉴定用于本发明的波数范围,获得了多元模型参数。然后在随后的分析中使用这些参数来推断响应值并选择用于计算病毒滴度的重要变量。在这种情况下,对从含有病毒的样本获得的拉曼数据进行回归。
在这种特定的情况下,发明人对预处理的拉曼数据实施回归。在这方面,应当理解,通常从光谱仪获取的原始拉曼光谱数据可能需要对若干干扰信号(例如背景荧光)进行校正,并且通常重要的是对样本获取的原始光谱进行归一化以校正绝对强度的总变化。因此,本领域技术人员将理解可能有必要进行光谱预处理以解决此类问题。
预处理所获得的拉曼光谱可以使用科学文献中可用的许多算法中的任何一种来执行。特别地,例如可以使用一阶导数、二阶导数(Savitzky等人,1964)和标准正态变量(SNV)归一化和多项式背景拟合和去除。Barnes等人(1989)描述了一种标准的正态变量方法。Lieber和Mahadevan-Jansen(2003)描述了一种基于对最小二乘多项式曲线拟合的修正从生物学拉曼光谱中减去荧光的自动化方法。Zhao等人(2007)描述了一种基于修正的多元多项式拟合的改进的荧光去除自动算法。Koch等人(2017)描述了一种用于预处理拉曼光谱的基于“软化子”的基线校正算法。Hu等人(2018)描述了一种基于分段多项式拟合(PPF)的基线校正方法。Zhang等人(2010)描述了一种自适应迭代重加权惩罚最小二乘(airPLS)算法。也参见Huang等人(2010)。
一旦已经采取步骤对拉曼光谱进行预处理,如果需要,则获得用于数据建模的参数。在这方面,拉曼数据的回归,特别是预处理的拉曼数据的回归可以基于使用其他技术获得的离线响应进行,其他技术例如为可以确定病毒滴度的qPCR和p24 ELISA、斑块测定等,或可用于分析代谢标记物的CuBiAn和LC-MS。因此,回归可涉及比较预处理的拉曼光谱和离线数据。多元回归的典型方法可以采用偏最小二乘回归(PLS-R)。
具体而言,在标准正交评分PLS-R分析中,寻求拉曼光谱阵列X和响应y之间的线性关系(例如,y可能是一个向量,其中每个元素代表对于每个样本的滴定度值:
y=a+Xβ+E
其中,α和β是未知参数,E是误差强度或残差的矩阵)。可以使用不同的基本PLS-R算法,这取决于在PLS1算法可用于单个响应值和PLS2算法可用于多个响应值的情况下,y包含每个样本的单个响应值还是多个响应值。在从拉曼光谱预测病毒滴度的情况下,y通常是每个样本的单变量参数,因此通常可以使用PLS1。
简而言之,PLS1算法的功能如下。最初,变量X和y以均值为中心(可以从X的列中的每个元素中减去每个变量的均值,并且可以从y的每个元素中减去y的均值。许多潜在因子A可以被选择用于模型,这些潜在因子为可用于线性组合对X建模的因子。第一步,可以将X投影到y上以找到权重;这些权重定义了与y具有最大协方差的X的向量/因子空间中的方向。然后可以将这些权重归一化为具有单位长度。随后可以通过将X投影到这些归一化的权重上来计算X分数。然后可以通过将X投影到分数上来计算X载荷。类似地,可以通过将y的转置投影到这些评分上来计算y载荷。可以通过减去给定分量的贡献来紧缩X和y,从而从X和y两者中去除当前分量的贡献。这可以通过将分量的各自评分和加载向量相乘,并分别从运行的X阵列和y向量中减去得到的阵列或向量来实现。
然后在迭代过程中,对于每个后续的分量,可以以相同的方式再次使用紧缩的X和y,即连续确定权重、评分和载荷,直到所有A分量都用完并且不再进行进一步的紧缩。例如,可以在Wold等人(2001)中找到对此PLS方法和NIPALS算法的引用。
在每次迭代期间,计算出的权重、评分和加载向量和标量可以顺序存储在它们自己的阵列或向量中,即对于每次迭代,相关向量或标量可以作为阵列中的新的列或行或作为向量中的新的元素而放置,其中现有的向量或标量可以是从先前的迭代中获得的那些。如果将回归系数用作后续数据建模的参数,则可以通过乘以最终的权重矩阵上的最终X块加载阵列的转置投影的倒数获得回归系数β。可以通过研究未在迭代模型构建过程中使用的预处理拉曼光谱的测试集的预测误差来确定分量的最佳数量。
可以如上所述使用模型参数(例如回归系数β),并通过与离线试验数据,例如qPCR/P24Elisa/斑块试验均方误差(MSE)进行比较来进行病毒滴度的预测。当预测的MSE已达到最小值时,可以选择基础分量A的最佳数量。
在构建初始PLS-R模型之后,例如使用上述过程,可以使用许多可用的变量选择方法之一来选择最重要的变量,所述方法例如为鉴定在y预测以及解释X中的方差中可能是最重要的变量的变量重要性投影(VIP)。VIP可以生成长度与X的行相同的VIP向量,即VIP向量包含对应于X的每个变量的元素,其中每个元素的数值可以是该变量重要性的度量。一种常见的方法是,通过仅使用VIP或其他变量选择方法确定的最重要的变量来重建上述初始模型,从而对上述初始模型进行细化。为了确定哪些变量是重要的,选择了阈值方法。通常,VIP阈值可以设置为1,因为这是VIP参数的平均值,但是技术人员会意识到这本质上是任意的,并且可以选择其他更高的阈值,例如1.5.
如下所述,在本发明中确定的对于确定病毒滴度而言重要的波数范围是基于将VIP参数设置为至少1.00或更高。因此,在本发明中,在该阶段不产生大于1.00的峰值强度的波数范围被排除在外。
本领域技术人员将理解,在选择VIP参数后可以再次运行PLS1算法,但在这种情况下,可以删除低于VIP阈值的X的变量,从而生成新的多元模型,其具有更短的载荷向量和更短的β回归系数向量。
下面列出的波数范围是用波长为785nm的激光实施拉曼光谱的结果。本发明还涵盖可以使用除785nm之外的不同波长的激光器。由于拉曼位移(即非弹性散射拉曼光与用于诱发拉曼散射的单色激光束之间的波长差异)在很大程度上与波长无关,因此使用不同波长的激光获得的波数范围将是相同的。
在本发明的优选实施方案中,超过1.5(可变重要性投影(VIP))的峰表明波数范围对于确定病毒的存在和确定病毒滴度可能是重要的。确定特定波数范围的信号强度对于通过本发明的方法预测病毒滴度是必不可少的。在本发明的实施方案中,使用1.5VIP阈值来确定哪些波数范围对于预测病毒滴度是重要的。因此,在优选的实施方案中,本发明涵盖一种使用拉曼光谱评估或预测病毒滴度的方法,该方法包括从自所述样本获得的拉曼光谱确定这些波数范围中的五个或更多个下的信号强度的步骤。测量的预处理信号用于预测。任何后续光谱(从其进行预测),即模型构建之后的光谱,需要使用与用于训练和构建PLS模型的数据完全相同的方法进行预处理。
本发明的任何方法包括测量多个波数范围中的每一个内的拉曼散射光的总强度以获得样本的波数强度数据集的步骤,其中所述多个波数范围是预先选择的并且表征样本中的病毒。
在本发明的任何方法中,所测量的拉曼光谱中的多个波数范围可以包括下表1中所列的波数范围1至28中的5个或更多个,并且其中VIP≥1.00。所测量的拉曼光谱中的多个波数范围可以包括下表1中所列的波数范围1至28中的10个或更多个,并且其中VIP≥1.00。所测量的拉曼光谱中的多个波数范围可以包括下表1中所列的波数范围1至28中的15个或更多个,并且其中VIP≥1.00。所测量的拉曼光谱中的多个波数范围可以包括下表1中所列的波数范围1至28中的20个或更多个,并且其中VIP≥1.00。所测量的拉曼光谱中的多个波数范围可以包括下表1中所列的波数范围1至28中的25个或更多个,并且其中VIP≥1.00。所测量的拉曼光谱中的多个波数范围可以包括下表1中列出的波数范围1至28中的所有28个,并且其中VIP≥1.00。
在本发明的任何方法中,所测量的拉曼光谱中的多个波数范围可以包括下表1中所列的波数范围29至59中的5个或更多个,并且其中VIP≥1.25。所测量的拉曼光谱中的多个波数范围可以包括下表1中所列的波数范围29至59中的10个或更多个,并且其中VIP≥1.25。所测量的拉曼光谱中的多个波数范围可以包括下表1中所列的波数范围29至59中的15个或更多个,并且其中VIP≥1.25。所测量的拉曼光谱中的多个波数范围可以包括下表1中所列的波数范围29至59中的20个或更多个,并且其中VIP≥1.25。所测量的拉曼光谱中的多个波数范围可以包括表1中所列的波数范围29至59中的25个或更多个,并且其中VIP≥1.25。所测量的拉曼光谱中的多个波数范围可以包括下表1中所列的波数范围29至59中的30个,并且其中VIP≥1.25。所测量的拉曼光谱中的多个波数范围可以包括表1中所列的波数范围29至59中的所有31个,并且其中VIP≥1.25。
在本发明的任何方法中,所测量的拉曼光谱中的多个波数范围可以包括下表1中所列的波数范围60至81中的5个或更多个,并且其中VIP≥1.50。所测量的拉曼光谱中的多个波数范围可以包括下表1中所列的波数范围60至81中的10个或更多个,并且其中VIP≥1.50。所测量的拉曼光谱中的多个波数范围可以包括下表1中所列的波数范围60至81中的15个或更多个,并且其中VIP≥1.50。所测量的拉曼光谱中的多个波数范围可以包括下表1中所列的波数范围60至81中的20个或更多个,并且其中VIP≥1.50。所测量的拉曼光谱中的多个波数范围可以包括下表1中所列的波数范围60至81中的所有22个,并且其中VIP≥1.50。
表1
可使用上文关于表1所述的拉曼光谱中的多个波数范围测量病毒滴度。在本发明的优选实施方案中,使用上文关于表1所述的拉曼光谱中的多个波数范围测量的病毒滴度是慢病毒滴度。
在本发明的另一优选实施方案中,超过1.5(可变重要性投影(VIP))的峰表明波数范围对于确定病毒的存在和确定病毒滴度可能是重要的。确定特定波数范围的信号强度对于通过本发明的方法预测病毒滴度是必不可少的。在本发明的实施方案中,使用1.5VIP阈值来确定哪些波数范围对于预测病毒滴度是重要的。因此,在优选的实施方案中,本发明涵盖一种使用拉曼光谱评估或预测病毒滴度的方法,该方法包括从自所述样本获得的拉曼光谱确定这些波数范围中的四个或更多个下的信号强度的步骤。测量的预处理信号用于预测。任何后续光谱(从其进行预测),即模型构建之后的光谱,需要使用与用于训练和构建PLS模型的数据完全相同的方法进行预处理。
本发明的任何方法包括测量多个波数范围中的每一个内的拉曼散射光的总强度以获得样本的波数强度数据集的步骤,其中所述多个波数范围是预先选择的并且表征样本中的病毒。
在本发明的任何方法中,所测量的拉曼光谱中的多个波数范围可以包括下表2中所列的波数范围1至12中的4个或更多个,并且其中VIP≥1.00。所测量的拉曼光谱中的多个波数范围可以包括下表2中所列的波数范围1至12中的6个或更多个,并且其中VIP≥1.00。所测量的拉曼光谱中的多个波数范围可以包括下表2中所列的波数范围1至12中的8个或更多个,并且其中VIP≥1.00。所测量的拉曼光谱中的多个波数范围可以包括下表2中所列的波数范围1至12中的10个或更多个,并且其中VIP≥1.00。所测量的拉曼光谱中的多个波数范围可以包括下表2中所列的波数范围1至12中的所有12个,并且其中VIP≥1.00。
在本发明的任何方法中,所测量的拉曼光谱中的多个波数范围可以包括下表2中所列的波数范围13至22中的4个或更多个,并且其中VIP≥1.25。所测量的拉曼光谱中的多个波数范围可以包括下下表2中所列的波数范围13至22中的6个或更多个,并且其中VIP≥1.25。所测量的拉曼光谱中的多个波数范围可以包括下表2中所列的波数范围13至22中的8个或更多个,并且其中VIP≥1.25。所测量的拉曼光谱中的多个波数范围可以包括下表2中所列的波数范围13至22中的所有10个,并且其中VIP≥1.25。
在本发明的任何方法中,所测量的拉曼光谱中的多个波数范围可以包括下表2中所列的波数范围23至30中的4个或更多个,并且其中VIP≥1.50。所测量的拉曼光谱中的多个波数范围可以包括下表2中所列的波数范围23至30中的6个或更多个,并且其中VIP≥1.50。所测量的拉曼光谱中的多个波数范围可以包括下表2中所列的波数范围23至30中的所有8个,并且其中VIP≥1.50。
表2
可使用如上文关于表2所述的拉曼光谱中的多个波数范围测量病毒滴度。在本发明的优选实施方案中,使用如上文关于表2所述的拉曼光谱中的多个波数范围测量的病毒滴度是腺相关病毒(AAV)滴度。在本发明的特别优选的实施方案中,使用如上文关于表2所述的拉曼光谱中的多个波数范围测量的病毒滴度是腺相关病毒血清型8(AAV8)滴度。
确定每个所需波数范围内的信号强度的步骤需要确定在所需波数范围内鉴定的任何峰的水平。本领域技术人员将理解,如上文所述,被认为与病毒滴度相关的任何波数范围内的信号强度可以处于任何水平,并且当用适当的多元模型分析时,对此类强度的测量将允许确定病毒滴度。如下文进一步详细讨论的,本发明因此可以包括通过使用多元模型分析所测量的信号强度来评估或计算病毒滴度的步骤。这种多元模型可以在实施本发明之前准备好,或者替代地,作为本发明方法的一部分,其中该方法可以另外包括建立多元模型的步骤。
本发明的方法可以包括在除了本文指定的波长范围之外的其他波数范围处确定信号强度。
神经网络也可用于基于拉曼光谱的分类,例如在病理学中分析病变组织与健康组织。神经网络也可用于回归问题,如在应用拉曼数据监测病毒生产时面临的问题,如本文所述。
更复杂的方法利用所谓的卷积神经网络(CNN)(深度学习(Deep Learning)),通常使用Google的TensorFlow后端和Keras API以在面向对象的Python编程语言中编写脚本。使用卷积层的优点是预处理变得越来越没有必要,因为网络本质上“学习”了用于预处理光谱本身以获得最佳滴度/浓度预测的完美方式。用于文中描述的数据处理步骤的这种神经网络是本领域技术人员公知的。更多的信息可以例如在此找到:
https://www.forbes.com/sites/bernardmarr/2018/09/24/what-are-
artificial-neural-networks-a-simple-explanation-for-absolutely-anyone/#
2c9442a91245
http://pages.cs.wisc.edu/~bolo/shipyard/neural/local.html
如上所述,可以获得多元数据模型参数并将其用于本文定义的病毒滴度的定量方法中。如果需要,此类模型参数还可用于构建如本文定义的替代的多元数据模型。本发明人已将多元算法应用于拉曼光谱波数信号强度数据以获得模型参数,然后将模型参数用于病毒滴度的定量。具体地,发明人已经应用多元算法来获得用作模型参数的回归系数。然而,本领域技术人员将理解,取决于所选模型的性质,可以获得和使用替代的模型参数。因此,在本文定义的任何方法中,可以适当地选择多元数据模型参数并且多元数据模型参数可以任选地包括回归系数。任何合适的多元算法可以应用于拉曼光谱波数信号强度数据以获得模型参数。可以使用多元回归算法,例如偏最小二乘(PLS)回归算法,任选地,其中PLS算法是非线性迭代偏最小二乘(NIPALS)回归算法。还可以使用涉及神经网络的算法来获得模型参数。
估算病毒滴度的模型
如本文所述进行拉曼光谱的化学计量建模以鉴定实时病毒滴度的增加与在拉曼光谱中看到的波数范围的同一性和强度之间的相关性。鉴定的波数范围如上所述。
如前所述,本发明需要在4个或5个或更多个被确定为对评估病毒滴度重要的波数范围下评估信号强度,并使用已经构建的多元模型(未校准多元模型上校准的)进一步分析强度。
技术人员将理解,可以根据待分析的样本构建不同的多元模型,并且用于构建多元模型的方法是本领域公知的(例如,参见本文引用的参考文献)。因此,例如,在包含不同类型的病毒、不同的细胞培养基或不同的生产细胞的样本中,可能需要不同的多元模型来确定病毒滴度。
在本发明的一个实施方案中,可以使用以下方法建立多元模型:
i)关于离线响应的预处理拉曼数据的回归,如上所述,其是使用其他技术(例如qPCR和p24 ELISA、斑块试验等)获得的,回归可涉及比较预处理的拉曼光谱,
ii)使用获得的回归系数,以使用预处理的数据来预测响应值,其中可以通过调整用于多元回归的分量/因子的基本数量来优化这些预测的质量,
iii)进行变量选择,其使用任何已知方法进行,例如变量重要性投影(VIP),其鉴定除了解释X之外对于预测Y是强大/重要的变量,
iv)构建细化模型,其中在鉴定重要光谱变量之后,可以使用与步骤(ii)中所述相同的方法进行再一轮的建模,但是其中在建立模型之前,将预处理后的拉曼光谱阵列中通过变量选择被认为不相关的变量或列去除。这产生了一个基于除去了许多不相关变量的数据构建的更简单的模型。如(ii)中所述,可通过选择利用最少数量的基本因子构建的模型来优化基本分量的数量,从而在给出分量到分量的变化时,预测误差最低。
v)进行未来预测,其使用在(iv)中确定的回归系数进行,其中新的预处理拉曼光谱可以乘以获得的回归系数来生成估算。
应当理解,一旦已鉴定用于分析的波数范围,则可以不必重复上述步骤(i)至(iii)。特别地,在这种情况下,构建模型可以只需要步骤iv)。此外,可以使用除回归系数之外的数据建模参数。
在本发明的另一方面,该方法可以包括准备或构建多元模型的附加步骤。
如以上步骤v)中所述,来自所生成的多元模型的回归系数可用于从一个或多个样本获得的拉曼光谱获得对病毒滴度的估算。因此,在本发明中,该方法可以包括使用来自多元模型的回归系数确定病毒滴度的步骤。相同预处理方法用于模型的训练/构建。
通过以下实施例进一步说明本发明,但以下实施例不应被解释为进一步的限制。在整个本申请中引用的所有附图和所有参考文献、专利和公开的专利申请的内容均通过引用明确并入本文。
实施例
实施例1-计算生产过程中不同阶段的慢病毒的浓度
进行计算以提供在示例性病毒生产过程中在不同阶段预期的以mg/ml为单位的估算的慢病毒浓度。使用已知的慢病毒浮力密度和物理滴度来计算浓度。结果如下表所示。
如图所示,发现估算的慢病毒浓度在2.03E-02至2.03E-05mg/ml的范围内。
出于比较目的,下面示出一些基于葡萄糖和苯丙氨酸检测限的指导性计算,这些计算获取自Buckley和Ryder(2017,Applied Spectroscopy,71,p1085-1116)。
葡萄糖
mw=180.156g/mol
检测限0.6mM(参见Buckley和Ryder)
摩尔=体积/1000*摩尔浓度
1/1000*0.0006–在1ml中
=0.0000006摩尔
质量=摩尔*mw
=0.0000006*180.156
=0.00011g/ml
估算的计浓度=0.11mg/ml。
苯丙氨酸
mw=165.19g/mol
LoD=1.1mM(参见Buckley和Ryder的论文)
摩尔=体积/1000*摩尔浓度
1/1000*0.0011-在1ml中
=0.0000011摩尔
质量=摩尔*mw
=0.0000011摩尔*165.19g/摩尔
=0.00018g
估算的浓度=0.18mg/ml。
葡萄糖和苯丙氨酸检测限的以mg/ml计的浓度与保守物理滴度相当的乐观估算浓度相比高5-10倍。
基于上述,预计出,培养基中慢病毒的以mg/ml表示的近似浓度将低于使用拉曼光谱时所认为的检测限。
实施例2-来自HEK293瞬时过程的慢病毒生产
实验方法
细胞培养和瞬时转染
HEK293培养物在Eppendorf DASbox BioBLU 300生物反应器中在FreeStyle 293表达培养基(ThermoFisher)中在37℃扩增,无需额外的补充物。在瞬时转染以生产慢病毒之前,搅动细胞并扩增2天。使用来自Polyplus的PEIPro,用gag-pol、vsv-g和编码eGFP的基因组转染细胞以产生LV颗粒。
在整个过程中,从每个生物反应器中采集10或12个样本,以使用qRT-PCR测量病毒滴度,并且所述样本通过P24 ELISA进行确认。在整个扩增和病毒生产阶段获取拉曼光谱。
RT-qPCR
使用的PCR试剂盒:Lenti-XTM qRT-PCR滴定试剂盒(Takara,Cat#631235)
供应商:Clontech
作用方法:该试剂盒为一步式逆转录和PCR扩增试剂盒。该试剂盒的引物靶向与包装信号相邻的HIV-1基因组的保守区域。扩增子通过SYBR绿色荧光检测,最终滴度由用于生成标准曲线的ssRNA标准品确定。病毒滴度的最终定量以病毒基因组/ml提供。
P24-ELISA
ELISA试剂盒:QuickTiterTM慢病毒滴度试剂盒(慢病毒相关的HIV p24)(Cat#VPK-107)
供应商:Cell Biolabs,Inc
作用方法:该试剂盒是一种酶免疫分析法,开发它仅为了检测和定量与慢病毒相关的HIV-1p24核心蛋白。病毒相关的p24可以定量为p24滴度(ng/ml)或颗粒/ml,其中假设每个慢病毒颗粒大约有2000个p24分子。
拉曼光谱
使用Kasier Optics RxN2拉曼光谱仪进行拉曼测量。该光谱仪具有顺序监测4个探针通道的能力。RxN2激发源是785nm近红外二极管激光器,其中每个探头的标称功率输出为~270mW。样本包含四个Eppendorf的dasBox BioBLU一次性***的内容物。使用四个Kaiser Optics过滤光纤MR探针和BioOptic 220探针(每个生物反应器一套)将光束传送到每个样本生物反应器。在于过程中测量(in-process measurement)之前,将RxN2***稳定1小时,然后使用RxN2的内部自动校准标准品校准4个探针通道中的每一个,此外,使用国家标准与技术研究院(National Institute of Standards and Technology,NIST)认证的光源(HCA)对每个探针通道进行CCD灵敏度校正。使用与光束传输时所用相同的BioOptic 220和MR探针收集散射光。在每个MR探针内,散射光通过第二光纤传输到RxN2 f\1.8成像光谱仪。在使用全息陷波滤波器过滤瑞利散射光后,拉曼散射光被引导到Kaiser Optics全息透射光栅,然后成像到热电冷却的1024像素CCD检测器上。该***的有效带宽为100-3425cm-1,分辨率为4cm-1。拉曼光谱从100-3425cm-1获得,积分时间约为15分钟/通道,其中包括CCD读出时间,对累计75次的10秒采集进行平均,以生成每个测量光谱。依次测量每个通道。在整个过程中的不同时间,从每个生物反应器中获取液体样本,并注明时间点,以便将离线试验数据与相当的拉曼光谱进行事后匹配。
拉曼数据分析
所有数据分析均以MATLAB(The MathWorks,MA,USA)版本R2017b进行。原始拉曼光谱通过将整个光谱归一化为~3000cm-1处水带的峰值强度进行预处理。去除了420-1800cm-1区域的中等荧光背景信号。选择该范围的低端是为了避免可能源自BioOptic-220的蓝宝石窗口或可能为拉曼仪器和探针的光学设计的伪影的拉曼谱带。然后对于明显的异常值和伪影,检查减少后的归一化光谱。鉴定与离线采样时间点相关的光谱并创建预处理光谱的模型训练子集。然后将预处理光谱的训练集用于化学计量建模。在化学计量建模之前,光谱以平均值为中心。构建了几个用于关键分析物和病毒滴度的对潜在结构的初始投影-回归(PLS-R)模型。这些模型允许您针对含有已知浓度的感兴趣分析物(病毒滴度)的样本对多元拉曼光谱进行回归。基于这些计算,可以在未来预测分析物的浓度。模型是针对训练数据使用10倍交叉验证程序准备的,即1/10的数据是从训练数据中随机选择和移除的,并被用于评估模型性能,这样进行10次,误差值、模型精度/性能统计是针对每个10倍训练集获得的平均值。基础分量或基本向量的数量的选择是构建诸如PLS-R等监督线性模型的重要步骤。在这项工作中,通过检查在交叉验证后预测的均方误差(mean squared error ofprediction after cross-validation,MSECV)随分量数量变化的图,确定基础分量的最佳数量;最小值确定了PLS分量的最佳数量。变量选择的第二阶段需要通过仅选择对预测最重要的波数/变量来优化构建的模型。这使用可变重要性投影(VIP)方法进行。然而,存在许多实施变量选择的方法。典型的VIP图在图5中所示。通常,VIP值大于1的变量用于最终模型。然而,在这里,我们已使用几个VIP阈值构建和评估模型,以鉴定做出良好预测所需的最小光谱变量数量,以及无法对离线RT-qPCR数据进行建模的阈值。随着VIP阈值的增加,鉴定的光谱变量的数量减少。一旦为每个VIP阈值确定了重要的变量,则构建最终模型。随后,这些模型用于预测中间病毒滴度值,即对于所有可用运行,每个离线数据点之间的值。
初步的病毒滴度模型评价及范围选择
例如,用于化学计量建模的预处理的拉曼光谱如图2所示。
在整个项目中监测病毒滴度,通过RT-qPCR获得的代表性滴度汇总在图3中。
图4示出了初始PLS-R模型交叉验证后的预测的均方误差的图。当使用所有光谱变量或通道时,发现使用12个PLS分量时发生的有效预测误差最小。
因此,从该图(图4)可以得出结论,预测误差最小化和模型简单性之间的最佳折衷在于12分量模型。通过增加分量的数量可以获得预测能力的小幅提高,这很可能只是合并了噪声并将模型过度拟合到训练集的结果。也就是说,构建一个这样的模型:该模型仅预测训练数据而不是新的未见数据,并且是基于测量的变量和因变量/响应变量之间的伪相关性。
在准备最初的12分量模型之后,评价了不同的变量选择方法,以选择用于最终模型的最佳/最具预测性的光谱变量。这里的目的是从模型中去除不必要的光谱通道/变量以增强其简约性,并且只包括物理上有意义的信息。最后计算变量重要性投影(VIP)以确定哪些光谱变量在预测病毒拷贝数方面最重要(图5A)。为了评估和鉴定做出可接受的物理滴度预测所需的最少光谱变量数,研究了几个变量重要性阈值作为保留变量的标准;通常,使用VIP阈值1——研究了阈值1.00–1.75。图5B示出了VIP算法鉴定认为最重要区域的变量或波数范围,即那些大于选定阈值的区域,所述选定阈值在这种情况下为1.5,图5C按重要性顺序示出了这些波数范围。
在减少光谱变量的数量后,进一步评估了基础的潜在变量的数量。PLS分量的最佳数量会随着模型中使用的光谱变量或波数的数量而变化。在采用1.5的阈值减少光谱变量后,发现PLS潜在变量的最佳数量为10。图6示出具有不同数量基础分量的细化模型的MSECV图。预测的均方误差随着基础分量数量的增加而增加这一事实表明,在包含超过10个PLS分量的情况下,生成的模型过度拟合了训练集。
采用从10潜在变量和VIP≥1.5选定光谱变量(保守)模型获得的回归系数估算的3次运行中每一次的RT-qPCR病毒拷贝数的模型预测分别在下面的图7、8和9中示出。结果表明,采用拉曼光谱数据的模型与病毒滴度随时间的离线测量一致。从RT-qPCR测试和P24ELISA获得的滴度的比较在图10中示出。
图11描述了如何使用本发明的方法来监测病毒生产培养的阶段。由于拉曼光谱是实时、连续使用的,因此在本发明的方法中可以准确跟踪病毒产率的变化。因此,可以鉴定从开始到生产阶段以及从生产阶段到结束阶段的变化。
实施例3-细化病毒滴度模型评价和范围选择
采用与上述实施例2相同的方法对采用的额外样本进一步研究,以进一步细化用于病毒滴度评估的波数范围选择。采用这种方法,通过应用≥1.00的可变重要性投影(VIP)阈值,鉴定了用于计算病毒滴度的各种波数范围。通过应用≥1.25的可变重要性投影(VIP)阈值来鉴定额外的波数范围,并通过应用≥1.50的可变重要性投影(VIP)阈值鉴定了进一步的波数范围。结果如上表1所示。
图12示出了定量病毒滴度的公式的概要示意图。该公式适用于从多元回归算法获得的回归系数,该算法适用于归一化的拉曼信号强度数据。
执行进一步分析以分析波数范围的数目,波数范围的数目可用于提供对病毒滴度的准确估计。
鉴定的对病毒载体生产重要的范围,即在采用扩展光谱范围(~420–1800cm-1)进行初始PLS建模后,通过可变重要性投影(VIP)≥1.00鉴定为重要的范围,被鉴定出(即如上表1中所列的波数范围1至28)且进行进一步的分析。
将数据按4:1的比例分成随机选择的成对的训练和测试数据块,即用于模型构建(80%)和模型测试(20%)的拉曼光谱及其相关的离线病毒滴度数据。
对于不同的训练和测试对,随机评估被VIP认为重要的范围的不同组合,即,对于范围1-28的每个r总数,基于模型性能R2统计(注意:R2=1–残差平方和/总平方和)评估了许多组合,并评估了不同模型性能的标准偏差以生成置信区间。通过选择其中多个训练/测试数据对的平均R2值的平均值约为0.5的范围的数量确定范围的最小数量。图13示出了R2随波数范围数量变化的曲线图。
该分析鉴定出了5个是提供病毒滴度估算值所需的波数范围最小数量。
因此,在本发明的任何方法中,在VIP阈值≥1.00时鉴定的如表1所示的波数范围1至28中的5个或更多个,可用于计算病毒滴度,如本文更详细描述的。在本发明的任何方法中,优选地,在VIP阈值≥1.25时鉴定的如表1所示的波数范围29至59中的5个或更多个,可用于计算病毒滴度,如本文更详细描述的。在本发明的任何方法中,更优选地,在VIP阈值≥1.50时鉴定的如表1所示的波数范围60至81中的5个或更多个,可用于计算病毒滴度,如本文更详细描述的。在任何这些方法中,如本文更详细描述的,优选地10个或更多个波数范围可用于计算病毒滴度,更优选15个或更多个,或还更优选20个或更多个。
实施例4–来自HEK 293瞬时过程的AAV8生产
实验方法
细胞培养和瞬时转染
HEK 293F培养物在Eppendorf DASbox BioBLU 300生物反应器中在具有4mMGlutaMAX(Fisher)的BalanCD培养基(Irvine Scientific)中在37℃扩增。在瞬时转染以产生AAV8之前,搅动细胞并扩增24小时。在无血清Opti-MEM(Gibco)中,利用PEIPro(Polyplus转染),用rep、cap、基因组编码的eGFP质粒和辅助质粒(E2A、E4)转染细胞以产生AAV8颗粒。
在整个过程中,从每个生物反应器中采集12个样本,以采用qRT-PCR测量病毒滴度。在整个扩增和病毒生产阶段中获得拉曼光谱。
RT-qPCR
采用基于TaqManTM的实时qPCR测量AAV8样本的病毒滴度,其中最终定量以病毒基因组/mL(VG/mL)提供。该测试的引物靶向AAV8病毒基因组中的ITR2序列。扩增子通过TaqManTM荧光基因针检测。病毒滴度根据线性化质粒生成的标准曲线确定。
拉曼光谱
使用Kasier Optics RxN2拉曼光谱仪进行拉曼测量。该光谱仪具有顺序监测4个探针通道的能力。RxN2激发源是785nm近红外二极管激光器,其中每个探针头的标称功率输出为~270mW。样本包含四个Eppendorf的dasBox BioBLU一次性***的内容物。使用四个Kaiser Optics过滤光纤MR探针和BioOptic 220探针(每个生物反应器一套)将光束传送到每个样本生物反应器。在于过程中测量(in-process measurement)之前,将RxN2***稳定1小时,然后使用RxN2的内部自动校准标准品校准4个探针通道中的每一个,此外,使用国家标准与技术研究院(National Institute of Standards and Technology,NIST)认证的光源(HCA)对每个探针通道进行CCD灵敏度校正。使用与光束传输时所用相同的BioOptic 220和MR探针收集散射光。在每个MR探针内,散射光通过第二光纤传输到RxN2 f\1.8成像光谱仪。在使用全息陷波滤波器过滤瑞利散射光后,拉曼散射光被引导到Kaiser Optics全息透射光栅,然后成像到热电冷却的1024像素CCD检测器上。该***的有效带宽为100-3425cm-1,分辨率为4cm-1。拉曼光谱从100-3425cm-1获得,积分时间约为15分钟/通道,其中包括CCD读出时间,对累计75次的10秒采集进行平均,以生成每个测量光谱。依次测量每个通道。在整个过程中的不同时间,从每个生物反应器中获取液体样本,并注明时间点,以便将离线试验数据与相当的拉曼光谱进行事后匹配。
拉曼数据分析
所有数据分析均以MATLAB(The MathWorks,MA,USA)版本R2019b进行。原始拉曼光谱通过将整个光谱归一化为~3000cm-1处水带的峰值强度进行预处理。去除了420-1800cm-1区域的中等荧光背景信号。选择该范围的低端是为了避免可能源自BioOptic-220的蓝宝石窗口或可能为拉曼仪器和探针的光学设计的伪影的拉曼谱带。然后对于明显的异常值和伪影,检查减少后的归一化光谱。鉴定与离线采样时间点相关的光谱并创建预处理光谱的模型训练子集。然后将预处理光谱的训练集用于化学计量建模。在化学计量建模之前,光谱以平均值为中心。构建了几个用于关键分析物和病毒滴度的对潜在结构的初始投影-回归(PLS-R)模型。这些模型允许您针对含有已知浓度的感兴趣分析物(病毒滴度)的样本对多元拉曼光谱进行回归。基于这些计算,可以在未来预测分析物的浓度。模型是针对训练数据使用10倍交叉验证程序准备的,即1/10的数据是从训练数据中随机选择和移除的,并被用于评估模型性能,这样进行10次,误差值、模型精度/性能统计是针对每个10倍训练集获得的平均值。基础分量或基本向量的数量的选择是构建诸如PLS-R等监督线性模型的重要步骤。在这项工作中,通过检查在交叉验证后预测的均方误差(MSECV)随分量数量变化的图,确定基础分量的最佳数量;最小值确定了PLS分量的最佳数量。变量选择的第二阶段需要通过仅选择对预测最重要的波数/变量来优化构建的模型。这使用可变重要性投影(VIP)方法进行。然而,存在许多实施变量选择的方法。典型的VIP图在图(18)中所示。通常,VIP值大于1的变量用于最终模型。然而,在这里,我们已使用几个VIP阈值构建和评估模型,以鉴定做出良好预测所需的最小光谱变量数量,以及无法对离线RT-qPCR数据进行建模的阈值。随着VIP阈值的增加,鉴定的光谱变量的数量减少。一旦为每个VIP阈值确定了重要的变量,则构建最终模型。随后,这些模型用于预测中间病毒滴度值,即对于所有可用运行,每个离线数据点之间的值。
初步的病毒滴度模型评价及范围选择
例如,用于AAV的化学计量建模的预处理的拉曼光谱如图(14)所示。
在整个项目中监测AAV滴度,通过RT-qPCR获得的代表性滴度汇总在图(15)中。
图(16)示出了初始PLS-R模型交叉验证后的预测的均方误差的图。当使用所有光谱变量或通道时,发现使用15个PLS分量时发生的有效预测误差最小。
因此,从该图(图16)可以得出结论,预测误差最小化和模型简单性之间的最佳折衷在于15分量模型。在准备最初的15分量模型之后,评价了不同的变量选择方法,以选择用于最终模型的最佳/最具预测性的光谱变量。这里的目的是从模型中除去不必要的光谱通道/变量以增强其简约性,并且只包括物理上有意义的信息。最后计算变量重要性投影(VIP)以确定哪些光谱变量在预测病毒拷贝数方面最重要(图(17)A)。为了评估和鉴定做出可接受的物理滴度预测所需的最少光谱变量数,研究了几个变量重要性阈值作为保留变量的标准;通常,使用VIP阈值1——研究了阈值1.00–1.75。图(17)B示出了VIP算法鉴定认为最重要区域的变量或波数范围,即那些大于选定阈值的区域,在这种情况下所述选定阈值为1.0,图(17)C按重要性顺序示出了这些波数范围。
在减少光谱变量的数量后,进一步评估了基础的潜在变量的数量。PLS分量的最佳数量会随着模型中使用的光谱变量或波数的数量而变化。在采用1.0的阈值减少光谱变量后,发现PLS潜在变量的最佳数量为9。图(18)示出了具有不同数量基础分量的细化模型的MSECV图。预测的均方误差随着基础分量数量的增加而增加这一事实表明,在包含超过9个PLS分量的情况下,生成的模型过度拟合了训练集。
采用从9潜在变量和VIP>1.0选定光谱变量(保守)模型获得的回归系数估算的4个生物反应器的示例性运行的RT-qPCR病毒拷贝数的模型预测在下面的图(19)中示出。结果表明,采用拉曼光谱数据的模型与病毒滴度随时间的离线测量一致。
实施例5–用于AAV的细化病毒滴度模型评估和范围选择
对实施例4中所描述的进行进一步分析以分析波数范围的数目,所述波数范围可用于提供对AAV病毒滴度的准确估算。
鉴定为对病毒载体生产重要的范围,即在采用扩展光谱范围(~420–1800cm-1)进行初始PLS建模后,通过可变重要性投影(VIP)≥1.00鉴定为重要的范围,被鉴定出(即如上表2中所列的波数范围1至12)且进行进一步的分析。
将数据按4:1的比例分成随机选择的成对的训练和测试数据块,即用于模型构建(80%)和模型测试(20%)的拉曼光谱及其相关的离线病毒滴度数据。
对于不同的训练和测试对,随机评估被VIP认为重要的范围的不同组合,即,对于范围1-(12)的每个r总数,基于模型性能R2统计(注意:R2=1–残差平方和/总平方和)评估了许多组合,并评估了不同模型性能的标准偏差以生成置信区间。通过选择其中多个训练/测试数据对的平均R2值的平均值约为0.5的范围的数量确定范围的最小数量。图20示出了R2随波数范围数量变化的曲线图。
该分析鉴定出了4个是提供AAV毒滴度估算值所需的波数范围的最小数目。
因此,在本发明的任何方法中,在VIP阈值≥1.00时鉴定的如表2所示的波数范围1至12中的4个或更多个,可用于计算病毒滴度,如本文更详细描述的。在任何这些方法中,如本文更详细描述的,优选地波数范围中的6个或更多个可用于计算病毒滴度,更优选8个或更多个,或仍更优选10个或更多个,或最优选所有12个。在本发明的任何方法中,在VIP阈值≥1.25时鉴定的如表2所示的波数范围13至22中的4个或更多个,可用于计算病毒滴度,如本文更详细描述的。在任何这些方法中,如本文更详细描述的,优选地波数范围中的6个或更多个可用于计算病毒滴度,更优选8个或更多个,或最优选所有10个。在本发明的任何方法中,在VIP阈值≥1.50时鉴定的如表2所示的波数范围23至30中的4个或更多个,可用于计算病毒滴度,如本文更详细描述的。在任何这些方法中,如本文更详细描述的,优选地波数范围中的6个或更多个可用于计算病毒滴度,或最优选所有8个。
参考文献
Barnes,R.J.,Dhanoa,M.S.和Lister,S.J.Standard Normal VariateTransformation and De-trending of Near-Infrared Diffuse ReflectanceSpectra.Applied Spectroscopy.1989,43(5):第772-777页。
Buckley,K.和Ryder,A.G.Applications of Raman Spectroscopy inBiopharmaceutical Manufacturing:A Short Review.Applied Spectroscopy.2017,71(6):第1085-1116页。
Hu H.,Bai,J.Xia,G.Zhang,W.Ma,Y.Improved Baseline Correction MethodBased on Polynomial Fitting for Raman Spectroscopy.Photonic Sensors.2018,8(4):第332-340页。
Huang,J.,Romero-Torres,S.和Moshgbar,M.Practical Considerations inData Pre-treatment for NIR and Raman Spectroscopy.American PharmaceuticalReview.2010。
Koch,M.,Suhr,C.,Roth,B.和Meinhardt-Wollweber,M.Iterativemorphological and mollifier-based baseline correction for Ramanspectra.Journal of Raman Spectroscopy.2017,48(2):第336-342页。
Lee,J.H.,Kim,B.C.,Oh,B.K.和Choi,J.W.Rapid and Sensitive Determinationof HIV-1Virus Based on Surface Enhanced Raman Spectroscopy.J.Biomed.Nanotechnol.2015,11(12):第2223-2230页。
Lieber,C.A.和Mahadevan-Jansen,A.Automated method for subtraction offluorescence from biological Raman spectra.Applied Spectroscopy.2003,57(11):第1363-1367页。
Savitzky,A.和Golay,M.J.E.Smoothing and Differentiation of Data bySimplified Least Squares Procedures.Analytical Chemistry.1964,36(8):第1627-1639页。
Wold,S.,Sjostrom,M和Eriksson,L.PLS-regression:a basic tool ofchemometrics.Chemometrics and Intelligent Laboratory Systems.2001,58:第109-130页。
Zhang,Z.M.,Chen,S.和Liang,Y.Z.Baseline correction using adaptiveiteratively reweighted penalized least squares.Analyst.2010,135(5):第1138-1146页。
Zhao,J.,Lui,H.,McLean,D.I.和Zeng,H.Automated autofluorescencebackground subtraction algorithm for biomedical Raman Spectroscopy.AppliedSpectroscopy.2007,61(11):第1225-32页。
Claims (35)
1.一种采用拉曼光谱定量样本中的病毒滴度的方法,该方法包括以下步骤:
(a)提供样本并用光源照射所述样本;
(b)测量多个波数范围中的每一个波数范围内的拉曼散射光的总强度,以获得所述样本的波数强度数据集,其中所述多个波数范围是预先选择的并且表征样本中的病毒;
(c)对波数强度数据执行数学数据处理步骤;和
(d)基于所述数学数据处理步骤的输出定量所述病毒滴度。
2.根据权利要求1所述的方法,其中执行所述数学数据处理和定量所述病毒滴度的步骤包括:
(i)任选地,通过采用一种或多种预处理分析方法对信号强度数据预处理来使波数信号强度数据归一化,所述预处理分析方法例如一阶导数法、二阶导数法、标准正态变量(SNV)法、多项式拟合法、多元多项式拟合法、软化子法、分段多项式拟合(PPF)法或自适应迭代重加权惩罚最小二乘(airPLS)法;
(ii)通过对所述波数信号强度数据应用多元回归算法来获得模型参数,所述多元回归算法诸如偏最小二乘(PLS)回归算法,任选地其中PLS算法是非线性迭代偏最小二乘(NIPALS)回归算法或神经网络;和
(iii)采用通过将所述多元回归算法应用于所述信号强度数据获得的模型参数来定量所述病毒滴度。
3.根据权利要求1或权利要求2所述的方法,其中用于照射所述样本的所述光源是激光并且用波长为785nm的光照射所述样本。
4.根据前述权利要求中任一项所述的方法,其中使用电荷耦合器件(CCD)检测所述拉曼散射光。
5.根据前述权利要求中任一项所述的方法,其中所测量的拉曼光谱中的所述多个波数范围包含表1中所列的波数范围1至28中的5个或更多个,并且其中变量重要性投影(VIP)≥1.00;或者其中,所测量的拉曼光谱中的所述多个波数范围包含表1中所列的波数范围1至28中的10个或更多个,并且其中VIP≥1.00;或者其中,所测量的拉曼光谱中的所述多个波数范围包含表1中所列的波数范围1至28中的15个或更多个,并且其中VIP≥1.00;或者其中,所测量的拉曼光谱中的所述多个波数范围包含表1中所列的波数范围1至28中的20个或更多个,并且其中VIP≥1.00;或者其中,所测量的拉曼光谱中的所述多个波数范围包含表1中所列的波数范围1至28中的25个或更多个,并且其中VIP≥1.00;或者其中,所测量的拉曼光谱中的所述多个波数范围包含表1中列出的波数范围1至28中的所有28个,并且其中VIP≥1.00。
6.根据权利要求1至4中任一项所述的方法,其中所测量的拉曼光谱中的所述多个波数范围包含表1中所列的波数范围29至59中的5个或更多个,并且其中变量重要性投影(VIP)≥1.25;或者其中,所测量的拉曼光谱中的所述多个波数范围包含表1中所列的波数范围29至59中的10个或更多个,并且其中VIP≥1.25;或者其中,所测量的拉曼光谱中的所述多个波数范围包含表1中所列的波数范围29至59中的15个或更多个,并且其中VIP≥1.25;或者其中,所测量的拉曼光谱中的所述多个波数范围包含表1中所列的波数范围29至59中的20个或更多个,并且其中VIP≥1.25;或者其中,所测量的拉曼光谱中的所述多个波数范围包含表1中所列的波数范围29至59中的25个或更多个,并且其中VIP≥1.25;或者其中,所测量的拉曼光谱中的所述多个波数范围包含表1中所列的波数范围29至59中的30个,并且其中VIP≥1.25;或者其中,所测量的拉曼光谱中的所述多个波数范围包含表1中所列的波数范围29至59中的所有31个,并且其中VIP≥1.25。
7.根据权利要求1至4中任一项所述的方法,其中所测量的拉曼光谱中的所述多个波数范围包含表1中所列的波数范围60至81中的5个或更多个,并且其中变量重要性投影(VIP)≥1.50;或者其中,所测量的拉曼光谱中的所述多个波数范围包含表1中所列的波数范围60至81中的10个或更多个,并且其中VIP≥1.50;或者其中,所测量的拉曼光谱中的所述多个波数范围包含表1中所列的波数范围60至81中的15个或更多个,并且其中VIP≥1.50;或者其中,所测量的拉曼光谱中的所述多个波数范围包含表1中所列的波数范围60至81中的20个或更多个,并且其中VIP≥1.50;或者其中,所测量的拉曼光谱中的所述多个波数范围包含表1中所列的波数范围60至81中的所有22个,并且其中VIP≥1.50。
8.根据权利要求5至7中任一项所述的方法,其中所测量的病毒滴度是慢病毒滴度。
9.根据权利要求1至4中任一项所述的方法,其中所测量的拉曼光谱中的所述多个波数范围包含表2中所列的波数范围1至12中的4个或更多个,并且其中VIP≥1.00;或者其中,所测量的拉曼光谱中的所述多个波数范围可以包含表2中所列的波数范围1至12中的6个或更多个,并且其中VIP≥1.00;或者其中,所测量的拉曼光谱中的所述多个波数范围可以包含表2中所列的波数范围1至12中的8个或更多个,并且其中VIP≥1.00;或者其中,所测量的拉曼光谱中的所述多个波数范围可以包含表2中所列的波数范围1至12中的10个或更多个,并且其中VIP≥1.00;或者其中,所测量的拉曼光谱中的所述多个波数范围可以包含表2中所列的波数范围1至12中的所有12个,并且其中VIP≥1.00。
10.根据权利要求1至4中任一项所述的方法,其中所测量的拉曼光谱中的所述多个波数范围包含表2中所列的波数范围13至22中的4个或更多个,并且其中VIP≥1.25;或者其中,所测量的拉曼光谱中的所述多个波数范围包含表2中所列的波数范围13至22中的6个或更多个,并且其中VIP≥1.25;或者其中,所测量的拉曼光谱中的所述多个波数范围包含表2中所列的波数范围13至22中的8个或更多个,并且其中VIP≥1.25;或者其中,所测量的拉曼光谱中的所述多个波数范围包含表2中所列的波数范围13至22中的所有10个,并且其中VIP≥1.25。
11.根据权利要求1至4中任一项所述的方法,其中所测量的拉曼光谱中的所述多个波数范围包含表2中所列的波数范围23至30中的4个或更多个,并且其中VIP≥1.50;或者其中,所测量的拉曼光谱中的所述多个波数范围可以包含表2中所列的波数范围23至30中的6个或更多个,并且其中VIP≥1.50;或者其中,所测量的拉曼光谱中的所述多个波数范围可以包含表2中所列的波数范围23至30中的所有8个,并且其中VIP≥1.50。
12.根据权利要求9至11中任一项所述的方法,其中所测量的病毒滴度是腺相关病毒(AAV)滴度。
13.根据前述权利要求中任一项所述的方法,其中所测量的病毒滴度是物理病毒滴度。
14.根据权利要求1至13中任一项所述的方法,其中所测量的病毒滴度是功能性病毒滴度。
15.根据权利要求1至14中任一项所述的方法,其中所测量的病毒滴度不是HIV-1的滴度或HIV-1病毒样颗粒(HIV-1VLP)的滴度。
16.根据前述权利要求中任一项所述的方法,其中所述拉曼光谱不是表面增强拉曼光谱。
17.根据前述权利要求中任一项所述的方法,其中所述样本是病毒培养物,并且从所述培养物获得的波数强度数据集原位定量所述病毒滴度。
18.根据权利要求1至16中任一项所述的方法,其中所述样本是从病毒培养物的培养基获得的样本,并且所述病毒滴度根据从所述样本获得的波数强度数据集定量。
19.根据前述权利要求中任一项所述的方法,所述方法包括在第一时间点定量所述样本中的病毒滴度的第一步骤和在稍后的时间点定量所述样本中的病毒滴度的一个或多个另外的步骤,并且还包括在各时间点之间测量所述样本中的病毒滴度的变化,其中每个定量步骤通过前述权利要求中任一项所述的方法进行,优选地其中每个定量步骤通过相同的方法进行。
20.根据权利要求19所述的方法,其中在一段时间内重复定量病毒滴度以实时提供对病毒滴度的变化的测量。
21.根据权利要求19或权利要求20所述的方法,其中所述样本中的病毒滴度的变化用于确定病毒生产过程的起始阶段、生产阶段和/或稳定阶段。
22.根据前述权利要求中任一项所述的方法,其中所述方法用于确定病毒生产过程的最佳条件。
23.根据前述权利要求中任一项所述的方法,其中所述方法用于评估病毒生产过程下游的过程。
24.根据权利要求1至23中任一项所述的方法,其中所述方法包括将由此获得的所述病毒滴度与通过替代方法从相同样本获得的病毒滴度进行比较的步骤,任选地其中所述替代方法是RT-qPCR或p24 ELISA。
25.一种采用拉曼光谱确定个体中病毒感染程度的方法,所述方法包括通过执行权利要求1至16中任一项所述的方法来定量样本中的病毒滴度,其中所述样本是先前已从所述个体获得的样本。
26.根据权利要求25所述的方法,其中所述样本是血液、唾液、痰、血浆、血清、脑脊液、尿液或粪便的样本。
27.根据权利要求25或权利要求62所述的方法,其中将来自受试者的样本中的病毒滴度与先前已针对个体中的感染获得的一个或多个病毒滴度测量值进行比较,以提供对所述个体的感染阶段的预后。
28.一种采用拉曼光谱定量样本中的病毒滴度的方法,所述方法包含以下步骤:
(a)提供所述样本的波数强度数据集,其中所述数据集已通过用光源照射所述样本并测量多个波数范围中的每一个波数范围内的拉曼散射光的总强度而获得,其中在所述拉曼光谱中所述多个波数范围已被选出来表征所述样本中的病毒;
(b)对波数强度数据执行数学数据处理步骤;和
(c)基于所述数学数据处理步骤的输出定量所述病毒滴度。
29.根据权利要求28所述的方法,其中所述方法根据权利要求2至27中任一项限定的步骤执行。
30.一种建立多元数据处理模型的方法,所述模型能够从针对样本获得的拉曼光谱波数强度数据集提供对样本中病毒滴度的定量,所述方法包含:
(a)提供样本并用光源照射所述样本;
(b)测量多个波数范围中的每一个波数范围内的拉曼散射光的总强度,以获得所述样本的波数强度数据集;
(c)通过采用预处理分析方法对信号强度数据预处理获得归一化的波数信号强度数据,所述预处理分析方法例如一阶导数法、二阶导数法、标准正态变量(SNV)法、多项式拟合法、多元多项式拟合法、软化子法、分段多项式拟合(PPF)法或自适应迭代重加权惩罚最小二乘(airPLS)法;
(d)通过对预处理的信号强度数据应用多元回归算法来获得模型参数,所述多元回归算法诸如偏最小二乘(PLS)回归算法,任选地其中PLS算法是非线性迭代偏最小二乘(NIPALS)回归算法或神经网络,其中执行校准,其中将预处理的信号强度数据与采用诸如qPCR和p24ELISA的非拉曼光谱方法对于相同样本条件获得的病毒滴度数据进行比较;
(e)采用从预处理的数据获得的所述模型参数推断响应值;和
(f)执行变量选择,任选地变量重要性投影(VIP),并鉴定拉曼光谱变量;和
(g)任选地,通过重新应用步骤(d)到(f)来执行一轮或多轮进一步的建模,其中不重要的变量被去除;并且
其中样本中的病毒滴度采用针对已鉴定的拉曼光谱变量获得的模型参数进行定量,所述已鉴定的拉曼光谱变量自所述多元数据处理模型导出。
31.拉曼光谱在定量样本中的病毒滴度中的用途。
32.根据权利要求31所述的用途,其中所述样本是病毒培养物或来自病毒培养物的样本,并且所述病毒滴度基于从所述样本获得的拉曼散射光的强度的测量值来原位定量,其中所述拉曼散射光的强度是从拉曼光谱中的多个波数范围测得的,所述多个波数范围表征所述样本中的病毒。
33.根据权利要求32所述的用途,其中所述样本中的病毒滴度在第一时间点和一个或多个稍后的时间点定量,并且其中计算在各时间点之间所述样本中的病毒滴度的变化。
34.根据权利要求33所述的用途,其中重复定量所述样本中的病毒滴度以实时提供对所述病毒滴度的变化的测量。
35.根据权利要求31至34中任一项所述的用途,其中所述样本中的病毒滴度通过执行根据权利要求1至16中任一项所述的方法来定量。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB1821206.8A GB2580186B (en) | 2018-12-24 | 2018-12-24 | Monitoring viral titre using Raman Spectroscopy |
GB1821206.8 | 2018-12-24 | ||
PCT/GB2019/053695 WO2020136376A1 (en) | 2018-12-24 | 2019-12-23 | Methods for determining viral titre using raman spectroscopy |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113490843A true CN113490843A (zh) | 2021-10-08 |
Family
ID=65364508
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980092894.2A Pending CN113490843A (zh) | 2018-12-24 | 2019-12-23 | 采用拉曼光谱确定病毒滴度的方法 |
Country Status (10)
Country | Link |
---|---|
US (2) | US11703455B2 (zh) |
EP (1) | EP3903096A1 (zh) |
JP (1) | JP2022515417A (zh) |
KR (1) | KR20210104887A (zh) |
CN (1) | CN113490843A (zh) |
AU (1) | AU2019412791A1 (zh) |
CA (1) | CA3123168A1 (zh) |
GB (1) | GB2580186B (zh) |
IL (1) | IL284283B1 (zh) |
WO (1) | WO2020136376A1 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110609030B (zh) * | 2019-10-22 | 2022-02-25 | 上海海关动植物与食品检验检疫技术中心 | 一种基于检出概率模型的拉曼快检性能综合评价方法 |
GB202010104D0 (en) * | 2020-07-01 | 2020-08-12 | Cell Therapy Catapult Ltd | Method |
US20230160829A1 (en) * | 2021-11-19 | 2023-05-25 | Janssen Biotech, Inc. | Methods for determination of virus titer in a sample using raman spectroscopy |
WO2023227438A1 (en) | 2022-05-23 | 2023-11-30 | F. Hoffmann-La Roche Ag | Raman-based method for the differentiation of aav particle serotype and aav particle loading status |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1242937A (zh) * | 1998-07-28 | 2000-02-02 | 中国科学院生物物理研究所 | 多环醌类化合物的光敏作用杀灭血制品中艾滋病毒的方法 |
JP2005140794A (ja) * | 2005-01-13 | 2005-06-02 | E Graw An | 化学物質および微生物の検出のためのラマンオプトロードプロセスおよび装置 |
US20090086201A1 (en) * | 2005-03-15 | 2009-04-02 | Dluhy Richard A | Surface Enhanced Raman Spectroscopy (SERS) systems for the detection of viruses and methods of use thereof |
US20120316446A1 (en) * | 2011-06-07 | 2012-12-13 | Sinisa Vukelic | Raman spectral analysis for disease detection and monitoring |
JP2015117950A (ja) * | 2013-12-17 | 2015-06-25 | パナソニックIpマネジメント株式会社 | 報知装置、空気清浄機、および、報知方法 |
CN105630743A (zh) * | 2015-12-24 | 2016-06-01 | 浙江大学 | 一种光谱波数的选择方法 |
CN107937957A (zh) * | 2017-11-23 | 2018-04-20 | 华中农业大学 | 表面增强拉曼基底的制备方法及该基底用于检测动物病毒 |
CN108088834A (zh) * | 2017-09-13 | 2018-05-29 | 新疆大学 | 基于优化反向传播神经网络的包虫病血清拉曼光谱诊断仪 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005031301A2 (en) * | 2003-07-10 | 2005-04-07 | Parallax Biosystems, Inc. | Raman signature probes and their use in the detection and imaging of molecular processes and structures |
WO2006051847A1 (ja) * | 2004-11-12 | 2006-05-18 | The New Industry Research Organization | Hiv等のウイルス感染の有無、又はプリオン感染の有無を近赤外線分光法により検査・判定する方法、及び同方法に使用する装置 |
US7889334B2 (en) * | 2005-03-15 | 2011-02-15 | University Of Georgia Research Foundation, Inc. | Surface enhanced Raman spectroscopy (SERS) systems for the detection of bacteria and methods of use thereof |
US20100279886A1 (en) * | 2007-04-03 | 2010-11-04 | University Of Rochester | Two-dimensional photonic bandgap structures for ultrahigh-sensitivity biosensing |
DE102008047240B4 (de) * | 2008-09-11 | 2016-03-31 | Friedrich-Schiller-Universität Jena | Verfahren zur Identifikation von Einzelviren in einer Probe |
US9662047B2 (en) * | 2010-08-05 | 2017-05-30 | Massachusetts Institute Of Technology | Portable raman diagnostic system |
TWI487910B (zh) * | 2010-09-07 | 2015-06-11 | 國立成功大學 | 倒多角錐陣列型免標定病毒檢測基板、系統及方法 |
KR101523337B1 (ko) * | 2012-09-20 | 2015-05-28 | 주식회사 바이오센 | 라만 분광법 및 케모메트릭스를 이용한 식물의 바이러스 감염에 대한 분석방법 |
EP3030870B1 (en) * | 2013-08-07 | 2021-04-07 | Wayne State University | Hand-held micro-raman based detection instrument and method of detection |
CN105603125B (zh) * | 2016-03-09 | 2019-07-12 | 华南农业大学 | 一种快速检测禽病病毒的检测试剂盒及其检测方法 |
-
2018
- 2018-12-24 GB GB1821206.8A patent/GB2580186B/en active Active
-
2019
- 2019-12-23 CA CA3123168A patent/CA3123168A1/en active Pending
- 2019-12-23 AU AU2019412791A patent/AU2019412791A1/en active Pending
- 2019-12-23 IL IL284283A patent/IL284283B1/en unknown
- 2019-12-23 CN CN201980092894.2A patent/CN113490843A/zh active Pending
- 2019-12-23 WO PCT/GB2019/053695 patent/WO2020136376A1/en unknown
- 2019-12-23 EP EP19831870.1A patent/EP3903096A1/en active Pending
- 2019-12-23 KR KR1020217023614A patent/KR20210104887A/ko unknown
- 2019-12-23 US US17/417,466 patent/US11703455B2/en active Active
- 2019-12-23 JP JP2021536747A patent/JP2022515417A/ja active Pending
-
2023
- 2023-05-26 US US18/324,728 patent/US20230384228A1/en active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1242937A (zh) * | 1998-07-28 | 2000-02-02 | 中国科学院生物物理研究所 | 多环醌类化合物的光敏作用杀灭血制品中艾滋病毒的方法 |
JP2005140794A (ja) * | 2005-01-13 | 2005-06-02 | E Graw An | 化学物質および微生物の検出のためのラマンオプトロードプロセスおよび装置 |
US20090086201A1 (en) * | 2005-03-15 | 2009-04-02 | Dluhy Richard A | Surface Enhanced Raman Spectroscopy (SERS) systems for the detection of viruses and methods of use thereof |
US20120316446A1 (en) * | 2011-06-07 | 2012-12-13 | Sinisa Vukelic | Raman spectral analysis for disease detection and monitoring |
JP2015117950A (ja) * | 2013-12-17 | 2015-06-25 | パナソニックIpマネジメント株式会社 | 報知装置、空気清浄機、および、報知方法 |
CN105630743A (zh) * | 2015-12-24 | 2016-06-01 | 浙江大学 | 一种光谱波数的选择方法 |
CN108088834A (zh) * | 2017-09-13 | 2018-05-29 | 新疆大学 | 基于优化反向传播神经网络的包虫病血清拉曼光谱诊断仪 |
CN107937957A (zh) * | 2017-11-23 | 2018-04-20 | 华中农业大学 | 表面增强拉曼基底的制备方法及该基底用于检测动物病毒 |
Non-Patent Citations (4)
Title |
---|
CUI FAN ET AL: "Detecting Food- and Waterborne Viruses by Surface-Enhanced Raman Spectroscopy", 《JOURNAL OF FOOD SCIENCE》, vol. 75, pages 302 * |
JEREMY D. DRISKELL ET AL: "Rapid and Sensitive Detection of Rotavirus Molecular Signatures Using Surface Enhanced Raman Spectroscopy", 《PLOS ONE》, vol. 5, no. 4, pages 2 - 3 * |
KAMILA MOOR ET AL: "Early detection of virus infection in live human cells using Raman Spectroscopy", 《JOURNAL OF BIOMEDICAL OPTICS》, vol. 23, no. 9, pages 3 - 4 * |
贾潇潇等: "利用表面增强拉曼光谱技术分析温度及pH值对H1N1亚型流感病毒增殖的影响", 《生物工程学报》, vol. 32, no. 4, pages 447 - 456 * |
Also Published As
Publication number | Publication date |
---|---|
US20230384228A1 (en) | 2023-11-30 |
US20220018782A1 (en) | 2022-01-20 |
IL284283A (en) | 2021-08-31 |
CA3123168A1 (en) | 2020-07-02 |
GB201821206D0 (en) | 2019-02-06 |
JP2022515417A (ja) | 2022-02-18 |
KR20210104887A (ko) | 2021-08-25 |
AU2019412791A1 (en) | 2021-07-08 |
US11703455B2 (en) | 2023-07-18 |
GB2580186B (en) | 2021-09-15 |
WO2020136376A1 (en) | 2020-07-02 |
GB2580186A (en) | 2020-07-15 |
IL284283B1 (en) | 2024-03-01 |
EP3903096A1 (en) | 2021-11-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11703455B2 (en) | Methods for determining viral titre using raman spectroscopy | |
US20230236128A1 (en) | Methods for analysing viruses using raman spectroscopy | |
Khan et al. | Detection of urea adulteration in milk using near-infrared Raman spectroscopy | |
Rohleder et al. | Quantitative analysis of serum and serum ultrafiltrate by means of Raman spectroscopy | |
Mistek et al. | Race differentiation by Raman spectroscopy of a bloodstain for forensic purposes | |
Chen et al. | Extracting chemical information from spectral data with multiplicative light scattering effects by optical path-length estimation and correction | |
Green et al. | In-line monitoring of moisture content in fluid bed dryers using near-IR spectroscopy with consideration of sampling effects on method accuracy | |
De Luca et al. | Modulated Raman spectroscopy for enhanced cancer diagnosis at the cellular level | |
KR101789893B1 (ko) | 의학적 측정 곡선들을 평가하기 위한 방법 | |
JP2009516181A (ja) | 試料または試料の成分の化学的または物理学的特性の決定 | |
Guo et al. | Extended multiplicative signal correction based model transfer for Raman spectroscopy in biological applications | |
Alexander | Development of methodology based on commercialized SERS-active substrates for rapid discrimination of Poxviridae virions | |
Giuliano et al. | Forensic phenotype profiling based on the attenuated total reflection fourier transform-infrared spectroscopy of blood: Chronological age of the donor | |
Takamura et al. | Recent advances of vibrational spectroscopy and chemometrics for forensic biological analysis | |
Bilal et al. | Raman spectroscopy-based screening of IgM positive and negative sera for dengue virus infection | |
JP7038230B2 (ja) | 細胞数を推定する方法および細胞数を推定する装置 | |
Zhu et al. | Raman spectroscopic measurement of relative concentrations in mixtures of oral bacteria | |
Monago-Maraña et al. | Second-order calibration in combination with fluorescence fibre-optic data modelling as a novel approach for monitoring the maturation stage of plums | |
Forouzangohar et al. | Mid-infrared spectra predict nuclear magnetic resonance spectra of soil carbon | |
Prakash et al. | White light excitation fluorescence (WLEF) Part II. Analysis of complex multifluorophoric systems | |
Olaetxea et al. | Determination of physiological lactate and pH by Raman spectroscopy | |
Chen et al. | High-throughput prediction of physical and mechanical properties of paper from Raman chemometric analysis of pulp fibres | |
JPH09171015A (ja) | 尿中成分測定装置 | |
Santos | Advanced strategies and modes of implementation of in-situ Raman Spectroscopy in monitoring mammalian processes. | |
Petrich | Biomedical Vibrational Spectroscopy |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |