RU2797170C9 - Systems and methods for assessing the efficiency of a medicinal product - Google Patents

Systems and methods for assessing the efficiency of a medicinal product Download PDF

Info

Publication number
RU2797170C9
RU2797170C9 RU2019135697A RU2019135697A RU2797170C9 RU 2797170 C9 RU2797170 C9 RU 2797170C9 RU 2019135697 A RU2019135697 A RU 2019135697A RU 2019135697 A RU2019135697 A RU 2019135697A RU 2797170 C9 RU2797170 C9 RU 2797170C9
Authority
RU
Russia
Prior art keywords
expression
training
feature
response
machine learning
Prior art date
Application number
RU2019135697A
Other languages
Russian (ru)
Other versions
RU2019135697A (en
RU2797170C2 (en
Inventor
Шилэ ЧЖАН
Мэнчи ВАН
Аарон ВАЙЗ
Хань КАН
Витор Феррейра ОНУЧИК
Кристина КРУГЛЯК
Original Assignee
Иллюмина, Инк.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Иллюмина, Инк. filed Critical Иллюмина, Инк.
Priority claimed from PCT/US2018/063658 external-priority patent/WO2019109089A1/en
Publication of RU2019135697A publication Critical patent/RU2019135697A/en
Publication of RU2797170C2 publication Critical patent/RU2797170C2/en
Application granted granted Critical
Publication of RU2797170C9 publication Critical patent/RU2797170C9/en

Links

Abstract

FIELD: bioinformatics.
SUBSTANCE: computer-implemented method is proposed, which includes loading into a trained machine-learning classifier of genomic information of a non-training subject, which contains features from the tumor profile, and the trained machine-learning classifier is trained with the help of the features of tumor samples obtained from training subjects and their response to treatment by inhibition of the control point, and the machine learning classifier is trained to predict response to treatment and generate, with the help of trained machine learning classifier, a checkpoint inhibition responsiveness classification to predict a subject's response to checkpoint inhibition, and report the classification of checkpoint inhibition responsiveness using graphical user interface. Also a computer system for executing the method and a machine-learning classifier trained using the specified method are proposed.
EFFECT: invention expands the arsenal of cancer treatment methods.
29 cl, 12 dwg

Description

ПЕРЕКРЕСТНАЯ ССЫЛКА НА РОДСТВЕННЫЕ ЗАЯВКИCROSS-REFERENCE TO RELATED APPLICATIONS

[0001] Настоящая заявка испрашивает приоритет согласно предварительной заявке на патент США №62/593802, поданной 1 декабря 2017 г., содержимое которой полностью включено в настоящую заявку посредством ссылки.[0001] This application claims priority under U.S. Provisional Application No. 62/593,802, filed Dec. 1, 2017, the contents of which are incorporated herein by reference in their entirety.

УРОВЕНЬ ТЕХНИКИBACKGROUND OF THE INVENTION

[0002] Обнаружение патологических или раковых клеток в организме - важная задача иммунной системы. Одним из участвующих механизмов является иммунная контрольная точка. Например, контрольные точки белка программируемой клеточной смерти 1 (PD-1) и цитотоксического Т-лимфоцит-ассоциированного белка 4 (CTLA-4) на Т-клетках отрицательно регулируют иммунную функцию и предотвращают чрезмерную реакцию (т.е. стимулируют самораспознавание иммунной системы). Однако этот механизм может использоваться опухолевыми клетками для ухода от иммунных атак. Иммунотерапия, как, например, ингибирование PD-1 (например, анти-PD1 антитела) и CTLA-4 (например, антитела к CTLA-4), блокирует активность контрольной точки, тем самым способствуя Т-клеточной идентификации болезни или опухолевых клеток как таковых.[0002] Detection of pathological or cancerous cells in the body is an important task of the immune system. One of the mechanisms involved is the immune checkpoint. For example, programmed cell death protein 1 (PD-1) and cytotoxic T-lymphocyte-associated protein 4 (CTLA-4) checkpoints on T cells negatively regulate immune function and prevent overreaction (i.e., stimulate self-recognition of the immune system) . However, this mechanism can be used by tumor cells to evade immune attacks. Immunotherapy, such as inhibition of PD-1 (eg, anti-PD1 antibodies) and CTLA-4 (eg, anti-CTLA-4 antibodies), blocks checkpoint activity, thereby facilitating T-cell identification of disease or tumor cells per se .

[0003] Однако, хотя терапевтические средства на основе иммунных контрольных точек могут быть эффективными, отвечаемость у всех онкологических больных не гарантирована. Терапевтические средства на основе иммунной контрольной точки продемонстрировали улучшение, по сравнению с традиционными терапиями рака, длительного выживания пациентов с различными онкологическими заболеваниями. Однако на одобренные в настоящее время лекарственные средства-ингибиторы контрольных точек, содержащие анти-CTLA-4 антитело (например, ипилимумаб), и терапевтические средства, нацеленные на путь контрольной точки PD-1, такие как анти-PD-1 антитело (например, ниволумаб) или антитело к анти-лиганду 1 программируемой смерти (анти-PD-L1) (например, атезолизумаб), реагирует только подмножество онкологических пациентов. Поэтому было бы полезно иметь возможностью выбирать пациентов, которые будут реагировать на конкретные терапевтические средства на основе контрольных точек, и прогнозировать, какая контрольная точка-мишень сделает возможным наилучший результат у данного пациента.[0003] However, while immune checkpoint therapies may be effective, response in all cancer patients is not guaranteed. Immune checkpoint-based therapies have been shown to improve, compared with conventional cancer therapies, the long-term survival of patients with various cancers. However, currently approved checkpoint inhibitor drugs containing an anti-CTLA-4 antibody (eg, ipilimumab) and therapeutics that target the PD-1 checkpoint pathway, such as an anti-PD-1 antibody (eg, nivolumab) or an anti-programmed death ligand 1 (anti-PD-L1) antibody (eg, atezolizumab) responds to only a subset of cancer patients. Therefore, it would be useful to be able to select patients who will respond to specific therapeutics based on breakpoints and to predict which target breakpoint will allow for the best outcome in a given patient.

[0004] Вклад в эффективность иммунотерапии конкретного человека могут вносить многие различные геномные и клеточные признаки. Более высокая мутационная нагрузка опухоли (MHO), например, может положительно влиять на частоту ответа за счет увеличения антигенов, присутствующих на опухолевых клетках, что приводит к повышенному распознаванию Т-клетками при блокировании PD-1. CD4/CD8/CD19-экспрессирующий лейкоцитарный опухолевый инфильтрат коррелирует с более хорошими клиническими результатами, так как такие клетки помогают иммунологической атаке опухолевых клеток и последующему высвобождению антигенов. Супрессорные клетки миелоидного происхождения и регуляторные Т-клетки (Treg) секвестрируют наличие Т-клеток и коррелируют с наихудшим выживанием у различных пациентов. Поскольку они являются взаимодействующими друг с другом признаками, которые могут быть обнаружены и выведены из данных секвенирования нового поколения (СНП), важно создать приложение машинного обучения, которое детально исследует их взаимосвязь с ответами на иммунотерапию и составляет прогноз отвечаемости на терапию, такую как ингибирование контрольной точки или другое лечение рака, соединяя контекст многих признаков, действующих совместно у данного индивида, на основе отвечаемости других людей с учетом их индивидуальных многофакторных контекстов.[0004] Many different genomic and cellular traits can contribute to the efficacy of immunotherapy in a particular individual. Higher tumor mutation load (MHO), for example, can positively influence response rates by increasing antigens present on tumor cells, resulting in increased T cell recognition when PD-1 is blocked. CD4/CD8/CD19-expressing leukocyte tumor infiltrate correlates with better clinical outcomes, as these cells aid in the immunological attack of tumor cells and the subsequent release of antigens. Myeloid-derived suppressor cells and regulatory T cells (Treg) sequester the presence of T cells and correlate with worse survival in various patients. Since they are mutually interacting features that can be detected and inferred from next generation sequencing (NGS) data, it is important to create a machine learning application that examines in detail their relationship to immunotherapy responses and predicts response to therapy such as control inhibition. point or other cancer treatment, connecting the context of many features that work together in this individual, based on the response of other people, taking into account their individual multifactorial contexts.

[0005] Кроме того, учитывая потенциально большое количество взаимодействующих геномных, клеточных и других признаков, которые могут взаимодействовать, для определения того, будет ли данный индивид реагировать положительно на ингибирование контрольной точки, требуется усовершенствованный способ предоставления отчета о прогнозировании отвечаемости. Например, при прогнозировании отвечаемости возможно комбинаторное взаимодействие множества разных признаков. При применении способа машинного обучения для оценки того, может ли пациент более или менее отвечать на данное ингибирование контрольной точки, некоторые признаки могут быть определены как более или менее важные, чем другие, причем разные признаки могут отличаться в разных степенях от уровня, который предполагает возможность влияния каждого из них на отвечаемость, и разные факторы могут сигнализировать о большей или меньшей отвечаемости пациента на разные терапии ингибированием контрольной точки у разных индивидов. Таким образом, требуется контекстный отчет об отвечаемости данного пациента, включающий идентификацию признаков, играющих важную роль при прогнозировании отвечаемости, и направленность их влияния на прогноз. Однако, учитывая данное ограниченное пространство для представления всех таких потенциальных аспектов отчета о прогнозировании, современные способы предоставления отчета недостаточные. Поэтому требуется новый способ предоставления отчета о множестве элементов, относящихся к прогнозированию отвечаемости.[0005] In addition, given the potentially large number of interacting genomic, cellular, and other traits that can interact, to determine whether a given individual will respond positively to checkpoint inhibition, an improved method for reporting response prediction is required. For example, when predicting response, a combinatorial interaction of many different features is possible. When using a machine learning method to assess whether a patient can more or less respond to a given checkpoint inhibition, some features may be determined to be more or less important than others, with different features differing to varying degrees from the level that suggests the possibility the effect of each on responsiveness, and different factors may signal greater or lesser responsiveness of a patient to different checkpoint inhibition therapies in different individuals. Thus, a contextual report on the respondability of a given patient is required, including the identification of features that play an important role in predicting response, and the direction of their influence on the prognosis. However, given this limited space for presenting all such potential aspects of a forecast report, current reporting methods are insufficient. Therefore, a new way of reporting on a plurality of items related to response forecasting is required.

[0006] Настоящее изобретение направлено на преодоление этих и других недостатков в данной области.[0006] The present invention is directed to overcoming these and other disadvantages in the art.

КРАТКОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯBRIEF DESCRIPTION OF THE INVENTION

[0007] Согласно одному аспекту раскрыт реализуемый на компьютере способ, включающий введение в натренированный машинно-обучаемый классификатор геномной информации нетренировочного субъекта, где геномная информация нетренировочного субъекта содержит признаки из профиля опухоли, полученного от нетренировочного субъекта, причем натренированный машинно-обучаемый классификатор натренирован на геномной информации множества тренировочных субъектов и отвечаемости каждого из множества тренировочных субъектов на лечение, включающее ингибирование контрольной точки, геномная информация множества тренировочных субъектов содержит признаки образцов опухоли, полученных от каждого из множества тренировочных субъектов, причем машинно-обучаемый классификатор натренирован на прогнозирование отвечаемости на лечение; формирование классификации отвечаемости на ингибирование контрольной точки для нетренировочного субъекта с использованием натренированного машинно-обучаемого классификатора, причем классификация отвечаемости на ингибирование контрольной точки позволяет прогнозировать ответ нетренировочного субъекта на ингибирование контрольной точки; и предоставление отчета о классификации отвечаемости на ингибирование контрольной точки нетренировочного субъекта с использованием графического пользовательского интерфейса. В одном примере по меньшей мере некоторые из признаков из профиля опухоли, полученного от нетренировочного субъекта, или по меньшей мере некоторые из признаков из профиля опухоли, полученного от одного или более тренировочных субъектов, выбирают из следующей группы признаков: общая мутационная нагрузка, состоящая из всех мутаций; общая мутационная нагрузка, состоящая из несинонимичных мутаций, экспрессия бета-2-микроглобулина (В2М), экспрессия бета-10-субъединицы протеасомы (PSMB10), экспрессия переносчика антигенных пептидов 1 (ТАР1), экспрессия транспортера антигенных пептидов 2 (ТАР2), экспрессия лейкоцитарного антигена человека A (HLA-A), экспрессия главного комплекса гистосовместимости, класс I, В (HLA-B), экспрессия главного комплекса гистосовместимости, класс I, С (HLA-C), экспрессия главного комплекса гистосовместимости класс II, DQ альфа-1 (HLA-DQA1), экспрессия антигена гистосовместимости HLA класса II, бета-цепь DRB1 (HLA-DRB1), экспрессия антигена гистосовместимости HLA класса I, альфа-цепь Е (HLA-E), экспрессия гранулярных белков естественной клетки-киллера 7 (NKG7), экспрессия хемокиноподобного рецептора 1 (CMKLR1), инфильтрация опухоли клетками, экспрессирующими кластер дифференцировки 8 (CD8), инфильтрация опухоли клетками, экспрессирующими кластер дифференцировки 4 (CD4), инфильтрация опухоли клетками, экспрессирующими кластер дифференцировки 19 (CD19), экспрессия гранзима A (GZMA), экспрессия перфорина-1 (PRF1), экспрессия цитотоксического Т-лимфоцит-ассоциированного белка 4 (CTLA4), экспрессия белка программируемой клеточной смерти 1 (PD1), экспрессия лиганда 1 программируемой смерти (PDL1), экспрессия лиганда 2 программируемой клеточной смерти 1 (PDL2), экспрессия гена активации лимфоцитов 3 (LAG3), экспрессия Т-клеточного иммунорецептора с доменами Ig и ITIM (TIGIT), экспрессия кластера дифференцировки 276 (CD276), экспрессия хемокинового (С-С мотива) лиганда 5 (CCL5), экспрессия CD27, экспрессия хемокинового (С-Х-С мотива) лиганда 9 (CXCL9), экспрессия хемокинового (С-Х-С мотива) рецептора 6 (CXCR6), экспрессия индоламин-2,3-диоксигеназы (IDO), экспрессия сигнального трансдуктора и активатора транскрипции 1 (STAT1), экспрессия 3-фукозил-N-ацетил-лактозамина (CD15), экспрессия альфа-цепи рецептора интерлейкина-2 (CD25), экспрессия сиглека-3 (CD33), экспрессия кластера дифференцировки 39 (CD39), экспрессия кластера дифференцировки (CD118), экспрессия транскрипционного фактора forkhead box Р3 (FOXP3) и любая комбинация двух или более вышеперечисленных признаков.[0007] According to one aspect, a computer-implemented method is disclosed, comprising introducing into a trained machine learning classifier genomic information of a non-training subject, where the genomic information of the non-training subject contains features from a tumor profile obtained from the non-training subject, and the trained machine learning classifier is trained on the genomic information of the plurality of training subjects and the response of each of the plurality of training subjects to treatment, including checkpoint inhibition, the genomic information of the plurality of training subjects contains features of tumor samples obtained from each of the plurality of training subjects, and the machine learning classifier is trained to predict response to treatment; generating a checkpoint inhibition response classification for a non-training subject using a trained machine learning classifier, wherein the checkpoint inhibition response classification predicts the response of the non-training subject to checkpoint inhibition; and providing a non-training subject checkpoint inhibition response classification report using a graphical user interface. In one example, at least some of the traits from a tumor profile obtained from a non-training subject, or at least some of the traits from a tumor profile obtained from one or more training subjects, are selected from the following group of traits: a total mutation load consisting of all mutations; total mutation load consisting of non-synonymous mutations, expression of beta-2-microglobulin (B2M), expression of beta-10 proteasome subunit (PSMB10), expression of antigenic peptide transporter 1 (TAP1), expression of antigenic peptide transporter 2 (TAP2), expression of leukocyte human antigen A (HLA-A), expression of major histocompatibility complex class I, B (HLA-B), expression of major histocompatibility complex class I, C (HLA-C), expression of major histocompatibility complex class II, DQ alpha-1 (HLA-DQA1), HLA class II histocompatibility antigen expression, DRB1 beta chain (HLA-DRB1), HLA class I histocompatibility antigen expression, alpha chain E (HLA-E), natural killer cell 7 (NKG7) granular protein expression ), expression of chemokine-like receptor 1 (CMKLR1), tumor infiltration by cells expressing cassette of differentiation 8 (CD8), tumor infiltration by cells expressing cassette of differentiation 4 (CD4), tumor infiltration by cells expressing cassette of differentiation 19 (CD19), granzyme A expression ( GZMA), perforin-1 (PRF1) expression, cytotoxic T-lymphocyte-associated protein 4 (CTLA4) expression, programmed cell death 1 (PD1) expression, programmed death ligand 1 (PDL1) expression, programmed cell death ligand 2 1 expression (PDL2), expression of lymphocyte activation gene 3 (LAG3), expression of T-cell immunoreceptor with Ig domains and ITIM (TIGIT), expression of differentiation cluster 276 (CD276), expression of chemokine (C-C motif) ligand 5 (CCL5), expression CD27, expression of chemokine (C-X-C motif) ligand 9 (CXCL9), expression of chemokine (C-X-C motif) receptor 6 (CXCR6), expression of indolamine-2,3-dioxygenase (IDO), expression of signal transducer and transcription activator 1 (STAT1), 3-fucosyl-N-acetyl-lactosamine (CD15) expression, interleukin-2 receptor alpha-chain expression (CD25), Siglec-3 expression (CD33), expression of differentiation cluster 39 (CD39), expression differentiation cassette (CD118), expression of the transcription factor forkhead box P3 (FOXP3), and any combination of two or more of the above.

[0008] В другом примере по меньшей мере некоторые из тренировочных признаков или по меньшей мере некоторые из нетренировочных признаков включают наборы генов. Еще в одном примере наборы генов выбирали с использованием анализа обогащения набора генов одного образца. Еще в одном примере машинно-обучаемый классификатор представляет собой случайный лес. Еще в одном примере при тренировке машинно-обучаемого классификатора используют по меньшей мере 50000 деревьев решений. Еще в одном примере классификация отвечаемости на ингибирование контрольной точки содержит оценку прогноза и один или более идентификаторов признаков, причем один или более идентификаторов признаков выбирают из группы, состоящей из валентности признака, важности признака и веса признака.[0008] In another example, at least some of the training traits or at least some of the non-training traits include sets of genes. In yet another example, gene sets were selected using single sample gene set enrichment analysis. In yet another example, the machine learning classifier is a random forest. In yet another example, at least 50,000 decision trees are used to train a machine learning classifier. In yet another example, a checkpoint inhibition responsiveness classification comprises a prognosis score and one or more feature identifiers, the one or more feature identifiers being selected from the group consisting of feature valency, feature importance, and feature weight.

[0009] В другом примере графический пользовательский интерфейс предоставляет отчет об идентификаторах признаков в виде характеристик кольцевого сектора, причем угол кольцевого сектора указывает важность признака, наружный радиус кольцевого сектора указывает вес признака, а цвет кольцевого сектора указывает валентность признака. Еще в одном примере важность признака включает снижение индекса Джини признака. Еще в одном примере графический пользовательский интерфейс предоставляет отчет об идентификаторе признака тогда, и только тогда, когда важность признака выше порогового значения. Еще в одном примере важность признака не превышает пороговое значение, если квадрат важности признака не превышает 0,1. Еще в одном примере каждый из кольцевых секторов содержит внутреннюю дугу, и внутренние дуги кольцевых секторов расположены так, что они образуют круг.[0009] In another example, the graphical user interface reports feature identifiers as ring sector characteristics, where the angle of the ring sector indicates the importance of the feature, the outer radius of the ring sector indicates the weight of the feature, and the color of the ring sector indicates the valency of the feature. In yet another example, the importance of a feature includes a decrease in the Gini index of the feature. In yet another example, the graphical user interface provides a feature ID report if, and only if, the feature's importance is above a threshold. In yet another example, the importance of a feature does not exceed a threshold value if the square of the importance of the feature does not exceed 0.1. In yet another example, each of the annular sectors comprises an inner arc, and the inner arcs of the annular sectors are arranged to form a circle.

[0010] Другой пример также включает ввод в натренированный машинно-обучаемый классификатор отвечаемости нетренировочного субъекта на лечение и дальнейшую тренировку машинно-обучаемого классификатора, причем дальнейшая тренировка включает тренировку натренированного машинно-обучаемого классификатора на признаках образцов опухоли, полученных от нетренировочного субъекта, и отвечаемости нетренировочного субъекта на лечение. Еще один пример также включает выбор лечения на основе сформированной классификации отвечаемости на ингибирование контрольной точки.[0010] Another example also includes inputting into the trained machine learning classifier the response rate of a non-training subject to treatment and further training the machine learning classifier, further training comprising training the trained machine learning classifier on features of tumor samples obtained from the non-training subject and the response rate of the non-training subject. subject for treatment. Another example also includes the choice of treatment based on the generated classification of responsiveness to checkpoint inhibition.

[0011] Согласно другому аспекту раскрыта компьютерная система, содержащая один или более микропроцессоров и один или более блоков памяти для хранения натренированного машинно-обучаемого классификатора и геномной информации нетренировочного субъекта, причем натренированный машинно-обучаемый классификатор натренирован на геномной информации множества тренировочных субъектов и отвечаемости каждого из множества тренировочных субъектов на лечение, включающее ингибирование контрольной точки, геномная информация множества тренировочных субъектов содержит признаки профилей опухоли, полученных от каждого из множества тренировочных субъектов, машинно-обучаемый классификатор натренирован на прогнозирование отвечаемости на лечение, геномная информация нетренировочного субъекта содержит признаки из профиля опухоли, полученного от нетренировочного субъекта, одна или более блоков памяти хранят инструкции, исполнение которых одним или более микропроцессорами вызывает формирование компьютерной системой классификации отвечаемости на ингибирование контрольной точки для нетренировочного субъекта с использованием натренированного машинно-обучаемого классификатора и предоставление отчета о классификации отвечаемости на ингибирование контрольной точки нетренировочного субъекта с использованием графического пользовательского интерфейса, причем классификация отвечаемости на ингибирование контрольной точки позволяет прогнозировать ответ нетренировочного субъекта на ингибирование контрольной точки.[0011] According to another aspect, a computer system is disclosed, comprising one or more microprocessors and one or more memory units for storing a trained machine learning classifier and genomic information of a non-training subject, wherein the trained machine learning classifier is trained on the genomic information of a plurality of training subjects and the response of each from a set of training subjects for treatment involving checkpoint inhibition, the genomic information of the set of training subjects contains features from the tumor profiles obtained from each of the set of training subjects, the machine learning classifier is trained to predict response to treatment, the genomic information of the non-training subject contains features from the tumor profile received from a non-training subject, one or more memories store instructions whose execution by one or more microprocessors causes a computer system to generate a checkpoint inhibition response classification for the non-training subject using a trained machine learning classifier and report the checkpoint inhibition response classification. non-training subject using a graphical user interface, and the classification of response to inhibition of the checkpoint allows you to predict the response of the non-training subject to inhibition of the checkpoint.

[0012] В одном примере по меньшей мере некоторые из признаков из профиля опухоли, полученного от нетренировочного субъекта, или по меньшей мере некоторые из признаков из профиля опухоли, полученного от одного или более тренировочных субъектов, выбирают из следующей группы: общая мутационная нагрузка, состоящая из всех мутаций, общая мутационная нагрузка, состоящая из несинонимичных мутаций, экспрессия бета-2-микроглобулина (В2М), экспрессия бета-10-субъединицы протеасомы (PSMB10), экспрессия переносчика антигенных пептидов 1 (ТАР1), экспрессия транспортера антигенных пептидов 2 (ТАР2), экспрессия лейкоцитарного антигена человека A (HLA-A), экспрессия главного комплекса гистосовместимости, класс I, В (HLA-B), экспрессия главного комплекса гистосовместимости, класс I, С (HLA-C), экспрессия главного комплекса гистосовместимости, класс II, DQ альфа-1 (HLA-DQA1), экспрессия антигена гистосовместимости HLA класса II, бета-цепь DRB1 (HLA-DRB1), экспрессия антигена гистосовместимости HLA класса I, альфа-цепь Е (HLA-E), экспрессия гранулярного белка естественной клетки-киллера 7 (NKG7), экспрессия хемокиноподобного рецептора 1 (CMKLR1), инфильтрация опухоли клетками, экспрессирующими кластер дифференцировки 8 (CD8), инфильтрация опухоли клетками, экспрессирующими кластер дифференцировки 4 (CD4), инфильтрация опухоли клетками, экспрессирующими кластер дифференцировки 19 (CD19), экспрессия гранзима А (GZMA), экспрессия перфорина-1 (PRF1), экспрессия цитотоксического Т-лимфоцит-ассоциированного белка 4 (CTLA4), экспрессия белка программируемой клеточной смерти 1 (PD1), экспрессия лиганда 1 программируемой смерти (PDL1), экспрессия лиганда 2 программируемой клеточной смерти 1 (PDL2), экспрессия гена активации лимфоцитов 3 (LAG3), экспрессия Т-клеточного иммунорецептора с доменами Ig и ITIM (TIGIT), экспрессия кластера дифференцировки 276 (CD276), экспрессия хемокинового (С-С мотива) лиганда 5 (CCL5), экспрессия CD27, экспрессия хемокинового (С-Х-С мотива) лиганда 9 (CXCL9), экспрессия хемокинового (С-Х-С мотива) рецептора 6 (CXCR6), экспрессия индоламин-2,3-диоксигеназы (IDO), экспрессия сигнального трансдуктора и активатора транскрипции 1 (STAT1), экспрессия 3-фукозил-N-ацетил-лактозамина (CD15), экспрессия альфа-цепи рецептора интерлейкина-2 (CD25), экспрессия сиглека-3 (CD33), экспрессия кластера дифференцировки 39 (CD39), экспрессия кластера дифференцировки (CD118), экспрессия транскрипционного фактора forkhead box Р3 (FOXP3) и любая комбинация двух или более вышеперечисленных признаков.[0012] In one example, at least some of the features from a tumor profile obtained from a non-training subject, or at least some of the features from a tumor profile obtained from one or more training subjects, are selected from the following group: a total mutation load consisting of of all mutations, total mutation load consisting of non-synonymous mutations, beta-2 microglobulin (B2M) expression, proteasome beta-10 subunit (PSMB10) expression, antigenic peptide transporter 1 (TAP1) expression, antigenic peptide transporter 2 (TAP2) expression ), expression of human leukocyte antigen A (HLA-A), expression of major histocompatibility complex, class I, B (HLA-B), expression of major histocompatibility complex, class I, C (HLA-C), expression of major histocompatibility complex, class II , DQ alpha-1 (HLA-DQA1), HLA class II histocompatibility antigen expression, DRB1 beta chain (HLA-DRB1), HLA class I histocompatibility antigen expression, E alpha chain (HLA-E), natural cell granular protein expression -killer 7 (NKG7), expression of chemokine-like receptor 1 (CMKLR1), tumor infiltration by cells expressing cassette of differentiation 8 (CD8), tumor infiltration by cells expressing cassette of differentiation 4 (CD4), tumor infiltration by cells expressing cassette of differentiation 19 (CD19) , granzyme A (GZMA) expression, perforin-1 (PRF1) expression, cytotoxic T-lymphocyte-associated protein 4 (CTLA4) expression, programmed cell death protein 1 (PD1) expression, programmed death ligand 1 (PDL1) expression, ligand expression 2 programmed cell death 1 (PDL2), expression of lymphocyte activation gene 3 (LAG3), expression of T-cell immunoreceptor with Ig and ITIM domains (TIGIT), expression of differentiation cluster 276 (CD276), expression of chemokine (C-C motif) ligand 5 (CCL5), CD27 expression, expression of chemokine (C-X-C motif) ligand 9 (CXCL9), expression of chemokine (C-X-C motif) receptor 6 (CXCR6), expression of indolamine-2,3-dioxygenase (IDO) , expression of signal transducer and transcription activator 1 (STAT1), expression of 3-fucosyl-N-acetyl-lactosamine (CD15), expression of interleukin-2 receptor alpha chain (CD25), expression of Siglec-3 (CD33), expression of differentiation cluster 39 (CD39), differentiation cassette expression (CD118), forkhead box P3 (FOXP3) transcription factor expression, and any combination of two or more of the above.

[0013] В другом примере по меньшей мере некоторые из тренировочных признаков или по меньшей мере некоторые из нетренировочных признаков содержат наборы генов. Еще в одном примере наборы генов выбирали с использованием анализа обогащения набора генов одного образца. Еще в одном примере машинно-обучаемый классификатор представляет собой случайный лес. Еще в одном примере в машинно-обучаемом классификаторе используют по меньшей мере 50000 деревьев решений. Еще в одном примере классификация отвечаемости на ингибирование контрольной точки содержит оценку прогноза и один или более идентификаторов признаков, причем один или более идентификаторов признаков выбирают из группы, состоящей из валентности признака, важности признака и веса признака. Инструкции, при исполнении их одним или более микропроцессорами, вызывают предоставление графическим пользовательским интерфейсом отчета об идентификаторах признаков в виде характеристик кольцевого сектора, причем угол кольцевого сектора указывает важность признака, наружный радиус кольцевого сектора указывает вес признака, а цвет кольцевого сектора указывает валентность признака.[0013] In another example, at least some of the training traits or at least some of the non-training traits contain sets of genes. In yet another example, gene sets were selected using single sample gene set enrichment analysis. In yet another example, the machine learning classifier is a random forest. In yet another example, at least 50,000 decision trees are used in a machine learning classifier. In yet another example, a checkpoint inhibition responsiveness classification comprises a prognosis score and one or more feature identifiers, the one or more feature identifiers being selected from the group consisting of feature valency, feature importance, and feature weight. The instructions, when executed by one or more microprocessors, cause the graphical user interface to report the feature identifiers as ring sector characteristics, where the angle of the ring sector indicates the importance of the feature, the outer radius of the ring sector indicates the weight of the feature, and the color of the ring sector indicates the valency of the feature.

[0014] Еще в одном примере важность признака включает снижение индекса Джини признака. Еще в одном примере инструкции, при исполнении их одним или более микропроцессорами, вызывают предоставление графическим пользовательским интерфейсом отчета об идентификаторе признака тогда, и только тогда, когда важность признака выше порогового значения. Еще в одном примере важность признака не превышает пороговое значение, если квадрат важности признака не превышает 0,1. Еще в одном примере инструкции, при исполнении их одним или более микропроцессорами, вызывают предоставление графическим пользовательским интерфейсом отчета о внутренней дуге каждого из кольцевых секторов и круге, содержащем внутренние дуги кольцевых секторов. Еще в одном примере инструкции, при выполнении их одним или более микропроцессорами, вызывают дальнейшую тренировку компьютерной системой машинно-обучаемого классификатора, причем дальнейшая тренировка включает тренировку натренированного машинно-обучаемого классификатора на признаках образцов опухоли, полученных от нетренировочного субъекта, и отвечаемости нетренировочного субъекта на лечение.[0014] In yet another example, the importance of a feature includes a decrease in the Gini index of the feature. In yet another example, the instructions, when executed by one or more microprocessors, cause the graphical user interface to report a feature ID when, and only when, the feature's importance is above a threshold. In yet another example, the importance of a feature does not exceed a threshold value if the square of the importance of the feature does not exceed 0.1. In yet another example, the instructions, when executed by one or more microprocessors, cause the graphical user interface to report the inner arc of each of the annular sectors and the circle containing the inner arcs of the annular sectors. In yet another example, the instructions, when executed by one or more microprocessors, cause the computer system to further train the machine learning classifier, further training comprising training the trained machine learning classifier on features of tumor samples obtained from a non-training subject and the non-training subject's response to treatment. .

[0015] Согласно еще одному аспекту раскрыт основанный на машинном обучении классификатор для классификации отвечаемости на ингибирование контрольной точки, который содержит основанный на машинном обучении классификатор, выполняющийся на множество процессоров, который натренирован на прогнозирование отвечаемости нетренировочного субъекта на лечение ингибированием иммунной контрольной точки, причем основанный на машинном обучении классификатор натренирован путем ввода в основанный на машинном обучении классификатор геномной информации множества тренировочных субъектов и отвечаемости каждого из множества тренировочных субъектов на лечение, геномная информация множества тренировочных субъектов содержит признаки профилей опухоли, полученных от каждого из множества тренировочных субъектов; входной процессор, который вводит признаки образцов опухоли, полученных от нетренировочного субъекта, в основанный на машинном обучении классификатор, причем машинно-обучаемый классификатор выполнен с возможностью формирования классификации отвечаемости на ингибирование контрольной точки нетренировочного субъекта, классификация отвечаемости на ингибирование контрольной точки позволяет прогнозировать ответ субъекта на лечение ингибированием контрольной точки; и выходной процессор, который предоставляет отчет о классификации отвечаемости на ингибирование контрольной точки. В одном примере классификация отвечаемости на ингибирование контрольной точки содержит оценку прогноза и множество идентификаторов.[0015] According to another aspect, a machine learning-based classifier for classifying response to checkpoint inhibition is disclosed, which comprises a machine learning-based classifier executing on multiple processors that is trained to predict a non-training subject's response to immune checkpoint inhibition treatment, which is based on machine learning, the classifier is trained by entering into the machine learning-based classifier the genomic information of a plurality of training subjects and the response of each of the plurality of training subjects to treatment, the genomic information of the plurality of training subjects contains features of tumor profiles obtained from each of the plurality of training subjects; an input processor that inputs features of tumor samples obtained from a non-training subject into a machine learning-based classifier, wherein the machine learning classifier is configured to generate a checkpoint inhibition response classification of the non-training subject, the checkpoint inhibition response classification allows prediction of the subject's response to checkpoint inhibition treatment; and an output processor that provides a checkpoint inhibition response classification report. In one example, a checkpoint inhibition response classification comprises a prognosis score and a plurality of identifiers.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙBRIEF DESCRIPTION OF THE DRAWINGS

[0016] Эти и другие признаки, аспекты и преимущества настоящего изобретения станут более понятными при прочтении следующего подробного описания со ссылкой на прилагаемые чертежи, на которых:[0016] These and other features, aspects and advantages of the present invention will become more apparent upon reading the following detailed description with reference to the accompanying drawings, in which:

[0017] на ФИГ. 1 приведена сетевая диаграмма, показывающая варианты выполнения способа в соответствии с аспектами настоящего изобретения;[0017] in FIG. 1 is a network diagram showing embodiments of a method in accordance with aspects of the present invention;

[0018] на ФИГ. 2 показаны некоторые не имеющие ограничительного характера примеры признаков, которые могут быть актуальны при тренировке классификатора и прогнозировании отвечаемости пациента на лечение в соответствии с аспектами настоящего изобретения;[0018] in FIG. 2 shows some non-limiting examples of features that may be relevant in training a classifier and predicting patient response to treatment in accordance with aspects of the present invention;

[0019] на ФИГ. 3 приведена сетевая диаграмма, показывающая пример возможного выполнения способа тренировки классификатора в соответствии с аспектами настоящего изобретения;[0019] in FIG. 3 is a network diagram showing an example of a possible implementation of a classifier training method in accordance with aspects of the present invention;

[0020] на ФИГ. 4 приведена сетевая диаграмма, показывающая пример возможного выполнения способа использования натренированного классификатора для прогнозирования отвечаемости субъекта в соответствии с аспектами настоящего изобретения;[0020] in FIG. 4 is a network diagram showing an example of a possible implementation of a method for using a trained classifier to predict subject response in accordance with aspects of the present invention;

[0021] на ФИГ. 5 приведен пример способа предоставления отчета об отвечаемости субъекта на лечение, которая спрогнозирована натренированным основанном на машинном обучении классификатором, в соответствии с аспектами настоящего изобретения;[0021] in FIG. 5 is an example of a method for reporting a subject's response to treatment as predicted by a trained machine learning classifier, in accordance with aspects of the present invention;

[0022] на ФИГ. 6 приведен пример способа предоставления отчета об отвечаемости субъекта на лечение, которая спрогнозирована натренированным основанном на машинном обучении классификатором, в соответствии с аспектами настоящего изобретения;[0022] in FIG. 6 is an example of a method for reporting a subject's response to treatment as predicted by a trained machine learning classifier, in accordance with aspects of the present invention;

[0023] на ФИГ. 7 приведен пример способа предоставления отчета и сравнении с другими лечениями отвечаемости субъекта на лечение, которая спрогнозирована натренированным основанном на машинном обучении классификатором, в соответствии с аспектами настоящего изобретения;[0023] in FIG. 7 is an example of a method for reporting and comparing with other treatments a subject's response to treatment as predicted by a trained machine learning classifier, in accordance with aspects of the present invention;

[0024] на ФИГ. 8 приведен пример способа предоставления отчета и сравнении с другими лечениями отвечаемости субъекта на лечение, которая спрогнозирована натренированным основанном на машинном обучении классификатором, в соответствии с аспектами настоящего изобретения;[0024] in FIG. 8 is an example of a method for reporting and comparing with other treatments a subject's response to treatment as predicted by a trained machine learning classifier, in accordance with aspects of the present invention;

[0025] на ФИГ. 9 приведен пример способа предоставления отчета и сравнения с другими лечениями отвечаемости субъекта на лечение, которая спрогнозирована натренированным основанном на машинном обучении классификатором, когда наборы генов не включены в качестве признаков, в соответствии с аспектами настоящего изобретения;[0025] in FIG. 9 is an example of a method for reporting and comparing with other treatments a subject's response to treatment as predicted by a trained machine learning classifier when gene sets are not included as features, in accordance with aspects of the present invention;

[0026] на ФИГ. 10 приведен пример способа предоставления отчета об отвечаемости субъекта на лечение, которая спрогнозирована натренированным основанном на машинном обучении классификатором, в соответствии с аспектами настоящего изобретения;[0026] in FIG. 10 is an example of a method for reporting a subject's response to treatment as predicted by a trained machine learning classifier, in accordance with aspects of the present invention;

[0027] на Фиг. 11A-11D приведены сравнительные графики и цифры, демонстрирующие, что использование 38 признаков обеспечивает превосходную эффективность классификатора по сравнению с использованием отдельно взятых факторов;[0027] in FIG. 11A-11D are comparison graphs and figures showing that using 38 features provides superior classifier performance compared to using factors alone;

[0028] на Фиг. 12A-12D приведены графики и цифры, сравнивающие рабочие характеристики машинно-обучаемых классификаторов, использующих 38 признаков без наборов генов или 44 признаков с использованием наборов генов.[0028] in FIG. 12A-12D are graphs and figures comparing the performance of machine learning classifiers using 38 features without gene sets or 44 features with gene sets.

ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯDETAILED DESCRIPTION OF THE INVENTION

[0029] Настоящее изобретение относится к способу машинного обучения для получения прогноза относительно того, может ли индивид отвечать на лечение ингибированием контрольной точки или другое лечение рака. Разные индивиды могут отвечать или не отвечать на данное лечение. Отвечаемость на лечение может зависеть не просто от наличия или отсутствие данного признака или количественной величины данного признака в отдельности. Скорее, несколько признаков могут по-разному сочетаться у разных людей, что делает ответ на данное лечение более вероятным у некоторых индивидов, и менее вероятным у других индивидов. Таким образом, стандартные способы прогнозирования отвечаемости пациента на основе одного признака или даже нескольких признаков не позволяют точно прогнозировать отвечаемость в условиях, когда большое количество факторов, которые могут меняться независимо друг о друга, действуют согласованно.[0029] The present invention relates to a machine learning method for predicting whether an individual may respond to checkpoint inhibition treatment or other cancer treatment. Different individuals may or may not respond to a given treatment. Responsiveness to treatment may depend on more than just the presence or absence of a given feature or the magnitude of a given feature alone. Rather, several features may be combined differently in different individuals, making a response to a given treatment more likely in some individuals and less likely in others. Thus, standard methods for predicting patient response based on a single attribute or even several attributes do not accurately predict response in conditions where a large number of factors that can vary independently of each other act in concert.

[0030] Способ машинного обучения представляет новое решение для устранения этого недостатка преобладающих способов диагностического прогнозирования. В машинном обучении с учителем, например, в запоминающее устройство компьютера могут быть загружены большие наборы данных, представляющих множество многочисленных характеристик индивидов в паре с каждой известной отвечаемостью на данное лечение. Носитель информации компьютера содержит инструкции, которые дают команду процессору компьютера на обработку информации о признаке и отвечаемости индивида для идентификации в информации о признаке структур, которые сигнализируют о высокой или низкой вероятности ответа индивида на данное лечение. Преимущество использования способа машинного обучения для такого анализа заключается в том, что он позволяет идентифицировать структуры в признаках и определять их актуальность для прогнозирования отвечаемости на лечение, что невозможно без больших возможностей по хранению и извлечению данных компьютерных систем и их способности обрабатывать большие количества информации. Компьютеризированная система машинного обучения может обрабатывать десятки или сотни признаков или более десятков или сотен субъектов для идентификации структур признаков и их совокупных корреляций с отвечаемостью индивида. Идентифицируемые таким образом структуры могут быть не обнаруживаемыми иным образом, поскольку они действительно требуют обработки больших количеств данных в сложных наборах информации.[0030] The machine learning method provides a new solution to overcome this shortcoming of the prevailing diagnostic prediction methods. In supervised machine learning, for example, large datasets can be loaded into a computer's storage device representing many multiple characteristics of individuals paired with each known response to a given treatment. The computer storage medium contains instructions that instruct the computer processor to process the individual's trait and response information to identify patterns in the trait information that signal a high or low likelihood of an individual's response to a given treatment. The advantage of using a machine learning method for such analysis is that it allows identifying patterns in traits and determining their relevance to predicting response to treatment, which is impossible without the great data storage and retrieval capabilities of computer systems and their ability to process large amounts of information. A computerized machine learning system may process dozens or hundreds of features, or more than dozens or hundreds of subjects, to identify feature patterns and their cumulative correlations with an individual's response. Structures identified in this way may not be otherwise discoverable because they do require processing large amounts of data in complex sets of information.

[0031] Для определения признаков индивида можно получать образец ткани индивида, такого как индивид с онкологическим заболеванием, и определять характеристики такой ткани. В некоторых примерах полученная ткань может быть образцом клеток, взятых из опухоли. В других примерах полученная ткань может быть неопухолевой тканью, взятой у индивида.[0031] To determine the characteristics of an individual, a tissue sample of an individual, such as an individual with cancer, can be obtained and the characteristics of such tissue can be determined. In some examples, the resulting tissue may be a sample of cells taken from a tumor. In other examples, the resulting tissue may be non-tumor tissue taken from an individual.

[0032] При этом ингибирование контрольной точки относится к лечениям, блокирующим процесс, посредством которого опухолевые клетки активируют пути самораспознавания в иммунной системе и тем самым предотвращают атаку иммунных клеток и цитолиз опухолевых клеток. Как полагают, активация таких путей опухолевыми клетками вносит вклад в рефрактерность некоторых пациентов к иммуноонкологическим лечениям, например, когда создают иммунные клетки для распознавания опухолевых клеток и выбора их в качестве мишени. В число примеров ингибирования контрольной точки входит путь CTLA4. CTLA4 является белковым рецептором, экспрессируемым на регуляторных Т-клетках. Он может быть также экспрессирован на обычных Т-клетках после их активации, что часто наблюдается при раке. Когда CTLA4 связывает CD80 или CD87, экспрессируемые на поверхности антигенпредставляющей клетки белки, это приводит к иммуносупрессии. В здоровых клетках этот механизм способствует самораспознаванию и предотвращает иммунологическую атаку своих клеток организма. Однако при раке повышенная регуляция этого пути помогает опухолевым клеткам избегать обнаружения и атаки иммунной системой. Примеры лечения ингибитором контрольной точки, который ингибирует этот путь (таким, как анти-CTLA4-антитело ипилимумаб), могут активизировать способность иммунной системы выцеливать и разрушать опухолевые клетки, например, в сочетании с другими иммуноонкологическими лечениями, которые стимулируют противоопухолевую иммуноотвечаемость.[0032] Here, checkpoint inhibition refers to treatments that block the process by which tumor cells activate self-recognition pathways in the immune system and thereby prevent attack by immune cells and cytolysis of tumor cells. Activation of such pathways by tumor cells is believed to contribute to the refractoriness of some patients to immuno-oncological treatments, for example when immune cells are designed to recognize and target tumor cells. Examples of checkpoint inhibition include the CTLA4 pathway. CTLA4 is a protein receptor expressed on regulatory T cells. It can also be expressed on normal T cells after their activation, which is often seen in cancer. When CTLA4 binds CD80 or CD87, proteins expressed on the surface of the antigen presenting cell, it results in immunosuppression. In healthy cells, this mechanism promotes self-recognition and prevents immunological attack of their body cells. However, in cancer, upregulation of this pathway helps tumor cells avoid detection and attack by the immune system. Examples of treatment with a checkpoint inhibitor that inhibits this pathway (such as the anti-CTLA4 antibody ipilimumab) can enhance the ability of the immune system to target and destroy tumor cells, for example, in combination with other immuno-oncological therapies that stimulate anti-tumor immunoresponse.

[0033] Аналогичным образом, другим примером ингибирования контрольной точки является путь PD-1. Связывание PD-1 на Т-клетках посредством рецептора PD1-L1, экспрессируемого на своих клетках организма, вызывает иммуносупрессивный ответ. Как и в случае пути CTLA4, этот путь тоже используется опухолевыми клетками для избежания обнаружения и атаки иммунной системой. Примеры лечения ингибитором контрольной точки, который ингибирует этот путь (таким, как анти-PD-1-антитела пембролизумаб, ниволумаб и семиплимаб и анти-PD-L1-антитела атезолизумаб, авелумаб и дурвалумаб), могут активизировать способность иммунной системы выцеливать и разрушать опухолевые клетки, например, в сочетании с другими иммуноонкологическими лечениями, которые стимулируют противоопухолевую иммуноотвечаемость.[0033] Similarly, another example of checkpoint inhibition is the PD-1 pathway. Binding of PD-1 on T cells via the PD1-L1 receptor expressed on its cells in the body elicits an immunosuppressive response. As with the CTLA4 pathway, this pathway is also used by tumor cells to avoid detection and attack by the immune system. Examples of checkpoint inhibitor treatments that inhibit this pathway (such as the anti-PD-1 antibodies pembrolizumab, nivolumab, and semiplimab and the anti-PD-L1 antibodies atezolizumab, avelumab, and durvalumab) can enhance the ability of the immune system to target and destroy tumors. cells, for example, in combination with other immuno-oncological treatments that stimulate anti-tumor immunoresponse.

[0034] Используемый в настоящем документе термин «ингибитор контрольной точки» или «лечение ингибированием контрольной точки» и т.п. включает эти лечения, а также другие лечения, которые ингибируют пути ингибитора контрольной точки, в том числе лечения с помощью других антител или фармацевтических составов, которые функционируют путем предотвращения взаимодействия CTLA4 или PD-1 с их когнатными лигандами или рецепторами или активации последствий их нисходящей сигнализации или клеточных функций.[0034] As used herein, the term "checkpoint inhibitor" or "checkpoint inhibition treatment" and the like. includes these treatments as well as other treatments that inhibit checkpoint inhibitor pathways, including treatments with other antibodies or pharmaceutical formulations that function by preventing CTLA4 or PD-1 from interacting with their cognate ligands or receptors or activating their downstream signaling consequences or cellular functions.

[0035] При создании прогноза в отношении отвечаемости индивида на данное лечение могут быть актуальны многие признаки. К примерам можно отнести информацию о генетической последовательности, содержащуюся в геноме клеток, взятых у индивида, информацию о генетической последовательности, выраженную в РНК, транскрибируемой из генома клетки индивида, величины экспрессии транскриптов геномных последовательностей, которые могут быть отражены в величинах соответствующего РНК-транскрипта или его белковом продукте, или типы клеток, присутствующие в образце. В одном примере, где образец содержит опухолевую ткань или клетки индивида, такая информация может указывать характеристики опухолевых клеток, т.е. клеток в пределах модифицированной геномной последовательности или последовательностях в сравнении с обычной популяцией неопухолевых клеток индивида или референсным геномом, упоминаемым в концепции генетического секвенирования. Онкогенез может быть результатом одного или более изменений нуклеотидной последовательности и/или нескольких последовательностей в геномной ДНК. В некоторых случаях, например, накопление нескольких таких модификаций последовательности может в совокупности функционировать таким образом, чтобы преобразовывать небольную клетку в опухолевую клетку. В других случаях начальное накопление одной или более таких модификаций в клетке может предрасположить клетку к дальнейшему накоплению таких модификаций. Еще в одних случаях пролиферация таких модификаций в клетке может не означать, что какие-либо конкретные модификации непосредственно участвуют в развитии опухоли или отвечают за нее. Скорее, онкогенный процесс может привести к некоторым модификациям, которые непосредственно вызывают преобразование клетки в опухолевую клетку, но может также создавать другие модификации, которые не делают этого.[0035] Many features may be relevant in making a prediction about an individual's response to a given treatment. Examples include information about the genetic sequence contained in the genome of cells taken from an individual, information about the genetic sequence expressed in RNA transcribed from the genome of an individual's cell, the amount of expression of transcripts of genomic sequences, which can be reflected in the values of the corresponding RNA transcript or its protein product, or the cell types present in the sample. In one example, where the sample contains tumor tissue or cells from an individual, such information may indicate the characteristics of the tumor cells, ie. cells within the modified genomic sequence or sequences as compared to the individual's normal population of non-tumor cells or a reference genome referred to in the concept of genetic sequencing. Oncogenesis may result from one or more nucleotide sequence and/or multiple sequence changes in genomic DNA. In some cases, for example, the accumulation of several such sequence modifications may collectively function to convert a non-diseased cell into a tumor cell. In other cases, the initial accumulation of one or more such modifications in a cell may predispose the cell to further accumulation of such modifications. In still other cases, the proliferation of such modifications in the cell may not mean that any particular modification is directly involved in the development of the tumor or is responsible for it. Rather, the oncogenic process may lead to some modifications that directly cause the cell to transform into a tumor cell, but may also create other modifications that do not.

[0036] Таким образом, опухолевые клетки некоторых индивидов могут иметь большое количество таких модификаций последовательностей геномной ДНК, тогда как у других индивидов их может быть немного. Из них некоторые могут приводить к транскриптам или белковым продуктам с аминокислотными последовательностями, измененными в результате геномной модификации, например, когда модификация последовательности ДНК в геномной ДНК приводит к продуцированию белка или молекулы ДНК, имеющей последовательность, которая отличается от той, которая была бы получена, если бы модификация не произошла. Такие модификации называют несинонимичными мутациями. Другие модификации могут быть модификациями некодирующей ДНК, или могут быть модификациями кодирующей ДНК, которые не изменяют аминокислотные последовательности белков. Например, модификации интронных последовательностей или нетранскрибированной ДНК могут не приводить к белковым продуктам, аминокислотная последовательность которых отличается от аминокислотной последовательности белков, полученной из генома, не имеющего такой же модификации. Такие модификации называют синонимичными мутациями. Таким образом разные опухоли могут содержать разные общие количества модификаций геномной ДНК, в том числе разные количества несинонимичных мутаций, разные количества синонимичных мутаций или разные количества и тех, и других (или одинаковое общее количество геномных мутаций, но разные количества синонимичных мутаций и разные количества несинонимичных мутаций). Количество мутаций, содержащихся в клетке, называют ее мутационной нагрузкой или общей мутационной нагрузкой, тогда как общее количество несинонимичных мутаций, содержащихся в ней, называют ее несинонимичной мутационной нагрузкой, а количество синонимичных мутаций, содержащихся в ней, называют ее синонимичной мутационной нагрузкой.[0036] Thus, some individuals' tumor cells may have a large number of such genomic DNA sequence modifications, while other individuals may have few. Of these, some may result in transcripts or protein products with amino acid sequences altered by genomic modification, such as where modification of a DNA sequence in genomic DNA results in the production of a protein or DNA molecule having a sequence that differs from that which would be obtained, if the modification had not taken place. Such modifications are called non-synonymous mutations. Other modifications may be non-coding DNA modifications, or may be coding DNA modifications that do not change the amino acid sequences of the proteins. For example, modifications to intron sequences or untranscribed DNA may not result in protein products whose amino acid sequence differs from the amino acid sequence of proteins derived from a genome not having the same modification. Such modifications are called synonymous mutations. Thus, different tumors may contain different total numbers of genomic DNA modifications, including different numbers of nonsynonymous mutations, different numbers of synonymous mutations, or different amounts of both (or the same total number of genomic mutations, but different numbers of synonymous mutations and different numbers of nonsynonymous mutations). mutations). The number of mutations contained in a cell is called its mutation load or total mutation load, while the total number of non-synonymous mutations contained in it is called its non-synonymous mutation load, and the number of synonymous mutations contained in it is called its synonymous mutation load.

[0037] Превращение клетки из неопухолевой в опухолевую может соответствовать накоплению таких модификаций в геномной ДНК. Такое накопление может быть накоплением синонимичных мутаций, несинонимичных мутаций или мутаций обоих типов. Так или иначе, общая мутационная нагрузка может возрастать, приводя к началу, развитию и последующему превращению неопухолевой клетки в опухолевую клетку. Кроме того, мутационная нагрузка опухолевой клетки может влиять на вероятность того, будет ли ингибитор контрольной точки эффективным в стимуляции противоопухолевого ответа иммунной системой. Чем больше мутаций содержит опухолевая клетка, тем больше шанс, что подавление ингибирования контрольной точки может разингибировать распознавание ее иммунной системой как больной клетки и атаковать ее. В частности, несинонимичная опухолевая мутационная нагрузка может быть положительно коррелирована со способностью ингибирования контрольной точки разингибировать противоопухолевый иммунный ответ. Белки с мутированными аминокислотными последовательностями, продуцированные после несинонимичных мутаций, могут быть идентифицированы в клетках как патологические и присутствующие на мембранах клеток в качестве сигнала болезненного состояния, имеющего место внутри клетки. Например, опухоли могут экспрессировать белки с мутированными аминокислотными последовательностями, называемыми неоантигенами. Опухолевые клетки, экспрессирующие такие неоантигены, могут экспрессировать мутированные фрагменты таких неоантигенов на своих клеточных мембранах.[0037] The transformation of a cell from a non-tumor to a tumor may correspond to the accumulation of such modifications in the genomic DNA. Such an accumulation may be an accumulation of synonymous mutations, non-synonymous mutations, or both types of mutations. One way or another, the total mutation load can increase, leading to the onset, development, and subsequent transformation of a non-tumor cell into a tumor cell. In addition, the mutation load of the tumor cell may influence the likelihood that a checkpoint inhibitor will be effective in stimulating an antitumor response by the immune system. The more mutations a tumor cell contains, the greater the chance that inhibition of checkpoint inhibition can uninhibit the immune system from recognizing it as a diseased cell and attack it. In particular, a non-synonymous tumor mutation load can be positively correlated with the ability of checkpoint inhibition to disinhibit the antitumor immune response. Proteins with mutated amino acid sequences produced after non-synonymous mutations can be identified in cells as pathological and present on cell membranes as a signal of a disease state occurring within the cell. For example, tumors can express proteins with mutated amino acid sequences called neoantigens. Tumor cells expressing such neoantigens may express mutated fragments of such neoantigens on their cell membranes.

[0038] Такое представление неоантигенов может стимулировать распознавание иммунной системой того, что клетка больна (например, опухолевая клетка), и способствовать нацеленному разрушению таких клеток иммунной системой. Однако противодействующий процесс в опухолях может использовать путь контрольной точки для избежания обнаружения иммунной системой. Таким образом, может ли ингибитор контрольной точки помочь в улучшении иммуноонкологического лечения, может зависеть от опухолевой мутационной нагрузки. Более высокая нагрузка может соответствовать более высокому уровню представления неоантигенов, что повышает шансы стимулированной противоопухолевой иммуногенности при оказании лечения ингибированием контрольной точки. Более высокая общая мутационная нагрузка может означать более высокую экспрессию неоантигенов в том смысле, что в среднем более высокая общая мутационная нагрузка может означать более высокую несинонимичную мутационную нагрузку. Кроме того, более высокая несинонимичная мутационная нагрузка опухоли может также означать более высокую экспрессию и, следовательно, более высокую вероятность того, что ингибирование контрольной точки будет эффективным. Также возможно, что синонимичная мутационная нагрузка опухоли может быть коррелирована с отвечаемостью на ингибирование контрольной точки, и/или что некоторые комбинации синонимичной и несинонимичной опухолевой мутационной нагрузки, например, которые могут быть отражены в общей мутационной нагрузке, могут коррелировать с отвечаемостью на ингибирование контрольной точки. Таким образом, общая мутационная нагрузка, несинонимичная опухолевая мутационная нагрузка, синонимичная опухолевая мутационная нагрузка или любая комбинация двух или более из них может позволять прогнозировать отвечаемость контрольной точки и может быть признаком или признаками, включаемыми в способ машинного обучения, как описано в настоящем документе.[0038] This presentation of neoantigens can stimulate recognition by the immune system that a cell is diseased (eg, a tumor cell) and facilitate targeted destruction of such cells by the immune system. However, an opposing process in tumors can use the checkpoint pathway to avoid detection by the immune system. Thus, whether a checkpoint inhibitor can help improve immuno-oncological treatment may depend on tumor mutation load. A higher load may correspond to a higher level of presentation of neoantigens, which increases the chances of stimulated antitumor immunogenicity when treated with checkpoint inhibition. A higher total mutation load may mean higher neoantigen expression in the sense that, on average, a higher total mutation load may mean a higher non-synonymous mutation load. In addition, a higher non-synonymous mutation load of a tumor may also mean higher expression and therefore a higher likelihood that checkpoint inhibition will be effective. It is also possible that synonymous tumor mutation load may be correlated with checkpoint inhibition responsiveness, and/or that some combinations of synonymous and non-synonymous tumor mutation load, for example, which may be reflected in total mutation load, may be correlated with checkpoint inhibition responsiveness. . Thus, total mutation load, non-synonymous tumor mutation load, synonymous tumor mutation load, or any combination of two or more of these may be predictive of checkpoint response and may be a feature or features included in a machine learning method as described herein.

[0039] Помимо или в дополнение к тому, является ли мутация синонимичной или несинонимичной, также могут присутствовать другие или дополнительные характеристики мутации, и их количество и тип, как и то, являются ли мутация или мутации синонимичными или несинонимичными, могут быть актуальны при прогнозировании отвечаемости на лечение. Например, некоторые мутации, называемые нонстоп-мутациями, представляют собой мутации в пределах стоп-кодона, которые приводят к продукции РНК-продукта, трансляция которого продолжается после того, где она остановилась бы из-за мутированной части транскрипта РНК. Другой формой мутации является мутация со сдвигом рамки считывания, которая включает в себя инсерцию (инсерцию со сдвигом рамки) или делецию (делеция со сдвигом рамки) некоторого количества непрерывно следующих нуклеотидов, которое не делится на три (например, инсерцию или делецию одного нуклеотида), приводящую к сдвигу последовательности прочтения кодонов, возникающему таким образом при рекрутинге разных молекул тРНК во время трансляции получающегося в результате транскрипта РНК, и, следовательно, к изменению аминокислотных последовательностей транслированного белка. Другие мутации могут представлять собой мутации сайта сплайсинга, которые происходят на или возле сайтов сплайсинга, модифицируя тем самым нормальный сплайсинг мРНК и приводя к модифицированным транскриптам РНК, Или мутация может быть миссенс-мутацией, в которой один нуклеотид изменяется таким образом, что содержащий его кодон изменяется так, чтобы рекрутировать другие виды тРНК во время трансляции с продуцированием тем самым белка с другой аминокислотной последовательностью.[0039] In addition to or in addition to whether a mutation is synonymous or non-synonymous, other or additional characteristics of the mutation may also be present, and their number and type, as well as whether the mutation or mutations are synonymous or non-synonymous, may be relevant in predicting response to treatment. For example, some mutations, called non-stop mutations, are mutations within a stop codon that result in the production of an RNA product whose translation continues past where it would have stopped due to a mutated portion of the RNA transcript. Another form of mutation is a frameshift mutation, which involves an insertion (frameshift insertion) or deletion (frameshift deletion) of a number of contiguous nucleotides that is not divisible by three (for example, a single nucleotide insertion or deletion), leading to a shift in the codon reading sequence, thus arising from the recruitment of different tRNA molecules during translation of the resulting RNA transcript, and, consequently, to a change in the amino acid sequences of the translated protein. Other mutations may be splice site mutations that occur at or near splice sites, thereby modifying normal mRNA splicing and resulting in modified RNA transcripts, Or the mutation may be a missense mutation in which one nucleotide is changed such that the codon containing it is modified to recruit other types of tRNA during translation, thereby producing a protein with a different amino acid sequence.

[0040] Другой возможной мутацией может быть мутация инициации, которая представляет собой мутацию сайта инициации транскрипции или инициирующего кодона, приводящую к изменению места начала транскрипции или трансляция, соответственно. Например, мутация сайта инициации может предотвратить инициирование транскрипции с этого сайта инициации. Или, мутация может создавать сайт инициации транскрипции, который ранее отсутствовал. Мутация сайта инициации транскрипции может привести к транскрипции РНК-транскрипта, который, хотя и имеет другую длину, чем была бы в противном случае, находится внутри той же рамки считывания, что и транскрипт, продуцированный в отсутствии мутации, или который может при этом находиться вне рамки считывания. Аналогичные мутации могут происходить также с инициирующим кодоном, приводя к транскрипции РНК-продукта, из которого не происходит инициирования трансляции, или где инициирование трансляции происходит оттуда, откуда она ранее не инициировалась. Такие мутации стоп-кодона тоже могут быть внутри рамки считывания или вне рамки считывания. Или, мутация может быть нонсенс-мутацией, т.е. мутацией, которая приводит к транскрипту РНК с преждевременным стоп-кодоном. Любая из вышеупомянутых мутаций может быть однонуклеотидным полиморфизмом (ОНП). Любые одна или более мутаций вышеуказанных типов могут быть признаками, имеющими отношение к прогнозированию отвечаемости индивида на данное лечение, такое как с помощью данного ингибитора точки контроля.[0040] Another possible mutation may be an initiation mutation, which is a mutation of the transcription initiation site or initiation codon, resulting in a change in the transcription start site or translation, respectively. For example, mutation of an origin site may prevent transcription from being initiated from that origin site. Or, the mutation may create a transcription initiation site that was previously absent. Mutation of the transcription initiation site can result in the transcription of an RNA transcript which, although of a different length than it would otherwise be, is within the same reading frame as the transcript produced in the absence of the mutation, or which may still be outside reading frames. Similar mutations can also occur at the initiation codon, resulting in the transcription of an RNA product from which translation is not initiated, or where translation is initiated from where it was not previously initiated. Such stop codon mutations can also be in-frame or out-of-frame. Or, the mutation could be a nonsense mutation, i.e. a mutation that results in an RNA transcript with a premature stop codon. Any of the above mutations may be a single nucleotide polymorphism (SNP). Any one or more mutations of the above types may be features relevant to predicting an individual's response to a given treatment, such as with a given checkpoint inhibitor.

[0041] В другом примере возможность прогнозирования отвечаемости на ингибитор контрольной точки может обеспечивать величина инфильтрации опухоли лимфоцитами. Опухоли содержат не только клетки, которые трансформированы из неопухолевых клеток в опухолевые, но и другие, нетрансформированные клетки. В число примеров входят клетки иммунной системы, которые играют или могут играть роль в стимулировании иммунного ответа против трансформированных клеток внутри опухоли. Иммунные клетки, в частности, лимфоциты, которые смешались с трансформированными клетками в опухоли, называют опухолеинфильтрующими лимфоцитами. Уровни опухолеинфильтрующих лимфоцитов и опухолеинфильтрующие лимфоциты, экспрессирующие разные маркеры, которые служат в качестве идентификаторов фенотипа лимфоцитов, могут позволять прогнозировать, будет ли субъект, у которого был взят образец опухоли, отвечать на ингибирование контрольной точки. Поскольку опухоль является гетерогенной смесью, например, опухолевых клеток и опухолеинфильтрующих лимфоцитов, было бы целесообразно различать экспрессию маркера лимфоцитов на опухолеинфильтрующих лимфоцитах, присутствующих в образце, и маркера лимфоцитов, потенциально экспрессируемого на других клетках в образце опухоли, таких как трансформированные опухолевые клетки.[0041] In another example, the ability to predict response to a checkpoint inhibitor can be provided by the amount of tumor infiltration by lymphocytes. Tumors contain not only cells that have been transformed from non-tumor cells to tumor cells, but also other, non-transformed cells. Examples include cells of the immune system that play or may play a role in stimulating an immune response against transformed cells within a tumor. Immune cells, in particular lymphocytes, that have mixed with transformed cells in tumors are called tumor-infiltrating lymphocytes. Levels of tumor filtering lymphocytes and tumor filtering lymphocytes expressing various markers that serve as identifiers of the lymphocyte phenotype can be predictive of whether a subject from whom a tumor sample has been taken will respond to checkpoint inhibition. Since a tumor is a heterogeneous mixture of, for example, tumor cells and tumor-infiltrating lymphocytes, it would be useful to distinguish between the expression of a lymphocyte marker on tumor-infiltrating lymphocytes present in the sample and a lymphocyte marker potentially expressed on other cells in the tumor sample, such as transformed tumor cells.

[0042] Например, опухолеинфильтрующие лимфоциты могут экспрессировать транскрипты (например, РНК) генов, кодирующих кластер дифференцировки 8 (CD8), кластер дифференцировки 4 (CD4) или кластер дифференцировки 19 (CD19), каждый из которых может служить в качестве маркера фенотипа лимфоцитов при экспрессировании в клетке. Таким образом, уровни экспрессии CD8, CD4, CD19 или любой комбинации любых двух или более из них, могут быть определены из образца опухоли. Поэтому, например, из образца может быть, соответственно, определено количество РНК. Поскольку такое определение может отражать не только экспрессию их опухолеинфильтрующими лимфоцитами, но и другими клетками в образце опухоли, такими как трансформированные опухолевые клетки, было бы целесообразно определять, какая часть обнаруженной величины их экспрессии обусловлена опухолеинфильтрующими лимфоцитами, а какая нет. Для этого может быть применен процесс деконволюции, в результате чего может быть пределен уровень экспрессии опухолеинфильтрующими лимфоцитами по сравнению с экспрессией другими клетками. Существуют различные варианты выполнения деконволюции опухолеинфильтрующих лимфоцитов, в том числе описанный, например, в работах под авторством Gaujoux и др. (2013), «CellMix: a comprehensive toolbox for gene expression deconvolution». Bioinformatics 29:2211-2212, и под авторством Finotello и др. (2018), «Quantifying tumor-infiltrating immune cells from transcriptomics data», Cancer Immunology, Immunotherapy 67:1031-1040. В качестве не имеющего ограничительного характера примера анализ деконволюции может быть выполнен на языке программирования R.[0042] For example, tumor-infiltrating lymphocytes can express transcripts (e.g., RNA) of genes encoding cluster of differentiation 8 (CD8), cluster of differentiation 4 (CD4), or cluster of differentiation 19 (CD19), each of which can serve as a marker of lymphocyte phenotype when expression in the cell. Thus, expression levels of CD8, CD4, CD19, or any combination of any two or more of these, can be determined from a tumor sample. Therefore, for example, the amount of RNA can be determined from a sample, respectively. Since such a determination may reflect not only their expression by tumor-infiltrating lymphocytes, but also by other cells in the tumor sample, such as transformed tumor cells, it would be reasonable to determine what part of the detected amount of their expression is due to tumor-infiltrating lymphocytes and what is not. For this, a deconvolution process can be applied, whereby the level of expression by tumor-infiltrating lymphocytes can be capped compared to expression by other cells. There are various options for performing deconvolution of tumor-infiltrating lymphocytes, including one described, for example, in Gaujoux et al. (2013), "CellMix: a comprehensive toolbox for gene expression deconvolution". Bioinformatics 29:2211-2212, and Finotello et al. (2018), "Quantifying tumor-infiltrating immune cells from transcriptomics data", Cancer Immunology, Immunotherapy 67:1031-1040. As a non-limiting example, deconvolution analysis can be performed in the R programming language.

[0043] В частности, посредством процесса, называемого деконволюцией опухолеинфильтрующих лимфоцитов, уровень экспрессии данного лимфоцитарного транскрипта (например, CD8, CD4 или CD19) может быть использован для определения процента лимфоцитарных клеток в образце опухоли, которые экспрессируют CD4, или CD8, или CD19. То есть, деконволюция опухолеинфильтрующих лимфоцитов может не просто показывать величину лимфоцитарной инфильтрации опухоли, представленной величиной данного лимфоцитарного транскрипта, который может быть идентифицирован в опухоли, но и указывать, на какой тип лимфоцита, идентифицированный по видам экспрессируемого транскрипта, какой процент общей инфильтрации опухоли приходится. Общая величина лимфоцитарной инфильтрации опухоли может быть актуальна при прогнозировании того, будет ли индивид отвечать на данное лечение, такое как ингибирование контрольной точки, и конкретный вклад лимфоцитарной инфильтрации опухоли, внесенный лимфоцитами, экспрессирующими данный транскрипт (CD4, или CD8, или CD19), тоже может быть актуален при составлении такого прогноза.[0043] In particular, through a process called tumor-infiltrating lymphocyte deconvolution, the level of expression of a given lymphocytic transcript (e.g., CD8, CD4, or CD19) can be used to determine the percentage of lymphocyte cells in a tumor sample that express CD4, or CD8, or CD19. That is, the deconvolution of tumor-infiltrating lymphocytes can not only show the amount of lymphocytic infiltration of the tumor, represented by the value of a given lymphocytic transcript that can be identified in the tumor, but also indicate which type of lymphocyte, identified by the types of the expressed transcript, what percentage of the total tumor infiltration falls. The overall magnitude of tumor lymphocytic infiltration may be relevant in predicting whether an individual will respond to a given treatment, such as checkpoint inhibition, and the specific contribution of tumor lymphocytic infiltration made by lymphocytes expressing a given transcript (CD4 or CD8 or CD19) is also may be relevant in making such a forecast.

[0044] При прогнозировании того, будет ли индивид отвечать на ингибирование контрольной точки, могут быть актуальны различные другие признаки. Такие признаки могут быть в целом классифицированы в соответствии с процессами, теоретически связанными с тем, может ли ингибитор контрольной точки быть эффективным в стимулировании или усилении онкоиммунологического ответа, или нет. Например, некоторые признаки могут относиться к тому, могут ли, и в какой степени, опухолевые клетки с большей или меньшей вероятностью выражать антигены мутированных белков на поверхностях своих клеток и тем самым увеличивать шансы противоопухолевого иммунного ответа. В число таких уже рассмотренных признаков входят типы опухолевой мутационной нагрузки, такие как, например, общая опухолевая мутационная нагрузка или несинонимичная опухолевая мутационная нагрузка. В число других примеров входят уровни экспрессии различных белков или транскриптов генов, кодирующих белки, известные участием в представлении антигена, для стимуляции иммунного ответа. В число таких не имеющих ограничительного характера примеров входят бета-2-микроглобулин (В2М), бета-10-субъединица протеасомы (PSMB10), переносчик антигенных пептидов 1 (ТАР1), транспортер антигенных пептидов 2 (ТАР2), лейкоцитарный антиген человека A (HLA-A), главный комплекс гистосовместимости, класс I, В (HLA-B) главный комплекс гистосовместимости, класс I, С (HLA-C), главный комплекс гистосовместимости, класс II, DQ альфа-1 (HLA-DQA1) и антиген гистосовместимости HLA класса II, бета-цепь DRB1 (HLA-DRB1). Известно, что эти генные продукты играют роль на разных этапах в представлении фрагментов белков, или антигенов, или поверхности клетки и распознавании иммунными Т-клетками.[0044] Various other features may be relevant in predicting whether an individual will respond to checkpoint inhibition. Such features can be generally classified according to processes theoretically related to whether a checkpoint inhibitor can be effective in stimulating or enhancing an oncoimmunological response or not. For example, some indications may relate to whether, and to what extent, tumor cells are more or less likely to express mutated protein antigens on their cell surfaces and thereby increase the chances of an antitumor immune response. Such features already discussed include types of tumor mutation load, such as, for example, total tumor mutation load or non-synonymous tumor mutation load. Other examples include expression levels of various proteins or gene transcripts encoding proteins known to be involved in antigen presentation to stimulate an immune response. Such non-limiting examples include beta-2-microglobulin (B2M), proteasome beta-10 subunit (PSMB10), antigenic peptide transporter 1 (TAP1), antigenic peptide transporter 2 (TAP2), human leukocyte antigen A (HLA -A), major histocompatibility complex class I, B (HLA-B) major histocompatibility complex class I, C (HLA-C), major histocompatibility complex class II, DQ alpha-1 (HLA-DQA1) and histocompatibility antigen HLA class II, DRB1 beta chain (HLA-DRB1). These gene products are known to play a role at various stages in presentation of protein fragments or antigens or cell surface and recognition by immune T cells.

[0045] Уровни экспрессии любого одного, или любой комбинации двух или более, или любого из этих генных продуктов в опухоли могут указывать уровни экспрессии антигена на поверхности опухолевых клеток. Например, экспрессия таких продуктов может влиять на степень представления белковых продуктов геномной ДНК, содержащей несинонимичные мутации на поверхности клеток. Когда экспрессия повышает представление антигена, вероятность представления мутированных антигенов, которые Т-клетки, по-видимому, будут распознавать как означающие больную клетку и, следовательно, запускать противоопухолевый иммунный ответ, может повысить шансы того, что данный ингибитор контрольной точки может быть эффективным в продуцировании ответа у субъекта. Таким образом, когда уровень экспрессии любого или комбинации двух или более вышеуказанных продуктов положительно или отрицательно коррелирован со степенью представления антигена на клетках в образце опухоли, такой уровень экспрессии может быть положительно или отрицательно коррелирован, соответственно, с вероятностью того, что субъект, у которого были взяты образцы опухоли, будет отвечать на данный ингибитор контрольной точки.[0045] The expression levels of any one, or any combination of two or more, or any of these gene products in a tumor may indicate the levels of antigen expression on the surface of the tumor cells. For example, the expression of such products can influence the extent to which protein products are represented by genomic DNA containing non-synonymous mutations on the cell surface. When expression increases antigen presentation, the likelihood of presenting mutated antigens that T cells are likely to recognize as signifying a diseased cell and therefore trigger an antitumor immune response may increase the chances that a given checkpoint inhibitor may be effective in producing subject's response. Thus, when the level of expression of any or a combination of two or more of the above products is positively or negatively correlated with the degree of presentation of the antigen on cells in the tumor sample, such expression level may be positively or negatively correlated, respectively, with the likelihood that the subject who had tumor samples taken will respond to a given checkpoint inhibitor.

[0046] Другой тип признака может включать уровень экспрессии Т-клеток или NK-клеток, присутствующих в образце опухоли, взятом у субъекта, и который тоже могут быть актуален для прогнозирования отвечаемости на лечение, такое как ингибирование контрольной точки. Например, уровень экспрессии антигена гистосовместимости HLA класса I, альфа-цепь Е (HLA-E), гранулярных белков естественной клетки-киллера 7 (NKG7), хемокиноподобного рецептора 1 (CMKLR1) или любой комбинации двух или более из них, может также позволять прогнозировать ответ на ингибитор контрольной точки. Таким образом, признак может включать меру экспрессии одного или более из этих продуктов или, соответственно, РНК-транскриптов.[0046] Another type of feature may include the level of expression of T cells or NK cells present in a tumor sample taken from a subject, and which may also be relevant for predicting response to treatment, such as checkpoint inhibition. For example, the level of expression of the histocompatibility antigen HLA class I, alpha chain E (HLA-E), natural killer cell 7 granular proteins (NKG7), chemokine-like receptor 1 (CMKLR1), or any combination of two or more of these, may also predict response to a checkpoint inhibitor. Thus, a feature may include a measure of the expression of one or more of these products or, respectively, RNA transcripts.

[0047] Другой тип признака может относиться к наличию или уровням экспрессии белков или их транскриптов, которые связаны или указывают на усиленную цитолитическую активность, такую, которая может быть стимулирована противоопухолевым иммунным ответом, или которая может ингибировать такую активность. Примерами таких признаков могут быть измерения деконволюции опухолеинфильтрующих лимфоцитов, рассмотренные выше (например, деконволюция инфильтрации опухоли клетками, экспрессирующими кластер дифференцировки 8 (CD8), кластер дифференцировки 4 (CD4) или кластер дифференцировки 19 (CD19)). Другие не имеющие ограничительного характера примеры данной категории признаков могут включать уровни экспрессии гранзима A (GZMA) или перфорина-1 (PRF1) или любую комбинацию двух или более вышеперечисленных признаков.[0047] Another type of feature may relate to the presence or levels of expression of proteins or transcripts thereof that are associated with or indicate enhanced cytolytic activity, such as may be stimulated by an antitumor immune response, or which may inhibit such activity. Examples of such features would be the deconvolution measurements of tumor-infiltrating lymphocytes discussed above (eg, deconvolution of tumor infiltration by cells expressing cassette 8 (CD8), cassette 4 (CD4), or cassette 19 (CD19)). Other non-limiting examples of this category of traits may include expression levels of granzyme A (GZMA) or perforin-1 (PRF1), or any combination of two or more of the above.

[0048] Еще одни признаки могут относиться к процессам или функциям в ингибировании контрольной точки противоопухолевой иммунной отвечаемости. Уровни экспрессии различных белковых продуктов или их транскриптов участников ингибирования контрольной точки в пределах образца опухоли субъекта могут быть актуальны в прогнозировании того, будет ли субъект отвечать на лечение с применением онкотерапии, такой как лечение ингибированием контрольной точки. Примеры таких признаков могут включать экспрессию, самих или их РНК-транскриптов, цитотоксического Т-лимфоцит-ассоциированного белка 4 (CTLA4), белка программируемой клеточной смерти 1 (PD1), лиганда 1 программируемой смерти (PDL1), лиганда 2 программируемой клеточной смерти 1 (PDL2), гена активации лимфоцитов 3 (LAG3), Т-клеточного иммунорецептора с доменами Ig и ITIM (TIGIT), кластера дифференцировки 276 (CD276) или любых двух или более из вышеперечисленных.[0048] Still other features may relate to processes or functions in inhibition of the antitumor immune response checkpoint. Expression levels of various protein products or their transcripts of checkpoint inhibition participants within a subject's tumor sample may be relevant in predicting whether a subject will respond to cancer therapy, such as checkpoint inhibition treatment. Examples of such features may include expression of, or their RNA transcripts, cytotoxic T-lymphocyte-associated protein 4 (CTLA4), programmed cell death protein 1 (PD1), programmed death ligand 1 (PDL1), programmed cell death ligand 2 1 ( PDL2), lymphocyte activation gene 3 (LAG3), T-cell immunoreceptor with Ig and ITIM domains (TIGIT), cluster of differentiation 276 (CD276), or any two or more of the above.

[0049] Для прогнозирования того, будет ли индивид отвечать на лечение, могут быть актуальные другие признаки, включая экспрессию белков или их РНК-транскриптов, относящихся к активности интерферона-γ, таких как продукты, экспрессия которых следует за высвобождением и, вследствие этого, активностью интерферона-γ на рецепторе. Примеры таких признаков могут включать экспрессию, самих или их РНК-транскриптов, хемокинового (С-С мотива) лиганда 5 (CCL5), CD27, хемокинового (С-Х-С мотива) лиганда 9 (CXCL9), хемокинового (С-Х-С мотива) рецептора 6 лиганда (CXCR6), индоламин-2,3-диоксигеназы (IDO), сигнального трансдуктора и активатора транскрипции 1 (STAT1) или любой комбинации двух или более вышеперечисленных. Другие индикаторы активности интерферона-γ могут тоже позволять прогнозировать отвечаемость на лечение, такое как ингибирование контрольной точки.[0049] To predict whether an individual will respond to treatment, there may be relevant other features, including the expression of proteins or their RNA transcripts related to interferon-γ activity, such as products whose expression follows release and, as a result, interferon-γ activity at the receptor. Examples of such features may include expression of, or their RNA transcripts, chemokine (C-C motif) ligand 5 (CCL5), CD27, chemokine (C-X-C motif) ligand 9 (CXCL9), chemokine (C-X- C motif) ligand receptor 6 (CXCR6), indolamine-2,3-dioxygenase (IDO), signal transducer and transcription activator 1 (STAT1), or any combination of two or more of the above. Other indicators of interferon-γ activity may also predict response to treatment, such as checkpoint inhibition.

[0050] При прогнозировании того, будет ли индивид отвечать на лечение, могут быть актуальны другие признаки, включая экспрессию белков или их РНК-транскриптов, относятся к супрессорным клеткам миелоидного происхождения или регуляторным Т-клеткам (Treg), которые могут оказывать иммуносупрессивное действие на противоопухолевую иммунную отвечаемость и снижать или предотвращать эффективность иммуноонкологических терапий. Примеры таких признаков могут включать экспрессию из взятого у субъекта образца опухоли 3-фукозил-N-ацетил-лактозамина (CD15), альфа-цепи рецептора интерлейкина-2 (CD25), сиглека-3 (CD33), кластера дифференцировки 39 (CD39), кластера дифференцировки (CD118), транскрипционного фактора forkhead box Р3 (FOXP3) или любой комбинации двух или более вышеперечисленных. Кроме того, для прогнозирования того, будет ли индивид отвечать на лечение ингибитором контрольной точки или другие противораковые терапии, также могут быть актуальны уровни экспрессии опухолью других видов белка или соответствующих РНК-транскриптов, указывающих на присутствие таких клеток или их активность.[0050] Other features may be relevant in predicting whether an individual will respond to treatment, including the expression of proteins or their RNA transcripts, refer to myeloid-derived suppressor cells or regulatory T cells (Treg), which may have an immunosuppressive effect on antitumor immune response and reduce or prevent the effectiveness of immuno-oncological therapies. Examples of such features may include expression from a subject's tumor sample of 3-fucosyl-N-acetyl-lactosamine (CD15), interleukin-2 receptor alpha chain (CD25), Siglec-3 (CD33), cluster of differentiation 39 (CD39), differentiation cassette (CD118), transcription factor forkhead box P3 (FOXP3), or any combination of two or more of the above. In addition, to predict whether an individual will respond to checkpoint inhibitor treatment or other anti-cancer therapies, levels of tumor expression of other protein species or corresponding RNA transcripts indicative of the presence of such cells or their activity may also be relevant.

[0051] Для создания прогноза в отношении того, будет ли индивид отвечать на лечение с применением данного противоракового лечения включая лечение ингибитором контрольной точки, могут быть актуальны любые один или более из любых вышеуказанных признаков. Любой из этих признаков может иметь отношение или заключать в себе геномную информацию об опухоли субъекта, образец которой был взят и протестирован для определения признаков. В данном случае термин «геномная» используют для включения не только информации, относящейся к последовательности нуклеотидов в геномной ДНК (такой как, например, признаки, относящиеся к мутационной нагрузке). В данном случае геномная информация, представленная измерениями признаков, также включает измерения уровней экспрессии различных продуктов транскрипции генома или белковых продуктов, продуцированных из таких транскриптов. Таким образом, уровни экспрессии любого из различных белковых продуктов, описанных выше, или других белковых продуктов, участвующих в путях, подобных специально идентифицированным, или, соответственно, уровни экспрессии РНК-транскриптов могут быть включены в геномную информацию, так как она относится к прогностическим признакам, как описано в настоящем документе Кроме того, в геномную информацию, относящуюся к признакам, могут быть включены признаки измерения деконволюции опухолеинфильтрующих лимфоцитов.[0051] Any one or more of any of the above indications may be relevant to predict whether an individual will respond to treatment with a given cancer treatment, including treatment with a checkpoint inhibitor. Any of these features may be related to or include genomic information about the subject's tumor that was sampled and tested for features. In this case, the term "genomic" is used to include not only information related to the sequence of nucleotides in genomic DNA (such as, for example, features related to mutation load). In this case, the genomic information represented by trait measurements also includes measurements of the expression levels of various transcription products of the genome or protein products produced from such transcripts. Thus, expression levels of any of the various protein products described above, or other protein products involved in pathways like those specifically identified, or, accordingly, expression levels of RNA transcripts, can be included in genomic information as it relates to prognostic features. , as described herein. In addition, traits measuring the deconvolution of tumor-infiltrating lymphocytes can be included in the trait-related genomic information.

[0052] В дополнение к измерениям отдельных признаков признаками, имеющими отношение к прогнозированию отвечаемости на ингибирование контрольной точки или другое лечение рака, также могут быть структуры коррелированных уровней экспрессии признаков, которые, как известно или предположительно, относятся к данному пути, или функции, или типу клеток. Например, из вышеперечисленных признаков могут быть идентифицированы группы некоторых общих особенностей путей, или клеточной или физиологической отвечаемости, или индикаций клеточного фенотипа, и на основе измерения отдельных признаков может быть определено, являются ли они, как группа, скоординированно избыточно или недостаточно регулированными или, в более общем смысле, экспрессированными или иным образом присутствующими как группа на скоординированно высоком или низком уровне в образце опухоли данного субъекта. В некоторых примерах мера такого обобщенного измерения сгруппированных признаков сама может быть введена в качестве признака в дополнение к отдельным признакам для тренировки машинно-обучаемого классификатора, прогнозирующего отвечаемость субъекта на ингибирование контрольной точки или другое лечение, либо на то и другое. В настоящем документе такие группировки признаков для получения дополнительного признака, представляющего уровень экспрессии и т.д. группировки в целом, называют набором генов. Таким образом, набор генов может включать комбинаторную меру, представляющую корреляционную индикацию присутствия геномной мутации, уровней экспрессии конкретных РНК-транскриптов, наличия идентифицированных типов клеток и т.д.[0052] In addition to measures of individual traits, traits relevant to predicting response to checkpoint inhibition or other cancer treatment may also be patterns of correlated expression levels of traits known or suspected to be related to a given pathway or function, or cell type. For example, from the above traits, groups of some common pathway features, or cellular or physiological responsiveness, or indications of cellular phenotype, can be identified, and whether they, as a group, are coordinately over- or under-regulated, or, in more generally, expressed or otherwise present as a group at a coordinated high or low level in a tumor sample of a given subject. In some examples, a measure of such a generalized measure of grouped features may itself be introduced as a feature in addition to individual features to train a machine learning classifier predictive of a subject's response to checkpoint inhibition or another treatment, or both. Herein, such groupings of features to obtain an additional feature representing the level of expression, etc. grouping as a whole is called a set of genes. Thus, a set of genes may include a combinatorial measure representing a correlation indication of the presence of a genomic mutation, the expression levels of specific RNA transcripts, the presence of identified cell types, and so on.

[0001] [0053] В качестве не имеющего ограничительного характера примера некоторые из вышеуказанных признаков относятся к представлению антигена, посредством которого клетки, например, опухолевые, экспрессируют белковые фрагменты на своих клеточных мембранах для контроля иммунной системой. Как описано выше, представление антигена может увеличивать вероятность стимулирования противоопухолевого иммунного ответа, например, с помощью ингибитора контрольной точки. Некоторые примеры таких характеристик могут включать общую мутационную нагрузку, несинонимичную мутационную нагрузку или другую мутационную нагрузку (нагрузку нонстоп-мутации, нагрузку мутации со сдвигом рамки считывания (инсерционную, делеционную или каждую из них), нагрузку мутации сайта сплайсинга, нагрузку миссенс-мутации, нагрузку мутации инициации (в рамке считывания, вне рамки считывания или каждая из них), нагрузку нонсенс-мутации, нагрузку мутации инициирующего кодона (включая ОНП инициирующего кодона или другую), нагрузку инсерционной мутации в рамке считывания, нагрузку делеционной мутации в рамке считывания или другую нагрузку ОНП-мутации или любую комбинацию двух или более вышеперечисленных. В число других не имеющих ограничительного характера примеров признаков, относящихся к представлению антигена, входят бета-2-микроглобулин (В2М), бета-10-субъединица протеасомы (PSMB10), переносчик антигенных пептидов 1 (ТАР1), транспортер антигенных пептидов 2 (ТАР2), лейкоцитарный антиген человека A (HLA-A), главный комплекс гистосовместимости, класс I, В (HLA-B) главный комплекс гистосовместимости, класс I, С (HLA-C), главный комплекс гистосовместимости, класс II, DQ альфа-1 (HLA-DQA1) и антиген гистосовместимости HLA класса II, бета-цепь DRB1 (HLA-DRB1). В дополнение к функциям, связанным с наличием или уровнями экспрессирования и т.д., относящимся к отдельным примерам из числа вышеуказанных признаков, дополнительный признак может представлять степень, в которой некоторые или все из вышеуказанных признаков скоординированно избыточно или недостаточно регулированы или иным образом присутствуют в высоких или низких уровнях в опухоли субъекта (будь то для тренировки машинно-обучаемого классификатора или прогнозирования).[0001] [0053] As a non-limiting example, some of the above features relate to antigen presentation by which cells, such as tumor cells, express protein fragments on their cell membranes for control by the immune system. As described above, antigen presentation can increase the likelihood of stimulating an antitumor immune response, for example with a checkpoint inhibitor. Some examples of such characteristics may include total mutation load, nonsynonymous mutation load, or other mutation load (nonstop mutation load, frameshift mutation load (insertion, deletion, or both), splice site mutation load, missense mutation load, initiation mutations (in-frame, out-of-frame, or each), nonsense mutation load, start codon mutation load (including start codon SNP or other), in-frame insertion mutation load, in-frame deletion mutation load, or other load SNP mutations or any combination of two or more of the above Other non-limiting examples of features related to antigen presentation include beta-2-microglobulin (B2M), proteasome beta-10 subunit (PSMB10), antigenic peptide transporter 1 (TAP1), antigenic peptide transporter 2 (TAP2), human leukocyte antigen A (HLA-A), major histocompatibility complex, class I, B (HLA-B) major histocompatibility complex, class I, C (HLA-C), major class II histocompatibility complex, DQ alpha-1 (HLA-DQA1); and HLA class II histocompatibility antigen, DRB1 beta chain (HLA-DRB1). In addition to functions related to the presence or levels of expression, etc., relating to individual examples of the above features, an additional feature may represent the extent to which some or all of the above features are coordinately over- or under-regulated or otherwise present in high or low levels in the subject's tumor (whether for machine learning classifier training or prediction).

[0054] В качестве еще одного не имеющего ограничительного характера примера некоторые признаки относятся к уровню экспрессии Т-клеток или NK-клеток, присутствующих в образце опухоли, взятом у субъекта, и тоже могут быть актуальны для прогнозирования отвечаемости на лечение, такое как ингибирование контрольной точки. Например, уровень экспрессии антигена гистосовместимости HLA класса I, альфа-цепь Е (HLA-E), гранулярных белков естественной клетки-киллера 7 (NKG7), хемокиноподобного рецептора 1 (CMKLR1) или любой комбинации двух или более из них, может также позволять прогнозировать ответ на ингибитор контрольной точки. В дополнение к функциям, связанным с наличием или уровнями экспрессирования и т.д., относящимся к отдельным примерам из числа вышеуказанных признаков, дополнительный признак может представлять степень, в которой некоторые или все из вышеуказанных признаков скоординированно избыточно или недостаточно регулированы или иным образом присутствуют в высоких или низких уровнях в опухоли субъекта (будь то для тренировки машинно-обучаемого классификатора или прогнозирования).[0054] As another non-limiting example, some features relate to the level of expression of T cells or NK cells present in a tumor sample taken from a subject, and may also be relevant to predicting response to treatment, such as inhibition of control points. For example, the level of expression of the histocompatibility antigen HLA class I, alpha chain E (HLA-E), natural killer cell 7 granular proteins (NKG7), chemokine-like receptor 1 (CMKLR1), or any combination of two or more of these, may also predict response to a checkpoint inhibitor. In addition to functions related to the presence or levels of expression, etc., relating to individual examples of the above features, an additional feature may represent the extent to which some or all of the above features are coordinately over- or under-regulated or otherwise present in high or low levels in the subject's tumor (whether for machine learning classifier training or prediction).

[0055] В качестве еще одного не имеющего ограничительного характера примера некоторые признаки относятся к индикаторам иммунологически стимулируемого цитолиза, например, когда иммунный ответ способствует гибели клеток и лизису клеток, таких как опухолевые клетки, присутствующие в образце опухоли, взятом у субъекта, и которые тоже могут быть актуальны для прогнозирования отвечаемости на лечение, такое как ингибирование контрольной точки. Например, деконволюированная экспрессия CD8, деконволюированная экспрессия CD4, деконволюированная экспрессия CD19 (деконволюция, представляющая пропорциональный вклад экспрессирующих CD8, CD4 и CD19 клеток, соответственно, относительно количества опухолеинфильтрующих лимфоцитов, присутствующих в образце опухоли), уровни экспрессии гранзима А (GZMA) или перфорина-1 (PRF1), или любая комбинация вышеуказанных, или, соответственно, РНК-транскриптов, тоже могут позволять прогнозировать ответ на ингибитор контрольной точки. В дополнение к функциям, связанным с наличием или уровнями экспрессирования и т.д., относящимся к отдельным примерам из числа вышеуказанных признаков, дополнительный признак может представлять степень, в которой некоторые или все из вышеуказанных признаков скоординированно избыточно или недостаточно регулированы или иным образом присутствуют в высоких или низких уровнях в опухоли субъекта (будь то для тренировки машинно-обучаемого классификатора или прогнозирования).[0055] As another non-limiting example, some features refer to indicators of immunologically stimulated cytolysis, for example, when the immune response promotes cell death and lysis of cells, such as tumor cells present in a tumor sample taken from a subject, and which also may be relevant for predicting response to treatment such as checkpoint inhibition. For example, deconvoluted CD8 expression, deconvoluted CD4 expression, deconvoluted CD19 expression (deconvolution representing the proportional contribution of CD8, CD4, and CD19 expressing cells, respectively, relative to the number of tumor-infiltrating lymphocytes present in a tumor sample), levels of granzyme A (GZMA) or perforin- 1 (PRF1), or any combination of the above, or RNA transcripts, respectively, can also predict the response to a checkpoint inhibitor. In addition to functions related to the presence or levels of expression, etc., relating to individual examples of the above features, an additional feature may represent the extent to which some or all of the above features are coordinately over- or under-regulated or otherwise present in high or low levels in the subject's tumor (whether for machine learning classifier training or prediction).

[0056] В качестве еще одного не имеющего ограничительного характера примера некоторые признаки относятся к клеточным и молекулярным процессам, участвующим в функциях ингибирования контрольной точки, присутствующих в образце опухоли, взятом у субъекта, и которые тоже могут быть актуальны для прогнозирования отвечаемости на лечение, такое как ингибирование контрольной точки. Не имеющие ограничительного характера примеры таких признаков могут включать экспрессию, самих или их РНК-транскриптов, цитотоксического Т-лимфоцит-ассоциированного белка 4 (CTLA4), белка программируемой клеточной смерти 1 (PD1), лиганда программируемой смерти 1 (PDL1), лиганда 2 программируемой клеточной смерти 1 (PDL2), гена активации лимфоцитов 3 (LAG3), Т-клеточного иммунорецептора с доменами Ig и ITIM (TIGIT), кластера дифференцировки 276 (CD276) или любых двух или более из вышеперечисленных. В дополнение к функциям, связанным с наличием или уровнями экспрессирования и т.д., относящимся к отдельным примерам из числа вышеуказанных признаков, дополнительный признак может представлять степень, в которой некоторые или все из вышеуказанных признаков скоординированно избыточно или недостаточно регулированы или иным образом присутствуют в высоких или низких уровнях в опухоли субъекта (будь то для тренировки машинно-обучаемого классификатора или прогнозирования).[0056] As another non-limiting example, some features refer to cellular and molecular processes involved in checkpoint inhibition functions present in a tumor sample taken from a subject, and which may also be relevant to predicting response to treatment, such as checkpoint inhibition. Non-limiting examples of such features may include expression of, or their RNA transcripts, cytotoxic T-lymphocyte-associated protein 4 (CTLA4), programmed cell death protein 1 (PD1), programmed death ligand 1 (PDL1), programmed death ligand 2 cell death 1 (PDL2), lymphocyte activation gene 3 (LAG3), T-cell immunoreceptor with Ig and ITIM domains (TIGIT), cluster of differentiation 276 (CD276), or any two or more of the above. In addition to functions related to the presence or levels of expression, etc., relating to individual examples of the above features, an additional feature may represent the extent to which some or all of the above features are coordinately over- or under-regulated or otherwise present in high or low levels in the subject's tumor (whether for machine learning classifier training or prediction).

[0057] В качестве еще одного не имеющего ограничительного характера примера некоторые признаки относятся к индикаторам или клеточным и молекулярным путям, участвующим в активности интерферона-γ, присутствующего в образце опухоли, взятом у субъекта, и которые могут быть тоже актуальны для прогнозирования отвечаемости на лечение, такое как ингибирование контрольной точки. Не имеющие ограничительного характера примеры таких признаков могут включать экспрессию, самих или их РНК-транскриптов, хемокинового (С-С мотива) лиганда 5 (CCL5), CD27, хемокинового (С-Х-С мотива) лиганда 9 (CXCL9), хемокинового (С-Х-С мотива) рецептора 6 (CXCR6), индоламин-2,3-диоксигеназы (IDO), сигнального трансдуктора и активатора транскрипции 1 (STAT1) или любой комбинации двух или более вышеперечисленных. В дополнение к функциям, связанным с наличием или уровнями экспрессирования и т.д., относящимся к отдельным примерам из числа вышеуказанных признаков, дополнительный признак может представлять степень, в которой некоторые или все из вышеуказанных признаков скоординированно избыточно или недостаточно регулированы или иным образом присутствуют в высоких или низких уровнях в опухоли субъекта (будь то для тренировки машинно-обучаемого классификатора или прогнозирования).[0057] As another non-limiting example, some features refer to indicators or cellular and molecular pathways involved in the activity of interferon-γ present in a tumor sample taken from a subject, and which may also be relevant to predicting response to treatment , such as checkpoint inhibition. Non-limiting examples of such features may include expression of, or their RNA transcripts, chemokine (C-C motif) ligand 5 (CCL5), CD27, chemokine (C-X-C motif) ligand 9 (CXCL9), chemokine (C-C motif) ligand 9 (CXCL9), C-X-C motif) receptor 6 (CXCR6), indolamine-2,3-dioxygenase (IDO), signal transducer and transcription activator 1 (STAT1), or any combination of two or more of the above. In addition to functions related to the presence or levels of expression, etc., relating to individual examples of the above features, an additional feature may represent the extent to which some or all of the above features are coordinately over- or under-regulated or otherwise present in high or low levels in the subject's tumor (whether for machine learning classifier training or prediction).

[0058] В качестве еще одного не имеющего ограничительного характера примера некоторые признаки относятся к наличию или активности MDSC или Treg, присутствующей в образце опухоли, взятом у субъекта, и которые тоже могут быть актуальны для прогнозирования отвечаемости на лечение, такое как ингибирование контрольной точки. Не имеющие ограничительного характера примеры таких признаков могут включать экспрессию из взятого о субъекта образца опухоли 3-фукозил-N-ацетил-лактозамина (CD15), альфа-цепи рецептора интерлейкина-2 (CD25), сиглека-3 (CD33), кластера дифференцировки 39 (CD39), кластера дифференцировки (CD118), транскрипционного фактора forkhead box Р3 (FOXP3) или любой комбинации двух или более вышеперечисленных. В дополнение к функциям, связанным с наличием или уровнями экспрессирования и т.д., относящимся к отдельным примерам из числа вышеуказанных признаков, дополнительный признак может представлять степень, в которой некоторые или все из вышеуказанных признаков скоординированно избыточно или недостаточно регулированы или иным образом присутствуют в высоких или низких уровнях в опухоли субъекта (будь то для тренировки машинно-обучаемого классификатора или прогнозирования).[0058] As another non-limiting example, some indications relate to the presence or activity of MDSC or Treg present in a tumor sample taken from a subject, and which may also be relevant to predicting response to treatment, such as checkpoint inhibition. Non-limiting examples of such features may include expression from a subject's tumor sample of 3-fucosyl-N-acetyl-lactosamine (CD15), interleukin-2 receptor alpha chain (CD25), Siglec-3 (CD33), Cluster of Differentiation 39 (CD39), cassette of differentiation (CD118), transcription factor forkhead box P3 (FOXP3), or any combination of two or more of the above. In addition to functions related to the presence or levels of expression, etc., relating to individual examples of the above features, an additional feature may represent the extent to which some or all of the above features are coordinately over- or under-regulated or otherwise present in high or low levels in the subject's tumor (whether for machine learning classifier training or prediction).

[0059] Таким образом, в некоторых примерах могут быть идентифицированы один или более наборов генов, а мера скоординированной или скоррелированной степени излишней или недостаточной регуляции признаков в опухоли субъекта, относящихся к такому набору генов, может быть предоставлена в качестве дополнительного признака для тренировки машинно-обучаемого классификатора или прогнозирования отвечаемости субъекта на ингибирование контрольной точки или другое лечение, либо на то и другое. В число примеров наборов генов входят наборы генов, относящиеся к представлению антигенов, сигнатурам Т-клеток и NK-клеток, индикаторам цитолиза, ингибированию контрольной точки, интерферону-γ и наличию или активности MSDC/Treg. В некоторых случаях один или более наборов генов вместе с одним или более любых других отдельных признаков, рассмотренных выше, могут быть включены в тренировку или использованы машинно-обучаемым классификатором в прогнозировании отвечаемости пациента на ингибирование контрольной точки или другое лечение. Для определения обобщенной меры того, насколько признаки в наборе генов скоординированно избыточно или недостаточно регулированы или иным образом экспрессированы или присутствуют на высоких или низких уровнях скоординированным или скоррелированным образом, могут быть использованы различные способы. Один из примеров может включать анализ, называемый анализом обогащения набора генов одного образца (ssGSEA). Для определения такого сгруппированного обогащения набора генов ssGSEA использует эмпирическую кумулятивную функцию распределения, как описано, например, в работе под авторством Barbie и др. (2009), «Systematic RNA interference reveals that oncogenic KRAS-driven cancers require TBK1», Nature 462:108-112. В качестве не имеющего ограничительного характера примера ssGSEA может быть выполнен на языке программирования R.[0059] Thus, in some examples, one or more sets of genes can be identified, and a measure of the coordinated or correlated degree of over- or under-regulation of traits in a subject's tumor related to such a set of genes can be provided as an additional feature for machine learning. a trainable classifier, or predicting a subject's response to checkpoint inhibition or another treatment, or both. Examples of gene sets include gene sets related to antigen presentation, T cell and NK cell signatures, cytolysis indicators, checkpoint inhibition, interferon-γ, and the presence or activity of MSDC/Treg. In some cases, one or more sets of genes, along with one or more of any of the other individual traits discussed above, may be included in training or used by a machine learning classifier in predicting a patient's response to checkpoint inhibition or other treatment. Various methods can be used to provide a generalized measure of how traits in a set of genes are coordinately over- or under-regulated or otherwise expressed or present at high or low levels in a coordinated or correlated manner. One example may include an assay called Single Sample Gene Set Enrichment Assay (ssGSEA). To determine this clumped enrichment of the gene set, ssGSEA uses an empirical cumulative distribution function, as described, for example, in Barbie et al. (2009), "Systematic RNA interference reveals that oncogenic KRAS-driven cancers require TBK1", Nature 462:108 -112. As a non-limiting example, ssGSEA can be implemented in the R programming language.

[0060] Некоторая или любая комбинация любых двух или более вышеуказанных признаков может быть использована как для тренировки машинно-обучаемого классификатора, так и для применения в машинно-обучаемом классификаторе для прогнозирования того, будет ли субъект, или с какой вероятностью, отвечать на лечение, например, с помощью ингибитора контрольной точки. Однако для тренировки машинно-обучаемого классификатора вовсе необязательно использовать все вышеуказанные признаки. Машинно-обучаемый классификатор может быть натренирован посредством набора характеристик, который включает все вышеупомянутые характеристики или исключает любые одну или более из них. Все комбинации и перестановки, предполагаемые этим необязательным включением и исключением, включены таким образом во всей их полноте, хотя и не обязательно перечислены дословно в явном виде. Специалист в данной области способен представить себе подмножества, комбинации, подкомбинации и перестановки, возможные с вышеуказанными признаками. Аналогичным образом также могут быть включены дополнительные признаки, будь то в дополнение ко всем вышеуказанным признакам, или просто комбинации, подкомбинации, перестановки или другие сочетаниям из меньшего, чем все, количества вышеуказанных признаков. Все такие различные примеры в прямой форме включены в настоящее изобретение.[0060] Some or any combination of any two or more of the above features can be used to both train a machine learning classifier and be used in a machine learning classifier to predict whether, or how likely a subject is, to respond to treatment, for example, using a checkpoint inhibitor. However, to train a machine learning classifier, it is not at all necessary to use all of the above features. A machine learning classifier can be trained with a feature set that includes all of the above features or excludes any one or more of them. All combinations and permutations contemplated by this optional inclusion and exclusion are thus included in their entirety, although not necessarily explicitly listed verbatim. One skilled in the art is able to imagine the subsets, combinations, subcombinations, and permutations possible with the above features. Likewise, additional features may also be included, whether in addition to all of the above features, or simply combinations, subcombinations, permutations, or other combinations of less than all of the above features. All such various examples are expressly included in the present invention.

[0061] В некоторых примерах признаки любого субъекта, используемые для тренировки машинно-обучаемого классификатора, те же самые, что и признаки, используемые для любого и всех остальных субъектов при тренировке машинно-обучаемого классификатора. Однако в других примерах для другого субъекта, используемого для тренировки машинно-обучаемого классификатора, могут быть предусмотрены другие признаки. Другими словами, некоторые субъекты могут иметь признаки, включенные в их тренировочный набор, которые не входят в признаки из тренировочных наборов других субъектов. Аналогичным образом в некоторых примерах для получения от машинно-обучаемого классификатора прогноза, относящегося к отвечаемости субъекта на лечение, признаки, полученные из образца пробы субъекта для получения прогноза, могут быть теми же, что и признаки, используемые для тренировки классификатора. То есть признаки всех субъектов, используемых для тренировки машинно-обучаемого классификатора, могут быть такими же, как у друг друга, а также такими же, что и у субъекта, для которого требуется получить прогноз от машинно-обучаемого классификатора. В других примера возможно несовпадение между признаками тренировочных субъектов, используемыми для тренировки машинно-обучаемого классификатора, и признаками субъекта, для которого требуется получить прогноз от машинно-обучаемого классификатора. Признаки некоторых или всех субъектов, используемые для тренировки машинно-обучаемого классификатора, могут включать признаки, для которых нет соответствующих признаков субъекта, для которого требуется получить прогноз от машинно-обучаемого классификатора.[0061] In some examples, the features of any subject used to train the machine learning classifier are the same as the features used for any and all other subjects when training the machine learning classifier. However, in other examples, other features may be provided for a different subject used to train a machine learning classifier. In other words, some subjects may have features included in their training set that are not included in the features in other subjects' training sets. Similarly, in some instances, in order to obtain a prediction regarding a subject's response to treatment from a machine learning classifier, the features obtained from the subject's predictive sample may be the same as the features used to train the classifier. That is, the features of all subjects used to train the machine learning classifier can be the same as each other, as well as the same as the subject for which you want to get a prediction from the machine learning classifier. In other examples, there may be a mismatch between the features of the training subjects used to train the machine learning classifier and the features of the subject for which you want to get a prediction from the machine learning classifier. The features of some or all of the subjects used to train the machine learning classifier may include features for which there are no corresponding features of the subject for which you want to get a prediction from the machine learning classifier.

[0062] В некоторых примерах субъект, для которого требуется получить прогноз от машинно-обучаемого классификатора, может не иметь признака, который соответствует признаку одного, или некоторых, или всех субъектов, используемому для тренировки машинно-обучаемого классификатора. В других примерах субъект может иметь аналогичный признак, но не идентичный признак, и этот аналогичный признак может быть использован вместо отсутствующего идентичного признака субъекта. Например, машинно-обучаемый классификатор может быть натренирован на признаках, которые, для по меньшей мере некоторых тренировочных субъектов, включают один или более таких признаков набора генов, которые могут быть получены с использованием ssGSEA, как описано выше. Для некоторых из тренировочных субъектов, наборы генов которых использовали для тренировки машинно-обучаемого классификатора, некоторые такие наборы могли быть получены из одних и тех же лежащих в основе отдельных признаков. Например, набор генов признака набора генов, относящегося к представлению антигена, мог быть получен из одних и тех же лежащих в основе признаков для всех субъектов, используемых для тренировки машинно-обучаемого классификатора. В других примерах некоторый относящийся к представлению антигена набор генов для тренировочного субъекта может быть основан на лежащих в основе признаках, которое включают некоторые такие признаки, которые не были бы включены в определение относящегося к представлению антигена набору генов другого тренировочного субъекта. Это может быть справедливо для других наборов генов. Кроме того, при получении прогноза может быть использован субъект признака набора генов, для которого требуется получить прогноз от машинно-обучаемого классификатора, а значение признака для набора генов, могло быть получено из лежащего в основе набора отдельных признаков субъекта, которые не включают по меньшей мере один или более лежащих в основе признаков, использованных при получении соответствующего значения признака набора генов одного или более тренировочных субъектов и при тренировке машинно-обучаемого классификатора.[0062] In some examples, the subject for which it is desired to obtain a prediction from the machine learning classifier may not have a feature that matches the feature of one, or some, or all of the subjects used to train the machine learning classifier. In other examples, the subject may have a similar feature, but not an identical feature, and that similar feature can be used in place of the subject's missing identical feature. For example, a machine learning classifier can be trained on traits that, for at least some of the training subjects, include one or more of those gene set traits that can be generated using ssGSEA as described above. For some of the training subjects whose gene sets were used to train the machine learning classifier, some of those sets may have been derived from the same underlying individual traits. For example, a set of genes for a feature of a set of genes related to antigen presentation could be derived from the same underlying features for all subjects used to train a machine learning classifier. In other examples, some antigen-presenting gene set for a training subject may be based on underlying traits that include some such traits that would not be included in another training subject's definition of an antigen-presenting gene set for another training subject. This may be true for other sets of genes. In addition, when obtaining a prediction, the subject of a trait of a gene set for which it is desired to obtain a prediction from a machine learning classifier can be used, and the feature value for a gene set could be obtained from the underlying set of individual features of the subject, which do not include at least one or more underlying features used in deriving the corresponding feature value of the gene set of one or more training subjects and in training the machine learning classifier.

[0063] Признаки могут быть определены известными способами определения данных генетического секвенирования, или уровней белка, или экспрессии РНК-транскрипта в биологическом образце. Например, значительное количество информации о нуклеотидной последовательности, которая может быть получена с использованием технологий секвенирования нового поколения, могут обеспечивать как относящиеся к геному признаки (например, общую мутационную нагрузку и т.д.), так и уровни экспрессии, например, РНК-транскриптов в зависимости от типа секвенирования нового поколения, используемого для получения данного признака. В число примеров подходящих способов входят полное секвенирование генома, полное секвенирование экзома, секвенирование мРНК, анализ генного чипа, анализ РНК-чипа, анализ белков, такой как анализ белкового чипа, или другие соответствующие способы определения наличия, или уровней, или количеств признаков, используемых для тренировки и/или получения прогноза от машинно-обучаемого классификатора в соответствии с аспектами настоящего изобретения. В некоторых примерах один и тот же набор методов может быть использован для получения признаков всех тренировочных субъектов для тренировки машинно-обучаемого классификатора и субъекта, для которого требуется получить прогноз. В других примерах возможны методологические различия между способом получения признака или некоторых признаков разных тренировочных субъектов и/или способом получения используемых для получения прогноза признаков субъекта, для которого требуется получить прогноз.[0063] Traits can be determined by known methods of determining genetic sequencing data, or protein levels, or expression of an RNA transcript in a biological sample. For example, the significant amount of nucleotide sequence information that can be obtained using next-generation sequencing technologies can provide both genome-specific features (e.g., total mutation load, etc.) and expression levels, e.g., of RNA transcripts. depending on the type of next generation sequencing used to obtain this trait. Examples of suitable methods include whole genome sequencing, whole exome sequencing, mRNA sequencing, gene array analysis, RNA array analysis, protein analysis such as protein array analysis, or other appropriate methods for determining the presence or levels or amounts of traits used. for training and/or obtaining a prediction from a machine learning classifier in accordance with aspects of the present invention. In some examples, the same set of methods can be used to obtain the features of all training subjects for training a machine learning classifier and the subject for which a prediction is desired. In other examples, there may be methodological differences between the method of obtaining a feature or some features of different training subjects and/or the method of obtaining features used to obtain a prediction of the subject for which you want to get a prediction.

[0064] Кроме того, для тренировки машинно-обучаемого классификатора с помощью признаков тренировочных субъектов в машинно-обучаемый классификатор также загружают отвечаемость тренировочных субъектов на лечение. Таким образом, тренировочный субъект представляет собой субъект, признаки и отвечаемость которого предоставляют для тренировки машинно-обучаемого классификатора. Отвечаемость может быть двоичной классификацией, например, когда тренировочного субъекта классифицируют как ответившего на лечение, если субъект продемонстрировал предварительно определенный ответ, в том числе продленный срок жизни, сокращение опухоли, частичную или полную ремиссию и т.д. В других примерах отвечаемость может быть оценкой или значением на основе полученной степени отвечаемости, а не двоичной оценкой того, была ли получена отвечаемость или нет. Например, в зависимости от типа искомого прогноза машинно-обучаемый классификатор согласно настоящему изобретению может включать, в качестве не имеющего ограничительного характера примера, деревья классификации и регрессии.[0064] In addition, to train the machine learning classifier using the features of the training subjects, the responses of the training subjects to treatment are also loaded into the machine learning classifier. Thus, a training subject is a subject whose features and responses are provided for training a machine learning classifier. Responsibility can be a binary classification, for example, where a training subject is classified as a response to treatment if the subject has demonstrated a predetermined response, including extended lifespan, tumor reduction, partial or complete remission, and so on. In other examples, the response rate may be a score or value based on a response rate received, rather than a binary assessment of whether a response was received or not. For example, depending on the type of prediction sought, the machine learning classifier of the present invention may include, by way of a non-limiting example, classification and regression trees.

[0065] Машинно-обучаемый классификатор может представлять собой классификатор, который подходит для машинного обучения на основе компьютера. В число не имеющих ограничительного характера примеров входит машинно-обучаемый классификатор на основе случайного леса. В машинно-обучаемом классификаторе на основе случайного леса создают деревья принятия решений на основе признаков тренировочных субъектов и значения отвечаемости на лечение, причем узлы, представляют точки принятия решения о классификации, а листья, представляют результаты не основе тренировочных входных данных. Классификатор на основе случайного леса может создавать несколько деревьев решений, используя подмножества признаков и подмножества тренировочных субъектов для создания многочисленных деревьев решений, которые затем объединяют. Такие многочисленные деревья принятия решений, содержащие подмножества водных данных, предотвращают чрезмерно близкую подгонку и уменьшают погрешность и систематическую ошибку при прогнозировании. В некоторых примерах, чем больше деревьев принятия решения, созданных во время тренировки, тем более точным может быть результат машинно-обучаемого классификатора. В некоторых примерах во время тренировки может быть создано примерно от 5000 до 500000 деревьев принятия решения. Например, в машинно-обучаемом классификаторе на основе случайного леса могут быть выполнены и объединены 5000, 10000, 15000, 20000, 25000, 30000, 50000, 75000, 90000, 100000, 125000, 150000, 175000, 200000, 225000, 250000, 275000, 300000, 325000, 350000, 375000, 400000, 425000, 450000, 475000 или 500000 деревьев принятия решений. Вместо этого могут быть выполнены больше или меньше деревьев решений, а также в количествах, попадающих в промежутки между этими приведенными для примера возможными вариантами.[0065] The machine learning classifier may be a classifier that is suitable for computer-based machine learning. Non-limiting examples include a random forest machine learning classifier. In a machine learning random forest classifier, decision trees are created based on training subject features and treatment response values, with nodes representing classification decision points and leaves representing outcomes based on training inputs. A random forest classifier can create multiple decision trees using subsets of features and subsets of training subjects to create multiple decision trees, which are then combined. Such multiple decision trees containing subsets of water data prevent over-fitting and reduce prediction error and bias. In some examples, the more decision trees generated during training, the more accurate the result of the machine learning classifier can be. In some examples, approximately 5,000 to 500,000 decision trees may be generated during training. For example, in a machine learning random forest classifier, 5000, 10000, 15000, 20000, 25000, 30000, 50000, 75000, 90000, 100000, 125000, 150000, 175000, 2000 00, 225000, 250000, 275000, 300000, 325000, 350000, 375000, 400000, 425000, 450000, 475000 or 500000 decision trees. Instead, more or fewer decision trees may be executed, as well as in amounts falling between these exemplary options.

[0066] Существуют различные варианты выполнения тренировки случайного леса и формирования прогноза посредством классификатора на основе случайного леса. В качестве примера, не имеющего ограничительного характера, может быть использован язык программирования R. Также могут быть использованы и другие классификаторы в соответствии с аспектами настоящего изобретения, в том числе, без ограничения, нейросетевой классификатор, машина опорных векторов, классификатор на основе максимальной энтропии, классификатор на основе экстремального градиентного бустинга и классификатор на основе случайного папоротника.[0066] There are various options for performing random forest training and prediction generation with a random forest classifier. As a non-limiting example, the R programming language may be used. Other classifiers may also be used in accordance with aspects of the present invention, including, but not limited to, a neural network classifier, a support vector machine, a maximum entropy classifier, a classifier based on extreme gradient boosting and a classifier based on a random fern.

[0067] Согласно способу, раскрытому в настоящем документе, получают признаки от каждого из некоторого количества тренировочных субъектов, как и отвечаемость каждого субъекта. Такие признаки и отвечаемости, или входные данные, вводят в запоминающее устройство компьютера, такое как накопитель на жестких дисках, сервер или другой компонент памяти. Кроме того, на запоминающем устройстве, которым оборудован такой компьютер, хранят инструкции, содержащиеся в программном обеспечении, которые командуют одним или более микропроцессорами. В число этих инструкций входят инструкции для использования входных данных от тренировочных субъектов для создания машинно-обучаемого классификатора. Затем натренированный машинно-обучаемый классификатор сохраняют в одном или более блоках памяти компьютера и могут впоследствии выполнять на признаках субъекта, для которого требуется получить прогноз отвечаемости.[0067] According to the method disclosed herein, signs are obtained from each of a number of training subjects, as is the response of each subject. Such features and responses, or inputs, are entered into a computer storage device such as a hard drive, server, or other storage component. In addition, the storage device that such a computer is equipped with stores the instructions contained in the software that command one or more microprocessors. These instructions include instructions for using input from training subjects to create a machine learning classifier. The trained machine learning classifier is then stored in one or more computer memory blocks and can subsequently be executed on the features of the subject for which the response prediction is to be obtained.

[0068] В качестве не имеющего ограничительного характера примера инструкции могут давать команду одному или более микропроцессорам на выполнение тренировки случайного леса с созданием деревьев принятия решения из входных данных тренировочного субъекта для определения того, указывают ли наличие, отсутствие, уровень и т.д. различных признаков с большей или меньшей вероятностью на отвечаемость на лечение, и команду на объединение многочисленных деревьев принятия решения в натренированный машинно-обучаемый классификатор на основе случайного леса. Затем натренированный машинно-обучаемый классификатор согласно данному примеру, основанный на объединении деревьев принятия решения, созданных одним или более микропроцессорами при обработке признаков и отвечаемости в соответствии с инструкциями, может быть сохранен в одном или более блоках памяти. Впоследствии при прогнозировании того, будет ли нетренировочный субъект (т.е. субъект, значения признаков которого не использовали для тренировки натренированного машинно-обучаемого классификатора) отвечать на лечение, например, с помощью конкретного ингибитора контрольной точки, полученные из образца опухоли данного нетренировочного субъекта признаки могут быть загружены в один или более блоков памяти. Один или более микропроцессоров могут обрабатывать инструкции таким образом, чтобы анализировать признаки нетренировочного субъекта посредством натренированного машинно-обучаемого классификатора, доступ к которому осуществляется из одного или более блоков памяти одним или более микропроцессором, и предоставлять отчет о прогнозе в отношении отвечаемости субъекта.[0068] As a non-limiting example, the instructions may instruct one or more microprocessors to perform random forest training to create decision trees from the training subject's input to determine whether it indicates presence, absence, level, etc. different features with greater or lesser likelihood of responding to treatment, and a command to combine multiple decision trees into a trained machine learning classifier based on a random forest. Then, the trained machine learning classifier according to this example, based on the combination of decision trees created by one or more microprocessors when processing features and responses in accordance with instructions, can be stored in one or more memory blocks. Subsequently, when predicting whether a non-training subject (i.e., a subject whose feature values were not used to train a trained machine learning classifier) would respond to treatment with, for example, a particular checkpoint inhibitor, the features derived from that non-training subject's tumor sample may be loaded into one or more memory blocks. The one or more microprocessors may process the instructions to parse the features of the non-training subject through a trained machine learning classifier accessed from one or more memories by the one or more microprocessors and provide a prediction report on the subject's response.

[0069] В таком примере машинно-обучаемый классификатор представлял собой натренированный машинно-обучаемый классификатор, натренированный на признаках образцов опухоли, полученных от каждого из множества тренировочных субъектов, и отвечаемости каждого из множества тренировочных субъектов на лечение, включающее ингибирование контрольной точки, причем машинно-обучаемый классификатор тренировали на прогнозирование отвечаемости на лечение. Кроме того, в натренированный машинно-обучаемый классификатор вводили геномную информацию нетренировочного субъекта, содержащую нетренировочные признаки из профиля опухоли субъекта, чтобы формировать классификацию отвечаемости на лечение для нетренировочного субъекта, например, классификацию или оценку, указывающую прогноз того, как нетренировочный субъект будет отвечать на лечение. Лечение может представлять собой ингибирование контрольной точки.[0069] In such an example, the machine learning classifier was a trained machine learning classifier trained on the features of tumor samples obtained from each of the plurality of training subjects and the response of each of the plurality of training subjects to treatment, including checkpoint inhibition, with machine learning the trainable classifier was trained to predict treatment response. In addition, non-training subject genomic information containing non-training features from the subject's tumor profile was entered into the trained machine learning classifier to generate a treatment response classification for the non-training subject, e.g., a classification or score indicating a prediction of how the non-training subject would respond to treatment. . The treatment may be checkpoint inhibition.

[0070] Отчет о сформированной машинно-обучаемым классификатором отвечаемости на ингибирование контрольной точки для нетренировочного субъекта может быть предоставлен пользователю. Отчет может включать классификацию субъекта, указывающую в двоичной форме, прогнозируется ли ответ нетренировочного субъекта на лечение или нет. В других примерах в дополнение или вместо двоичной классификации того, прогнозируется ли ответ нетренировочного субъекта или нет, может быть указана вероятность отвечаемости посредством числовой оценки по шкале. В других примерах может быть предоставлен отчет о конкретных степенях отвечаемости. Например, отчет может указывать высокую вероятность отвечаемости, но отвечаемость может быть квалифицирована относительно продолжительности или степени. В других примерах отчет может указывать прогноз относительно низкой вероятности отвечаемости, но большей продолжительности или степени, если спрогнозировано, что такой нетренировочный субъект ответит.[0070] A report of the machine learning classifier generated response to checkpoint inhibition for a non-training subject may be provided to the user. The report may include a subject classification indicating in binary whether the non-training subject's response to treatment is predicted or not. In other examples, in addition to or instead of a binary classification of whether a non-training subject's response is predicted or not, the response probability may be indicated by a numerical score on a scale. In other examples, specific response rates may be reported. For example, a report may indicate a high likelihood of response, but response may be categorized in terms of duration or extent. In other examples, the report may indicate a prediction of a relatively low probability of response, but of greater duration or extent, if such a non-training subject is predicted to respond.

[0071] Отчет о прогнозе в виде оценки или двоичного прогноза вероятности или, наоборот, маловероятности ответа может быть предоставлен с помощью графического пользовательского интерфейса (ГПИ). Например, соединенные с одним или более блоками памяти и одним или более микропроцессорами компьютер или компьютерная система, в которые ввели профиль значений признаков нетренировочного субъекта и проанализировали с помощью натренированного машинно-обучаемого классификатора, могут быть также соединены с устройством отображения, на котором в визуальном виде предоставляют отчет о прогнозе. ГПИ может принимать любую из множества форм. Например, ГПИ может быть представлять собой выполненные в виде таблицы различные аспекты признаков или подмножества признаков с более высокой степенью важности или весом при формировании прогноза с указанием также для каждого фактора большей или меньшей вероятности ответа нетренировочного субъекта на лечение (т.е. валентность признака) с учетом значения признака для нетренировочного субъекта, как дополнительно объяснено ниже. Или, для сообщения такой информации отчет может содержать различные формы, штриховки или цветные схемы.[0071] A prediction report in the form of an estimate or a binary prediction of the probability or, conversely, the improbability of a response can be provided using a graphical user interface (GUI). For example, connected to one or more memory units and one or more microprocessors, a computer or computer system, into which a profile of the values of features of a non-training subject has been entered and analyzed using a trained machine-learning classifier, can also be connected to a display device, on which in a visual form provide a forecast report. A GUI can take any of a variety of forms. For example, a GPI could be tabulated various aspects of features or a subset of features with a higher degree of importance or weight in forecasting, also indicating for each factor a greater or lesser likelihood of a non-training subject responding to treatment (i.e., feature valence) given the feature value for the non-training subject, as further explained below. Or, to communicate such information, the report may contain various shapes, shading, or color schemes.

[0072] Объект изобретения, раскрытый в настоящем документе, отличается от традиционных способов прогнозирования отвечаемости на лечение отчетом о классификации прогнозирования с использованием совокупности признаков, как описано в настоящем документе. В отличие от традиционных способов прогнозирования отвечаемости на лечение, в настоящем документе раскрыт способ использования комбинаторного подхода, где в некоторых примерах при формировании прогноза большое количество признаков могут быть проверены в контексте друг с другом, а не просто по отдельности. Такое отличие изложенного в настоящем документе изобретения от традиционных способов обеспечивает преимущество, заключающееся в том, что предпринимавшиеся прежде усилия по прогнозированию того, будет ли индивид отвечать на данное лечение, такое как ингибирование контрольной точки, до сих пор имели весьма ограниченную точность и обобщаемость из-за ограниченных количеств признаков. Как описано в настоящем документе, нетрадиционный процесс машинного обучения для оценки вкладов многочисленных факторов и того, как каждый из них может независимо или в совокупности с другими влиять на результаты прогнозирования, преодолевает ограничения попыток традиционного прогнозирования.[0072] The subject matter disclosed herein differs from conventional methods for predicting treatment response by reporting a prediction classification using a feature set as described herein. In contrast to traditional methods for predicting response to treatment, the present document discloses a method of using a combinatorial approach, where in some examples, when making a prediction, a large number of features can be tested in context with each other, and not just separately. This difference between the present invention and conventional methods provides the advantage that past efforts to predict whether an individual will respond to a given treatment, such as checkpoint inhibition, have so far been of very limited accuracy and generalizability due to for a limited number of features. As described herein, an unconventional machine learning process for evaluating the contributions of multiple factors and how each of them can independently or in combination with others influence prediction results overcomes the limitations of traditional prediction attempts.

[0073] Традиционные способы определения прогноза отвечаемости связаны с идентификацией признака или ограниченного количества признаков, которые могут указывать на более высокую или более низкую вероятность отвечаемости на лечение. В настоящем документе, напротив, раскрыт нетрадиционный подход, в котором для формулирования прогноза одновременно оценивают относительные вклады десятков или более потенциальных признаков в контексте друг с другом, используя машинно-обучаемый классификатор. Такой многофакторный подход посредством нетрадиционного применения машинно-обучаемого классификатора обеспечивает значительные преимущества над ныне имеющимися способами.[0073] Conventional methods for determining predictive response involve identifying a feature or a limited number of features that may indicate a higher or lower likelihood of responding to treatment. In contrast, this paper discloses a non-traditional approach in which the relative contributions of dozens or more potential features are simultaneously estimated in context with each other using a machine learning classifier to formulate a prediction. This multivariate approach, through the non-traditional use of a machine learning classifier, provides significant advantages over currently available methods.

[0074] Предпочтительной особенностью некоторых примеров ГПИ для предоставления отчета о прогнозе отвечаемости может быть представление многосторонней информации, относящейся к признакам, актуальным для сообщаемого прогноза, в относительно тесном или маленьком пространстве так, чтобы пользователь мог получать значимую информацию в компактном виде. В частности, преимущество определенных примеров ГПИ, используемых в соответствии с настоящим изобретением, может заключаться в их подборе размеров и конфигурации для отображения на дисплее ограниченного или уменьшенного размера или на дисплее, на котором необходимо или желательно отображать также уйму другой информации. ГПИ для предоставления отчета о классификации прогноза в соответствии с настоящим изобретением может служить для компактного размещения легко распознаваемых и узнаваемых аспектов классификации прогноза и/или признаков, актуальных для его формирования, на дисплее ограниченного размера или его ограниченной части. Такое компактное предоставление отчета улучшает взаимодействие пользователя с компьютерной системой, предоставляющей отчет, в том смысле, что оно облегчает получение и интерпретацию отчета и экономит пространство дисплея, которое может потребоваться для других целей или ограничено, например, когда дисплей представляет собой экран переносного электронного устройства, такого как телефон или другие устройства беспроводной связи (например, компьютерный планшет, или телефон, или другое переносное проводное или беспроводное устройство). В одном примере, где отчет предоставляют с помощью ГПИ, который в сжатой форме изображает большое количество характеристик и аспектов признаков в ограниченном пространстве, сохраняя при этом способность быстро сообщать большие количества информации, которая остается быстро и легко доступной, используемость компьютерной системы улучшается в том смысле, что при этом для дополнительных целей остается больше пространства дисплея или сохраняется возможность использования дисплеев меньшего размера.[0074] A preferred feature of some examples of GUIs for reporting a response prediction may be to present rich information related to features relevant to the reported prediction in a relatively cramped or small space so that the user can obtain meaningful information in a compact manner. In particular, certain examples of GUIs used in accordance with the present invention may have the advantage of being sized and configured for display on a display of limited or reduced size, or on a display that also needs or desires to display a plethora of other information. The prediction classification reporting GUI according to the present invention may serve to compactly place easily recognizable and recognizable prediction classification aspects and/or features relevant to prediction generation on a display of limited size or a limited portion thereof. This compact reporting improves the user's interaction with the reporting computer system in that it facilitates receipt and interpretation of the report and saves display space that may be required for other purposes or is limited, for example, when the display is a screen of a portable electronic device, such as a telephone or other wireless communication devices (for example, a computer tablet or telephone, or other portable wired or wireless device). In one example, where a report is provided by a GUI that concisely depicts a large number of characteristics and aspects of features in a limited space while retaining the ability to quickly report large amounts of information that remains quickly and easily accessible, the usability of the computer system is improved in that leaving more display space for additional purposes or retaining the ability to use smaller displays.

[0075] Отчет может содержать идентификаторы признаков либо аспекты или характеристики некоторых или всех признаков, используемых при формировании классификации отвечаемости. Например, отчет может содержать индикацию валентности признака, т.е. указывает ли его значение в профиле пациента на повышенную или пониженную вероятностью того, что субъект будет отвечать на лечение. А именно, в случае профиля нетренировочного пациента признак может иметь положительную валентность или отрицательную валентность. Положительная валентность может означать либо то, что значение признака у тренировочных субъектов имеет тенденцию к положительной корреляции с отвечаемостью на лечение, и значение нетренировочного субъекта для этого признака было высоким, либо то, что значение признака у тренировочных субъектов имело тенденцию к отрицательной корреляции с отвечаемостью, и значение нетренировочного субъекта для этого признака было низким.[0075] The report may contain feature identifiers or aspects or characteristics of some or all of the features used in generating the response classification. For example, a report may contain an indication of the valence of a feature, i.e. whether its value in the patient profile indicates an increased or decreased likelihood that the subject will respond to treatment. Namely, in the case of a non-training patient profile, the trait may have a positive valence or a negative valence. A positive valency could mean either that the value of the trait in training subjects tended to be positively correlated with response to treatment and the non-training subject's value for that trait was high, or that the value of the trait in training subjects tended to be negatively correlated with response, and the value of the non-training subject for this trait was low.

[0076] Другой идентификатор может представлять собой индикацию важности признака при формировании прогноза для данного машинно-обучаемого классификатора. Важность признака может указывать на то, что он, по всей вероятности, направит прогноз в одном или другом направлении относительно других признаков, используемых при тренировке. Например, в некоторых примерах во время тренировки для одного или более признаков может быть определен индекс снижения Джини. Индекс снижения Джини указывает важность признака в том смысле, что он учитывает влияние признака на функционирование классификатора в отношении того, каково влияние других признаков в направлении формируемого прогноза. Индекс снижения Джини может быть определен с помощью различных программных пакетов, например, с использованием языка программирования R. В некоторых примерах важность признаков может быть использована для определения того, какие идентификаторы признаков следует включать в отчет отдельно от оценки прогноза или в дополнение к нему. Например, для данного отчета, предоставляемого в форме ГПИ, ГПИ может отображать признаки только тех признаков, важность которых удовлетворяет предварительно определенному минимальному порогу важности. Например, отчет может содержать идентификаторы только тех признаков, квадрат важности которых, представленной численно в виде индекса снижения Джини, превышает 0,1. Вместо этого пороги минимальной важности могут быть установлены более или менее строгими или изменены для данных отчетов в зависимости от того, сколько информации требуется включать вместе с оценкой прогноза. Чем выше порог минимальной важности, тем меньше идентификаторов признаков может быть включено в отчет, и наоборот. Например, порог минимальной важности может быть таким, чтобы квадрат выраженной в численном виде важности (например, коэффициент снижения Джини) был выше, чем примерно от 0,01 до 0,5. Могут быть выбраны другие пороги минимальной важности в любом месте внутри или за пределами этого диапазона.[0076] Another identifier may be an indication of the importance of the feature in generating a prediction for a given machine learning classifier. The importance of a feature may indicate that it is likely to steer the prediction in one direction or the other relative to other features used in training. For example, in some examples, a Gini reduction index may be determined for one or more features during training. The Gini decline index indicates the importance of a feature in the sense that it takes into account the influence of the feature on the performance of the classifier in relation to what the influence of other features is in the direction of the prediction being made. The Gini decline index can be determined using various software packages, for example using the R programming language. In some examples, feature importance can be used to determine which feature identifiers to report separately from or in addition to the prediction score. For example, for a given report provided in the form of a GUI, the GUI can only display the features of those features whose importance satisfies a predefined minimum importance threshold. For example, a report might contain identifiers for only those features whose square of importance, represented numerically as a Gini decline index, is greater than 0.1. Instead, the minimum importance thresholds can be set to be more or less stringent, or modified for report data, depending on how much information you want to include along with the prediction score. The higher the minimum importance threshold, the fewer feature identifiers can be included in the report, and vice versa. For example, the minimum importance threshold may be such that the square of the numerical importance (eg, the Gini reduction factor) is greater than about 0.01 to 0.5. Other thresholds of minimum importance may be chosen anywhere within or outside of this range.

[0077] Другим примером идентификатора признака, который может быть включен в отчет, является вес признака. Вес признака является мерой степени, в которой значение признака субъекта само по себе предполагает, что субъект будет или не будет отвечать на лечение. Например, для каждого признака может быть определена граница однофакторного принятия решения. Граница однофакторного принятия решения представляет собой значение для данного признака, которое наилучшим образом устанавливает различие между наличием и отсутствием ответа на лечение у тренировочных субъектов. Например, если все тренировочные субъекты, которые отвечают на лечение, имели значение признака выше данной величины, тогда как все не отвечающие на лечение субъекты имели значения ниже этой величины, данная величина может быть границей однофакторного принятия решения. В некоторых других примерах некоторые отвечающие тренировочные субъекты могли иметь значение признака выше, чем у некоторых неотвечающих тренировочных субъектов, а другие отвечающие тренировочные субъекты могли иметь значение признака ниже, чем у этих тренировочных субъектов. Таким образом, в некоторых примерах для значения признака может существовать четкая разграничительная линия, которая недвусмысленно устанавливает различие между теми, кто отвечает, и теми, кто не отвечает, тогда как в других примерах возможно большее перекрытые на границе значений признака между тем, кто отвечают, и теми, кто не отвечают. В примерах последнего типа граница однофакторного принятия решения может быть выбрана в виде значения, которое обеспечивает максимально возможное отличие между теми, кто отвечают, и теми, кто не отвечают, в наборе тренировочных субъектов.[0077] Another example of a feature identifier that can be included in a report is feature weight. Feature weight is a measure of the extent to which a subject's feature value alone suggests that the subject will or will not respond to treatment. For example, for each feature, a one-factor decision boundary can be defined. The univariate decision margin is the value for a given trait that best distinguishes between treatment response and non-response in training subjects. For example, if all training subjects that respond to treatment had a feature value above a given value, while all non-responders had values below this value, this value may be a univariate decision boundary. In some other examples, some responding training subjects may have a feature value higher than some non-responding training subjects, and other responding training subjects may have a feature value lower than those training subjects. Thus, in some examples, there may be a clear dividing line for the feature value that unambiguously distinguishes between those who respond and those who do not respond, while in other examples there may be more overlap at the feature value boundary between those who respond. and those who do not respond. In examples of the latter type, the one-factor decision boundary can be chosen as the value that provides the largest possible difference between those who respond and those who do not respond in the set of training subjects.

[0078] Вес признака является мерой или индикацией того, насколько значение признака нетренировочного субъекта отличается от границы однофакторного принятия решения для этого признака. Чем больше значение признака нетренировочного субъекта отличается от границы однофакторного принятия решения для данного признака на основе тренировочных субъектов, тем больший вес может иметь признак при определении прогноза классификации отвечаемости. Например, признак может иметь отрицательную валентность, означающую, что нетренировочный субъект имеет низкое значение признака, положительно коррелируемого с отвечаемостью тренировочных субъектов, или высокое значение признака, отрицательно коррелируемого с отвечаемостью тренировочных субъектов. Если значение нетренировочного субъекта для данного признака отличается существенно от границы однофакторного принятия решения для этого признака, вес этого признака может быть высоким. Однако, если другой признак имеет более высокую важность и положительную валентность (т.е. высокое значение для нетренировочного субъекта и положительную корреляцию с отвечаемостью у тренировочных субъектов, или низкое значение для нетренировочного субъекта и отрицательную корреляцию с отвечаемостью у тренировочных субъектов), он может иметь пропорционально более сильное влияние на классификацию прогнозирования отвечаемости, даже если его значение отличается меньше от границы принятия однофакторного решения (т.е. имеет меньший вес).[0078] Feature weight is a measure or indication of how far a non-training subject's feature value differs from the one-factor decision boundary for that feature. The more the value of a feature of a non-training subject differs from the one-factor decision boundary for a given feature based on training subjects, the more weight the feature can have in determining the response classification prediction. For example, a feature may have a negative valence, meaning that a non-training subject has a low value of a feature that is positively correlated with the response of training subjects, or a high value of a feature that is negatively correlated with the response of training subjects. If the value of a non-training subject for a given feature differs significantly from the one-factor decision boundary for that feature, the weight of that feature may be high. However, if another trait has higher importance and positive valence (i.e. high value for a non-training subject and positive correlation with response in training subjects, or low value for a non-training subject and negative correlation with response in training subjects), it may have proportionally stronger impact on the response prediction classification, even if its value differs less from the one-factor decision boundary (i.e., has less weight).

[0079] Для представления идентификаторов признаков в виде компонентов отчета о прогнозе отвечаемости и ГПИ имеются множество возможностей. Некоторые конкретные примеры представлены в настоящем документе достаточно подробно. Однако специалисту в данной области понятно, что может быть много других возможностей для сообщения валентности, веса и важности в отчете в ГПИ, и что примеры, приведенные в настоящем документе, не имеют ограничительного характера, или каждый из них сам по себе никоим образом не является особенно существенным.[0079] There are many possibilities for presenting feature identifiers as components of the response prediction report and the GUI. Some specific examples are presented in this document in sufficient detail. However, one of skill in the art will appreciate that there may be many other possibilities for reporting valency, weight, and importance in a GUI report, and that the examples provided herein are not intended to be limiting, or each of them in and of itself is in no way especially significant.

[0080] ГПИ может представлять признаки в табличном виде посредством строк и столбцов. Признаки могут быть представлены, например, в строках, а различные характеристики данных признаков могут быть представлены в нескольких столбцах. Например, различные столбцы могут указывать важность признака, его валентность, границу однофакторного принятия решения для этого признака, значение нетренировочного субъекта для этого признака, необязательно с визуальной индикацией того, насколько значение нетренировочного субъекта для этого признака отличается от граница однофакторного принятия решения для этого признака, и был бы ли спрогнозирован ответ нетренировочного субъект, если прогноз основывался бы только на этом признаке. Табличный ГПИ может включать любые комбинации двух или более вышеперечисленных столбцов. Табличный отчет в ГПИ может также включать общую оценку прогноза.[0080] The GUI may represent the features in tabular form by means of rows and columns. The features may be presented, for example, in rows, and the various characteristics of these features may be presented in several columns. For example, different columns may indicate the importance of a feature, its valence, the one-factor decision boundary for that feature, the value of the non-training subject for that feature, optionally with a visual indication of how much the non-training subject's value for that feature differs from the one-factor decision boundary for that feature. and whether the non-training subject's response would be predicted if the prediction were based on that trait alone. A tabular GUI can include any combination of two or more of the above columns. The tabular report in the GUI may also include an overall estimate of the forecast.

[0081] Отчет в ГПИ может быть также гистограммой. Например, столбики могут указывать значение для данного признака нетренировочного субъекта вместе с линией, также указывающей границу однофакторного решения для данного признака. Разница между значением признака нетренировочного пациента и линией, указывающей границу однофакторного принятия решения, является идентификатором веса для данного признака. Кроме того, между высотой столбца и линией, указывающей границу однофакторного принятия решения, может быть проведена линия. Длина линии между ними двумя тоже является индикатором веса. Валентность может быть указана символом ниже столбца. Например, знак плюса или минуса может указывать положительную или отрицательную валентность, соответственно. Другие пары могут включать направленные вверх и вниз стрелки, ориентированные вверх и вниз треугольники и т.д., где одно направление указывает положительную валентностью этого признака, а другая ориентация указывает отрицательную валентность. Валентность может быть также указана цветом или штриховкой столбца, причем столбы одного цвета или рисунка штриховки, указывают одну ценность (положительную или отрицательную), а столбцы другого цвета и или рисунка штриховки, указывают противоположную ценность. Цвет или штриховка линии между значением признака нетренировочного субъекта в гистограмме и границей однофакторного принятия решения для этого признака тоже могут указывать ценность. Например, если значение признака отрицательно коррелировано с отвечаемостью тренировочных субъектов, а значение этого признака нетренировочного субъекта меньше границы однофакторного принятия решения, то линия, соединяющая значение этого признака нетренировочного субъекта в столбике гистограммы отчета и границу однофакторного принятия решения, может иметь цвет или штриховку, указывающие положительную ценность. А если значение признака положительно коррелировано с отвечаемостью тренировочных субъектов, а значение этого признака нетренировочного субъекта меньше границы однофакторного принятия решения, то линия, соединяющая значение этого признака нетренировочного субъекта в столбике гистограммы отчета и границу однофакторного принятия решения, может иметь цвет или штриховку, указывающие отрицательную ценность. Отметим, что в обоих случаях значение признака нетренировочного субъекта меньше границы однофакторного принятия решения для данного признака, но его ценность отличается в зависимости от того, был ли признак коррелирован отрицательно (отрицательная ценность) или положительно (положительная ценность) с отвечаемостью тренировочных субъектов. Верно и обратное (т.е., когда граница однофакторного принятия решения признака меньше значения этого признака нетренировочного субъекта, он может иметь положительную или отрицательную ценность в зависимости от того, имеет ли признак тенденцию быть положительно или отрицательно коррелированы с отвечаемостью тренировочных субъектов, соответственно).[0081] The GUI report may also be a histogram. For example, the bars may indicate a value for a given feature of a non-training subject, along with a line also indicating a one-factor decision boundary for that feature. The difference between the value of the non-training patient feature and the line indicating the one-factor decision boundary is the weight identifier for that feature. In addition, a line can be drawn between the height of the column and the line indicating the one-factor decision boundary. The length of the line between the two is also an indicator of weight. Valency can be indicated by a symbol below the column. For example, a plus or minus sign can indicate positive or negative valency, respectively. Other pairs may include up and down arrows, up and down triangles, etc., where one direction indicates a positive valency of that feature and the other orientation indicates a negative valence. Valency can also be indicated by the color or hatching of a bar, with bars of the same color or hatching pattern indicating one value (positive or negative), and bars of a different color or hatching pattern indicating the opposite value. The color or shading of the line between the value of a non-training subject feature in the histogram and the one-factor decision boundary for that feature can also indicate value. For example, if the value of a feature is negatively correlated with the response rate of training subjects, and the value of this feature of a non-training subject is less than the one-factor decision boundary, then the line connecting the value of this feature of a non-training subject in the histogram bar of the report and the one-factor decision boundary may have a color or shading indicating positive value. And if the value of a feature is positively correlated with the response rate of training subjects, and the value of this feature of a non-training subject is less than the one-factor decision boundary, then the line connecting the value of this feature of a non-training subject in the histogram column of the report and the one-factor decision boundary may have a color or shading indicating a negative value. Note that in both cases, the value of the feature of a non-training subject is less than the one-factor decision boundary for this feature, but its value differs depending on whether the feature was negatively (negative value) or positively (positive value) correlated with the response rate of training subjects. The converse is also true (i.e., when the one-factor decision margin of a feature is less than the value of that feature of a non-training subject, it may have a positive or negative value depending on whether the feature tends to be positively or negatively correlated with response rates of training subjects, respectively) .

[0082] Важность признака может быть указана символом или другим индикатором возле, внутри или ниже столбика признака в гистограмме. Например, важность признака может быть указана размером символа ниже столбика признака. Или важность может быть кодирована цветом путем указания степени важности окрашиванием или штриховкой столбиков или связанных символов. Гистограмма может быть дополнена условными обозначениями, указывающими спектр цветов или штриховок, где более высокая важность указана цветом или штриховкой, которые больше напоминают один конец спектра, а более низкая важность указана цветом или штриховкой, которые больше напоминают другой конец спектра. В некоторых примерах символ, например, помещенный в гистограмме отчета в ГПИ под столбцом признака нетренировочного субъекта, может указывать, были ли значения этого признака коррелированы отрицательно или положительно с отвечаемостью тренировочных субъектов. Например, положительно и отрицательно коррелированные признаки могут быть указаны знаком плюса и знаком минуса, стрелкой вверх и стрелкой вниз, ориентированным вверх треугольником и ориентированным вниз треугольником или другими парами. В таких случаях относительные размеры этих символов могут обозначать их относительную важность.[0082] Feature importance may be indicated by a symbol or other indicator next to, within, or below the feature bar in the histogram. For example, the importance of a feature can be indicated by the size of the symbol below the bar of the feature. Or importance can be color-coded by indicating the degree of importance by coloring or shading bars or associated symbols. The histogram can be augmented with legend indicating a spectrum of colors or shading, where higher importance is indicated by a color or shading that more resembles one end of the spectrum, and lower importance is indicated by a color or shading that more resembles the other end of the spectrum. In some examples, a symbol, such as placed in a histogram of a GUI report under a column of a non-training subject feature, may indicate whether the values of that feature were negatively or positively correlated with the response rate of the training subjects. For example, positively and negatively correlated features may be indicated by a plus sign and a minus sign, an up arrow and a down arrow, an up triangle and a down triangle, or other pairs. In such cases, the relative sizes of these symbols may indicate their relative importance.

[0083] В другом примере отчет в ГПИ содержит формы, которые выражают идентификаторы признаков. Например, каждый признак, идентификаторы которого включены в отчет в ГПИ, может быть представлен формой, размеры, цвет, штриховка или другие аспекты которого могут обозначать разные идентификаторы. Например, каждый признак может быть представлен прямоугольником, ширина которого представляет важность, а высота представляет вес. Ценность могут указывать цвет, штриховка или стиль контура прямоугольников. Или признаки могут быть представлены треугольниками, где основание представляет важность, а высота представляет вес, или наоборот. Треугольник может быть ориентирован вверх для признака положительной ценности, и наоборот. Или цветом, рисунком штриховки или линиями контура треугольника может быть указана валентность.[0083] In another example, the GUI report contains forms that express feature identifiers. For example, each feature whose identifiers are included in a GUI report may be represented by a shape, size, color, shading, or other aspects of which may be denoted by a different identifier. For example, each feature could be represented by a rectangle whose width represents importance and whose height represents weight. The value can indicate the color, hatching, or outline style of the rectangles. Or features can be represented by triangles where base represents importance and height represents weight, or vice versa. The triangle can be oriented upward for a positive value feature, and vice versa. Or the color, hatching pattern or lines of the contour of the triangle can indicate valency.

[0084] В другом примере идентификаторы признаков могут быть указаны в форме сектора кольца или кольцевого сектора. Угол кольцевого сектора может указывать важность, а его внешний радиус может указывать вес, или наоборот. Валентность может быть указана цветом кольцевого сектора, или рисунком его штриховки, или стилем линий, которыми нарисован его контур. В других примерах идентификаторы признаков могут быть представлены сектором круга, или круговым сектором, причем угол и радиус представляют важность и вес, или наоборот, а цвет или штриховка и т.д. представляют валентность, как в примере с кольцевым сектором, приведенном выше. Когда идентификаторы признаков представлены кольцевыми секторами, в некоторых примерах такие кольцевые секторы могут быть нарисованы так, чтобы они имели одинаковый внутренний радиус, а кольцевые секторы могут быть расположены так, чтобы их внутренние дуги вместе образовывали внутренний круг. В пределах самого внутреннего круга могут быть указаны оценка прогноза или другая общая сводная индикация прогноза или классификации отвечаемости. Цвет или штриховка этого внутреннего круга могут указывать, прогнозирует ли классификация отвечаемости вероятность или маловероятность ответа нетренировочного пользователя. Например, когда прогноз заключается в том, что нетренировочный субъект, вероятно, ответит, внутренний круг может иметь один цвет или рисунок штриховки, или может быть нарисован линией одного стиля, ну а если прогноз состоит в том, что нетренировочный субъект вряд ли ответит, внутренний круг может иметь другой цвет или рисунок штриховки. В других примерах вместо внутреннего круга может быть другая внутренняя форма, такая как квадрат, звезда, треугольник или пятиугольник либо другая форма. Размер внутренней формы может указывать состоятельность прогноза - чем больше внутренняя форма, тем достовернее прогноз, и наоборот.[0084] In another example, feature identifiers may be specified in the form of a ring sector or ring sector. The angle of a ring sector may indicate importance, and its outer radius may indicate weight, or vice versa. Valence can be indicated by the color of the annular sector, or by the pattern of its hatching, or by the style of the lines with which its outline is drawn. In other examples, feature identifiers may be represented by a circle sector, or a circular sector, with the angle and radius representing importance and weight, or vice versa, and the color or hatching, etc. represent valence, as in the ring sector example above. When the feature identifiers are represented by annular sectors, in some examples, such annular sectors may be drawn to have the same inner radius, and the annular sectors may be positioned so that their inner arcs together form an inner circle. Within the innermost circle, a forecast score or other general summary indication of a forecast or response classification may be indicated. The color or shading of this inner circle may indicate whether the response rating predicts the likelihood or improbability of a non-training user's response. For example, when the prediction is that a non-training subject is likely to respond, the inner circle may have a single color or hatch pattern, or may be drawn with a single style of line, but if the prediction is that a non-training subject is unlikely to respond, the inner the circle may have a different color or hatching pattern. In other examples, instead of the inner circle, there may be another inner shape, such as a square, star, triangle, or pentagon, or some other shape. The size of the internal shape can indicate the consistency of the forecast - the larger the internal shape, the more reliable the forecast, and vice versa.

[0085] Отчет в ГПИ может также предоставлять пользователю возможность поиска дополнительной информации или запуска дополнительных приложений в зависимости от конкретного представляющего интерес признака, сообщенного в отчете в ГПИ. Например, ГПИ может быть выполнен таким образом, чтобы пользователь мог наводить указатель или другой элемент, которым можно управлять с помощью устройства ввода, такого как мышь, на идентификаторы признаков или указывать их касанием сенсорного экрана. Ориентирование элемента или касание дисплея в месте нахождения признака может открывать раскрывающееся меню с пунктами, которые затем могут быть выбраны. Например, раскрывающееся меню может отображать аспекты признака, специфичные для нетренировочного субъекта, такие как его значение, или когортный диапазон для признака, каков процент значения признака нетренировочного субъекта, представленный относительно диапазона значений, имеющихся в тренировочных данных, или по сравнению только с тренировочными данными для тренировочных субъектов, которые ответили в соответствии с ответом, спрогнозированным для нетренировочного субъекта, или для других тренировочных субъектов, или границу однофакторного принятия решения для признаков, или важность или корреляцию признака с отвечаемостью на другие лечения, или любую комбинацию двух или более вышеуказанных аспектов. Раскрывающееся меню может также предоставлять ссылки на другие программы, к которым могут получить доступ один или более микропроцессоров, чтобы дополнительно оценить признак или оценку прогноза нетренировочных субъектов, например, путем выполнения другого машинно-обучаемого классификатора. Благодаря такому компактному размещению интерактивных возможностей в отчете в ГПИ можно значительно сэкономить пространство и вычислительные ресурсы и существенно улучшить взаимодействие пользователя с компьютерной системой. Например, для одновременного непрерывного отображения отчета в ГПИ во время доступа к пунктам раскрывающегося меню потребуется меньше места на дисплее. Кроме того, можно экономить время и вычислительные ресурсы, так как такое взаимодействие сделает возможным доступ к множеству функций компьютера без переключения между экранами дисплея или приложениями.[0085] The GUI report may also allow the user to search for additional information or launch additional applications, depending on the particular feature of interest reported in the GUI report. For example, the GUI may be configured such that a user can place a pointer or other element that can be controlled with an input device such as a mouse over the feature identifiers or indicate them by touching a touch screen. Orienting the element or touching the display at the location of the feature can open a drop-down menu with items that can then be selected. For example, a drop-down menu could display aspects of a feature specific to a non-training subject, such as its value, or the cohort range for the feature, what is the percentage of the value of the non-training subject's feature represented relative to the range of values present in the training data, or compared only to the training data for training subjects who responded according to the response predicted for the non-training subject or for other training subjects, or the one-factor decision margin for the traits, or the importance or correlation of the trait with responsiveness to other treatments, or any combination of two or more of the above. The drop-down menu may also provide links to other programs that can be accessed by one or more microprocessors to further evaluate a feature or predictive score of non-training subjects, for example, by executing another machine learning classifier. Due to such a compact placement of interactive features in a report in the GUI, you can significantly save space and computing resources and significantly improve user interaction with a computer system. For example, to display a report continuously in the GUI at the same time while accessing the drop-down menu items will require less display space. In addition, you can save time and computing resources, since such interaction will allow you to access many computer functions without switching between display screens or applications.

[0086] В некоторых примерах возможна дальнейшая тренировка натренированного машинно-обучаемого классификатора. Например, после того, как определена отвечаемость нетренировочного субъекта, машинно-обучаемый классификатор может быть повторно натренирован на признаках, включая значения признаков и отвечаемости тренировочных субъектов, на которых его первоначально тренировали, плюс значения признаков и отвечаемость нетренировочного субъекта, для которого был предоставлен прогноз и получена отвечаемость. В других примерах натренированный машинно-обучаемый классификатор может быть повторно натренирован с использованием дополнительных значений признаков и отвечаемости нетренировочного субъекта, для которого не получали прогноз от этого натренированного машинно-обучаемого классификатора.[0086] In some examples, further training of the trained machine learning classifier is possible. For example, once the response of a non-training subject is determined, a machine learning classifier can be retrained on features, including the feature values and responses of the training subjects on which it was originally trained, plus the feature values and responses of the non-training subject for which the prediction was provided and response received. In other examples, a trained machine learning classifier may be retrained using additional feature values and responses of a non-trained subject for which no prediction was made from that trained machine learning classifier.

[0087] В некоторых примерах по получении классификации прогноза ответа для субъекта может быть принято решение, применять или нет данное лечение ингибированием контрольной точки. Высокая оценка прогноза в отношении лечения с использованием конкретной контрольной точки, полученного от машинно-обучаемого классификатора, натренированного, как описано в настоящем документе, может привести к принятию решения лечить субъекта с применением лечения, для прогнозирования ответа на которое был натренирован машинно-обучаемый классификатор. Или, низкая оценка может привести к принятию решения не применять такое лечение. Получив классификацию или оценку прогноза ответа, указывающую на достаточно высокую вероятность отвечаемости, или указания лечить субъекта в результате получения такой классификации или оценки прогноза ответа в соответствии со способами, системами или машинно-обучаемым классификатором, как описано в настоящем документе, можно лечить субъекта с использованием данного лечения. Настоящее изобретение включает онкотерапию субъекта путем применения лечения ингибированием контрольной точки в ответ на получение классификации прогноза или оценки прогноза ответа, сформированной в соответствии с настоящим изобретением, которая указывает на то, что субъект будет отвечать на такое лечение, или применение такого лечения по указаниям того, кто получил такую классификацию прогноза или оценку прогноза.[0087] In some examples, upon obtaining a classification of response prognosis for a subject, a decision may be made whether or not to apply a given checkpoint inhibition treatment. A high estimate of treatment prediction using a particular breakpoint derived from a machine learning classifier trained as described herein may lead to a decision to treat a subject with a treatment for which the machine learning classifier has been trained to predict response. Or, a low score may lead to a decision not to use such treatment. Having received a classification or response prediction score indicating a sufficiently high probability of responding, or an instruction to treat a subject as a result of obtaining such a classification or a response prediction score in accordance with methods, systems or a machine learning classifier, as described herein, it is possible to treat the subject using this treatment. The present invention includes oncotherapy of a subject by administering a checkpoint inhibition treatment in response to obtaining a prognosis classification or response prognosis score generated in accordance with the present invention that indicates that the subject will respond to such treatment, or administering such treatment as indicated by who received such a forecast classification or forecast score.

ПРИМЕРЫEXAMPLES

[0088] Следующие примеры предназначены для иллюстрации конкретных вариантов реализации настоящего изобретения, но никоим образом не предназначены для ограничения его объема.[0088] The following examples are intended to illustrate specific embodiments of the present invention, but are in no way intended to limit its scope.

[0089] На ФИГ. 1 приведена сетевая диаграмма, показывающая варианты выполнения способа в соответствии с аспектами настоящего изобретения. Показаны потенциальные не имеющие ограничительного характера примеры источников значений признаков, такие как атлас ракового генома (TCGA) или данные клинических исследований (таких, как исследование лечения с помощью анти-PD1, лечения с помощью анти-CTLA4 или другого лечения с помощью ингибитора контрольной точки или другого лечения рака). Также указаны некоторые не имеющие ограничительного характера примеры анализов, которые могут быть использованы для получения информации о признаках, используемой для определения значений признаков, например, секвенирование РНК и полное секвенирование экзома (ПСЭ) в качестве двух примеров, не имеющих ограничительного характера. Указаны также другие не имеющие ограничительного характера примеры типов признаков, которые являются примерами того, какие анализ или анализы могут обеспечивать измерения, актуальные для определения значения такого признака. В число примеров входят HLA, экспрессия генов, ssGSEA, опухолевая мутационная нагрузка, цитолитическая инфильтрация, например, посредством опухолеинфильтрующих лимфоцитов (деконволюирированная), CGA, неоантигены, наличие клональной и/или субклональной мутаций (т.е. мутаций, которые присутствуют в потомках клетки, первоначально имеющейся в данной мутации, и в других потомках клетки, из которой первоначально мутировала клетка, впоследствии полученная другой мутацией) и т.д. Признаки обрабатывают с использованием модели машинного обучения (МО), при помощи которой тренируют машинно-обучаемый классификатор, и в натренированный машинно-обучаемый классификатор вводят значения признаков нетренировочного субъекта, после чего получают отклик пациента для маркировки пациента, как вероятно или маловероятно отвечающего на лечение.[0089] FIG. 1 is a network diagram showing embodiments of a method in accordance with aspects of the present invention. Potential non-limiting examples of sources of trait values are shown, such as the Cancer Genome Atlas (TCGA) or data from clinical studies (such as a trial of anti-PD1 treatment, anti-CTLA4 treatment, or other checkpoint inhibitor treatment or other cancer treatment). Also included are some non-limiting examples of assays that can be used to obtain feature information used to determine feature values, such as RNA sequencing and whole exome sequencing (WSE) as two non-limiting examples. Other non-limiting examples of feature types are also provided, which are examples of what assay or assays may provide measurements relevant to determining the value of such feature. Examples include HLA, gene expression, ssGSEA, tumor mutation load, cytolytic infiltration, e.g. by tumor infiltrating lymphocytes (deconvoluted), CGA, neoantigens, the presence of clonal and/or subclonal mutations (i.e., mutations that are present in the cell's progeny). , originally present in this mutation, and in other descendants of the cell from which the cell originally mutated, subsequently obtained by another mutation), etc. The features are processed using a machine learning (ML) model by which a machine learning classifier is trained, and the values of the features of a non-training subject are entered into the trained machine learning classifier, after which the patient's response is obtained to mark the patient as likely or unlikely to respond to treatment.

[0090] На ФИГ. 2 показаны некоторые не имеющие ограничительного характера примеры признаков, которые могут быть актуальны при тренировке классификатора и прогнозировании отвечаемости пациента на лечение в соответствии с аспектами настоящего изобретения. Как понятно специалистам в данной области, признаки, идентифицированные на ФИГ. 2, являются примерами, не имеющими ограничительного характера. Кроме того, не все они являются обязательными. При выполнении способа согласно аспектам настоящего изобретения помимо показанных на ФИГ. 2 могут быть использованы другие признаки, а некоторые из показанных признаков могут быть опущены. В данном случае признаки показаны сгруппированными в соответствии с функцией, клеточным или молекулярным путем, ответом и т.п. Примеры таких группировок включают представление антигена, сигнатуры Т-клетки или NK-клетки, сигнатуры иммуноопосредованного цитолиза, участников пути контрольной точки, участников пути интерферона-γ и сигнатуры MDSC/Treg. В дополнение или вместо любых группировок, показанных в настоящем документе в качестве не имеющих ограничительного характера примеров, могут быть включены другие группировки, представляющие другие функции либо клеточные или молекулярные процессы и т.д.[0090] FIG. 2 shows some non-limiting examples of features that may be relevant in training a classifier and predicting patient response to treatment in accordance with aspects of the present invention. As will be appreciated by those skilled in the art, the features identified in FIG. 2 are non-limiting examples. Also, not all of them are mandatory. When performing the method according to aspects of the present invention, in addition to those shown in FIG. 2, other features may be used, and some of the features shown may be omitted. Here, the features are shown grouped according to function, cellular or molecular pathway, response, and the like. Examples of such moieties include antigen representation, T cell or NK cell signature, immune mediated cytolysis signature, checkpoint pathway members, interferon-γ pathway members, and MDSC/Treg signature. In addition to or instead of any of the groupings shown herein as non-limiting examples, other groupings representing other functions or cellular or molecular processes, etc. may be included.

[0091] На ФИГ. 3 приведена сетевая диаграмма, показывающая пример возможного выполнения способа тренировки классификатора в соответствии с аспектами настоящего изобретения. Как понятно специалистам в данной области, признаки, идентифицированные на ФИГ. 3, являются примерами, не имеющими ограничительного характера. Кроме того, не все они являются обязательными. При выполнении способа согласно аспектам настоящего изобретения помимо показанных на ФИГ. 3 могут быть использованы другие признаки, а некоторые из показанных признаков могут быть опущены. В данном случае признаки показаны сгруппированными в соответствии с функцией, клеточным или молекулярным путем, ответом и т.п. Примеры таких группировок включают представление антигена, сигнатуры Т-клетки или NK-клетки, сигнатуры иммуноопосредованного цитолиза, участников пути контрольной точки, участников пути интерферона-γ и сигнатуры MDSC/Treg. Как указано на ФИГ. 3, признаки тренировочных субъектов, такие как показанные, вводят в машинно-обучаемый классификатор, например, классификатор на основе случайного леса, в виде меток, соответствующих тому, как тренировочные субъекты отвечали на данное лечение, такое как лечение ингибированием контрольной точки. Таким образом можно тренировать классификатор. Как отмечалось, могут быть также использованы другие машинно-обучаемые классификаторы.[0091] FIG. 3 is a network diagram showing an example of a possible implementation of a classifier training method in accordance with aspects of the present invention. As will be appreciated by those skilled in the art, the features identified in FIG. 3 are non-limiting examples. Also, not all of them are mandatory. When performing the method according to aspects of the present invention, in addition to those shown in FIG. 3, other features may be used, and some of the features shown may be omitted. Here, the features are shown grouped according to function, cellular or molecular pathway, response, and the like. Examples of such moieties include antigen representation, T cell or NK cell signature, immune mediated cytolysis signature, checkpoint pathway members, interferon-γ pathway members, and MDSC/Treg signature. As shown in FIG. 3, features of the training subjects, such as those shown, are entered into a machine learning classifier, such as a random forest classifier, as labels corresponding to how the training subjects responded to a given treatment, such as a checkpoint inhibition treatment. In this way, the classifier can be trained. As noted, other machine learning classifiers may also be used.

[0092] ФИГ. 4 представляет собой расширение ФИГ. 3, показывающее сетевую диаграмму, демонстрирующую пример возможного выполнения способа использования натренированного классификатора для прогнозирования отвечаемости субъекта в соответствии с аспектами настоящего изобретения. Машинно-обучаемый классификатор (классификатор на основе случайного леса в данном не имеющем ограничительного характера примере), натренированный на признаках (не имеющие ограничительного характера примеры которых, например, показаны в настоящем документе), принимает входные данные, полученные от нетренировочного субъекта. В частности, в машинно-обучаемый классификатор вводят значения признаков нетренировочного субъекта. После этого при предоставлении отчета о прогнозе натренированный машинно-обучаемый классификатор формирует классификацию прогноза ответа, которая может содержать оценку, указывающую вероятность отвечаемости (в данном случае указанную в виде иммунных оценок) и/или идентификаторы признаков.[0092] FIG. 4 is an extension of FIG. 3 showing a network diagram showing an example of a possible implementation of a method for using a trained classifier to predict subject response in accordance with aspects of the present invention. A machine learning classifier (a random forest classifier in this non-restrictive example) trained on features (non-restrictive examples of which, for example, are shown herein) receives input from a non-training subject. In particular, the values of features of a non-training subject are entered into the machine-learning classifier. Thereafter, when reporting the prediction, the trained machine learning classifier generates a response prediction classification, which may contain a score indicating the probability of response (in this case, indicated in the form of immune scores) and/or feature identifiers.

[0093] Признаки и отвечаемость на ингибирование PD-1 были получены из работы под авторством Hugo и др. (2016) «Genomic and Transcriptomic Features of Response to Anti-PD-1 Therapy in Metastatic Melanoma». Cell. 2016; 165(1):35-44 (doi:10.1016/j.cell.2016.02.065). В этом исследовании были получены данные полного секвенирования экзома и данные секвенирования РНК из образцов опухоли 26 пациентов с меланомой до и после лечения с помощью антитела к ингибитору пути контрольной точки PD-1 (анти-PD-1) (ниволумаб) или антитела к анти-PD-L1 (пембролизумаб). Необработанные данные были общедоступны и приведены в качестве примеров в настоящем документе. Данные транскриптома, полученные посредством секвенирования РНК (включая уровни экспрессии транскриптов в образцах) были доступны в Интернете в базе данных Gene Expression Omnibus Национального центра биотехнологической информации (NCBI) под входящим номером GSE78220 (https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE78220). Данные полного секвенирования экзома, полученные методами СНП, были доступны в Интернете в базе данных Sequence Read Archive Национального центра биотехнологической информации (NCBI) (https://www.ncbi.nlm.nih.gov/sra) под входящими номерами SRA: SRP067938 и SRA: SRP090294. Отвечаемость пациентов, для которых были доступны такие данные, тоже была получена из результатов опубликованных исследований. Из этих источников выбирали данные для создания признаков тренировочных субъектов и отвечаемостей тренировочных субъектов, чтобы тренировать машинно-обучаемый классификатор на прогнозирование отвечаемости на ингибиторы пути контрольной точки анти-PD1. Из этих же источников получали данные признаков для получения прогноза от натренированного машинно-обучаемого классификатора.[0093] Signs and response to PD-1 inhibition were derived from Hugo et al. (2016) "Genomic and Transcriptomic Features of Response to Anti-PD-1 Therapy in Metastatic Melanoma". cell. 2016; 165(1):35-44 (doi:10.1016/j.cell.2016.02.065). In this study, whole exome sequencing data and RNA sequencing data were obtained from tumor samples of 26 melanoma patients before and after treatment with an antibody to an inhibitor of the PD-1 checkpoint pathway (anti-PD-1) (nivolumab) or an antibody to anti- PD-L1 (pembrolizumab). The raw data has been publicly available and is provided as examples in this document. Transcriptome data obtained by RNA sequencing (including expression levels of transcripts in samples) were available online from the National Center for Biotechnology Information (NCBI) Gene Expression Omnibus database under accession number GSE78220 (https://www.ncbi.nlm.nih.gov /geo/query/acc.cgi?acc=GSE78220). Whole exome sequencing data obtained by SNP methods were available online from the National Center for Biotechnology Information (NCBI) Sequence Read Archive database (https://www.ncbi.nlm.nih.gov/sra) under SRA access numbers: SRP067938 and SRA: SRP090294. The response rates of patients for whom such data were available were also derived from published studies. From these sources, data was selected to create training subject features and training subject responses to train a machine learning classifier to predict responses to anti-PD1 checkpoint pathway inhibitors. From the same sources, feature data was obtained to obtain a prediction from a trained machine learning classifier.

[0094] Признаки и отвечаемость на ингибирование CTLA-4 были получены из работы под авторством Van Allen и др. (2015) «Genomic correlates of response to CTLA-4 blockade in metastatic melanoma». Science 350:207-211 (doi: 10.1126/science.aad0095). В этом исследовании были получены данные полного секвенирования экзома и данные секвенирования РНК из образцов опухоли 30 пациентов с меланомой до и после лечения с помощью ингибитора CTLA-4 (ипилимумаб). Необработанные данные были общедоступны и приведены в качестве примеров в настоящем документе. Данные полного секвенирования экзома и данные транскриптома, полученные посредством СНП, были доступны в базе данных генотипов и фенотипов (Genotypes and Phenotypes, dbGaP), входящий номер phs000452.v2.p1 (https://www.ncbi.nlm.nih.gov/gap/?term=phs000452.v2.p1). Отвечаемость пациентов, для которых были доступны такие данные, тоже была получена из результатов опубликованных исследований. Из этих источников выбирали данные для создания признаков тренировочных субъектов и отвечаемостей тренировочных субъектов, чтобы тренировать машинно-обучаемый классификатор на прогнозирование отвечаемости на ингибиторы пути контрольной точки анти-CTLA4. Из этих же источников получали данные признаков для получения прогноза от натренированного машинно-обучаемого классификатора.[0094] Signs and response to CTLA-4 inhibition were derived from Van Allen et al. (2015) "Genomic correlates of response to CTLA-4 blockade in metastatic melanoma". Science 350:207-211 (doi: 10.1126/science.aad0095). In this study, whole exome sequencing data and RNA sequencing data were obtained from tumor samples of 30 melanoma patients before and after treatment with the CTLA-4 inhibitor (ipilimumab). The raw data has been publicly available and is provided as examples in this document. Whole exome sequencing data and transcriptome data obtained by SNP were available from the Genotypes and Phenotypes (dbGaP) database, accession number phs000452.v2.p1 (https://www.ncbi.nlm.nih.gov/ gap/?term=phs000452.v2.p1). The response rates of patients for whom such data were available were also derived from published studies. From these sources, data was selected to create training subject features and training subject responses to train a machine learning classifier to predict responses to anti-CTLA4 checkpoint pathway inhibitors. From the same sources, feature data was obtained to obtain a prediction from a trained machine learning classifier.

[0095] Данные, полученные из обоих исследований, предварительно обрабатывали для создания входных признаков для тренировки машинно-обучаемых классификаторов. Затем на этих тренировочных данных тренировали машинно-обучаемые классификаторы на основе случайного леса, принявшие такие входные данные. После этого признаки некоторых субъектов использовали для формирования прогноза с помощью одного или обоих натренированных классификаторов и посредством ГПИ предоставляли отчеты о классификации прогноза отвечаемости, в том числе оценку прогноза и идентификаторы признаков. На ФИГ. 1, которая описана выше, приведен обзор примера некоторых способов, используемых в данных примерах. На ФИГ. 2 показаны 38 признаков, которые выбирали для ввода в машинно-обучаемый классификатор. Признаки выбирали на основе ожиданий, что они могут относиться к прогнозу того, может ли субъект отвечать на ингибирование контрольной точки или нет, исходя из текущего понимания ролей таких признаков. allMut обозначает опухолевую мутационную нагрузку всех мутаций, а nonSynMut обозначает опухолевую мутационную нагрузку, приписываемую несинонимичным мутациям. cd8_dec, cd4_dec и cd19_dec обозначают измерения деконволюции опухолефильтрующих лимфоцитов для CD8, CD4 и CD19, соответственно. Остальные признаки, идентифицированные на ФИГ. 2, получены из данных секвенирования РНК и содержат измерения относительных уровней экспрессии. Для некоторых примеров также получали ssGSEA для наборов признаков (представление антигена, сигнатура Т-клетки/NK-клетки, путь контрольной точки, интерферон-γ и сигнатуры MDSC/Treg). Некоторые машинно-обучаемые классификаторы тренировали только на первоначальных 38 признаках, а остальные тренировали на 38 первоначальных признаках плюс наборы генов, полученные посредством анализа ssGSEA, что в итоге дало 44 признака для таких примеров.[0095] Data from both studies was preprocessed to generate input features for training machine learning classifiers. These training data were then used to train machine learning classifiers based on a random forest that received such input data. Thereafter, the features of some subjects were used to generate a prediction using one or both of the trained classifiers, and the response prediction classification reports, including the prediction score and feature identifiers, were provided through the GUI. FIG. 1, which is described above, provides an overview of an example of some of the methods used in these examples. FIG. 2 shows 38 features that were selected for input to the machine learning classifier. The traits were chosen based on the expectation that they may be related to the prediction of whether a subject can respond to checkpoint inhibition or not, based on the current understanding of the roles of such traits. allMut denotes the tumor mutation burden of all mutations, and nonSynMut denotes the tumor mutation burden attributed to non-synonymous mutations. cd8_dec, cd4_dec, and cd19_dec denote deconvolution measurements of tumor filtering lymphocytes for CD8, CD4, and CD19, respectively. Other features identified in FIG. 2 are derived from RNA sequencing data and contain measurements of relative expression levels. For some examples, ssGSEA for feature sets (antigen presentation, T cell/NK cell signature, checkpoint pathway, interferon-γ, and MDSC/Treg signatures) were also generated. Some machine learning classifiers were trained on only the original 38 features, while others were trained on the 38 original features plus gene sets derived from ssGSEA analysis, resulting in a total of 44 features for these examples.

[0096] Данные субъектов в расчете на значение признака нормализовали по порядку ранжирования их значений как процента каждого значения в расчете на признак относительно диапазона значений для всех значений субъекта для этого признака в наборе. В этих примерах отвечаемость для тренировки была двоичной, причем субъекта помечали либо как отвечающего (включая как частичные отвечаемости, так и полную отвечаемость или долгосрочную пользу от лечения, о чем сообщалось в соответствующем исследовании, лежащем в основе) или неотвечающего (включая субъектов, о прогрессировании болезни которых в ответ на лечение сообщалось в соответствующих исследованиях, что их болезнь прогрессировала в ответ на лечение, и не сообщалось о пользе лечения).[0096] Subject data per feature value was normalized by ranking order of their values as a percentage of each value per feature relative to the range of values for all subject values for that feature in the set. In these examples, response to training was binary, with the subject labeled as either responding (including both partial responses and complete response or long-term treatment benefit as reported in the respective underlying study) or non-responder (including subjects progressing whose disease in response to treatment was reported in the relevant studies that their disease progressed in response to treatment, and no benefit of treatment was reported).

[0097] Признаки вводили в компьютерную систему, содержащую одно или более запоминающих устройств и один или более микропроцессоров. Одно или более запоминающих устройств содержали инструкции, которые при выполнении их одним или более микропроцессорами тренировали машинно-обучаемый классификатор на основе случайного леса, используя язык программирования R. Признаки субъектов сохраняли в одном или более запоминающих устройствах и анализировали с помощью одного или более микропроцессоров в соответствии с инструкциями. В этих примерах использовали 50000 деревьев решений. После тренировки в натренированный машинно-обучаемый классификатор вводили признаки субъекта, которые хранились в одном или более запоминающих устройствах компьютерной системы, и формировали оценку классификации прогноза ответа и отображали ее посредством ГПИ на дисплее компьютера. Пример тренировки показан на ФИГ. 3, а пример формирования прогноза показан на ФИГ. 4.[0097] The features were entered into a computer system containing one or more memory devices and one or more microprocessors. The one or more memories contained instructions that, when executed by one or more microprocessors, trained a machine learning random forest classifier using the R programming language. with instructions. In these examples, 50,000 decision trees were used. After training, the subject attributes stored in one or more storage devices of the computer system were entered into the trained machine learning classifier, and a response prediction classification score was formed and displayed by the GUI on the computer display. An example training is shown in FIG. 3, and an example of forecast generation is shown in FIG. 4.

[0098] Окончательные оценки прогноза формировали с помощью вероятности классификации по шкале оценок от 0 до 10. В качестве пример и в порядке пояснения вероятность 0,75 классификации события «имел ответ» на данную иммунотерапию, переводили в оценку 7,5 прогноза. Кроме того, для каждого признака в качестве границы однофакторного принятия решения определяли значение, которое максимально повышает точность классификации. Направление корреляции того, был ли признак положительно или отрицательно коррелирован с классификацией субъекта как отвечающего, определяли с помощью коэффициента корреляции Спирмена между признаком и ответом. Вышеуказанные анализы выполняли с использованием полных образцов без разделения на тренировочных и нетренировочных субъектов. Анализ эффективности проводили отдельно. Для 3-кратной перекрестной проверки и создания графика площади под кривой (ППК) использовали пакеты «care» и «cvAUC» языка программирования R с используемыми по умолчанию функцией и параметром.[0098] The final prognosis scores were generated by the probability of classifying on a rating scale from 0 to 10. As an example and by way of explanation, a probability of 0.75 classifying an event as “responding” to a given immunotherapy was converted to a prognosis score of 7.5. In addition, for each feature, the value that maximizes the accuracy of classification was determined as the boundary of one-factor decision making. The direction of correlation of whether a feature was positively or negatively correlated with a subject's classification as a responder was determined using Spearman's correlation coefficient between feature and response. The above analyzes were performed using complete samples without separation into training and non-training subjects. Efficiency analysis was performed separately. For 3-fold cross-validation and area under the curve (AUC) plotting, the "care" and "cvAUC" packages of the R programming language were used with the default function and parameter used.

[0099] На ФИГ. 5 показан пример отчета 500 в ГПИ, предоставляющего оценку прогноза классификации ответа и идентификаторы признаков. В этих примерах идентификаторы признаков предоставляли только в том случае, если квадрат важности признака (важность признака определяли по уменьшению индекса Джини признака) был больше 0,1. На ФИГ. 5 показан отчет в ГПИ для субъекта, данные которого были получены при пробном прогоне анти-PD1 на машинно-обучаемом классификаторе, натренированном на прогнозирование отвечаемости на лечение с использованием анти-PD1 (например, анти-PD1 или антитело к анти-PD1-L1). 15 признаков с важностью, превышающей минимальный порог важности, показаны в столбце 510 ПРИЗНАКИ. Важность признаков показана в столбце 520 ВАЖН. Группа, с которой связана признак согласно ФИГ. 2, показана в столбце 530 ГРУППА. Положительная или отрицательная корреляция признака с отвечаемостью показана в столбце 540 КОРР. В данном примере для указания направления корреляции использованы треугольники, где ориентированный вверх треугольник указывает положительную корреляцию, а ориентированный вниз треугольник указывает отрицательную корреляцию между значением признака и отвечаемостью. Граница однофакторного принятия решения показана в столбце 550 Г1ФПР. В данном примере граница однофакторного принятия решения определена в числовом виде как процент в диапазоне значений субъекта для данного образца, выше и ниже которого обеспечивалось наивысшее достижимое различие между отвечающими и неотвечающими (т.е. значение ниже или выше этого процента было менее точным в целом при установлении различия между отвечающим и неотвечающим субъектами). В каждой ячейке признака в столбце Г1ФПР также указана граница однофакторного принятия решения в виде штриховки слева направо, представляющей процент, указанный границей однофакторного принятия решения (т.е., чем ниже процент, тем меньше штриховки, и чем выше процент, тем больше штриховки пропорционально значению границы). Значение субъекта для каждого признака показано в столбце 560 ВВОД (в данном случае ВВОД ПТ5, идентифицирующий пациента, о прогнозе которого сообщается здесь, как пациента под номером 5, ПТ5). Число в столбце 560 ВВОД ПТ5 указывает значение субъекта для данного признака, как и штриховка, указывающая в процентах ранг значения признака субъекта относительно диапазона значений тренировочных субъектов.[0099] FIG. 5 shows an example of a GUI report 500 providing a response classification prediction score and feature identifiers. In these examples, feature identifiers were provided only if the square of feature importance (feature importance was determined by the reduction in the feature's Gini index) was greater than 0.1. FIG. Figure 5 shows a GUI report for a subject whose data was obtained from an anti-PD1 trial run on a machine learning classifier trained to predict response to an anti-PD1 treatment (e.g. anti-PD1 or anti-PD1-L1 antibody) . The 15 features with importance above the minimum importance threshold are shown in column 510 FEATURES. The importance of the features is shown in column 520 IMPORTANT. The group to which the feature is associated according to FIG. 2 is shown in column 530 GROUP. The positive or negative correlation of a trait with response is shown in column 540 CORR. In this example, triangles are used to indicate the direction of correlation, where an upward triangle indicates a positive correlation and a downward triangle indicates a negative correlation between feature value and response. The one-factor decision boundary is shown in column 550 G1FPR. In this example, the one-factor decision boundary is numerically defined as the percentage in the range of subject values for a given sample above and below which provided the highest achievable difference between responders and non-responders (i.e., a value below or above this percentage was less accurate overall at distinguishing between responding and non-responding subjects). In each feature cell, the G1FDF column also indicates the one-factor decision boundary as a left-to-right hatch representing the percentage indicated by the one-factor decision boundary (i.e., the lower the percentage, the less hatching, and the higher the percentage, the more hatches proportionally border value). The subject value for each feature is shown in INPUT column 560 (in this case INPUT PT5, identifying the patient whose prognosis is reported here as patient number 5, PT5). The number in column 560 INPUT PT5 indicates the value of the subject for a given feature, as does the hatching indicating, in percentage terms, the rank of the value of the subject's feature relative to the range of values of the training subjects.

[0100] В столбце 570 1Ф.ПРОГ сообщается, будет ли субъект реагировать на лечение согласно прогнозу на основе только значения данного признака. Таким образом, если для положительно коррелированных признаков значение в столбце 560 ВХОД ПТ5 выше значения в столбце 550 Г1ФПР, то в столбце 570 1Ф.ПРОГ указано ДА (означающее, что прогноз на основе этого признака будет указывать на то, субъект будет отвечать на лечение). Если для положительно коррелированных признаков значение в столбце 560 ВХОД ПТ5 ниже значения в столбце 550 Г1ФПР, то в столбце 570 1Ф.ПРОГ указано НЕТ (означающее, что прогноз на основе этого признака будет указывать на то, что субъект не будет отвечать на лечение). Если для отрицательно коррелированных признаков значение в столбце 560 ВХОД ПТ5 выше значения в столбце 550 Г1ФПР, то в столбце 570 1Ф.ПРОГ указано НЕТ (означающее, что прогноз на основе этого признака будет указывать на то, что субъект не будет отвечать на лечение). А если для отрицательно коррелированных признаков значение в столбце 560 ВХОД ПТ5 ниже значения в столбце 550 Г1ФПР, то в столбце 570 1Ф.ПРОГ указано ДА (означающее, что прогноз на основе этого признака будет указывать на то, субъект будет отвечать на лечение). В данном примере ячейки в столбце 570 1Ф.ПРОГ могут быть также кодированы цветом в соответствии с тем, будет ли взятый в отдельности признак прогнозировать отвечаемость. Ячейки ДА могут быть окрашены, например, в зеленый цвет (З), тогда как ячейки НЕТ могут быть окрашены в красный цвет (К). Нижняя строка 580 ПОЛНАЯ МОДЕЛЬ сообщает оценку классификации ответа, в данном случае 5,5. Можно определить пороговое значение, выше или ниже которого лечение может быть спрогнозировано как эффективное или неэффективное. Например, оценка ниже 5,0 может быть принята как прогноз того, что лечение не будет действовать для данного пациента, а оценка выше 5,0 может быть принята как прогноз того, что лечение будет действовать для этого пациента. В данном случае, когда оценку выше 5 принимают как указание на то, что лечение будет действовать для данного пациента, можно увидеть, что ценность тренировки и использования машинно-обучаемого классификатора, как описано в настоящем документе, заключается в обеспечении значительно улучшенной основы для прогнозирования, чем была бы основа для прогнозирования с использованием только одного из признаков, индикаторы которого присутствуют в отчете в ГПИ, в том смысле, что некоторые признаки по отдельности прогнозировали неотвечаемость (в том числе признак с наивысшей важностью), но машинно-обучаемый классификатор в целом прогнозирует, что пациент будет реагировать.[0100] Column 570 1F.PROG reports whether the subject will respond to treatment as predicted based on the value of this feature alone. Thus, if for positively correlated traits, the value in column 560 IN PT5 is higher than the value in column 550 G1FPR, then column 570 1F.PROG is YES (meaning that the prediction based on this trait will indicate that the subject will respond to treatment) . If, for positively correlated traits, the value in column 560 INPUT PT5 is lower than the value in column 550 G1FPR, then column 570 1F.PROG is NO (meaning that the prediction based on this trait will indicate that the subject will not respond to treatment). If, for negatively correlated traits, the value in column 560 INPUT PT5 is higher than the value in column 550 G1FPR, then column 570 1F.PROG is NO (meaning that the prediction based on this trait will indicate that the subject will not respond to treatment). And if, for negatively correlated traits, the value in column 560 INPUT PT5 is lower than the value in column 550 G1FPR, then column 570 1F.PROG is YES (meaning that the prediction based on this trait will indicate that the subject will respond to treatment). In this example, the cells in column 570 1F.PROG can also be color-coded according to whether the feature taken alone would predict response. YES cells can be colored, for example, green (G), while NO cells can be colored red (R). The bottom line 580 of the COMPLETE MODEL reports the response classification score, in this case 5.5. A threshold value can be defined above or below which a treatment can be predicted to be effective or ineffective. For example, a score below 5.0 may be taken as a prediction that the treatment will not work for a given patient, and a score above 5.0 may be taken as a prediction that the treatment will work for that patient. In this case, when a score above 5 is taken as an indication that the treatment will work for a given patient, it can be seen that the value of training and using a machine learning classifier as described herein is to provide a much improved basis for prediction. what would be the basis for predicting using only one of the features whose indicators are present in the GUI report, in the sense that some features individually predicted non-response (including the feature with the highest importance), but the machine learning classifier as a whole predicts that the patient will respond.

[0101] В данном примере отчет об оценке прогноза ответа предоставлен в ГПИ в виде индикаторов для каждого признака, включенного в отчет в ГПИ, включая вес (за счет сравнения между столбцом 560 ВХОД ПТ5 и столбцом 550 Г1ФПР), важность 520 и валентность 1Ф.ПРОГ. В некоторых примерах у пользователя может быть возможность получения доступа к открывающимся меню из разных аспектов ГПИ, такая как касание части отображения сенсорного экрана, соответствующей части отчета в ГПИ, или перемещение графического элемента, такого как курсор, с помощью устройства, например, мыши, на признак или его соответствующие индикаторы или оценки, чтобы получить доступ к дополнительной информации или выбрать дополнительный анализ, который может быть выполнен одним или более микропроцессорами посредством разных программных инструкций, хранящихся в одном или более запоминающих устройствах.[0101] In this example, the response prediction score report is provided to the GUI as indicators for each feature reported to the GUI, including weight (by comparison between INP5 column 560 and G1FPR column 550), importance 520, and valency 1F. PROG. In some examples, the user may be able to access pop-up menus from different aspects of the GUI, such as touching a portion of the touch screen display corresponding to a portion of a report in the GUI, or moving a graphic element, such as a cursor, using a device such as a mouse, to a feature or its corresponding indicators or evaluations to access additional information or select additional analysis that can be performed by one or more microprocessors through different program instructions stored in one or more memory devices.

[0102] Другой отчет 610 в ГПИ для данного субъекта представлен на ФИГ. 6. В примере на ФИГ. 6 несколько отчетов в ГПИ объединены в один отчет. В верхней части на ФИГ. 6 представлено кольцо из кольцевых секторов 610, каждый из которых соответствует признаку, имеющему важность выше минимального порога важности, как объяснено для ФИГ. 5. Признак, которому соответствует каждый кольцевой сектор, также указан надписью. Например, кольцевой сектор 630 соответствует признаку HLA.B. Каждый кольцевой сектор имеет угол, внешний радиус и внутренний радиус, и внутреннюю дугу. В данном примере угол соответствует важности признака. В данном примере углы признаков пропорциональны друг другу, чтобы можно было непосредственно сравнивать их визуально. Также в этом примере разница между внешним радиусом и внутренним радиусом сектора соответствует его весу (т.е. разнице значения признака субъекта по сравнению с границей однофакторного принятия решения). В данном примере также сообщается валентность признака с помощью стиля лини, которая очерчивает кольцевой сектор признака. Признак, кольцевой сектор которого имеет положительную валентность для субъекта (например, для все опухолевой мутационной нагрузки 640), очерчен сплошной линией, тогда как признак, кольцевой сектор которого имеет отрицательную валентность для субъекта (например, HLA.B 630), очерчен пунктирной линией.[0102] Another report 610 in the GUI for this subject is shown in FIG. 6. In the example of FIG. 6 several reports in the GUI are combined into one report. At the top in FIG. 6 is a ring of annular sectors 610, each corresponding to a feature having an importance above a minimum importance threshold as explained for FIG. 5. The sign to which each ring sector corresponds is also indicated by the inscription. For example, an annular sector 630 corresponds to an HLA.B feature. Each annular sector has an angle, an outer radius and an inner radius, and an inner arc. In this example, the angle corresponds to the importance of the feature. In this example, the feature angles are proportional to each other so that they can be directly compared visually. Also in this example, the difference between the outer radius and the inner radius of the sector corresponds to its weight (i.e., the difference in the value of the subject feature compared to the one-factor decision boundary). This example also reports the valency of the feature using a line style that outlines the ring sector of the feature. A trait whose ring sector has a positive valence for the subject (e.g., for all tumor mutation load 640) is outlined with a solid line, while a feature whose ring sector has a negative valency for the subject (e.g., HLA.B 630) is outlined with a dotted line.

[0103] В данном примере внутренние дуги расположены так, что они образуют внутренний круг. Также в этом примере во внутреннем круге сообщается оценка классификации прогноза отвечаемости для этого пациента, в данном случае 5,5. Также в этом примере общий прогноз указан сплошной линией, образующей внутренний круг, которая означает, что оценка классификации прогноза ответа превышает предварительно заданный уровень различия между прогнозом отвечаемости и неотвечаемости. В других примерах внутренний круг мог бы быть образован пунктирной линией, если бы оценка классификации прогноза ответа была ниже такого предварительно определенного порога оценки. В других примерах цвет или разные рисунки штриховки внутри кольцевого сектора и/или внутреннего круга и/или разная окраска контуров кольцевого сектора или внутреннего сектора могут указывать валентность.[0103] In this example, the inner arcs are arranged so that they form an inner circle. Also in this example, the inner circle reports the response prediction classification score for this patient, in this case 5.5. Also in this example, the overall prediction is indicated by a solid line forming an inner circle, which means that the response prediction classification score exceeds a predetermined level of difference between the response and non-response predictions. In other examples, the inner circle could be formed by a dotted line if the response prediction classification score were below such a predetermined score threshold. In other examples, the color or different hatching patterns within the annular sector and/or the inner circle and/or the different coloring of the contours of the annular sector or the inner sector may indicate valency.

[0104] В данном примере верхняя часть 610 отчета 600 в ГПИ, представленного на ФИГ. 6, содержит отчет об оценке классификации прогноза ответа и указывает важность, валентность и вес признаков. Другой пример такого отчета 1010 в ГПИ представлен на ФИГ. 10. Кольцевые секторы признаков представлены отдельно, а не с образование круга их внутренними дугами. В целях иллюстрации показаны примеры внешней дуги 1002, внутренней дуги 1001 и разность 1003 между внешним и внутренним радиусами для кольцевого сектора для CD15 и пример угла 1004 кольцевого сектора ниже кольцевого сектора 1030 для HLA.B. Внешние радиусы признаков (или разности между внутренними радиусами и внешними радиусами) указывают вес, углы указывают важность, а стиль линии, очерчивающей кольцевой сектор, указывает, имеет ли признак положительную (сплошная линия, например, кольцевой сектор для всей опухолевой мутационной нагрузки, all_tmb 1040) или отрицательную (пунктирная линия, например, кольцевой сектор для CD15) валентность. Не показано, но такой отчет 1010 в ГПИ необязательно включает оценку классификации прогноза ответа. Валентность может быть указана не контурами разных стилей, а разными цветами или штриховками разных рисунков. Также вместо кольцевых секторов могут быть использованы другие формы. Например, признаки могут быть представлены в отчете в виде прямоугольников, ширина и высота которых представляют важность и вес, или треугольников, в которых ширина основания отражает важность, высота представляет вес, а ориентация представляет валентность. Специалисту в данной области понятно, что в целях предоставления в ГПИ отчета о множестве индикаторов нескольких признаков в соответствии с аспектами настоящего изобретения могут быть адаптированы множество возможностей.[0104] In this example, the upper part 610 of the GUI report 600 shown in FIG. 6 contains a response prediction classification evaluation report and indicates the importance, valence, and weight of the features. Another example of such a GUI report 1010 is shown in FIG. 10. Ring sectors of features are presented separately, and not with the formation of a circle by their internal arcs. For illustration purposes, examples of the outer arc 1002, the inner arc 1001 and the difference 1003 between the outer and inner radii for the annular sector for CD15 and an example annular sector angle 1004 below the annular sector 1030 for HLA.B are shown. Outer radii of features (or differences between inner radii and outer radii) indicate weight, angles indicate importance, and the style of the line outlining the ring sector indicates whether the feature is positive (solid line, e.g. ring sector for all tumor mutation load, all_tmb 1040 ) or negative (dashed line, e.g. ring sector for CD15) valency. Not shown, but such a GUI report 1010 does not necessarily include an assessment of the response prediction classification. Valency may not be indicated by contours of different styles, but by different colors or shading of different patterns. Also other shapes can be used instead of annular sectors. For example, features can be presented in a report as rectangles where the width and height represent importance and weight, or triangles where the base width represents importance, height represents weight, and orientation represents valency. One skilled in the art will appreciate that a variety of possibilities can be adapted in order to report multiple indicators of multiple features to the GUI in accordance with aspects of the present invention.

[0105] Возвращаясь к отчету 600 в ГПИ, изображенному на ФИГ. 6, ниже верхней части 610 отчета, которая содержит кольцевые секторы, в ГПИ представлена часть 620 отчета в виде гистограммы. Отчет в ГПИ может иметь обе эти части, или только одну, или ни одной. Гистограмма 620 показывает столбики для каждого признака, значение которого в отчете по субъекту превышает минимальный порог важности, установленный для этого признака. Шкала 650 слева указывает в процентах ранг значения субъекта для каждого признака. Каждый столбик признака представляет значение признака субъекта для этого признака в виде процента от диапазона значений тренировочных субъектов. В качестве примера указано значение 660 субъекта для признака CD15. Также в каждом столбике представлена граница однофакторного принятия решения для данного признака, в данном случае в виде горизонтальной линии. В качестве примера указана граница 670 принятия однофакторного решения для признака CD15. Треугольники под каждым столбиком указывают, является ли признак положительно (треугольник, ориентированный вверх) или отрицательно (треугольник, ориентированный вниз) коррелированным с отвечаемостью. Пример 680 указан для CD15. Кроме того, размеры треугольников пропорциональны относительной важности каждого признака - чем больше треугольники, тем выше важность, и чем меньше треугольники, тем ниже важность. Линия между значением признака субъекта и границей однофакторного принятия решения для этого признака указывает вес признака. В качестве примера веса признака в отчете указан вес 690 для признака CD15. Валентность признака указана посредством того, является ли линия веса сплошной (положительная валентность) или пунктирной (отрицательная валентность). Как понятно специалисту в данной области, каждый из этих конкретных примеров предоставления отчета о различных индикациях разных признаков может быть опущен или замен другими графическими представлениями. Цвета и штриховка могут представлять валентность и/или корреляции для признаков, стрелки или другие направленные формы могут представлять валентность или корреляции, важность может быть представлена масштабированной схемой цветового кодирования и т.д.[0105] Returning to the GUI report 600 depicted in FIG. 6, below the top portion 610 of the report, which contains the circular sectors, a portion 620 of the report is presented in the GUI as a histogram. A report to the GUI may have both of these parts, or only one, or none. Histogram 620 shows bars for each feature whose value in the subject report exceeds the minimum importance threshold set for that feature. The scale 650 on the left indicates, in percentage terms, the rank of the subject's value for each feature. Each feature bar represents the subject feature value for that feature as a percentage of the range of training subject values. As an example, the value 660 of the subject for the feature CD15 is indicated. Also, each column represents the one-factor decision boundary for a given feature, in this case as a horizontal line. As an example, a one-way decision boundary 670 is provided for the CD15 trait. The triangles below each bar indicate whether the feature is positively (upward triangle) or negatively (downward triangle) correlated with response. Example 680 is for CD15. In addition, the sizes of the triangles are proportional to the relative importance of each feature - the larger the triangles, the higher the importance, and the smaller the triangles, the lower the importance. The line between the subject's feature value and the one-factor decision boundary for that feature indicates the weight of the feature. As an example of a feature weight, the report lists a weight of 690 for the CD15 feature. The valency of a trait is indicated by whether the weight line is solid (positive valence) or dashed (negative valence). As one skilled in the art would appreciate, each of these specific examples of reporting various indications of various features may be omitted or replaced by other graphical representations. Colors and shading may represent valency and/or correlations for features, arrows or other directional shapes may represent valency or correlations, importance may be represented by a scaled color coding scheme, and so on.

[0106] В некоторых примерах для тренировки машинно-обучаемого классификатора и формирования прогноза от натренированного машинно-обучаемого классификатора использовали наборы генов. Пример наборов генов, формируемых посредством ssGSEA, показан на ФИГ. 7. Показаны шесть наборов, сгруппированных из отдельных признаков, используемых для определения набора генов. В число примеров входят путь процессирования антигена, т.е. относящийся к представлению антигенов (710), сигнатуры 720 Т-клеток и NK-клеток, цитолитические сигнатуры 730, путь 740 контрольной точки, интерферон-гамма 750 и сигнатуры 760 MSDC/Treg. Корреляции и важности для каждого признака, включая наборы генов, когда они используются для тренировки машинно-обучаемого классификатора PD1 и CTLA4, указаны в столбцах 770 и 780, соответственно. В некоторых случаях выделенный в ячейках, обведенных пунктирными рамками, набор генов обеспечивал либо корреляцию более высокой величины, либо более высокую важность, чем любой отдельный признак, на котором был определен набор генов с использованием ssGSEA, что указывает на ценность включения наборов генов в качестве признаков. Полезность включения ssGSEA также показана на ФИГ. 9. На ФИГ. 9 показаны два отчета в ГПИ о прогнозе отвечаемости для того же субъекта с использованием двух разных машинно-обучаемых классификаторов. Прогноз 910 слева был получен путем формирования прогноза без использования наборов генов ssGSEA в качестве признаков во время тренировки или прогнозирования. Прогноз 920 справа был получен путем формирования прогноза с использованием наборов генов ssGSEA в качестве признаков во время тренировки и прогнозирования. Когда включали наборы генов, полученные с помощью ssGSEA, меньше признаков превышали минимальную пороговую границу (11 против 15), в том числе некоторые наборы генов (которые по определению не были включены в прогноз 910, получаемый без наборов генов), без ущерба для общего прогнозирования (например, в обоих случаях прогноз превышал оценку 5,0, установленную в качестве минимальной оценки классификации прогноза ответа, инициирующей классификацию субъекта как отвечающего).[0106] In some examples, sets of genes were used to train the machine learning classifier and generate a prediction from the trained machine learning classifier. An example of gene sets generated by ssGSEA is shown in FIG. 7. Shown are six sets grouped from individual traits used to define a set of genes. Examples include the antigen processing pathway, ie. relating to the presentation of antigens (710), T cell and NK cell signatures 720, cytolytic signatures 730, checkpoint pathway 740, interferon gamma 750, and MSDC/Treg signatures 760. Correlations and importances for each trait, including gene sets, when used to train the PD1 and CTLA4 machine learning classifier are shown in columns 770 and 780, respectively. In some cases, highlighted in dotted boxes, a set of genes provided either a correlation of higher magnitude or higher importance than any single trait on which the set of genes was determined using ssGSEA, indicating the value of including sets of genes as traits. . The utility of including ssGSEA is also shown in FIG. 9. In FIG. Figure 9 shows two response prediction reports in GUI for the same subject using two different machine learning classifiers. The 910 prediction on the left was obtained by generating a prediction without using the ssGSEA gene sets as features during training or prediction. Prediction 920 on the right was obtained by generating a prediction using the ssGSEA gene sets as features during training and prediction. When ssGSEA-derived gene sets were included, fewer traits exceeded the minimum threshold (11 vs 15), including some gene sets (which by definition were not included in the 910 prediction obtained without gene sets), without compromising overall prediction. (e.g., in both cases, the prediction was greater than the score of 5.0 set as the minimum response prediction classification score that triggers the subject's classification as responder).

[0107] На ФИГ. 8 показаны два отчета в ГПИ, полученные для одного и того же пациента, для которого прогноз формировали с использованием двух разных машинно-обучаемых классификаторов - один 810 натренированный на прогнозирование отвечаемости на лечение при помощи анти-CTLA4, а другой 820 натренированный на прогнозирование отвечаемости на лечение с помощью анти-PD1, с использованием в обоих классификаторах признаков, изображенных на ФИГ. 2. Машинно-обучаемый классификатор 810 для анти-CTLA4 дал оценку классификации прогноза ответа 3,8, предсказывающую, что субъект не будет отвечать на лечение с помощью анти-CTLA4 (при использовании порога оценки классификации прогноза ответа 5,0). В данном случае 810 валентность оценки классификации прогноза ответа (неотвечаемость) указана пунктирными линиями 815 вокруг внутреннего круга, в котором изображена оценка классификации прогноза ответа. Точность такого прогноза подкреплена классификацией ответа данного пациента в использованном в качестве источника клиническом исследовании (Van Allen и др.) как «прогрессирование болезни», указывающей на то, что субъект не отвечал на лечение с помощью анти-CTLA4. Однако машинно-обучаемый классификатор 820 для анти-PD1 сформировал оценку классификации прогноза ответа 6,7, предсказывающую, что субъект будет отвечать на лечение с помощью анти-PD1 (например, анти-PD1 или антитела к анти-PD-L1) (опять же при использовании порога оценки классификации прогноза ответа 5,0). В данном случае 820 оценка классификации прогноза ответа (отвечаемости) указана сплошной линией 817 вокруг внутреннего круга, в котором изображена оценка классификации прогноза ответа.[0107] FIG. 8 shows two GIP reports from the same patient who was predicted using two different machine learning classifiers - one 810 trained to predict response to treatment with anti-CTLA4, and the other 820 trained to predict response to treatment with anti-CTLA4. treatment with anti-PD1, using in both classifiers features depicted in FIG. 2. The anti-CTLA4 machine learning classifier 810 gave a response prediction classification score of 3.8 predicting that the subject would not respond to anti-CTLA4 treatment (using a response prediction classification score threshold of 5.0). In this case 810, the valence of the response prediction classification score (non-response) is indicated by dotted lines 815 around the inner circle in which the response prediction classification score is depicted. The accuracy of this prediction is supported by the classification of this patient's response in the reference clinical study (Van Allen et al.) as "disease progression", indicating that the subject did not respond to anti-CTLA4 treatment. However, the anti-PD1 machine learning classifier 820 generated a response prediction classification score of 6.7 predicting that the subject would respond to treatment with an anti-PD1 (e.g., anti-PD1 or anti-PD-L1 antibody) (again when using a response prediction classification score threshold of 5.0). In this case 820, the response prediction (response) classification score is indicated by a solid line 817 around the inner circle that depicts the response prediction classification score.

[0108] Разные оценки классификации прогноза ответа (и соответствующие различия в валентности, весе и важности различных параметров) в зависимости от используемого машинно-обучаемого классификатора отражают мощь способов, раскрытых в настоящем документе. Например, индикаторы, сообщенные для HLA.A 830, указывают на то, что он имеет отрицательную валентность для прогнозирования отвечаемости пациента на лечение с помощью анти-CTLA4, но положительную валентность для прогнозирования отвечаемости субъекта на лечение с помощью анти-PD1. Кроме того, значения признаков для несинонимичной опухолевой мутационной нагрузки и всей опухолевой мутационной нагрузки 840 не превзошли минимального порога важности в машинно-обучаемом классификаторе для анти-CTLA4, но превзошли в машинно-обучаемом классификаторе для анти-PD1.[0108] The different response prediction classification scores (and corresponding differences in valence, weight, and importance of various parameters) depending on the machine learning classifier used reflect the power of the methods disclosed herein. For example, the indicators reported for HLA.A 830 indicate that it has a negative valence for predicting a patient's response to anti-CTLA4 treatment, but a positive valence for predicting a subject's response to anti-PD1 treatment. In addition, the feature values for the non-synonymous tumor mutation load and the total tumor mutation load 840 did not exceed the minimum threshold of importance in the machine learning classifier for anti-CTLA4, but did exceed in the machine learning classifier for anti-PD1.

[0109] Как и в примере, изображенном на ФИГ. 4, примеры отчетов в ГПИ, изображенные на ФИГ. 6, 8, 9 и 10, могут включать возможность взаимодействия с пользователем. Таким образом, в некоторых примерах у пользователя может быть возможность получения доступа к открывающимся меню из разных аспектов ГПИ, такая как касание части отображения сенсорного экрана, соответствующей части отчета в ГПИ, или перемещение графического элемента, такого как курсор, с помощью устройства, например, мыши, на признак (например, кольцевой сектор или столбик в гистограмме или другие индикаторы), чтобы получить доступ к дополнительной информации или выбрать дополнительный анализ, который может быть выполнен одним или более микропроцессорами посредством разных программных инструкций, хранящихся в одном или более запоминающих устройств.[0109] As in the example shown in FIG. 4, examples of reports in the GUI shown in FIG. 6, 8, 9 and 10 may include the ability to interact with the user. Thus, in some examples, it may be possible for a user to access pop-up menus from various aspects of the GUI, such as touching a portion of a touch screen display corresponding to a portion of a report in the GUI, or moving a graphical element, such as a cursor, with a device such as mouse, on a feature (eg, a ring sector or a bar in a histogram or other indicators) to access additional information or select additional analysis that can be performed by one or more microprocessors through different program instructions stored in one or more memory devices.

[0110] На Фиг. 11А-11D показано, что при использовании всех 38 признаков, изображенных на ФИГ. 2, эффективность формируемого классификатора выше, чем при использовании отдельно взятых факторов. Это было справедливо в отношении машинно-обучаемых классификаторов, натренированы ли они на прогнозирование отвечаемости на лечение с помощью анти-PD1 или с помощью анти-CTLA4. На ФИГ. 11А показано, что при использовании всех 38 признаков для тренировки и тестирования машинно-обучаемого классификатора на прогнозирование отвечаемости, например, на лечение с помощью анти-PD1, ППК рабочей характеристики приемника (auROC) отношения ложно положительных прогнозов к истинно положительным составила 1,00, когда машинно-обучаемый классификатор был перетренирован без перекрестной проверки (CV), причем auROC достигала 1,00 по сравнению с auROC, равным 0,64, для усредненных отдельных факторов, как показано на ФИГ. 11В. На ФИГ. 11С и 11D также показано, что использование 38 признаков, изображенных на ФИГ. 2, дает более точный результат, что все три лучших однофакторных признаков, HLA-B, nonSyn_tmb и all_tmb.[0110] In FIG. 11A-11D show that using all 38 features depicted in FIG. 2, the efficiency of the generated classifier is higher than when using individual factors. This was true for machine learning classifiers, whether they were trained to predict response to treatment with anti-PD1 or with anti-CTLA4. FIG. 11A shows that when using all 38 features to train and test a machine learning classifier for predicting responses to, for example, anti-PD1 treatment, the receiver operating characteristic (auROC) ratio of false positives to true positives was 1.00. when the machine learning classifier was overtrained without cross-validation (CV), with auROC reaching 1.00 compared to auROC of 0.64 for averaged individual factors as shown in FIG. 11V. FIG. 11C and 11D also show that the use of the 38 features depicted in FIG. 2 gives a more accurate result that all three of the best single factor traits, HLA-B, nonSyn_tmb and all_tmb.

[0111] На ФИГ. 12A-12D приведены графики, показывающие влияние использования наборов генов, полученных посредством ssGSEA, на эффективность классификатора. Эффективность ssGSEA сравнима с эффективностью при использовании 38 признаков, изображенных на ФИГ. 2. На ФИГ. 12А, 12В и 12С приведен отчет по auROC с 3-кратной перекрестной проверкой в случае использования 38 признаков, изображенных на ФИГ. 2, для прогнозирования отвечаемости на лечение с помощью анти-PD1 (ФИГ. 12А) или анти-CTLA4 (ФИГ. 12В), или в случае использования 38 признаков плюс 6 наборов генов, изображенных на ФИГ. 7, для прогнозирования отвечаемости на лечение с помощью анти-PD1 (ФИГ. 12С). Хотя при включении 6 наборов генов, полученных посредством ssGSEA, эффективность прогнозирования лечения с помощью анти-PD1 была снижена с 0,69 до 0,64 (если сравнивать ФИГ. 12А с ФИГ. 12С), количество признаков, которые превысили минимальный порог важности, сократилось с 15 до 11 (как обсуждалось выше; см., например, ФИГ. 8). На ФИГ. 12D показаны сравнимые результаты t-критерия Стьюдента для ложно и истинно положительных результатов по оценке классификации прогноза ответа для машинно-обучаемых классификаторов (без перекрестной проверки). Поэтому в некоторых примерах включение наборов генов в качестве признаков может улучшить общую устойчивость к ошибкам классификатора, помочь избежать перетренировки и позволяет более четко интерпретировать важные признаки и их идентификаторы.[0111] FIG. 12A-12D are graphs showing the effect of using ssGSEA-derived gene sets on classifier performance. The performance of ssGSEA is comparable to that of the 38 features depicted in FIG. 2. In FIG. 12A, 12B, and 12C show a 3-fold cross-validation report of auROC using the 38 features depicted in FIG. 2 to predict responsiveness to treatment with anti-PD1 (FIG. 12A) or anti-CTLA4 (FIG. 12B), or when using the 38 traits plus 6 gene sets depicted in FIG. 7 to predict response to anti-PD1 treatment (FIG. 12C). Although the inclusion of 6 ssGSEA-derived gene sets reduced anti-PD1 treatment predictive power from 0.69 to 0.64 (comparing FIG. 12A with FIG. 12C), the number of features that exceeded the minimum threshold of importance decreased from 15 to 11 (as discussed above; see, for example, FIG. 8). FIG. 12D shows comparable Student's t-test results for false and true positive results on response prediction classification evaluation for machine learning classifiers (no cross-validation). Therefore, in some examples, including sets of genes as features can improve the overall classifier error tolerance, help avoid overtraining, and allow more clear interpretation of important features and their identifiers.

[0112] Данные, использованные в этих примерах, принадлежат субъектам, включенным в исследование по проверке эффективности ингибиторов контрольной точки - антитела к анти-CTLA4, антитела к анти-PD1 и антитела к анти-PD1-L1 - у пациентов с меланомой. Однако, как понятно специалистам в данной области, исходя из роли блокировок контрольных точек, известных своей ролью в снижении эффективности иммуноонкологического лечения других раков, и роли признаков, вроде включенных в настоящий документ, в функции пути контрольной точки, раскрытые в настоящем документе способы, системы и классификаторы будут в равной степени полезны и эффективны также при формировании прогнозов отвечаемости субъекта на эти ингибиторы контрольной точки в случае других раков, включая рак молочной железы, раки пищеварительной системы, рак печени, рак мочевого пузыря, лимфому, лейкемию, раки костной ткани, раки нервной системы, раки легких, раки поджелудочной железы или другие. Кроме того, как также понятно специалистам в данной области, с помощью способов, систем и классификаторов, раскрытых в настоящем документе, можно также прогнозировать отвечаемость на ингибиторы контрольной точки в дополнение к тем, что специально указаны в вышеприведенных примерах, описанных в настоящем документе, которые служат просто не имеющими ограничительного характера примерами применимости этих способов, систем и классификаторов.[0112] The data used in these examples is from subjects included in a study testing the efficacy of anti-CTLA4 antibodies, anti-PD1 antibodies, and anti-PD1-L1 checkpoint inhibitors in patients with melanoma. However, as will be understood by those skilled in the art, based on the role of checkpoint blockages known to play a role in reducing the efficacy of immuno-oncological treatments for other cancers, and the role of features such as those included herein in function of the checkpoint pathway, the methods, systems disclosed herein and classifiers will be equally useful and effective also in predicting a subject's response to these checkpoint inhibitors in other cancers, including breast cancer, digestive system cancers, liver cancer, bladder cancer, lymphoma, leukemia, bone cancers, cancers. nervous system, lung cancers, pancreatic cancers or others. In addition, as will also be appreciated by those skilled in the art, the methods, systems, and classifiers disclosed herein can also predict response to checkpoint inhibitors in addition to those specifically noted in the above examples described herein, which are merely non-limiting examples of the applicability of these methods, systems, and classifiers.

[0113] Недостатком данного анализа эффективности является малый размер выборки. Даже при десятках признаков перетренировка неизбежна. Между тем результаты кратной перекрестной проверки очень неустойчивые и демонстрируют дискретизацию точек auROC вместо непрерывной кривой. Однако в рамках имеющихся ограничений полная модель явно эффективнее факторов, взятых в отдельности.[0113] A disadvantage of this efficacy analysis is the small sample size. Even with dozens of signs, overtraining is inevitable. Meanwhile, the multiple cross-validation results are very erratic and show discretization of auROC points instead of a continuous curve. However, within the existing limitations, the full model is clearly more efficient than the factors taken separately.

[0114] Хотя в настоящем документе подробно изображены и описаны предпочтительные варианты реализации, специалистам в данной области техники очевидно, что могут быть внесены различные модификации, добавления, изъятия и т.п. в пределах сущности настоящего изобретения, и поэтому они считаются входящими в объем настоящего изобретения, как определено в нижеследующей формуле изобретения.[0114] While the preferred embodiments are depicted and described in detail herein, those skilled in the art will recognize that various modifications, additions, deletions, and the like may be made. within the spirit of the present invention and are therefore considered to be within the scope of the present invention as defined in the following claims.

[0115] Следует понимать, что все сочетания вышеупомянутых понятий и дополнительных понятий, обсуждаемых более подробно в настоящем документе (при условии, что такие понятия не являются взаимно несовместимыми), рассматриваются как часть патентоспособного предмета изобретения, описанного в настоящей заявке. В частности, все сочетания заявленного предмета изобретения в конце данного описания рассматриваются как часть патентоспособного предмета изобретения, описанного в настоящей заявке.[0115] It should be understood that all combinations of the above concepts and additional concepts discussed in more detail herein (provided that such concepts are not mutually incompatible) are considered part of the patentable subject matter described in this application. In particular, all combinations of the claimed subject matter at the end of this specification are considered to be part of the patentable subject matter described in this application.

Claims (42)

1. Cпособ лечения рака, включающий:1. A method of treating cancer, including: - введение в натренированный машинно-обучаемый классификатор геномной информации указанного нетренировочного субъекта, содержащей признаки из профиля опухоли, полученного от нетренировочного субъекта, причем - introduction into the trained machine-learning classifier of the genomic information of the specified non-training subject, containing features from the tumor profile obtained from the non-training subject, and натренированный машинно-обучаемый классификатор натренирован на геномной информации множества тренировочных субъектов и отвечаемости каждого из множества тренировочных субъектов на лечение, включающее ингибирование контрольной точки, причем геномная информация множества тренировочных субъектов содержит признаки профилей опухоли, полученных от каждого из множества тренировочных субъектов, а машинно-обучаемый классификатор натренирован на прогнозирование отвечаемости на лечение; the trained machine learning classifier is trained on the genomic information of a plurality of training subjects and the response of each of the plurality of training subjects to treatment, including checkpoint inhibition, and the genomic information of the plurality of training subjects contains features of tumor profiles obtained from each of the plurality of training subjects, and the machine learning the classifier is trained to predict response to treatment; - формирование классификации отвечаемости на ингибирование контрольной точки для нетренировочного субъекта с использованием натренированного машинно-обучаемого классификатора, причем классификация отвечаемости на ингибирование контрольной точки позволяет прогнозировать ответ нетренировочного субъекта на ингибирование контрольной точки; и - forming a classification of response to checkpoint inhibition for a non-training subject using a trained machine-learning classifier, and the classification of response to inhibition of a checkpoint allows you to predict the response of a non-training subject to inhibition of a checkpoint; And - применение лечения рака у нетренировочного субъекта, причем указанное лечение рака включает лечение ингибированием контрольной точки, если оценка отвечаемости на лечение ингибированием контрольной точки равна или превышает пороговое значение оценки классификации прогнозирования ответа, и не включает лечение ингибированием контрольной точки, если оценка отвечаемости на лечение ингибированием контрольной точки ниже порогового значения оценки классификации прогнозирования ответа.administering a cancer treatment to a non-training subject, wherein said cancer treatment includes checkpoint inhibition treatment if the checkpoint inhibition treatment response score is equal to or greater than the response prediction classification score threshold, and does not include checkpoint inhibition treatment if the inhibition treatment response score is checkpoint below the response prediction classification score threshold. 2. Способ по п. 1, в котором по меньшей мере некоторые из признаков из профиля опухоли, полученного от нетренировочного субъекта, или по меньшей мере некоторые из признаков из профиля опухоли, полученного от одного или более тренировочных субъектов, выбраны из группы, состоящей из: общей мутационной нагрузки, состоящей из всех мутаций; общей мутационной нагрузки, состоящей из несинонимичных мутаций, экспрессии бета-2-микроглобулина (B2M), экспрессии бета-10-субъединицы протеасомы (PSMB10), экспрессии переносчика антигенных пептидов 1 (TAP1), экспрессии транспортера антигенных пептидов 2 (TAP2), экспрессии лейкоцитарного антигена человека A (HLA-A), экспрессии главного комплекса гистосовместимости, класс I, B (HLA-B), экспрессии главного комплекса гистосовместимости, класс I, C (HLA-C), экспрессии главного комплекса гистосовместимости, класс II, DQ альфа-1 (HLA-DQA1), экспрессии антигена гистосовместимости HLA класс II, бета-цепь DRB1(HLA-DRB1), экспрессии антигена гистосовместимости HLA класс I, альфа-цепь E (HLA-E), экспрессии гранулярного белка естественной клетки-киллера 7 (NKG7), экспрессии хемокиноподобного рецептора 1 (CMKLR1), инфильтрации опухоли клетками, экспрессирующими кластер дифференцировки 8 (CD8), инфильтрации опухоли клетками, экспрессирующими кластер дифференцировки 4 (CD4), инфильтрации опухоли клетками, экспрессирующими кластер дифференцировки 19 (CD19), экспрессии гранзима A (GZMA), экспрессии перфорина-1 (PRF1), экспрессии цитотоксического Т-лимфоцит-ассоциированного белка 4 (CTLA4), экспрессии белка программируемой клеточной смерти 1 (PD1), экспрессии лиганда 1 программируемой смерти (PDL1), экспрессии лиганда 2 программируемой клеточной смерти 1 (PDL2), экспрессии гена активации лимфоцитов 3 (LAG3), экспрессии T-клеточного иммунорецептора с доменами Ig и ITIM (TIGIT), экспрессии кластера дифференцировки 276 (CD276), экспрессии хемокинового (C-C мотива) лиганда 5 (CCL5), экспрессии CD27, экспрессии хемокинового (C-X-C мотива) лиганда 9 (CXCL9), экспрессии хемокинового (C-X-C мотива) рецептора 6 (CXCR6), экспрессии индоламин-2,3-диоксигеназы (IDO), экспрессии сигнального трансдуктора и активатора транскрипции 1 (STAT1), экспрессии 3-фукозил-N-ацетил-лактозамина (CD15), экспрессии альфа-цепи рецептора интерлейкина-2 (CD25), экспрессии сиглека-3 (CD33), экспрессии кластера дифференцировки 39 (CD39), экспрессии кластера дифференцировки (CD118), экспрессии транскрипционного фактора forkheadbox P3 (FOXP3) и любой комбинации двух или более вышеперечисленных признаков.2. The method of claim 1, wherein at least some of the features from a tumor profile obtained from a non-training subject, or at least some of the features from a tumor profile obtained from one or more training subjects, are selected from the group consisting of : total mutation load, consisting of all mutations; total mutation load, consisting of non-synonymous mutations, expression of beta-2-microglobulin (B2M), expression of the beta-10 proteasome subunit (PSMB10), expression of antigenic peptide transporter 1 (TAP1), expression of antigenic peptide transporter 2 (TAP2), expression of leukocyte human antigen A (HLA-A), expression of major histocompatibility complex, class I, B (HLA-B), expression of major histocompatibility complex, class I, C (HLA-C), expression of major histocompatibility complex, class II, DQ alpha- 1 (HLA-DQA1), expression of histocompatibility antigen HLA class II, beta chain DRB1(HLA-DRB1), expression of histocompatibility antigen HLA class I, alpha chain E (HLA-E), expression of natural killer cell granular protein 7 ( NKG7), expression of chemokine-like receptor 1 (CMKLR1), tumor infiltration with cells expressing cassette of differentiation 8 (CD8), tumor infiltration with cells expressing cassette of differentiation 4 (CD4), tumor infiltration with cells expressing cassette of differentiation 19 (CD19), expression of granzyme A (GZMA), expression of perforin-1 (PRF1), expression of cytotoxic T-lymphocyte-associated protein 4 (CTLA4), expression of programmed cell death protein 1 (PD1), expression of programmed death ligand 1 (PDL1), expression of programmed cell death ligand 2 1 (PDL2), expression of lymphocyte activation gene 3 (LAG3), expression of T-cell immunoreceptor with Ig domains and ITIM (TIGIT), expression of differentiation cluster 276 (CD276), expression of chemokine (C-C motif) ligand 5 (CCL5), expression of CD27 , expression of chemokine (C-X-C motif) ligand 9 (CXCL9), expression of chemokine (C-X-C motif) receptor 6 (CXCR6), expression of indolamine-2,3-dioxygenase (IDO), expression of signal transducer and transcription activator 1 (STAT1), expression of 3 -fucosyl-N-acetyl-lactosamine (CD15), interleukin-2 receptor alpha chain expression (CD25), Siglec-3 expression (CD33), differentiation cluster 39 (CD39) expression, differentiation cluster expression (CD118), transcription factor expression forkheadbox P3 (FOXP3) and any combination of two or more of the above. 3. Способ по п. 1, в котором по меньшей мере некоторые из тренировочных признаков или по меньшей мере некоторые из нетренировочных признаков включают наборы генов.3. The method of claim 1, wherein at least some of the training traits, or at least some of the non-training traits, comprise sets of genes. 4. Способ по п. 3, в котором наборы генов выбраны с использованием анализа обогащения набора генов одного образца.4. The method of claim 3, wherein the gene sets are selected using single sample gene set enrichment analysis. 5. Способ по п. 1, в котором машинно-обучаемый классификатор представляет собой случайный лес.5. The method of claim 1, wherein the machine learning classifier is a random forest. 6. Способ по п. 5, в котором при тренировке машинно-обучаемого классификатора используют по меньшей мере 50000 деревьев принятия решений.6. The method of claim 5, wherein at least 50,000 decision trees are used to train the machine learning classifier. 7. Способ по п. 1, в котором классификация отвечаемости на ингибирование контрольной точки включает один или более идентификатор признаков, выбранный из валентности признака, важности признака и веса признака.7. The method of claim 1, wherein the checkpoint inhibition responsiveness classification includes one or more feature identifiers selected from feature valency, feature importance, and feature weight. 8. Способ по п. 7, в котором классификация отвечаемости на ингибирование контрольной точки представлена с помощью графического пользовательского интерфейса и указанный графический пользовательский интерфейс предоставляет отчет об идентификаторах признаков в виде характеристик кольцевого сектора, где угол кольцевого сектора указывает важность признака, наружный радиус кольцевого сектора указывает вес признака, а цвет кольцевого сектора указывает валентность признака. 8. The method of claim 7, wherein the classification of response to checkpoint inhibition is presented using a graphical user interface, and said graphical user interface reports the feature identifiers as ring sector characteristics, where the ring sector angle indicates the importance of the feature, the outer radius of the ring sector indicates the weight of the feature, and the color of the annular sector indicates the valency of the feature. 9. Способ по п. 8, в котором важность признака включает снижение индекса Джини признака.9. The method of claim 8, wherein the importance of the feature includes decreasing the Gini index of the feature. 10. Способ по п. 9, в котором графический пользовательский интерфейс предоставляет отчет об идентификаторе признака тогда и только тогда, когда важность признака выше порогового значения.10. The method of claim 9, wherein the graphical user interface reports the feature ID if and only if the feature importance is above a threshold. 11. Способ по п. 10, в котором важность признака не превышает пороговое значение, если квадрат важности признака не превышает 0,1.11. The method of claim 10, wherein the importance of the feature does not exceed a threshold value if the square of the importance of the feature does not exceed 0.1. 12. Способ по п. 10, в котором каждый из кольцевых секторов содержит внутреннюю дугу и внутренние дуги кольцевых секторов расположены таким образом, что они образуют круг.12. The method of claim. 10, in which each of the annular sectors contains an internal arc and the internal arcs of the annular sectors are arranged so that they form a circle. 13. Способ по п. 1, дополнительно включающий ввод в натренированный машинно-обучаемый классификатор отвечаемости нетренировочного субъекта на лечение ингибированием контрольной точки и дальнейшую тренировку машинно-обучаемого классификатора, где дальнейшая тренировка включает тренировку натренированного машинно-обучаемого классификатора на признаках образцов опухоли, полученных от нетренировочного субъекта, и отвечаемости нетренировочного субъекта на лечение ингибированием контрольной точки.13. The method of claim 1, further comprising entering into the trained machine learning classifier the response of a non-training subject to checkpoint inhibition treatment and further training the machine learning classifier, where further training includes training the trained machine learning classifier on features of tumor samples obtained from a non-training subject, and the non-training subject's response to checkpoint inhibition treatment. 14. Компьютерная система для формирования оценки отвечаемости на ингибирование контрольной точки для нетренировочного субъекта, содержащая:14. A computer system for the formation of an assessment of the response to inhibition of the control point for a non-training subject, containing: - один или более микропроцессоров, - one or more microprocessors, - один или более блоков памяти для хранения натренированного машинно-обучаемого классификатора и геномной информации нетренировочного субъекта, причем натренированный машинно-обучаемый классификатор натренирован на геномной информации множества тренировочных субъектов и отвечаемости каждого из множества тренировочных субъектов на лечение, включающее лечение ингибированием контрольной точки, причем геномная информация множества тренировочных субъектов содержит признаки профилей опухоли, полученных от каждого из множества тренировочных субъектов, а машинно-обучаемый классификатор натренирован на прогнозирование отвечаемости на лечение ингибированием контрольной точки, причем геномная информация нетренировочного субъекта содержит признаки из профиля опухоли, полученного от нетренировочного субъекта, и - one or more memory blocks for storing a trained machine learning classifier and genomic information of a non-training subject, wherein the trained machine learning classifier is trained on the genomic information of a plurality of training subjects and the response of each of the plurality of training subjects to treatment, including checkpoint inhibition treatment, and genomic the information of the set of training subjects contains features of the tumor profiles obtained from each of the set of training subjects, and the machine learning classifier is trained to predict response to treatment by checkpoint inhibition, and the genomic information of the non-training subject contains features from the tumor profile obtained from the non-training subject, and указанные один или более блоков памяти хранят инструкции, которые, при исполнении одним или более микропроцессорами, вызывают формирование компьютерной системой оценки отвечаемости на лечение ингибированием контрольной точки для нетренировочного субъекта с использованием натренированного машинно-обучаемого классификатора и предоставление указанной оценки отвечаемости на лечение ингибированием контрольной точки нетренировочного субъекта с использованием графического пользовательского интерфейса, причем оценка отвечаемости на лечение ингибированием контрольной точки позволяет прогнозировать ответ нетренировочного субъекта на ингибирование контрольной точки,said one or more memories store instructions which, when executed by the one or more microprocessors, cause the computer system to generate a checkpoint inhibition treatment responsiveness score for a non-training subject using a trained machine learning classifier and provide said non-training subject inhibition treatment responsiveness score to the non-training subject. of a subject using a graphical user interface, wherein the assessment of response to treatment with checkpoint inhibition predicts the response of a non-training subject to checkpoint inhibition, причем указанный машинно-обучаемый классификатор представляет собой случайный лес и при тренировке машинно-обучаемого классификатора используют по меньшей мере 50000 деревьев принятия решений.wherein said machine learning classifier is a random forest and at least 50,000 decision trees are used in training the machine learning classifier. 15. Система по п. 14, в которой по меньшей мере некоторые из признаков из профиля опухоли, полученного от нетренировочного субъекта, или по меньшей мере некоторые из признаков из профиля опухоли, полученного от одного или более тренировочных субъектов, выбраны из группы, состоящей из: общей мутационной нагрузки, состоящей из всех мутаций; общей мутационной нагрузки, состоящей из несинонимичных мутаций, экспрессии бета-2-микроглобулина (B2M), экспрессии бета-10-субъединицы протеасомы (PSMB10), экспрессии переносчика антигенных пептидов 1 (TAP1), экспрессии транспортера антигенных пептидов 2 (TAP2), экспрессии лейкоцитарного антигена человека A (HLA-A), экспрессии главного комплекса гистосовместимости, класс I, B (HLA-B), экспрессии главного комплекса гистосовместимости, класс I, C (HLA-C), экспрессии главного комплекса гистосовместимости, класс II, DQ альфа-1 (HLA-DQA1), экспрессии антигена гистосовместимости HLA класс II, бета-цепь DRB1(HLA-DRB1), экспрессии антигена гистосовместимости HLA класс I, альфа-цепь E (HLA-E), экспрессии гранулярного белка естественной клетки-киллера 7 (NKG7), экспрессии хемокиноподобного рецептора 1 (CMKLR1), инфильтрации опухоли клетками, экспрессирующими кластер дифференцировки 8 (CD8), инфильтрации опухоли клетками, экспрессирующими кластер дифференцировки 4 (CD4), инфильтрации опухоли клетками, экспрессирующими кластер дифференцировки 19 (CD19), экспрессии гранзима A (GZMA), экспрессии перфорина-1 (PRF1), экспрессии цитотоксического Т-лимфоцит-ассоциированного белка 4 (CTLA4), экспрессии белка программируемой клеточной смерти 1 (PD1), экспрессии лиганда 1 программируемой смерти (PDL1), экспрессии лиганда 2 программируемой клеточной смерти 1 (PDL2), экспрессии гена активации лимфоцитов 3 (LAG3), экспрессии T-клеточного иммунорецептора с доменами Ig и ITIM (TIGIT), экспрессии кластера дифференцировки 276 (CD276), экспрессии хемокинового (C-C мотива) лиганда 5 (CCL5), экспрессии CD27, экспрессии хемокинового (C-X-C мотива) лиганда 9 (CXCL9), экспрессии хемокинового (C-X-C мотива) рецептора 6 (CXCR6), экспрессии индоламин-2,3-диоксигеназы (IDO), экспрессии сигнального трансдуктора и активатора транскрипции 1 (STAT1), экспрессии 3-фукозил-N-ацетил-лактозамина (CD15), экспрессии альфа-цепи рецептора интерлейкина-2 (CD25), экспрессии сиглека-3 (CD33), экспрессии кластера дифференцировки 39 (CD39), экспрессии кластера дифференцировки (CD118), экспрессии транскрипционного фактора forkheadbox P3 (FOXP3) и любой комбинации двух или более вышеперечисленных признаков.15. The system of claim 14, wherein at least some of the features from a tumor profile obtained from a non-training subject, or at least some of the features from a tumor profile obtained from one or more training subjects, are selected from the group consisting of : total mutation load, consisting of all mutations; total mutation load, consisting of non-synonymous mutations, expression of beta-2-microglobulin (B2M), expression of the beta-10 proteasome subunit (PSMB10), expression of antigenic peptide transporter 1 (TAP1), expression of antigenic peptide transporter 2 (TAP2), expression of leukocyte human antigen A (HLA-A), expression of major histocompatibility complex, class I, B (HLA-B), expression of major histocompatibility complex, class I, C (HLA-C), expression of major histocompatibility complex, class II, DQ alpha- 1 (HLA-DQA1), expression of histocompatibility antigen HLA class II, beta chain DRB1(HLA-DRB1), expression of histocompatibility antigen HLA class I, alpha chain E (HLA-E), expression of natural killer cell granular protein 7 ( NKG7), expression of chemokine-like receptor 1 (CMKLR1), tumor infiltration with cells expressing cassette of differentiation 8 (CD8), tumor infiltration with cells expressing cassette of differentiation 4 (CD4), tumor infiltration with cells expressing cassette of differentiation 19 (CD19), expression of granzyme A (GZMA), expression of perforin-1 (PRF1), expression of cytotoxic T-lymphocyte-associated protein 4 (CTLA4), expression of programmed cell death protein 1 (PD1), expression of programmed death ligand 1 (PDL1), expression of programmed cell death ligand 2 1 (PDL2), expression of lymphocyte activation gene 3 (LAG3), expression of T-cell immunoreceptor with Ig domains and ITIM (TIGIT), expression of differentiation cluster 276 (CD276), expression of chemokine (C-C motif) ligand 5 (CCL5), expression of CD27 , expression of chemokine (C-X-C motif) ligand 9 (CXCL9), expression of chemokine (C-X-C motif) receptor 6 (CXCR6), expression of indolamine-2,3-dioxygenase (IDO), expression of signal transducer and transcription activator 1 (STAT1), expression of 3 -fucosyl-N-acetyl-lactosamine (CD15), interleukin-2 receptor alpha chain expression (CD25), Siglec-3 expression (CD33), differentiation cluster 39 (CD39) expression, differentiation cluster expression (CD118), transcription factor expression forkheadbox P3 (FOXP3) and any combination of two or more of the above. 16. Система по п. 14, в которой по меньшей мере некоторые из тренировочных признаков или по меньшей мере некоторые из нетренировочных признаков включают наборы генов.16. The system of claim 14, wherein at least some of the training traits, or at least some of the non-training traits, comprise sets of genes. 17. Система по п. 16, в которой наборы генов выбраны с использованием анализа обогащения набора генов одного образца.17. The system of claim 16 wherein the gene sets are selected using single sample gene set enrichment analysis. 18. Система по п. 14, в которой оценка отвечаемости на лечение ингибированием контрольной точки содержит оценку прогноза и один или более идентификаторов признаков, где один или более идентификаторов признаков выбирают из группы, состоящей из валентности признака, важности признака и веса признака.18. The system of claim 14, wherein the score for response to checkpoint inhibition treatment comprises a prognosis score and one or more feature identifiers, wherein the one or more feature identifiers are selected from the group consisting of feature valence, feature importance, and feature weight. 19. Система по п. 18, в которой инструкции при исполнении их одним или более микропроцессорами вызывают предоставление графическим пользовательским интерфейсом отчета об идентификаторах признаков в виде характеристик кольцевого сектора, где угол кольцевого сектора указывает важность признака, наружный радиус кольцевого сектора указывает вес признака, а цвет кольцевого сектора указывает валентность признака. 19. The system of claim 18, wherein the instructions, when executed by one or more microprocessors, cause the graphical user interface to report feature identifiers as ring sector characteristics, where the angle of the ring sector indicates the importance of the feature, the outer radius of the ring sector indicates the weight of the feature, and the color of the annular sector indicates the valency of the feature. 20. Система по п. 19, в которой важность признака включает снижение индекса Джини признака.20. The system of claim 19, wherein the importance of the feature includes decreasing the Gini index of the feature. 21. Система по п. 20, в которой инструкции, при исполнении их одним или более микропроцессорами, вызывают предоставление графическим пользовательским интерфейсом отчета об идентификаторе признака тогда и только тогда, когда важность признака выше порогового значения.21. The system of claim 20, wherein the instructions, when executed by one or more microprocessors, cause the graphical user interface to report a feature ID if and only if the feature's importance is above a threshold. 22. Система по п. 21, в которой важность признака не превышает пороговое значение, если квадрат важности признака не превышает 0,1.22. The system of claim 21, wherein the importance of the feature does not exceed a threshold value if the square of the importance of the feature does not exceed 0.1. 23. Система по п. 21, в которой инструкции, при исполнении их одним или более микропроцессорами, вызывают графический пользовательский интерфейс для предоставления отчета о внутренней дуге каждого из кольцевых секторов и круге, содержащем внутренние дуги кольцевых секторов.23. The system of claim 21, wherein the instructions, when executed by one or more microprocessors, invoke a graphical user interface to report the inner arc of each of the annular sectors and the circle containing the inner arcs of the annular sectors. 24. Система по п. 14, в которой инструкции, при выполнении их одним или более микропроцессорами, вызывают дальнейшее обучение компьютерной системой машинно-обучаемого классификатора, где дальнейшая тренировка включает тренировку натренированного машинно-обучаемого классификатора на признаках образцов опухоли, полученных от нетренировочного субъекта, и отвечаемости нетренировочного субъекта на лечение ингибированием контрольной точки.24. The system of claim 14, wherein the instructions, when executed by one or more microprocessors, cause the computer system to further train the machine learning classifier, where further training includes training the trained machine learning classifier on features of tumor samples obtained from a non-training subject, and the non-training subject's response to checkpoint inhibition treatment. 25. Основанный на машинном обучении классификатор, выполняющийся на одном или более процессоре, для формирования оценки отвечаемости на ингибирование контрольной точки для нетренировочного субъекта, 25. A machine learning based classifier running on one or more processors to generate a checkpoint inhibition response score for a non-training subject, причем основанный на машинном обучении классификатор натренирован формировать оценку отвечаемости на ингибирование контрольной точки путем ввода в основанный на машинном обучении классификатор геномной информации множества тренировочных субъектов и отвечаемости каждого из множества тренировочных субъектов на лечение ингибированием контрольной точки, причем геномная информация множества тренировочных субъектов содержит признаки профилей опухоли, полученных от каждого из множества тренировочных субъектов; wherein the machine learning based classifier is trained to generate an estimate of checkpoint inhibition response by entering into the machine learning classifier the genomic information of a plurality of training subjects and the response of each of the plurality of training subjects to checkpoint inhibition treatment, wherein the genomic information of the plurality of training subjects contains features of tumor profiles obtained from each of the many training subjects; и при этом указанный основанный на машинном обучении классификатор формирует оценку отвечаемости на ингибирование контрольной точки в ответ на ввод геномной информации нетренировочного субъекта в процессор, на котором работает основанный на машинном обучении классификатор, при этом геномная информация нетренировочного субъекта содержит признаки из профиля опухоли, полученного от нетренировочного субъекта, и причем основанный на машинном обучении классификатор выполнен с возможностью предоставления оценки отвечаемости на ингибирование контрольной точки через выходной процессор,wherein said machine learning-based classifier generates a checkpoint inhibition response score in response to input of non-training subject genomic information into a processor running the machine learning-based classifier, wherein the non-training subject genomic information contains features from a tumor profile obtained from a non-training subject, and wherein the machine learning-based classifier is configured to provide a response score to checkpoint inhibition via an output processor, причем указанный машинно-обучаемый классификатор представляет собой случайный лес и при тренировке машинно-обучаемого классификатора используют по меньшей мере 50000 деревьев принятия решений.wherein said machine learning classifier is a random forest and at least 50,000 decision trees are used in training the machine learning classifier. 26. Основанный на машинном обучении классификатор по п. 25, в котором классификация отвечаемости на ингибирование контрольной точки содержит оценку прогноза и множество идентификаторов. 26. The machine learning-based classifier of claim 25, wherein the checkpoint inhibition response classification comprises a prediction score and a plurality of identifiers. 27. Способ по п. 1, в котором лечение ингибированием контрольной точки выбрано из анти-CTLA4 лекарственного средства, анти-PD1 лекарственного средства, анти-PDL1 лекарственного средства и любой комбинации двух или более из указанных выше лекарственных средств.27. The method of claim 1, wherein the checkpoint inhibition treatment is selected from an anti-CTLA4 drug, an anti-PD1 drug, an anti-PDL1 drug, and any combination of two or more of the above drugs. 28. Способ по п.1, в котором по меньшей мере некоторые из признаков из профиля опухоли, полученного от нетренировочного субъекта, или по меньшей мере некоторые из признаков из профиля опухоли, полученного от одного или более тренировочных субъектов, включают:28. The method of claim 1, wherein at least some of the features from a tumor profile obtained from a non-training subject, or at least some of the features from a tumor profile obtained from one or more training subjects, comprise: (A) одно или более из (i) общей мутационной нагрузки, состоящей из всех мутаций, (ii) общей мутационной нагрузки, состоящей из несинонимичных мутаций, (iii) инфильтрации опухоли клетками, экспрессирующими кластер дифференцировки 8 (CD8), (iv) инфильтрации опухоли клетками, экспрессирующими кластер дифференцировки 4 (CD4), и (v) инфильтрации опухоли клетками, экспрессирующими кластер дифференцировки 19 (CD19); и (A) one or more of (i) total mutation load consisting of all mutations, (ii) total mutation load consisting of non-synonymous mutations, (iii) tumor infiltration by cells expressing cassette of differentiation 8 (CD8), (iv) infiltration tumors with cells expressing cassette of differentiation 4 (CD4), and (v) tumor infiltration with cells expressing cassette of differentiation 19 (CD19); And (B) экспрессию одного или более из бета-2-микроглобулина (B2M), бета-10-субъединицы протеасомы (PSMB10), переносчика антигенных пептидов 1 (TAP1), транспортера антигенных пептидов 2 (TAP2), лейкоцитарного антигена человека A (HLA-A), главного комплекса гистосовместимости, класс I, B (HLA-B), главного комплекса гистосовместимости, класс I, C (HLA-C), главного комплекса гистосовместимости, класс II, DQ альфа-1 (HLA-DQA1), антигена гистосовместимости HLA класса II, бета-цепь DRB1 (HLA-DRB1), антигена гистосовместимости HLA класса I, альфа-цепь E (HLA-E), гранулярного белка естественной клетки-киллера 7 (NKG7), хемокиноподобного рецептора 1 (CMKLR1), гранзима A (GZMA), перфорина-1 (PRF1), цитотоксического Т-лимфоцит-ассоциированного белка 4 (CTLA4), белка программируемой клеточной смерти 1 (PD1), лиганда 1 программируемой смерти (PDL1) и лиганда 2 программируемой клеточной смерти 1 (PDL2). (B) expression of one or more of beta-2-microglobulin (B2M), proteasome beta-10 subunit (PSMB10), antigenic peptide transporter 1 (TAP1), antigenic peptide transporter 2 (TAP2), human leukocyte antigen A (HLA- A), major histocompatibility complex class I, B (HLA-B), major histocompatibility complex class I, C (HLA-C), major histocompatibility complex class II, DQ alpha-1 (HLA-DQA1), histocompatibility antigen HLA class II, DRB1 beta chain (HLA-DRB1), HLA class I histocompatibility antigen, E alpha chain (HLA-E), natural killer cell granular protein 7 (NKG7), chemokine-like receptor 1 (CMKLR1), granzyme A (GZMA), perforin-1 (PRF1), cytotoxic T-lymphocyte-associated protein 4 (CTLA4), programmed cell death protein 1 (PD1), programmed death ligand 1 (PDL1), and programmed cell death ligand 2 (PDL2). 29. Способ по п. 28, в котором лечение ингибированием контрольной точки выбрано из анти-CTLA4 лекарственного средства, анти-PD1 лекарственного средства, анти-PDL1 лекарственного средства и любой комбинации двух или более из указанных выше лекарственных средств.29. The method of claim 28, wherein the checkpoint inhibition treatment is selected from an anti-CTLA4 drug, an anti-PD1 drug, an anti-PDL1 drug, and any combination of two or more of the above drugs.
RU2019135697A 2017-12-01 2018-12-03 Systems and methods for assessing the efficiency of a medicinal product RU2797170C9 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762593802P 2017-12-01 2017-12-01
US62/593,802 2017-12-01
PCT/US2018/063658 WO2019109089A1 (en) 2017-12-01 2018-12-03 Systems and methods for assessing drug efficacy

Publications (3)

Publication Number Publication Date
RU2019135697A RU2019135697A (en) 2022-01-04
RU2797170C2 RU2797170C2 (en) 2023-05-31
RU2797170C9 true RU2797170C9 (en) 2023-08-25

Family

ID=

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2155373C2 (en) * 1995-03-23 2000-08-27 Чейенн Эдванст Текнолоджи Лимитед Computer duplication system, which operates with open files
WO2015184061A2 (en) * 2014-05-28 2015-12-03 Dana-Farber Cancer Institute, Inc. Activating jak kinase biomarkers predictive of anti-immune checkpoint inhibitor response
RU2015148763A (en) * 2013-07-18 2017-05-19 Косс Корпорейшн WIRELESS CAMERA
WO2017167942A1 (en) * 2016-03-31 2017-10-05 Pamgene Bv Method for predicting the response of melanoma patients to a medicament
WO2017201165A1 (en) * 2016-05-17 2017-11-23 Genecentric Diagnostics, Inc. Methods for subtyping of lung adenocarcinoma

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2155373C2 (en) * 1995-03-23 2000-08-27 Чейенн Эдванст Текнолоджи Лимитед Computer duplication system, which operates with open files
RU2015148763A (en) * 2013-07-18 2017-05-19 Косс Корпорейшн WIRELESS CAMERA
WO2015184061A2 (en) * 2014-05-28 2015-12-03 Dana-Farber Cancer Institute, Inc. Activating jak kinase biomarkers predictive of anti-immune checkpoint inhibitor response
WO2017167942A1 (en) * 2016-03-31 2017-10-05 Pamgene Bv Method for predicting the response of melanoma patients to a medicament
WO2017201165A1 (en) * 2016-05-17 2017-11-23 Genecentric Diagnostics, Inc. Methods for subtyping of lung adenocarcinoma

Similar Documents

Publication Publication Date Title
Karasaki et al. An immunogram for the cancer-immunity cycle: towards personalized immunotherapy of lung cancer
JP7429539B2 (en) Systems and methods for evaluating drug efficacy
Charoentong et al. Pan-cancer immunogenomic analyses reveal genotype-immunophenotype relationships and predictors of response to checkpoint blockade
Ma et al. Single-cell RNA sequencing of lung adenocarcinoma reveals heterogeneity of immune response–related genes
Saini et al. Human endogenous retroviruses form a reservoir of T cell targets in hematological cancers
Simon et al. Analysis of gene expression data using BRB-array tools
Eckstein et al. Cytotoxic T-cell-related gene expression signature predicts improved survival in muscle-invasive urothelial bladder cancer patients after radical cystectomy and adjuvant chemotherapy
Lee et al. Comprehensive immunoproteogenomic analyses of malignant pleural mesothelioma
US20220154284A1 (en) Determination of cytotoxic gene signature and associated systems and methods for response prediction and treatment
Stein et al. The varied distribution and impact of RAS codon and other key DNA alterations across the translocation cyclin D subgroups in multiple myeloma
WO2020201825A2 (en) Aryl hydrocarbon receptor (ahr) activation signature and methods for determining ahr signaling status
Pan et al. Prognostic and predictive value of a long non-coding RNA signature in glioma: a lncRNA expression analysis
McCann et al. Targeting the tumor mutanome for personalized vaccination in a TMB low non-small cell lung cancer
Sung et al. Integrative analysis of risk factors for immune-related adverse events of checkpoint blockade therapy in cancer
US20230245724A9 (en) Systems and methods for assessing drug efficacy
Liu et al. Systemic immune microenvironment and regulatory network analysis in patients with lung adenocarcinoma
Bendall et al. Specific human endogenous retroviruses predict metastatic potential in uveal melanoma
Zheng et al. The tumor environment immune phenotype of LUSC by genome-wide analysis
Naulaerts et al. Immunogenomic, single-cell and spatial dissection of CD8+ T cell exhaustion reveals critical determinants of cancer immunotherapy
Liu et al. Landscape of immune microenvironment in epithelial ovarian cancer and establishing risk model by machine learning
RU2797170C9 (en) Systems and methods for assessing the efficiency of a medicinal product
RU2797170C2 (en) Systems and methods for assessing the efficiency of a medicinal product
NZ759413B2 (en) Systems and methods for assessing drug efficacy
Chang et al. Apoptosis pathway signature for prediction of treatment response and clinical outcome in childhood high risk B-Precursor acute lymphoblastic leukemia
Ghasemi et al. Expression profiles of the individual genes corresponding to the genes generated by cytotoxicity experiments with bortezomib in multiple myeloma