RU2440610C1 - System for working with intelligent electronic book - eib - Google Patents
System for working with intelligent electronic book - eib Download PDFInfo
- Publication number
- RU2440610C1 RU2440610C1 RU2010125501/08A RU2010125501A RU2440610C1 RU 2440610 C1 RU2440610 C1 RU 2440610C1 RU 2010125501/08 A RU2010125501/08 A RU 2010125501/08A RU 2010125501 A RU2010125501 A RU 2010125501A RU 2440610 C1 RU2440610 C1 RU 2440610C1
- Authority
- RU
- Russia
- Prior art keywords
- block
- code
- molding
- knowledge
- moldings
- Prior art date
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
1. Область техники, к которой относится изобретение1. The technical field to which the invention relates.
Изобретение относится к компьютерным системам, использующим модели, основанные на знаниях, а именно к системам, синтезирующим интеллектуальные решения и новые знания по запросу пользователя.The invention relates to computer systems using knowledge-based models, namely, systems synthesizing intelligent solutions and new knowledge at the request of the user.
2. Уровень техники2. The level of technology
1 аналог1 analog
Известна компьютерная система «Изобретающая машина» для решения изобретательских задач см. Конспект научно-практической конференции «Теория и практика обучения техническому творчеству», Миасс, 23-27 мая 1988 г. ПРОЕКТ "ИЗОБРЕТАЮЩАЯ МАШИНА". Современное состояние и реальные перспективы. В.М.Цуриков, 1988 г. Последний вариант системы известен как Invention Machine Goldfire. См. информационный буклет «Invention Machine Goldfire. Data sheet/». 2009).The computer system “Inventing Machine” for solving inventive problems is known. See the abstract of the scientific-practical conference “Theory and Practice of Teaching Technical Creativity”, Miass, May 23-27, 1988. PROJECT “INVENTING MACHINE”. Current state and real prospects. V.M. Tsurikov, 1988. The latest version of the system is known as Invention Machine Goldfire. See the Invention Machine Goldfire Information Booklet. Data sheet / ". 2009).
Используется в компьютерной системе - компьютер - машиночитаемый носитель - программное средство (ПС) - пользователь для решения интеллектуальных задач для одного направления - решения технических задач. Представляет собой гибридную экспертную систему (ЭС) с использованием моделей знаний, объединенных в базу знаний, и имеющей машину логического вывода. Имеется возможность искать подходящие документы по запросам на основе семантического анализа, как в локальных базах данных (БД), так и в сети Интернет.It is used in a computer system - computer - computer-readable medium - software (PS) - a user for solving intellectual problems in one direction - solving technical problems. It is a hybrid expert system (ES) using knowledge models combined into a knowledge base and having a logical inference machine. It is possible to search for suitable documents on request based on semantic analysis, both in local databases (DB) and on the Internet.
«Изобретающая машина» обладает знаниями (и выдает ответы), в своей части превосходящими знания наиболее квалифицированных специалистов. В ней содержатся мощные информационные базы - технических спецэффектов из разных областей знаний, каталог методов решения задач, используются некоторые расчетные модели, в частности, функционально-стоимостного анализа. Некоторые из этих баз построены с использованием моделей знаний, в частности семантических сетей, продукционных моделей и моделей «субъект - акция - объект» (САО-модели). Также применяются визуальные и графические образы - графики, изображения, чертежи для повышения эффективности работы, подключенные к некоторым моделям знаний.An “inventive machine” possesses knowledge (and provides answers), in its part exceeding the knowledge of the most qualified specialists. It contains powerful information bases - technical special effects from different areas of knowledge, a catalog of problem solving methods, some calculation models are used, in particular, functional-cost analysis. Some of these bases are built using knowledge models, in particular semantic networks, production models, and “subject-share-object” models (CAO-models). Visual and graphic images are also used - graphs, images, drawings to improve work efficiency, connected to some knowledge models.
Поставляется пользователю на стандартных машиночитаемых носителях, защищенных от копирования кодами доступа. Поскольку нет массовой продажи, нет необходимости в специальных устройствах чтения машиночитаемых носителей и специальных средствах для их защиты.It is delivered to the user on standard machine-readable media protected against copying by access codes. Since there is no mass sale, there is no need for special devices for reading machine-readable media and special means for protecting them.
Традиционно подобные системы продаются на машиночитаемых носителях, которые для эксплуатации подключаются к компьютерам через устройства считывания. При работе ядро ПС считывается в компьютер и работа выполняется в оперативной памяти компьютера с подкачкой объемов информации с машиночитаемого носителя.Traditionally, such systems are sold on computer-readable media that are connected to computers through readers for operation. During operation, the PS core is read into the computer and the work is performed in the computer's RAM with pumping volumes of information from a computer-readable medium.
Недостатки системы заключаются в следующем:The disadvantages of the system are as follows:
- сфера применения узкоспециальная;- the scope of application is highly specialized;
- ограниченные возможности получения новых знаний;- limited opportunities for obtaining new knowledge;
- имеются возможности несанкционированного копирования ПС и информации непосредственно из оперативной памяти компьютера;- there are opportunities for unauthorized copying of PS and information directly from the computer's RAM;
- при обработке больших объемов информации происходят постоянные потери времени на подкачку информации с машиночитаемого носителя;- when processing large amounts of information, there is a constant loss of time for pumping information from a machine-readable medium;
- кроме того, «Изобретающая машина» работает только в рамках технологии ТРИЗ (теория решения изобретательских задач) для нахождения новых технических решений на собственных информационных базах - базах знаний и БД;- in addition, “Inventing Machine” works only within the framework of TRIZ technology (theory of solving inventive problems) to find new technical solutions on our own information bases - knowledge bases and databases;
- не предназначена для нахождения уже известных и отработанных технологий, поскольку для этих целей нужны иные базы знаний.- It is not intended to find already known and proven technologies, since other knowledge bases are needed for these purposes.
2 аналог2 analog
«Электронная книга» по заявке US 2008/0076103."E-book" by application US 2008/0076103.
Компьютерная система состоит из портативного компьютера со стандартным набором устройств, в частности, дисплея (с применением двух экранов), устройства печати, устройств для воспроизведения звука, клавиатуры, центрального процессора с оперативной памятью, устройства считывания машиночитаемых носителей, машиночитаемых носителей с ядром ПС, которое управляет работой системы, переводчиком, и системой записи текстов на машиночитаемые носители и воспроизведения для пользователя, в т.ч. с переводом. При этом также запоминаются графические и визуальные образы совместно с текстом. Также применяется звуковой вариант воспроизведения. Тексты запоминаются в БД на машиночитаемом носителе в исходном формате.A computer system consists of a laptop computer with a standard set of devices, in particular, a display (using two screens), a printing device, devices for reproducing sound, a keyboard, a central processor with random access memory, a reader for computer-readable media, computer-readable media with a PS core, which controls the operation of the system, a translator, and a system for recording texts on computer-readable media and playback for the user, including with the translation. At the same time, graphic and visual images along with the text are also remembered. Also used is the audio playback option. Texts are stored in a database on a machine-readable medium in the original format.
Недостатки системы заключаются в следующем:The disadvantages of the system are as follows:
- поскольку текстовых документов много и число их постоянно растет, в т.ч. во многих узких предметных областях, знания в них дублируются, вплоть до простого дублирования исходных текстов, а технические возможности ограничены, то подобное устройство не решает проблему в принципе, лишь помогая немного пользователю, в частности, в дороге;- since there are a lot of text documents and their number is constantly growing, including in many narrow subject areas, knowledge in them is duplicated, up to simple duplication of source texts, and technical capabilities are limited, then such a device does not solve the problem in principle, only helping a little user, in particular, on the road;
- проблема анализа исходных текстов и знаний, содержащихся в них, поиск связей между ними остаются полностью за пользователем;- the problem of analyzing the source texts and the knowledge contained in them, the search for connections between them remains entirely with the user;
- не может находить решения для пользователя, из анализа имеющихся больших информационных баз;- cannot find solutions for the user, from an analysis of the large information databases available;
- не имеет особых специальных возможностей для защиты информационных баз на машиночитаемом носителе.- does not have special special capabilities for protecting information databases on a machine-readable medium.
3 аналог, который является прототипом.3 analogue, which is a prototype.
К предлагаемому изобретению наиболее близка система семантического анализа и отбора документов со способностью получения знаний, «DOCUMENT SEMANTIC ANALYSIS/SELECTION WITH KNOWLEDGE CREATIVITY CAPABILITY», пат. US 2001/0014852. Система состоит из компьютера, машиночитаемого носителя знаний, устройства считывания, средства связи с локальными сетями и Интернет и машины логического вывода в виде отдельного семантического процессора. Последний включает блок подготовки текстов для моделирования, блок получения анализируемых САО-структур, блок синтеза ключевых слов/фраз для рефератов на естественном языке, блок синтеза рефератов, а также, блок базы знаний для САО-структур, блок БД исходных текстов, блок БД обобщений текстов на естественном языке, блок БД новых концептов на естественном языке, блок БД ключевых слов и фраз для рефератов.The system of semantic analysis and selection of documents with the ability to obtain knowledge, "DOCUMENT SEMANTIC ANALYSIS / SELECTION WITH KNOWLEDGE CREATIVITY CAPABILITY", US Pat. US 2001/0014852. The system consists of a computer, a machine-readable medium of knowledge, a reader, a means of communication with local networks and the Internet, and an inference machine in the form of a separate semantic processor. The latter includes a block for preparing texts for modeling, a block for obtaining analyzed SAO-structures, a block for synthesizing keywords / phrases for abstracts in a natural language, a block for synthesizing essays, and also a block for a knowledge base for SAO-structures, a block for a database of source texts, a block for a database of generalizations texts in a natural language, a database block of new concepts in a natural language, a database block of keywords and phrases for abstracts.
Пользователь, используя принятые термины, вводит в систему запросы с клавиатуры компьютера. Система моделирует запросы пользователя в виде САО-структур с выделением ключевых слов и фраз, на основе которых в локальных БД и Интернет подбирает подходящие исходные тексты-кандидаты. В текстах-кандидатах также выделяются САО-структуры. Если они соответствуют САО-структурам запросов пользователя, то тексты-кандидаты запоминаются для просмотра в БД текстов на естественном языке. Тексты-кандидаты, не имеющие запрашиваемых САО-структур, удаляются. На основе наиболее частых ключевых слов, фраз и грамматических правил составляются рефераты отобранных текстов. Имеется возможность синтеза новых концептов знаний на основе синтеза подобранных САО-структур с учетом словарей синонимов компонентов САО-структур.Using accepted terms, the user enters into the system requests from the computer keyboard. The system simulates user requests in the form of CAO structures with the selection of keywords and phrases, on the basis of which it selects suitable source texts for candidates in local databases and the Internet. Candidate texts also highlight CAO structures. If they correspond to the CAO structures of user queries, then the candidate texts are remembered for viewing in the database of texts in natural language. Candidate texts that do not have the requested CAO structures are deleted. Based on the most frequent keywords, phrases and grammar rules, abstracts of selected texts are compiled. It is possible to synthesize new concepts of knowledge based on the synthesis of selected SAO structures taking into account dictionaries of synonyms of components of SAO structures.
Недостатки последней системы заключаются в следующем:The disadvantages of the latter system are as follows:
- при каждом запросе пользователя система последовательно рассматривает весь объем доступных текстов во внешних и внутренних сетях, без исключения повторов или весьма похожих источников. Последовательный перебор всех текстов требует значительных затрат машинного времени;- at each user request, the system sequentially considers the entire amount of available texts in external and internal networks, without exception of repetitions or very similar sources. Sequential search of all texts requires a significant amount of computer time;
- возможности системы ограничены доступными источниками, а в ряде областей знаний тексты на бумажных носителях слишком велики, засекречены или продаются по высокой цене;- the capabilities of the system are limited by available sources, and in a number of areas of knowledge paper texts are too large, classified or sold at a high price;
- разбиение предложений исходных текстов на САО-структуры приводит к разрыву весьма сложных семантических структур, которые присутствуют внутри предложений и разделов текста. Попытка нового синтеза на их основе приведет во многих случаях к утере исходного семантического смысла;- the division of sentences of source texts into SAO-structures leads to the breakdown of very complex semantic structures that are present inside sentences and sections of the text. An attempt at a new synthesis based on them will in many cases lead to the loss of the original semantic meaning;
- система удовлетворительно синтезирует рефераты, но синтез новых концептов знания достигается лишь в редких случаях;- the system satisfactorily synthesizes essays, but the synthesis of new concepts of knowledge is achieved only in rare cases;
- при получении САО-структур не решается задача выделения синонимов, фразеологизмов, метафор, профессиональных и заимствованные слов, неологизмов, диалектизмов, архаизмов, которые также имеют семантический смысл;- upon receipt of the CAO structures, the task of highlighting synonyms, phraseological units, metaphors, professional and borrowed words, neologisms, dialectisms, archaisms that also have semantic meaning is not solved;
- отсутствует оценка уровня соответствия удаляемых текстов-кандидатов. Достаточно одного не очень удачного или нового термина, и исходный текст, содержащий необходимую информацию, будет снят с рассмотрения;- there is no assessment of the level of conformity of deleted candidate texts. One not very successful or new term is enough, and the source text containing the necessary information will be removed from consideration;
- система применяется только подготовленным экспертом-пользователем. Корректность САО-структур и достоверность рефератов, подготовленных без участия эксперта, остается неподтвержденной.- The system is used only by a trained expert user. The correctness of the CAO structures and the reliability of essays prepared without the participation of an expert remains unconfirmed.
3. Раскрытие изобретения3. Disclosure of invention
Настоящее изобретение решает задачу предварительной систематизации знаний и данных на специальном машиночитаемом носителе, выполненном в виде интеллектуальной электронной книги-элинги. Интеллектуальная электронная книга-элинга готовится группой экспертов-редакторов в отдельной области знаний, на основе опубликованных печатных изданий, а также других достоверных источников информации. В отличие от печатных изданий и их электронных версий, интеллектуальная электронная книга-элинга читается только в компьютерной системе, способна распознавать вопросы пользователя и синтезировать достоверные ответы, которые могут не содержаться в исходных источниках. Для интеллектуальной электронной книги-элинги, располагающих такими возможностями, в тексте далее применяется термин «элинга». Изобретение также решает задачу повышения эффективности семантического анализа, повышения достоверности результатов, улучшения зашиты элинг от незаконного копирования, а также повышения скорости нахождения обоснованных решений.The present invention solves the problem of preliminary systematization of knowledge and data on a special machine-readable medium made in the form of an intellectual electronic book-elingi. Intelligent electronic book-éling is prepared by a group of expert editors in a separate field of knowledge, based on published print media, as well as other reliable sources of information. Unlike print publications and their electronic versions, an intelligent e-book e-book is read only in a computer system, it is able to recognize user questions and synthesize reliable answers that may not be contained in the source sources. For an intellectual electronic book-elings with such capabilities, the term “elinga” is used in the text below. The invention also solves the problem of increasing the effectiveness of semantic analysis, increasing the reliability of the results, improving the protection of e-mail from illegal copying, as well as increasing the speed of finding informed decisions.
Технический результат от использования изобретения заключается в создании и использовании - элинги, как доступного продукта массового спроса, содержащего систематизированные знания и способного формулировать новые знания по запросам пользователей. Централизованное создание и тиражирование элинг обеспечивает их умеренную стоимость и доступность широкому кругу пользователей.The technical result from the use of the invention is to create and use - eling, as an affordable product of mass demand, containing systematic knowledge and able to formulate new knowledge at the request of users. The centralized creation and replication of the elling ensures their moderate cost and availability to a wide range of users.
Изобретение реализуется компьютерной системой (фиг.1), которая состоит из компьютера 1, связанного с устройством считывания элинги 2, имеющей разъем 3. Пользователь 4 имеет доступ к элинге и результатам работы с ней через технические возможности компьютера 1.The invention is implemented by a computer system (Fig. 1), which consists of a
Машиночитаемый носитель 5 с элингой подключается к устройству считывания элинги через свой разъем 6 (фиг.2).The computer-
На машиночитаемом носителе 5 находятся шифратор/дешифратор 7, блок распределения заданий 8, блок машины логического вывода 9, блок базы знаний 10, блок ввода знаний 11, блок БД словарей 12 (здесь содержатся словари терминов, отношений, качественных признаков, количественных признаков, лингвистических и логических связей (все с их синонимами), вместе со словарем введенных исходных текстов), блок расчетных моделей 13, блок графических и визуальных образов 14, блока рабочей части диалога 15, блока сохраненной части диалога 16.The machine-
Физически элинга представят собой машиночитаемый носитель 5 с блоками, реализованными на базе электронных компонентов. Функционирует только в рамках компьютерной системы на базе компьютер 1 для работы с машиночитаемым носителем 5 с элингой..Physically, the boathouse will be a machine-
Базовые режимы работы элинги 17 представлены на фиг.3. Основные два - режим ввода знаний 18 и режим рабочий 19. В состав рабочих режимов 19 входят режим вывода текстов 20, режим работы с диалогом 21 и режим логического вывода 22. В свою очередь, в режим вывода текстов 20 входят режим вывода исходных текстов 23 и режим когезии 24.The basic operating modes of the
В режиме работы с диалогом 21 возможен также переход к режимам вывода исходных текстов 23 и режиму когезии 24.In the operation mode with the
Режим ввода знаний 18 резко отличается от прототипа. В прототипе он один из текущих оперативных режимов работы компьютерной системы. В настоящем изобретении ввод знаний резко отделен от оперативной работы пользователя 4. Ввод знаний в режиме ввода знаний 18 производит, как минимум, один (может быть более) подготовленный эксперт-редактор 4, который у производителя элинги заполняет блок базы знаний достаточно долго, но качественно,The input mode of
А оперативная работа пользователя 4 уже происходит быстро без дополнительных потерь времени на преобразование исходных текстов, баз знаний, поиска исходных текстов во внешних БД и каких-то их отборов, как в прототипе. А именно скорость в оперативной работе и качественный результат одно из главный требований пользователя к компьютерной системе, в т.ч. при работе со знаниями.And the operational work of user 4 is already happening quickly without additional loss of time for converting source texts, knowledge bases, searching for source texts in external databases and some sort of selection, as in the prototype. Namely, speed in operational work and a high-quality result are one of the main requirements of the user for a computer system, including when working with knowledge.
Режим ввода знаний 18 происходит через блок ввода знаний 11 в блок базы знаний 10, блок БД словарей 12, блок расчетных моделей 13, блок графических и визуальных образов 14.The input mode of
Сам ввод знаний в элингу в режиме ввода знаний 18 производится экспертом-редактором 4 следующим образом. Имеется множество специально подобранных исходных текстов определенной предметной области, они разбиваются на простые предложения преимущественно длиной 3-15 слова. Это простые предложения превращаются в специальные модели знаний - молинги, имеющие следующую структуру (табл.1)The very input of knowledge into the Eling in the mode of entering
Они не только ускоряют и упрощают моделирование знаний из исходных текстов, в частности, по сравнению с САО-структурами у прототипа, но и значительно упрощают получение результатов логического вывода для элинги, позволяя выдавать пользователю 4 связный осмысленный текст, весьма удобный для чтения и понимания.They not only accelerate and simplify the modeling of knowledge from source texts, in particular, in comparison with the SAO structures of the prototype, but also greatly simplify the obtaining of logical inference results for the elings, allowing users to provide 4 connected meaningful text that is very convenient for reading and understanding.
Код 1 - это множество идентификаторов, с помощью которого данная молинга выделяется из всего множества молинг, хотя для некоторых молинг они могут быть и одинаковы (поскольку находятся в одном абзаце исходного текста). В качестве идентификатора выступает составной номер, включающий номер ссылки на текст в словаре исходных текстов (обозначим код 1.1), номер главы (код 1.2), номер параграфа внутри конкретной главы (код 1.3) и номер абзаца внутри конкретного параграфа (где молинга находится - код 1.4). Заголовок параграфа имеет код абзаца, равный нулю. Каждый идентификатор молинги, в целом, имеет вид - код 1.1. код 1.2. код 1.3. код 1.4.
Указываются все идентификаторы для этой молинги всех исходных текстов (или разделы внутри них), где встречались одинаковые знания.All identifiers for this molding of all source texts (or sections within them), where the same knowledge met, are indicated.
Код 2 - это условие применимости ядра молинги. Обычно представляет собой логическое выражение. Когда оно принимает значение «истина», ядро молинги активизируется.
Код 3 - основной элемент молинги - ядро молинги. Ядро молинги вводится после обработки экспертом-редактором простых и сложных предложений (которые превращает в простые) исходных текстов. При вводе ядер молинг выявляются и вводятся в состав словаря терминов (обозначаемый 1), находящегося в блоке БД словарей 12, - все термины, их синонимы, фразеологизмы, метафоры, профессиональные слова, заимствованные слова, неологизмы, диалектизмы, архаизмы. В молинги вводятся, в основном, базовое значение терминов (определяемое экспертом-редактором). Соответственно таким же образом при вводе ядер молинг выявляются и вводятся в состав словаря отношений (обозначаемый 2), находящегося в блоке БД словарей 12, - все отношения с их синонимами. Так же при вводе ядер молинг выявляются и вводятся в состав словаря качественных признаков (обозначаемый 3), находящегося в блоке БД словарей 12, - все качественные признаки с их синонимами, в состав словаря количественных признаков (обозначаемый 4), находящегося в блоке БД словарей 12, - все количественные признаки с их синонимами, в состав словаря лингвистических и логических связей (обозначаемый 5), находящегося в блоке БД словарей 12, - все лингвистические и логические связи с их синонимами.Code 3 - the main element of moldings - the core moldings. The core of moldings is introduced after processing by the expert editor of simple and complex sentences (which turns into simple ones) of the source texts. When nuclei are introduced, moldings are identified and entered into the glossary of terms (indicated by 1) located in the database block of dictionaries 12 - all terms, their synonyms, phraseological units, metaphors, professional words, borrowed words, neologisms, dialectisms, archaisms. In the moldings are introduced, basically, the basic meaning of the terms (determined by the expert editor). Accordingly, in the same way, when introducing cores, moldings are identified and entered into the relations dictionary (designated 2), located in the database block of
В коде 4 указаны последовательность номеров словарей, фиксирующих положение слов и элементов простых предложений в ядре молинги последовательностью номеров словарей терминов, отношений, качественных признаков, количественных признаков или лингвистических и логических связей.Code 4 shows the sequence of dictionary numbers that fix the position of words and elements of simple sentences in the core moldings with the sequence of dictionary numbers of terms, relationships, qualitative attributes, quantitative attributes, or linguistic and logical connections.
В коде 5 указываются уровни достоверности молинг в виде факторов уверенности, впервые примененных в ЭС MYCIN.
В коде 6 описываются постусловия молинги. Они актуализируются только в том случае, если ядро молинги реализовалось, в т.ч. и ничего не делать (если код 6 равен нулю). Постусловия молинги описывают действия и процедуры, которые необходимо выполнить после реализации ядра молинги. В их числе может быть - переход к другой молинге, ввод в действие расчетных моделей, введенных в блок расчетных моделей 13, или актуализация визуальных или графических образов из блока визульных и графических образов 14.
Фиксация элементов ядра молинги последовательностью номеров словарей, фиксирующих положение слов и элементов простых предложений, означает фиксацию представления ядра молинги в виде короткой семантический сети. В результате блок базы знаний 10 содержит огромный набор коротких семантических сетей.Fixing the core elements of moldings by a sequence of dictionary numbers fixing the position of words and elements of simple sentences means fixing the representation of the core moldings in the form of a short semantic network. As a result, the
Далее процедура происходит в соответствии с фиг.4.Next, the procedure occurs in accordance with figure 4.
Имеются, например, исходные тексты 1, 2, …, n - блоки 25, 26, 27, которые предполагается ввести в блок БЗ 10 элинги. Ввод производится в рамках компьютерной системы, представленной на фиг.1. Тексты разбиваются на простые предложения и привязанные к ним расчетные модели и визуальные, и графические образы. Простые предложения превращаются в молинги, а тексты в модели текстов (фиг.4, блоки - 28, 29, 30), с кодированием порядка элементов в ядрах молинг с занесением соответствующих элементов в блок БД словарей 12, если они или их синонимы в словарях отсутствуют. При моделировании эксперт-редактор задает значение уровня достоверности в виде фактора уверенности со значениями в пределах от -1 (совершенно недостоверная) до +1 (полностью достоверная).There are, for example, the source texts 1, 2, ..., n - blocks 25, 26, 27, which are supposed to be entered into the block of the
Расчетные модели (запрограммированные стандартным образом или реализуемые с использованием уже разработанных ПС, находящихся в блоке расчетных моделей 13 или в оперативной памяти компьютера 1) и визуальные, и графические образы привязываются в качестве постусловий к молингам и заносятся непосредственно соответственно в блок расчетных моделей 13 и блок визуальных и графических образов 14.Calculation models (programmed in a standard way or implemented using already developed substations located in the block of
На фиг.4 показано на первом этапе в исходных текстах 1, 2, …, n (блоки 25, 26, 27) по 6 простых предложений. На втором этапе (блоки 28, 29, 30) после моделирования в модели текста 1 (блок 28) - 6 молинг, а во второй группе моделей текста 2, …, n (блоки 29, 30) уже по пять. Это связано с тем, что если предложения или их синонимические представления являются повторами и находятся в том же абзаце, то они повторно не вводятся. Также не вводятся предложения, которые с точки зрения эксперта-редактора 4 не имеют значения для ввода.Figure 4 shows at the first stage in the source texts 1, 2, ..., n (blocks 25, 26, 27) of 6 simple sentences. At the second stage (blocks 28, 29, 30) after modeling in text model 1 (block 28) - 6 moldings, and in the second group of
Затем молинги (с их базовыми идентификаторами, определяющие их положение в исходном тексте) вводятся в базу знаний элинги, находящейся в блоке базы знаний 10 по порядку ввода исходных текстов, определяемого экспертом-редактором 4. Если ядра молинг одинаковы или синонимичны той молинге, которая уже находится в блоке БЗ 10, то добавляется ее идентификатор во множество идентификаторов данной молинги. Подобное построение БЗ обеспечивает декларативный подход к моделям знаний. На первом этапе в исходных текстах на фиг.3 было 18 простых предложений, в блоке БЗ 10 их уже всего восемь.Then the moldings (with their basic identifiers that determine their position in the source text) are entered into the knowledge base of the slip, which is located in the
Известно - знания в исходных текстах повторяются. При вводе знаний в виде моделей знаний в блок базы знаний элинги 10 делаются пометки (идентификаторы), из какого исходного текста ввод. Повторение знаний, имеющихся в базе знаний, повышает их достоверность (пометки дублированных знаний из разных источников в виде набора идентификаторов сохраняются). А то, чего нет, - вводится и увеличивает объем базы знаний. Т.е. с каждым новым исходным текстом база знаний представляет собой новую версию, монотонно возрастающую в объеме.It is known - knowledge in the source code is repeated. When you enter knowledge in the form of knowledge models into the block of the knowledge base of
Т.е. база знаний элинги представляет собой постепенно увеличивающуюся «паутину» - все более расширяющуюся и сгущающуюся в местах «горбов» знаний, где они или полностью оказываются дублированными (указывается только еще один их новый идентификатор), или все более уточняют эту фокусную область знаний конкретной предметной области. Этот и есть «эффект гребня»Those. Elinga's knowledge base is a gradually increasing "web" - more and more expanding and gathering in places of "humps" of knowledge, where they either turn out to be completely duplicated (only one new identifier is indicated), or more and more specify this focal area of knowledge of a specific subject area . This is the "comb effect"
Такое построение базы знаний обеспечивает возможность вывода необходимого источника в виде, близком к исходному тексту, достаточно задать номер исходного текста из словаря введенных исходных текстов.This construction of the knowledge base provides the ability to output the required source in a form close to the source text, it is enough to set the number of the source text from the dictionary of input sources.
Режим логического вывода 22 реализуется машиной логического вывода 9 с участием блока базы знаний 10 и блока рабочей части диалога 11, - приведен на фиг.5.The
Машина логического вывода 9 выполняет две функции:
- просмотр существующих фактов (у нас - терминов) из рабочей памяти 31 машины логического вывода 9 и молинг из блока базы знаний 10 и добавление (при возможности) в рабочую память 31 новых терминов (для вывода);- viewing existing facts (with us, the terms) from the working memory 31 of the
- определение порядка просмотра и применения молинг. Этот механизм управляет процессом вывода, сохраняя для пользователя информацию о полученных заключениях в блоке рабочей части диалога 15.- determination of the order of viewing and application of molding. This mechanism controls the output process, saving for the user information about the findings in the block of the working part of the
Логический вывод основан на правиле modus ponens, - «если известно, что истинно утверждение А и истинно правило вида «ЕСЛИ А, ТО В», тогда утверждение В также истинно». Применительно к молингам, которые представимы короткой семантической сетью в виде связанного графа (где вершинами являются термины из блока БД словарей 12), оно имеет вид, - «если имеет место определенный уровень истинности утверждения (термина) А и существует цепь в молинге, связывающая А с утверждением (термином) В, то имеет место определенный уровень истинности (достоверности) утверждения (термина) В». Этот уровень достоверности определяется уровнем достоверности (код 5) молинги.The logical conclusion is based on the modus ponens rule, “if it is known that statement A is true and a rule of the form“ IF A, THEN B is true, then statement B is also true. ” With regard to moldings, which are represented by a short semantic network in the form of a connected graph (where the vertices are the terms from the block of the dictionary database 12), it has the form, “if there is a certain level of truth of the statement (term) A and there is a chain in the molding that connects A with the statement (term) B, then there is a certain level of truthfulness (reliability) of the statement (term) B ”. This level of confidence is determined by the level of confidence (code 5) moldings.
Пример вывода показан на фиг.6. Предположим, пользователь задал запрос - найти связь между двумя разными терминами - термин 1 и термин 9. Ищется на основе прямого вывода с ограниченным перебором (с количеством промежуточных терминов не более шести). Вводится вначале исходный термин 1, ищется какая-то первая молинга с ядром молинги, где есть термин 1 (или его синоним) и термин 9 (или его синоним) одновременно. Если находится, то вводится в блок рабочей части диалога 15, где выстраиваются по мере уменьшения уровня достоверности найденных молинг. Если не находится, ищется некая (i-я) молинга с термином 1 с самым высоким уровнем достоверности и есть другие термины. Молинга срабатывает и выбираются другие термины, находящиеся в молинге для дальнейшего поиска, - это термины - термин 2 и термин 3. Вначале ищется цепочка связи с термином 9 по первому термину 2 (и его синониму), выбирается (i+k)-я молинга, в ней ищется следующий ближайший термин - термин 6. Ищется следующая молинга, имеющая термин 6 (или его синоним) и термин 9, и она находится (i+k+r)-я молинга. Результат вывода - последовательность молинг с порядковыми номерами (i), (i+k) (i+k+r) помещается блок рабочей части диалога 15.An example output is shown in FIG. Suppose a user asked to find a connection between two different terms -
Машина логического вывода должна функционировать даже при недостатке информации. Полученное решение может и не быть точным, однако система не должна останавливаться из-за того, что отсутствует какая-либо часть входной информации.The inference engine should function even with a lack of information. The resulting solution may not be accurate, but the system should not stop due to the absence of any part of the input information.
Машина логического вывода определяет порядок применения правил и выполняет четыре функции (см. фиг.5.).The inference machine determines the order of application of the rules and performs four functions (see Fig. 5.).
1. Сопоставление (блок программы 32 машины логического вывода 9) - выбранная молинга сопоставляется с имеющимися терминами, выбранные поступают в конфликтное множество - блок программы 33.1. Matching (program block 32 of the logical inference machine 9) - the selected molding is compared with the existing terms, the selected arrive in a conflicting set - program block 33.
2. Выбор (блок программы 34) - если в конкретной ситуации может быть применено сразу несколько молинг, то из них выбирается одна, наиболее подходящая по заданному критерию выбора молинг (блок программы 35), и происходит разрешение конфликта. Этим критерием является более высокий уровень достоверности и при равных величинах - первая по порядку.2. Choice (program block 34) - if several moldings can be applied at once in a specific situation, then one of the moldings most suitable according to the given selection criterion (program block 35) can be applied, and the conflict will be resolved. This criterion is a higher level of reliability and, with equal values, the first in order.
3. Срабатывание (блок программы 36) - если молинга при сопоставлении совпала с какими-либо терминами из блока рабочей части диалога 15, то молинга срабатывает.3. Triggering (program block 36) - if the molding during matching coincided with any terms from the block of the working part of the
4. Действие (блок программы 37) - блок рабочей части диалога 15 подвергается изменению путем добавления в него сработавшей молинги и новых терминов для дальнейшего вывода. Если в правой части молинги содержится указание на какое-либо действие - постусловие, то оно выполняется.4. Action (program block 37) - the block of the working part of the
Машина логического вывода 9 циклична. В каждом цикле просматриваются молинги, чтобы выявить те, где термины совпадают с известными на данный момент терминами из блока рабочей памяти 31 (кроме уже просмотренных). После выбора (блок программы 34) молинга срабатывает, и новый термин заносится в блок рабочей части диалога 15 для дальнейшего вывода, и цикл повторяется.
В одном цикле может сработать только одна молинга. Если несколько молинг успешно сопоставлены с терминами, то машина логического вывода 9 производит выбор по заданным критериям единственной молинги, которая срабатывает в данном цикле.In one cycle, only one molding can work. If several moldings are successfully mapped to terms, then
В режиме работы с диалогом 21, реализуемым блоком рабочей части диалога 15, всю необходимую информацию выдают пользователю 4 через компьютер 1. Пользователю 4 поступают по группам все последовательности логического вывода ядер молинг с номерами (i), (i+k), (i+k+r) разной длины в порядке убывания уровня достоверности (код 5) при заданном запросе для вывода на основе термин 1 - термин 9.In the mode of operation with the
Уровень достоверности последовательности молинг упосл рассчитывается следующим образом.The reliability level of the sequence of molding at the last is calculated as follows.
ПустьLet be
yi - уровень достоверности в виде фактора уверенности в пределах от -1 до 1 для начальной i-й молинги (где 1≤i≤n);y i is the confidence level in the form of a confidence factor ranging from -1 to 1 for the initial i-th molding (where 1≤i≤n);
yi+k - уровень достоверности в виде фактора уверенности в пределах от -1 до 1 для некоторой промежуточной i+k-й молинги (где 1<k<n);y i + k is the confidence level in the form of a confidence factor ranging from -1 to 1 for some intermediate i + k-th molding (where 1 <k <n);
yi+k+r - уровень достоверности в виде фактора уверенности в пределах от -1 до 1 для некоторой конечной i+k+r-й молинги (где i+k<r<n - (i+k)). Тогдаy i + k + r is the confidence level in the form of a confidence factor ranging from -1 to 1 for some final i + k + r-th molding (where i + k <r <n - (i + k)). Then
Если какое-то из значений yi, yi+k, yi+k+r окажется ≤0, то и все значение yпосл указывается сразу равным=0 без дальнейшего расчета.If any of the values of y i , y i + k , y i + k + r turns out to be ≤0, then the entire value of y last is indicated immediately equal to = 0 without further calculation.
Пользователь, читая последовательность этих ядер молинг, а фактически это группы последовательностей простых предложений, семантически связанных между собой, сам решает, удовлетворяет его этот результат - текст или нет. Выбирает необходимую ему группу (или группы) и фиксирует ее (или их) в блок сохраненной части диалога (вместе с терминами запроса) 16, вместе с со всеми результатами постусловий при запуске расчетных моделей из блока расчетных моделей 13 или визуальных и графических образов из блока визуальных и графических образов 14. Если ответ его полностью не устраивает, пользователь имеет возможность или снова повторить логический вывод (режим логического вывода 22) с новыми вариантами запроса (с новыми терминами для логического вывода) или по какому-то ядру молинги запустить режим когезии 24 (локальной связанности текста относительного конкретного исходного текста (одного из используемых для конкретной молинги идентификаторов исходного текста, соответствует абзацу исходного текста) на небольшом расстоянии от исходного предложения) или когерентности (глобальной связанности текста через одинаковые термины (заголовки), относительного конкретного упомянутого и выбранного исходного текста из нескольких идентификаторов),The user, reading the sequence of these cores, molding, but in fact it is a group of sequences of simple sentences that are semantically interconnected, he decides whether this result satisfies him - text or not. Selects the group (or groups) he needs and fixes it (or them) in the block of the saved part of the dialog (together with the query terms) 16, together with all the results of the postconditions when starting the calculation models from the block of
Режим когезии 24 обеспечивает вывод в блок рабочей части диалога 15 из блока базы знаний 10 последовательностей ядер молинг, имеющих, как минимум, один идентификатор, соответствующий заданному пользователем (через представленный ему перечню исходных текстов, их глав, параграфов из словаря введенных исходных текстов из блока БД словарей 12). Вывод ядер молинг в режиме когезии при одинаковом идентификаторе соответствует выводу абзаца исходного текста (блоки 25 или 26 или 27). Запрос пользователя о выводе всего исходного текста, соответствующего интересующему его ядра молинги (простого предложения) соответствует использованию эффекта когерентности исходного текста или режима вывода исходного текста 23. Объем может задаваться пользователем 4 - или в объеме параграфа, или в объеме главы, или в объеме всего исходного текста со всеми главами и параграфами.The
Весь необходимый пользователю текст, который оказался необходим пользователю и полученный им в режиме работы с диалогом 21 в блоке рабочая часть диалога 15, может быть сохранен пользователем в блоке сохраненной части диалога 16. Причем блоки исходного текста (в виде последовательностей ядер молинг), полученные в режиме когезии 24, могут непосредственно в блоке сохраненной части диалога 16 запоминаться, а также полученные в режиме вывода исходных текстов (обеспечения когерентности) 23, только с указанием выделенных пользователем необходимых идентификаторов.All the text necessary for the user, which turned out to be necessary for the user and received by him in the mode of working with the
В дальнейшем при работе пользователя с блоком сохраненной части диалога 16 необходимые последовательности ядер молинг будут подгружаться в блок сохраненной части диалога 16 из блока базы знаний 10, также как и необходимые расчетные модели из блока 13 и визуальные, и графические образы - блок 14. Соответственно, все это будет выводиться по запросу пользователя в компьютер 1 для пользователя.Subsequently, when the user is working with the block of the saved part of the
Режим вывода текстов 23 может задаваться пользователем через блок распределения заданий 8. Последний активизирует блок рабочей части диалога 15 и по запросу пользователя производится вывод из блока базы знаний 10 тех или иных исходных текстов в виде последовательности ядер молинг по подобранным идентификаторам, начиная с одинакового номера ссылки в словаре исходных текстов в коде 1. Все это передается в компьютер 1 для пользователя.The output mode of the
Подробнее программная реализация режима вывода текстов 23 и режима когезии 24 в машине логического вывода 9 рассмотрены на фиг.7.The software implementation of the
В режиме когезии 24 пользователь при работе с результатами, выдаваемыми элингой в блок рабочей части диалога 15, может выбрать интересующее его простое предложение (ядро некоторой молинги) и для уточнения выбрать поясняющий абзац, выбрав один из идентификаторов молинги, в виде - код 1.1. код 1.2. код 1.3. код 1.4. Он поступает в машину логического вывода 9 в блок программы 38, а из него в блок программы 39, который ищет все молинги, находящиеся в блоке базы знаний 10 с заданным идентификатором. Если молинга найдена, то блоком программы 40 копия молинги отправляется в блок рабочей части диалога 15, если "нет" - проверяется блоком программы 41, все ли просмотрено. Если "нет", просмотр продолжается, если "да", то проверяют в блоке программы 42 - это был запущен режим когезии 24 или нет. Если "да", то сообщают в блок рабочей части диалога 15, что задание выполнено.In the
Если "нет", то - машина логического вывода 9 инициирована или блоком распределения заданий 8, или блоком рабочей части диалога 15 (в обоих случаях пользователем) в режиме вывода исходных текстов 23.If "no", then the
Режим вывода исходных текстов 23 задается или из блока распределения заданий 8, или блока рабочей части диалога 15. В блок программы 43 машины логического вывода 9 в виде запроса текста, который надо вывести - код 1.1.x.x.x, т.е. надо вывести весь текст, близкий к исходному тексту, который содержится в блоке БЗ 10 в форме молинг. Код 1.1 соответствует номеру исходного текста из словаря исходных текстов, который находится в блоке БД словарей 12. Возможны варианты задания в виде код 1.1. код 1.2.х.х, когда задается вывод только конкретной главы конкретного исходного текста, и код 1.1. код 1.2. код 1.3.х - когда задается вывод только конкретного параграфа конкретной главы.The output mode of the source texts 23 is set either from the
Поиск молинг начинается с задания поиска главы с номером 1 в виде заданияThe search for a molding begins with the task of searching for a chapter with
код 1.1.х.х.х=код 1.1.1.х.х.code 1.1.x.x.x = code 1.1.1.x.x.
Задается начальный код параграфа, который ищется с номером 1 в виде код 1.1.х.код 1.3..х=код 1.1.x.1.xThe initial code of the paragraph is set, which is searched with
в блоке программы 45.in
Далее задается начальный номер абзаца с номером 0 (это - заголовок) в начальном параграфе начальной главы в блоке программы 46 в виде код 1.1.х.х.х=код 1.1.х.х.0.Next, the starting number of the paragraph with number 0 (this is the title) is set in the initial paragraph of the initial chapter in
И затем начинается поиск молинг для 0-го абзаца. Дальше все проходит, как и в режиме когезии 24. Если в блоке программы 42 идет выход "нет", то происходит переход к блоку программы 47, в котором определяется, все ли абзацы в параграфе просмотрены. Если выход блока программы 47 - "нет", то в блоке 48 увеличивается номер кода для поиска нового абзацаAnd then the search begins for the molding for the 0th paragraph. Then everything goes on, as in
код 1.1.х.х.код 1.4=код 1.1.х.х. (код 1.4+1).code 1.1.x.x.code 1.4 = code 1.1.x.x. (code 1.4 + 1).
Если в качестве выхода блока программы 47 используется "да", то идет переход к блоку программы 49. При этом проверяются, все ли номера параграфов просмотрены, если "нет", то идет присвоение нового номера параграфа в блоке программы 50 в видеIf "yes" is used as the output of program block 47, then it goes to program block 49. In this case, it is checked whether all paragraph numbers are viewed, if "no", then a new paragraph number is assigned in
код 1.1.х.код 1.3.х=код 1.1.х.(код 1.3+1).хcode 1.1.x.code 1.3.x = code 1.1.x. (code 1.3 + 1) .x
и далее по циклу.and further along the cycle.
Если в блоке программы 49 был выход "да", то означает, что просмотрены все параграфы заданной главы заданного исходного текста и идет переход к блоку программы 51. Если из него выход "нет", т.е. не просмотрены все главы заданного исходного текста, то номер главы в блоке программы 52 увеличиваетсяIf the program block 49 had a yes exit, it means that all the paragraphs of the given chapter of the specified source text have been viewed and the program 51 will go to the block. If there is a no exit, i.e. if all chapters of the given source text are not viewed, then the chapter number in the
код 1.1. код 1.2.х.х=код 1.1.(код 1.2+1).х.х.code 1.1. code 1.2.x.x = code 1.1. (code 1.2 + 1) .x.x.
Если выход из блока программы 51 "да", то это означает, что все молинги данного номера текста с кодом код 1.1. выбраны и отправлены в блок рабочей части диалога 15. При этом происходит возврат к блокам распределения заданий 8 или блоку рабочей части диалога 15 с сообщением, что задание по блоку 43 закончено.If the exit from the program block 51 is “yes”, then this means that all the moldings of a given text number with code code 1.1. selected and sent to the block of the working part of the
Для снижения опасности копирования элинг и времени реакции на задаваемые вопросы (в процессе эксплуатации) используется специальное устройство считывания эллинг 2 для запуска машиночитаемых носителей 5 с элингами и специальные методы защиты машиночитаемых носителей, - как механическим путем, программным, так и организационным.To reduce the risk of copying the elling and the reaction time to the questions asked (during operation), a
А именно:Namely:
- с целью затруднения копирования, - машиночитаемый носитель 5 имеет механические изменения, препятствующие его считыванию на иных устройствах считывания (отличных от устройств считывания 2) - разъемы 3, 6 имеют размеры, отличные от стандартных;- in order to make copying difficult, - machine-
- все содержимое блоков на машиночитаемом носителе 5 с каждой новой версией шифруется с использованием блоков шифратор/дешифратор 7, препятствуя считыванию элинг, в т.ч. на иных устройствах считывания, отличных от устройств считывания 2;- the entire contents of the blocks on a machine-
- набор молинг в блоке базы знаний 10 каждой новой версии имеет небольшие изменения, препятствующие работе со старой машиной логического вывода 9, в частности, изменяются разделители кодов молинг и их последовательность;- the molding set in the
- машина логического вывода 9 каждой новой версии имеет небольшие изменения, препятствующие работе с наборами молинг в старых базах знаний, в частности, в новой версии машины логического вывода 9, в блоке рабочей части диалога 15, в блоке сохраненной части диалога 16 изменены элементы работы с блоком базы знаний 10 в связи с новыми разделителями кодов молинг и их последовательностью.-
Итак, основные отличия от прототипа:So, the main differences from the prototype:
- иная техническая реализация поставленных целей, в частности, совсем иная реализация машиночитаемого носителя и его роль;- other technical implementation of the goals, in particular, a completely different implementation of a machine-readable medium and its role;
- использование объединенной базы знаний текстов, причем специально отобранных, обеспечивает более качественный отбор знаний, меньший объем объединенной базы знаний (по сравнению с традиционными системами управления знаниями), что затем приводит к резкому ускорению нахождения решений даже того же уровня и возможности «свободного плавания» по предметному «морю» знаний (объединенной базе знаний), что практически невозможно у прототипа;- the use of a unified knowledge base of texts, and specially selected ones, provides a better selection of knowledge, a smaller amount of a joint knowledge base (compared to traditional knowledge management systems), which then leads to a sharp acceleration of finding solutions even of the same level and the possibility of “free swimming” on the subject "sea" of knowledge (a unified knowledge base), which is practically impossible with the prototype;
- использование в качестве моделей знаний молинг приводит, по сравнению с САО-структурами, к намного более точному отражению семантики знаний уже на уровне предложений, ликвидации проблем синтеза на уровне предложений и возможности применения намного более простых и более быстродействующих методов синтезов текстов, в т.ч. реального синтеза текстов, близких к исходным текстам, что фактически на базе САО-структур в удовлетворительном варианте реализовать нельзя;- the use of moldings as knowledge models leads, in comparison with CAO structures, to a much more accurate reflection of the semantics of knowledge already at the sentence level, elimination of synthesis problems at the sentence level and the possibility of using much simpler and faster methods of text synthesis, i.e. hours a real synthesis of texts close to the source texts, which in fact cannot be implemented satisfactorily on the basis of SAO structures;
- жесткое разделение на режимы ввода знаний 18 и рабочий режим 19, причем в режиме ввода знаний 18 производителем элинг возможно медленное (казалось бы, но качественное и множеством экспертов-редакторов, причем даже параллельно) заполнение объединенной базы знаний, но в рабочем режиме 19 намного более быстрое нахождение результатов по уже находящейся в элинге объединенной базы знаний (в т.ч. не надо потерь времени на каналы передачи информации по Интернету и внутри компьютерной системы);- a rigid division into
- более качественное нахождение результатов логического вывода, поскольку ядра молинг по сравнению с САО-структурами более качественно отражают семантическую сущность используемых элементов знаний.- a better quality of finding the results of a logical conclusion, since molding cores, in comparison with SAO structures, better reflect the semantic essence of the elements of knowledge used.
Более конкретно ниже.More specifically below.
Основными существенными признаками являются нижеследующие.The main essential features are as follows.
Система для работы с интеллектуальной электронной книгой - элингой - носителем знаний, состоящая из компьютера 1, устройства считывания эллинги 2 и машиночитаемого носителя 5, соединяемые через разъемы 3, 6, ПС компьютера для подключения машиночитаемого носителя 5, с машиной логического вывода 9, блоком базы знаний 10, ПС запуска его блоков с визуализацией для пользователя получаемых результатов, отличающаяся тем:System for working with an intellectual electronic book - Elinga - a knowledge carrier, consisting of
1. что на машиночитаемом носителе 5 машина логического вывода 9, с одной стороны, соединена через блок распределения заданий 8, шифратор/дешифратор 7 с разъемом 6, с другой стороны, соединена с блоком базы знаний 10, соединенной с отдельными блоками - блоком БД словарей 12, блоком расчетных моделей 13, блоком визуальных и графических образов 14 и блоками рабочей части диалога 15, блоком ввода знаний 11, с третьей стороны, соединенной с блоком рабочей части диалога 15, соединенного также с блоком распределения заданий 8, блоком БД словарей 12, блоком сохраненной части диалога 16, который соединен с блоком распределения заданий 8, блоком расчетных моделей 13 и блоком визуальных и графических образов 14, причем блок ввода знаний 11 соединен с блоком распределения заданий 8, блоком БД словарей 12, блоком расчетных моделей 13 и блоком визуальных и графических образов 14;1. that on a machine-
2. Система по п.1. отличающаяся тем, что исходный текст 25-27 (вводимый в блок базы знаний 10) разбит экспертом-редактором 4 на простые предложения длиной 3-15 слов, выделяются расчетные модели и визуальные и графические образы, причем простые предложения преобразуются в модели знаний - молинги в моделях текста 28-30, которые имеют структуру, где код 1 - множество идентификаторов простых предложений, указывающих все места исходных текстов, где они упоминаются, в том числе в семантически эквивалентном виде; код 2 - условие применимости ядра молинги; код 3 - ядро молинги, где помещается простое предложение, как правило, длиной 3-15 слов; код4 - последовательность номеров словарей, фиксирующих положение слов и элементов простых предложений в ядре молинги последовательностью терминов, отношений, качественных признаков, количественных признаков или лингвистических и логических связей; код 5 - уровень достоверности молинг в виде факторов уверенности в пределах от -1 до +1; код 6 - постусловия молинги, которые активизируются в случае, если ядро молинги реализовалось, при этом постусловия молинги описывают действия и процедуры, которые необходимо выполнить, в их числе - переход к другой молинге, ввод в действие расчетных моделей введенных в блок расчетных моделей 13 или актуализация визуальных или графических образов из блока визуальных или графических образов 14, затем молинги из моделей текстов 28-30 вводятся в блок базы знаний 10 посредством наложения моделей знаний - молинг, при этом расчетные модели в виде программ заносятся в блок расчетных моделей 13, визуальные и графические образы в блок визуальных или графических образов 14, словари терминов, отношений, качественных признаков, количественных признаков или лингвистических и логических связей и номеров исходных текстов в блок БД словарей 12, причем сами молинги, словари, расчетные модели, визуальные и графические образы вводятся в режиме ввода знаний 18 задаваемым блоком распределения заданий 8 - экспертом-редактором 4 через компьютер 1, устройство считывания элинги 3, разъемы 3,6, шифратор/дешифратор 7, блок распределения заданий 8, блок ввода знаний 11 в блок базы знаний 10, блок БД словарей 12, блок расчетных моделей 13 и блок визуальных и графических образов 14;2. The system according to
3. Система по п.1. отличающаяся тем, логический вывод осуществляется машиной логического вывода 9 в режиме логического вывода 22 по заданию блока распределения заданий 8 или блока рабочей части диалога 15, которые активизируются пользователем 4 по его запросу - заданию им, как минимум, двух разных терминов: термин 1 и термин 2 для проведения логического вывода на основе прямого вывода с ограниченным перебором (с количеством промежуточных терминов не более шести), при этом вначале ищутся ядра молинг в блоке базы знаний 9, где они присутствуют вместе и если есть, - передаются в блок рабочей части диалога 15 по порядку уменьшения уровня достоверности, потом ищется первая (i-я) молинга с первым термином термин 1 (или его синонимом) с самым высоким уровнем достоверности и есть другие термины, тогда молинги срабатывают и выбираются другие термины (или их синонимы), находящиеся в молинге для дальнейшего поиска, вначале первый из них (или его синоним), потом последующие посредством ограниченного перебора вариантов, при этом выбирается (i+k)-я молинга, где имеется этот первый из других термин (или последующий и их синонимы), в ней ищется новый следующий ближайший термин, а далее ищется (i+k+r)-я молинга, которая имеет и следующий ближайший термин и искомый для логического вывода второй термин термин2, при этом последовательность ядер молинг, удовлетворяющих условиям вывода с порядковыми номерами (i), (i+k) (i+k+r), помещаются в блок рабочей части диалога 15 ограниченными наборами, причем сам поиск последовательностей логического вывода машиной логического вывода 9 и блоком базы знаний 10 продолжается, пока пользователь не просмотрит уже полученный ограниченный набор последовательностей ядер молинг, переданный ему из блока рабочей части диалога 15, в компьютер 1 и не решит, - устраивает его результат или нет, просматривать ли ему новый ограниченный набор последовательностей ядер молинг или нет, причем сами последовательности ядер молинг имеют вид семантически связанного текста из простых предложений, при этом пользователь 4, исходя из полученных результатов, может задать новые термины для нового запроса логического вывода машине логического вывода 9 или перейти к режиму когезии 24 для выбранного им самим ядра молинги (простого предложения) или режиму вывода текстов 20, причем последовательности ядер молинг подаются пользователю в порядке уменьшения расчетного уровня достоверности, который рассчитывается для последовательностей ядер молинг, причем ко всем ядрам молинг соответственно пользователю выдаются активированные постусловия молинг, - из блока расчетных моделей 13 - расчетные модели или из блока визуальных и графических образов 14 - визуальные и графические образы;3. The system according to
4. Система по п.1. отличающаяся тем, что в режим когезии 24 и режиме вывода исходного текста 23 происходит вывод текста, близкого к исходному по запросу пользователя блоком рабочей части диалога 15 или блоком сохраненной части диалога 16 в виде последовательности ядер молинг из блока базы знаний 10, имеющих, как минимум один одинаковый элемент идентификатора, соответствующий заданному пользователем (через представленный ему перечень исходных текстов, их глав, параграфов из словаря, введенных исходных текстов из блока БД словарей 12), если задан код 1.1.x.x.x - находятся все простые предложения в виде последовательностей ядер молинг заданного исходного текста, если задан код 1.1.код 1.2.х.х, находятся все простые предложения в виде последовательностей всех ядер молинг главы код. 1.2 текста код 1.1, если задан код 1.1. код 1.2. код 1.3.х, находятся все простые предложения параграфа код 1.3 главы 1.2 текста 1.1, если задан код 1.1. код 1.2. код 1.3. код 1.4, находятся все простые предложения абзаца 1.4 параграфа код 1.3 главы 1.2 текста 1.1, причем последний и есть режим когезии 24, причем эти последовательности ядер молинг в виде семантически связанного текста, близкого к исходному, передаются в компьютер 1 пользователю 4;4. The system according to
5. Система по п.1. отличающаяся тем, что машиночитаемый носитель 5 имеет механические изменения, препятствующие его подключению и считыванию на иных устройствах считывания (отличных от устройств считывания элинг 2) - их разъемы 3,6 имеют размеры, отличные от существующих стандартных.5. The system according to
6. Система по п.1. отличающаяся тем, что все содержимое блоков на машиночитаемый носителе 5 с каждой новой версией элинги зашифровано с помощью шифратора/дешифратора 7, препятствуя считыванию элинг, используя возможности предыдущих версий элинг, а также на иных устройствах считывания, отличных от устройств считывания эллинг 2;6. The system according to
7. Система по п.1, отличающаяся тем, что в наборе молинг в блоке базы знаний 10 каждой новой версии элинги для препятствия работе с машиной логического вывода 9 старой версии изменяются разделители кодов молинг и их последовательность.7. The system according to
8. Система по п.1, отличающаяся тем, что машина логического вывода 9 каждой новой версии элинги имеет изменения, препятствующие работе с наборами молинг в блоках баз знаний 10 предыдущих версий, как минимум, в новой версии машины логического вывода 9, в блоке рабочей части диалога 15, в блоке сохраненной части диалога 16, изменены элементы работы с базой знаний 10 в связи с новыми разделителями кодов молинг и их последовательностью.8. The system according to
4. Краткое описание чертежей4. Brief Description of the Drawings
Фиг.1 - обобщенная структурная схема, в которой функционирует изобретениеFigure 1 is a generalized block diagram in which the invention operates
Фиг.2 - структурная схема связей блоков на машиночитаемом носителе 5Figure 2 is a block diagram of block connections on a computer-
Фиг.3 - базовые режимы работы элинги 17Figure 3 - the basic modes of operation of the
Фиг.4 - порядок семантического анализа исходных текстов и заполнения базы знаний в режиме ввода знаний 18Figure 4 - the order of the semantic analysis of the source texts and filling the knowledge base in the mode of entering
Фиг.5 - структура работы машины логического вывода 9 в режиме логического вывода 22Figure 5 - structure of the operation of the
Фиг.6 - вариант логического вывода на базе знаний из молинг6 is a variant of the logical conclusion based on knowledge from molding
Фиг.7 - блок-схема программы машины логического вывода 9 и связи блоков при этом в режиме вывода исходных текстов 23 и режима когезии 247 is a block diagram of a program of a
5. Осуществление изобретения5. The implementation of the invention
В принципе, технологии реализации изобретения и его использования полностью находятся в рамках создания интеллектуальных систем, в частности, ЭС, и их использования.In principle, the technologies for implementing the invention and its use are completely within the framework of creating intelligent systems, in particular, ES, and their use.
Однако ряд указанных технических особенностей реализации такой технологии для системы для работы с элингами обеспечивает новые возможности, которые ранее были недостижимы.However, a number of the indicated technical features of the implementation of such a technology for a system for working with elings provides new opportunities that were previously unattainable.
Например, ЭС могут работать только в узкой области и для не слишком сложных задач, поскольку все выдаваемые результаты должны быть отлажены с участием экспертов, а базы знаний вводятся только с участием экспертов и заполняются и отлаживаются весьма медленно.For example, ES can work only in a narrow area and for not too complicated tasks, since all the output should be debugged with the participation of experts, and knowledge bases are entered only with the participation of experts and are filled and debugged very slowly.
А при работе с элингой - база знаний может быть намного больше, т.е. время отладки для ЭС, с подобной базой знаний, - просто ушло бы в бесконечность. Решаемые задачи для элинги гораздо более сложные, а предметная область намного шире, - все оказывается по-иному.And when working with лингlinga - the knowledge base can be much larger, i.e. debugging time for ES with a similar knowledge base would simply go to infinity. The tasks for elinga are much more complex, and the subject area is much wider - everything turns out differently.
Полная отладка не делается из-за отсутствия необходимости и невозможности. Используется то, что вводятся исходные тексты, уже прошедшие редактирование, экспертизу и нередко весьма тщательную (например, патенты, стандарты, учебники и т.п.). При этом отладка элинги проводится только локальная. Если возникают при вводе разные варианты молинг (разные варианты знаний), то они фиксируются, как разные, с разным уровнем достоверными, оцениваемыми факторами уверенности. Способ их расчета, такой, какой применялся в ЭС MYCIN.Full debugging is not done due to the lack of need and impossibility. It is used that the source texts that have already been edited, reviewed, and often very thorough (for example, patents, standards, textbooks, etc.) are introduced. At the same time, debugging of the eling is carried out only local. If different types of molding (different types of knowledge) arise when entering, then they are recorded as different, with different levels of reliable, assessed confidence factors. The method of their calculation, such as that used in the MYCIN ES.
Остается ситуация, традиционная для чтения текстов тысячелетиями, - возможны какие-то мелкие ошибки или нестыковки при подготовке текста автором или подготовке к печати. Что не мешает, как правило, восприятию текста и знаний вообще.There remains a situation traditional for reading texts for millennia — some minor errors or inconsistencies are possible in preparing the text by the author or preparing for printing. What does not interfere, as a rule, with the perception of text and knowledge in general.
Если при чтении одного текста пользователь имеет дело с одним текстом, то в данном случае он имеет дело действительно фактически с «морем» знаний (присутствуют интегрированные знания из многих книг), в котором он перемещается по своему желанию. Возникает тот же эффект, который уже давно зафиксирован для гипертекстовых систем, когда пользователь имеет дело с нелинейной организацией текста. Обычный текст пользователь читает последовательно (линейно), а для гипертекстовых систем идет постоянный переход от одних частей текста к другим, в т.ч. разных источниках. В элинге это происходит в связи с логическим выводом по базе знаний элинги.If the user is dealing with one text while reading one text, then in this case he is actually dealing with a “sea” of knowledge (there are integrated knowledge from many books), in which he moves as he wishes. There is the same effect that has long been fixed for hypertext systems when the user is dealing with non-linear organization of the text. The user reads plain text sequentially (linearly), and for hypertext systems there is a constant transition from one part of the text to another, including different sources. In Eling, this happens in connection with the logical conclusion of the Elings knowledge base.
За счет использования эффектов когезии или когерентности, - связанный текст, получаемый при работе машины логического вывода элинги, представляется пользователю весьма осмысленным и связным текстом, имеющим для пользователя совершенно новое звучание. Эффекты когезии и когерентности хорошо известны в лингвистике.Through the use of cohesion or coherence effects, the linked text obtained by the operation of the Elinga logical inference machine seems to the user to be a very meaningful and coherent text that has a completely new sound for the user. The effects of cohesion and coherence are well known in linguistics.
Оценим размер баз знаний элинги с точки зрения реализуемости. Элинга с хорошим уровнем знаний будет иметь знания, где-то от 100 исходных текстов конкретной предметной области, например, книг. Средняя книга - объем 300 стр., средний объем страницы около 30 Кбайт, средний объем 1 рисунка (чертежа) на 1 стр.- около 70 Кбайт. Итого получается 30 Мбайт на 1 книгу или 3 Гбайта на весь объем. Однако не менее 50% знаний окажется дублированным, т.е. в разных книгах или даже разных частях одной книги совпадающим, то объем окажется уже 1,5 Гбайта. Поскольку в молинге, кроме ядра есть еще информация, а кроме того, еще есть информация о кодировании структуры самого ядра, как маленькой семантической сети, то общий объем возрастает теперь в среднем в 1,5 раза, т.е. до 2,25 Гбайт. Словари терминов (и их синонимов), отношений, качественных признаков и иного, займут относительно немного места.Let us evaluate the size of Elingi knowledge bases in terms of feasibility. Eling with a good level of knowledge will have knowledge, somewhere from 100 source texts of a specific subject area, for example, books. The average book is 300 pages long, the average page size is about 30 Kbytes, the average volume of 1 drawing (drawing) per 1 page is about 70 KB. In total, 30 MB for 1 book or 3 GB for the entire volume is obtained. However, at least 50% of the knowledge will be duplicated, i.e. in different books or even different parts of the same book matching, then the volume will be already 1.5 GB. Since in addition to the core there is also information in the molding, and in addition there is still information about the encoding of the structure of the core itself, as a small semantic network, the total volume now increases on average by 1.5 times, i.e. up to 2.25 GB. Dictionaries of terms (and their synonyms), relationships, quality attributes and otherwise, will take up relatively little space.
ПС машины вывода займет не более 300 М байт. Т.о. общий объем такой элинги вполне мог бы записывается на обычный диск формата DVD объемом около 4 Гбайт или небольшую флэшку (которые имеют тоже сложную внутреннюю структуру), а тем более специально разработанный машиночитаемый носитель 5 для создания элинги.The MS of the output machine will take no more than 300 M bytes. T.O. the total volume of such an eling could well be written to a regular DVD-format disc with a capacity of about 4 GB or a small flash drive (which also have a complex internal structure), and even more so specially designed computer-
Теперь оценим с точки зрения уровня знаний с учетом «эффекта гребня».Now we will evaluate in terms of the level of knowledge, taking into account the "comb effect".
Предположим, около 50% молинг (полученных из отдельных предложений) находятся в достаточно широкой предметной области, а 50% сосредоточены в фокусных местах, где появились «горбы» знаний (о чем мы говорили при объяснении «эффекта гребня»). В исходном тексте - тексте - книге, предположим, на странице - 20 предложений (или получается 25 молинг - излагается исходный текст более четко).Suppose that about 50% of moldings (obtained from individual sentences) are in a fairly wide subject area, and 50% are concentrated in focal places where the “humps” of knowledge have appeared (which we talked about when explaining the “comb effect”). In the source text - text - book, suppose there are 20 sentences on the page (or 25 molding is obtained - the source text is stated more clearly).
Общее число молинг получается - 100 книг × 300 страниц × 25 молинг=750000 молинг. Из них около 400000 относится к фокусным группам. Если фокусных групп около 100, в среднем по 1 на книгу, большинство из них фактически будут в первых книгах, причем некоторые из последних вводимых вообще никаких фокусных групп не добавят. У нас выходит, что, в среднем, на 1 фокусную группу приходится около 4000 молинг. Из 30-летней практики применения ЭС известно, что при увеличении базы знаний ЭС до 10000 продукционных правил (в среднем), ЭС превосходит наиболее квалифицированных специалистов по уровню выдаваемых результатов. Здесь молинги вполне можно сравнивать с продукционными правилами, они еще более мощные и гибкие средства моделирования знаний по сравнению с ними. Этот же предел в 10000 продукционных правил (как ориентировочный барьер интеллектуальности) указан в проекте создания ЭВМ 5-го поколения.The total number of moldings is obtained - 100 books × 300 pages × 25 molding = 750,000 molding. Of these, about 400,000 are focus groups. If there are about 100 focus groups, on average 1 per book, most of them will actually be in the first books, and some of the last ones introduced will not add any focus groups at all. It turns out that, on average, about 4,000 moldings per 1 focus group. From the 30-year practice of using ES, it is known that with an increase in the knowledge base of ES to 10,000 production rules (on average), ES surpasses the most qualified specialists in terms of the results issued. Here, moldings can be compared with production rules; they are even more powerful and flexible tools for modeling knowledge in comparison with them. The same limit of 10,000 production rules (as an indicative barrier to intelligence) is indicated in the design project for the 5th generation computer.
Увеличение базы знаний элинги еще в 3-4 раза приведет к тому, что элинги в широкой предметной области способны выдавать ответы с уровнем знаний, превышающим лучших специалистов конкретных предметных областей. Заметим, что не для всех предметных областей с ходу возможно создание элинг с таким уровнем результатов.An increase in the knowledge base of elings by another 3-4 times will lead to the fact that the elings in a wide subject area are able to give answers with a level of knowledge exceeding the best specialists in specific subject areas. Note that not for all subject areas on the move it is possible to create an elling with this level of results.
Изобретение реализуется компьютерной системой (фиг.1), которая состоит из компьютера 1, связаного с устройством считывания элинги 2, имеющей разъем 3. Пользователь 4 имеет доступ к элинге и результатам работы с ней через технические возможности компьютера 1. Машиночитаемый носитель 5 с элингой подключается к устройству считывания элинги через свой разъем 6 (фиг.2).The invention is implemented by a computer system (Fig. 1), which consists of a
Машиночитаемый носитель 5 с элингой подключается к устройству считывания элинги через свой разъем 6 (фиг.2).The computer-
На машиночитаемом носителе 5 находятся шифратор/дешифратор 7, блок распределения заданий 8, блок машины логического вывода 9, блок базы знаний 10, блок ввода знаний 11, блок БД словарей 12, блок расчетных моделей 13, блок графических и визуальных образов 14, блок рабочей части диалога 15, блок сохраненной части диалога 16.The machine-
Физически элинга представят собой - машиночитаемый носитель 5 с блоками, реализованными на базе электронных компонентов, который и будет выступать в качестве носителя знаний.Physically, the boathouse will be a machine-
Режим ввода знаний 18 (фиг.3) резко отличается от прототипа. В прототипе он - текущий оперативный. В настоящем изобретении ввод знаний резко отделен от оперативной работы пользователя 4. Ввод знаний в режиме ввода знаний 18 производит подготовленный эксперт-редактор 4, который у производителя элинги заполняет блок базы знаний достаточно долго, но качественно.The input mode of knowledge 18 (figure 3) is very different from the prototype. In the prototype, he is the current operational. In the present invention, the input of knowledge is sharply separated from the operational work of the user 4. The input of knowledge in the input mode of
Оперативная работа пользователя 4 уже происходит быстро без дополнительных потерь времени на преобразования исходных текстов и поиска исходных текстов во внешних БД, как в прототипе.The operational work of user 4 is already happening quickly without additional loss of time for converting source texts and searching for source texts in external databases, as in the prototype.
Сам ввод знаний в элингу в режиме ввода знаний 18 производится экспертом-редактором 4 следующим образом. Имеется множество специально подобранных исходных текстов определенной предметной области, они разбиваются на простые предложения преимущественно длиной 3-15 слов. Эти простые предложения превращаются в специальные модели знаний - молинги, имеющие структуру - код 1; код 2; код 3; код 4; код 3; код 6, описанную ранее.The very input of knowledge into the Eling in the mode of entering
Это не только ускоряет и упрощает моделирование знаний из исходных текстов, в частности, по сравнению с САО-структурами у прототипа, но и значительно упрощает получение результатов логического вывода для элинги, позволяя выдавать пользователю 4 связный осмысленный текст блоками, весьма удобный для чтения и понимания, и позволяя ему управлять этим процессом в диалоге с компьютером 1.This not only speeds up and simplifies the modeling of knowledge from the source texts, in particular, in comparison with the SAO structures of the prototype, but also greatly simplifies the obtaining of logical inference results for the eling, allowing the user to give 4 connected meaningful text in blocks, which is very convenient for reading and understanding , and allowing him to control this process in dialogue with
При моделировании эксперт-редактор 4 задает значения уровня достоверности в виде фактора уверенности со значениями в пределах от -1 (совершенно недостоверная) до +1 (полностью достоверная), что потом используется при логическом выводе с целью выстраивания иерархии ответов по степени их достоверности. Вначале выдаются цепочки молинг с большим уровнем факторов уверенности.When modeling, the expert editor 4 sets the values of the confidence level in the form of a confidence factor with values ranging from -1 (completely unreliable) to +1 (completely reliable), which is then used in the logical inference in order to build a hierarchy of answers according to the degree of their reliability. Initially, chain moldings with a high level of confidence factors are issued.
Расчетные модели (запрограммированные стандартным образом или реализуемые с использованием уже разработанных ПС, находящихся в блоке расчетных моделей 13 или в оперативной памяти компьютера 1) и визуальные, и графические образы привязываются в качестве постусловий к молингам и заносятся непосредственно соответственно в блок расчетных моделей 13 и блок визуальных и графических образов 14. Т.е. элинги представляют собой гибридные системы, где связаны часть, работающая на основе методов направления искусственный интеллект, и стандартные подсистемы на основе методов математического моделирования, подсистемы численных расчетных моделей при использовании визуальных и графических образов.Calculation models (programmed in a standard way or implemented using already developed substations located in the block of
Моделирование отдельных предложений молингами обеспечивает декларативное представление базы знаний.Modeling individual sentences with moldings provides a declarative representation of the knowledge base.
Уже отмечалось, - знания в исходных текстах повторяются. При вводе знаний в виде молинг в блок базы знаний 10 (фиг.4), делаются пометки (идентификаторы), из какого исходного текста ввод. Повторение знаний, имеющихся в базе знаний, повышает их достоверность (пометки дублированных знаний в виде набора идентификаторов сохраняются). А то, чего нет, - вводится и увеличивает объем базы знаний в блоке базы знаний 10. Т.е. каждая новая версия эллинги с дополнительно введенными текстами имеет монотонно возрастающую в объеме базу знаний.It has already been noted - knowledge in the source code is repeated. When entering knowledge in the form of a molding into the block of the knowledge base 10 (Fig. 4), notes (identifiers) are made from which source text the input is. Repetition of the knowledge available in the knowledge base increases their reliability (marks of duplicated knowledge in the form of a set of identifiers are saved). And what is not, is introduced and increases the volume of the knowledge base in the
Таким образом, база знаний элинги представляет собой «паутину» - все расширяющуюся и сгущающуюся в местах «горбов» знаний, где они или полностью оказываются дублированными, или все более уточняют эту фокусную область знаний конкретной предметной области, что и есть «эффект гребня»Thus, the Elingi knowledge base is a “web” - everything expanding and gathering in places of “humps” of knowledge, where they either completely turn out to be duplicated, or more and more refine this focal area of knowledge of a particular subject area, which is the “crest effect”
Одновременно такое построение базы знаний обеспечивает возможность вывода необходимого источника в виде, близком к исходному тексту, достаточно задать номер исходного текста из словаря введенных исходных текстов.At the same time, this construction of the knowledge base provides the ability to output the required source in a form close to the source text; it is enough to set the number of the source text from the dictionary of input sources.
Режим логического вывода 22 реализуется машиной логического вывода 9 и приведен на фиг.5.The
Машина логического вывода 9 выполняет две основные функции:
- просмотр терминов из рабочей памяти 31 машины логического вывода 9 и молинг из блока базы знаний 10 и добавление (при возможности) в рабочую память 31 новых терминов (для вывода);- viewing terms from the working memory 31 of the
- определение порядка просмотра и применения молинг. Этот механизм управляет процессом вывода, сохраняя для пользователя информацию о полученных заключениях в блоке рабочей части диалога 15.- determination of the order of viewing and application of molding. This mechanism controls the output process, saving for the user information about the findings in the block of the working part of the
Логический вывод основан на правиле - «если известно, что истинно утверждение А и истинно правило вида «ЕСЛИ А, ТО В», тогда утверждение В также истинно». Применительно к молингам, которые представимы короткой семантической сетью в виде связанного графа (где вершинами являются термины из блока БД словарей 12), оно имеет вид, - «если имеет место определенный уровень истинности утверждения (термина) А и существует цепь в молинге, связывающая А с утверждением (термином) В, то имеет место определенный уровень истинности (достоверности) утверждения (термина) В». Этот уровень достоверности определяется факторами уверенности (код 5) молинги.The logical conclusion is based on the rule - "if it is known that statement A is true and a rule of the form" IF A, THEN B "is true, then statement B is also true." With regard to moldings, which are represented by a short semantic network in the form of a connected graph (where the vertices are the terms from the block of the dictionary database 12), it has the form, “if there is a certain level of truth of the statement (term) A and there is a chain in the molding that connects A with the statement (term) B, then there is a certain level of truthfulness (reliability) of the statement (term) B ”. This level of confidence is determined by confidence factors (code 5) moldings.
Пример вывода показан на фиг.6, где пользователь 4 задал запрос - найти связь между двумя разными терминами - термин 1 и термин 9. Ищется на основе прямого вывода по указанному выше правилу с ограниченным перебором (количество промежуточных терминов не более шести). Результат вывода - последовательность молинг с порядковыми номерами (i), (i+k) (i+k+r) помещается блок рабочей части диалога 15.An example of the output is shown in Fig.6, where user 4 asked to find a connection between two different terms -
Машина логического вывода 9 (фиг.5) циклична. В одном цикле может сработать только одна молинга. Если несколько молинг успешно сопоставлены с терминами, то машина логического вывода 9 производит выбор по заданным критериям единственной молинги, которая срабатывает в данном цикле.Inference machine 9 (Fig. 5) is cyclic. In one cycle, only one molding can work. If several moldings are successfully mapped to terms, then
В режиме работы с диалогом 21, реализуемым блоком рабочей части диалога 15, всю необходимую информацию и результаты вывода в виде групп последовательностей ядер молинг выдают пользователю 4 через компьютер 1. Пользователю 4 поступают по группам все последовательности логического вывода ядер молинг с номерами (i), (i+k), (i+k+r) разной длины в порядке убывания фактора уверенности (код 5) при заданном запросе для вывода на основе термин 1 - термин 9 Пользователь 4, читая группы последовательность ядер молинг, а фактически группы последовательностей простых предложений, семантически связанных между собой, сам решает, удовлетворяет его этот результат - вновь синтезированный текст или нет. И может фиксировать необходимую ему группу (или группы) в блок сохраненной части диалога (вместе с терминами запроса) 16, вместе со всеми результатами постусловий при запуске расчетных моделей из блока расчетных моделей 13 или визуальных и графических образов из блока визуальных и графических образов 14. Если ответ его полностью не устраивает, пользователь 4 имеет возможность или снова повторить режим логического вывода 22 с новыми вариантами запроса или по какому-то ядру молинги запустить режим когезии 24 (локальной связанности текста) или когерентности (глобальной связанности текста, который реализуется как расширенный вариант режима когезии 24).In the mode of operation with the
Режим когезии 24 обеспечивает вывод в блок рабочей части диалога 15 из блока базы знаний 10 последовательностей ядер молинг, имеющих, как минимум, один идентификатор, соответствующий заданному пользователем, что соответствует выводу абзаца исходного текста (блоки 25 или 26, или 27). Запрос пользователя о выводе всего исходного текста, соответствующего интересующему его ядру молинги (простого предложения), равнозначен использованию эффекта когерентности исходного текста или режима вывода исходного текста 23. Объем может задаваться пользователем 4 - в объеме параграфа, в объеме главы, в объеме всего исходного текста.The
Режим вывода текстов 23 может задаваться пользователем 4 через блок распределения заданий 8. Последний активизирует блок рабочей части диалога 15 и по запросу пользователя 4 производится вывод из блока базы знаний 10 тех или иных исходных текстов в виде последовательности ядер молинг по подобранным идентификаторам. Все это передается в компьютер 1 для пользователя 4.The output mode of
Программная реализация режима вывода текстов 23 и режима когезии 24 в машине логического вывода 9 представлены на фиг.7. Это позволяет в любой момент пользователю 4 вывести любой текст (или его часть), вызвать выизуальные и графические образы, запустить через постусловия необходимые ему расчетные модели.Software implementation of the output mode of the
Иначе (обобщенно) в элинге создается специальная среда для ускоренного и эффективного нахождения рациональных решений. Она заключается в следующих этапах:Otherwise (generalized), a special environment is created in the Eling for the accelerated and efficient finding of rational solutions. It consists of the following steps:
1. Задание запроса пользователем 4 по интересующему его вопросу;1. Task request by user 4 on a question of interest to him;
2. Элинга быстро выдает пользователю 4 взаимосвязанный поток текста (блоками), который логический вывод может за заданный короткий промежуток времени обеспечить, причем упорядоченный по уровню достоверности выводов. При первом запросе - такой ответ системой называется «начальным», далее уточняемым и развиваемым;2. Elinga quickly gives the user 4 an interconnected stream of text (in blocks), which the logical conclusion can provide for a given short period of time, moreover, ordered by the level of reliability of the conclusions. At the first request - such a response by the system is called "initial", then specified and developed;
3. Пользователь анализирует получаемые результаты и, если необходимо, продолжает вывод (блоками) подготовленного результата, или уточняет интересующие его детали, или делает новый запрос, т.е. переходит к пункту 1;3. The user analyzes the results obtained and, if necessary, continues to output (in blocks) the prepared result, or clarifies the details of interest to him, or makes a new request, ie proceeds to step 1;
4. Когда пользователь 4 убеждается, что он получил от системы, то, что ему надо, или удовлетворительного ответа получить невозможно, он заканчивает поиск.4. When user 4 makes sure that he received from the system, what he needs or cannot receive a satisfactory answer, he finishes the search.
Здесь также, как и в ТРИЗ, и при «мозговом штурме», создаются условия для возникновения у пользователя 4 новых ассоциаций, которые ведут к ускоренному нахождению решений с высокой оригинальностью и эффективностью. Этот процесс соответствует изложенному у М.Желены процессу поиска решения на основе самовоспроизводства. В этом процессе все аспекты решения (критерии, альтернативы, представления и оценки) непрерывно исследуются и приспосабливаются в течение всего процесса. При этом возникает круговой и рекурсивный, но постепенно сужающийся поиск устойчивой конфигурации решения, начиная с «начального».Here, as well as in TRIZ, and during the “brainstorming”, the conditions are created for the user to have 4 new associations that lead to an accelerated finding of solutions with high originality and efficiency. This process corresponds to the process of finding a solution based on self-reproduction described by M. Jela. In this process, all aspects of the solution (criteria, alternatives, representations, and evaluations) are continuously explored and adapted throughout the process. In this case, a circular and recursive, but gradually narrowing, search for a stable solution configuration arises, starting with the “initial” one.
Применяемый в элинге подход назовем диалого-ассоциативным поиском. Каждый раз при подаче запроса сложно сказать, найдет ли пользователь необходимый ответ и каков он будет, но зато можно уверенно утверждать, что пользователь разберется в интересующем его вопросе намного лучше. И, одна из главных особенностей, - быстро, поскольку, не надо обращаться вначале - ни в другие книги, ни в другие библиотеки, ни к другим специалистам, ни в другие отделы, ни в другие организации (конечно при достаточной развитости базы знаний элинги).The approach used in the elling is called the dialogue-associative search. Each time you submit a request, it’s hard to say whether the user will find the necessary answer and what it will be, but you can confidently say that the user will understand the question he is interested in much better. And, one of the main features is quickly, because you don’t have to go first - to other books, or to other libraries, or to other specialists, or to other departments, or to other organizations (of course, with the knowledge base is well developed) .
Для снижения опасности копирования элинг и времени реакции на задаваемые вопросы (в процессе эксплуатации) используется специальное устройство считывания для запуска машиночитаемых носителей 5 с элингами и специальные методы защиты машиночитаемых носителей 5, - как механическим путем, программным, так и организационным.To reduce the risk of copying the eling and the reaction time to asked questions (during operation), a special reader is used to start machine-
А именно:Namely:
- с целью затруднения копирования, - машиночитаемый носитель 5 имеет механические изменения, препятствующие его считыванию на другого типа устройствах считывания, причем разъемы 3, 6 имеют размеры, отличные от стандартных;- for the purpose of making copying difficult, - machine-
- все содержимое блоков на машиночитаемом носителе 5 с каждой новой версией шифруется с использованием блоков шифратор/дешифратор 7, препятствуя считыванию элинг;- the entire contents of the blocks on a machine-
- набор молинг в блоке базы знаний 10 каждой новой версии имеет изменения, препятствующие работе со старой машиной логического вывода 9, в частности, изменяются разделители кодов молинг и их последовательность;- the molding set in the
- машина логического вывода 9 каждой новой версии имеет изменения, препятствующие работе с наборами молинг в старых базах знаний, в частности, изменены элементы работы с блоком базы знаний 10 в связи с новыми разделителями кодов молинг и их последовательностью.-
Ядро ПС, которое обеспечивает работу с элингой, считывается в оперативную память компьютера 1 с машиночитаемого носителя 5 и оно находится в самом начале в блоке распределения заданий 8 машиночитаемого носителя 5.The core of the PS, which provides work with the sling, is read into the random access memory of
Claims (8)
код 1; код 2; код 3; код 4; код 5; код 6,
где код 1 - множество идентификаторов простых предложений, указывающих все места исходных текстов, где они упоминаются, в том числе в семантически эквивалентном виде,
код 2 - условие применимости ядра молинги,
код 3 - ядро молинги, где помещается простое предложение, как правило, длиной 3-15 слова,
код 4 - последовательность номеров словарей, фиксирующих положение слов и элементов простых предложений в ядре молинги последовательностью терминов, отношений, качественных признаков, количественных признаков или лингвистических и логических связей,
код 5 - уровень достоверности молинг в виде факторов уверенности в пределах от -1 до +1,
код 6 - постусловия молинги, которые активизируются в случае, если ядро молинги реализовалось, в т.ч. и ничего не делать (если код 6 равен нулю), при этом постусловия молинги описывают действия и процедуры, которые необходимо выполнить, в их числе - переход к другой молинге, ввод в действие расчетных моделей введенных в блок расчетных моделей или актуализация визуальных или графических образов из блока или графических образов, затем посредством блока ввода знаний молинги из моделей текстов вводятся в блок базы знаний в виде объединенной базы знаний посредством наложения моделей знаний - молинг, при этом расчетные модели в виде программ заносятся в блок расчетных моделей, визуальные и графические образы в блок визуальных и графических образов, словари терминов, отношений, качественных признаков, количественных признаков или лингвистических и логических связей и номеров исходных текстов в блок баз данных словарей, причем сами молинги, словари, расчетные модели, визуальные и графические образы вводятся в режиме ввода знаний, задаваемых через блок распределения заданий, экспертом-редактором через компьютер, устройство считывания элинги, разъемы, шифратор/дешифратор, блок распределения заданий, блок ввода знаний и соответственно в блок базы знаний, блок базы данных словарей, блок расчетных моделей и блок визуальных и графических образов.2. The system according to claim 1, characterized in that the source text is divided by an expert editor, as a rule, into simple sentences of 3-15 words long, computational models and visual and graphic images are highlighted, and simple sentences are converted into knowledge models - moldings in text models which have the structure:
code 1; code 2; code 3; code 4; code 5; code 6,
where code 1 is the set of identifiers of simple sentences indicating all the places of the source texts where they are mentioned, including in semantically equivalent form,
code 2 - condition for the applicability of the core moldings,
code 3 - core moldings, where a simple sentence is placed, usually 3-15 words long,
code 4 - a sequence of dictionary numbers fixing the position of words and elements of simple sentences in the core moldings by a sequence of terms, relationships, qualitative features, quantitative features or linguistic and logical connections,
code 5 - confidence level molding in the form of confidence factors ranging from -1 to +1,
code 6 - postconditioning moldings that are activated in the event that the core moldings are implemented, incl. and do nothing (if code 6 is equal to zero), while the postconditions moldings describe the actions and procedures that need to be performed, including moving to another molding, commissioning the calculation models introduced into the block of calculation models, or updating visual or graphic images from a block or graphic images, then, through the knowledge input block, moldings from text models are entered into the knowledge base block in the form of a unified knowledge base by means of superimposing knowledge models - molding, while calculation models in the form of programs are started fit into the block of computational models, visual and graphic images into a block of visual and graphical images, dictionaries of terms, relationships, qualitative attributes, quantitative attributes or linguistic and logical connections and numbers of source texts into a block of dictionaries databases, with the moldings themselves, dictionaries, computational models , visual and graphic images are entered in the input mode of knowledge set through the task distribution unit, by an expert editor through a computer, an eling reader, connectors, an encryptor / decoder, a rac assignment of tasks, a unit for entering knowledge and, accordingly, in a block of a knowledge base, a block of a database of dictionaries, a block of calculation models, and a block of visual and graphic images.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2010125501/08A RU2440610C1 (en) | 2010-06-21 | 2010-06-21 | System for working with intelligent electronic book - eib |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2010125501/08A RU2440610C1 (en) | 2010-06-21 | 2010-06-21 | System for working with intelligent electronic book - eib |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2440610C1 true RU2440610C1 (en) | 2012-01-20 |
Family
ID=45785780
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2010125501/08A RU2440610C1 (en) | 2010-06-21 | 2010-06-21 | System for working with intelligent electronic book - eib |
Country Status (1)
Country | Link |
---|---|
RU (1) | RU2440610C1 (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2564641C1 (en) * | 2014-05-27 | 2015-10-10 | Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Кубанский государственный технический университет" (ФГБОУ ВПО "КубГТУ") | Intelligent information selection system "optimel" |
RU2649772C2 (en) * | 2012-07-02 | 2018-04-04 | Самсунг Электроникс Ко., Лтд. | Apparatus and method for controlling e-book in terminal |
RU2684497C1 (en) * | 2017-10-04 | 2019-04-09 | Плеадес Паблишинг, Лтд. | Method of creating single electronic textbooks distribution system |
RU2684496C2 (en) * | 2017-07-05 | 2019-04-09 | Плеадес Паблишинг, Лтд. | Unified electronic textbooks distribution system |
RU2692427C1 (en) * | 2017-05-01 | 2019-06-24 | Тойота Дзидося Кабусики Кайся | Interest determination system, interest determination method and data medium |
-
2010
- 2010-06-21 RU RU2010125501/08A patent/RU2440610C1/en not_active IP Right Cessation
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2649772C2 (en) * | 2012-07-02 | 2018-04-04 | Самсунг Электроникс Ко., Лтд. | Apparatus and method for controlling e-book in terminal |
RU2564641C1 (en) * | 2014-05-27 | 2015-10-10 | Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Кубанский государственный технический университет" (ФГБОУ ВПО "КубГТУ") | Intelligent information selection system "optimel" |
RU2692427C1 (en) * | 2017-05-01 | 2019-06-24 | Тойота Дзидося Кабусики Кайся | Interest determination system, interest determination method and data medium |
RU2684496C2 (en) * | 2017-07-05 | 2019-04-09 | Плеадес Паблишинг, Лтд. | Unified electronic textbooks distribution system |
RU2684497C1 (en) * | 2017-10-04 | 2019-04-09 | Плеадес Паблишинг, Лтд. | Method of creating single electronic textbooks distribution system |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11250842B2 (en) | Multi-dimensional parsing method and system for natural language processing | |
Christiansen et al. | Toward a connectionist model of recursion in human linguistic performance | |
Becchetti et al. | Speech recognition: Theory and C++ implementation (with CD) | |
US20050005266A1 (en) | Method of and apparatus for realizing synthetic knowledge processes in devices for useful applications | |
JP2012520527A (en) | Question answering system and method based on semantic labeling of user questions and text documents | |
CN109635197B (en) | Searching method, searching device, electronic equipment and storage medium | |
RU2440610C1 (en) | System for working with intelligent electronic book - eib | |
Xu et al. | Schema2qa: High-quality and low-cost q&a agents for the structured web | |
Vander Linden | Speaking of Actions: Choosing Rhetorical Status and Grammatical Form in Instructional Text Generation | |
Antony et al. | A survey of advanced methods for efficient text summarization | |
Galanis et al. | Machine learning meets natural language processing-the story so far | |
McShane et al. | Treating unexpected input in incremental semantic analysis | |
Lee | Natural Language Processing: A Textbook with Python Implementation | |
Potter | A survey of knowledge acquisition from natural language | |
Minker | Information storage and retrieval: a survey and functional description | |
RU2564641C1 (en) | Intelligent information selection system "optimel" | |
Fox et al. | Maximal Consistent Interpretations of Errorful Data in Hierarchically Modeled Domains. | |
RU104348U1 (en) | SYSTEM FOR WORK WITH INTELLECTUAL ELECTRONIC BOOK - ELINGA - KNOWLEDGE CARRIER | |
Slator | Lexical semantics and preference semantics analysis | |
Schwarcz | Towards a computational formalization of natural language semantics | |
Smith | Natural language generation in the LOLITA system an engineering approach | |
Erman | Overview of the hearsay speech understanding research | |
Devillers et al. | The PEACE SLDS understanding evaluation paradigm of the French MEDIA campaign | |
Nijholt | Linguistic engineering: a survey | |
Murzin et al. | Development and Analysis of Technologies of Searching Information Relevant to the Search Query Using Linguistic Support |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | The patent is invalid due to non-payment of fees |
Effective date: 20140622 |