RU117657U1 - THE DEVICE FOR CLASSIFICATION OF INTERNET RESOURCES BASED ON THE RESULTS OF AUTOMATIC TEXT PROCESSING AND A WELL-EXPRESSED OPINION OF EXPERTS - Google Patents

THE DEVICE FOR CLASSIFICATION OF INTERNET RESOURCES BASED ON THE RESULTS OF AUTOMATIC TEXT PROCESSING AND A WELL-EXPRESSED OPINION OF EXPERTS Download PDF

Info

Publication number
RU117657U1
RU117657U1 RU2012100711/08U RU2012100711U RU117657U1 RU 117657 U1 RU117657 U1 RU 117657U1 RU 2012100711/08 U RU2012100711/08 U RU 2012100711/08U RU 2012100711 U RU2012100711 U RU 2012100711U RU 117657 U1 RU117657 U1 RU 117657U1
Authority
RU
Russia
Prior art keywords
module
internet resources
expert
experts
resource
Prior art date
Application number
RU2012100711/08U
Other languages
Russian (ru)
Inventor
Александр Владимирович Супруненко
Original Assignee
Александр Владимирович Супруненко
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Александр Владимирович Супруненко filed Critical Александр Владимирович Супруненко
Priority to RU2012100711/08U priority Critical patent/RU117657U1/en
Application granted granted Critical
Publication of RU117657U1 publication Critical patent/RU117657U1/en

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Устройство классификации Интернет-ресурсов на основе результатов автоматической обработки текста и взвешенного мнения экспертов, включающее модуль регистрации рекомендаций, реализующий следующие функции: прием рекомендованной оценки интернет-ресурса на первый вход устройства, передача полученных данных для дальнейшей обработки модулю классификации интернет-ресурсов; модуль расчета экспертного мнения, обладающий следующим функционалом: прием мнения экспертов на второй вход устройства, передача полученных данных для расчета оценки модулю классификации Интернет-ресурсов; модуль классификации интернет-ресурсов, осуществляющий функцию определения принадлежности ресурса к определенной категории на основании взвешенной экспертной оценки; модуль хранения информации об интернет-ресурсах, реализующий следующие функции: сохранение данных об оцененных интернет-ресурсах, предоставление доступа к данным о классифицированных интернет-ресурсах на выход устройства; модуль расчета и хранения репутаций экспертов, обеспечивающий функцию коррекции значений репутации экспертов для повышения качества оценки интернет-ресурсов на основании опыта участия экспертов в процессе классификации. A device for classifying Internet resources based on the results of automatic text processing and a balanced opinion of experts, including a recommendation registration module that implements the following functions: receiving a recommended estimate of an Internet resource at the first input of the device, transferring the received data for further processing to the module for classifying Internet resources; a module for calculating an expert opinion, which has the following functionality: receiving an expert opinion at the second input of the device, transmitting the received data to calculate an assessment to the module for classifying Internet resources; a module for classifying Internet resources, which performs the function of determining the belonging of a resource to a certain category based on a weighted expert assessment; a module for storing information about Internet resources, which implements the following functions: storing data on the estimated Internet resources, providing access to data on classified Internet resources at the device output; a module for calculating and storing experts 'reputations, which provides a function for correcting the values of experts' reputation to improve the quality of assessing Internet resources based on the experience of experts participating in the classification process.

Description

Полезная модель относится к области вычислительной техники, в частности, к процессу классификации и категоризации Интернет-ресурсов с возможностью получения результирующей оценки ресурса, накопления и распространения информации о ресурсах в открытом формате.The utility model relates to the field of computer technology, in particular, to the process of classification and categorization of Internet resources with the possibility of obtaining the resulting resource assessment, accumulation and dissemination of information about resources in an open format.

Устройство предназначено для создания базы данных Интернет-ресурсов, структурированных по категориям на основе принятого решения о принадлежности ресурса с использованием результатов автоматической обработки текста отдельно взятой страницы и взвешенного мнения экспертов, основанного на их репутации, с возможностью накопления, изменения и открытого распространения информации о ресурсах. Таким образом, устройство обладает следующими свойствами:The device is designed to create a database of Internet resources, structured into categories on the basis of a decision on the ownership of the resource using the results of automatic processing of the text of a single page and the weighted opinion of experts based on their reputation, with the possibility of accumulation, modification and open dissemination of information about resources . Thus, the device has the following properties:

- оценка и классификация Интернет-ресурсов на основе автоматически определенной принадлежности ресурса к той или иной категории и взвешенного мнения экспертов, улучшающего показатели классификации;- Evaluation and classification of Internet resources based on automatically determined membership of a resource in a particular category and a balanced opinion of experts that improves classification indicators;

- возможность оценки как ресурса в целом, так и отдельных страниц;- the ability to evaluate both the resource as a whole and individual pages;

- накопление структурированной информации об оценках и принадлежности ресурсов к категориям с возможностью ее распространения средствами стандартных технологий (RDF, Resource Description Framework);- the accumulation of structured information about assessments and the belonging of resources to categories with the possibility of its dissemination by means of standard technologies (RDF, Resource Description Framework);

- непрерывное улучшение показателей классификации за счет изменения показателей репутации экспертов, участвующих в формировании общего мнения.- continuous improvement of classification indicators due to changes in the reputation indicators of experts involved in the formation of a common opinion.

Известны устройства, осуществляющие анализ и классификацию Интернет-ресурсов.Known devices that analyze and classify Internet resources.

Модель (Патент на полезную модель №77465 М. кл. G06F 12/00, 15/00, 2008) включает в себя модули селекции опорных адресов сайтов в базе данных сервера, идентификации адресов электронных документов в списке доступа, идентификации временных циклов выборки адресов из списка доступа, формирования сигналов управления выборкой записей базы данных сервера и модуль селекции доступа к электронным документам.The model (Utility Model Patent No. 77465 M. class. G06F 12/00, 15/00, 2008) includes modules for selecting the reference addresses of sites in the server database, identifying addresses of electronic documents in the access list, identifying time cycles for selecting addresses from access list, generating control signals for fetching database records of the server and a selection module for access to electronic documents.

Существенным недостатком рассмотренной модели является полностью автоматическая (фиксированная) классификация электронных документов (Интернет-ресурсов) с возможностью классификации всего ресурса по процентному содержанию в нем документов определенной категории. Такой подход значительно ухудшает качество фильтрации ресурсов, содержащих документы различных категорий. Также, политика доступа к ресурсам (список доступа) является частью системы, что может негативно повлиять на масштабируемость (расширяемость) всего решения в целом.A significant drawback of the considered model is the fully automatic (fixed) classification of electronic documents (Internet resources) with the ability to classify the entire resource by the percentage of documents in a certain category. This approach significantly affects the quality of filtering resources containing documents of various categories. Also, the resource access policy (access list) is part of the system, which can negatively affect the scalability (extensibility) of the entire solution.

Модель (Патент на полезную модель №105758 М. кл. G06F 17/00, H04N 21/454, 2010) состоит из модулей кэш-прокси-сервера, ядра, модулей принятия решений, классификации многотемных документов и модуля «робот» и позволяет классифицировать гипертекстовые вебстраницы с учетом содержащейся в них ссылочной информации на основе машинного обучения с дообучением.The model (Utility Model Patent No. 105758 M. cl. G06F 17/00, H04N 21/454, 2010) consists of cache proxy modules, a kernel, decision modules, classification of multi-dark documents and a robot module and allows you to classify Hypertext web pages, taking into account the contained information on the basis of machine learning with retraining.

Основным недостатком данной модели является способ принятия решения о принадлежности ресурса к определенной категории на основе решения дообучаемого классификатора, определяющего меру сходства документа с обучающим набором, а также с использованием ссылочной информации, содержащейся в документе, что может негативно сказаться на качестве классификации ресурсов, состоящих из документов различных категорий.The main disadvantage of this model is the method of deciding whether a resource belongs to a certain category based on the decision of a retraining classifier that determines the similarity of a document with a training set, as well as using the reference information contained in the document, which can adversely affect the quality of classification of resources consisting of documents of various categories.

Наиболее близким аналогом является подсистема репутации (Патент США №0254499 М кл. G06F 15/18, 2009), состоящая из модуля управления репутациями и модуля ввода/вывода репутаций, реализующая механизм фильтрации контента на основе репутации ресурса.The closest analogue is the reputation subsystem (US Patent No. 0254499 M cl. G06F 15/18, 2009), which consists of a reputation management module and a reputation input / output module that implements a content filtering mechanism based on a resource’s reputation.

Основным недостатком данного аналога является формирование оценки ресурса на основе полученных через модуль ввода/вывода недифференцированных значений без учета репутации источников, предоставляющих данные значения.The main disadvantage of this analogue is the formation of a resource estimate based on undifferentiated values received through the input / output module without taking into account the reputation of the sources providing these values.

Задача моделирования - классификация Интернет-ресурсов на основе результатов автоматической обработки текста и взвешенного мнения экспертов, основанного на их репутации.The task of modeling is the classification of Internet resources based on the results of automatic text processing and the weighted opinion of experts based on their reputation.

Поставленная цель достигается путем создания устройства классификации Интернет-ресурсов, содержащего следующие модули:This goal is achieved by creating a device for classifying Internet resources, containing the following modules:

- Модуль регистрации рекомендаций - осуществляет прием результатов автоматического определения принадлежности ресурса к той или иной категории и передачу этой оценки модулю классификации Интернет-ресурсов.- Recommendation registration module - receives the results of automatic determination of a resource’s belonging to a particular category and transfers this assessment to the classification module of Internet resources.

- Модуль расчета экспертного мнения - принимает множество мнений экспертов, каждому мнению ставит в соответствие репутацию эксперта, полученную от модуля расчета и хранения репутаций экспертов и передает полученные значения модулю классификации интернет-ресурсов.- The module for calculating expert opinions - accepts a lot of expert opinions, associates with each opinion the expert reputation obtained from the module for calculating and storing expert reputations and transfers the obtained values to the Internet resource classification module.

- Модуль классификации интернет-ресурсов - принимает на вход результат автоматической оценки интернет-ресурса от модуля регистрации рекомендаций и значения оценок и репутаций экспертов от модуля расчета экспертного мнения, осуществляет классификацию и расчет итоговой оценки интернет-ресурса, и передает полученные значения в модуль хранения информации об интернет-ресурсах и в модуль расчета и хранения репутаций экспертов для коррекции значения репутации экспертов, принявших участие в оценке данного интернет-ресурса.- Classification module of Internet resources - receives the input of the result of the automatic assessment of the Internet resource from the module for registering recommendations and the values of ratings and reputation of experts from the module for calculating expert opinions, classifies and calculates the final rating of the Internet resource, and transfers the obtained values to the information storage module about Internet resources and into the module for calculating and storing expert reputations to correct the value of the reputation of experts who took part in the assessment of this Internet resource.

- Модуль хранения информации об интернет-ресурсах - принимает и сохраняет полученные от модуля классификации Интернет-ресурсов оценки и обеспечивает возможность передачи этой информации за пределы системы.- Module for storing information about Internet resources - receives and saves estimates received from the classification module for Internet resources and provides the ability to transfer this information outside the system.

- Модуль расчета и хранения репутаций экспертов - передает значения репутаций экспертов модулю расчета экспертного мнения и получает результаты классификации и оценки интернет-ресурса от модуля классификации интернет-ресурсов для корректировки значений репутаций экспертов.- Module for calculating and storing expert reputations - transfers the values of expert reputations to the module for calculating expert opinions and receives the results of the classification and evaluation of the Internet resource from the module for classifying Internet resources to adjust the values of expert reputations.

Работа устройства проиллюстрирована на следующих изображениях:The operation of the device is illustrated in the following images:

1. Фиг.1. Архитектура системы классификации интернет-ресурсов1. Figure 1. Internet Resource Classification System Architecture

2. Фиг.2. Структура RDF-описания интернет-ресурсов2. Figure 2. The structure of the RDF description of Internet resources

3. Фиг.3. Структура объекта, содержащего информацию об интернет-ресурсе3. Figure 3. The structure of the object containing information about the Internet resource

4. Фиг.4. Структура объекта, содержащего информацию об эксперте4. Figure 4. The structure of the object containing information about the expert

5. Фиг.5. Структура объекта, содержащего информацию об оценке интернет-ресурса5. Figure 5. The structure of the object containing information on the assessment of the Internet resource

Модуль 1 регистрации рекомендаций выполнен в виде вычислительного блока, реализующего прием и сохранение автоматически определенной принадлежности ресурса к определенной категории (рекомендации) для последующего уточнения этого значения с использованием взвешенных мнений экспертов. Прием значений осуществляется по протоколу HTTP(S) (Hypertext Transfer Protocol (Secure)) в виде RDF-описания ресурса (фиг.1, вход 1). Для описания ресурсов используется простой набор атрибутов стандарта Дублинское ядро (Dublin Core, ГОСТ Р 7.0.10-2010) и XML-нотация (extensible Markup Language) RDF (RDF/XML). При этом ключевая, с точки зрения системы, информация передается в узлах Identifier, Type и Subject (фиг.2). Узел Identifier содержит URL 3 (Uniform Resource Locator) ресурса. Узел Type определяет природу или жанр описываемого ресурса и содержит в данном случае характеристику Е3 (aims) текстовой части Интернет-ресурса по классификации Синклера-Шарова, описывающую влияние текста на аудиторию (значения данного элемента не входят во множество значений, описанных в словаре значений атрибута Type, и имеют дополнительный смысл). Узел Subject определяет тему содержимого ресурса при помощи характеристики I1 (topic) по классификации Синклера-Шарова, позволяющей определить принадлежность текста к какой-либо предметной области. Узел Creator в данном случае содержит идентификатор источника рекомендации. Значения узлов Creator, Identifier, Type и Subject в виде идентифицированного соответствующими значениями свойств объекта (фиг.3) передаются в модуль 3 классификации Интернет-ресурсов.The module 1 for registering recommendations is made in the form of a computing unit that implements the reception and saving of automatically determined resource belonging to a certain category (recommendation) for the subsequent refinement of this value using weighted expert opinions. The reception of values is carried out using the HTTP (S) protocol (Hypertext Transfer Protocol (Secure)) in the form of an RDF description of the resource (Fig. 1, input 1). To describe the resources, a simple set of attributes of the Dublin Core standard (Dublin Core, GOST R 7.0.10-2010) and XML notation (extensible Markup Language) RDF (RDF / XML) are used. In this case, the key, from the point of view of the system, information is transmitted in the nodes Identifier, Type and Subject (figure 2). The Identifier node contains the URL 3 (Uniform Resource Locator) of the resource. The Type node determines the nature or genre of the described resource and contains in this case the E3 characteristic of the text part of the Internet resource according to the Sinclair-Sharov classification, which describes the effect of the text on the audience (the values of this element are not included in the set of values described in the dictionary of values of the Type attribute , and have an additional meaning). The Subject node determines the topic of the content of the resource using the I1 (topic) characteristic according to the Sinclair-Sharov classification, which allows determining the text belongs to any subject area. The Creator node in this case contains the identifier of the recommendation source. The values of the nodes Creator, Identifier, Type and Subject in the form identified by the corresponding values of the properties of the object (Fig.3) are transferred to the module 3 classification of Internet resources.

Модуль 2 расчета экспертного мнения выполнен в виде вычислительного блока, реализующего прием мнений экспертов, обращение к модулю 5 расчета и хранения репутаций экспертов для получения соответствующего значения репутации и передачу полученных значений модулю 3 классификации Интернет-ресурсов. Прием мнений экспертов осуществляется по протоколу HTTP(S) в формате RDF/XML (фиг.1, вход 2), аналогичном формату, принимаемому модулем 1 регистрации рекомендаций. Каждое сообщение содержит идентификатор эксперта в поле Creator, URL ресурса в поле Identifier, факторы Е3 (aims) и II (topic) классификации Синклера-Шарова в полях Type и Subject соответственно (фиг.2). Используя полученное значение идентификатора эксперта, модуль обращается с запросом значения репутации соответствующего эксперта к модулю 5 расчета и хранения репутаций экспертов. Из полученных значений формируется объект, свойства которого содержат значения идентификатора и репутации эксперта (в виде объекта, фиг.4), URL ресурса, факторы Е3 (aims) и II (topic) классификации Синклера-Шарова (фиг.3). Сформированный объект передается модулю 3 классификации Интернет-ресурсов.Module 2 calculating expert opinions is made in the form of a computing unit that implements the reception of expert opinions, accessing module 5 for calculating and storing expert reputations to obtain the corresponding reputation value and transmitting the obtained values to module 3 for classifying Internet resources. The expert opinions are received via the HTTP (S) protocol in RDF / XML format (Fig. 1, input 2), similar to the format accepted by module 1 for registering recommendations. Each message contains the identifier of the expert in the Creator field, the URL of the resource in the Identifier field, the E3 (aims) and II (topic) factors of the Sinclair-Sharov classification in the Type and Subject fields, respectively (Fig. 2). Using the obtained value of the identifier of the expert, the module requests the value of the reputation of the corresponding expert to module 5 for calculating and storing the reputations of experts. From the obtained values, an object is formed whose properties contain the values of the identifier and reputation of the expert (in the form of an object, Fig. 4), resource URL, factors E3 (aims) and II (topic) of the Sinclair-Sharov classification (Fig. 3). The generated object is transmitted to the module 3 classification of Internet resources.

Модуль 3 классификации интернет-ресурсов - центральный модуль системы - выполнен в виде вычислительного блока, реализующего совместный прием полученных от модулей 1 регистрации рекомендаций и 2 расчета экспертного мнения объектов, содержащих оценки определенного интернет-ресурса (по совпадающему значению URL), классификацию интернет-ресурса на основе полученных значений, передачу информации о классифицированном ресурсе модулю 4 хранения информации об интернет-ресурсах и информации о результате классификации модулю 5 расчета и хранения репутаций экспертов для коррекции значений репутации экспертов, принявших участие в оценке ресурса. Типичный сценарий работы модуля следующий. Полученные от модулей 1 регистрации рекомендаций и 2 расчета экспертного мнения значения факторов Е3 (aims) и I1 (topic) классификации Синклера-Шарова для каждого эксперта и для полученной рекомендации преобразуются в набор двоичных столбцов bE3 и bI1, в которых значение фактора, присвоенного определенным экспертом, равно 1, а остальные строки в столбце равны 0. Из множества репутаций экспертов ri, участвующих в оценке ресурса (участвуют m экспертов), рассчитывается суммарная репутация , где последняя единица является, по сути, репутацией рекомендации, полученной от модуля 1 регистрации рекомендаций. Итоговое мнение по каждому из факторов Е3 и I1 также представляет собой пару столбцов bE3 и bI1 и рассчитывается для каждого из значений по формуле , где R- суммарная репутация, bi- соответствующее значение из столбцов bI1 и bE3, определяющее значения факторов Е3 и I1, присвоенных ресурсу i-ым экспертом, и ri - репутация i-го эксперта. Процесс определения общего мнения считается завершенным, если в каждом из столбцов из пары bE3 и bI1 найдутся максимальные значения, большие либо равные величине сходимости мнения c0(0<c0≤1). Найденные значения заменяются единицами, все остальные значения - нулями. Из полученных столбцов bI1 и bE3 извлекаются значения характеристик Е3 и I1, на основе которых создается объект, аналогичный получаемому от модуля 1 регистрации рекомендаций, содержащий URL ресурса в поле Identifier, рассчитанные факторы Е3 и I1 в полях Type и Subject соответственно (фиг.3). Сформированный объект передается в модуль 4 хранения информации о веб-ресурсах. На основе рассчитанных значений Е3 и I1 строится объект, содержащий значения Е3 и I1, указанные для данного ресурса всеми экспертами, принимавшими участие в оценке, и рассчитанные итоговые значения (фиг.5). Полученный объект передается модулю 5 расчета и хранения репутаций экспертов для корректировки значения репутаций экспертов, принявших участие в оценке данного Интернет-ресурса.Module 3 for classifying Internet resources — the central module of the system — is designed as a computing unit that implements the joint reception of recommendations from modules 1 for registering recommendations and 2 calculating expert opinions of objects containing assessments of a specific Internet resource (based on the matching URL value), and classifying the Internet resource based on the obtained values, the transfer of information about the classified resource to the module 4 for storing information about Internet resources and information about the classification result to the module 5 for calculating and storing p expert reputations to correct the values of the reputation of experts who participated in the assessment of the resource. A typical module operation scenario is as follows. The values of Sinclair-Sharov factors E3 (aims) and I1 (topic) of the Sinclair-Sharov classification received from modules 1 for registering recommendations and 2 for calculating expert opinion are converted to a set of binary columns b E3 and b I1 for which the value of the factor assigned by a certain expert, it is 1, and the remaining rows in the column are 0. From the set of reputations of experts r i participating in the resource assessment (m experts participate), the total reputation is calculated , where the last unit is, in fact, the reputation of the recommendation received from module 1 of the registration of recommendations. The final opinion for each of the factors E3 and I1 also represents a pair of columns b E3 and b I1 and is calculated for each of the values by the formula , where R is the total reputation, b i is the corresponding value from columns b I1 and b E3 , which determines the values of factors E3 and I1 assigned to the resource by the i-th expert, and r i is the reputation of the i-th expert. The process of determining the general opinion is considered complete if in each of the columns from the pair b E3 and b I1 there are maximum values greater than or equal to the value of the convergence of the opinion c 0 (0 <c 0 ≤1). The values found are replaced by ones, all other values are replaced by zeros. From the obtained columns b I1 and b E3 , the values of the characteristics E3 and I1 are extracted, based on which an object similar to that obtained from the module 1 for registering recommendations is created, containing the resource URL in the Identifier field, calculated factors E3 and I1 in the Type and Subject fields, respectively (Fig. 3). The generated object is transmitted to the module 4 for storing information about web resources. Based on the calculated values of E3 and I1, an object is constructed containing the values of E3 and I1 indicated for this resource by all experts who participated in the assessment and the calculated total values (Fig. 5). The resulting object is transmitted to module 5 for calculating and storing expert reputations to adjust the value of the reputations of experts who participated in the assessment of this Internet resource.

Модуль 4 хранения информации об Интернет-ресурсах выполнен в виде вычислительного блока, принимающего от модуля 3 классификации Интернет-ресурсов результаты оценки определенного Интернет-ресурса в виде объекта, аналогичного объекту, передаваемому модулем 1 регистрации рекомендаций модулю 3 классификации Интернет-ресурсов (фиг.3). Модуль обеспечивает сохранение принятого объекта в базе данных с обеспечением возможности доступа к информации по значению URL. Модуль также может осуществлять передачу сохраненной информации об Интернет-ресурсах по внешнему НТТР(S)-запросу (фиг.1, выход 3) в виде RDF/XML описания Интернет-ресурса (фиг.2).Module 4 for storing information about Internet resources is made in the form of a computing unit receiving, from the module 3 for classifying Internet resources, the evaluation results of a specific Internet resource in the form of an object similar to the object transmitted by module 1 for registering recommendations to module 3 for classifying Internet resources (Fig. 3 ) The module provides storage of the received object in the database with the possibility of access to information by URL value. The module can also transmit stored information about Internet resources via an external HTTP (S) request (Fig. 1, output 3) in the form of an RDF / XML description of the Internet resource (Fig. 2).

Модуль 5 расчета и хранения репутаций экспертов выполнен в виде вычислительного блока, предоставляющего модулю 2 расчета экспертного мнения значения репутаций экспертов и получающего от модуля 3 классификации Интернет-ресурсов объект, содержащий значения Е3 и I1 для каждого эксперта, принявшего участие в оценке Интернет-ресурса, для коррекции значений репутации экспертов. Для предоставления значений репутаций экспертов модулю 2 расчета экспертного мнения используется объект, передаваемый в модуль 5, в котором в соответствие идентификатору эксперта ставится значение его репутации, после чего объект возвращается модулю 2 (фиг.4). Для коррекции значений репутаций экспертов, после завершения процесса классификации Интернет-ресурса в модуле 3, модулю 5 передается объект, содержащий для каждого эксперта, участвовавшего в оценке ресурса, значения факторов Е3 и I1, определенные данным экспертом, а также рассчитанные модулем 3 в процессе классификации значения данных факторов (фиг.5). На основании полученных данных, модуль осуществляет перерасчет репутаций экспертов, участвовавших в оценке Интернет-ресурса следующим образом: для экспертов, чье мнение совпало с результирующим, новая репутация r определяется как , где r0 - текущее значение репутации эксперта, Rc - суммарная репутация экспертов, чье мнение совпало с результирующим, и R - суммарная репутация экспертов, принимавших участие в оценке ресурса; для экспертов, чье мнение не совпало с результирующим, новая репутация r определяется как . При этом репутация рекомендации, полученной от модуля 1 регистрации рекомендаций, учитывается при перерасчетах, но остается неизменной (равной 1). Обновленные значения репутаций экспертов сохраняются в базе данных.Module 5 for calculating and storing expert reputations is made in the form of a computational unit that provides module 2 for calculating expert opinions with the values of expert reputations and receives an object from module 3 for classifying Internet resources containing E3 and I1 values for each expert who participated in the assessment of the Internet resource, to correct the values of the reputation of experts. To provide expert reputation values to expert opinion calculation module 2, an object is used that is transferred to module 5, in which the expert’s reputation is assigned to the expert’s identifier, after which the object is returned to module 2 (Fig. 4). To correct the values of the reputation of experts, after the classification process of the Internet resource in module 3 is completed, module 5 receives an object containing, for each expert involved in the resource assessment, the values of factors E3 and I1 determined by this expert, as well as calculated by module 3 in the classification process the values of these factors (figure 5). Based on the data obtained, the module recalculates the reputations of experts who participated in the assessment of the Internet resource as follows: for experts whose opinion coincides with the resulting one, the new reputation r is defined as , where r 0 is the current value of the expert’s reputation, R c is the total reputation of experts whose opinion coincided with the resultant, and R is the total reputation of experts who participated in the assessment of the resource; for experts whose opinion did not coincide with the resultant, the new reputation r is defined as . At the same time, the reputation of the recommendation received from module 1 of the registration of recommendations is taken into account when recalculating, but remains unchanged (equal to 1). Updated expert reputation values are stored in the database.

Claims (1)

Устройство классификации Интернет-ресурсов на основе результатов автоматической обработки текста и взвешенного мнения экспертов, включающее модуль регистрации рекомендаций, реализующий следующие функции: прием рекомендованной оценки интернет-ресурса на первый вход устройства, передача полученных данных для дальнейшей обработки модулю классификации интернет-ресурсов; модуль расчета экспертного мнения, обладающий следующим функционалом: прием мнения экспертов на второй вход устройства, передача полученных данных для расчета оценки модулю классификации Интернет-ресурсов; модуль классификации интернет-ресурсов, осуществляющий функцию определения принадлежности ресурса к определенной категории на основании взвешенной экспертной оценки; модуль хранения информации об интернет-ресурсах, реализующий следующие функции: сохранение данных об оцененных интернет-ресурсах, предоставление доступа к данным о классифицированных интернет-ресурсах на выход устройства; модуль расчета и хранения репутаций экспертов, обеспечивающий функцию коррекции значений репутации экспертов для повышения качества оценки интернет-ресурсов на основании опыта участия экспертов в процессе классификации.
Figure 00000001
A device for classifying Internet resources based on the results of automatic text processing and a balanced opinion of experts, including a module for registering recommendations that implements the following functions: receiving the recommended rating of an Internet resource to the first input of the device, transmitting the data for further processing to the classification module for Internet resources; an expert opinion calculation module with the following functionality: receiving expert opinion to the second input of the device, transmitting the received data for calculating the assessment to the Internet resource classification module; a module for classifying Internet resources that performs the function of determining whether a resource belongs to a specific category based on a weighted expert assessment; a module for storing information about Internet resources that implements the following functions: storing data on estimated Internet resources, providing access to data on classified Internet resources to the device output; a module for calculating and storing expert reputations, providing a function for correcting the values of expert reputations to improve the quality of the assessment of Internet resources based on the experience of experts in the classification process.
Figure 00000001
RU2012100711/08U 2012-01-11 2012-01-11 THE DEVICE FOR CLASSIFICATION OF INTERNET RESOURCES BASED ON THE RESULTS OF AUTOMATIC TEXT PROCESSING AND A WELL-EXPRESSED OPINION OF EXPERTS RU117657U1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2012100711/08U RU117657U1 (en) 2012-01-11 2012-01-11 THE DEVICE FOR CLASSIFICATION OF INTERNET RESOURCES BASED ON THE RESULTS OF AUTOMATIC TEXT PROCESSING AND A WELL-EXPRESSED OPINION OF EXPERTS

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2012100711/08U RU117657U1 (en) 2012-01-11 2012-01-11 THE DEVICE FOR CLASSIFICATION OF INTERNET RESOURCES BASED ON THE RESULTS OF AUTOMATIC TEXT PROCESSING AND A WELL-EXPRESSED OPINION OF EXPERTS

Publications (1)

Publication Number Publication Date
RU117657U1 true RU117657U1 (en) 2012-06-27

Family

ID=46682454

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2012100711/08U RU117657U1 (en) 2012-01-11 2012-01-11 THE DEVICE FOR CLASSIFICATION OF INTERNET RESOURCES BASED ON THE RESULTS OF AUTOMATIC TEXT PROCESSING AND A WELL-EXPRESSED OPINION OF EXPERTS

Country Status (1)

Country Link
RU (1) RU117657U1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2658878C1 (en) * 2017-04-04 2018-06-25 Общество С Ограниченной Ответственностью "Яндекс" Method and server for web-resource classification

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2658878C1 (en) * 2017-04-04 2018-06-25 Общество С Ограниченной Ответственностью "Яндекс" Method and server for web-resource classification
US10423690B2 (en) 2017-04-04 2019-09-24 Yandex Europe Ag Method of and server for classifying a web resource

Similar Documents

Publication Publication Date Title
Price et al. Computational support for academic peer review: A perspective from artificial intelligence
CN107958317B (en) Method and device for selecting crowdsourcing participants in crowdsourcing project
Yang et al. Friend or frenemy? Predicting signed ties in social networks
US10360482B1 (en) Crowd-sourced artificial intelligence image processing services
CN109919316A (en) The method, apparatus and equipment and storage medium of acquisition network representation study vector
US20160071015A1 (en) Information processing apparatus, information processing method, and program
US10535041B2 (en) System and method of predicting community member responsiveness
CN112119388A (en) Training image embedding model and text embedding model
US8977617B1 (en) Computing social influence scores for users
Xue et al. Generative adversarial learning for optimizing ontology alignment
CN112074828A (en) Training image embedding model and text embedding model
US20200394448A1 (en) Methods for more effectively moderating one or more images and devices thereof
Tang et al. Keyword clustering for user interest profiling refinement within paper recommender systems
US20210073235A1 (en) Incremental data retrieval based on structural metadata
CN113656686A (en) Task report generation method based on birth teaching fusion and service system
Veeramachaneni et al. A maximum margin matrix factorization based transfer learning approach for cross-domain recommendation
CN114428910A (en) Resource recommendation method and device, electronic equipment, product and medium
RU117657U1 (en) THE DEVICE FOR CLASSIFICATION OF INTERNET RESOURCES BASED ON THE RESULTS OF AUTOMATIC TEXT PROCESSING AND A WELL-EXPRESSED OPINION OF EXPERTS
CN117174232A (en) Electronic medical record generation method and device, electronic equipment and storage medium
WO2023087933A1 (en) Content recommendation method and apparatus, device, storage medium, and program product
Guo et al. PicPick: a generic data selection framework for mobile crowd photography
US20240005170A1 (en) Recommendation method, apparatus, electronic device, and storage medium
Hu et al. SHEDR: an end-to-end deep neural event detection and recommendation framework for hyperlocal news using social media
WO2021134944A1 (en) Mobile news client-based evaluation method and system therefor
Singh et al. Self-Attention Mechanism Based Federated Learning Model for Cross Context Recommendation System

Legal Events

Date Code Title Description
PC11 Official registration of the transfer of exclusive right

Effective date: 20140926

MM9K Utility model has become invalid (non-payment of fees)

Effective date: 20210112