RU2505858C2 - Способ оценки возраста пользователя по данным большого объема и соответствующая система - Google Patents

Способ оценки возраста пользователя по данным большого объема и соответствующая система Download PDF

Info

Publication number
RU2505858C2
RU2505858C2 RU2012101503/08A RU2012101503A RU2505858C2 RU 2505858 C2 RU2505858 C2 RU 2505858C2 RU 2012101503/08 A RU2012101503/08 A RU 2012101503/08A RU 2012101503 A RU2012101503 A RU 2012101503A RU 2505858 C2 RU2505858 C2 RU 2505858C2
Authority
RU
Russia
Prior art keywords
age
data
weight
basic
user
Prior art date
Application number
RU2012101503/08A
Other languages
English (en)
Other versions
RU2012101503A (ru
Inventor
Лэбинь ЛИНЬ
Чуань ЧЭНЬ
Гохой ЛИН
Али СУНЬ
Original Assignee
Тенсент Текнолоджи (Шэньчжэнь) Компани Лимитед
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Тенсент Текнолоджи (Шэньчжэнь) Компани Лимитед filed Critical Тенсент Текнолоджи (Шэньчжэнь) Компани Лимитед
Publication of RU2012101503A publication Critical patent/RU2012101503A/ru
Application granted granted Critical
Publication of RU2505858C2 publication Critical patent/RU2505858C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/20ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/52User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications
    • H04L65/403Arrangements for multi-party communication, e.g. for conferences

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Business, Economics & Management (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

Изобретение относится к способу и системе, обеспечивающим определение возраста пользователя в сети по данным большого объема. Техническим результатом является обеспечение возможности точной фильтрации пользователей сети по возрасту. Предложенный способ содержит следующие этапы: получение базовых данных о возрасте пользователя и задание начального веса для каждого типа этих данных; получение веса возраста пользователя в каждом типе базовых данных о возрасте в соответствии с начальным весом и степенью схожести возраста пользователя в разных типах этих данных; поиск в базовых данных о возрасте возраста с наибольшим весом и оценка возраста пользователя по возрасту с наибольшим весом. Предложенные способ и система позволяют увеличить точность определения возраста пользователя. 2 н. и 12 з. п. ф-лы. 6 ил, 1 табл.

Description

Область техники
[0001] Настоящее изобретение относится к методам обработки данных большого объема, в частности к способу и системе, обеспечивающим определение возраста пользователя по данным большого объема.
Уровень техники
[0002] С ростом популярности Интернета сеть стала одной из важных областей повседневной жизни людей. Интернет может предоставлять пользователям различные услуги, например электронные покупки, запрос информации, развлечения. Возраст - основной атрибут пользователя сети. Пользователям разных возрастов могут предоставляться разные настраиваемые интернет-услуги. Однако пользователи обычно не указывают в Интернете свой фактический возраст. Поэтому встал вопрос, как точно определить фактический возраст пользователя?
[0003] Согласно существующему в настоящее время способу, возраст пользователя оценивается по полученным от него данным с применением простой фильтрации по граничному значению. В частности, возрастной диапазон пользователей оценивают по накопленным данным, и значения за пределами этого диапазона фильтруют. В результате определяется возраст пользователей. Однако этот способ во многом полагается на данные о возрасте, предоставляемые самими пользователями, и поэтому является неточным.
Сущность изобретения
[0004] В настоящем изобретении предложен способ оценки возраста пользователя по данным большого объема для повышения точности результата.
[0005] В настоящем изобретении предложена также система оценки возраста пользователя по данным большого объема для повышения точности результата.
[0006] Согласно настоящему изобретению, предложенный способ оценки возраста пользователя, содержит следующие этапы:
получение базовых данных о возрасте пользователя и задание начального веса для каждого типа этих данных;
получение веса возраста пользователя в каждом типе базовых данных о возрасте в соответствии с начальным весом и степенью схожести возраста пользователя в разных типах этих данных;
поиск в разных типах базовых данных о возрасте возраста с наибольшим весом и оценка возраста пользователя по возрасту с наибольшим весом.
[0007] Согласно другому аспекту изобретения, предложена система оценки возраста пользователя. Эта система содержит:
блок задания веса, выполненный с возможностью получения базовых данных о возрасте пользователя, а также с возможностью задания начального веса для каждого типа этих данных;
блок обработки веса, соединенный с блоком задания веса и выполненный с возможностью получения веса возраста пользователя в каждом типе базовых данных о возрасте в соответствии с начальным весом и степенью схожести возраста пользователя в разных типах этих данных;
блок оценки возраста, соединенный с блоком обработки веса и выполненный с возможностью поиска в разных типах базовых данных о возрасте возраста с наибольшим весом, а также с возможностью оценки возраста пользователя по возрасту с наибольшим весом.
[0008] Согласно предложенным в настоящем изобретении способу и системе, обеспечивающим определение возраста пользователя, для базовых данных о возрасте задается начальный вес, вес возраста пользователя в разных базовых данных о возрасте определяется в соответствии с начальным весом и степенью схожести возраста пользователя в разных типах этих данных, и в качестве возраста пользователя определяется возраст с наибольшим весом. Поскольку несколько типов предоставляемых пользователем базовых данных о возрасте оцениваются вместе, возраст с наибольшим весом точнее соответствует фактическому возрасту пользователя. Следовательно, точность определения возраста пользователя увеличивается.
Краткое описание чертежей
[0009] На фиг.1 показана блок-схема предложенного способа определения возраста пользователя по данным большого объема.
[0010] На фиг.2 приведена блок-схема предложенного способа задания начального веса для базовых данных о возрасте.
[0011] На фиг.3 представлена блок-схема предложенного способа получения весовых коэффициентов возраста пользователя в разных типах базовых данных о возрасте.
[0012] На фиг.4 показана блок-схема предложенного способа определения
возраста пользователя по данным среды одноклассников.
[0013] На фиг.5 представлена структурная схема предложенной системы
определения возраста пользователя по данным большого объема.
[0014] На фиг.6 приведена структурная схема системы определения возраста пользователя по данным большого объема, соответствующей другому варианту изобретения.
Подробное описание изобретения
[0015] На фиг.1 показана блок-схема предложенного способа определения возраста пользователя по данным большого объема. В этом способе предусмотрено выполнение следующих этапов.
[0016] На этапе S10 принимают базовые данные о возрасте пользователя и задают начальный вес для каждого типа этих данных, причем базовые данные о возрасте предоставляются пользователем при вводе информации посредством различных сетевых продуктов, например службы обмена мгновенными сообщениями, социальной сети и т.д.
[0017] Как видно из фиг.2, предложенный способ задания начального веса для базовых данных о возрасте предусматривает выполнение следующих этапов.
[0018] На этапе S100 принимают опорные данные о возрасте пользователя.
[0019] Эти опорные данные могут быть получены с помощью сетевой анкеты. Поскольку вопросы, сформулированные в такой анкете, достаточно конкретны, возраст, полученный с ее помощью, более точен, чем непосредственно введенный пользователем.
[0020] На этапе S102 базовые данные о возрасте сравнивают с опорными данными о возрасте и определяют коэффициент точности базовых данных.
[0021] Во всех типах базовых данных о возрасте выполняют поиск пользователей, возраст которых соответствует возрасту в опорных данных о возрасте, и количество найденных пользователей делят на общее число пользователей в группе пользователей, получая в результате коэффициент точности базовых данных о возрасте.
[0022] В частности, для каждого типа базовых данных о возрасте выполняют поиск в соответствующей им группе пользователей, получая тем самым число пользователей, возраст которых по базовым данным соответствует их возрасту по опорным данным. Затем определяют отношение между этим числом и общим числом пользователей в группе пользователей, соответствующей базовым данным о возрасте. Это отношение представляет коэффициент точности типа базовых данных пользователей. Термин "соответствовать" означает, что возраст по базовым данным совпадает с возрастом по опорным данным или различие между этими значениями возраста находится в определенных пределах, например в пределах трех лет.
[0023] Базовые данные о возрасте, полученные разными способами, рассматривают как принадлежащие к разным типам данных о возрасте. Например, базовые данные о возрасте, полученные посредством службы обмена мгновенными сообщениями, относят к одному типу данных, а базовые данные о возрасте, полученные через социальную сеть, - к другому типу данных.
[0024] На этапе S104 задают начальный вес для базовых данных о возрасте согласно указанному коэффициенту точности.
[0025] В соответствии с одним из вариантов изобретения коэффициент точности базовых данных о возрасте имеет три уровня: низкий, средний и высокий. Согласно коэффициенту точности на этих трех уровнях для базовых данных о возрасте задают начальные весовые коэффициенты P1, P2 и P3, соответственно. Например, P1=1, P2=5 и Р3=9. Предположим, что базовые данные о возрасте IM1, IM2,…, IMn n пользователей принимают через службу обмена мгновенными сообщениями, базовые данные о возрасте SNS1, SNS2, …, SNSn n пользователей принимают через социальную сеть, а опорные данные о возрасте R1, R2, …, Rn n пользователей собирают посредством анкетирования. Сравнив данные IM1, IM2, …, IMn с данными R1, R2, …, Rn, можно определить коэффициент точности базовых данных о возрасте, полученных с помощью службы обмена мгновенными сообщениями. Предположим, что этот коэффициент точности низкий. Тогда в качестве начального веса базовых данных о возрасте, полученных с помощью службы обмена мгновенными сообщениями, задают значение P1. Аналогичным образом можно определить коэффициент точности базовых данных о возрасте, полученных через социальную сеть. Предположим, что этот коэффициент точности средний. Тогда в качестве начального веса базовых данных о возрасте, полученных через социальную сеть, задают значение P2.
[0026] В соответствии с другим вариантом изобретения можно также задать начальные весовые коэффициенты для разных типов базовых данных о возрасте в зависимости от их источников. Например, данные о возрасте, полученные из регистрационной информации сетевой службы, такой как запись выпускника, являются более точными. Следовательно, начальный вес, заданный для этого типа базовых данных о возрасте, может быть относительно высоким по сравнению с весом других данных.
[0027] На этапе S12 определяют вес возраста пользователя в каждом типе базовых данных о возрасте в соответствии с их начальным весом и степенью схожести возраста пользователя в разных типах этих данных.
[0028] Как видно из фиг.3, предложенный способ получения весовых коэффициентов возраста пользователя в разных типах базовых данных о возрасте предусматривает выполнение следующих этапов.
[0029] На этапе S120 сравнивают разные типы базовых данных о возрасте. В частности, сравнивают значения возраста пользователя в разных типах базовых данных о возрасте, полученных разными способами.
[0030] На этапе S122 задают показатель веса возраста пользователя в соответствии с начальными весовыми коэффициентами разных типов базовых данных о возрасте и степенью схожести возраста пользователя в разных типах этих данных. В соответствии с одним из вариантов изобретения степень схожести возраста пользователя в разных типах базовых данных о возрасте является следующей: одинаковый возраст, схожий возраст и разный возраст, причем возраст считается схожим, если он различается не более чем на три года, и разным, если разница в возрасте составляет более трех лет. Затем сравнивают начальные весовые коэффициенты разных типов базовых данных о возрасте для получения отношения веса этих данных. Отношение веса может быть следующим: одинаковый вес, схожий вес и разный вес, причем вес считают одинаковым, если в двух типах базовых данных о возрасте уровень веса один и тот же (высокий, средний или низкий), схожим, если в двух типах базовых данных о возрасте он различается на один уровень (высокий и средний или средний и низкий), и разным, если в двух типах базовых данных о возрасте он различается на два уровня (высокий и низкий). В соответствии с одним из вариантов изобретения показатели веса возраста пользователя задают, как показано в таблице.
Степень схожести возраста
Отношение веса
Одинаковый возраст Схожий возраст Разный возраст
Одинаковый вес +А1 +А4 0
Схожий вес +А2 +А5 0
Разный вес +А3 +А6 0
[0031] Например, А1=1, А2=2, А3=3, А4=4, А5=5 и А6=6.
[0032] На этапе S124 определяют вес возраста пользователя согласно сумме начального веса и показателя веса возраста. В приведенном выше варианте изобретения сравнивают разные типы базовых данных о возрасте. Для каждого типа базовых данных о возрасте определяют отношение веса между данным типом и всеми другими типами базовых данных о возрасте, а также степень схожести возраста пользователя при данном отношении веса. Показатель веса возраста пользователя в базовых данных о возрасте равен сумме всех показателей веса возраста, полученных путем сравнения этих базовых данных о возрасте с другими базовыми данными о возрасте.
[0033] Согласно одному из вариантов изобретения, используют три типа базовых данных о возрасте пользователя - М, N и О. Предположим, что в этом варианте начальные весовые коэффициенты этих трех типов базовых данных - P1, P2 и P3, соответственно. Предположим также, что возраст трех пользователей a, b и с в базовых данных о возрасте М - Ma, Mb и Мс, соответственно, возраст этих пользователей в базовых данных о возрасте N - Na, Nb и Nc, соответственно, и их возраст в базовых данных о возрасте О - Оа, Ob и Ос, соответственно. Сравним базовые данные о возрасте М, N и О. Предположим, что весовые коэффициенты базовых данных М и базовых данных N схожи, весовые коэффициенты базовых данных М и базовых данных О различны, и весовые коэффициенты базовых данных N и базовых данных О схожи. Для пользователя а предположим, что Ма=25, Na=25 и Оа=23, т.е. возраст Ма и Na одинаков, возраст Ма и Оа схож, и возраст Na и Оа тоже схож. С учетом показателей веса возраста, указанных в таблице 1, получается, что вес возраста Ма - P1+А2+А6, вес возраста Na - P2+А2+А5, и вес возраста Оа - P3+А6+А5. Аналогичным способом можно получить весовые коэффициенты возраста пользователей b и с.
[0034] На этапе S14 в базовых данных разных типов возраста ищут возраст с наибольшим весом и возраст с наибольшим весом определяют как оценочный возраст пользователя. Для приведенного выше примера возраст с наибольшим весом среди значений Ма, Na и Оа определяют как оценочный возраст пользователя а. Поскольку возраст с наибольшим весом лучше соответствует фактическому возрасту пользователя, его определяют как более точный.
[0035] В одном из вариантов изобретения после получения оценочного возраста пользователя вес этого возраста сравнивают с начальным весом и классифицируют как вес одного из трех уровней - высокий, средний или низкий. Для примера предположим, что начальные весовые коэффициенты трех типов базовых данных о возрасте - P1, P2 и P3. Если вес оценочного возраста меньше или равен P2, вес возраста низкий. Если вес оценочного возраста больше, чем P2, но меньше или равен P3, вес возраста средний. Если вес оценочного возраста больше, чем P3, вес возраста высокий.
[0036] На фиг.4 показана блок-схема предложенного способа определения возраста пользователя по данным среды одноклассников. В этом способе предусмотрено выполнение следующих этапов.
[0037] На этапе S20 в данных среды одноклассников выясняют число пользователей с высокими весовыми коэффициентами оценочного возраста, которым соответствует одинаковый оценочный возраст. Данные среды одноклассников - это набор данных пользователей, связанных отношением одноклассников. Пользователи с отношениями одноклассников обычно имеют одинаковый или схожий возраст. Данные среды одноклассников могут быть получены от членов группы одноклассников и группы друзей пользователя.
[0038] На этапе S22 определяют, удовлетворяет ли число пользователей заранее заданному условию. Если число пользователей удовлетворяет заранее заданному условию, выполняют этап S24; в противном случае процедура завершается. В одном из примеров заранее заданное условие следующее: m>3 и m/n>=1/4, где m - число пользователей с высокими весовыми коэффициентами оценочного возраста, которым соответствует одинаковый оценочный возраст, а n - общее число пользователей в среде одноклассников.
[0039] На этапе S24 оценочный возраст пользователей со средними и низкими весовыми коэффициентами оценочного возраста в среде одноклассников корректируют до оценочного возраста пользователей с высокими весовыми коэффициентами оценочного возраста, которым соответствует одинаковый оценочный возраст. Если в одном из примеров число пользователей с высокими весовыми коэффициентами оценочного возраста, которым соответствует одинаковый оценочный возраст, удовлетворяет указанному выше заранее заданному условию, то, поскольку оценочный возраст этих пользователей более точен и возраст пользователей в среде одноклассников обычно одинаков или схож, возраст пользователей с низкими и средними весовыми коэффициентами возраста корректируют согласно оценочному возрасту пользователей с высокими весовыми коэффициентами возраста. В результате значения оценочного возраста становятся более точными.
[0040] На фиг.5 представлена структурная схема предложенной системы определения возраста пользователя по данным большого объема. Как видно из фиг.5, система содержит блок 10 задания веса, блок 20 обработки веса и блок 30 оценки возраста.
[0041] Блок 10 задания веса служит для получения базовых данных о возрасте пользователя и задания начального веса для каждого типа этих данных.
[0042] Блок 20 обработки веса соединен с блоком 10 задания веса и служит для получения веса возраста пользователя в каждом типе базовых данных о возрасте в соответствии с начальным весом и степенью схожести возраста пользователя в разных типах этих данных.
[0043] Блок 30 оценки возраста соединен с блоком 20 обработки веса и служит для поиска в базовых данных о возрасте возраста с наибольшим весом и определения возраста с наибольшим весом в качестве оценочного возраста пользователя.
[0044] На фиг.6 представлена структурная схема предложенной системы оценки возраста пользователя по данным большого объема, соответствующей другому варианту настоящего изобретения. Как видно из фиг.6, помимо блока 10 задания веса, блока 20 обработки веса и блока 30 оценки возраста, система содержит также блок 40 хранения данных о возрасте и блок 50 хранения данных среды одноклассников.
[0045] Блок 40 хранения данных о возрасте соединен с блоком 10 задания веса, блоком 20 обработки веса и блоком 30 оценки возраста и служит для хранения базовых и опорных данных о возрасте. Базовые данные о возрасте предоставляются пользователем посредством различных сетевых продуктов, а опорные данные о возрасте собираются с помощью сетевой анкеты. Поскольку вопросы, сформулированные в такой анкете, достаточно конкретны, опорные данные о возрасте точнее базовых данных.
[0046] Блок 50 хранения данных среды одноклассников соединен с блоком 30 оценки возраста и предназначен для хранения данных среды одноклассников. Пользователи с отношениями одноклассников обычно имеют одинаковый или схожий возраст. Данные среды одноклассников можно получить от членов группы одноклассников или группы друзей пользователя.
[0047] В одном из примеров блок 10 задания веса должен также получать опорные данные о возрасте пользователя, сравнивать базовые данные о возрасте с опорными данными о возрасте, определять коэффициент точности базовых данных о возрасте и задавать начальный вес базовых данных о возрасте в соответствии с коэффициентом точности. Возможно выполнение поиска во всех типах базовых данных о возрасте, чтобы найти пользователей, возраст по базовым данным которых соответствует возрасту по опорным данным. Коэффициент точности определяют путем деления числа пользователей, возраст по базовым данным которых соответствует возрасту по опорным данным, на общее число пользователей. Блок 10 задания веса должен также относить коэффициент точности к одному из трех уровней (высокий, средний и низкий) и устанавливать начальный вес базовых данных о возрасте в соответствии с этими уровнями.
[0048] В одном из примеров блок 20 обработки веса должен также сравнивать базовые данные о возрасте и задавать показатель веса возраста пользователя в соответствии с начальным весом и степенью схожести возраста пользователя в разных типах базовых данных о возрасте. Вес возраста пользователя равен сумме начального веса и показателя веса возраста. Блок 20 обработки веса сравнивает разные типы базовых данных о возрасте и для каждого их типа определяет отношение веса между данным типом и другими типами базовых данных о возрасте, а также степень схожести возраста пользователя при данном отношении веса. Показатель веса возраста пользователя в базовых данных о возрасте равен сумме всех показателей веса возраста, полученных путем сравнения этих и других базовых данных о возрасте. После расчета веса возраста блоком 20 обработки веса блок 30 оценки возраста выполняет поиск возраста с наибольшим весом и определяет этот возраст в качестве оценочного возраста пользователя.
[0049] В одном из примеров после того как блок 30 оценки возраста определяет оценочный возраст пользователя, блок 20 обработки веса сравнивает вес оценочного возраста с начальным весом и в зависимости от полученного результата классифицирует вес оценочного возраста как высокий, средний или низкий (возможно также использование большего количества уровней веса).
[0050] В одном из примеров блок 30 оценки возраста должен также выполнять поиск в данных среды одноклассников пользователей с высокими весовыми коэффициентами оценочного возраста, которым соответствует одинаковый возраст, определять, удовлетворяет ли число найденных пользователей заранее заданному условию, и, если да, изменять возраст пользователей в среде одноклассников со средними и низкими весовыми коэффициентами возраста на оценочный возраст пользователей с высокими весовыми коэффициентами оценочного возраста, которым соответствует одинаковый возраст. В одном из примеров заранее заданное условие следующее: m>3 и m/n>=1/4, где m - число пользователей с высокими весовыми коэффициентами оценочного возраста, которым соответствует одинаковый возраст в данных среды одноклассников, а n - общее число пользователей в среде одноклассников. Поскольку возраст пользователей в среде одноклассников обычно одинаков или схож, возраст пользователей с низкими и средними весовыми коэффициентами возраста корректируется в соответствии с оценочным возрастом пользователей с высокими весовыми коэффициентами. В результате значения оценочного возраста становятся более точными.
[0051] Выше были представлены предпочтительный пример изобретения и некоторые из его вариантов. Использованные в заявке термины, характеристики и рисунки предназначены только для пояснения изобретения и не должны рассматриваться как ограничение патентных притязаний. Объем патентной охраны данного изобретения допускает его различные модификации, не выходящие за рамки сущности настоящего изобретения, и определяется представленными ниже пунктами формулы (и их эквивалентами), все признаки которых следует трактовать в самом широком смысле, если не указано обратное.

Claims (14)

1. Способ оценки возраста пользователя, содержащий следующие этапы: получение разных типов базовых данных о возрасте пользователя, причем разные типы базовых данных о возрасте предоставляются пользователем при вводе информации посредством различных сетевых продуктов,
задание начального веса для каждого типа базовых данных о возрасте в соответствии с коэффициентом точности базовых данных о возрасте;
получение веса возраста пользователя в каждом типе базовых данных о возрасте в соответствии с суммой начального веса и показателя веса возраста конкретного типа базовых данных о возрасте;
причем показатель веса возраста конкретного типа базовых данных о возрасте задают в соответствии с начальным весом конкретного типа базовых данных о возрасте и степенью схожести возраста пользователя в разных типах базовых данных о возрасте; и.
поиск в разных типах базовых данных о возрасте таких базовых данных о возрасте, которые имеют наибольший вес, и оценка возраста пользователя по базовым данным о возрасте с наибольшим весом.
2. Способ по п.1, в котором этап задания начального веса для каждого типа базовых данных о возрасте включает в себя следующие этапы:
получение опорных данных о возрасте пользователя;
сравнение базовых данных о возрасте с опорными данными о возрасте с получением коэффициента точности базовых данных о возрасте;
задание начального веса базовых данных о возрасте в соответствии с указанным коэффициентом точности.
3. Способ по п.2, в котором этап получения коэффициента точности базовых данных о возрасте включает в себя следующие этапы:
поиск в базовых данных о возрасте пользователей, возраст которых соответствует опорным данным о возрасте, деление числа найденных пользователей на общее число пользователей в базовых данных о возрасте и определение полученного результата в качестве коэффициента точности базовых данных о возрасте.
4. Способ по п.1, в котором этап задания начального веса для каждого типа базовых данных о возрасте включает в себя следующий этап:
задание начального веса для каждого типа базовых данных о возрасте согласно источнику базовых данных о возрасте.
5. Способ по п.1, в котором этап получения веса возраста пользователя в каждом типе базовых данных включает в себя следующие этапы:
сравнение разных типов базовых данных о возрасте;
задание показателя веса возраста пользователя в соответствии с начальным весом и степенью схожести возраста пользователя в разных типах базовых данных о возрасте;
определение веса возраста пользователя в соответствии с начальным весом и показателем веса возраста.
6. Способ по п.1, дополнительно включающий в себя следующие этапы:
определение оценочного возраста пользователя в данных среды одноклассников и корректировка оценочного возраста других пользователей в данных среды одноклассников в соответствии с оценочным возрастом этого пользователя и весом его возраста.
7. Способ по п.1 или п.6, дополнительно включающий в себя следующие этапы: сравнение веса оценочного возраста пользователя с начальным весом и классификация веса оценочного возраста, в соответствии с результатом сравнения, как высокого, среднего или низкого.
8. Способ по п.7, дополнительно включающий в себя следующие этапы: поиск в данных среды одноклассников пользователей с высокими весовыми коэффициентами оценочного возраста, которым соответствует одинаковый возраст; определение, удовлетворяет ли число найденных пользователей заранее заданному условию; если это число удовлетворяет заранее заданному условию, то корректировка возраста пользователей в данных среды одноклассников со средними и низкими весовыми коэффициентами оценочного возраста до оценочного возраста пользователей с высокими весовыми коэффициентами оценочного возраста, которым соответствует одинаковый возраст.
9. Система оценки возраста пользователя, содержащая:
блок задания веса, выполненный с возможностью получения разных типов базовых данных о возрасте пользователя, а также с возможностью задания начального веса для каждого типа этих данных в соответствии со степенью схожести указанных базовых данных о возрасте; причем разные типы базовых данных о возрасте предоставляются пользователем при вводе информации посредством различных сетевых продуктов,
блок обработки веса, соединенный с блоком задания веса и выполненный с возможностью сравнения различных типов базовых данных о возрасте пользователя, задания, для каждого типа базовых данных о возрасте, суммы начального веса и показателя веса возраста в качестве веса возраста пользователя в конкретном типе базовых данных о возрасте;
причем показатель веса возраста конкретного типа базовых данных о возрасте задают в соответствии с начальным весом конкретного типа базовых данных о возрасте и степенью схожести возраста пользователя в разных типах базовых данных о возрасте; и
блок оценки возраста, соединенный с блоком обработки веса и выполненный с возможностью поиска в разных типах базовых данных о возрасте таких базовых данных о возрасте, которые имеют наибольший вес, а также с возможностью оценки возраста пользователя по базовым данным о возрасте с наибольшим весом.
10. Система по п.9, в которой блок задания веса выполнен также с возможностью получения опорных данных о возрасте пользователя, сравнения каждого типа базовых данных о возрасте с опорными данными о возрасте с определением коэффициента точности типа базовых данных о возрасте и с возможностью задания начального веса базовых данных о возрасте в соответствии с указанным коэффициентом точности.
11. Система по п.9, в которой блок обработки веса выполнен также с возможностью сравнивания разных типов базовых данных о возрасте пользователя, задания показателя веса возраста пользователя в соответствии с начальным весом и степенью схожести возраста в разных типах базовых данных о возрасте, а также с возможностью использования суммы начального веса и показателя веса возраста в качестве веса возраста пользователя.
12. Система по п.9, в которой блок обработки веса выполнен также с возможностью сравнивания оценочного возраста пользователя с начальным весом и классифицирования, по результату указанного сравнения, веса оценочного возраста как высокого, среднего или высокого.
13. Система по п.12, в которой блок оценки возраста выполнен также с возможностью проведения поиска в данных среды одноклассников пользователей с высокими весовыми коэффициентами оценочного возраста, которым соответствует одинаковый возраст, определения, удовлетворяет ли число найденных пользователей заранее заданному условию, и, если это число удовлетворяет заранее заданному условию, корректировки возраста пользователей в данных среды одноклассников со средними. и низкими весовыми коэффициентами оценочного возраста до оценочного возраста пользователей с высокими весовыми коэффициентами оценочного возраста, которым соответствует одинаковый возраст.
14. Система по п.9, содержащая также:
блок хранения данных о возрасте, соединенный с блоком задания веса, блоком обработки веса и блоком оценки возраста и выполненный с возможностью хранения базовых и опорных данных о возрасте;
блок хранения данных среды одноклассников, соединенный с блоком оценки возраста и выполненный с возможностью хранения данных среды одноклассников.
RU2012101503/08A 2009-08-21 2010-06-23 Способ оценки возраста пользователя по данным большого объема и соответствующая система RU2505858C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN200910042053.9A CN101635009B (zh) 2009-08-21 2009-08-21 基于海量数据的用户年龄估算方法及***
CN200910042053.9 2009-08-21
PCT/CN2010/074318 WO2011020371A1 (zh) 2009-08-21 2010-06-23 基于海量数据的用户年龄估算方法及***

Publications (2)

Publication Number Publication Date
RU2012101503A RU2012101503A (ru) 2013-09-27
RU2505858C2 true RU2505858C2 (ru) 2014-01-27

Family

ID=41594195

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2012101503/08A RU2505858C2 (ru) 2009-08-21 2010-06-23 Способ оценки возраста пользователя по данным большого объема и соответствующая система

Country Status (8)

Country Link
US (2) US8909638B2 (ru)
CN (1) CN101635009B (ru)
BR (1) BR112012001650B1 (ru)
CA (1) CA2765111C (ru)
MX (1) MX2012000896A (ru)
RU (1) RU2505858C2 (ru)
SG (1) SG176809A1 (ru)
WO (1) WO2011020371A1 (ru)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101635009B (zh) * 2009-08-21 2015-06-17 腾讯科技(深圳)有限公司 基于海量数据的用户年龄估算方法及***
CN102708497B (zh) * 2012-01-13 2015-08-05 合一网络技术(北京)有限公司 一种基于VideoBag特征的精准广告投放***及方法
GB2539588A (en) 2014-03-13 2016-12-21 Nielsen Co Us Llc Methods and apparatus to compensate impression data for misattribution and/or non-coverage by a database proprietor
US9489592B2 (en) 2014-12-05 2016-11-08 Xerox Corporation User characteristic prediction using images posted in online social networks
CN104410710B (zh) * 2014-12-15 2018-04-03 北京国双科技有限公司 数据推送方法和装置
US20160189182A1 (en) 2014-12-31 2016-06-30 The Nielsen Company (Us), Llc Methods and apparatus to correct age misattribution in media impressions
CN104992060A (zh) * 2015-06-25 2015-10-21 腾讯科技(深圳)有限公司 用户年龄估计方法及装置
US10045082B2 (en) 2015-07-02 2018-08-07 The Nielsen Company (Us), Llc Methods and apparatus to correct errors in audience measurements for media accessed using over-the-top devices
US10380633B2 (en) 2015-07-02 2019-08-13 The Nielsen Company (Us), Llc Methods and apparatus to generate corrected online audience measurement data
CN106447375A (zh) * 2015-08-12 2017-02-22 深圳市腾讯计算机***有限公司 一种年龄信息估计方法及装置
CN106447374A (zh) * 2015-08-12 2017-02-22 深圳市腾讯计算机***有限公司 一种用户性别估算方法和***
CN106713104B (zh) * 2015-08-12 2021-06-18 深圳市腾讯计算机***有限公司 多媒体信息的推送方法和装置
US20170127133A1 (en) * 2015-10-30 2017-05-04 The Nielsen Company (Us), Llc Methods and apparatus to categorize media impressions by age
CN107103366B (zh) * 2017-04-24 2020-06-30 北京京东尚科信息技术有限公司 用于生成用户的年龄信息的方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2202280C1 (ru) * 2001-08-07 2003-04-20 Российский центр судебно-медицинской экспертизы МЗ РФ Способ определения возраста человека по морфометрическим параметрам гистологических препаратов костной ткани
JP2004318632A (ja) * 2003-04-18 2004-11-11 Yokogawa Electric Corp 年齢推定装置
US20080025573A1 (en) * 2006-07-28 2008-01-31 Noriyuki Nishi Photographic image processing apparatus
US20080140640A1 (en) * 2003-01-14 2008-06-12 Infederation Ltd. Communications System and Method

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5763837A (en) * 1994-10-11 1998-06-09 Davignon; Andre Automatic biometric data system
US7912246B1 (en) * 2002-10-28 2011-03-22 Videomining Corporation Method and system for determining the age category of people based on facial images
JP4384895B2 (ja) * 2003-11-14 2009-12-16 フィールファイン株式会社 年齢アセスメント装置及び年齢アセスメント方法
JP2006119920A (ja) * 2004-10-21 2006-05-11 Matsushita Electric Ind Co Ltd 情報端末装置
CN101061713A (zh) * 2004-11-18 2007-10-24 皇家飞利浦电子股份有限公司 一种更新用户档案的方法和装置
JP2007164439A (ja) * 2005-12-13 2007-06-28 Matsushita Electric Ind Co Ltd 情報提示装置及び情報提示方法
US8160993B2 (en) * 2007-05-22 2012-04-17 The Regents Of The University Of California System and methods for evaluating inferences of unknown attributes in a social network
CN101251853A (zh) * 2008-02-20 2008-08-27 魔极科技(北京)有限公司 基于用户交互记录来挖掘用户属性的方法及***
CN101360098B (zh) * 2008-08-29 2012-02-15 腾讯科技(北京)有限公司 用户行为属性确定方法、装置、***及广告投放方法与***
US9996844B2 (en) * 2008-09-30 2018-06-12 Excalibur Ip, Llc Age-targeted online marketing using inferred age range information
WO2010088262A2 (en) * 2009-01-27 2010-08-05 University Of Washington Prosthetic limb monitoring system
JP4742193B2 (ja) * 2009-04-28 2011-08-10 Necソフト株式会社 年齢推定装置、年齢推定方法及びプログラム
CN101635009B (zh) * 2009-08-21 2015-06-17 腾讯科技(深圳)有限公司 基于海量数据的用户年龄估算方法及***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2202280C1 (ru) * 2001-08-07 2003-04-20 Российский центр судебно-медицинской экспертизы МЗ РФ Способ определения возраста человека по морфометрическим параметрам гистологических препаратов костной ткани
US20080140640A1 (en) * 2003-01-14 2008-06-12 Infederation Ltd. Communications System and Method
JP2004318632A (ja) * 2003-04-18 2004-11-11 Yokogawa Electric Corp 年齢推定装置
US20080025573A1 (en) * 2006-07-28 2008-01-31 Noriyuki Nishi Photographic image processing apparatus

Also Published As

Publication number Publication date
US20150019570A1 (en) 2015-01-15
US20120109973A1 (en) 2012-05-03
RU2012101503A (ru) 2013-09-27
BR112012001650B1 (pt) 2020-01-21
US9075865B2 (en) 2015-07-07
SG176809A1 (en) 2012-01-30
CA2765111C (en) 2016-09-13
BR112012001650A2 (pt) 2016-04-12
CN101635009A (zh) 2010-01-27
CA2765111A1 (en) 2011-02-24
MX2012000896A (es) 2012-02-28
US8909638B2 (en) 2014-12-09
CN101635009B (zh) 2015-06-17
WO2011020371A1 (zh) 2011-02-24

Similar Documents

Publication Publication Date Title
RU2505858C2 (ru) Способ оценки возраста пользователя по данным большого объема и соответствующая система
CN105701216B (zh) 一种信息推送方法及装置
CN105159932B (zh) 一种数据检索引擎和排序***和方法
CN109241405A (zh) 一种基于知识关联的学习资源协同过滤推荐方法及***
JP2017512344A (ja) 迅速なデータ解析のためのシステム及び方法
JP2009151760A (ja) オブジェクト間競合指標計算方法およびシステム
CN103368917A (zh) 一种网络虚拟用户的风险控制方法及***
CN105373597A (zh) 基于k-medoids项目聚类和局部兴趣融合的用户协同过滤推荐方法
CN103440242A (zh) 一种基于用户搜索行为的个性化推荐方法和***
KR101868729B1 (ko) 리소스조합 처리방법, 장치, 설비 및 컴퓨터 저장매체
CN116578726B (zh) 一种个性化图书推荐***
Wu Geographical knowledge diffusion and spatial diversity citation rank
US9020863B2 (en) Information processing device, information processing method, and program
Samanta et al. LMPP: A Large Margin Point Process Combining Reinforcement and Competition for Modeling Hashtag Popularity.
CN110334936B (zh) 一种信贷资质评分模型的构建方法、装置和设备
KR101711118B1 (ko) 빅데이터를 이용한 사용자에 개인화된 음식 추천 시스템
KR101621735B1 (ko) 추천 검색어 제공 방법 및 시스템
CN106611339B (zh) 种子用户筛选方法、产品的用户影响力评价方法及装置
CN106708880A (zh) 话题关联词的获取方法和装置
KR20160088503A (ko) 검색 방법 및 검색 서버
KR100910515B1 (ko) 연관 검색어 판단 방법 및 시스템
KR102388952B1 (ko) 소셜 사물 인터넷 환경에서 유사 사용자 추천 방법 및 이를 기록한 기록매체
CN104331398B (zh) 生成同义词对齐词典的方法及装置
CN113313582A (zh) 拒客回捞模型训练方法、装置及电子设备
CN111523054A (zh) 基于活跃账号和相似账号的项目推荐方法及***