KR101777035B1 - 주소 필터링 방법, 장치, 프로그램 및 기록매체 - Google Patents

주소 필터링 방법, 장치, 프로그램 및 기록매체 Download PDF

Info

Publication number
KR101777035B1
KR101777035B1 KR1020157031176A KR20157031176A KR101777035B1 KR 101777035 B1 KR101777035 B1 KR 101777035B1 KR 1020157031176 A KR1020157031176 A KR 1020157031176A KR 20157031176 A KR20157031176 A KR 20157031176A KR 101777035 B1 KR101777035 B1 KR 101777035B1
Authority
KR
South Korea
Prior art keywords
address
url address
cache list
web page
resource
Prior art date
Application number
KR1020157031176A
Other languages
English (en)
Other versions
KR20160110064A (ko
Inventor
진송 판
이페이 유
징롱 주오
Original Assignee
시아오미 아이엔씨.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 시아오미 아이엔씨. filed Critical 시아오미 아이엔씨.
Publication of KR20160110064A publication Critical patent/KR20160110064A/ko
Application granted granted Critical
Publication of KR101777035B1 publication Critical patent/KR101777035B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/60Scheduling or organising the servicing of application requests, e.g. requests for application data transmissions using the analysis and optimisation of the required network resources
    • H04L67/63Routing a service request depending on the request content or context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/74Address processing for routing
    • H04L45/745Address table lookup; Address filtering
    • H04L61/2007
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L61/00Network arrangements, protocols or services for addressing or naming
    • H04L61/09Mapping addresses
    • H04L61/25Mapping addresses of the same type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L61/00Network arrangements, protocols or services for addressing or naming
    • H04L61/58Caching of addresses or names
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/02Network architectures or network communication protocols for network security for separating internal from external traffic, e.g. firewalls
    • H04L63/0227Filtering policies
    • H04L63/0236Filtering by address, protocol, port number or service, e.g. IP-address or URL
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Computing Systems (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

본 발명은 주소 필터링 방법, 장치 및 프로그램 및 기록매체에 관한 것이고, 인터넷 기술 분야에 속한다. 상기 방법은, 웹 페이지 소재 리소스에 대응되는 URL 주소를 획득하는 단계와, 주소 캐시 리스트에 상기 URL 주소가 저장되어 있는지 여부를 검색하는 단계와, 상기 주소 캐시 리스트에 상기 URL 주소가 저장되어 있지 않은 경우, 상기 소정의 매칭 알고리즘에 의해 상기 URL 주소가 필터링할 필요가 있는 URL 주소인지 여부를 판정하도록 상기 URL 주소에 대해 매칭 연산을 수행하는 단계를 포함하고, 상기 웹 페이지 소재 리소스에는 사진 리소스, 음성 리소스, 동영상 리소스 및 문자 리소스 중 적어도 하나가 포함되고, 상기 주소 캐시 리스트는 소정의 매칭 알고리즘에 의해 매칭된 URL 주소를 저장한다. 본 발명은 소정의 매칭 알고리즘에 의해 주소 캐시 리스트에 저장되지 않은 URL 주소에 대해서만 매칭을 수행하기 때문에 필터링 효율이 향상되고 계산 리소스를 절약하는 효과를 가져올 수 있다.

Description

주소 필터링 방법, 장치, 프로그램 및 기록매체{METHOD AND DEVICE FOR FILTERING ADDRESS, PROGRAM AND RECORDING MEDIUM}
본원은 출원번호가 201510079200.5이며, 출원일이 2015 년 2 월 13 일인 중국특허출원을 기초로 우선권을 주장하고 해당 중국특허출원의 내용 전부를 본원에 원용한다.
본 발명은 인터넷 기술 분야에 관한 것이고, 특히 주소 필터링 방법, 장치 및 프로그램 및 기록매체에 관한 것이다.
웹 페이지에 게재된 광고 리소스는 사용자의 브라우징 체험에 영향을 줄뿐만 아니라 사용자의 데이터 트래픽을 낭비한다.
종래 기술에서 광고 리소스에 대해 필터링 할 때, 먼저 소정의 매칭 알고리즘에 의해 필터링 매칭 테이블을 구축하고, 필터링 매칭 테이블 중의 하나 이상의 정규 표현식에 의해 웹 페이지 소재 리소스에 대응하는 URL(Uniform Resource Locator, 리소스 위치 지정자) 주소를 매칭하고, 매칭이 성공되면, 상기 URL 주소가 필터링 될 필요가 있는 광고 주소로 인증되고 필터링 된다. 또한 동일한 웹 페이지에서 서로 같은 광고 리소스에 대응하는 URL 주소는 일반적으로 동일하기 때문에, 두 개의 동일한 URL 주소를 수신하였을 경우, 소정의 매칭 알고리즘에 의해 동일한 매칭 연산을 2 회 반복할 필요가 있기에 필터링 효율에 영향을 미칠 뿐만 아니라 계산 리소스도 낭비된다.
본 발명은 주소 필터링 방법 및 장치를 제공하고 기술 방안은 하기과 같다.
본 발명의 제 1 양태에 의한 주소 필터링 방법은,
웹 페이지 소재 리소스에 대응되는 URL 주소를 획득하는 단계와,
주소 캐시 리스트에 상기 URL 주소가 저장되어 있는지 여부를 검색하는 단계와,
상기 주소 캐시 리스트에 상기 URL 주소가 저장되어 있지 않은 경우, 상기 소정의 매칭 알고리즘에 의해 상기 URL 주소가 필터링할 필요가 있는 URL 주소인지 여부를 판정하도록 상기 URL 주소에 대해 매칭 연산을 수행하는 단계를 포함하고,
상기 웹 페이지 소재 리소스에는 사진 리소스, 음성 리소스, 동영상 리소스 및 문자 리소스 중 적어도 하나가 포함되고,
상기 주소 캐시 리스트는 소정의 매칭 알고리즘에 의해 매칭된 URL 주소를 저장한다.
본 발명의 제 2 양태에 의한 주소 필터링 장치는,
웹 페이지 소재 리소스에 대응되는 URL 주소를 획득하는 제 1 획득 모듈과,
주소 캐시 리스트에서 상기 URL 주소가 저장되어 있는지 여부를 검색하는 검색 모듈과,
상기 주소 캐시 리스트에 상기 URL 주소가 저장되어 있지 않은 경우, 상기 소정의 매칭 알고리즘에 의해 상기 URL 주소가 필터링할 필요가 있는 URL 주소인지 여부를 판정하도록 상기 URL 주소에 대해 매칭 연산을 수행하는 매칭 모듈을 구비하고,
상기 웹 페이지 소재 리소스에는 사진 리소스, 음성 리소스, 동영상 리소스 및 문자 리소스 중 적어도 하나가 포함되고,
상기 주소 캐시 리스트는 소정의 매칭 알고리즘에 의해 매칭된 URL 주소를 저장한다.
본 발명의 제 3 양태에 의한 주소 필터링 장치는,
프로세서와,
상기 프로세서에 의해 실행 가능한 명령을 저장하는 메모리를 포함하고,
상기 프로세서는,
웹 페이지 소재 리소스에 대응되는 URL 주소를 획득하고,
주소 캐시 리스트에 상기 URL 주소가 저장되어 있는지 여부를 검색하고,
상기 주소 캐시 리스트에 상기 URL 주소가 저장되어 있지 않은 경우, 상기 소정의 매칭 알고리즘에 의해 상기 URL 주소가 필터링할 필요가 있는 URL 주소인지 여부를 판정하도록 상기 URL 주소에 대해 매칭 연산을 수행하도록 구성되며,
상기 웹 페이지 소재 리소스에는 사진 리소스, 음성 리소스, 동영상 리소스 및 문자 리소스 중 적어도 하나가 포함되고,
상기 주소 캐시 리스트는 소정의 매칭 알고리즘에 의해 매칭된 URL 주소를 저장한다.
본 발명의 제 4 양태에 의한 프로그램은,
프로세서에 의해 실행되는 것을 통하여 상기 주소 필터링 방법을 실현하는 기록매체에 기록된다.
본 발명의 제5양태에 의한 기록매체는,
상기 프로그램이 기록된다.
본 발명에 의해 제공된 기술안에 따르면 하기와 같은 기술 효과를 가져올 수 있다. 즉,
주소 캐시 리스트에서 획득한 URL 주소가 저장되어 있는지 여부를 검색하고, 상기 URL 주소가 검색되지 않은 경우, 소정의 매칭 알고리즘에 의해 상기 URL 주소가 필터링할 필요가 있는 URL 주소인지 여부를 판정하도록 상기 URL 주소에 대해 매칭 연산을 수행한다. 이를 통해 2 개의 동일한 URL 주소가 수신되는 경우, 소정의 매칭 알고리즘에 의해 동일한 매칭 연산을 2 회 반복하기에 필터링 효율에 영향을 미칠뿐만 아니라 계산 리소스도 낭비되는 문제가 해결되고, 소정의 매칭 알고리즘에 의해 주소 캐시 리스트에 저장되지 않은 URL 주소에 대해서만 매칭을 수행하기 때문에 필터링 효율이 향상되고 계산 리소스를 절약할 수 있다.
상기 일반적인 기재 및 후술하는 상세한 설명은 단지 예시적이고 해석적인 설명이며, 본 발명을 한정하지 않음을 이해해야 한다.
여기서 도면은 명세서에 병합되어 본 명세서의 일부를 구성하고 본 발명에 부합하는 실시예를 표시하고 명세서와 함께 본 발명의 원리를 설명한다.
도 1은 본 발명의 각 실시예에 따른 실시 환경을 나타내는 환경 모식도이다.
도 2a는 일 예시적인 실시예에 따른 주소 필터링 방법을 나타내는 흐름도이다.
도 2b는 일 예시적인 실시예에 따른 주소 필터링 방법을 나타내는 흐름도이다.
도 2c는 일 예시적인 실시예에 따른 주소 필터링 방법을 나타내는 흐름도이다.
도 2d는 일 예시적인 실시예에 따른 주소 필터링 방법을 나타내는 흐름도이다.
도 3a는 다른 예시적인 실시예에 주소 필터링 방법을 나타내는 흐름도이다.
도 3b는 다른 예시적인 실시예에 주소 필터링 방법에서 URL 주소를 획득하는 과정을 나타내는 흐름도이다.
도 4는 또 다른 예시적인 실시예에 따른 주소 필터링 방법을 나타내는 흐름도이다.
도 5는 또 다른 하나의 예시적인 실시예에 따른 주소 필터링 방법을 나타내는 흐름도이다.
도 6은 일 예시적인 실시예에 따른 주소 필터링 장치의 구조를 나타내는 블록도이다.
도 7은 다른 예시적인 실시예에 따른 주소 필터링 장치의 구조를 나타내는 블록도이다.
도 8은 예시적인 실시예에 따른 주소 필터링 장치를 나타내는 블록도이다.
상기 도면에 의해 본 발명의 명확한 실시예는 이미 표시되었지만 하기에 더욱 상세하게 설명한다. 이러한 도면 및 기재는 임의의 방식에 의해 본 발명의 사상 범위를 제한하려는 것이 아니라 특정 실시예를 참고하여 당업자에게 본 발명의 개념을 설명하기 위한 것이다.
하기에 예시적 실시예에 대하여 상세히 설명하되 그 예들은 도면에 도시되어 있다. 하기에 도면과 관련하여 기술할 경우, 별도의 설명이 없는 한,다른 도면 중의 동일한 도면부호는 동일하거나 유사한 요소를 나타낸다. 하기의 예시적 실시예에서 기술되는 실시형태는 본 발명과 일치한 모든 실시형태를 대표하는 것이 아니다. 이들은 단지 첨부되는 특허청구 범위에서 상술하는 본 발명의 일 방면과 일치한 장치 및 방법의 예일 뿐이다.
도 1은 본 발명의 각 실시예에 따른 실시 환경을 나타내는 환경 모식도이며, 상기 실시 환경은 전자 기기(110), 웹 페이지 리소스 서버(120) 및 서버(130)를 포함한다.
전자 기기(110)는 웹 페이지 브라우징 클라이언트가 설치된 전자 기기에 의해 실현될 수 있다. 해당 전자 기기는 스마트 폰, 태블릿 PC, 전자 책 리더 및 노트북 컴퓨터(카메라, 캠코더) 등일 수도 있다.
전자 기기(110)는 유선 또는 무선 네트워크를 통해 웹 페이지 리소스 서버(120)에 연결될 수 있다.
웹 페이지 리소스 서버(120)는 하나의 서버 또는 복수의 서버로 구성된 서버 그룹, 또는 클라우드 컴퓨팅 서비스 센터일 수도 있다. 상기 웹 페이지 리소스 서버(120)는 전자 기기(120)가 발송한 웹 페이지 액세스 요청에 의하여 대응되는 웹 페이지 코드를 회신하고, 전자 기기(120)가 발송한 웹 페이지 소재 리소스 획득 요청에 의해 대응되는 웹 페이지 소재를 회신한다.
서버(130)는 유선 또는 무선 네트워크를 통해 전자 기기(120)에 연결될 수 있다.
서버(130)는 하나의 서버 또는 복수의 서버로 구성된 서버 군, 또는 클라우드 컴퓨팅 서비스 센터일 수도 있다. 상기 서버(130)는 복수의 전자 기기(120)가 발송한 주소 캐시 리스트를 송수신할 수 있다.
설명을 편리하기 위해, 주소 필터링 방법이 클라이언트에 의해 실행되는 것 만을 예로 들어 설명하지만, 이에 한정하지 않는다.
도 2a는 일 예시적인 실시예에 따른 주소 필터링 방법을 나타내는 흐름도이며, 본 실시예는, 상기 주소 필터링 방법이 웹 페이지 브라우징 클라이언트가 설치된 전자 기기에 의해 실행되는 것을 예로 들어 설명한다. 상기 주소 필터링 방법에는 하기와 같은 단계가 포함될 수 있다.
201단계: 웹 페이지 소재 리소스에 대응되는 URL 주소를 획득한다. 상기 웹 페이지 소재 리소스에는 사진 리소스, 음성 리소스, 동영상 리소스 및 문자 리소스 중 적어도 하나가 포함된다.
202단계: 주소 캐시 리스트에 상기 URL 주소가 저장되어 있는지 여부를 검색한다. 상기 주소 캐시 리스트는 소정의 매칭 알고리즘에 의해 매칭된 URL 주소를 저장한다.
상기 주소 캐시 리스트에는 소정의 매칭 알고리즘에 의한 매칭 연산에 의해 필터링할 필요가 있는 URL 주소를 저장하는 제 1 캐시 리스트 및 소정의 매칭 알고리즘에 의한 매칭 연산에 의해 필터링할 필요가 없는 URL 주소를 저장하는 제 2 캐시 리스트 중 적어도 하나를 포함한다.
203단계: 주소 캐시 리스트에 URL 주소가 저장되어 있지 않은 경우, 소정의 매칭 알고리즘에 의해 상기 URL 주소가 필터링할 필요가 있는 URL 주소인지 여부를 판정하도록 상기 URL 주소에 대해 매칭 연산을 수행한다.
상기 내용을 종합하면, 본 발명의 실시예가 제공한 주소 필터링 방법은, 주소 캐시 리스트에서 획득한 URL 주소가 저장되어 있는지 여부를 검색하고, 상기 URL 주소가 검색되지 않은 경우, 소정의 매칭 알고리즘에 의해 상기 URL 주소가 필터링할 필요가 있는 URL 주소인지 여부를 판정하도록 상기 URL 주소에 대해 매칭 연산을 수행한다. 이를 통해 2 개의 동일한 URL 주소가 수신되는 경우 소정의 매칭 알고리즘에 의해 동일한 매칭 연산을 2 회 반복하기에 필터링 효율에 영향을 미칠뿐만 아니라 계산 리소스도 낭비되는 문제가 해결되고, 소정의 매칭 알고리즘에 의해 주소 캐시 리스트에 저장되지 않은 URL 주소에 대해서만 매칭을 수행하기 때문에 필터링 효율이 향상되고 계산 리소스를 절약하는 효과를 가져올 수 있다.
하나의 가능한 실시형태로써, 클라이언트는 주소 캐시 리스트에서의 URL 주소에 대한 검색 효율을 향상시키기 위해, 주소 캐시 리스트 내의 각각의 URL 주소를 해시 테이블(hash table)에 의해 저장하고 있다. 도 2b에 도시된 바와 같이, 상기 주소 필터링 방법은 또한 하기와 같은 단계를 포함할 수 있다.
204단계: 주소 캐시 리스트 내의 각각의 URL 주소는 해시 테이블에 의해 저장된다.
또 다른 가능한 실시형태로써, 클라이언트가 자주 액세스하는 웹 페이지에 액세스할 때, 주소 캐시 리스트에서 더욱 빨리 검색을 수행하여 URL 주소를 필터링하는 효율을 향상시킬 수 있도록, 클라이언트는 주소 캐시 리스트에서 각 URL 주소가 검색되는 횟수에 따라 각 URL 주소에 대해 검색 우선 순위를 설정한다. 도 2c에 도시된 바와 같이, 상기 주소 필터링 방법은 하기와 같은 단계가 포함될 수 있다.
205단계: 주소 캐시 리스트에서 각각의 URL 주소가 검색되는 횟수를 획득하고, 횟수에 따라 주소 캐시 리스트 내의 각각의 URL 주소에 대해 검색 우선 순위를 설정한다. 검색 우선 순위는 각 URL 주소가 검색될 때의 검색 순서를 표시한다.
또 다른 하나의 가능한 실시형태로써, 서로 다른 클라이언트가 업데이트 정보에 의해 주소 캐시 리스트에 저장된 URL 주소를 완벽하게 하여 필터링 효율을 향상시킬 수 있도록 클라이언트는 생성된 주소 캐시 리스트를 서버에 발송하고 서버가 서로 다른 클라이언트가 발송한 주소 캐시 리스트에 의해 서로 다른 클라이언트에 대한 업데이트 정보를 생성한다. 도 2d에 도시된 바와 같이, 상기 주소 필터링 방법은 또한 하기와 같은 단계가 포함될 수 있다.
206단계: 주소 캐시 리스트에 의해 클라이언트 액세스 습관을 분석하고, 또한 클라이언트 액세스 습관 및 기타 클라이언트가 발송한 주소 캐시 리스트에 의해 업데이트 정보를 생성하는 서버에 주소 캐시 리스트를 발송한다.
207단계: 업데이트 정보를 수신하고, 업데이트 정보에 의하여 주소 캐시 리스트를 업데이트 한다.
주소 캐시 리스트에 제 1 캐시 리스트가 포함되는 경우, 클라이언트는 제 1 캐시 리스트에 획득한 웹 페이지 소재 리소스에 대응되는 URL 주소가 저장되어 있는지 여부를 우선적으로 검색하고, 제 1 캐시 리스트에 해당 URL 주소가 저장되어 있지 않은 경우, 소정의 매칭 알고리즘에 의해 상기 URL에 대해 매칭을 수행한다. 한편, 필터링 효율을 높이기 위해, 제 1 캐시 리스트 내의 각각의 URL 주소는 해시 테이블에 의해 저장될 수 있다. 하기에 예시적인 실시예를 통해 설명한다.
도 3a는 다른 예시적인 실시예에 따른 주소 필터링 방법을 나타내는 흐름도이며, 본 실시예는 상기 주소 필터링 방법이 도 1에 도시된 전자 기기(110)에 적용되는 것을 예로 들어 설명한다. 상기 주소 필터링 방법에는 하기와 같은 단계가 포함될 수 있다.
301단계: 웹 페이지 소재 리소스에 대응되는 URL 주소를 획득한다. 상기 웹 페이지 소재 리소스에는 사진 리소스, 음성 리소스, 동영상 리소스 및 문자 리소스 중 적어도 하나가 포함된다.
웹 페이지에는 대량의 웹 페이지 소재 리소스가 포함되어 있고, 이러한 웹 페이지 소재 리소스는 웹 페이지의 문자, 동영상, 사진 및 음성 등일 수 있다. 그러나 이러한 웹 페이지 소재 리소스에는 일부 광고 리소스도 포함되어 있어, 웹 페이지에 이러한 광고 리소스가 표시되면 사용자의 브라우징 체험에 영향을 준다. 따라서 클라이언트는 웹 페이지 소재 리소스 중의 광고 리소스에 대해 필터링할 필요가 있다.
광고 리소스에 대한 URL 주소는 특정된 표시를 구비하고 있기 때문에 클라이언트는 웹 페이지 소재 리소스 중의 URL 주소를 얻을 수 있으며, 상기 URL 주소에 의하여 상기 웹 페이지 소재 리소스가 광고 리소스인지 여부를 판단한다.
하나의 가능한 실시형태로써, 도 3b에 도시된 바와 같이, 상기301단계는 하기와 같은 단계가 포함될 수 있다.
301A단계: 웹 페이지 리소스 서버에 웹 페이지 액세스 요청을 발송한다. 웹 페이지 액세스 요청은 웹 페이지의 웹 주소를 구비하고, 웹 페이지 리소스 서버는 웹 주소에 의하여 웹 페이지에 대응하는 웹 페이지 코드를 검색한다.
사용자가 클라이언트를 통해 웹 페이지를 브라우징할 때, 주소 입력란에 대응되는 주소를 입력할 필요가 있고, 클라이언트는 상기 주소에 의하여 상기 주소를 구비한 웹 페이지 액세스 요청을 생성하고, 상기 웹 페이지 액세스 요청을 대응되는 웹 페이지 리소스 서버에 발송한다.
웹 페이지 리소스 서버가 상기 웹 페이지 액세스 요청을 받은 후, 상기 주소에 대응되는 웹 페이지의 웹 페이지 코드를 클라이언트에 발송한다. 여기서, 상기 웹 페이지 코드는 HTML(HyperText MarkUp langUage)에 의해 프로그래밍된 코드일 수 있다.
301B단계: 웹 페이지 리소스 서버가 발송한 웹 페이지 코드를 수신한다. 웹 페이지 코드는 적어도 하나의 웹 페이지 소재 리소스에 대응되는 URL 주소를 포함한다.
하나의 웹 페이지에 대량의 웹 페이지 소재 리소스가 포함되어 있고, 각 웹 페이지 소재 리소스는 대응하는 하나의 URL 주소를 구비하기 때문에, 상기 웹 페이지 코드에 대량의 웹 페이지 소재 리소스에 대응되는 URL 주소가 포함된다.
301C단계: 웹 페이지 코드에 포함된 웹 페이지 소재 리소스의 URL 주소를 획득한다.
클라이언트는 웹 페이지 코드에 포함된 웹 페이지 소재 리소스의 URL 주소를 일일이 획득하고, 상기 주소에 의해 대응되는 웹 페이지 소재 리소스가 광고 리소스인지 여부를 판단한다.
302단계: URL 주소에 대해 해시 연산을 수행하여 해시 연산 후의 URL 주소를 획득한다.
소정의 필터링 알고리즘에 의한 매칭 연산에 의해 필터링할 필요가 있는 URL 주소는 해시 테이블에 의해 저장된다. 즉, 제 1 캐시 리스트에 저장된 URL 주소에 대해 모두 해시 연산을 수행하기에 제 1 캐시 리스트에서 해당 URL 주소가 저장되어 있는지 여부를 검색하는 경우, 해당 URL 주소에 대해 해시 연산을 수행할 필요가 있다. 여기서, 상기 제 1 캐시 리스트의 테이블 구조는 표1에 표시한 바와 같다.
Figure 112015105112673-pct00001
여기서, 상기 키 값은 URL 주소에 대해 해시 연산을 수행하여 얻은 것이다.
클라이언트는 웹 페이지 소재 리소스 중의 URL 주소를 획득한 후, 해시 연산을 통하여 해당 URL 주소에 대응되는 키 값을 얻는다. 또한, 본 실시예는 상기 URL 주소에 대해 해시 연산을 수행한 후 얻은 것이 대응되는 키 값인 것만을 예로 들어 설명하나, 본 발명은 이에 한정되지 않는다.
303단계: 해시 연산을 수행한 후의 URL 주소에 의해 제 1 캐시 리스트에 상기 URL 주소가 저장되어 있는지 여부를 검색한다.
해시 연산을 수행한 후의 URL 주소에 의해 제 1 캐시 리스트에 해당 URL 주소가 저장되어 있는 것이 검색되는 경우, 304단계를 실행하고, 해시 연산 후의 URL 주소에 의해 제 1 캐시 리스트에서 상기 URL 주소가 검색되지 않은 경우, 305단계를 실행한다.
304단계: 제1 캐시 리스트에 해당 URL 주소가 저장되어 있는 경우, 제 1 캐시 리스트의 기록에 의해 상기 URL 주소를 직접 필터링한다.
제 1 캐시 리스트에 해당 URL 주소가 저장되어 있는 경우, 클라이언트는 상기 URL 주소가 소정의 매칭 알고리즘에 의한 매칭 연산에 의해 필터링할 필요가 있는 URL 주소로 결정한다. 즉, 상기 URL 주소에 대응되는 웹 페이지 소재 리소스가 광고 리소스라고 결정하고, 클라이언트는 상기 URL 주소를 필터링한다.
예를 들어, 클라이언트는 획득한 URL 주소에 대해 해시 연산을 수행하여 키 값 "Hash B"를 얻고, 상기 키 값에 의해 표 1에 표시된 제 1 캐시 리스트에서 검색하여 제 1 캐시 리스트에 해당 키 값이 존재하는 것을 검색한다. 즉, 제 1 캐시 리스트에 해당 URL 주소가 저장되어 있는 것을 검색한다. 이때 클라이언트는 소정의 매칭 알고리즘에 의해 상기 URL 주소를 매칭할 필요가 없이 상기 URL 주소를 직접 필터링 한다.
305단계 :제1 캐시 리스트에 해당 URL 주소가 저장되어 있지 않은 경우, 소정의 매칭 알고리즘에 의해 상기 URL 주소가 필터링할 필요가 있는URL 주소인지 여부를 판정하도록 상기 URL 주소에 대해 매칭 연산을 수행한다.
제 1 캐시 리스트에 해당 URL 주소가 저장되어 있지 않은 경우, 클라이언트는 상기 URL 주소가 필터링할 필요가 있는URL 주소 인지 여부를 결정할 수 없기 때문에 소정의 매칭 알고리즘에 의해 상기 URL 주소에 대해 매칭할 필요가 있다.
클라이언트는 소정의 매칭 알고리즘에 의해 필터링 매칭 테이블을 구축한다. 여기서, 상기 필터링 매칭 테이블에는 적어도 하나의 정규 표현식(regular expression)이 저장되고, 클라이언트는 획득한 URL 주소와 필터링 매칭 테이블 중의 정규 표현식을 매칭한다. 상기 URL 주소와 필터링 매칭 테이블 중의 정규 표현식이 매칭되면, 상기 URL 주소가 필터링할 필요가 있는 URL 주소로 결정하고 306단계를 실행한다. 여기서, 상기 필터링 매칭 테이블은 표2에 표시한 바와 같다.
Figure 112015105112673-pct00002
예를 들어, 획득한 URL 주소가 http://example.com/adv/123인 경우, 필터링 매칭 테이블 중의 정규 표현식과 매칭하여, 상기 URL 주소와 번호가 2 인 정규 표현식과 매칭되면 상기 URL 주소가 필터링할 필요가 있는 URL 주소로 결정한다.
306단계: 소정의 매칭 알고리즘에 의해 상기 URL 주소가 필터링할 필요가 있는 URL 주소로 검출되는 경우, 상기 URL 주소를 필터링한다.
소정의 매칭 알고리즘에 의해 상기 URL 주소가 필터링할 필요가 있는 URL 주소로 검출되는 경우, 클라이언트는 상기 웹 페이지 소재 리소스를 광고 리소스로 결정하고, 상기 URL 요청을 필터링한다.
307단계: 상기 URL 주소를 제1 캐시 리스트에 추가한다.
상기 URL 주소가 소정의 매칭 알고리즘에 의한 매칭 연산에 의해 필터링할 필요가 있는 URL 주소이기 때문에 클라이언트는 상기 URL 주소를 제1 캐시 리스트에 추가한다. 또한, 제 1 캐시 리스트에서 각 URL 주소는 해시 테이블에 의해 저장되기 때문에 클라이언트는 우선 상기 URL 주소에 대해 해시 연산을 수행하고 제 1 캐시 리스트에 저장할 필요가 있다.
클라이언트가 또 다시 상기 URL 주소를 획득하는 경우, 제 1 캐시 리스트에 해당 URL 주소가 이미 저장되어 있기 때문에 클라이언트는 소정의 매칭 알고리즘에 의해 매칭을 수행할 필요가 없이 해당 URL 주소를 직접 필터링하고 계산 리소스를 절약한다.
상기 내용을 종합하면, 본 발명의 실시예에 의해 제공되는 주소 필터링 방법은, 주소 캐시 리스트에서 획득한 URL 주소가 저장되어 있는지 여부를 검색하고, 상기 URL 주소가 검색되지 않은 경우, 소정의 매칭 알고리즘에 의해 상기 URL 주소가 필터링할 필요가 있는 URL 주소인지 여부를 판정하도록 상기 URL 주소에 대해 매칭 연산을 수행한다. 이를 통해 2 개의 동일한 URL 주소가 수신되는 경우, 소정의 매칭 알고리즘에 의해 동일한 매칭 연산을 2 회 반복하기에 필터링 효율에 영향을 미칠뿐만 아니라 계산 리소스도 낭비되는 문제가 해결되고, 소정의 매칭 알고리즘에 의해 주소 캐시 리스트에 저장되지 않은 URL 주소에 대해서만 매칭을 수행하기 때문에 필터링 효율이 향상되고 계산 리소스를 절약하는 효과를 가져올 수 있다.
본 실시예에서 제공한 주소 필터링 방법은, 소정의 매칭 알고리즘에 의한 매칭 연산에 의해 필터링할 필요가 있는 URL 주소를 제1 캐시 리스트에 저장하고, 또한 제 1 캐시 리스트에서 웹 페이지 소재 리소스에 대응되는 URL 주소가 저장되어 있는지 여부를 검색하고, 제 1 캐시 리스트에 해당 URL 주소가 저장되어 있는 경우, 직접 해당 URL 주소를 필터링하고, 제 1 캐시 리스트에 해당 URL 주소가 저장되어 있는 않은 경우, 소정의 매칭 알고리즘에 의해 매칭을 수행한다. 이리 하여 알고리즘에 의해 URL 주소에 대해 매칭하는 과정이 감소되고 계산 리소스가 절약되고 필터링 효율이 향상된다.
본 실시예에 의해 제공된 주소 필터링 방법은, 주소 캐시 리스트 내의 각각의 URL 주소를 해시 테이블에 의해 저장하여 클라이언트가 주소 캐시 리스트에서의 검색 효율을 향상시키고 필터링 효율도 향상된다.
주소 캐시 리스트에 제 2 캐시 리스트가 포함되는 경우, 클라이언트는 상기 제 2 캐시 리스트에 획득한 웹 페이지 소재 리소스에 대응되는 URL 주소가 저장되어 있는지 여부를 우선적으로 검색한다. 상기 제 2 캐시 리스트에 해당 URL 주소가 저장되어 있지 않은 경우, 소정의 매칭 알고리즘에 의해 상기 URL에 대해 매칭을 수행한다. 또한 필터링 효율을 향상하기 위하여, 클라이언트는 제 2 캐시 리스트에서 각각의 URL 주소가 검색되는 횟수에 따라 제 2 캐시 리스트 내의 각각의 URL 주소에 대해 검색 우선 순위를 설정한다. 하기에 예시적인 실시예를 통해 설명한다.
도 4는 또 다른 예시적인 실시예에 따른 주소 필터링 방법을 나타내는 흐름도이며, 본 실시예는 상기 주소 필터링 방법을 도 1에 도시된 전자 기기(110)에 적용되는 것을 예로 들어 설명한다. 상기 주소 필터링 방법에는 하기와 같은 단계가 포함될 수 있다.
401단계: 제 2 캐시 리스트에서 각각의 URL 주소가 검색되는 횟수를 획득한다.
제 2 캐시 리스트는 소정의 매칭 알고리즘에 의한 매칭 연산에 의해 필터링할 필요가 없는 URL 주소를 저장하고, 제 2 캐시 리스트에서 URL 주소가 매번 검색 될 때마다 클라이언트는 상기 URL 주소 검색 횟수에 1을 더한다. 물론 URL 주소가 검색되는 횟수가 많으면 많을수록, 사용자가 상기 URL 주소에 대응되는 웹 페이지 소재 리소스를 획득하는 횟수도 많아지는 것을 의미한다. 따라서 클라이언트는 획득한 제 2 캐시 리스트에서 각각의 URL 주소가 검색되는 횟수에 따라 사용자가 대응되는 웹 페이지 소재 리소스를 획득하는 횟수를 결정할 수 있다.
402단계 : 해당 횟수에 따라 제 2 캐시 리스트 내의 각각의 URL 주소에 대해 검색 우선 순위를 설정한다. 검색 우선 순위는 각각의 URL 주소를 검색할 때의 검색 순서를 표시한다.
클라이언트는 획득한 각각의 URL 주소가 검색되는 횟수에 따라 제 2 캐시 리스트에 저장된 URL 주소에 대해 검색 우선 순위를 설정한다. 여기서, 상기 제 2 캐시 리스트는 표3에 표시한 바와 같다.
Figure 112015105112673-pct00003
여기서, 클라이언트가 제 2 캐시 리스트에서 URL 주소를 검색할 때, 검색 우선 순위에 따라 내림차순으로 검색한다. 그리고, 서로 다른 URL 주소는 동일한 검색 우선 순위에 대응될 수 있다. 본 실시예는 서로 다른 URL 주소가 서로 다른 검색 우선 순위에 대응되는 경우만을 예로 들어 설명하나, 본 발명은 이에 한정되지 않는다.
물론 클라이언트가 자주 액세스하는 웹 페이지인 경우, 웹 페이지에 포함된 웹 페이지 소재 리소스에 대응되는 URL 주소의 검색 우선 순위가 상대적으로 높다. 사용자가 이러한 자주 액세스하는 웹 페이지에 액세스할 때 제 2 캐시 리스트에서의 검색 효율도 비교적 높기 때문에 웹 페이지 리소스의 획득 효율이 향상된다.
403단계: 웹 페이지 소재 리소스에 대응되는 URL 주소를 획득한다. 상기 웹 페이지 소재 리소스에는 사진 리소스, 음성 리소스, 동영상 리소스 및 문자 리소스 중 적어도 하나가 포함된다.
상기 301단계와 유사하게 클라이언트는 웹 페이지 소재 리소스에 대응되는 URL 주소를 획득하고, 상기 URL 주소에 의해 상기 웹 페이지 소재 리소스가 광고 리소스인지 여부를 판단한다.
404단계: 제 2 캐시 리스트에서 해당 URL 주소가 저장되어 있는지 여부를 검색한다.
클라이언트는 제 2 캐시 리스트 내의 각각의 URL주소의 검색 우선 순위를 획득하고, 검색 우선 순위의 내림차순으로 상기 URL 주소와 제 2 캐시 리스트 내의 각각의 URL 주소를 대비하여 제 2 캐시 리스트에 해당 URL 주소가 저장되어 있는지 여부를 결정한다.
제 2 캐시 리스트에 해당 URL 주소가 저장되어 있는 경우, 405단계를 실행하고, 제 2 캐시 리스트에 상기 URL 주소가 저장되어 있지 않은 경우, 406단계를 실행한다.
405단계: 제 2 캐시 리스트에 해당 URL 주소가 저장되어 있는 경우, URL 주소에 의해 웹 페이지 리소스 서버에 웹 페이지 소재 리소스 획득 요청을 발송한다.
제 2 캐시 리스트에 해당 URL 주소가 저장되어 있는 경우, 상기 URL 주소를 필터링할 필요가 없는 URL 주소로 결정하고, 클라이언트는 상기 URL 주소에 의해 웹 페이지 소재 리소스 획득 요청을 생성하고 웹 페이지 리소스 서버에 해당 웹 페이지 소재 리소스 획득 요청을 발송한다.
406단계: 제 2 캐시 리스트에 해당 URL 주소가 저장되어 있지 않은 경우, 소정의 매칭 알고리즘에 의해 상기 URL 주소가 필터링할 필요가 있는 URL 주소인지 여부를 판정하도록 상기 URL 주소에 대해 매칭 연산을 수행한다.
제 2 캐시 리스트에 해당 URL 주소가 저장되어 있지 않은 경우, 클라이언트는 상기 URL 주소가 필터링할 필요가 있는 URL 주소인지 여부를 결정할 수 없기 때문에 소정의 매칭 알고리즘에 의해 상기 URL 주소에 대해 매칭할 필요가 있다. 여기서, 소정의 매칭 알고리즘에 의해 상기 URL 주소에 대해 매칭하는 단계는, 상기 305단계와 유사하기 때문에 여기서 장황하게 설명하지 않는다.
407단계: 소정의 매칭 알고리즘에 의해 상기 URL 주소를 필터링할 필요가 없는 URL 주소로 검출되는 경우, URL 주소에 의해 웹 페이지 리소스 서버에 웹 페이지 소재 리소스 획득 요청을 발송한다.
소정의 매칭 알고리즘에 의해 상기 URL 주소를 필터링할 필요가 없는 URL 주소로 검출되는 경우, 클라이언트는 상기 웹 페이지 소재 리소스를 광고 리소스가 아니라고 결정하고, 또한 웹 페이지 리소스 서버에 웹 페이지 소재 리소스 획득 요청을 발송한다. 이에 대응하여, 웹 페이지 리소스 서버는 상기 웹 페이지 소재 리소스 획득 요청에 대응되는 해당 웹 페이지 소재 리소스를 회신한다.
408단계: 상기 URL 주소를 제 2 캐시 리스트에 추가한다.
상기 URL 주소가 소정의 매칭 알고리즘에 의한 매칭 연산에 의해 필터링할 필요가 없는 URL 주소이기 때문에, 클라이언트는 상기 URL 주소를 제 2 캐시 리스트에 추가한다. 그리고, 상기 URL 주소를 제 2 캐시 리스트에 추가한 후, 클라이언트는 검색 우선 순위를 변경할 필요가 있는지 여부를 검출하고, 검색 우선 순위에 변경이 있을 경우 조정을 수행하여 제 2 캐시 리스트 중의 검색 우선 순위 시간성을 보장할 수 있다.
클라이언트가 또 다시 상기 URL 주소를 획득할 때, 제 2 캐시 리스트에 해당 URL 주소가 이미 저장되어 있기 때문에, 클라이언트는 소정의 매칭 알고리즘에 의해 상기 URL 주소에 대해 매칭할 필요가 없게 되고 계산 리소스가 절약된다.
상기 내용을 종합하면, 본 발명의 실시예가 제공한 주소 필터링 방법은, 주소 캐시 리스트에서 획득한 URL 주소가 저장되어 있는지 여부를 검색하고, 상기 URL 주소가 검색되지 않은 경우, 소정의 매칭 알고리즘에 의해 상기 URL 주소가 필터링할 필요가 있는 URL 주소인지 여부를 판정하도록 상기 URL 주소에 대해 매칭 연산을 수행한다. 이를 통해 2 개의 동일한 URL 주소가 수신되는 경우, 소정의 매칭 알고리즘에 의해 동일한 매칭 연산을 2 회 반복하기에 필터링 효율에 영향을 미칠뿐만 아니라 계산 리소스도 낭비되는 문제가 해결되고, 소정의 매칭 알고리즘에 의해 주소 캐시 리스트에 저장되지 않은 URL 주소에 대해서만 매칭을 수행하기 때문에 필터링 효율이 향상되고 계산 리소스를 절약하는 효과를 가져올 수 있다.
본 실시예에서 제공한 주소 필터링 방법은, 소정의 매칭 알고리즘에 의한 매칭 연산에 의해 필터링할 필요가 없는 URL 주소를 제 2 캐시 리스트에 저장하고, 또한 상기 제 2 캐시 리스트에서 웹 페이지 소재 리소스에 대응되는 URL 주소가 저장되어 있는지 여부를 검색하고, 상기 제 2 캐시 리스트에 해당 URL 주소가 저장되어 있는 경우, 웹 페이지 리소스 서버에 웹 페이지 소재 리소스 획득 요청을 발송하고, 상기 제 2 캐시 리스트에 해당 URL 주소가 저장되어 있지 않은 경우, 소정의 매칭 알고리즘에 의해 매칭을 수행한다. 따라서 알고리즘에 의해 URL 주소에 대해 매칭하는 과정이 감소되고 계산 리소스가 절약되며 필터링 효율이 향상된다.
본 실시예에서 제공한 주소 필터링 방법은, 주소 캐시 리스트에서의 각 URL 주소가 검출되는 횟수에 따라 각 URL 주소에 대해 검색 우선 순위 배열을 설정하여 클라이언트가 주소 캐시 리스트에서의 검색 효율이 향상되고, 필터링 효율도 향상된다.
클라이언트는 매칭되는 필터링할 필요가 있는 URL 주소를 제1 캐시 리스트에 저장하고, 매칭되는 필터링할 필요가 없는 URL 주소를 제 2 캐시 리스트에 저장하며, URL 주소를 획득한 경우, 제 1 캐시 리스트 및 제 2 캐시 리스트에서 차례로 검색하고, 제 1 캐시 리스트 및 제 2 캐시 리스트에 모두 해당 URL 주소가 저장되어 있는 경우, 소정의 매칭 알고리즘에 의해 매칭을 수행한다. 필터링 효율을 향상시키기 위하여, 클라이언트는 주소 캐시 리스트를 서버에 발송하고, 서버는 상기 클라이언트 액세스 습관 및 기타 클라이언트가 발송한 주소 캐시 리스트에 의해 업데이트 정보를 생성하고, 상기 업데이트 정보를 클라이언트에 발송하여 상기 주소 캐시 리스트를 더욱 보완하고, 필터링 효율을 더욱 향상할 수 있다. 하기에 예시적인 실시예를 통해 설명한다.
도 5는 또 다른 예시적인 실시예에 따른 주소 필터링 방법을 나타내는 흐름도이며, 본 실시예는 상기 주소 필터링 방법을 도 1에 도시된 전자 기기(110)에 적용되는 것을 예로 들어 설명한다. 상기 주소 필터링 방법에는 하기와 같은 단계가 포함될 수 있다.
501단계: 서버에 제 1 캐시 리스트 및 제 2 캐시 리스트를 발송한다. 서버는 제 1 캐시 리스트 및 제 2 캐시 리스트에 의해 클라이언트 액세스 습관을 분석하고, 클라이언트 액세스 습관 및 기타 클라이언트가 발송한 제 1 캐시 리스트 및 제 2 캐시 리스트에 의해 업데이트 정보를 생성한다.
클라이언트는 소정의 시간 간격으로 서버에 제 1 캐시 리스트 및 제 2 캐시 리스트를 발송할 수 있으며, 상기 소정의 시간 간격은 동일할 수도 있고 상이할 수 도 있다. 예를 들어, 클라이언트는 24시간 간격으로 서버에 제 1 캐시 리스트 및 제 2 캐시 리스트를 발송할 수 있고, 또는 매월 1 일에 제 1 캐시 리스트 및 제 2 캐시 리스트를 서버에 발송할 수도 있다. 그리고, 클라이언트는 제 1 캐시 리스트 또는 제 2 캐시 리스트에 새로운 URL 주소가 추가된 것을 검출했을 때, 서버에 제 1 캐시 리스트 및 제 2 캐시 리스트를 발송한다. 본 발명은 이에 한정되지 않는다.
서버가 제 1 캐시 리스트 및 제 2 캐시 리스트를 수신한 후, 제 1 캐시 리스트 및 제 2 캐시 리스트에 저장된 URL 주소에 의해 클라이언트 액세스 습관을 분석한다. 예를 들면, 저장된 URL 주소에 의한 분석을 통해 상기 클라이언트가 자주 액세스하는 웹 사이트를 장악할 수 있다.
서버는 기타 클라이언트가 발송한 제 1 캐시 리스트 및 제 2 캐시 리스트를 동시에 수신하기 때문에, 서버는 상기 클라이언트의 액세스 습관 및 기타 클라이언트가 발송한 제 1 캐시 리스트 및 제 2 캐시 리스트에 저장된 URL 주소에 의해 업데이트 정보를 생성한다.
예를 들어, 서버는 클라이언트 A가 발송한 제 1 캐시 리스트 A를 분석하여 클라이언트 A가 항상 액세스하는 웹 사이트가 웹 사이트 A이며, 제 1 캐시 리스트 A중의 "URL A" 및 "URL B"가 동일한 웹 사이트 A에 속하는 것을 획득한다. 서버는 클라이언트 B가 발송한 제 1 캐시 리스트 B를 분석하여 클라이언트 B가 항상 액세스하는 웹 사이트가 웹 사이트 A이며, 제 1 캐시 리스트 A 중의 "URL B" 및 "URL C"가 동일한 웹 사이트 A에 속하는 것을 획득한다. 서버는 "URL C"를 클라이언트 A에 대응하는 업데이트 정보로 결정하고, "URL A"를 클라이언트 B에 대응하는 업데이트 정보로 결정한다.
서버는 생성된 업데이트 정보를 해당 클라이언트에 발송한다.
502단계: 업데이트 정보를 수신하고, 업데이트 정보에 의하여 제 1 캐시 리스트 및 제 2 캐시 리스트를 업데이트한다.
클라이언트는 업데이트 정보에 포함된 URL 주소를 대응되는 주소 캐시 리스트에 추가한다.
503단계: 웹 페이지 소재 리소스에 대응되는 URL 주소를 획득한다. 상기 웹 페이지 소재 리소스에는 사진 리소스, 음성 리소스, 동영상 리소스 및 문자 리소스 중 적어도 하나가 포함된다.
상기 301단계와 유사하게 클라이언트는 웹 페이지 소재 리소스에 대응되는 URL 주소를 획득하고, 상기 URL 주소에 의해 상기 웹 페이지 소재 리소스가 광고 리소스인지 여부를 판단한다.
504단계: 제1 캐시 리스트에 해당 URL 주소가 저장되어 있는지 여부를 검출한다.
클라이언트는 제 1 캐시 리스트에 해당 URL 주소가 저장되어 있는지 여부를 검출하고, 제 1 캐시 리스트에 해당 URL 주소가 저장되어 있는 것으로 검출되는 경우, 상기 URL 주소를 필터링할 필요가 있는 URL 주소로 결정하고 필터링한다. 제 1 캐시 리스트에 해당 URL 주소가 저장되어 있지 않은 경우, 505단계를 실행한다.
505단계: 제1 캐시 리스트에 해당 URL 주소가 저장되어 있지 않은 경우, 제 2 캐시 리스트에 해당 URL 주소가 저장되어 있는지 여부를 검출한다.
클라이언트는 제 2 캐시 리스트에 해당 URL 주소가 저장되어 있는지 여부를 검출하고, 제 2 캐시 리스트에 해당 URL 주소가 저장되어 있는 것으로 검출되는 경우, 상기 URL 주소를 필터링할 필요가 없는 URL 주소로 결정한다. 제 2 캐시 리스트에 해당 URL 주소가 저장되어 있지 않은 경우, 506단계를 실행한다.
506단계: 제 2 캐시 리스트에 해당 URL 주소가 저장되어 있지 않은 경우, 소정의 매칭 알고리즘에 의해 상기 URL 주소가 필터링할 필요가 있는 URL 주소인지 여부를 판정하도록 상기 URL 주소에 대해 매칭 연산을 수행한다.
소정의 매칭 알고리즘에 의해 상기 URL 주소가 필터링할 필요가 있는 URL 주소인지 여부를 판정하도록 상기 URL 주소에 대해 매칭 연산을 수행하는 단계는, 상기 305단계와 유사하기 때문에 여기서 장황하게 설명하지 않는다.
507단계: 소정의 매칭 알고리즘에 의해 상기 URL 주소가 필터링할 필요가 있는 URL 주소인 경우, 상기 URL 주소를 필터링하고, 상기 URL 주소를 제1 캐시 리스트에 추가한다.
소정의 매칭 알고리즘에 의해 상기 URL 주소가 필터링할 필요가 있는 URL 주소로 검출되면 클라이언트는 상기 웹 페이지 소재 리소스를 광고 리소스로 결정하고, 상기 URL 주소를 필터링하고, 상기 URL 주소를 제 1 캐시 리스트에 추가한다.
508단계: 소정의 매칭 알고리즘에 의해 상기 URL 주소가 필터링할 필요가 없는 URL 주소인 경우, 상기 URL 주소에 의해 웹 페이지 리소스 서버에 웹 페이지 소재 리소스 획득 요청을 발송하고, 상기 URL 주소를 제 2 캐시 리스트에 추가한다.
소정의 매칭 알고리즘에 의해 상기 URL 주소가 필터링할 필요가 없는 URL 주소로 검출되는 경우, 클라이언트는 해당 웹 페이지 소재 리소스를 광고 리소스 가 아니라고 결정하고, 웹 페이지 리소스 서버에 웹 페이지 소재 리소스 획득 요청을 발송하고, 상기 URL 주소를 제 2 캐시 리스트에 추가한다.
상기 내용을 종합하면, 본 발명의 실시예가 제공한 주소 필터링 방법은, 주소 캐시 리스트에서 획득한 URL 주소가 저장되어 있는지 여부를 검색하고, 상기 URL 주소가 검색되지 않은 경우, 소정의 매칭 알고리즘에 의해 상기 URL 주소가 필터링할 필요가 있는 URL 주소인지 여부를 판정하도록 상기 URL 주소에 대해 매칭 연산을 수행한다. 이를 통해 2 개의 동일한 URL 주소가 수신되는 경우, 소정의 매칭 알고리즘에 의해 동일한 매칭 연산을 2 회 반복하기에 필터링 효율에 영향을 미칠뿐만 아니라 계산 리소스도 낭비되는 문제가 해결되고, 소정의 매칭 알고리즘에 의해 주소 캐시 리스트에 저장되지 않은 URL 주소에 대해서만 매칭을 수행하기 때문에 필터링 효율이 향상되고 계산 리소스를 절약하는 효과를 가져올 수 있다.
본 실시예에서 제공한 주소 필터링 방법은, 주소 캐시 리스트를 서버에 발송하고, 서버가 상기 주소 캐시 리스트 및 기타 클라이언트가 발송한 주소 캐시 리스트에 의해 업데이트 정보를 생성하고, 상기 업데이트 정보를 클라이언트에 발송하며, 클라이언트는 업데이트 정보에 의해 주소 캐시 리스트를 업데이트하고, 동일한 액세스 습관을 구비한 클라이언트의 주소 캐시 리스트를 보완하고 필터링 효율을 향상시킨다.
하기는 본 발명에 따른 장치의 실시예이고, 본 발명에 따른 방법의 실시예를 실행하는데 적용할 수 있다. 본 발명에 따른 장치의 실시예에 설명되지 않은 세부적인 부분에 관하여 본 발명에 따른 방법의 실시예를 참조하면 된다.
도 6은 일 예시적인 실시예에 따른 주소 필터링 장치의 구조를 나타내는 블록도이고, 상기 주소 필터링 장치는 소프트웨어, 하드웨어 또는 이 둘의 조합에 의해 실현 가능하며, 도 1에 도시된 전자 기기(110)의 일부 또는 전부를 구성하는 것이 가능하다. 상기 주소 필터링 장치는,
사진 리소스, 음성 리소스, 동영상 리소스 및 문자 리소스 중 적어도 하나가 포함된 웹 페이지 소재 리소스에 대응되는 URL 주소를 획득하는 제1 획득 모듈(601)과,
소정의 매칭 알고리즘에 의해 매칭된 URL 주소를 저장하는 주소 캐시 리스트에서 URL 주소가 저장되어 있는지 여부를 검색하는 검색 모듈(602)과,
주소 캐시 리스트에 URL 주소가 저장되어 있지 않은 경우, 소정의 매칭 알고리즘에 의해 상기 URL 주소가 필터링할 필요가 있는 URL 주소인지 여부를 판정하도록 상기 URL 주소에 대해 매칭 연산을 수행하는 매칭 모듈(603)을 포함할 수 있다.
상기 내용을 종합하면, 본 발명의 실시예를 제공한 주소 필터링 장치는, 주소 캐시 리스트에서 획득한 URL 주소가 저장되어 있는지 여부를 검색하고, 상기 URL 주소가 검색되지 않은 경우, 소정의 매칭 알고리즘에 의해 상기 URL 주소가 필터링할 필요가 있는 URL 주소인지 여부를 판정하도록 상기 URL 주소에 대해 매칭 연산을 수행한다. 이를 통해 2 개의 동일한 URL 주소가 수신되는 경우, 소정의 매칭 알고리즘에 의해 동일한 매칭 연산을 2 회 반복하기에 필터링 효율에 영향을 미칠뿐만 아니라 계산 리소스도 낭비되는 문제가 해결되고, 소정의 매칭 알고리즘에 의해 주소 캐시 리스트에 저장되지 않은 URL 주소에 대해서만 매칭을 수행하기 때문에 필터링 효율이 향상되고 계산 리소스를 절약하는 효과를 가져올 수 있다.
도 7은 다른 예시적인 실시예에 따른 주소 필터링 장치의 구조를 나타내는 블록도이고, 상기 주소 필터링 장치는 소프트웨어, 하드웨어 또는 이 둘의 조합에 의해 실현 가능하며, 도 1에 도시된 전자 기기(110)의 일부 또는 전부를 구성 가능하다. 상기 주소 필터링 장치는,
사진 리소스, 음성 리소스, 동영상 리소스 및 문자 리소스 중 적어도 하나가 포함된 웹 페이지 소재 리소스에 대응되는 URL 주소를 획득하는 제1 획득 모듈(701)과,
소정의 매칭 알고리즘에 의해 매칭된 URL 주소를 저장를 저장하는 주소 캐시 리스트에 URL 주소가 저장되어 있는지 여부를 검색하는 검색 모듈(702)과,
주소 캐시 리스트에 URL 주소가 저장되어 있지 않은 경우, 소정의 매칭 알고리즘에 의해 상기 URL 주소가 필터링할 필요가 있는 URL 주소인지 여부를 판정하도록 상기 URL 주소에 대해 매칭 연산을 수행하는 매칭 모듈(703)을 포함할 수 있다.
바람직하게는, 제1 획득 모듈(701)은,
주소에 의해 웹 페이지에 대응되는 웹 페이지 코드를 검색하는 웹 페이지 리소스 서버에 웹 페이지 주소를 구비한 웹 페이지 액세스 요청을 발송하는 요청 발송 서브 모듈(701A)과,
웹 페이지 리소스 서버가 발송한 적어도 하나의 웹 페이지 소재 리소스에 대응되는 URL 주소가 포함된 웹 페이지 코드를 수신하는 코드 수신 서브 모듈(701B)과,
웹 페이지 코드에 포함된 웹 페이지 소재 리소스의 URL 주소를 획득하는 획득 서브 모듈 (701C)을 포함할 수 있다.
바람직하게는, 주소 캐시 리스트 내의 각각의 URL 주소는 해시 테이블에 의해 저장된다.
또한, 검색 모듈(702)은
URL 주소에 대해 해시 연산을 수행하여 해시 연산 후의 URL 주소를 얻는 연산 서브 모듈(702A)과,
해시 연산이 수행된 URL 주소에 의해 제 1 캐시 리스트에서 상기 URL 주소가 저장되어 있는지 여부를 검색하는 검색 서브 모듈(702B)을 포함할 수 있다.
바람직하게는, 상기 장치는,
주소 캐시 리스트에서 각각의 URL 주소가 검색되는 횟수를 획득하는 제 2 획득 모듈(704)과,
횟수에 따라 주소 캐시 리스트 내의 각각의 URL 주소에 대해 각 URL 주소가 검색될때 검색 순서를 표시하는 검색 우선 순위 배열을 수행하는 순위 배열 모듈 (705)을 포함할 수 있다 .
바람직하게는, 주소 캐시 리스트에는 소정의 매칭 알고리즘에 의한 매칭 연산에 의해 필터링할 필요가 있는 URL 주소를 저장하는 제 1 캐시 리스트가 포함된다.
상기 장치는,
소정의 매칭 알고리즘에 의해 상기 URL 주소가 필터링할 필요가 있는 URL 주소로 검출되는 경우, 상기 URL 주소를 필터링하는 제 1 필터링 모듈(706)과,
상기 URL 주소를 제1 캐시 리스트에 추가하는 제 1 추가 모듈(707)을 포함할 수 있다.
바람직하게는, 주소 캐시 리스트에는 소정의 매칭 알고리즘에 의한 매칭 연산에 의해 필터링할 필요가 없는 URL 주소를 저장하는 제 2 캐시 리스트가 포함된다.
상기 장치는,
소정의 매칭 알고리즘에 의해 상기 URL 주소가 필터링할 필요가 없는 URL 주소로 검출되는 경우, 상기 URL 주소에 의해 웹 페이지 리소스 서버에 웹 페이지 소재 리소스 획득 요청을 발송하는 제 1 발송 모듈(708)과,
URL 주소를 제 2 캐시 리스트에 추가하는 제 2 추가 모듈(709)을 포함할 수 있다.
바람직하게는, 주소 캐시 리스트에는 소정의 매칭 알고리즘에 의한 매칭 연산에 의해 필터링할 필요가 있는 URL 주소를 저장하는 제 1 캐시 리스트 및 소정의 매칭 알고리즘에 의한 매칭 연산에 의해 필터링할 필요가 없는 URL 주소를 저장하는 제 2 캐시 리스트가 포함된다.
또한, 검색 모듈(702)은,
제 1 캐시 리스트에 URL 주소가 저장되어 있는지 여부를 검출하는 제 1 검출 서브 모듈(702C)과,
제 1 캐시 리스트에 URL 주소가 저장되어 있지 않은 경우, 제 2 캐시 리스트에 해당 URL 주소가 저장되어 있는지 여부를 검출하는 제 2 검출 서브 모듈 (702D)을 포함할 수 있고,
제 2 검출 서브 모듈(702D)은, 또한 제 2 캐시 리스트에 URL 주소가 저장되어 있지 않은 경우, 소정의 매칭 알고리즘에 의해 URL 주소가 필터링할 필요가 있는 URL 주소인지 여부를 판정하도록 상기 URL 주소에 대해 매칭 연산을 수행하는 단계를 실행하도록 배치된다.
상기 장치는,
소정의 매칭 알고리즘에 의해 상기 URL 주소가 필터링할 필요가 있는 URL 주소인 경우, 상기 URL 주소를 필터링하고, 상기 URL 주소를 제1 캐시 리스트에 추가하는 제 2 필터링 모듈(710)과,
소정의 매칭 알고리즘에 의해 상기 URL 주소를 필터링할 필요가 없는 URL 주소인 경우, URL 주소에 의해 웹 페이지 리소스 서버에 웹 페이지 소재 리소스 획득 요청을 발송하고, 상기 URL 주소를 제 2 캐시 리스트에 추가하는 제 2 발송 모듈(711)을 포함할 수 있다.
바람직하게는, 상기 장치는,
주소 캐시 리스트에 의하여 클라이언트 액세스 습관을 분석하고, 클라이언트 액세스 습관 및 기타 클라이언트가 발송한 주소 캐시 리스트에 의해 업데이트 정보를 생성하는 서버에 주소 캐시 리스트를 발송하는 리스트 발송 모듈(712)과,
업데이트 정보를 수신하고 업데이트 정보에 의해 주소 캐시 리스트를 업데이트하는 수신 모듈(713)을 포함할 수 있다.
바람직하게는, 상기 장치는,
주소 캐시 리스트에 URL 주소가 저장되어 있는 경우, 주소 캐시 리스트의 기록에 의해 URL 주소를 직접 필터링하거나, 또는 상기 URL 주소에 의해 웹 페이지 리소스 서버에 웹 페이지 소재 리소스 획득 요청을 발송하는 제 3 필터링 모듈(714)을 포함할 수 있다.
상기 내용을 종합하면, 본 발명의 실시예를 제공한 주소 필터링 장치는, 주소 캐시 리스트에서 획득한 URL 주소가 저장되어 있는지 여부를 검색하고, 상기 URL 주소가 검색되지 않은 경우, 소정의 매칭 알고리즘에 의해 상기 URL 주소가 필터링할 필요가 있는 URL 주소인지 여부를 판정하도록 상기 URL 주소에 대해 매칭 연산을 수행한다. 이를 통해 2 개의 동일한 URL 주소가 수신되는 경우, 소정의 매칭 알고리즘에 의해 동일한 매칭 연산을 2 회 반복하기에 필터링 효율에 영향을 미칠뿐만 아니라 계산 리소스도 낭비되는 문제가 해결되고, 소정의 매칭 알고리즘에 의해 주소 캐시 리스트에 저장되지 않은 URL 주소에 대해서만 매칭을 수행하기 때문에 필터링 효율이 향상되고 계산 리소스를 절약하는 효과를 가져올 수 있다.
본 실시예에서 제공한 주소 필터링 장치는, 소정의 매칭 알고리즘에 의한 매칭 연산에 의해 필터링할 필요가 있는 URL 주소를 제1 캐시 리스트에 저장하고, 또한 제 1 캐시 리스트에 웹 페이지 소재 리소스에 대응되는 URL 주소가 저장되어 있는지 여부를 검색하고, 제 1 캐시 리스트에 해당 URL 주소가 저장되어 있는 경우, 직접 해당 URL 주소를 필터링하고, 제 1 캐시 리스트에 해당 URL 주소가 저장되어 있지 않은 경우, 다시 소정의 매칭 알고리즘에 의해 매칭을 수행한다. 따라서 알고리즘에 의해 URL 주소를 매칭하는 과정이 감소되고, 계산 리소스가 절약되며 필터링 효율이 향상될 수 있다.
본 실시예에 의해 제공된 주소 필터링 장치는, 주소 캐시 리스트 중의 각 URL 주소를 해시 테이블에 의해 저장하여 클라이언트가 주소 캐시 리스트에서의 검색 효율을 향상시키고 필터링 효율도 향상된다.
본 실시예에서 제공한 주소 필터링 장치는, 소정의 매칭 알고리즘에 의한 매칭 연산에 의해 필터링할 필요가 없는 URL 주소를 제 2 캐시 리스트에 저장하고, 또한 상기 제 2 캐시 리스트에서 웹 페이지 소재 리소스에 대응되는 URL 주소가 저장되어 있는지 여부를 검색하고, 상기 제 2 캐시 리스트에 해당 URL 주소가 저장되어 있는 경우, 웹 페이지 리소스 서버에 웹 페이지 소재 리소스 획득 요청을 발송하고, 상기 제 2 캐시 리스트에 해당 URL 주소가 저장되어 있지 않은 경우, 다시 소정의 매칭 알고리즘에 의해 매칭을 수행한다. 따라서 알고리즘에 의해 URL 주소를 매칭하는 과정이 감소되고, 계산 리소스가 절약되며 필터링 효율이 향상될 수 있다.
본 실시예에서 제공한 주소 필터링 장치는, 주소 캐시 리스트에서 각각의 URL 주소가 검색되는 횟수에 따라 각각의 URL 주소에 대해 검색 우선 순위 배열을 수행하여 클라이언트가 주소 캐시 리스트에서의 검색 효율이 향상되고, 필터링 효율도 향상된다.
본 실시예에서 제공한 주소 필터링 장치는, 주소 캐시 리스트를 서버에 발송하고, 서버가 상기 주소 캐시 리스트 및 기타 클라이언트가 발송한 주소 캐시 리스트에 의해 업데이트 정보를 생성하고, 상기 업데이트 정보를 클라이언트에 발송하고, 클라이언트는 업데이트 정보에 의해 주소 캐시 리스트를 업데이트하여, 동일한 액세스 습관을 구비한 클라이언트의 주소 캐시 리스트를 보완하고 필터링 효율을 향상시킬 수 있다.
도 8은 일 예시적인 실시예에 따른 주소 필터링 장치를 나타내는 블록도이다. 예를 들어, 장치(800)는 도 1에 도시된 전자 기기(110)일 수도 있다.
도8을 참조하면, 장치(800)는 프로세싱 유닛(802), 메모리(804), 전원 유닛(806) , 멀티미디어 유닛(808), 오디오 유닛(810), 입출력(I/O) 인터페이스(812), 센서 유닛(814) 및 통신 유닛(816) 중의 적어도 하나 이상을 포함할 수 있다.
프로세싱 유닛(802)은 일반적으로 장치(800)의 전반 조작 예를 들어 디스플레이, 전화 호출, 데이터 통신, 카메라 조작 및 기록 조작에 관련된 조작을 제어할 수 있다. 프로세싱 유닛(802)은 적어도 하나 이상의 프로세서(820)를 포함하여 명령을 실행함으로써 상기 방법의 일부 또는 전부 단계를 완성할 수 있다. 또한 프로세싱 유닛(802)은 기타 유닛과의 인터랙션을 편리하게 하도록 적어도 하나 이상의 모듈을 포함할 수 있다. 예를 들어, 프로세싱 유닛(802)은 멀티미디어 유닛(808)과의 인터랙션을 편리하게 할 수 있도록 멀티미디어 모듈을 포함할 수 있다.
메모리(804)는 장치(800)의 조작을 서포트 하기 위해 각종 데이터를 저장하도록 설치된다. 이러한 데이터는 예를 들어 장치(800)에서 임의의 애플리케이션이나 방법을 조작하기 위한 명령, 연락처 데이터, 전화 번호부 데이터, 메시지, 사진, 동영상 등을 포함할 수 있다. 메모리(804)는 임의의 유형의 휘발성 또는 비휘발성 메모리 예를 들어 SRAM(Static Random Access Memory), EEPROM(Electrically Erasable Programmable Read-Only Memory), EPROM(Erasable Programmable Read Only Memory), PROM(Programmable ROM) , ROM(Read Only Member), 자기 메모리, 플래시 메모리, 자기 디스크 혹은 콤팩트 디스크에 의해 혹은 이들의 조합에 의해 실현될 수있다.
전원 유닛(806)은 장치(800)의 각 유닛에 전력을 공급하기 위한 것이며, 전원 관리 시스템, 적어도 하나 이상의 전원 및 장치(800)를 위하여 전력을 생성, 관리 및 분배하는 관련된 기타 유닛을 포함할 수 있다.
멀티미디어 유닛(808)은 장치(800)와 사용자 사이에 출력 인터페이스를 제공하는 스크린을 포함할 수 있다. 일 실시예에 있어서 스크린은 액정 디스플레이(LCD) 또는 터치 패널(TP)을 포함할 수 있다. 스크린은 터치 패널을 포함하는 경우, 사용자의 입력 신호를 수신하도록 터치 스크린으로 실현될 수있다. 또한 터치 패널은 터치, 슬라이딩 및 터치 패널 위에서의 제스처(gesture)를 검출하도록 적어도 하나 이상의 터치 센서를 포함할 수 있다. 터치 센서는 터치 또는 슬라이딩 동작의 경계위치를 검출할 수 있을 뿐만 아니라, 터치 또는 슬라이딩 조작에 관련되는 지속시간 및 압력을 검출할 수 있다. 일 실시예에 있어서 멀티미디어 유닛(808)은 프론트 카메라 및/또는 리어 카메라를 포함할 수 있다. 장치(800)가 예를 들어 촬영 모드 또는 동영상 모드 등 조작 모드 상태에 있을 때, 프론트 카메라 및/또는 리어 카메라는 외부의 멀티미디어 데이터를 수신할 수 있다. 프론트 카메라 및 리어 카메라 각각은 고정된 광학 렌즈 시스템 또는 가변 초점 거리 및 광학 줌 기능을 구비할 수 있다.
오디오 유닛(810)은 오디오 신호를 출력 및/또는 입력하도록 설치될 수 있다. 예를 들어, 오디오 유닛(810)은 마이크(MIC)를 포함할 수 있다. 장치(800)가 예를 들어 호출 모드, 기록 모드 또는 음성 인식 모드 등 조작 모드 상태에 있을 때, 마이크는 외부의 오디오 신호를 수신하도록 설치될 수 있다. 수신된 오디오 신호는 메모리(804)에 저장되거나 또는 통신 유닛(816)을 통해 송신될 수 있다. 일 실시예에 있어서 오디오 유닛(810)은 오디오 신호를 출력하는 스피커를 더 포함할 수 있다.
I/O 인터페이스(812)는 프로세싱 유닛(802)과 주변 인터페이스 모듈 사이에 인터페이스를 제공하기 위한 것이다. 상기 주변 인터페이스 모듈은 키보드, 클릭 휠, 버튼 등일 수 있다. 이러한 버튼은 홈 버튼, 볼륨 버튼, 스타트 버튼 및 잠금 버튼 등을 포함하되 이에 한정되지 않는다.
센서 유닛(814)은 장치(800)를 위해 각 방면의 상태를 평가하는 적어도 하나 이상의 센서를 포함할 수 있다. 예를 들어, 센서 유닛(814)은 장치(800)의 온/오프 상태, 유닛의 상대적인 위치를 검출할 수 있다. 예를 들어, 상기 유닛은 장치(800)의 디스플레이 및 작은 키패드일 수 있다. 센서 유닛(814)은 장치(800) 또는 장치(800)의 유닛의 위치 변경, 사용자와 장치(800) 사이의 접촉여부, 장치(800)의 방위 또는 가속/감속 및 장치(800)의 온도 변화를 검출할 수 있다. 센서 유닛(814)은 어떠한 물리적 접촉도 없는 상황에서 근처의 물체를 검출하도록 배치되는 근접 센서를 포함 수 있다. 센서 유닛(814)은 이미지 형성 응용에 이용하기 위한 광 센서 예를 들어 CMOS 또는 CCD 이미지 센서를 포함할 수 있다. 일 실시예에 있어서 상기 센서 유닛(814)은 가속도 센서, 자이로 스코프 센서, 자기 센서, 압력 센서 또는 온도 센서를 더 포함할 수 있다.
통신 유닛(816)은 장치(800)와 기타 기기 사이의 무선 또는 유선 통신을 편리하게 수행하게 하도록 설치될 수 있다. 장치(800)는 통신 표준을 기반으로 하는 무선 네트워크 예를 들어 WiFi, 2G, 3G 또는 이들의 조합에 액세스할 수 있다. 일 예시적인 실시예에 있어서, 통신 유닛(816)은 방송 채널을 통해 외부의 방송 관리 시스템으로부터의 방송 신호 또는 방송 정보를 수신할 수 있다. 예시적인 일 실시예에 있어서, 상기 통신 유닛(816)은 근거리 통신을 촉진하기 위한 근거리 무선 통신(NFC) 모듈을 더 포함할 수 있다. 예를 들어, NFC 모듈은 RFID기술, IrDA기술, UWB기술, 블루투스(BT) 기술 및 기타 기술에 의해 실현될 수 있다.
예시적인 실시예에 있어서, 장치(800)는 상기 방법을 실행하기 위하여 적어도 하나 이상의 ASIC( Application Specific Integrated Circuit), DSP( Digital Signal Processor) , DSPD( Digital Signal Processing Device), PLD(Programmable Logic Device), FPGA(Field-Programmable Gate Array), 컨트롤러, 마이크로 컨트롤러, 마이크로 프로세서, 또는 기타 전자 소자에 의해 실현될 수 있다.
예시적인 일 실시예는 명령을 포함한 비일시적인 컴퓨터 판독 가능한 기록매체, 예를 들어 명령을 포함한 메모리(804)를 더 제공한다. 상기 명령은 장치(800)의 프로세서(820)에 의해 실행되어 상기 방법을 실현할 수 있다. 예를 들어, 상기 비일시적인 컴퓨터 판독 가능한 기록매체는, ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크 및 광 데이터 메모리 등일 수 있다.
비 일시적인 컴퓨터 판독 가능한 기록매체는, 상기 장치(800)의 프로세서에 의해 상기 기록매체에 저장되어 있는 명령이 실행되는 경우, 상기 장치(800)가 도 1에 도시된 전자 기기(110)의 주소 필터링 방법을 실행한다.
본원 명세서를 고려하여, 본원 명세서에 개시된 발명을 실시한 후, 본 발명의 다른 실시예가 당업자에게 자명할 것이다. 본원은 본 발명에 대한 임의의 변형, 사용 또는 적응적인 변경을 포함하는데 그 취지가 있다. 이러한 변형, 용도 또는 적응적인 변경은 본 발명의 일반적인 원리에 따라 본원 명세서에 개시되어 있지 않은 본 분야의 공지 상식 또는 관용적 기술 수단을 포함한다. 명세서 및 실시예는 예시적인 것에 불과하다. 본 발명의 범위 및 정신은 특허 청구 범위에 의해 한정된다.
또한, 본 발명은 상술 한 설명 및 도면에 표시된 구성에 한정하지 않고, 그 범위에서 벗어나지 않는 범위에서 다양한 수정 및 변경을 실시할 수 있다. 본 발명의 범위는 특허 청구 범위에 한정된다.

Claims (21)

  1. 주소 캐시 리스트에 의해 클라이언트 액세스 습관을 분석하고, 상기 클라이언트 액세스 습관 및 기타 클라이언트가 발송한 상기 주소 캐시 리스트에 의해 업데이트 정보를 생성하는 서버에 상기 주소 캐시 리스트를 발송하는 단계와,
    상기 업데이트 정보를 수신하고, 상기 업데이트 정보에 의해 상기 주소 캐시 리스트를 업데이트하는 단계와,
    웹 페이지 소재 리소스에 대응되는 URL 주소를 획득하는 단계와,
    상기 주소 캐시 리스트에 상기 URL 주소가 저장되어 있는지 여부를 검색하는 단계와,
    상기 주소 캐시 리스트에 상기 URL 주소가 저장되어 있지 않은 경우, 소정의 매칭 알고리즘에 의해 상기 URL 주소가 필터링할 필요가 있는 URL 주소인지 여부를 판정하도록 상기 URL 주소에 대해 매칭 연산을 수행하는 단계를 포함하고,
    상기 웹 페이지 소재 리소스에는 사진 리소스, 음성 리소스, 동영상 리소스 및 문자 리소스 중 적어도 하나가 포함되고,
    상기 주소 캐시 리스트는 상기 소정의 매칭 알고리즘에 의해 매칭된 URL 주소를 저장하는 것을 특징으로 하는
    주소 필터링 방법.
  2. 제1항에 있어서,
    상기 웹 페이지 소재 리소스에 대응되는 URL 주소를 획득하는 단계는,
    웹 페이지 리소스 서버에 웹 페이지 액세스 요청을 발송하는 단계와,
    상기 웹 페이지 리소스 서버가 발송한 웹 페이지 코드를 수신하는 단계와,
    웹 페이지 코드에 포함된 상기 웹 페이지 소재 리소스의 URL 주소를 획득하는 단계를 포함하고,
    상기 웹 페이지 액세스 요청은 상기 웹 페이지의 웹 주소를 구비하고, 상기 웹 페이지 리소스 서버는 상기 웹 주소에 의해 상기 웹 페이지에 대응되는 상기 웹 페이지 코드를 검색하고,
    상기 웹 페이지 코드는 적어도 하나의 상기 웹 페이지 소재 리소스에 대응되는 URL 주소를 포함하는 것을 특징으로하는
    주소 필터링 방법.
  3. 삭제
  4. 삭제
  5. 제1항에 있어서,
    상기 주소 캐시 리스트는, 상기 소정의 매칭 알고리즘에 의한 매칭 연산에 의해 필터링할 필요가 있는 URL 주소를 저장하는 제1 캐시 리스트를 포함하고,
    상기 방법은,
    상기 소정의 매칭 알고리즘에 의해 상기 URL 주소가 상기 필터링할 필요가 있는 URL 주소로 검출되면 상기 URL 주소를 필터링하는 단계와,
    상기 URL 주소를 상기 제 1 캐시 리스트에 추가하는 단계를 더 포함하는 것을 특징으로하는
    주소 필터링 방법.
  6. 제1항에 있어서,
    상기 주소 캐시 리스트는, 상기 소정의 매칭 알고리즘에 의한 매칭 연산에 의해 필터링할 필요가 없는 URL 주소를 저장하는 제 2 캐시 리스트를 포함하고,
    상기 방법은,
    상기 소정의 매칭 알고리즘에 의해 상기 URL 주소가 상기 필터링할 필요가 없는 URL 주소로 검출되면 상기 URL 주소에 의해 웹 페이지 리소스 서버에 웹 페이지 소재 리소스 획득 요청을 발송하는 단계와,
    상기 URL 주소를 상기 제 2 캐시 리스트에 추가하는 단계를 더 포함하는 것을 특징으로하는
    주소 필터링 방법.
  7. 제1항에 있어서,
    상기 주소 캐시 리스트는, 상기 소정의 매칭 알고리즘에 의한 매칭 연산에 의해 필터링할 필요가 있는 URL 주소를 저장하는 제1 캐시 리스트 및 상기 소정의 매칭 알고리즘에 의한 매칭 연산에 의해 필터링할 필요가 없는 URL 주소를 저장하는 제 2 캐시 리스트를 포함하고,
    상기 주소 캐시 리스트에 상기 URL 주소가 저장되어 있는지 여부를 검색하는 단계는,
    상기 제 1 캐시 리스트에 상기 URL 주소가 저장되어 있는지 여부를 검출하는 단계와,
    상기 제 1 캐시 리스트에 상기 URL 주소가 저장되어 있지 않은 경우, 상기 제 2 캐시 리스트에 상기 URL 주소가 저장되어 있는지 여부를 검출하는 단계와,
    상기 제 2 캐시 리스트에 상기 URL 주소가 저장되어 있지 않은 경우, 상기 소정의 매칭 알고리즘에 의해 상기 URL 주소가 필터링할 필요가 있는 URL 주소인지 여부를 판정하도록 상기 URL 주소에 대해 매칭 연산을 수행하는 단계를 포함하고,
    상기 방법은,
    상기 소정의 매칭 알고리즘에 의해 상기 URL 주소가 상기 필터링할 필요가 있는 URL 주소로 판정되는 경우, 상기 URL 주소를 필터링하고, 상기 URL 주소를 상기 제 1 캐시 리스트에 추가하는 단계와,
    상기 소정의 매칭 알고리즘에 의해 상기 URL 주소가 상기 필터링할 필요가 없는 URL 주소로 판정되는 경우, 상기 URL 주소에 의해 웹 페이지 리소스 서버에 웹 페이지 소재 리소스 획득 요청을 발송하고, 상기 URL 주소를 상기 제 2 캐시 리스트에 추가하는 단계를 더 포함하는 것을 특징으로하는
    주소 필터링 방법.
  8. 삭제
  9. 제1항, 제2항, 제5항, 제6항, 제7항 중 어느 한 항에 있어서,
    상기 주소 캐시 리스트에 상기 URL 주소가 저장되어 있는 경우, 상기 주소 캐시 리스트의 기록에 의해 상기 URL 주소를 직접 필터링하거나, 또는 상기 URL 주소에 의해 웹 페이지 리소스 서버에 상기 웹 페이지 소재 리소스 획득 요청을 발송하는 단계를 더 포함하는 것을 특징으로 하는
    주소 필터링 방법.
  10. 주소 캐시 리스트에 의해 클라이언트 액세스 습관을 분석하고, 상기 클라이언트 액세스 습관 및 기타 클라이언트가 발송한 상기 주소 캐시 리스트에 의해 업데이트 정보를 생성하는 서버에 상기 주소 캐시 리스트를 발송하는 리스트 발송 모듈과,
    상기 업데이트 정보를 수신하고, 상기 업데이트 정보에 의해 상기 주소 캐시 리스트를 업데이트하는 수신 모듈과,
    웹 페이지 소재 리소스에 대응되는 URL 주소를 획득하는 제 1 획득 모듈과,
    상기 주소 캐시 리스트에 상기 URL 주소가 저장되어 있는지 여부를 검색하는 검색 모듈과,
    상기 주소 캐시 리스트에 상기 URL 주소가 저장되어 있지 않은 경우, 소정의 매칭 알고리즘에 의해 상기 URL 주소가 필터링할 필요가 있는 URL 주소인지 여부를 판정하도록 상기 URL 주소에 대해 매칭 연산을 수행하는 매칭 모듈을 포함하고,
    상기 웹 페이지 소재 리소스에는 사진 리소스, 음성 리소스, 동영상 리소스 및 문자 리소스 중 적어도 하나가 포함되고,
    상기 주소 캐시 리스트는 상기 소정의 매칭 알고리즘에 의해 매칭된 URL 주소를 저장하는 것을 특징으로 하는
    주소 필터링 장치.
  11. 제10항에 있어서,
    상기 제 1 획득 모듈은,
    웹 페이지 리소스 서버에 웹 페이지 액세스 요청을 발송하는 요청 발송 서브 모듈과,
    상기 웹 페이지 리소스 서버가 발송한 웹 페이지 코드를 수신하는 코드 수신 서브 모듈과,
    웹 페이지 코드에 포함된 상기 웹 페이지 소재 리소스의 URL 주소를 획득하는 획득 서브 모듈을 포함하고,
    상기 웹 페이지 액세스 요청은 상기 웹 페이지의 웹 주소를 구비하고, 상기 웹 페이지 리소스 서버는 상기 웹 주소에 의해 상기 웹 페이지에 대응되는 상기 웹 페이지 코드를 검색하고,
    상기 웹 페이지 코드는 적어도 하나의 상기 웹 페이지 소재 리소스에 대응되는 URL 주소를 포함하는 것을 특징으로하는
    주소 필터링 장치.
  12. 삭제
  13. 삭제
  14. 제10항에 있어서,
    상기 주소 캐시 리스트는, 상기 소정의 매칭 알고리즘에 의한 매칭 연산에 의해 필터링할 필요가 있는 URL 주소를 저장하는 제1 캐시 리스트를 포함하고,
    상기 장치는,
    상기 소정의 매칭 알고리즘에 의해 상기 URL 주소가 상기 필터링할 필요가 있는 URL 주소로 검출되면 상기 URL 주소를 필터링하는 제 1 필터링 모듈과,
    상기 URL 주소를 상기 제 1 캐시 리스트에 추가하는 제 1 추가 모듈을 더 포함하는 것을 특징으로하는
    주소 필터링 장치.
  15. 제10항에 있어서,
    상기 주소 캐시 리스트는, 상기 소정의 매칭 알고리즘에 의한 매칭 연산에 의해 필터링할 필요가 없는 URL 주소를 저장하는 제 2 캐시 리스트를 포함하고,
    상기 장치는,
    상기 소정의 매칭 알고리즘에 의해 상기 URL 주소가 상기 필터링할 필요가 없는 URL 주소로 검출되면 상기 URL 주소에 의해 웹 페이지 리소스 서버에 웹 페이지 소재 리소스 획득 요청을 발송하는 제 1 발송 모듈과,
    상기 URL 주소를 상기 제 2 캐시 리스트에 추가하는 제 2 추가 모듈을 더 포함하는 것을 특징으로하는
    주소 필터링 장치.
  16. 제10항에 있어서,
    상기 주소 캐시 리스트는, 상기 소정의 매칭 알고리즘에 의한 매칭 연산에 의해 필터링할 필요가 있는 URL 주소를 저장하는 제1 캐시 리스트 및 상기 소정의 매칭 알고리즘에 의한 매칭 연산에 의해 필터링할 필요가 없는 URL 주소를 저장하는 제 2 캐시 리스트를 포함하고,
    상기 검색 모듈은,
    상기 제 1 캐시 리스트에 상기 URL 주소가 저장되어 있는지 여부를 검출하는 제 1 검출 서브 모듈과,
    상기 제 1 캐시 리스트에 상기 URL 주소가 저장되어 있지 않은 경우, 상기 제 2 캐시 리스트에 상기 URL 주소가 저장되어 있는지 여부를 검출하는 제 2 검출 서브 모듈을 포함하고,
    상기 제 2 검출 서브 모듈은 상기 제 2 캐시 리스트에 상기 URL 주소가 저장되어 있지 않은 경우, 상기 소정의 매칭 알고리즘에 의해 상기 URL 주소가 필터링할 필요가 있는 URL 주소인지 여부를 판정하도록 상기 URL 주소에 대해 매칭 연산을 수행하도록 또한 구성되고,
    상기 장치는,
    상기 소정의 매칭 알고리즘에 의해 상기 URL 주소가 상기 필터링할 필요가 있는 URL 주소로 판정되는 경우, 상기 URL 주소를 필터링하고, 상기 URL 주소를 상기 제 1 캐시 리스트에 추가하는 제 2 필터링 모듈과,
    상기 소정의 매칭 알고리즘에 의해 상기 URL 주소가 상기 필터링할 필요가 없는 URL 주소로 판정되는 경우, 상기 URL 주소에 의해 웹 페이지 리소스 서버에 웹 페이지 소재 리소스 획득 요청을 발송하고, 상기 URL 주소를 상기 제 2 캐시 리스트에 추가하는 제 2 발송 모듈을 더 포함하는 것을 특징으로하는
    주소 필터링 장치.
  17. 삭제
  18. 제10항, 제11항, 제14항, 제15항, 제16항 중 어느 한 항에 있어서,
    상기 주소 캐시 리스트에 상기 URL 주소가 저장되어 있는 경우, 상기 주소 캐시 리스트의 기록에 의해 상기 URL 주소를 직접 필터링하거나, 또는 상기 URL 주소에 의해 웹 페이지 리소스 서버에 상기 웹 페이지 소재 리소스 획득 요청을 발송하는 제 3 필터링 모듈을 더 포함하는 것을 특징으로 하는
    주소 필터링 장치.
  19. 프로세서와,
    상기 프로세서에 의해 실행 가능한 명령을 저장하는 메모리를 포함하고,
    상기 프로세서는,
    주소 캐시 리스트에 의해 클라이언트 액세스 습관을 분석하고, 상기 클라이언트 액세스 습관 및 기타 클라이언트가 발송한 상기 주소 캐시 리스트에 의해 업데이트 정보를 생성하는 서버에 상기 주소 캐시 리스트를 발송하고,
    상기 업데이트 정보를 수신하고, 상기 업데이트 정보에 의해 상기 주소 캐시 리스트를 업데이트하고,
    웹 페이지 소재 리소스에 대응되는 URL 주소를 획득하고,
    상기 주소 캐시 리스트에 상기 URL 주소가 저장되어 있는지 여부를 검색하고,
    상기 주소 캐시 리스트에 상기 URL 주소가 저장되어 있지 않은 경우, 소정의 매칭 알고리즘에 의해 상기 URL 주소가 필터링할 필요가 있는 URL 주소인지 여부를 판정하도록 상기 URL 주소에 대해 매칭 연산을 수행하도록 구성되며,
    상기 웹 페이지 소재 리소스에는 사진 리소스, 음성 리소스, 동영상 리소스 및 문자 리소스 중 적어도 하나가 포함되고,
    상기 주소 캐시 리스트는 상기 소정의 매칭 알고리즘에 의해 매칭된 URL 주소를 저장하는 것을 특징으로 하는
    주소 필터링 장치.
  20. 프로세서에 의해 실행되는 것을 통하여 청구항 1, 2, 5, 6, 7 중 어느 한 항에 기재된 주소 필터링 방법을 실현하는 것을 특징으로 하는 기록매체에 기록된 프로그램.
  21. 청구항 20에 기재된 프로그램이 기록된 기록매체.
KR1020157031176A 2015-02-13 2015-08-31 주소 필터링 방법, 장치, 프로그램 및 기록매체 KR101777035B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201510079200.5 2015-02-13
CN201510079200.5A CN104683496B (zh) 2015-02-13 2015-02-13 地址过滤方法及装置
PCT/CN2015/088632 WO2016127625A1 (zh) 2015-02-13 2015-08-31 地址过滤方法及装置

Publications (2)

Publication Number Publication Date
KR20160110064A KR20160110064A (ko) 2016-09-21
KR101777035B1 true KR101777035B1 (ko) 2017-09-19

Family

ID=53318060

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020157031176A KR101777035B1 (ko) 2015-02-13 2015-08-31 주소 필터링 방법, 장치, 프로그램 및 기록매체

Country Status (9)

Country Link
US (1) US20160241674A1 (ko)
EP (1) EP3057006A1 (ko)
JP (1) JP6302098B2 (ko)
KR (1) KR101777035B1 (ko)
CN (1) CN104683496B (ko)
BR (1) BR112015028941A2 (ko)
MX (1) MX357349B (ko)
RU (1) RU2630746C2 (ko)
WO (1) WO2016127625A1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104683496B (zh) * 2015-02-13 2018-06-19 小米通讯技术有限公司 地址过滤方法及装置
CN107888981B (zh) * 2017-11-16 2020-12-18 北京小米移动软件有限公司 音视频预加载方法、装置、设备及存储介质
CN110825987B (zh) * 2019-11-07 2023-06-23 北京博睿宏远数据科技股份有限公司 一种流媒体资源地址获取方法、装置、设备和存储介质
CN112861030B (zh) * 2019-11-27 2024-04-05 北京金山云网络技术有限公司 Cdn的刷新方法和装置、缓存服务器以及存储介质
CN112286592A (zh) * 2020-10-29 2021-01-29 平安普惠企业管理有限公司 资源数据的加载方法及装置、存储介质、计算机设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080086555A1 (en) * 2006-10-09 2008-04-10 David Alexander Feinleib System and Method for Search and Web Spam Filtering
GB2445764A (en) * 2007-01-22 2008-07-23 Surfcontrol Plc Resource access filtering system and database structure for use therewith
JP2011086086A (ja) * 2009-10-15 2011-04-28 Nec Access Technica Ltd コンテンツフィルタリングシステム、コンテンツフィルタリング方法及びゲートウェイ

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5822759A (en) * 1996-11-22 1998-10-13 Versant Object Technology Cache system
US7194464B2 (en) * 2001-12-07 2007-03-20 Websense, Inc. System and method for adapting an internet filter
CN100339845C (zh) * 2002-08-15 2007-09-26 联想网御科技(北京)有限公司 基于状态检测的链路层统一资源定位符过滤的方法
US8849838B2 (en) * 2008-01-15 2014-09-30 Google Inc. Bloom filter for storing file access history
JP4939562B2 (ja) * 2009-03-19 2012-05-30 ヤフー株式会社 Webサーバ、広告再表示方法
US20120016897A1 (en) * 2010-07-16 2012-01-19 Altruik, Inc. System and method for improving webpage indexing and optimization
JP5723306B2 (ja) * 2012-02-22 2015-05-27 日本電信電話株式会社 フィルタリング装置、および、フィルタリング方法
CN103838728B (zh) * 2012-11-21 2018-01-09 腾讯科技(深圳)有限公司 网页信息的处理方法及浏览器
CN103428196B (zh) * 2012-12-27 2016-08-03 北京安天电子设备有限公司 一种基于url白名单的web应用入侵检测方法
CN104021126B (zh) * 2013-02-28 2020-02-07 深圳市世纪光速信息技术有限公司 网页内容的过滤方法及服务器
CN103544316B (zh) * 2013-11-06 2017-02-08 苏州大拿信息技术有限公司 Url过滤的***及其实现方法
CN104144170A (zh) * 2014-08-25 2014-11-12 网神信息技术(北京)股份有限公司 网页地址的过滤方法、装置和***
CN104683496B (zh) * 2015-02-13 2018-06-19 小米通讯技术有限公司 地址过滤方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080086555A1 (en) * 2006-10-09 2008-04-10 David Alexander Feinleib System and Method for Search and Web Spam Filtering
GB2445764A (en) * 2007-01-22 2008-07-23 Surfcontrol Plc Resource access filtering system and database structure for use therewith
JP2011086086A (ja) * 2009-10-15 2011-04-28 Nec Access Technica Ltd コンテンツフィルタリングシステム、コンテンツフィルタリング方法及びゲートウェイ

Also Published As

Publication number Publication date
JP6302098B2 (ja) 2018-03-28
KR20160110064A (ko) 2016-09-21
RU2015147593A (ru) 2017-05-11
BR112015028941A2 (pt) 2017-07-25
WO2016127625A1 (zh) 2016-08-18
MX2015015404A (es) 2017-03-15
RU2630746C2 (ru) 2017-09-12
CN104683496A (zh) 2015-06-03
JP2017511556A (ja) 2017-04-20
MX357349B (es) 2018-07-05
US20160241674A1 (en) 2016-08-18
EP3057006A1 (en) 2016-08-17
CN104683496B (zh) 2018-06-19

Similar Documents

Publication Publication Date Title
JP6062608B2 (ja) ウェブページアクセス方法、装置、サーバ、端末、プログラム、及び記録媒体
TWI528282B (zh) 用於自訂應用程式的啟動之方法
WO2021022689A1 (zh) 一种信息采集方法和装置
KR101777035B1 (ko) 주소 필터링 방법, 장치, 프로그램 및 기록매체
RU2604420C2 (ru) Способ, устройство и терминал для обновления облегченных приложений в офлайновом режиме
US9672026B2 (en) Light app offline updating method, device and terminal
JP2016522483A (ja) ページロールバック制御方法、ページロールバック制御装置、端末、プログラム及び記録媒体
KR20130142642A (ko) 이동 단말기, 서버, 시스템, 이동 단말기 및 서버의 제어 방법
KR101926736B1 (ko) 자원 검색 방법, 장치, 프로그램 및 기록매체
CN117390330A (zh) 网页访问方法及装置
CN112711723B (zh) 一种恶意网址检测方法、装置及电子设备
RU2606305C2 (ru) Способ и устройство для совместного использования ресурсов
CN112528185A (zh) 评论信息展示方法、装置、服务器、终端
US20160006787A1 (en) Methods and devices for visiting a webpage
CN104050236B (zh) 网站内容更新提示方法、服务器和客户端
JP6239188B2 (ja) 情報フィルタリング方法、装置、プログラム及び記録媒体
CN107491453B (zh) 一种识别作弊网页的方法及装置
CN110020082B (zh) 一种搜索方法及装置
CN108268507B (zh) 一种基于浏览器的处理方法、装置及电子设备
CN105956202A (zh) 浏览器中的网页显示方法、装置及终端
CN109766501B (zh) 爬虫协议管理方法及装置、爬虫***
CN104991901A (zh) 网页访问方法和装置
CN110020244B (zh) 一种对网址信息进行纠错的方法及装置
CN110069667B (zh) 一种搜索方法、装置以及用于搜索的装置
JP2013065230A (ja) 情報処理装置、情報処理方法およびプログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant