CN107404671A - 电影内容特征获取***及应用*** - Google Patents

电影内容特征获取***及应用*** Download PDF

Info

Publication number
CN107404671A
CN107404671A CN201710443803.8A CN201710443803A CN107404671A CN 107404671 A CN107404671 A CN 107404671A CN 201710443803 A CN201710443803 A CN 201710443803A CN 107404671 A CN107404671 A CN 107404671A
Authority
CN
China
Prior art keywords
data
film
information
team
playwright
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710443803.8A
Other languages
English (en)
Inventor
刘杉
柴剑平
范馨怡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Communication University of China
Original Assignee
Communication University of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Communication University of China filed Critical Communication University of China
Priority to CN201710443803.8A priority Critical patent/CN107404671A/zh
Publication of CN107404671A publication Critical patent/CN107404671A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8126Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts
    • H04N21/8133Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts specifically related to the content, e.g. biography of the actors in a movie, detailed information about an article seen in a video program
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Physics & Mathematics (AREA)
  • Finance (AREA)
  • Multimedia (AREA)
  • Accounting & Taxation (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Tourism & Hospitality (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Game Theory and Decision Science (AREA)
  • Library & Information Science (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了电影内容特征获取***及应用***,将电影数据共分为8个级别,包括电影基本信息、电影用户数据、电影拍摄信息、电影制作团队、导演、编剧、演员基本信息、电影IP影响力,共涉及采集指标600余个,针对电影数据内容的研究,将人工和自动相结合,通过对电影数据内容特征的定义和获取,帮助分析和提升电影整体影片质量,可以为制片方选择电影团队提供参考,为影片的宣传营销提供依据和策略,同时,开发电影数据内容特征的应用***,对帮助电影决策,提升影片整体质量、制作团队、票房等都有着至关重要的作用。

Description

电影内容特征获取***及应用***
技术领域
本发明涉及电影内容特征提取技术领域,具体地,涉及电影内容特征提取***及应用***。
背景技术
中国是全球第二大电影市场,同时也是增长最快的市场之一。随着电影产量的增加和票房容量的扩大,全国各地的影院建设也进行的如火如荼。影院数量和银幕数量的***性增长为电影市场的发展奠定了良好的基础建设条件。
在“互联网+”的时代观影用户的行为数据如依托行业可较易获取,但仅仅依靠用户行为数据来尝试内容创意指导、后期制作和营销还远远不够。电影内容的数据能体现作品的丰富特征,蕴含大量电影基本信息、电影团队成员、导演基本信息、编剧基本信息、演员基本信息、电影IP影响力、电影票房等语义信息,更是电影大数据的金矿。通过对电影全息数据的研究分析和***的构建,对帮助电影决策,提升影片整体质量、制作团队、票房等都有着十分重要的意义和作用。
发明内容
本发明的目的在于,针对上述问题,提出一种电影内容特征获取***,帮助电影决策,提升影片整体质量、制作团队、票房。
为实现上述目的,本发明采用的技术方案是:一种电影内容特征获取***,主要包括:
标签管理***和电影管理***,所述标签管理***和电影管理***通过网络接口连接,其特征在于,所述标签管理***包括数据获取模块和标签提取模块,所述数据获取模块获取电影内容信息,所述标签提取模块提取电影内容标签,标引标签,将标签与电影关联后存入标签库;
所述提取电影内容标签具体为,首先将电影内容数据按照电影基本信息数据、电影用户数据、电影拍摄信息数据、电影制作团队数据、导演基本信息数据、编剧基本信息数据、演员基本信息数据、电影IP影响力数据和其他数据内容进行级别划分,而后按照各级划分内容对电影内容进行详细的数据采集,形成数据采集标签。
进一步地,所述电影基本信息数据用于对电影内容进行综合分析,并得出电影成功的关键要素;
按照电影基本信息数据进行详细的数据采集,具体包括采集电影名称信息数据、电影英文名数据、电影名拼音数据、更多片名数据、原著数据、IP类型数据、导演数据、编剧数据、主演数据、电影类型数据、电影评级数据、电影票房数据、电影专资办数据、剧情简介数据、色彩数据、IMDB编码、获奖情况数据、发行日期数据、国家/地区数据、时长数据、联合出品数据、制作数据、出品人数据和联合出品人数据。
进一步地,根据电影用户数据对电影的宣传营销提供数据支持,按照电影用户数据进行详细的数据采集,具体包括采集用户个人信息特征数据和用户内容特征数据,所述用户个人信息特征数据包括***用户ID数据、用户名数据、用户年龄数据、用户性别数据、地域数据、星座数据和个人介绍数据;
所述用户内容特征数据包括IMDB评分数据、IMDB评分人数以及各网站的评分及评分人数、各电影网站的票房统计数据、各网站的搜索指数以及各网站用户对电影内容的评论数据。
进一步地,通过采集的电影拍摄信息数据,为新电影拍摄指导提供数据支持;
按照电影拍摄信息数据进行详细的数据采集,具体包括采集图像元素数据、声音序列数据、男一号主角数据、女一号主角数据、电影高潮数据、镜头分割获取数据和分镜头数据,并按照上述划分内容进行详细的数据采集,形成多个对应的数据采集标签。
进一步地,通过对电影制作团队数据进行采集,为构建制片团队库,并向制片方推荐参与过相似影片的制作团队提供数据支持;
根据电影制作团队数据进行详细的数据采集,具体包括采集演员组数据、导演组数据、制片组数据、编剧和剧本组数据、策划监制组数据、策划监制组数据、制作组数据、场记统筹和剧务场务组数据、艺术组数据、摄影组数据、灯光组数据、化妆组数据、服装道具组数据、后期剪辑合成组数据、特效动画数据、字幕组数据、武术动作数据、音乐制作数据、声音制作数据、数字中间片数据、出品团队数据、海报设计和赞助鸣谢数据、模型材质数据和绑定组数据、预告片、花絮及片头片尾动画数据,以及其他数据。
进一步地,通过对导演基本信息数据进行采集,对导演参与过相似影片进行综合分析,为制片方推荐相关的优秀导演提供数据支持;
按照导演基本信息数据进行详细的数据采集,具体包括采集片名信息、导演中文名信息、外文名信息、别名信息、个人简介信息、全部影片目录信息、代表目录信息、代表作品信息、主要奖项信息、出生日期信息、出生地信息、籍贯信息、国籍信息、民族信息、血型信息、身高信息、体重信息、星座信息、经纪公司信息、职业信息、毕业院校信息、婚姻状况信息、配偶信息和家庭孩子信息;
通过对编剧基本信息数据进行采集,根据采集的信息构建编剧库,为制片方挑选编剧提供参考;
按照信息数据进行详细的数据采集,具体包括采集编剧参与的电影片名信息、编剧中文名信息、外文名信息和别名信息,编剧的个人简介信息、编剧作品目录信息、代表作品信息、主要奖项信息、编剧出生日期、出生地、籍贯、国籍、民族、血型、身高、体重和星座信息,编剧所在经纪公司信息、编剧的职业信息、毕业院校信息、婚姻状况信息、配偶信息和孩子信息;
根据采集的演员基本信息数据,构建艺人电影标签库,向制片方推荐参与过相似影片的演员;
根据电影制作团队数据进行详细的数据采集,具体包括采集演员的个人简介信息、演员作品目录信息、代表作品信息、主要奖项信息、演员出生日期、出生地、籍贯、国籍、民族、血型、身高、体重和星座信息,演员所在经纪公司信息、演员的职业信息、毕业院校信息、婚姻状况信息、配偶信息和孩子信息。
进一步地,通过对采集的电影IP影响力数据进行分析,得到原著小说的热度分析结果,对剧本选择提供指导数据支持;
按照电影IP影响力数据进行详细的数据采集,具体包括采集电影名信息、电影原著信息、原著作者信息、电影类型信息、各网站的评分信息、电影票房信息、话题度信息、最高搜索指数信息和评价信息。
包括所述获取***的应用***,还包括后台管理模块和标签数据分析应用模块,所述后台管理模块对用户、消息、内容和标签进行管理,所述标签数据分析应用模块包括剧本筛选模块、影片分析模块、受众分析模块、团队选择模块和题材选择模块,所述剧本筛选模块根据所述获取***获取的与剧本内容相关的数据采集标签与海量剧本故事梗概进行匹配,进行初步筛选,再将剧本人物性格和情节套路、故事核与已有模型进行比对,进行细致筛选;
所述影片分析模块,根据标签库的内容,分析相似度较高的优质影片信息,帮助投资方进行电影的后期宣传营销;为制片方提供若干部和待进行的电影项目有相似剧本元素的同类型影片,对剧本进行对比分析和修改,最终获得更优方案;
所述受众分析模块,根据标签库的受众年龄、性别、地域分布进行广告投放和后期营销,并且对用户的新鲜感和满意度进行分析,可帮助投资方进行影片投放选择;
所述团队选择模块,通过标签库中演员的标签信息,向制片方推荐参与过相似影片的演员;构建制片团队库,向制片方推荐参与过相似影片的制作团队,选择优秀的电影团队参与电影创作;
所述题材选择模块,根据标签库的数据采集标签内容,对电影进行分析,得到市场流行度高的电影题材。
获取的***中的标签库,将数据采集标签内容进行存储,具体包括,
存储电影用户数据用户信息的用户个人信息表,所述用户个人信息表以***用户分配的 ID为主键作为索引;
电影内容数据指标分类表,对各级分类名进行存储,以分类ID作为主键作为索引;
导演信息表,存储导演基本信息数据,以导演ID作为主键作为索引;
演员信息表,存储演员基本信息,以主演ID作为主键作为索引;
编剧信息表,存储编剧基本信息,以编剧ID作为主键作为索引;
所述电影团队成员数据和电影拍摄信息数据以电影ID为主键作为索引。
本发明各实施例的电影数据内容特征获取及应用***,将电影数据共分为8个级别,包括电影基本信息、电影用户数据、电影拍摄信息、电影制作团队、导演、编剧、演员基本信息、电影IP影响力,共涉及采集指标600余个。针对电影数据内容的研究,将人工和自动相结合,采集的电影来源于自2001年至今中国电影发行放映协会数据中心的5000余部国内上映电影,目前已人工录入200部电影进行电影全息内容数据的提取和分析。开发电影数据内容特征的应用***,对帮助电影决策,提升影片整体质量、制作团队、票房等都有着至关重要的作用。过对电影数据内容特征的定义和获取,帮助分析和提升电影整体影片质量,可以为制片方选择电影团队提供参考,为影片的宣传营销提供依据和策略。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例所述的包括电影内容特征获取***的应用***架构图;
图2为本发明实施例所述的电影内容数据分类方法图;
图3为本发明实施例所述的电影基本信息内容特征图;
图4为本发明实施例所述的用户个人信息特征图;
图5为本发明实施例所述的用户数据内容特征图;
图6为本发明实施例所述的电影拍摄信息内容特征图;
图7为本发明实施例所述的导演基本信息内容特征图;
图8为本发明实施例所述的编剧基本信息内容特征图;
图9为本发明实施例所述的主演基本信息内容特征图;
图10为本发明实施例所述的电影IP分析内容特征图;
图11为本发明实施例所述的用户个人信息图;
图12为本发明实施例所述的电影内容数据指标分类图;
图13为本发明实施例所述的导演信息表图;
图14为本发明实施例所述的主演信息图;
图15为本发明实施例所述的编剧信息图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
本发明的目的通过对电影数据内容特征的定义和获取,帮助分析和提升电影整体影片质量,可以为制片方选择电影团队提供参考,为影片的宣传营销提供依据和策略。
本发明是一个电影数据内容特征获取及应用***,将电影数据共分为九个级别,包括电影基本信息、电影用户数据、电影拍摄信息、电影制作团队、导演、编剧、演员基本信息、电影IP影响力和其他,每个级别下细分电影数据采集组别,共涉及采集指标600余个。为实现电影全息数据的存储和分析,设计了适用于电影数据录入和存储的数据库结构.
结合图1,电影内容特征获取***,包括标签管理***和电影管理***,所述标签管理***和电影管理***通过网络接口连接,其特征在于,所述标签管理***包括数据获取模块和标签提取模块,所述数据获取模块获取电影内容信息,所述标签提取模块提取电影内容标签,标引标签,将标签与电影关联后存入标签库;
所述提取电影内容标签具体为,首先将电影内容数据按照电影基本信息数据、电影用户数据、电影拍摄信息数据、电影制作团队数据、导演基本信息数据、编剧基本信息数据、演员基本信息数据、电影IP影响力数据和其他数据内容进行级别划分,而后按照各级划分内容对电影内容进行详细的数据采集,形成数据采集标签。
还包括后台管理模块和标签数据分析应用模块,所述后台管理模块对用户、消息、内容和标签进行管理,所述标签数据分析应用模块包括剧本筛选模块、影片分析模块、受众分析模块、团队选择模块和题材选择模块,所述剧本筛选模块根据所述获取***获取的与剧本内容相关的数据采集标签与海量剧本故事梗概进行匹配,进行初步筛选,再将剧本人物性格和情节套路、故事核与已有模型进行比对,进行细致筛选;
所述影片分析模块,根据标签库的内容,分析相似度较高的优质影片信息,帮助投资方进行电影的后期宣传营销;为制片方提供若干部和待进行的电影项目有相似剧本元素的同类型影片,对剧本进行对比分析和修改,最终获得更优方案;
所述受众分析模块,根据标签库的受众年龄、性别、地域分布进行广告投放和后期营销,并且对用户的新鲜感和满意度进行分析,可帮助投资方进行影片投放选择;
所述团队选择模块,通过标签库中演员的标签信息,向制片方推荐参与过相似影片的演员;构建制片团队库,向制片方推荐参与过相似影片的制作团队,选择优秀的电影团队参与电影创作;
所述题材选择模块,根据标签库的数据采集标签内容,对电影进行分析,得到市场流行度高的电影题材。
结合附图2的电影数据分类方法图,对采集的电影内容获取的数据具体介绍如下:
一、电影基本信息
电影基本信息包括电影类型、评级、出品、发行、票房等近三十个指标,其中数据定义的具体信息,如图3所示,通过电影基本信息的获取,可以对电影各个方面进行综合分析,得到电影成功的关键要素
二、用户数据
用户数据分为两部分:第一部分如图4所示为用户的个人信息特征,用包括用户性别、地域、年龄等数据;第二部分如图5所示为用户数据内容特征表,包括IMDB、 1905网站、时光网、豆瓣网、猫眼票房、百度指数、微博平台的电影口碑和评分等四十多个指标。通过分析用户对电影的口碑、评价、热度等可以为电影的宣传营销提供依据和帮助。
三、电影拍摄信息
通过对电影拍摄过程中各类数据的获取和分析,我们可以通过对优秀电影中各参数的分析,为新电影的拍摄提供指导。图6为需要采集电影拍摄信息具体的内容特征。
图6,电影拍摄信息数据,为新电影拍摄指导提供数据支持,按照电影拍摄信息数据进行详细的数据采集,具体包括采集图像元素数据、声音序列数据、男一号主角数据、女一号主角数据、电影高潮数据、镜头分割获取数据和分镜头数据,并按照上述划分内容进行详细的数据采集,形成多个对应的数据采集标签
对图像元素数据进行详细的数据采集,具体包括采集画面色彩数据、节奏数据、运动路径数据、亮度值数据、单帧红色分量数据、单帧绿色分量数据、单帧蓝色分量数据、单帧均方差数据、单帧信息熵数据、单帧梯度值数据、纹理数据四项数据和边缘数据;
对声音序列数据进行详细的数据采集,包括采集时域数据输出数据、频域数据输出数据、声响数据、主频值数据、主频点数据、1/2中位数频点数据、1/4分位数频点数据、3/4分位数频点数据和均方差;
对男一号主角数据进行详细的数据采集,包括采集男主角首度出场时间点数据、男主角首度出场景别数据、男主角首度出场脸部色调数据、男主角首度出场背景色数据和男主角分镜统计数据;
对女一号主角数据进行详细的数据采集,包括采集女主角首度出场时间点数据、女主角首度出场景别数据、女主角首度出场脸部色调数据、女主角首度出场背景色数据和女主角分镜统计数据;
对电影高潮数据进行详细的数据采集,包括采集高潮时间段数据和色彩分布信息数据;
对镜头分割获取数据进行详细的数据采集,包括采集3D拍摄参数、时间轴位置数据、场景地理位置数据、时间、天气数据、环境数据、人物数据、动作数据和背景数据;
对分镜头数据进行详细的数据采集,包括采集镜头号、景别数据、摄法数据、画面内容数据、对话数据、镜头长度数据、音响效果数据和音乐数据。
四、电影团队成员
将电影团队成员分为25个组别,信息来源为电影片头片尾字幕,包涵近四百个标签。表1为对电影团队成员的分组和组内详情。
表1
电影团队成员组成中,演员组包括参加演出演员、联合主演、动作替身等十多个标签;导演组包括导演、助理、现场副导演、执行导演等近二十个标签;制片组包括电影制片人、总制片、制片人助理等十多个标签;编剧和剧本组包括剧本顾问、剧本绘制等;策划监制组包括总策划、联合策划等近十个标签;同时还分有制作组、场记、艺术组、特效动画组、后期剪辑合成组、服装道具组、化妆、美术、灯光、摄影组、字幕、武术组、音乐制作等组别,包涵近四百个标签。
通过对电影制作团队的成员获取,可以构建制片团队库,向制片方推荐参与过相似影片的制作团队。
五、导演基本信息
对导演基本信息包括个人简介、代表作、主要奖项、生日、籍贯等二十多个指标的获取,其中数据定义的具体信息如图7所示。
通过构建导演信息库,通过对导演参与过相似影片的综合分析,可以为制片方推荐相关的优秀导演。
六、演员基本信息
对演员基本信息包括个人简介、代表作、主要奖项、生日、籍贯等二十多个指标的获取,其中数据定义的具体信息如图9所示。
通过采集演员信息来构建艺人电影标签库,可以向制片方推荐参与过相似影片的演员。
七、编剧基本信息
对编剧基本信息包括个人简介、代表作、主要奖项、生日、籍贯等二十多个指标的获取,其中数据定义的具体信息如图8所示。
通过采集编剧信息来构建电影编剧库,可以为制片方挑选编剧提供参考。
八、电影IP分析
电影IP分析包括电影原著、作者、话题度、搜索指数等近二十个指标,其中数据定义的具体信息如图10所示。通过对电影IP的分析,我们可以通过对原著小说的热度分析来对剧本选择提供指导。
九、其他
其他为未来待扩充的、有价值的电影数据
对电影数据内容特征的应用可包括剧本筛选、影片分析、受众分析、电影制作团队选择、电影题材选择,来帮助电影决策,提升影片整体质量、制作团队、票房。图 1为电影数据内容特征获取及应用***的***架构图。
1.剧本筛选***的目的就是通过一个剧本评价体系,为剧本的初步筛选提供帮助,提高剧本筛选的效率。可通过对题材热度趋势、电影台词、故事情节、人物特点等电影相关因素进行研究来筛选剧本。在剧本筛选的过程中需要用到的一个重要技术就是要实现剧本机器阅读。机器在读剧本之前,需要懂剧本的人先去打标签,可从内在冲突、外在冲突、主人翁的确立、剧情矛盾性等几个方向“教”机器读剧本。挑选近3-5年100多部用于训练的剧本,较少考虑低成本的悬疑类、惊悚类电影。具体筛选流程如下:
对于用户需求的题材电影,我们从海量剧本中搜索出同题材的优质电影剧本库,将海量剧本的故事梗概与剧本库标签匹配进行初步筛选,再将剧本人物性格和情节套路、故事核与已有模型进行比对,进行细致筛选。
参考优秀电影的剧本,也可以为剧本修改提供参考。可根据三个方面对优秀电影剧本进行筛选:根据IMDB、时光网、豆瓣等知名电影网站评分,考虑电影的打分人数、平均分数和票房;根据电影主演、导演、编剧库中对其的综合评分排名;权威影评人、资深媒体人、电影学者等电影权威人士组成的专家评审团,对剧本进行全方位的打分。通过对优秀电影剧本筛选,对优秀电影的人员、剧本进行分析,可以为剧本选择提供参考。
2.影片分析***
分析相似度较高的优质影片的电影简介、平均票房、发行档期、主创人员等信息,帮助投资方进行电影的后期宣传营销。
将为制片方提供若干部和待进行的电影项目有相似剧本元素的同类型影片,对剧本进行对比分析和修改获得更优方案。
3.受众分析
根据受众年龄、性别、地域分布等进行广告投放和后期营销,并且对用户的新鲜感和满意度进行研究,可以帮助投资方进行影片投放选择。
4.电影团队选择
通过构建艺人电影标签库,向制片方推荐参与过相似影片的演员;构建制片团队库,向制片方推荐参与过相似影片的制作团队。选择优秀的电影团队参与电影创作,可以使电影的品质、经济效益、社会反应得到保障。
5.电影题材选择
通过对目前市场流行度高的电影题材进行拍摄可以更好的吸引观众,了解选择某个题材的意义和价值及会产生的经济和社会效果和回报。
a.构建标签库
构建不同题材的优质电影剧本库、近三年电影类型统计和相应票房统计。
b.编剧、原著评分
参考编剧得奖情况、优秀作品及受关注度进行综合排名,根据剧本原著的网络小说和动画的受关注度来判断题材内容的受欢迎度。
c.题材评分
根据剧本题材初步评分,并在同题材内进行剧本的评分。
d.影片情节、主角性格分析
对影片主角的性格特点和观众喜欢的情节套路进行收集和分析。
对电影的题材周期进行预测分析,可以预测和把握市场走向,提高电影的效益。对题材周期的把握,可以更好的指导电影剧本题材的选择。首先,建立题材库,构建不同题材的优质电影题材库(包括国内和国外的大量资源以及模型入库);分析题材流行度,对近三年电影类型和题材统计和分析(各题材受欢迎度及流行度);获得题材周期,通过统计微博等门户网站上电影票房和话题度持续时间及走势以得到相应题材周期;最后对题材周期进行预测分析和总结。同理对电影拍摄手法和制作方式等也可使用相同的手段。
至少可以达到以下有益效果:
1.电影数据内容特征的获取可以帮助分析和提升电影整体影片质量、帮助影片的宣传营销。为了全面的描述电影的内容特征,将电影全息数据共分为八个级别,每个级别下细分电影数据组别,定义和统计的指标共有600余个。
2.为实现电影数据的存储和分析,设计了适用于电影数据指标录入和存储的数据库结构。
3.对电影数据内容特征的应用包括剧本筛选、影片分析、受众分析、电影制作团队选择、电影题材选择,来帮助电影决策,提升影片整体质量、制作团队、票房等。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.电影内容特征获取***,包括标签管理***和电影管理***,所述标签管理***和电影管理***通过网络接口连接,其特征在于,所述标签管理***包括数据获取模块和标签提取模块,所述数据获取模块获取电影内容信息,所述标签提取模块提取电影内容标签,标引标签,将标签与电影关联后存入标签库;
所述提取电影内容标签具体为,首先将电影内容数据按照电影基本信息数据、电影用户数据、电影拍摄信息数据、电影制作团队数据、导演基本信息数据、编剧基本信息数据、演员基本信息数据、电影IP影响力数据和其他数据内容进行级别划分,而后按照各级划分内容对电影内容进行详细的数据采集,形成数据采集标签。
2.根据权利要求1所述的电影内容特征获取***,其特征在于,所述电影基本信息数据用于对电影内容进行综合分析,并得出电影成功的关键要素;
按照电影基本信息数据进行详细的数据采集,具体包括采集电影名称信息数据、电影英文名数据、电影名拼音数据、更多片名数据、原著数据、IP类型数据、导演数据、编剧数据、主演数据、电影类型数据、电影评级数据、电影票房数据、电影专资办数据、剧情简介数据、色彩数据、IMDB编码、获奖情况数据、发行日期数据、国家/地区数据、时长数据、联合出品数据、制作数据、出品人数据和联合出品人数据。
3.根据权利要求2所述的电影内容特征获取***,其特征在于,根据电影用户数据对电影的宣传营销提供数据支持,按照电影用户数据进行详细的数据采集,具体包括采集用户个人信息特征数据和用户内容特征数据,所述用户个人信息特征数据包括***用户ID数据、用户名数据、用户年龄数据、用户性别数据、地域数据、星座数据和个人介绍数据;
所述用户内容特征数据包括IMDB评分数据、IMDB评分人数以及各网站的评分及评分人数、各电影网站的票房统计数据、各网站的搜索指数以及各网站用户对电影内容的评论数据。
4.根据权利要求3所述的电影内容特征获取***,其特征在于,通过采集的电影拍摄信息数据,为新电影拍摄指导提供数据支持;
按照电影拍摄信息数据进行详细的数据采集,具体包括采集图像元素数据、声音序列数据、男一号主角数据、女一号主角数据、电影高潮数据、镜头分割获取数据和分镜头数据,并按照上述划分内容进行详细的数据采集,形成多个对应的数据采集标签。
5.根据权利要求4所述的电影内容特征获取***,其特征在于,通过对电影制作团队数据进行采集,为构建制片团队库,并向制片方推荐参与过相似影片的制作团队提供数据支持;
根据电影制作团队数据进行详细的数据采集,具体包括采集演员组数据、导演组数据、制片组数据、编剧和剧本组数据、策划监制组数据、策划监制组数据、制作组数据、场记统筹和剧务场务组数据、艺术组数据、摄影组数据、灯光组数据、化妆组数据、服装道具组数据、后期剪辑合成组数据、特效动画数据、字幕组数据、武术动作数据、音乐制作数据、声音制作数据、数字中间片数据、出品团队数据、海报设计和赞助鸣谢数据、模型材质数据和绑定组数据、预告片、花絮及片头片尾动画数据,以及其他数据。
6.根据权利要求5所述的电影内容特征获取***,其特征在于,通过对导演基本信息数据进行采集,对导演参与过相似影片进行综合分析,为制片方推荐相关的优秀导演提供数据支持;
按照导演基本信息数据进行详细的数据采集,具体包括采集片名信息、导演中文名信息、外文名信息、别名信息、个人简介信息、全部影片目录信息、代表目录信息、代表作品信息、主要奖项信息、出生日期信息、出生地信息、籍贯信息、国籍信息、民族信息、血型信息、身高信息、体重信息、星座信息、经纪公司信息、职业信息、毕业院校信息、婚姻状况信息、配偶信息和家庭孩子信息;
通过对编剧基本信息数据进行采集,根据采集的信息构建编剧库,为制片方挑选编剧提供参考;
按照信息数据进行详细的数据采集,具体包括采集编剧参与的电影片名信息、编剧中文名信息、外文名信息和别名信息,编剧的个人简介信息、编剧作品目录信息、代表作品信息、主要奖项信息、编剧出生日期、出生地、籍贯、国籍、民族、血型、身高、体重和星座信息,编剧所在经纪公司信息、编剧的职业信息、毕业院校信息、婚姻状况信息、配偶信息和孩子信息;
根据采集的演员基本信息数据,构建艺人电影标签库,向制片方推荐参与过相似影片的演员;
根据电影制作团队数据进行详细的数据采集,具体包括采集演员的个人简介信息、演员作品目录信息、代表作品信息、主要奖项信息、演员出生日期、出生地、籍贯、国籍、民族、血型、身高、体重和星座信息,演员所在经纪公司信息、演员的职业信息、毕业院校信息、婚姻状况信息、配偶信息和孩子信息。
7.根据权利要求6所述的电影内容特征获取***,其特征在于,通过对采集的电影IP影响力数据进行分析,得到原著小说的热度分析结果,对剧本选择提供指导数据支持;
按照电影IP影响力数据进行详细的数据采集,具体包括采集电影名信息、电影原著信息、原著作者信息、电影类型信息、各网站的评分信息、电影票房信息、话题度信息、最高搜索指数信息和评价信息。
8.包括权利要求1-7任一项所述获取***的应用***,其特征在于,还包括后台管理模块和标签数据分析应用模块,所述后台管理模块对用户、消息、内容和标签进行管理,所述标签数据分析应用模块包括剧本筛选模块、影片分析模块、受众分析模块、团队选择模块和题材选择模块,所述剧本筛选模块根据所述获取***获取的与剧本内容相关的数据采集标签与海量剧本故事梗概进行匹配,进行初步筛选,再将剧本人物性格和情节套路、故事核与已有模型进行比对,进行细致筛选;
所述影片分析模块,根据标签库的内容,分析相似度较高的优质影片信息,帮助投资方进行电影的后期宣传营销;为制片方提供若干部和待进行的电影项目有相似剧本元素的同类型影片,对剧本进行对比分析和修改,最终获得更优方案;
所述受众分析模块,根据标签库的受众年龄、性别、地域分布进行广告投放和后期营销,并且对用户的新鲜感和满意度进行分析,可帮助投资方进行影片投放选择;所述团队选择模块,通过标签库中演员的标签信息,向制片方推荐参与过相似影片的演员;构建制片团队库,向制片方推荐参与过相似影片的制作团队,选择优秀的电影团队参与电影创作;
所述题材选择模块,根据标签库的数据采集标签内容,对电影进行分析,得到市场流行度高的电影题材。
9.一种权利要求1-7任一项所述获取的***中的标签库,其特征在于,将数据采集标签内容进行存储,具体包括,
存储电影用户数据用户信息的用户个人信息表,所述用户个人信息表以***用户分配的ID为主键作为索引;
电影内容数据指标分类表,对各级分类名进行存储,以分类ID作为主键作为索引;
导演信息表,存储导演基本信息数据,以导演ID作为主键作为索引;
演员信息表,存储演员基本信息,以主演ID作为主键作为索引;
编剧信息表,存储编剧基本信息,以编剧ID作为主键作为索引;
所述电影团队成员数据和电影拍摄信息数据以电影ID为主键作为索引。
CN201710443803.8A 2017-06-13 2017-06-13 电影内容特征获取***及应用*** Pending CN107404671A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710443803.8A CN107404671A (zh) 2017-06-13 2017-06-13 电影内容特征获取***及应用***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710443803.8A CN107404671A (zh) 2017-06-13 2017-06-13 电影内容特征获取***及应用***

Publications (1)

Publication Number Publication Date
CN107404671A true CN107404671A (zh) 2017-11-28

Family

ID=60404549

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710443803.8A Pending CN107404671A (zh) 2017-06-13 2017-06-13 电影内容特征获取***及应用***

Country Status (1)

Country Link
CN (1) CN107404671A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108694619A (zh) * 2018-06-20 2018-10-23 新华网股份有限公司 电影票房预测方法和***
CN109033240A (zh) * 2018-07-05 2018-12-18 淮海工学院 基于情感分析的电影评论信息检索***及方法
CN109190022A (zh) * 2018-08-15 2019-01-11 深圳快购科技有限公司 影片主创人员的推荐方法及***
CN109299884A (zh) * 2018-10-19 2019-02-01 北京网智天元大数据科技有限公司 一种影响力评估方法及评估装置
CN111768037A (zh) * 2020-06-30 2020-10-13 广西科技大学 一种基于ls-svmr的电影票房预测方法及***
CN112035704A (zh) * 2020-08-03 2020-12-04 映美传世(北京)文化传媒有限公司 档期推荐的方法及装置
CN113748439A (zh) * 2019-05-20 2021-12-03 索尼集团公司 电影的成功商数的预测
CN117078112A (zh) * 2023-10-16 2023-11-17 云境商务智能研究院南京有限公司 应用于企业异常用电管理的能耗检测方法及数据分析***

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102982076A (zh) * 2012-10-30 2013-03-20 新华通讯社 基于语义标签库的多维度内容标注方法
CN105095516A (zh) * 2015-09-16 2015-11-25 中国传媒大学 基于谱聚类集成的广播电视用户分群***及方法
CN105184375A (zh) * 2015-10-09 2015-12-23 中国传媒大学 基于大数据的全产业链的电影评价方法及***
CN105550277A (zh) * 2015-12-10 2016-05-04 中国传媒大学 基于标签热度的智能电影排名和评价***
CN106354861A (zh) * 2016-09-06 2017-01-25 中国传媒大学 电影标签自动标引方法及自动标引***
CN106469170A (zh) * 2015-08-18 2017-03-01 阿里巴巴集团控股有限公司 文本数据的处理方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102982076A (zh) * 2012-10-30 2013-03-20 新华通讯社 基于语义标签库的多维度内容标注方法
CN106469170A (zh) * 2015-08-18 2017-03-01 阿里巴巴集团控股有限公司 文本数据的处理方法和装置
CN105095516A (zh) * 2015-09-16 2015-11-25 中国传媒大学 基于谱聚类集成的广播电视用户分群***及方法
CN105184375A (zh) * 2015-10-09 2015-12-23 中国传媒大学 基于大数据的全产业链的电影评价方法及***
CN105550277A (zh) * 2015-12-10 2016-05-04 中国传媒大学 基于标签热度的智能电影排名和评价***
CN106354861A (zh) * 2016-09-06 2017-01-25 中国传媒大学 电影标签自动标引方法及自动标引***

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108694619A (zh) * 2018-06-20 2018-10-23 新华网股份有限公司 电影票房预测方法和***
CN109033240A (zh) * 2018-07-05 2018-12-18 淮海工学院 基于情感分析的电影评论信息检索***及方法
CN109190022A (zh) * 2018-08-15 2019-01-11 深圳快购科技有限公司 影片主创人员的推荐方法及***
CN109299884A (zh) * 2018-10-19 2019-02-01 北京网智天元大数据科技有限公司 一种影响力评估方法及评估装置
CN113748439A (zh) * 2019-05-20 2021-12-03 索尼集团公司 电影的成功商数的预测
JP2022533690A (ja) * 2019-05-20 2022-07-25 ソニーグループ株式会社 映画成功指数の予測
JP7208595B2 (ja) 2019-05-20 2023-01-19 ソニーグループ株式会社 映画成功指数の予測
US11704495B2 (en) 2019-05-20 2023-07-18 Sony Group Corporation Prediction of film success-quotient
CN113748439B (zh) * 2019-05-20 2024-03-12 索尼集团公司 电影的成功商数的预测
CN111768037A (zh) * 2020-06-30 2020-10-13 广西科技大学 一种基于ls-svmr的电影票房预测方法及***
CN112035704A (zh) * 2020-08-03 2020-12-04 映美传世(北京)文化传媒有限公司 档期推荐的方法及装置
CN117078112A (zh) * 2023-10-16 2023-11-17 云境商务智能研究院南京有限公司 应用于企业异常用电管理的能耗检测方法及数据分析***
CN117078112B (zh) * 2023-10-16 2024-01-02 云境商务智能研究院南京有限公司 应用于企业异常用电管理的能耗检测方法及数据分析***

Similar Documents

Publication Publication Date Title
CN107404671A (zh) 电影内容特征获取***及应用***
Berry et al. The new Chinese documentary film movement: For the public record
Kahana The documentary film reader: History, theory, criticism
Voci China on video: Smaller-screen realities
Elsaesser Harun Farocki: Working on the sight-lines
Hao et al. Worth thousands of words? Visual content analysis and photo interpretation of an outdoor tourism spectacular performance in Yangshuo-Guilin, China
King Positioning art cinema: Film and cultural value
Chiu et al. Taiwan cinema: International reception and social change
Smith Bande de Filles: Girlhood Identities in Contemporary France
CN107368529A (zh) 专题片数据内容特征获取***及标签库
CN107347163A (zh) 一种电视剧内容特征获取***及标签库
Musser The Documentary Film Reader: History, Theory, Criticism
O'Connor et al. Video structure meaning
Blankenship et al. European visions: small cinemas in transition
O’Regan et al. The emergence of Australian film criticism
Lim Towards a poor cinema: ubiquitous trafficking and poverty as problematic in Midi Z’s films
Udo Calabar Carnival: Visualizing cultural authenticity and the paradigm of the street
Osmond et al. Sources
Schein Minorities, homelands and methods
Hanan et al. Intermittent industries: Film production in Indonesia over nine decades
Kumar The'Bollywoodization'of Popular Indian Visual Culture: A Critical Perspective
Ingle The ‘Tamasha’genre of Marathi cinema: imbrications of a vernacular cultural space
Doing Cinema and the Prefigurative
Mukherjee et al. Popular Cinema in Bengal
Andrew National Turbulence and the Turbos of the World Cinema System

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20171128