CN105518680A - 用于电子文档审查的***和方法 - Google Patents

用于电子文档审查的***和方法 Download PDF

Info

Publication number
CN105518680A
CN105518680A CN201580000600.0A CN201580000600A CN105518680A CN 105518680 A CN105518680 A CN 105518680A CN 201580000600 A CN201580000600 A CN 201580000600A CN 105518680 A CN105518680 A CN 105518680A
Authority
CN
China
Prior art keywords
message content
computing equipment
participant
metadata categories
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201580000600.0A
Other languages
English (en)
Inventor
拉杰库马尔·钱德拉塞卡尔
彼得·范伯格
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Consilio LLC
Original Assignee
Consilio LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US14/609,898 external-priority patent/US20160224538A1/en
Application filed by Consilio LLC filed Critical Consilio LLC
Publication of CN105518680A publication Critical patent/CN105518680A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/83Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

***和方法实现电子文档的方便和准确的搜索、过滤、审查和分类而没有元数据的损失。通信数据源文件被解析成包括消息内容和元数据的对话特定文件。消息内容和元数据显示在由审查者操作的计算设备上。为了使审查过程合理化,审查者可根据各种元数据类别过滤消息内容的显示以及使用元数据类别来搜索对话特定文件。

Description

用于电子文档审查的***和方法
技术领域和背景
本发明总体上涉及电子文档发现的领域,且更具体地,涉及用于处理并审查电子文档的***和方法。
电子发现正变成法律程序和管制及内部合规调查的越来越重要且昂贵的组成部分。在提供可能用作为在法律程序或管制或内部合规调查中的证据的电子文档之前,必须根据相关性、保密性等审查并分类文档。
电子文档被处理并呈递给律师和公司监察专员以用于审查的方式对审查的效率、准确性和成本有效性有直接影响。应将电子文档应以一致、直观和容易阅读的方式显示给用户,且电子文档应是动态可搜索的和可分类的。这可能在处理不同的文件类型的大量电子文档时特别有挑战性,在电子发现中情况常常是这样。
关于诸如“聊天”消息文字记录的电子通信文档,传统电子发现方法将这样的通信以电子邮件格式呈递到审查者,因为电子邮件格式通常是由电子发现处理和审查软件解决方案可支持和审查者可识别的标准化格式。然而,以电子邮件格式的电子通信文档的呈递具有以下缺点:审查冗长的聊天文字记录文档审查起来很麻烦,且为了电子发现审查的目的将聊天文字记录文档转换成电子邮件格式导致有价值的元数据的损失。
即时聊天发消息正变成在全世界公司实体当中的合作的越来越流行的手段。特别是,诸如证券交易的特定行业中,即使发消息软件允许来自一个机构的交易员同时与在相同或不同的机构处的很多其他交易员在单个会话(即“聊天室”)中参与讨论。目前,数百万即时消息每天在数百万用户之间被交换。这些消息以电子方式被存档并在法律程序、管制调查或审核期间被频繁地寻找。因此,提供允许用户快速和方便地在电子发现期间搜索、过滤、审查和分类消息而不将消息转换成涉及信息的损失的格式的***和方法将是有利的。
概述
因此,本发明的目的是提供允许将存档电子通信源文件解析成可由审查者快速、方便和准确地搜索、过滤、审查和分类的分开的对话特定文件的***和方法。本发明的另一目的是提供允许对话特定文件被搜索、过滤和审查而没有元数据的损失的***和方法。
根据本发明的一个实施方式,提供了用于审查电子文档的方法和***。***包括与审查者相关的计算设备和与电子发现***相关的计算设备。发现***计算设备将电子通信数据源文件解析成一个或多个对话特定文件。对话特定文件包括消息内容和一个或多个元数据类别。消息内容和元数据被传输到审查者计算设备以用于由审查者审查和分析。审查者可利用软件应用来根据内容类别过滤消息内容,且动态地为审查者显示过滤的消息内容。可用于过滤消息内容的内容类别包括参与者标识符和参与者-实体标识符等。
在本发明的另一方面中,对话特定文件包括第一元数据类别和第二元数据类别,第一元数据类别是参与者进入事件,第二元数据类别是参与者离开事件。***根据参与者进入和参与者离开事件过滤消息内容,且将过滤的内容动态地传输到审查者计算设备以显示。本发明的另一方面包括从消息内容过滤免责声明文本和将没有免责声明文本的过滤的消息内容传输到审查者计算设备以显示的额外步骤。
本发明的另一方面可包括根据元数据类别和元数据类别值来搜索一个或多个对话特定文件的步骤。包括元数据类别和元数据类别值的对话特定文件被传输到审查者计算设备以显示和审查。可根据各种元数据类别——包括会话持续时间、参与者计数、参与者标识符和实体标识符等——来搜索对话特定文件。
在本发明的又一方面中,审查者计算设备接收由发现***计算设备传输的对话特定文件。对话特定文件包含消息内容和至少一个元数据类别。审查者计算设备将过滤请求传输到发现计算设备,请求根据元数据类别过滤消息内容。审查者计算设备随后接收由发现计算设备传输的过滤的消息内容。
根据本发明的另一个实施方式,发现计算设备将电子通信数据源文件解析成一个或多个对话特定文件。对话特定文件包括消息内容和一个或多个元数据类别。消息内容和元数据类别由发现计算设备显示,且发现计算设备被用于根据元数据类别来过滤消息内容。为审查者显示过滤的消息内容。
附图简述
当参考附图阅读本发明的下面的详细描述时,本发明的特征、方面和优点将被更好地理解,其中:
图1是根据本发明的一个实施方式的示例性硬件配置的示意图;
图2是涉及即时聊天消息的交换的示例性通信会话;
图3示出当参与者发起并终止通信会话时产生的以扩展标记语言格式的通信数据;
图4示出当参与者交换消息时产生的以扩展标记语言格式的通信数据;
图5示出当在通信会话期间传输免责声明文本时产生的以扩展标记语言格式的通信数据;
图6是由扩展标记语言和个人存储表格文件格式支持的通信元数据类别的比较;
图7示出以电子邮件格式显示的通信数据;
图8A-8B示出用于审查通信数据的示例性显示屏;
图9A-9B示出用于过滤通信数据的示例性显示屏;
图10A-10B示出用于显示通信元数据的示例性显示屏;
图11A-11B示出用于根据元数据类别搜索通信数据的示例性显示屏;以及
图12A-12B示出用于导出通信元数据的示例性显示屏。
详细描述
现在将参考示出本发明的示例性实施方式的附图更充分地描述本发明。然而,本发明可体现在很多不同的形式中且不应被解释为限于下面描述的代表性实施方式。提供了示例性实施方式,从而使得本发明彻底和完整,并完全传达本发明的范围和使本领域中的普通技术人员能够制造、使用和实施本发明。
电子发现通常指任何过程,其中电子数据被寻找、定位、收集、审查和产生,其意图是将它使用为在法律过程、审计或调查中的证据。术语“审查者”旨在描述利用本发明的***和方法来审查电子文档作为电子发现过程的一部分的个人。术语“审查者”可与术语“用户”或“方”可互换地使用。术语“提供者”通常表示提供与电子发现有关的服务的个人或实体。
术语“通信会话”指在两个或多个通信电子设备之间的交互式信息交换,并包括例如电子邮件通信的交换、即时聊天消息的传输或消息在留言板或社交媒体平台上的公布。术语“通信会话”与术语“对话”、“交换”、“聊天室”或“聊天文字记录”可互换地被使用。术语“参与者”通常描述主动或被动地被涉及到通信会话的个人或实体。与一个或多个通信会话有关的以电子方式存储的信息通常使用术语“存档文件”、“源文件”、“电子通信数据”、“对话特定文件”或“电子发现数据”连同其它术语被提及。
所公开的是允许审查者有效和准确地审查电子通信数据作为电子发现过程的一部分而不损失包含在存档的通信数据中的有价值的信息的***和方法。在商业的正常过程期间,个人频繁地利用电子通信平台、这样的即时发消息来近实时地交换信息。将这些通信的内容连同与通信的上下文有关的元数据一起以电子方式存档。元数据可包括例如发送每个通信的日期和时间,诸如参与者账号、相关商业实体的名称和参与者的其它唯一标识符的用于通信的参与者的识别信息。所述***和方法找到关于对即时聊天消息文字记录的审查的特定应用,但本领域中的普通技术人员将认识到,***和方法可被应用于对其它类型的电子文档和通信数据的审查。
在电子发现期间,使用电子发现软件将所存档的通信数据收集并处理到数据库中以审查和分析。处理步骤通常采用所收集的存档通信数据并打开单独的电子通信文档并提取文本以便于创建可搜索的索引和存储进一步实现文档搜索的有价值的元数据。可将数据库和电子发现软件集成到由电子发现提供者维护的计算机***。法律程序或调查方或他们的代理为了进行审查的目的而远程访问电子发现软件。可选地,可在由一方或一方的代理维护的计算机***上实现数据库和电子发现软件。
可审查以类似于消息帖子的连续线程的电子邮件格式的电子通信数据,消息帖子包括每个消息的内容、屏幕名称或用于发起消息的参与者的其它识别信息及张贴每个消息时的日期和时间。聊天文字记录可以且常常包括来自数百或数千参与者的数千条消息。所产生的电子文档可以是难以审查的庞大的多页文字记录。从本地***档案库收集以电子邮件格式的电子通信数据可以且常常也导致与法律程序有密切关系并可被用于使审查过程合理化的有价值的元数据的损失。这是因为电子邮件格式缺乏对于被存储在本地存档***中的有价值的元数据所必需的字段定义,例如“消息交互类型”或“UUID”或参与者的“账号”。因此,收集、处理和审查以电子邮件格式的聊天文字记录可削弱电子发现经验。
此外,聊天文字记录常常包括构成不相关的“噪声”的很多消息。噪声包括例如指示某些事件(例如,参与者进入或离开通信会话)的发生的消息帖子、诸如免责声明文本的自动化消息帖子(例如,由聊天发消息***输入到聊天文字记录内且一般警告提防前视声明的低价值重复文本内容)、以及与法律程序或调查没有密切关系的实质性消息帖子。在一些情况下,超过90%的聊天文字记录内容构成噪声。结果是,审查者可能在筛选通信数据以识别并分析相关信息时遇到困难。这导致严重影响审查的效率和准确度的审查者的疲劳。
本发明的***和方法通过以促进方便、有效和可靠而没有元数据的损失的审查的格式向审查者呈递电子通信数据来克服这些缺点。***将以完整的结构化形式收集并包括所有有价值的元数据的存档通信数据解析成用于每个聊天文字记录的分开的对话特定文件。对话特定文件被呈递给审查者,并可根据诸如通信参与者的身份、通信会话持续时间或参与者的数量的许多不同的标准来动态地被搜索和过滤。以这种方式,审查者可专注于聊天文字记录、参与者或与需要电子发现审查的法律程序或调查最相关的其它信息。
***和方法还允许审查者通过在审查期间对适当的结构工作流应用元数据来使审查过程合理化。为了说明,审查者常常在每小时费用基础上执行发现审查。可根据在会话中的参与者的数量或按照会话持续时间来将对话特定文件分类。可将包含大部分数据(即,大部分参与者或最长持续时间)的会话特定文件分配给具有最低的每小时费用率的审查者。
转到图1所示的示例性实施方式,根据本发明的一个实施方式的***通常包括与审查者相关的至少一个计算设备101和与电子发现提供者相关的计算机***150。电子发现提供者计算机***150可包括提供者服务器106、电子文档数据库104、防火墙107和由提供者合伙人(未示出)操作的一个或多个计算设备。
图1所示的***并不旨在为限制性的,且本领域中的普通技术人员将认识到,可使用其它适当的硬件或软件配置来实现本发明的***和方法。例如,电子发现提供者计算机***150可以只利用由一个或多个计算设备实现的单个服务器或单个计算设备可实现提供者服务器106、电子文档数据库104、防火墙107和/或审查者计算设备101其中的一个或多个。此外,单个计算设备可实现本文所述的方法的多于一个步骤;可由多于一个计算设备实现单个步骤;或可使用对步骤的任何其它逻辑划分。在一个实施方式中,***由使用一个或多个合伙人或代理以进行电子发现审查的法律程序或调查方维持。使用这个实施方式,单个计算设备可实现提供者服务器106和审查者计算设备101。
任何适当的计算设备可被用于实现审查者计算设备101或电子发现提供者计算机***150的部件。审查者计算设备101、提供者服务器106和合伙人计算设备可包括经由总线子***与多个***子***通信的处理器。这些***子***可包括存储子***、用户界面输入设备、用户界面输出设备、通信***和网络接口子***。通过处理存储在一个或多个存储设备上的指令,处理器可执行本方法的步骤。可使用包括光存储设备、磁存储设备或固态存储设备的任何类型的存储设备。
通常,审查者计算设备101访问电子发现提供者计算机***150或在互联网120上以正常方式-例如,通过诸如局域网(“LAN”)或广域网(“WWAN”)130的一个或多个远程连接基于802.11标准或通过蜂窝服务提供者提供的数据连接彼此通信。这些远程连接只代表可对互联网120做出用于访问电子发现提供者计算机***150或与其它审查者计算设备101通信的多个连接。
提供者服务器106和审查者计算设备101包括一个或多个集成软件应用,一个或多个集成软件应用提供图形用户界面、允许与其它电子设备的通信和通常实现本文公开的方法的步骤。在图7-12中描绘示例性用户界面显示屏。用户界面屏幕可包括用于显示信息并接受来自用户的输入的特征,例如文本框、数据字段、超链接、下拉菜单、复选框、单选框等。本领域中的技术人员将认识到,在附图中所示的示例性功能和用户界面显示屏并不旨在为限制性的,且集成软件应用可包括其它显示屏和功能。
电子发现数据被收集并存入到电子文档数据库104内。可将电子发现数据以可扩展标记语言(“XML”)格式、个人存储表格(“PST”)格式、MIMERFC822(“EML”)格式或本领域中的普通技术人员已知的任何其它适当的格式存入数据库104内。由与发现服务提供者服务器106集成的发现软件应用访问发现数据。发现软件应用规定用于显示在审查者计算设备101上的电子发现数据的格式,且发现数据被传输到审查者计算设备101以审查和分析。
在图2中描绘如为聊天参与者显示的示例性即时发消息通信,且在图3-6中示出的实施方式使用由标记结构构成的多层嵌套数据结构示出的以XML格式的即时消息通信数据。标记结构以由开角括号(“<”)和闭角括号(“>”)围住的属性组成的开始标签开始。标记结构以由在跟随有正斜杠(“</”)的开角括号(“<”)和闭角括号(“>”)内围住的属性组成的结束标签结束。属性对应用于即时消息的元数据类别的标记。元数据以及消息内容的实质由开始和结束标签作为书挡。
参考图3所示的例子可更好地理解以XML格式的即时通信消息的结构,图3示出当参与者发起并然后终止通信会话(即,进入和离开聊天室)时产生的数据。用唯一的会话标识号来标记每个聊天文字记录。对话标识号在图3中被显示为PCHAT数据字段,并被围在RoomID和ConversationID开始和结束标签内。
当发起或终止通信会话时,即时消息软件捕获被存储为元数据的各种信息,例如,包含:(1)在本地时间和协调世界时(“UTC”)中发起或终止会话时的日期和时间;(2)指示参与者进入或退出聊天室的事件标签(即,“ParticipantEntered”和“ParticipantLeft”属性)的时间标记;以及(3)识别信息,例如参与者的屏幕名称、名、姓、唯一用户标识号(“UUID”)、商号名称(即,用于与参与者相关的公司实体的标识号)、账号、公司名称、即时发消息账户电子邮件地址和公司电子邮件地址。参与者信息被包含在父母用户标签和相应的孩子子标签内:LoginName(即,用于参与者的简写屏幕名称)、FirstName、UUID等。当通信会话终止时,终止事件连同参与者识别信息一起被记录在“ParticipantLeft”标签内,从而使得可将终止事件链接到特定的参与者。
在图4中以XML格式显示在两个参与者之间的示例性即时消息对话。消息内容被围在父母“消息”标签和“内容”标签内。消息内容连同每个消息的日期和时间和发起消息的参与者的标识信息一起被记录。在一些情况下,当发起通信会话或传输消息时,通信软件将自动产生并显示某些信息。例如,图5示出保密免责声明的自动产生和显示。通常将这样的免责声明附加到很多职业服务提供者和商业企业的发出的外部通信。免责声明被记录在XML文件的消息和内容标签内。
除了上面所述的类别以外,所公开的***和方法还可处理描述通信的实质和环境的各种元数据类别。示例性元数据类别在图6中被示出并包括:(1)ChatAttachmentCount;(2)ChatAttachmentLogin;(3)ChatAttachmentName;(4)ChatCompany;(5)ChatCompanyCount;(6)ChatDomainCount;(7)ChatDomainNames;(8)ChatDuration;(9)ChatEndUTC;(10)ChatFirmCount;(11)ChatFirmNumber;(12)ChatMessageCount;(13)ChatPartipantCount;(14)ChatParticipantEmail;(15)ChatParticipantLogins;(16)ChatParticipantNames;(17)ChatRoomDuration;(18)ChatRoomEnd;(19)ChatRoomID;(20)ChatRoomPerspective;(21)ChatAttachmentCount;(22)ChatRoomType;(23)ChatStartUTC;以及(24)由通信软件捕获的任何其它有用的元数据类别。本领域中的普通技术人员将认识到,这些类别并不旨在为限制性的,且***和方法可被配置成处理涉及聊天文字记录的内容和环境的额外的信息。
多个聊天文字记录一般被存档在从本地发消息***中收集的单个电子通信源文件中。以结构化非电子邮件格式的源文件被收集并解析成用于每个聊天记录的单独的XML文件以创建对话特定XML文件。在一个实施方式中,通过提取相应于特定的PCHAT标识值的所有数据结构并将数据结构存储在单独的对话特定XML文件来解析结构、非电子邮件存档电子通信源文件。在单独的XML文件中的数据结构的存储实现由电子发现审查软件根据各种标准动态搜索和过滤。用于每个对话特定文件的元数据元素被存储到关系数据库中的单独的数据库字段以实现在电子发现审查软件内的搜索。
图7所示的实施方式示出以电子邮件格式显示的电子发现数据。为了以电子邮件格式显示,存档电子通信源文件可被收集并分离成用于每个聊天文字记录的单独的对话特定PST文件。将对话特定文件以电子邮件格式显示在审查者计算设备101上。除了消息内容以外,PST文件还包括进一步描述在特定会话期间被传输或张贴的通信环境的元数据(然而,当源文件是结构化、非电子邮件格式时,更少的元数据被收集)。为了说明,在图7中所示的对话特定PST文件示出每个通信参与者的名字、相关商业实体和屏幕名称和张贴每个消息的日期和时间。对话特定PST文件还包括与某些事件有关的元数据(例如,当参与者发起、终止或查看通信会话)以及通常涉及通信会话的信息(例如,通信会话开始和结束时间以及在会话中的参与者的数量)。
与XML文件格式相比,PST文件格式支持明显少的元数据类别。在图6中示出由PST和XML文件格式支持的元数据类别的比较。此外,PST文件是“平面的”,因为消息内容在电子邮件主体中被存储为无特征文本存储而没有任何区分的标签、密钥或字段结构。因此,消息内容和相关元数据不能如同XML文件一样被动态地搜索和过滤。在图8-12中示出对包含在XML文件内的通信数据的显示、搜索和过滤。技术人员将认识到,在附图中示出的示例性实施方式并不旨在为限制性的,且创造性***和方法可处理以任何结构化数据格式存储并使用各种通信软件平台创建的电子文档,各种通信软件平台包括但不限于MicrosoftBloomberg服务终端或ThomsonReutersEikon
审查者可通过使用唯一的用户名和密码登录到***内来安全地访问提供者的***150。审查者将对话特定XML文件载入***内,且将文件内容显示在诸如图8所示的显示屏的图形用户界面中。通信的内容202连同屏幕名称206和张贴每个消息的参与者的全名204以及张贴消息的日期和时间一起被显示在阅读窗格210中。显示屏还包括提供涉及通信会话的基础信息的头部窗格220,基础信息包括唯一会话标识号222、发起和终止会话的日期和时间、会话的总持续时间及参与者数量224。
审查者可通过从阅读窗格210过滤某些噪声元素来使审查过程合理化,噪声元素包括显示参与者何时进入或离开会话的事件条目、历史查看条目(例如,显示参与者何时进入会话以只查看或请求消息历史的事件条目)或保密免责声明。审查者可通过将在过滤结果窗格230之下的滑动输入232切换到断开位置并选择应用功能234来过滤掉这些元件。可通过选择重置功能236来将过滤器恢复到默认接通或断开设置。
***通过搜索用于相应的消息内容或元数据类别的对话特定文件来过滤噪声。参考下面的简化例子可更好地理解过滤。如果审查者将显示条目和退出滑动输入232切换到断开位置,则***可搜索诸如图3所示文件的对话特定文件,以找出所有ParticipantEntered和ParticipantLeft元数据标签。***然后从阅读窗格210移除相应的事件条目而不修改对话特定文件且不需要存储对话特定文件的预过滤版本。类似地,如果审查者将显示全部免责声明滑动输入232切换到断开位置,则***搜索对话特定文件的消息内容以定位保密免责声明的所有实例。***然后从阅读窗格210移除相应的条目。
在一个实施方式中,***和方法使用可被填入已知的保密免责声明或其它数据的项目特定噪声文件。例如,如果消息张贴以文本“***DISCL”或“保密声明”开始,***可将整个消息张贴处理为噪声。***使用来自项目特定噪声文件的数据来搜索、识别并过滤来自对话特定文件的噪声,从而可将噪声从阅读窗格210移除。可在发现审查项目声明周期期间的任何时间更新项目特定噪声文件。这具有创建“渐进学习***”的优点,“渐进学习***”中在通信数据收集并最初处理初始存档的时间不需要预先知道噪声。
在参与者窗格240之下显示的列表条目中识别通信会话的参与者,并在公司窗格250之下的列表条目中单独地识别与参与者相关的商业实体。列表条目可以可选地显示诸如参与者屏幕名称(“登录”)和由每个参与者或商业实体张贴的消息的数量(“帖子计数”)的其它有用的信息。参与者通过如图7所示在阅读窗格210中紧靠参与者名字显示商业实体名称或通过对每个参与者/商业实体对进行颜色编码来与他们的相应商业实体相关联。
通过提供紧靠每个参与者列表条目的指示器242对参与者/商业实体对进行颜色编码,指示器242与紧靠相应的公司列表条目的指示器252是相同的颜色。显示器还可包括紧靠在阅读窗格210中参与者的每个张贴的颜色编码指示器208。所以,例如如果参与者RonSmith与实施诉讼商业实体相关联,则紧靠相应的列表条目的指示器242和252可被渲染为橘黄色的。橘黄色的指示器208也可被显示在紧靠由RonSmith张贴的每个消息的阅读窗格210中。
审查者可以可选地在聊天文字记录中只显示由特定的参与者或商业实体张贴的那些消息。为了实现参与者过滤,审查者选择图8所示的参与者过滤功能244以显示图9所示的所有参与者窗口。所有参与者窗口显示用于每个参与者的单独列表条目和参与者的全名、屏幕名称(“登录”)、相关商业实体(“公司”)和由那个参与者张贴的消息的数量(“帖子计数”)。在所有参与者窗口上,审查者选择或取消选择相应于参与者的复选框310以移除或显示在阅读窗格210中的参与者的帖子。当选择或取消选择复选框310时,***搜索对话特定文件以找到包含相应于该参与者的识别信息的元数据标签的所有实例(例如,Login、FirstName、LastName、UUID和FirmNumber标签)。当选择或取消选择期望的参与者时,审查者选择应用功能312以关闭所有参与者窗口并应用过滤器。
在图8所示的显示屏的元数据选项卡260之下显示与聊天文字记录相关的元数据的概述。审查者可通过选择浏览全部元数据功能262以显示图9中所示的文档元数据窗口来访问完整的元数据。审查者也可选择使用在编辑定制字段选项卡264上可得到的功能而显示或隐藏的元数据类别。
在头部窗格220中显示基础会话信息、对参与者/商业实体对进行颜色编码、噪声过滤、提供对元数据类别的访问和显示消息计数信息帮助审查者快速评估对话特定文件的潜在相关性以及潜在工作流问题。作为例子,电子发现可涉及要求按小时费用付费的多个审查者。为了建立有效的工作流,特定的审查者可被指定基于每小时费率、审查者速度或审查者技能连同其它标准来审查某些会话特定文件。审查者可通过选择图8所示的我的任务280选项卡来访问所指定的文档以审查。
可通过参考聊天持续时间和参与者计数224元数据字段根据数据量快速分类聊天文字记录。可将具有较长的持续时间或较多的参与者的聊天文字记录分配给较快的审查者或具有较低的每小时费率的审查者。作为另一例子,如果已知审查者特别熟悉源于特定参与者或商业实体的通信数据,则可将包含源于该参与者或实体的最大量的消息帖子的对话特定文件分配给具有最相关的技能的审查者。审查者可利用在过滤结果窗格230、公司窗格250和参与者窗格240之下的过滤功能以使数据显示合理化并且只分析来自特定参与者和商业实体的那些消息。
方法和***可包含促进在文档审查期间的有效工作流管理的额外特征,包括基于元数据信息搜索对话特定文件。审查者选择搜索功能282以打开图11中所示的搜索向导窗口。审查者通过选择在快速字段选项卡330之下的期望元数据类别、将待搜索的数据值输入到“对于:”文本框332中并选择OK功能334来输入搜索标准。
为了说明,审查者可发起对包括二十到三十个参与者的所有对话特定文件的搜索。审查者选择在快速字段选项卡330之下的ChatParticipantCouont元数据类别,并在对于:文本框332中输入“20~~30”的范围。或者审查者可通过选择ChatParticipantNames元数据字段并在对于:文本框332中输入“Smith”来搜索包括由参与者RonSmith张贴的消息的所有对话特定文件。在本发明的另一方面中,审查者可通过从图12中所示的导出布局窗口选择期望元数据类别352、选择期望显示设置354(例如,风格、字段、文本、换行符字符、数据类型等)并选择导出功能356来将元数据信息导出到单独的文件(例如,电子数据表)。可接着参考导出的元数据来确定审查者任务。
在审查期间,可通过选择在标签和元数据窗格270下的适当复选框“标签”272来根据相关性、保密性、权限等对文档分类。在附图中所示的示例性分类包括与文档相关性有关的标签272(例如,Not_Relevant、Relevant、Unclear_Needs_Follow-up)、律师-当事人特权(例如,Attorney_Work_Product、AttorneyClient_Communication、JointDefense)和与文档的可审查性有关的标签272(例如,ForeignLanguage、IllegibleScan、Password_Protected和Technical_Issue)。审查者可通过选择向前功能292和返回功能290在文档之间切换。
***可选地提供某些身份管理(“IdM”)和安全特征。审查者可通过选择编辑配置文件功能286来输入、存储和编辑诸如审查者身份信息、密码或显示偏好的配置文件信息。审查者可通过选择改变项目功能284在项目(即,待审查的文档组)之间切换。且当文档审查会话完成时,审查者选择登出功能288来终止会话并防止对***的未授权访问。
在将项目中的所有电子文档审查和适当地分类之后,可规定文档的格式以用于在法律程序或调查中对其他方的产生。可以以本领域中的普通技术人员已知的任何适当格式产生电子文档,适当格式包括XML、PST、EML、便携式文档格式(“PDF”)或图像格式(例如,标签图像文件格式(“TIFF”))。
虽然前述描述作为例子提供了本发明的实施方式,设想其它实施方式可执行类似的功能和/或实现类似的结果。任何和所有这样的等效实施方式和例子都在本发明的范围内。

Claims (16)

1.一种电子文档审查的计算机实现的方法,包括下列步骤:
(a)提供与审查者相关的计算设备;
(b)提供与电子发现***相关的计算设备;
(c)通过所述发现计算设备将源文件解析成一个或多个对话特定文件,所述对话特定文件包括消息内容和第一元数据类别;
(d)将所述消息内容和所述第一元数据类别从所述发现计算设备传输到所述审查者计算设备;
(e)由所述发现计算设备根据所述第一元数据类别来过滤所述消息内容;以及
(f)将经过滤的消息内容从所述发现计算设备传输到所述审查者计算设备。
2.如权利要求1所述的方法,其中,所述第一元数据类别是参与者标识符。
3.如权利要求1所述的方法,其中,所述第一元数据类别是参与者-实体标识符。
4.如权利要求1所述的方法,其中:
(a)所述对话特定文件还包括第二元数据类别;
(b)所述第一元数据类别是参与者进入事件,且所述第二元数据类别是参与者离开事件;以及
(c)所述消息内容由所述参与者进入事件和所述参与者离开事件过滤。
5.如权利要求1所述的方法,其中,所述对话特定文件消息内容包括免责声明文本,且所述方法还包括下列步骤:
(a)由所述发现计算设备从所述消息内容过滤所述免责声明文本;以及
(b)将没有所述免责声明文本的所述过滤的消息内容从所述发现计算设备传输到所述审查者计算设备。
6.如权利要求1所述的方法,还包括下列步骤:
(a)由所述发现计算设备根据所述第一元数据类别和第一元数据类别值搜索所述一个或多个对话特定文件;以及
(b)将包括所述第一元数据类别和所述第一元数据类别值的所述对话特定文件从所述发现计算设备传输到所述审查者计算设备。
7.如权利要求6所述的方法,其中,所述第一元数据类别选自由会话持续时间、参与者计数、参与者标识符和实体标识符组成的组。
8.一种电子文档审查的计算机实现的方法,包括下列步骤:
(a)提供与审查者相关的计算设备;
(b)提供与电子发现***相关的计算设备;
(c)由所述审查者计算设备接收由所述发现计算设备传输的对话特定文件,所述对话特定文件包括消息内容和第一元数据类别;
(d)由所述审查者计算设备将请求根据所述第一元数据类别过滤所述消息内容的过滤请求传输到所述发现计算设备;以及
(e)由所述审查者计算设备接收由所述发现计算设备传输的经过滤的消息内容。
9.一种用于电子文档审查的***,包括:
第一处理器,其与审查者相关;
第二处理器,其与发现设备相关;以及
数据存储设备,其包括具有用于指示所述处理器的计算机可读代码的计算机可读介质,且当所述计算机可读代码被所述处理器执行时,所述处理器执行操作,所述操作包括:
(a)由所述第二处理器将源文件解析成一个或多个对话特定文件,所述对话特定文件包括消息内容和第一元数据类别;
(b)将所述消息内容和所述第一元数据类别从所述第二处理器传输到所述第一处理器;
(c)由所述第二处理器根据所述第一元数据类别来过滤所述消息内容;以及
(d)将经过滤的消息内容从所述第二处理器传输到所述第一处理器。
10.如权利要求9所述的***,其中,所述第一元数据类别是参与者标识符。
11.如权利要求9所述的***,其中,所述第一元数据类别是参与者-实体标识符。
12.如权利要求9所述的***,其中:
(a)所述对话特定文件还包括第二元数据类别;
(b)所述第一元数据类别是参与者进入事件,且所述第二元数据类别是参与者离开事件;以及
(c)所述消息内容由所述参与者进入事件和所述参与者离开事件过滤。
13.如权利要求9所述的***,其中,所述对话特定文件消息内容包括免责声明文本,且所述处理器还配置成执行包括以下动作的操作:
(a)由所述第二处理器从所述消息内容过滤所述免责声明文本;以及
(b)将没有所述免责声明文本的所述过滤的消息内容从所述第二处理器传输到所述第一处理器。
14.如权利要求9所述的***,其中,所述处理器还被配置成执行包括以下动作的操作:
(a)由所述第二处理器根据所述第一元数据类别和第一元数据类别值搜索所述一个或多个对话特定文件;以及
(b)将包括所述第一元数据类别和所述第一元数据类别值的所述对话特定文件从所述第二处理器传输到所述第一处理器。
15.如权利要求14所述的***,其中,所述第一元数据类别选自由会话持续时间、参与者计数、参与者标识符和实体标识符组成的组。
16.一种用于电子文档审查的***,包括:
处理器,其与电子发现***相关;以及
数据存储设备,其包括具有用于指示所述处理器的计算机可读代码的计算机可读介质,且当所述计算机可读代码被所述处理器执行时,所述处理器执行操作,所述操作包括:
(a)将源文件解析成一个或多个对话特定文件,所述对话特定文件包括消息内容和第一元数据类别;
(b)显示所述消息内容和所述第一元数据类别;
(c)根据所述第一元数据类别来过滤所述消息内容;以及
(d)显示经过滤的消息内容。
CN201580000600.0A 2015-01-30 2015-07-23 用于电子文档审查的***和方法 Pending CN105518680A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US14/609,898 2015-01-30
US14/609,898 US20160224538A1 (en) 2015-01-30 2015-01-30 Systems and methods for electronic document review
US14/711,997 US9344390B1 (en) 2015-01-30 2015-05-14 Systems and methods for electronic document review
US14/711,997 2015-05-14
PCT/US2015/041667 WO2016122713A1 (en) 2015-01-30 2015-07-23 Systems and methods for electronic document review

Publications (1)

Publication Number Publication Date
CN105518680A true CN105518680A (zh) 2016-04-20

Family

ID=55725018

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580000600.0A Pending CN105518680A (zh) 2015-01-30 2015-07-23 用于电子文档审查的***和方法

Country Status (1)

Country Link
CN (1) CN105518680A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110093471A1 (en) * 2007-10-17 2011-04-21 Brian Brockway Legal compliance, electronic discovery and electronic document handling of online and offline copies of data
CN102655481A (zh) * 2011-03-04 2012-09-05 腾讯科技(深圳)有限公司 一种基于网页的即时通信聊天内容查看方法及***
CN104125135A (zh) * 2013-04-28 2014-10-29 腾讯科技(深圳)有限公司 一种即时通信应用聊天记录的管理方法和终端

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110093471A1 (en) * 2007-10-17 2011-04-21 Brian Brockway Legal compliance, electronic discovery and electronic document handling of online and offline copies of data
CN102655481A (zh) * 2011-03-04 2012-09-05 腾讯科技(深圳)有限公司 一种基于网页的即时通信聊天内容查看方法及***
CN104125135A (zh) * 2013-04-28 2014-10-29 腾讯科技(深圳)有限公司 一种即时通信应用聊天记录的管理方法和终端

Similar Documents

Publication Publication Date Title
van Baar et al. Digital forensics as a service: A game changer
CA3138730C (en) Public-opinion analysis method and system for providing early warning of enterprise risks
US10146878B2 (en) Method and system for creating filters for social data topic creation
CN105704005B (zh) 恶意用户举报方法及装置、举报信息处理方法及装置
US20150120583A1 (en) Process and mechanism for identifying large scale misuse of social media networks
US20160224538A1 (en) Systems and methods for electronic document review
AU2014400621B2 (en) System and method for providing contextual analytics data
CN107633433B (zh) 广告的审核方法及装置
CN112163072A (zh) 基于多数据源的数据处理方法以及装置
US20160188676A1 (en) Collaboration system for network management
CN114119322A (zh) 政策全流程服务的方法、装置、服务器及计算机存储介质
Hope Unsocial media: school surveillance of student internet use
CN113568934A (zh) 一种数据查询方法、装置、电子设备和存储介质
US20130145289A1 (en) Real-time duplication of a chat transcript between a person of interest and a correspondent of the person of interest for use by a law enforcement agent
Cahyani et al. An evidence‐based forensic taxonomy of Windows phone dating apps
TW201500941A (zh) 社群資料篩選系統、方法及其非揮發性電腦可讀取紀錄媒體
US10992488B2 (en) System and method for an enhanced focus group platform for a plurality of user devices in an online communication environment
CN107491530B (zh) 一种基于文件自动标记信息的社会关系挖掘分析方法
CN112612817B (zh) 数据处理方法、装置、终端设备及计算机可读存储介质
JP6759720B2 (ja) 情報処理装置及び情報処理プログラム
CN105518680A (zh) 用于电子文档审查的***和方法
US10742588B2 (en) Representative media item selection for electronic posts
CN112230902A (zh) 一种基于钉钉定制的软件开发方法及***
KR101862178B1 (ko) 맞춤형 포스팅 방법 및 이를 운용하는 서버
CN115292482B (zh) 一种用于公益诉讼的消息处理方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1221530

Country of ref document: HK

WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160420

WD01 Invention patent application deemed withdrawn after publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1221530

Country of ref document: HK