CN106462474B - 使用故意延迟发送的网络超时 - Google Patents

使用故意延迟发送的网络超时 Download PDF

Info

Publication number
CN106462474B
CN106462474B CN201580024137.3A CN201580024137A CN106462474B CN 106462474 B CN106462474 B CN 106462474B CN 201580024137 A CN201580024137 A CN 201580024137A CN 106462474 B CN106462474 B CN 106462474B
Authority
CN
China
Prior art keywords
message
timeout
network
data
timeout message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201580024137.3A
Other languages
English (en)
Other versions
CN106462474A (zh
Inventor
J.C.莫格尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of CN106462474A publication Critical patent/CN106462474A/zh
Application granted granted Critical
Publication of CN106462474B publication Critical patent/CN106462474B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/28Timers or timing mechanisms used in protocols
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/547Remote procedure calls [RPC]; Web services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/30Definitions, standards or architectural aspects of layered protocol stacks
    • H04L69/32Architecture of open systems interconnection [OSI] 7-layer type protocol stacks, e.g. the interfaces between the data link level and the physical level
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/10Program control for peripheral devices
    • G06F13/12Program control for peripheral devices using hardware independent of the central processor, e.g. channel or peripheral processor
    • G06F13/124Program control for peripheral devices using hardware independent of the central processor, e.g. channel or peripheral processor where hardware is a sequential transfer control unit, e.g. microprocessor, peripheral processor or state-machine
    • G06F13/128Program control for peripheral devices using hardware independent of the central processor, e.g. channel or peripheral processor where hardware is a sequential transfer control unit, e.g. microprocessor, peripheral processor or state-machine for dedicated transfers to a network

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

提供了一种用于通过利用向网络控制器140内部发送故意延迟的信息发送而生成网络超时的***和方法。例如,根据这一***和方法,网络控制器140在网络510上向外部发送数据消息并且数据消息激发响应网络消息。网络控制器140还发送与数据消息对应的超时消息;然而,超时消息在被内部发送之前被故意延迟预定的持续时间(520)。控制器主机设备接收响应消息和超时消息的至少一个并且确定哪个是最先被接收到的。如果超时消息被接收到(540),则与发送的数据消息关联的请求被认为已超时(550)。

Description

使用故意延迟发送的网络超时
相关申请的交叉引用
本申请是2014年6月2日提交的美国专利申请第14/293,438号的继续申请,美国专利申请第14/293,438号要求了于2014年5月8日提交的美国临时专利申请第61/990,378号的提交日的优先权,在此通过引用将该申请的公开内容并入。
背景技术
计算机网络化和电信中,计算设备彼此发送消息并且经常在继续之前必须等待响应。为避免无限期地等待,该计算设备可以包括超时机制,当其被触发时,警告计算设备执行一些动作。例如,如果在超时期间未收到响应,则计算设备可以重发消息或关闭连接。超时的持续时间通常基于预计应有响应的时间量。
随着计算设备和网络化基础设施迅速增加,它们能够更高速地处理更多消息。因此,超时所需的持续时间已减少。这对于实现能有效、准确且可靠地设置和处理具有短持续时间的超时的网络超时机制产生了挑战。
传统的超时机制是基于实现于软件中的网络超时。一个示例是在数据结构中调度超时请求,每当发生内核时钟中断就检查超时请求。问题是内核时钟中断成本高并且可能不能足够频繁地发生以可靠地触发具有短持续时间的超时。其它超时机制利用软件中实现的忙循环。忙循环可以容纳具有较短时间持续的超时,但是它可能在所述延迟的持续时间内占用CPU线程,因而计算效率较差。
发明内容
本公开涉及设置细粒度超时。例如,具有发送(TX)队列和接收(RX)队列的大集合的网络控制器可以被单独地指定给用户模式进程(例如,使用现有SR-IOV硬件)。用户模式或内核模式软件可以高效地轮询所述接收队列以检查传入的分组,并且可以以相对低的成本直接地将分组缓冲入队到任一种类型的队列。网络控制器还可以将分组从其TX队列中的一个高效地转移到其RX队列中的一个,而不浪费实际网络带宽(如,支持“环回”)。网络控制器可以将当前在TX队列头部的分组的发送延迟在该TX分组描述符中指定的间隔。例如,网络控制器可以具有能够提供微秒或更小量级的精度的内部时钟,因而可以将两个分组从TX队列中移出,并且以不短于第二个分组的分组描述符中指定的延迟来发送第二个分组。第一主机上的线程可以以零发送延迟向第二远程主机发送远程过程调用(RPC)消息,之后以例如137usec延迟向其自身发送短超时消息。如果第一主机首先接收到RPC响应,则该RPC被视为成功。然而,如果第一主机首先接收到其自身的超时消息,则它可以将该RPC视为已超时。
本公开的一方面提供了一种方法,包含由一个或多个处理器在网络上向外部发送数据消息,该数据消息激发响应消息,并且由一个或多个处理器在内部发送超时消息,该超时消息与数据消息对应并且故意地被延迟预定的持续时间。该方法进一步包含由一个或多个处理器接收响应消息和超时消息中的至少一个,并且由一个或多个处理器确定响应消息或超时消息中至少一个的哪个被最先接收。如果所述超时消息被最先接收,则该方法进一步包含将与数据消息关联的请求识别为已超时。
本公开的另一方面提供了一种***,包含一个或多个处理器和与一个或多个处理器耦接的存储器。该存储器包括可由一个或多个处理器运行的指令,用以在网络上向外部发送数据消息,该数据消息激发响应消息,在内部发送超时消息,该超时消息与数据消息对应并且故意地延迟预定的持续时间,接收响应消息和超时消息的至少一者,确定响应消息或超时消息的至少一者的哪个被最先接收,并且如果超时消息被最先接收,则将与数据消息关联的请求识别为已超时。
本公开的又一方面提供了一种记录指令的非暂态计算机可读介质,当指令被一个或多个处理器运行时导致该一个或多个处理器执行方法。这种方法包含在网络上向外部发送数据消息,该数据消息激发响应消息,在内部发送超时消息,该超时消息与数据消息对应并且故意地延迟了预定的持续时间,接收响应消息和超时消息中的至少一个,确定响应消息或超时消息的至少一者中哪个被最先接收,并且如果超时消息本最先接收,则将与数据消息关联的请求识别为已超时。
附图说明
图1是根据本公开的方面的示例计算机***的示意图。
图2是根据本公开的方面的示例***的图。
图3A-D示出了根据本公开的方面的网络消息的示例流。
图4A-D示出了根据本公开的方面的网络消息的另一示例流。
图5是根据本公开的方面的实现网络超时的示例方法的框图。
具体实施方式
本技术一般地涉及用于网络通信的超时机制。该机制可以通过利用在内部向网络接口控制器(NIC)发送的故意延迟的超时消息传输来触发超时。这可以允许,例如,计算设备利用底层网络硬件来监视流量消息并且在适当时生成超时。
该超时机制可以包括定制的超时分组(custom timeout packets),其每一个与一个或多个传统数据分组(如,RPC、HTTP)对应。超时分组和数据分组一起在一个或多个发送队列上。每个超时分组可以与数据字段关联,该数据字段允许该机制将该分组的发送故意延迟预定的持续时间。一示例中,所述数据字段可以存储与延迟的持续时间关联的时间值。所述数据字段可以被包含在超时分组内(如,头部字段或主体内)或者可以与该分组分离,例如在该机制可访问的单独的数据结构中(如,传输分组描述符)。时间值可以具有次微秒分辨率并且是使用该机制生成的时基的绝对时间或相对时间(如,相对于其入队的时间)。
延迟的持续时间可以是可定制的并且可以非常接近于网络往返时间的长度或略微长于用于运行诸如RPC的远程交互的典型时间。当经过了延迟,NIC经其硬件环回功能向主机发送超时分组。如果超时分组先于对于相应的数据分组的响应到达,则与该数据分组关联的过程、任务、请求等被视为已超时。例如,主机可以停止等待对于该数据分组的响应,和/或可以重新发送新的数据分组。另一方面,如果该响应在超时分组到达前到来,则没有超时,并且NIC可以在超时分组被发送之前中止它或者简单地当接收到超时分组时忽略它。
NIC可以确定它是否应当以多种方式中的任意一种中止超时分组。例如,一个途径是将第二“门铃”与每个发送队列关联。门铃是I/O地址空间的小区域,主机软件在其中写入值以告知NIC它已将N个条目添加到发送队列。一示例中,第二门铃将允许主机软件指令NIC从发送队列中移除最开始的N个条目,并且丢弃它们。这将允许主机中止一个或多个超时分组。根据另一示例,只有当最开始的N个条目携带延迟值,例如N=1时,第二门铃才将允许主机软件指令NIC移除它们。这将只从发送队列中删除超时分组而非常规分组。
一示例中,该技术可以包括具有用于处理网络分组(如,RPC、HTTP)的多个发送队列和接收队列的网络控制器。每个队列可以被单独地指定给内核模式或用户模式软件,其可以高效地轮询所述接收队列以检查传入的分组并且能够以相对低的计算和/或时间成本将分组直接地入队到任意类型的队列。NIC可以将分组从其自身发送队列中的一个传输到其自身接收队列中的一个,而不使用实际网络带宽。NIC可以将当前在发送队列头部的超时分组的发送故意延迟在传输分组描述符(如,延迟字段)中指定的间隔。所述间隔定时可以利用NIC内部的时钟,该时钟与主机时钟同步并且提供微秒或更小量级的时间精度。当超时分组先于对应数据分组的响应被接收到时,NIC可以触发***中断或设置标志以警告内核模式或用户模式软件已发生超时,以便主机可以相应地做出反应。
另一示例中,计算设备上的线程可能想要向远程计算设备发送RPC消息。该线程可以选择——RPC消息应当在预定延迟值(例如,137微秒)后超时。该线程之后可以发送两个分组,第一分组可以是采用去往远程计算设备的TCP/IP分组的形式的实际RPC消息并且零发送延迟。第二分组可以包括指示“你已超时”的短网络消息,并且可以根据用户数据报协议(UDP)而被格式化并且具有137微秒的发送延迟。
图1示出了一个可能的***100,其中这里所公开的方面可以被实现。***100可以是包含通常存在于通用计算设备中的一个或多个处理器120、存储器130和其它组件的计算设备。尽管图1在功能上将处理器120和存储器130表示为***100内的单一块(***100也被表示为单一块),但该***可以包括并且这里所描述的方法可以涉及可以或不可以存放在同一物理外壳内的多个处理器、存储器和设备。
***100的存储器130可以存储处理器120可访问的信息,包括可由处理器120运行的指令131。存储器130还可以包括数据135,其可由处理器120取回、操作或存储。存储器130和这里所描述的其它存储器可以是能够存储可被相关处理器访问的信息的任意类型的存储装置,诸如硬盘驱动器、固态驱动器、存储卡、RAM、DVD、可写存储器或只读存储器。此外,存储器可以包括分布式存储***,其中诸如数据135的数据被存储在多个不同存储设备上,所述存储设备可以物理地位于相同或不同的地理位置。
指令131可以是由处理器120或其它计算设备运行的指令的任意集合。指令可被存储在用于立即由处理器处理的目标代码格式中,或者存储在包括脚本或独立源代码模块的集合的另一计算设备语言中,其按需解释或预先被编译。以下更具体地解释指令的功能、方法和例程。处理器120可以是任意传统的处理器,诸如市售CPU。替换地,处理器可以是诸如ASIC或其它基于硬件的处理器的专用组件。
计算设备100可以根据指令131取回、存储或修改数据135。数据可以包含足够识别相关信息的任意信息,诸如数字、描述性文本、专有代码、指针、对存储在诸如其它网络位置的其它存储器中的数据的引用,或由函数使用以计算相关数据的信息。
计算设备100可以是服务器计算设备106、客户端计算设备107、移动计算设备108或路由计算设备109。每个计算设备可以包括可用于通过网络125与其它计算设备通信的一个或多个控制器140。网络控制器140可以是与计算设备100耦接的单独的计算设备,诸如所图示的具有其自身的处理器160和存储器150的单独的计算模块(如,PCIe卡、USB设备或子卡)。替换地,网络控制器140可被集成到计算设备并且与诸如处理器120和存储器130的计算设备共享资源。
网络控制器140可以包括用于向网络通信信道提供物理接入的硬件和软件(如,固件)的组合。网络通信信道可以基于有线或无线连接。每个网络控制器可以包括一个或多个处理器160,其可包含专用集成电路(ASIC)、现场可编程门阵列(FPGA)、通用处理器或任何其它类型的处理器。处理器160可与存储器130耦接,存储器130能够存储计算机可读指令151和数据155。数据155可以包括用于存储网络数据(如,网络消息)的发送缓冲157和接收缓冲159。一示例中,网络控制器140可以是网络接口控制器(NIC)(如,以太网、异步传输模式(ATM)、令牌环)、光适配器(如,光纤通道)或无线网络适配器(如,WiFi、蓝牙、LTE、GSM、CDMA或TDMA)。
如图2所示,计算设备200可以包括具有用于与网络控制器140的硬件交互的设备驱动器210的操作***或管理程序205。网络控制器140可以包括一个或多个发送缓冲157和一个或多个接收缓冲159。这些缓冲能够存储多个网络消息,诸如数据网络消息220、响应网络消息225和超时网络消息230。
缓冲157和159可以是数据结构,诸如队列、循环队列、链表、数组、堆和其它相似的存储网络消息同时保持顺序并且允许添加和移除条目的数据结构。每个缓冲(如,队列)可以包括多个槽(slot)240-242,每一槽能够存储一个或多个网络消息。一示例中,发送缓冲可以包括8个单独的优先队列,每一队列具有1,000或更多槽以存储网络消息。
网络消息(如,220、225、230)可以是能够或被配置为在网络通信信道上发送的任意消息。例如,网络消息可以是分组(packet)、帧、单元(cell)、数据段(data segment)或数据报,并且可以准备在物理介质上发送或可以需要额外的预处理(如,仍然需要目的MAC地址)。网络消息可以被格式化以支持专有通信协议或工业标准协议(如,IP、TCP、UDP)。
数据网络消息220可以是一种类型的网络消息并且可以包括对于数据的请求。对于数据的请求当被远程计算设备接收到时可以激发响应网络消息225。响应网络消息225可以是包含与该原始数据网络消息中含有的所述请求对应的数据的一种类型的网络消息。一示例中,数据网络消息220可以是用作***或进程之间的进程间通信的形式的网际协议(IP)分组(如,远程过程调用(RPC)分组)。这可由计算设备使用以与远程计算设备远程地交互。远程交互可以包括提供用于在远程计算设备上运行的指令和/或参数,诸如远程方法调用(如,Java RMI、SOAP、ONC-RPC、XML-RPC)。一旦指令(如,数据请求)已运行,结果数据就可以被包括在一个或多个响应网络消息中并且被发送回该原始计算设备。
超时消息230也可以是一种类型的网络消息,并且可以被用来指示所请求的过程、任务等已超时。一些示例中,超时消息230可被用来调度和触发网络超时。每个超时消息230可以与一个或多个数据网络分组220对应或者关联。每个超时消息230可以或者被配置为在网络125上被发送,但也可以保留在计算设备200内。例如,计算设备200可以经环回功能向其自身发送此超时消息230。
每个超时消息230还可以与预定的持续时间(如,延迟值)关联,该持续时间可由计算设备200使用以故意延迟超时消息230的发送。延迟值可以是大量时钟周期或按秒、毫秒、微秒、纳秒或更高分辨率量级的时间量。延迟值可以是相对值(如,5微秒或50纳秒)或者它可以是基于绝对起始点的绝对值(如,未来时间)。
延迟值(如,预定的持续时间)可以被定制并且可以非常近似于期望的网络超时的长度。一示例中,延迟值可以近似网络往返时间的长度。另一示例中,延迟值可以比运行诸如RPC的远程交互的典型持续时间略大。这可以考虑往返时间以及远程机器运行、分组打包和发送结果数据所需的持续时间。延迟值还可以根据通信协议动态地确定,例如超时时段可以基于RPC标准。
延迟值可被存储在***(如,网络控制器)可访问的任意位置。一示例中,延迟值可被存储在超时消息230内,诸如存储在超时网络消息230的头部内或该网络消息的正文内的数据字段中。替换地,延迟值可被存储在与超时网络消息230对应或关联的网络消息外部的数据结构中。当外部数据结构被存储在任意缓冲(如,发送缓冲157或接收缓冲159)时,它可与超时网络消息230关联,或者,当外部数据结构在发送缓冲中时它可以只与该超时网络消息230关联并且可以在该超时消息被发送后被移除。一示例中,延迟值可以指示以微秒或纳秒测量的持续时间,并且可以被包括在消息描述符(如,外部分组描述符)中,当在发送队列中时,该消息描述符与超时网络消息230关联。
网络控制器140和设备驱动器210可以被配置为提供到缓冲157和159的内核模式软件和用户模式软件访问。这一访问包括轮询发送和接收缓冲以检查消息条目的状态、内容或关联的数据(如,延迟值)的能力,以及添加、移除或修改缓冲(如,入队或出队)中的条目的能力。例如,这可以通过使设备驱动器210暴露用于直接地操作缓冲的较低层的功能(如,经API)来进行。这还可以包括对在管理程序穿越(hypervisor pass-through)或管理程序绕过(hypervisor by-pass)的支持,如果可用的话。一示例中,这可以允许每个缓冲(如,队列)被独立地指定给用户模式或内核模式进程并且可被用户模式或内核模式进程访问。
图3A-D示出了可以导致产生网络超时的发送缓冲157和接收缓冲159之间的网络消息的示例流。如图3A所示,设备驱动器210可以指示网络控制器140将数据网络消息320和对应的超时网络消息330入队。如所示,在该队列的头部有单一的数据网络消息320,其后跟着单一的超时网络消息330。当网络消息在该队列的头部时,它可以准备好被处理并且随后被发送。
发送可以在计算设备的外部,或者在计算设备的内部(如,NIC 140可以向其自身发送消息)。图3A中,数据消息320在该队列的头部。如箭头370所示,数据消息320可在物理网络上向外发送。例如,消息可被从本地计算设备发送到远程计算设备。根据一示例,数据网络消息可被编码为电信号并且在有线连接(如,经以太网线缆发送的以太帧)上被发送。
如图3B所示,在数据消息320被发送后,它从发送缓冲157上被移除并且超时消息330被移到缓冲157的头部。超时消息330由网络控制器140发送到网络控制器140(如,在内部发送)。超时网络消息330被故意延迟地发送,例如,网络控制器140可以等待或推迟网络消息的发送直到在发送消息前已经过延迟时段。
网络控制器140可以通过将延迟值和与网络消息关联的时间戳比较来确定已经过延迟时段。时间戳可以具有微秒或更小时间量的分辨率,并且可以指示网络消息被添加到缓冲(如,被入队或被重新入队)的瞬时时刻。时间戳可被网络控制器的处理器读取并且被与相关的延迟值比较以确定是否已经过该故意延迟。当经过该延迟时,网络控制器可以立即在内部发送消息或者可以将其标记为可用于随后当下层硬件有能力时在内部被发送。
如图3C所示,在内部发送延迟后,超时消息330在网络控制器140的接收缓冲159中被接收。在内部发送消息可以包括在不通过网络,或不向计算设备200和/或网络控制器140外部发送的情况下发送消息。一示例中,网络控制器可被配置为具有纯硬件环回(hardware-only loopback path)路径,诸如箭头372所示。例如,纯硬件环回可以包括网络控制器处理器将网络消息330从发送缓冲157传输到接收缓冲159,其中这两个缓冲都被存储在网络控制器140的存储器150中。如果缓冲是队列,则这可以包括将网络消息从发送队列中移出并且将其入队到接收队列,而不向外部发送该消息。纯硬件环回可以不同于传统环回,因为传统环回只被实现于软件中,诸如操作***的设备驱动器或网络堆栈,并且被设计为完全地绕过网络接口控制器。
如图3D所示,超时网络消息330先于响应网络消息325被接收。这一情况下,接收到的超时消息330指示请求或任务已超时。例如,计算设备200的软件可以将延迟的分组解释为超时。因而,计算设备200可以决定取消或停止等待对于请求或任务的响应。
一些示例中,网络控制器140可被设计为解释超时网络消息330的接收以生成或触发超时。超时可以表示已经过了预定的时间段而没有发生预期事件(如,响应的接收)。超时可以是超时信号或超时标志,其用来通知更高层软件——网络超时已发生,从而,例如,更高层软件(如,操作***或管理程序)可以采取行动以解决该问题(如,重发网络消息)。超时信号可以包括,例如,基于硬件的中断,其可以被设备驱动器检测或与设备驱动器接口以通知更高层软件发生了超时。超时还可以包括设置超时标志(如,数据结构成员或字段),其可在轮询时被更高层软件检测到。图4A-D示出了发送缓冲157和接收缓冲159之间的网络消息流的另一示例。这一示例中,基于消息流,网络控制器140未将延迟的消息传递到计算设备200,因而计算设备200未判定所请求的过程已超时。还是这一示例所示,NIC发送多个数据消息和一个超时消息,其中一个超时消息与多个数据消息的每个对应。
如图4A所示,设备驱动器210可以指示网络控制器140将数据消息220和420加上超时消息430入队。超时消息与数据消息420和440两者对应,并且可以与诸如1秒的绝对延迟值关联。这一示例中,数据网络消息420在发送缓冲157的头部,其后跟着数据消息440和与数据消息420和440两者对应的超时消息430。数据消息420可以被发送到外部,如箭头470所示和以上关于图3A所讨论的。
移到图4B,数据消息440类似地被发送到外部,如箭头471所示。超时消息430可被故意延迟地发送,比如,故意延迟1秒。例如,超时消息将留在发送缓冲157中直到故意延迟时段已期满。如图4C所示,响应网络消息425和445可以在故意延迟的期满之前——如,当超时网络消息430仍在发送缓冲157中时——在接收缓冲159中被接收。如果对于与超时消息430关联的数据消息420、440的响应425、445已到达,那么超时消息430可以不再是必要的。相应地,例如,计算设备200软件当接收到响应425、445时,意识到超时消息430不再是必要的。如此,当超时消息430到达时,该软件可以忽略它。替换地,该软件可以在发送之前中止超时消息430,如,使用第二门铃。中止超时消息430可以是有益的,因为其避免在等待将要发送的超时消息430时延迟后续的发送。
一些示例中,网络控制器140可被设计为识别何时超时消息430是不必要的。例如,网络控制器140可以在内部发送超时消息,但可以在接收缓冲159中接收到它时忽略它。另一示例中,网络控制器140可以在发送超时网络消息前将其移除,如480所示。这可以允许网络控制器避免浪费缓冲空间和计算容量(computing power)。
如图4D所示,超时网络消息430可被从发送缓冲157中移除。该移除可以以多种方式实现,例如网络控制器140可以从发送缓冲删除该消息(如,出队),或用缓冲中的另一消息盖写。另一示例中,可以将消息留在缓冲中,但可以修改消息描述符(如,分组描述符),从而超时网络消息430被发送到空的目的地。
尽管以上示例描述了超时消息仅与两个数据消息关联,但任意数目的数据消息都可以与一个超时消息一起发送。例如,一个超时消息可被用来对100,1000或更多数据消息设置细粒度超时。
除了图2-4所示的操作,现在还将描述根据本发明的多个方面的各种操作。应当理解,以下操作不必按下述准确的顺序执行。而是,各种步骤可以按相反的顺序或同时地被处理。
图5提供了示出方法500的示例流图。例如,方法500可由主机设备的软件、网络控制器140或其一些组合来运行。以下参考图1-4的***描述方法500。然而,应当理解,方法500可以实现在具有不同配置的多个***中任意一个。还应当理解,以上方法中涉及的操作不需要按所述准确的顺序执行。而是,各种操作可按不同顺序或同时地处理,并且操作可以被添加或省略。
块510中,网络控制器140可以在网络通信信道上向外部发送一个或多个数据网络消息220。例如,计算设备200可以将一个或多个数据网络消息220和一个或多个对应的超时网络消息230添加到发送缓冲157。发送缓冲可被存储在网络控制器140的存储器150中,尽管其可***作***或管理程序访问,但只可以被网络控制器140的处理器160修改而不能被计算设备200的处理器120修改。替换地,发送缓冲157可以存储在存储器130(如,主存储器)中,并且可被处理器120和160访问。数据消息220的发送可以通过网络控制器140外部的有线或无线连接来进行。数据网络消息220可以包括对于数据的请求,其可以引发响应网络消息。
块520中,网络控制器140可以在故意延迟后在内部发送与一个或多个数据消息220对应的超时消息230。例如,网络控制器140可以经环回功能将超时消息230发送到计算设备200。一些示例中,网络控制器140可以检查与超时消息230关联的延迟值并且故意延迟发送直到已经过适当的持续时间。延迟期间,网络控制器可以执行其它功能,诸如发送其它网络消息。一旦已经过延迟,网络控制器140就可以在内部发送超时网络消息。
如块530所示,响应于数据消息220,确定是否已接收到响应网络消息225。例如,数据消息220在RPC中时,可以确定是否已接收到一个或多个响应分组。例如,响应分组可被接收在计算设备200的接收缓冲159中。
如果接收到对于一个或多个数据消息220的响应,块535中忽略或中止相应的超时消息230。例如,网络控制器140可以从计算设备200软件接收第二门铃,其指示超时消息230应当被从发送缓冲157中移除。这可以减少缓冲上的数据量,并且减少与发送和分析关联的计算周期。作为另一示例,如果在对于一个或多个数据消息220的所有响应都被接收后才接收到对应的超时消息230,则计算设备200可被编程为忽略对应的超时消息230。
如果未接收到对于一个或多个数据消息220的响应,则块540中确定在经过了故意延迟后是否在内部接收到对应的超时网络消息230。如果超时消息230仍未被接收,则计算设备200可以等待(块545)并且继续寻找对于所发送的一个或多个数据消息220的响应。
块550中,如果确定已接收到超时消息230,则与一个或多个数据消息220关联的操作被视为已超时。例如,数据消息在RPC中并且超时消息先于对于RPC的响应被接收时,NIC将该RPC视为已超时。其它示例中,超时可以采用由网络控制器140发送给设备驱动器210的警报或中断的形式,其可以随后被发送到操作***或管理程序205。
上述***、方法和示例是有益的,因为它们提供了设置细粒度超时以及精确地且以高效计算方式处理超时。如此,它们比现有网络超时机制更好地适应延时敏感的应用。这些***和方法还可以通过检测更快地检测网络超时并且避免浪费时间来允许未来和现有的应用更快且更可靠地运行。
由于以上讨论的这些和特性的其它变化及组合可在不脱离权利要求所限定的主题的情况下被使用,所以实施例前面的描述应当作为阐述而非作为限制权利要求所限定的主题。作为示例,前面的操作不必要按上述准确的顺序执行。而是,各种步骤可以不同顺序或同时地处理。除非另有所声明,步骤才可以被省略。并且,这里所述的示例的提供,以及用“诸如”、“包括”等措辞的从句,不应当被解释为将权利要求的主题限制在特定示例;而是,示例意图只阐述许多可能的实施例的一个。进一步,不同图中相同的附图标记可以示出相同或相似的元件。

Claims (20)

1.一种用于发送数据的方法,包含:
由一个或多个计算设备通过网络向外部发送一个或多个数据消息,所述一个或多个数据消息与请求关联并且激发响应消息;
由所述一个或多个计算设备在内部发送来自所述一个或多个计算设备的发送队列的超时消息,所述超时消息与所述一个或多个数据消息对应并且被故意延迟预定的持续时间;
由所述一个或多个计算设备在所述一个或多个计算设备的接收队列中接收所述响应消息和所述超时消息中的至少一个;
由所述一个或多个计算设备确定所述响应消息或所述超时消息中的至少一个的哪个被最先接收;以及
当所述超时消息被最先接收时,由所述一个或多个计算设备将所述请求识别为已超时。
2.如权利要求1所述的方法,进一步包含:将所述数据消息和所述超时消息添加到网络控制器的发送队列;以及
其中在内部发送超时消息包含将所述超时消息从发送队列中移出并且将所述超时消息入队到网络控制器的接收队列。
3.如权利要求2所述的方法,进一步包含:
当所述响应消息在所述超时消息的发送之前被接收时,将所述超时消息从发送队列中移出。
4.如权利要求3所述的方法,进一步包含由一个或多个计算设备至少基于接收到的信号确定是否将所述超时消息从发送队列中移出,所述接收到的信号指令一个或多个计算设备将消息从发送队列的头部移出。
5.如权利要求1所述的方法,其中在内部发送所述超时消息包含使用网络控制器的环回功能向主机设备发送所述超时消息。
6.如权利要求1所述的方法,其中所述数据消息是被配置为远程过程调用的一个或多个IP分组,并且对于故意延迟的预定的持续时间长于运行远程过程调用的估计时间。
7.如权利要求1所述的方法,其中对于故意延迟的预定的持续时间大于平均的网络消息往返时间。
8.一种用于发送数据的***,包含:
一个或多个处理器;以及
与所述一个或多个处理器耦接的存储器,所述存储器包括由一个或多个处理器运行以执行以下操作的指令:
通过网络向外部发送数据消息,所述数据消息与请求关联并且激发响应消息;
在内部发送来自所述存储器的发送队列的超时消息,所述超时消息与所述数据消息对应并且在被内部发送之前被故意地延迟预定的持续时间;
在所述存储器的接收队列中接收所述响应消息和所述超时消息中的至少一者;
确定所述响应消息或所述超时消息中的至少一个的哪个被最先接收;以及
当所述超时消息被最先接收时,将所述请求识别为已超时。
9.如权利要求8所述的***,其中所述一个或多个处理器进一步被配置为:
将所述数据消息和所述超时消息添加到网络控制器的发送队列;以及
其中在内部发送所述超时消息包含将所述超时消息从发送队列中移出并且将所述超时消息入队到网络控制器的接收队列。
10.如权利要求9所述的***,其中所述一个或多个处理器进一步被配置为,当所述响应消息在发送所述超时消息之前被接收到时,将所述超时消息从发送队列中移出。
11.如权利要求10所述的***,其中所述一个或多个处理器进一步被配置为至少基于接收到的信号确定是否将所述超时消息从发送队列中移出,所述接收到的信号指令一个或多个处理器将消息从发送队列的头部移出。
12.如权利要求8所述的***,其中在内部发送超时消息包含使用网络控制器的环回功能向计算设备发送所述超时消息。
13.如权利要求8所述的***,其中所述数据消息是被配置为远程过程调用的一个或多个IP分组,并且对于故意延迟的预定的持续时间长于运行远程过程调用的估计时间。
14.如权利要求8所述的***,其中对于故意延迟的预定的持续时间大于平均的网络消息往返时间。
15.一种非暂态计算机可读介质,其记录有指令,当指令被一个或多个处理器运行时,导致一个或多个处理器执行方法,包含:
通过网络向外部发送数据消息,所述数据消息与请求关联并且激发响应消息;
在内部发送来自发送队列的超时消息,所述超时消息与所述数据消息对应并且在被内部发送之前被故意延迟预定的持续时间;
在接收队列中接收所述响应消息和所述超时消息中的至少一个;
确定响应消息或超时消息中的至少一个的哪个被最先接收;以及
当超时消息被最先接收时,将所述请求识别为已超时。
16.如权利要求15所述的非暂态计算机可读介质,其中,所述方法进一步包含:
将数据消息和超时消息发送到网络控制器的发送队列;以及
其中在内部发送超时消息包含将超时消息从发送队列中移出并且将超时消息入队到网络控制器的接收队列。
17.如权利要求15所述的非暂态计算机可读介质,其中所述数据消息是被配置为远程过程调用的一个或多个IP分组,并且对于故意延迟的预定的持续时间长于运行远程过程调用的估计时间。
18.如权利要求15所述的非暂态计算机可读介质,其中对于故意延迟的预定的持续时间大于平均的网络消息往返时间。
19.如权利要求16所述的非暂态计算机可读介质,其中,所述方法进一步包含发送多个数据消息,所述多个数据消息的每个与超时消息对应。
20.如权利要求15所述的非暂态计算机可读介质,其中,所述方法进一步包含:
当响应消息在超时消息的发送之前被接收时,将超时消息从发送队列中移出。
CN201580024137.3A 2014-05-08 2015-05-07 使用故意延迟发送的网络超时 Active CN106462474B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201461990378P 2014-05-08 2014-05-08
US61/990,378 2014-05-08
US14/293,438 US9614939B2 (en) 2014-05-08 2014-06-02 Network timeouts using intentionally delayed transmissions
US14/293,438 2014-06-02
PCT/US2015/029645 WO2015171866A1 (en) 2014-05-08 2015-05-07 Network timeouts using intentionally delayed transmissions

Publications (2)

Publication Number Publication Date
CN106462474A CN106462474A (zh) 2017-02-22
CN106462474B true CN106462474B (zh) 2020-03-31

Family

ID=54368901

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580024137.3A Active CN106462474B (zh) 2014-05-08 2015-05-07 使用故意延迟发送的网络超时

Country Status (5)

Country Link
US (1) US9614939B2 (zh)
EP (1) EP3140974B1 (zh)
CN (1) CN106462474B (zh)
DK (1) DK3140974T3 (zh)
WO (1) WO2015171866A1 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10116772B2 (en) * 2014-11-14 2018-10-30 Cavium, Inc. Network switching with co-resident data-plane and network interface controllers
US10447773B2 (en) * 2015-12-29 2019-10-15 General Motors Llc Aggregating vehicle-related big data
US10237171B2 (en) * 2016-09-20 2019-03-19 Intel Corporation Efficient QoS support for software packet processing on general purpose servers
US10455040B2 (en) 2017-01-30 2019-10-22 Microsoft Technology Licensing, Llc Deferring invocation requests for remote objects
CN109284196B (zh) * 2018-09-30 2021-08-31 Oppo广东移动通信有限公司 消息处理方法及电子装置
CN110825534B (zh) * 2019-09-18 2023-11-28 深圳云盈网络科技有限公司 模组间通讯msg命令集的实现方法
US11476928B2 (en) * 2020-03-18 2022-10-18 Mellanox Technologies, Ltd. TDMA networking using commodity NIC/switch
CN114138520B (zh) * 2020-05-13 2022-06-28 浙江创邻科技有限公司 分布式消息处理方法及***
US11886938B2 (en) * 2021-03-11 2024-01-30 Microsoft Technology Licensing, Llc Message communication between integrated computing devices
CN114039707B (zh) * 2021-11-09 2023-11-07 中国人民解放军国防科技大学 基于SRv6可编程网络的报文传输超时处理方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101178667A (zh) * 2007-12-03 2008-05-14 中兴通讯股份有限公司 一种***进程调度下无效超时消息的方法及消息发送方法
CN103067258A (zh) * 2012-12-14 2013-04-24 北京思特奇信息技术股份有限公司 一种消息超时检测处理方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5224095A (en) 1990-01-30 1993-06-29 Johnson Service Company Network control system and method
FI108499B (fi) * 1998-02-03 2002-01-31 Nokia Corp Palvelujen tarjoaminen tietoliikenneverkossa
US7024556B1 (en) * 2000-06-02 2006-04-04 3Com Corporation Distributed system authentication
US7363342B1 (en) * 2003-07-08 2008-04-22 Microsoft Corporation Method and apparatus for providing web services in a collaborative computing system
US8494979B2 (en) * 2004-01-07 2013-07-23 International Business Machines Corporation Detection of unknown scenarios
US20070198629A1 (en) * 2006-02-21 2007-08-23 Nec Laboratories America, Inc. Scalable Content Based Event Multicast Platform
US9112808B2 (en) * 2007-02-06 2015-08-18 At&T Intellectual Property Ii, L.P. Devices, systems, and methods for providing data
US8229596B2 (en) * 2008-05-16 2012-07-24 Hewlett-Packard Development Company, L.P. Systems and methods to interface diverse climate controllers and cooling devices
US9135094B2 (en) * 2009-06-22 2015-09-15 Microsoft Technology Licensing, Llc Adding configurable messaging functionality to an infrastructure
CA2854466A1 (en) * 2011-11-03 2013-05-10 Raytheon Company Intrusion prevention system (ips) mode for a malware detection system
US9942196B2 (en) * 2014-05-01 2018-04-10 The Johns Hopkins University Canonical network isolator component

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101178667A (zh) * 2007-12-03 2008-05-14 中兴通讯股份有限公司 一种***进程调度下无效超时消息的方法及消息发送方法
CN103067258A (zh) * 2012-12-14 2013-04-24 北京思特奇信息技术股份有限公司 一种消息超时检测处理方法

Also Published As

Publication number Publication date
US20150326698A1 (en) 2015-11-12
EP3140974A1 (en) 2017-03-15
WO2015171866A1 (en) 2015-11-12
US9614939B2 (en) 2017-04-04
EP3140974B1 (en) 2018-07-11
DK3140974T3 (en) 2018-07-30
CN106462474A (zh) 2017-02-22

Similar Documents

Publication Publication Date Title
CN106462474B (zh) 使用故意延迟发送的网络超时
US11934340B2 (en) Multi-path RDMA transmission
US11412042B2 (en) Remote NVMe activation
CN110784415B (zh) 一种ecn快速响应的方法及装置
KR20220045982A (ko) 데이터 패킷을 송신하는 방법, 및 이 방법을 실시하는 장치
WO2023240998A1 (zh) 数据包处理方法、通信芯片及计算机设备
EP3694164A1 (en) Data transmission method and device, and computer storage medium
US20140297791A1 (en) Communication apparatus, method of controlling the same, and storage medium
US10372667B2 (en) Communication apparatus and control method thereof
US9590909B2 (en) Reducing TCP timeouts due to Incast collapse at a network switch
EP2311226B1 (en) Controlling data flow through a data communications link
US9544401B2 (en) Device and method for data communication using a transmission ring buffer
US20160285607A1 (en) Communication apparatus, method for controlling communication apparatus, and program
EP3977705B1 (en) Streaming communication between devices
CN109660322B (zh) 一种数据处理方法、装置及计算机存储介质
WO2014057596A1 (ja) 無線通信装置、無線通信方法、および無線通信制御プログラム
US11784933B2 (en) Traffic shaping offload on a network interface controller
JP4894012B2 (ja) データ通信システム、通信機、データ通信方法及び通信制御用プログラム
CN115776475A (zh) 一种消息处理方法、装置、电子设备及计算机存储介质
KR20210073039A (ko) 효율적 메시지 유실 감지 및 재전송을 처리하는 dds 미들웨어 장치의 동작 을 위한 프로그램
KR20210073046A (ko) 기록매체
KR20210073037A (ko) 효율적 메시지 유실 감지 및 재전송을 처리하는 dds 미들웨어 장치의 동작 방법
KR20210073034A (ko) 효율적 메시지 유실 감지 및 재전송을 처리하는 dds 미들웨어 시스템
KR20210073031A (ko) 효율적 메시지 처리를 제공하는 dds 미들웨어 장치의 동작을 위한 프로그램
CN115834730A (zh) 支持优先级乱序的tcp数据包收发方法及***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: American California

Applicant after: Google limited liability company

Address before: American California

Applicant before: Google Inc.

GR01 Patent grant
GR01 Patent grant