CN107003710A - 包括多个相异的处理器核心的处理器 - Google Patents
包括多个相异的处理器核心的处理器 Download PDFInfo
- Publication number
- CN107003710A CN107003710A CN201580062255.3A CN201580062255A CN107003710A CN 107003710 A CN107003710 A CN 107003710A CN 201580062255 A CN201580062255 A CN 201580062255A CN 107003710 A CN107003710 A CN 107003710A
- Authority
- CN
- China
- Prior art keywords
- processor
- core
- state
- processor core
- power manager
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013461 design Methods 0.000 claims abstract description 10
- 239000000872 buffer Substances 0.000 claims description 17
- 238000012545 processing Methods 0.000 claims description 16
- 230000008859 change Effects 0.000 claims description 11
- 238000000034 method Methods 0.000 claims description 9
- 230000004044 response Effects 0.000 claims description 7
- 238000012546 transfer Methods 0.000 claims description 7
- 230000005540 biological transmission Effects 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims 3
- 238000006243 chemical reaction Methods 0.000 claims 1
- 238000003860 storage Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 7
- 230000002093 peripheral effect Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000007726 management method Methods 0.000 description 5
- 230000005055 memory storage Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 101100498818 Arabidopsis thaliana DDR4 gene Proteins 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3234—Power saving characterised by the action undertaken
- G06F1/3293—Power saving characterised by the action undertaken by switching to a less power-consuming processor, e.g. sub-CPU
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3206—Monitoring of events, devices or parameters that trigger a change in power modality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3234—Power saving characterised by the action undertaken
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3234—Power saving characterised by the action undertaken
- G06F1/3287—Power saving characterised by the action undertaken by switching off individual functional units in the computer system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3234—Power saving characterised by the action undertaken
- G06F1/3296—Power saving characterised by the action undertaken by lowering the supply or operating voltage
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/461—Saving or restoring of program or task context
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02B—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO BUILDINGS, e.g. HOUSING, HOUSE APPLIANCES OR RELATED END-USER APPLICATIONS
- Y02B70/00—Technologies for an efficient end-user side electric power management and consumption
- Y02B70/10—Technologies improving the efficiency by using switched-mode power supplies [SMPS], i.e. efficient power electronics conversion e.g. power factor correction or reduction of losses in power supplies or efficient standby modes
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/50—Reducing energy consumption in communication networks in wire-line communication networks, e.g. low power modes or reduced link rate
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Computing Systems (AREA)
- Power Sources (AREA)
- Microcomputers (AREA)
Abstract
本发明的实施方案公开了可包括一个或多个处理器的集成电路。每个处理器可包括多个处理器核心,并且每个核心具有不同的设计/实施和性能水平。例如,一个核心可被实施用于高性能,但可具有较高的最小电压。另一核心可以较低的最大性能实施,但可针对效率进行优化并且可在较低的最小电压正确地操作。处理器可支持多个处理器状态(PState)。每个PState可指定操作点,并且可映射到处理器核心中的一个处理器核心。在操作期间,核心中的一个核心是活动的:当前PState映射到的核心。如果新的PState被选择并被映射到另一核心,则处理器可自动地将处理器状态上下文切换到新选择的核心,并且可在该核心上开始执行。
Description
背景技术
技术领域
本文所述实施方案涉及处理器,并且更具体地讲涉及形成处理器的多个处理器核心。
相关领域的描述
各种处理器被包括在电子***中用于执行提供某些量的用户功能性的软件。处理器可包括***中的中央处理单元(CPU),以及用于特定任务诸如图形、媒体处理等的专用处理器。一般来讲,处理器被设计用于在多个操作点(供电电压量值和时钟频率的设置)处操作。与较高操作点相比,较低操作点消耗较少电力,但也提供受限性能。对于某些工作负荷,受限的性能是足够的,并且可使用较低操作点。对于其它工作负荷,需要较高操作点来提供足够的性能。
在一些***中会经历各种各样的工作负荷。设计能提供要求最高的工作负荷所需的性能同时还支持将为很多经常执行的工作负荷提供足够性能的最低可能操作点的处理器已经变得具有挑战性。在电路停止正确发挥作用之前,在高操作点处操作的处理器只可支持将供电电压减小到特定水平。必须进行折中,通常,最低操作点被提高直到设计能满足所期望的高端操作点。随着高端操作点继续提高,越来越多的工作负荷是能够在最低操作点处执行的(并且能在甚至更低的操作点处执行很多工作负荷)。对于此类工作负荷,电力被不必要地消耗,这在常常操作于有限能量源诸如电池的移动***中是一个关键的因素。
发明内容
在实施方案中,集成电路可包括一个或多个处理器。每个处理器可包括多个处理器核心,并且每个核心具有不同的设计/实施和性能水平。例如,一个核心可被实施用于高性能,但其正确操作的最小电压可能较高。另一核心能够以较低的最大性能实施,但可针对效率进行优化并且能够以较低的最小电压正确地操作。处理器可支持多个处理器状态(PState)。每个PState可指定操作点(例如供电电压量值和时钟频率的组合),并且每个PState可映射到处理器核心中的一个处理器核心。在操作期间,核心中的一个核心是活动的:当前PState映射到的核心。如果新的PState被选择并被映射到不同的核心,则处理器可自动地将处理器状态上下文切换到新选择的核心,并且可在该核心上开始执行。
在实施方案中,该多个核心可允许处理器支持宽范围的PState,以及/或者可提供改善的电力效率,尤其是在较低PState处。处理器可支持增强的电池寿命(例如,在移动***中)。处理器可为并非性能要求高的工作负荷提供有效执行,这可减少各种***中的热需求。
附图说明
下面的具体实施方式将参照附图进行描述,现在对附图进行简要说明。
图1是处理器集群的一个实施方案的框图。
图2是对于一个实施方案例示如图1所示的PCore和ECore的效率与性能之间关系的图。
图3是例示处理器电力管理单元的一个实施方案的用于改变处理器状态的操作的流程图。
图4是例示处理器电力管理单元的一个实施方案的用于更换核心的操作的流程图。
图5是针对核心更换的上下文切换硬件的一个实施方案的框图。
图6是包括图1所示的处理器集群的一个实施方案的一种片上***(SOC)的一个实施方案的框图。
图7是***的一个实施例的框图。
尽管本公开所述的实施方案可允许各种修改形式和另选形式,但其特定实施方案在附图中以举例的方式示出并将在本文详细描述。然而,应当理解,附图和对其的详细描述并非旨在将实施方案限制于所公开的具体形式,相反,本发明旨在涵盖落入到所附权利要求的实质和范围内的所有修改形式、等同形式和另选形式。本文所使用的标题仅用于组织目的,并不旨在用于限制说明书的范围。如在整个本专利申请中所使用的那样,以允许的意义(即,意味着具有可能性)而非强制的意义(即,意味着必须)使用“可能”一词。类似地,字词“包括”是指包括但不限于。
各种单元、电路或其它部件可被描述为“被配置为”执行一个或多个任务。在此类上下文中,“被配置为”是对一般意味着“具有如下电路”的结构的宽泛表述:在操作期间执行一个或多个任务。如此,即使在单元/电路/部件当前未接通时,该单元/电路/部件也可被配置为执行任务。一般来讲,形成与“被配置为”对应的结构的电路可包括硬件电路和/或存储可执行以实现该操作的程序指令的存储器。该存储器可包括易失性存储器诸如静态随机存取存储器或动态随机存取存储器和/或非易失性存储器诸如光盘或磁盘存储装置、闪存存储器、可编程只读存储器等。类似地,为了描述的方便,可将各种单元/电路/部件描述为执行一项或多项任务。此类描述应当被解释成包括短语“被配置为”。表述被配置为执行一个或多个任务的单元/电路/部件明确地旨在对该单元/电路/部件不调用35U.S.C.§112(f)的解释。
本说明书包括对“一个实施方案”或“实施方案”的引用。短语“在一个实施方案中”或“在实施方案中”的出现不一定指相同的实施方案,尽管通常设想包括特征的任何组合的实施方案,除非在此明确地否认。特定特征、结构或特性可以与本公开一致的任何适当的方式结合。
具体实施方式
图1是处理器集群30的一个实施方案的框图。在所示实施方案中,包括多个处理器32A-32n和二级(L2)缓存34。处理器32A-32n耦接到L2缓存34,L2缓存被进一步耦接以与包括集群30的***的其它元件通信。在所示实施方案中,L2缓存34包括处理器电力管理器36,处理器电力管理器包括存储处理器32A-32n的PState的PState寄存器38。在各种实施方案中,每个处理器32A-32n可具有其自己的独立PState,处理器32A-32n的分组可共享PState,或者集群30可具有处理器32A-32n的共享的PState。处理器32A在图1中被详细图示为包括至少两个处理器核心:性能核心(PCore)40和效率核心(ECore)42。其它实施方案可包括附加的核心。每个核心40和42通过相应的电力开关44和46耦接到电源轨(VP)。因此,每个核心40和42可被独立地加电或掉电。其它处理器诸如处理器32n可与处理器32A类似。
每个处理器32A-32n可以是在***中执行的软件可将代码分配给以执行的实体。例如,软件可以是对***中的硬件进行控制的操作***(OS)的一部分。软件可以是对要执行的代码进行调度的线程或任务调度器。OS还可基于代码被执行的性能需求,为处理器32A-32n分配PState。OS可跟踪代码的行为以确定PState,可静态地记录每个线程/任务的信息以选择PState,等等,或它们的任何组合。此外或另选地,PState可受到***中的其它条件(热极限、可用电池电力等)影响。
每个可能的PState可指定处理器32A-32n的操作点。例如,操作点可包括处理器32A-32n中的VP的供电电压量值以及时钟的时钟频率。其它实施方案可以其它方式限定操作点,但一般来讲,操作点可指示处理器的性能和电力消耗。在一个实施方案中,PState可以是直接用作供电电压量值和时钟频率的一对值。在其它实施方案中,PState可以是用于获取供电电压量值和时钟频率的值(例如值表的索引)。
如图1所示,处理器32A包括PCore 40和ECore 42。处理器32A所支持的每个PState映射到核心40和42中的一个核心。每个核心40和42可具有映射到自己的不止一个PState。
在处理器32A-32n执行的代码改变和/或其它***考量保证PState改变时,PState寄存器38可被更新(例如,通过OS)。如果PState从映射到核心40和42中的一者(“活动核心”)的当前PState改变成映射到核心40和42中的另一者(“目标核心”)的新PState,则集群30可自动地在硬件上将处理器32A的处理器上下文从活动核心转移到目标核心。目标核心可在PState改变时被断电。转移上下文的过程可包括对目标核心通电、重置并初始化目标核心、转移处理器上下文、以及对活动核心断电(使目标核心成为活动核心)。执行可在目标核心(现在是活动核心)上继续。因此,核心之间的切换对于软件可以是不可见的。事实上,软件可能甚至不“知道”在处理器32A-32n中有多个核心。在一个实施方案中,核心40和42可具有不同的实施,但响应于任何给定指令流(包括特权指令)可准确地提供相同的程序行为。例如,一些指令集架构可包括唯一地标识***中的处理器的特征。例如,指令集架构常常具有返回被分配给***中CPU的值的“CPU ID”指令。***中的每个CPU分配有唯一值。核心40和42二者可返回相同的CPU ID值。另一形式的CPU ID指令可返回指示指令集架构的哪些可选特征由处理器实施的值。核心40和42二者也可返回用于该指令的相同值。可提供对于不同的具体实施可以不同的各种特定于模型的寄存器。核心40和42的特定于模型的寄存器可以是相同的。因此,在处理器32A-32B上执行的软件(包括操作***软件、应用程序软件等)可相同地操作,而与哪个核心40和42活动无关。
PCore 40和ECore 42可以是处理器32A-32n采用的指令集架构(ISA)的不同设计、不同实施。以另一种方式来看,PCore 40和ECore 42可实施不同的微架构。PCore 40可以是试图使性能最大化而电力节省是较少强调的设计目标的激进设计。PCore 40中的电路可以是激进的,这可防止PCore 40可操作于的最小供电电压如一些所述PState中所期望的那样低。另一方面,ECore 42可实施更保守设计,因此可在比PCore 40低的最小电压正确地操作。ECore 42的性能在给定操作点处可低于PCore 40,并且电力节省对于ECore 42可以是更高度强调的目标。ECore 42占据的半导体面积也可比PCore 40小。
虽然图1所示的示例在处理器32A中包括两个核心,但其它实施方案可包括不止两个核心。一个核心可以是在最低PState下操作的最有效核心,其它核心可针对沿性能/效率谱的其它点进行优化,直到再一个核心是处理器中的多个核心中的最高性能核心。可在各种实施方案中使用任意数量的核心。
一般来讲,处理器可以是被配置为实施所限定的指令集架构(ISA)的任何电路。各种ISA存在于各种实施方案并且可在各种实施方案中使用,诸如x86架构(也称为APX)、ARM架构、MIPS架构、PowerPC(现在简称为Power)等。处理器可采用多种微架构技术,包括上述的多核心方法。每个核心也可实施各种微架构技术。一般来讲,微架构可以是指执行单元和用于实施ISA的其它电路的组织。示例可包括按序对乱序执行、推测性执行、分支预测、超标量、超流水线等。除了各种其它技术之外,实施方案可实施微编码技术。
处理器32A-32n和/或处理器复合体30可被用作***中的任何处理器。例如,处理器可以是执行OS以控制***中的其它硬件并调度要执行的应用程序代码的中央处理单元(CPU)。CPU也可执行应用程序代码等等。处理器可以是专用处理器诸如针对图形操控进行优化的图形处理单元(GPU)、针对信号处理进行优化的数字信号处理器(DSP)、进行各个***设备部件中软件执行的嵌入式处理器等等。
在一个实施方案中,除了处理器上下文正被转移时之外,形成处理器32A-32n的核心40和42中的至多一者可在执行期间被通电。给定的处理器32A-32n可完全关闭(所有核心掉电)。处理器电力管理器36可被配置为利用电力开关44和46控制处理器核心的通电/加电和处理器核心的断电/掉电。
在一些实施方案中,核心40和/或42可实施数据缓存,该数据缓存可存储经修改的数据(即例如响应于处理器代码中的存储被执行而已经被写入缓存中、但还未写到存储器使得存储器中的数据不再是正确数据的数据)。除了转移处理器上下文之外,可从数据缓存刷新经修改的数据。特别地,数据可被刷新到L2缓存34,但可保持存储在L2缓存34中,除非L2缓存34的正常操作导致该数据被清除。一旦新活动核心正在执行,经修改的数据就可以是L2缓存34中的命中,并且可以相对低的延迟被移动到新活动核心的缓存。
处理器电力管理器36可被配置为管理处理器集群30内的PState转变。处理器电力管理器36可被配置为将供电电压量值转变传送到***级电力管理器或者直接传送到向***供应电压的电力管理单元(PMU)。处理器电力管理器36可被配置为与时钟生成硬件(在图1中未示出)诸如锁相环(PLL)等交互。
处理器上下文通常可包括任何软件可见的处理器状态。该状态通常可存储在寄存器中,该寄存器是能够作为ISA中定义的各种指令的操作数进行访问的。该状态可包括所架构的寄存器诸如各种类型(整数、浮点、向量等)的操作数寄存器。寄存器还可包括处理器控制寄存器诸如状态寄存器、处理器模式寄存器等。寄存器还可包括被定义为对于特定单元包括特定内容的专用寄存器。寄存器还可包括特定于模型的寄存器,其存在可以是架构特定的但其内容对于不同实施可以是不同的。
L2缓存34可具有任何容量和配置。L2缓存34可以包括处理器32A-32n中的缓存、可不包括该缓存、或者非包括性的。
图2是例示核心40和42的一个实施方案的效率与性能之间关系的图。虚线对应于ECore 42,并且实线对应于PCore 40。效率被图示在竖轴上,并且性能被图示在横轴上。效率可以多种方式(例如性能/瓦)来测量。性能可利用各种基准程序诸如Specint、SpecFlt、Dhrystone等来测量。处理器32A的各个PState沿图2中的曲线图示。对应于较高性能的PState在PCore曲线上,因为PCore针对性能进行了优化,其中对应于较低性能/较高能力节省的PState在ECore曲线上,其在较低性能水平更有效但在较高性能水平的性能较低。
因此,在图2的实施例中,PState 1、2和3映射到ECore 42,并且PState 4、5、6和7映射到PCore 40。可支持任意数量的PState,并且任意数量可被映射到各个核心。在另一个实施方案中,可支持连续PState设置。在此类实施方案中,可定义图2中曲线相交的转折点,在该点处可进行核心切换。
图3是例示处理器电力管理器36响应于写到PState寄存器38的新PState进行的操作的一个实施方案的流程图。然而,为了便于理解,框图以特定顺序示出,也可使用其它顺序。框可在处理器电力管理器36中的组合逻辑中并行执行。框、框的组合和/或流程图作为整体可在多个时钟周期内为管线式的。处理器电力状态管理器36可被配置为实施图3中所示的操作。
活动核心可以是当前正执行代码的核心40/42。在一些实施方案中,活动核心可以是在当前PState稳态操作期间被通电的唯一核心。如果新的PState不映射到活动核心(决策框50,“否”分支),则处理器电力状态管理器36可执行“核心更换”到新PState所映射到的核心(框52)。如果新的PState映射到活动核心,则活动核心可保持活动,并且执行可在PState改变时继续。如果新的PState是从当前PState的增大(决策框54,“是”分支),则供电电压量值可首先增大以支持增大的频率。因此,处理器电力状态管理器36可请求电压增大(框56),并等待电压增大完成(决策框58,“是”分支)。处理器电力状态管理器36可通过等待指定的时间段来确定电压增大完成,或者可接收指示电压增大何时完成的通信。在一个实施方案中,处理器电力状态管理器36可将电压增大请求传输给另一电力管理器(例如在一个实施方案中是图6所示的SOC级电力管理器),或者可将电压请求直接传输给供应电压的PMU。一旦电压增大完成,处理器电力管理器36就可提高时钟的频率(框60)。另一方面,如果新的PState是从当前PState的减小,则当前供电电压可支持新的(更低)频率。因此(决策框54,“否”分支),处理器电力管理器36可更新时钟频率并请求新的供电电压,而不等待电压改变完成(框62)。
图4是例示处理器电力管理器36执行核心更换(图3的框52)的操作的一个实施方案的流程图。然而,为了便于理解,框图以特定顺序示出,也可使用其它顺序。框可在处理器电力管理器36中的组合逻辑中并行执行。框、框的组合和/或流程图作为整体可在多个时钟周期内为管线式的。处理器电力状态管理器36可被配置为实施图4中所示的操作。
处理器电力管理器36可将活动核心转换到“安全”PState(框70)。安全PState可以是活动核心和目标核心二者都正确操作的状态。在这个上下文中,目标核心可以是新PState映射到的核心。在其中存在不止两个核心的实施方案中,安全PState可以不同,具体取决于哪个核心是活动核心以及哪个核心是目标核心。安全PState不必是能在PState寄存器36中选择的PState。也就是说,供电电压与频率的组合可以不是映射到核心的所支持的组合中的一者。例如,在给定了安全PState中的供电电压量值的情况下,PCore可以能够在较高频率下运行。然而,ECore可能不能以所给定的供电电压量值在较高频率下运行。因此,安全PState可包括当前供电电压量值,但时钟频率更低。另选地,目标核心可能不支持当前供电电压,并且安全PState可包括不同的供电电压量值和时钟频率。向安全PState的转变可类似于图3中的框54、56、58、60、和62。
处理器电力管理器36可对目标核心加电(框72)。例如在图1的实施方案中,处理器电力管理器36可闭合通向目标核心的电力开关,从而允许电力流向目标核心。目标核心可在电力稳定之后被重置。在一些实施方案中,目标核心可在重置完成后初始化。一旦重置(以及初始化,如果适用的话)完成(决策框74,“是”分支),处理器电力管理器36就可发起处理器上下文从活动核心向目标核心的转移(框76)。在一个实施方案中,核心可包括被配置为传输/接收处理器上下文的电路。在另一实施方案中,所述电路可位于处理器电力管理器36中。如先前所提及的,核心还可被配置为在上下文转移期间刷新缓存。一旦上下文转移完成(决策框78,“是”分支),则处理器电力管理器可使(先前)活动核心掉电,并且目标核心可变成活动核心(框80)。掉电可例如通过断开通向先前活动核心的电力开关来实现。处理器电力管理器36可将活动核心转换到新PState(框82)。向新PState的转变可类似于图3中的框54、56、58、60、和62。
图5是处理器32A的一个实施方案的更详细框图。在例示的实施方案中,PCore 40和ECore 42被示为包括上下文状态机90的实例(即图5中的90A和90B)。核心40和42中的状态机90的具体实施可以不同,但它们在逻辑上可以类似的方式操作。一般来讲,活动核心中的状态机90可导致寄存器状态被活动核心输出到状态机90所耦接到的上下文缓冲器92。状态中寄存器的次序可以是固定的,使得接收状态机可简单地读取数据并将其写到正确的寄存器。在另一具体实施中,所述次序可以是随意的,并且可为每个寄存器分配标识符,所述标识符可以与寄存器内容一起被写到上下文缓冲器92并被接收状态机用来在接收核心内写正确的寄存器。
状态机可以各种方式实现:固定功能电路(例如有限状态机)、处理器执行的微码、在处理器电力管理器36中(例如传输命令给核心以转移各个寄存器)等等。另外,活动处理器中的状态机90可将数据缓存刷新到L2缓存34,如上所述。
上下文缓冲器92可以是先进先出缓冲器(FIFO),用于从一个核心向另一个捕获上下文状态。上下文缓冲器92可提供弹性,处理跨时钟域问题等等。在实施方案中,上下文缓冲器92可以是处理器电力管理器36的一部分,因此在图5中以虚线示出。在另一实施方案中,状态机90也可实施在处理器电力管理器36中。在此类实施方案中,处理器电力管理器36可访问核心40和42中的寄存器状态,或者可使指令被执行以执行寄存器读/写来执行寄存器状态的传输。
图6是耦接到存储器12的SOC 10的一个实施方案的框图。正如其名称所暗示的,SOC 10的部件可被集成到单个半导体基板上作为集成电路“芯片”。在一些实施方案中,部件可在***中的两个或更多个芯片上实现。然而,SOC 10在本文将被用作示例。在所示的实施方案中,SOC 10的部件包括中央处理单元(CPU)复合体14(其可由图1所示的处理器集群30实施)、***设备部件18A-18B(更简略地,“***设备”18)、存储器控制器22、SOC电力管理器(PMGR)16和通信结构27。部件14、16、18A-18B和22可全部耦接到通信结构27。存储器控制器22在使用期间可耦接到存储器12。
存储器控制器22一般可包括电路,该电路用于接收来自SOC 10的其它部件的存储器操作并用于访问存储器12以完成存储器操作。存储器控制器22可被配置为访问任何类型的存储器12。例如,存储器12可以是静态随机存取存储器(SRAM)、动态RAM(DRAM)诸如包括双倍数据速率(DDR、DDR2、DDR3、DDR4等)DRAM的同步DRAM(SDRAM)。可支持DDRDRAM的低电力/移动版本(例如,LPDDR、mDDR等)。存储器控制器22可包括存储器操作队列,以用于对这些操作进行排序(并且可能重新排序),并将这些操作呈现至存储器12。存储器控制器22还可包括用于存储等待写到存储器的写数据和等待返回至存储器操作的源的读数据的数据缓冲器。在一些实施方案中,存储器控制器22可包括用于存储最近访问的存储器数据的存储器缓存。例如,在SOC具体实施中,存储器缓存可通过在预期很快要再次访问数据的情况下避免从存储器12重新访问数据来降低SOC中的电力消耗。在一些情况下,存储器缓存也可被称为***缓存,其与私有缓存诸如L2缓存或处理器中的缓存不同,该私有缓存只服务于某些部件。此外,在一些实施方案中,***缓存不需要位于存储器控制器22内。
***设备18A-18B可为被包括在SOC 10中的附加硬件功能性的任何集合。例如,***设备18A-18B可包括视频***设备,诸如被配置为处理来自相机或其它图像传感器的图像捕捉数据的图像信号处理器、被配置为在一个或多个显示设备上显示视频数据的显示控制器、图形处理单元(GPU)、视频编码器/解码器、缩放器、旋转器、混合器等。***设备可包括音频***设备,诸如麦克风、扬声器、至麦克风和扬声器的接口、音频处理器、数字信号处理器、混合器等。***设备可包括用于SOC 10外部的各种接口的接口控制器(例如***设备18B),该SOC包括接口诸如通用串行总线(USB)、***部件互连(PCI)(包括PCI高速(PCIe))、串行和并行端口等等。***设备可包括联网***设备诸如媒体访问控制器(MAC)。可包括硬件的任何集合。
通信构造27可以是用于在SOC 10的部件间进行通信的任何通信互连件和协议。通信构造27可以是基于总线的,包括共享总线配置、交叉杆配置以及具有网桥的分级总线。通信构造27还可以是基于封装的,并且可利用网桥、交叉杆、点到点或其它互连件进行分级。
SOC PMGR 16可被配置为控制从***中的PMU请求的供电电压量值。可存在由PMU为SOC 10生成的多个供电电压。例如,可为CPU复合体14中的处理器32A-32n生成VP电压,可为SOC 10中的其它部件生成VSOC电压。在一个实施方案中,VSOC可服务存储器控制器22、***设备18、SOC PMGR 16、和SOC 10的其它部件,并且可基于电力域采用电力门控。在一些实施方案中,对于SOC 10的其余部分可存在多个供电电压。在一些实施方案中,还可存在用于CPU复合体14和/或SOC 10中各个存储器阵列的存储器供电电压。存储器供电电压可与供应给逻辑电路的电压(例如VP或VSOC)一起使用,供应给逻辑电路的电压可具有比为了确保稳健的存储操作所需要的电压量值低的电压量值。SOC PMGR 16可以直接在软件控制下(例如,软件可直接请求部件的加电和/或掉电)和/或可被配置为监视SOC 10并确定各个部件何时要被加电或掉电。对于CPU复合体14,对于VP的电压请求可被提供给SOC PMGR 16,SOCPMGR 16可将该请求传送给PMU以实现供电电压量值改变。
一般来讲,部件可被称为被通电或被断电。如果部件正在接收供电电压使得其可如所设计的那样操作,则其可以是被通电。如果部件被断电,则其并没有正在接收供电电压并且不处于操作中。如果部件被通电,则其也可被称为被加电,并且如果其被断电,则其也可被称为掉电。对部件加电可以是指将供电电压供应给被断电的部件,并且对部件掉电可以是指终止将供电电压供应给部件。类似地,任何子部件和/或SOC 10作为整体可被称为被加电/掉电等等。部件可以是提供SOC 10内的指定功能并且具有到SOC 10的其余部分的特定接口的预定电路块。因此,***设备18A-18B、CPU复合体14、存储器控制器22和SOC PMGR16各自可以是部件的示例。
应当指出,SOC 10的部件的数量(以及图1中所示的那些部件的子部件的数量,诸如在CPU复合件14内)在不同实施方案中可以是不同的。可存在比图1中所示的数量多或少的每个部件/子部件。
接下来转向图7,其示出了***150的一个实施方案的框图。在例示的实施方案中,***150包括耦接到外部存储器12和一个或多个***设备154的SOC 10的至少一个实例。提供向SOC 10供应供电电压以及向存储器12和/或***设备154供应一个或多个供电电压的PMU 156。在一些实施方案中,可包括SOC 10的多于一个实例(也可包括多于一个存储器12)。
PMU 156一般可包括用于生成供电电压并将那些供电电压提供给***的其它部件诸如SOC 10、存储器12、各个片外***设备部件154诸如显示设备、图像传感器、用户接口设备等的电路。PMU 156因此可包括可编程电压调节器、用于与SOC 10通过接口结合并且更具体地是与SOC PMGR 16通过接口结合以接收电压请求的逻辑部件等等。
根据***150的类型,***设备154可包括任何期望的电路。例如,在一个实施方案中,***150可以是移动设备(例如个人数字助理(PDA)、智能电话等),并且***设备154可包括用于各种类型的无线通信的设备,诸如wifi、蓝牙、蜂窝、全球定位***等。***设备154还可包括附加存储装置,该附加存储装置包括RAM存储装置、固态存储装置或磁盘存储装置。***设备154可包括用户界面设备(诸如包括触摸显示屏或多点触摸显示屏的显示屏)、键盘或其它输入设备、麦克风、扬声器等。在其它实施例中,***150可以是任何类型的计算***(例如台式个人计算机、膝上型电脑、工作站、网络机顶盒等)。
外部储存器12可以包括任何类型的存储器。例如,外部存储器12可以是SRAM、动态RAM(DRAM)(诸如同步DRAM(SDRAM))、双倍数据速率(DDR、DDR2、DDR3等)SDRAM、RAMBUSDRAM、低电力版本的DDR DRAM(例如LPDDR、mDDR等)等等。外部存储器12可包括存储器设备可被安装到的一个或多个存储器模块,诸如单列存储器模块(SIMM)、双列存储器模块(DIMM)等。另选地,外部存储器12可包括以芯片上芯片配置或封装上封装具体实施被安装在SOC 10上的一个或多个存储器设备。
一旦充分理解了以上公开,很多变型形式和修改形式对于本领域的技术人员而言将变得显而易见。本发明旨在将以下权利要求书被解释为涵盖所有此类变型形式和修改形式。
Claims (15)
1.一种处理器装置,包括:
多个处理器核心,其中所述处理器核心中的至少一个处理器核心实施具有与所述处理器核心中的另一个处理器核心不同的效率/性能特征的相应设计;和
处理器电力管理器,所述处理器电力管理器耦接到所述多个处理器核心,其中所述处理器电力管理器能够编程有多个处理器状态,其中所述多个处理器状态中的每个处理器状态映射到所述多个处理器核心中的一个处理器核心;并且所述多个处理器核心和所述处理器电力管理器被配置为响应于所述处理器装置从当前处理器状态被编程到所请求的处理器状态而将处理器上下文从所述多个处理器核心中的所述当前处理器状态所映射到的第一处理器核心转移到所述多个处理器核心中的所请求的处理器状态所映射到的第二处理器核心。
2.根据权利要求1所述的处理器装置,其中所述处理器电力管理器被配置为响应于所述处理器装置从所述当前处理器状态被编程到所请求的处理器状态而使所述第二处理器核心通电并使所述第一处理器核心掉电。
3.根据权利要求1或2所述的处理器装置,其中所述处理器电力管理器被配置为将所述第二处理器核心的操作点改变到由第二处理器状态指定的第二操作点。
4.根据权利要求1-3中任一项所述的处理器装置,其中所述处理器电力管理器被配置为响应于所述处理器电力管理器被编程到第三处理器状态而将由所述当前处理器状态指定的当前操作点改变到由所述第三处理器状态指定的第三操作点,其中所述第三处理器状态映射到所述第一处理器核心。
5.根据权利要求1-4中任一项所述的处理器装置,其中所述多个处理器核心包括上下文切换状态机,所述上下文切换状态机被配置为与所述多个处理器核心中的其它处理器核心的上下文切换状态机协作以转移所述处理器上下文。
6.根据权利要求5所述的处理器装置,还包括缓冲器,所述缓冲器耦接到所述上下文切换状态机并被配置为从所述第一处理器核心接收所述处理器上下文并将所述处理器上下文提供给所述第二处理器核心。
7.根据权利要求1-6中任一项所述的处理器装置,其中所述多个处理器核心形成多个处理器中的第一处理器,并且其中所述处理器装置包括形成所述多个处理器中的其它处理器的第二多个处理器核心。
8.根据权利要求7所述的处理器装置,还包括耦接到所述多个处理器并被所述多个处理器共享的缓存,其中转移所述上下文包括将至少经修改的数据从所述第一处理器核心刷新到所述缓存。
9.根据权利要求1-8中任一项所述的处理器装置,其中所述处理器电力管理器被配置为在转移所述处理器上下文之前将所述第一处理器核心的操作点改变到所述第二处理器核心也被配置为操作于的第四操作点。
10.根据权利要求9所述的处理器装置,其中所述处理器电力管理器被配置为在转移所述处理器上下文之后将所述第二处理器核心的操作点改变到所述第二操作点。
11.一种集成电路,包括:
中央处理单元(CPU)复合体,所述中央处理单元(CPU)复合体包括根据权利要求1-10中任一项所述的处理器装置,
其中:
所述CPU复合体包括多个CPU处理器,并且所述多个CPU处理器中的每个CPU处理器包括所述处理器装置中的所述多个处理器核心;并且
所述处理器电力管理器被配置为响应于被编程到所述处理器电力管理器中的处理器状态而管理所述多个处理器核心之间的转换;和
第二电力管理器,所述第二电力管理器耦接到所述CPU复合体,所述第二电力管理器被配置为与电力管理单元对接以请求用于所述集成电路的供电电压量值,其中所述处理器电力管理器被配置为将供电电压量值请求传输给所述第二电力管理器以响应于所述处理器状态的改变而向所述电力管理单元进行请求。
12.根据权利要求11所述的集成电路,其中相异的所述多个处理器核心中的每个处理器核心被配置为以与相异的所述多个处理器核心中的每个其它处理器核心相同的方式执行任何给定的指令序列。
13.一种方法,包括:
检测包括多个处理器核心的第一处理器改变到第一处理器状态,其中所述多个处理器核心中的至少一个处理器核心实施具有与所述处理器核心中的另一个处理器核心不同的效率/性能特征的相应设计,其中所述改变是在所述第一处理器核心正操作于映射到所述多个处理器核心中的第一处理器核心的第二处理器状态期间被检测到的,其中所述第一处理器状态映射到所述多个处理器核心中的第二处理器核心;以及
响应于所述检测,将所述第一处理器的上下文从所述第一处理器核心传输到所述第二处理器核心。
14.根据权利要求13所述的方法,还包括:
响应于所述检测,将所述第二处理器核心通电;以及
在所述传输之后将所述第一处理器核心断电。
15.根据权利要求13或14所述的方法,还包括:
在转移所述处理器上下文之前,将所述第一处理器核心的状态改变成所述第二处理器核心也被配置为操作于的第三处理器状态;以及
在转移所述处理器上下文之后,将所述第二处理器核心的状态改变成所述第一处理器状态。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/548,872 | 2014-11-20 | ||
US14/548,872 US9898071B2 (en) | 2014-11-20 | 2014-11-20 | Processor including multiple dissimilar processor cores |
PCT/US2015/054993 WO2016081089A1 (en) | 2014-11-20 | 2015-10-09 | Processor including multiple dissimilar processor cores |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107003710A true CN107003710A (zh) | 2017-08-01 |
CN107003710B CN107003710B (zh) | 2020-01-07 |
Family
ID=54705784
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580062255.3A Active CN107003710B (zh) | 2014-11-20 | 2015-10-09 | 包括多个相异的处理器核心的处理器 |
Country Status (6)
Country | Link |
---|---|
US (2) | US9898071B2 (zh) |
EP (1) | EP3221766A1 (zh) |
KR (1) | KR101930659B1 (zh) |
CN (1) | CN107003710B (zh) |
TW (1) | TWI553549B (zh) |
WO (1) | WO2016081089A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112055862A (zh) * | 2018-05-04 | 2020-12-08 | 苹果公司 | 可扩展神经网络处理引擎 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9898071B2 (en) | 2014-11-20 | 2018-02-20 | Apple Inc. | Processor including multiple dissimilar processor cores |
US9958932B2 (en) | 2014-11-20 | 2018-05-01 | Apple Inc. | Processor including multiple dissimilar processor cores that implement different portions of instruction set architecture |
US10437310B2 (en) * | 2016-12-21 | 2019-10-08 | Intel Corporation | Technologies for secure hybrid standby power management |
US10585725B2 (en) | 2018-03-27 | 2020-03-10 | Arista Networks, Inc. | System and method of hitless reconfiguration of a data processing pipeline |
US10832370B2 (en) * | 2018-03-27 | 2020-11-10 | Arista Networks, Inc. | System and method of hitless reconfiguration of a data processing pipeline with standby pipeline |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101233475A (zh) * | 2005-08-02 | 2008-07-30 | 先进微装置公司 | 增加于多核心处理器上的一个或多个核心的工作量效能 |
WO2009029643A2 (en) * | 2007-08-27 | 2009-03-05 | Marvell World Trade Ltd. | Dynamic core switching |
CN102033596A (zh) * | 2009-09-26 | 2011-04-27 | 英特尔公司 | 用于多核心处理器的低功率操作的方法和装置 |
US20110213934A1 (en) * | 2010-03-01 | 2011-09-01 | Arm Limited | Data processing apparatus and method for switching a workload between first and second processing circuitry |
US20140181501A1 (en) * | 2012-07-31 | 2014-06-26 | Nvidia Corporation | Heterogeneous multiprocessor design for power-efficient and area-efficient computing |
US20140298060A1 (en) * | 2013-03-26 | 2014-10-02 | Via Technologies, Inc. | Asymmetric multi-core processor with native switching mechanism |
Family Cites Families (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7281055B2 (en) | 2002-05-28 | 2007-10-09 | Newisys, Inc. | Routing mechanisms in systems having multiple multi-processor clusters |
JP2006185348A (ja) | 2004-12-28 | 2006-07-13 | Fujitsu Ltd | マルチプロセッサシステム及びロックフラグ操作方法 |
US7624250B2 (en) | 2005-12-05 | 2009-11-24 | Intel Corporation | Heterogeneous multi-core processor having dedicated connections between processor cores |
US7717350B2 (en) | 2006-06-30 | 2010-05-18 | Advanced Micro Devices, Inc. | Portable computing platform having multiple operating modes and heterogeneous processors |
US7856562B2 (en) * | 2007-05-02 | 2010-12-21 | Advanced Micro Devices, Inc. | Selective deactivation of processor cores in multiple processor core systems |
US20080307422A1 (en) | 2007-06-08 | 2008-12-11 | Kurland Aaron S | Shared memory for multi-core processors |
US8146106B2 (en) | 2007-12-31 | 2012-03-27 | Intel Corporation | On-demand emulation via user-level exception handling |
US9043795B2 (en) * | 2008-12-11 | 2015-05-26 | Qualcomm Incorporated | Apparatus and methods for adaptive thread scheduling on asymmetric multiprocessor |
US8245070B2 (en) * | 2008-12-30 | 2012-08-14 | Intel Corporation | Method for optimizing voltage-frequency setup in multi-core processor systems |
US8819686B2 (en) | 2009-07-23 | 2014-08-26 | Empire Technology Development Llc | Scheduling threads on different processor cores based on memory temperature |
US8301932B2 (en) | 2009-11-16 | 2012-10-30 | Arm Limited | Synchronising between clock domains |
US20110213935A1 (en) | 2010-03-01 | 2011-09-01 | Arm Limited | Data processing apparatus and method for switching a workload between first and second processing circuitry |
US8533505B2 (en) | 2010-03-01 | 2013-09-10 | Arm Limited | Data processing apparatus and method for transferring workload between source and destination processing circuitry |
US8751833B2 (en) | 2010-04-30 | 2014-06-10 | Arm Limited | Data processing system |
US8683243B2 (en) | 2011-03-11 | 2014-03-25 | Intel Corporation | Dynamic core selection for heterogeneous multi-core systems |
US8949836B2 (en) | 2011-04-01 | 2015-02-03 | International Business Machines Corporation | Transferring architected state between cores |
US8793686B2 (en) | 2011-06-08 | 2014-07-29 | Microsoft Corporation | Operating system decoupled heterogeneous computing |
WO2013036222A1 (en) | 2011-09-06 | 2013-03-14 | Intel Corporation | Power efficient processor architecture |
US9069553B2 (en) * | 2011-09-06 | 2015-06-30 | Marvell World Trade Ltd. | Switching tasks between heterogeneous cores |
US20140019723A1 (en) | 2011-12-28 | 2014-01-16 | Koichi Yamada | Binary translation in asymmetric multiprocessor system |
US9348594B2 (en) | 2011-12-29 | 2016-05-24 | Intel Corporation | Core switching acceleration in asymmetric multiprocessor system |
US9727388B2 (en) | 2011-12-29 | 2017-08-08 | Intel Corporation | Migrating threads between asymmetric cores in a multiple core processor |
WO2013162589A1 (en) | 2012-04-27 | 2013-10-31 | Intel Corporation | Migrating tasks between asymmetric computing elements of a multi-core processor |
US9342334B2 (en) | 2012-06-22 | 2016-05-17 | Advanced Micro Devices, Inc. | Simulating vector execution |
DE102013108041B4 (de) | 2012-07-31 | 2024-01-04 | Nvidia Corporation | Heterogene Mehrprozessor-Anordnung für ein leistungseffizientes und flächeneffizientes Rechnen |
US9383812B2 (en) * | 2012-09-28 | 2016-07-05 | Intel Corporation | Method and apparatus for efficient store/restore of state information during a power state |
KR102005765B1 (ko) | 2012-12-17 | 2019-07-31 | 삼성전자주식회사 | 시스템-온 칩과, 이의 동작 방법 |
US20150007196A1 (en) | 2013-06-28 | 2015-01-01 | Intel Corporation | Processors having heterogeneous cores with different instructions and/or architecural features that are presented to software as homogeneous virtual cores |
US9495001B2 (en) * | 2013-08-21 | 2016-11-15 | Intel Corporation | Forcing core low power states in a processor |
KR20150050135A (ko) * | 2013-10-31 | 2015-05-08 | 삼성전자주식회사 | 복수의 이종 코어들을 포함하는 전자 시스템 및 이의 동작 방법 |
US9582012B2 (en) * | 2014-04-08 | 2017-02-28 | Qualcomm Incorporated | Energy efficiency aware thermal management in a multi-processor system on a chip |
US9513689B2 (en) | 2014-06-30 | 2016-12-06 | Intel Corporation | Controlling processor performance scaling based on context |
US9958932B2 (en) | 2014-11-20 | 2018-05-01 | Apple Inc. | Processor including multiple dissimilar processor cores that implement different portions of instruction set architecture |
US9898071B2 (en) | 2014-11-20 | 2018-02-20 | Apple Inc. | Processor including multiple dissimilar processor cores |
US20160154649A1 (en) | 2014-12-01 | 2016-06-02 | Mediatek Inc. | Switching methods for context migration and systems thereof |
US9928115B2 (en) | 2015-09-03 | 2018-03-27 | Apple Inc. | Hardware migration between dissimilar cores |
-
2014
- 2014-11-20 US US14/548,872 patent/US9898071B2/en active Active
-
2015
- 2015-10-09 CN CN201580062255.3A patent/CN107003710B/zh active Active
- 2015-10-09 EP EP15801519.8A patent/EP3221766A1/en not_active Withdrawn
- 2015-10-09 WO PCT/US2015/054993 patent/WO2016081089A1/en active Application Filing
- 2015-10-09 KR KR1020177014554A patent/KR101930659B1/ko active IP Right Grant
- 2015-10-26 TW TW104135131A patent/TWI553549B/zh not_active IP Right Cessation
-
2018
- 2018-01-09 US US15/866,014 patent/US10289191B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101233475A (zh) * | 2005-08-02 | 2008-07-30 | 先进微装置公司 | 增加于多核心处理器上的一个或多个核心的工作量效能 |
WO2009029643A2 (en) * | 2007-08-27 | 2009-03-05 | Marvell World Trade Ltd. | Dynamic core switching |
CN102033596A (zh) * | 2009-09-26 | 2011-04-27 | 英特尔公司 | 用于多核心处理器的低功率操作的方法和装置 |
US20110213934A1 (en) * | 2010-03-01 | 2011-09-01 | Arm Limited | Data processing apparatus and method for switching a workload between first and second processing circuitry |
US20140181501A1 (en) * | 2012-07-31 | 2014-06-26 | Nvidia Corporation | Heterogeneous multiprocessor design for power-efficient and area-efficient computing |
US20140298060A1 (en) * | 2013-03-26 | 2014-10-02 | Via Technologies, Inc. | Asymmetric multi-core processor with native switching mechanism |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112055862A (zh) * | 2018-05-04 | 2020-12-08 | 苹果公司 | 可扩展神经网络处理引擎 |
CN112055862B (zh) * | 2018-05-04 | 2024-05-07 | 苹果公司 | 可扩展神经网络处理引擎 |
US11989640B2 (en) | 2018-05-04 | 2024-05-21 | Apple Inc. | Scalable neural network processing engine |
Also Published As
Publication number | Publication date |
---|---|
TWI553549B (zh) | 2016-10-11 |
US20160147289A1 (en) | 2016-05-26 |
KR101930659B1 (ko) | 2018-12-18 |
CN107003710B (zh) | 2020-01-07 |
WO2016081089A1 (en) | 2016-05-26 |
TW201631467A (zh) | 2016-09-01 |
US10289191B2 (en) | 2019-05-14 |
US9898071B2 (en) | 2018-02-20 |
EP3221766A1 (en) | 2017-09-27 |
US20180129271A1 (en) | 2018-05-10 |
KR20170078757A (ko) | 2017-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107003709B (zh) | 包括实现指令集架构不同部分的多个不同处理器内核的处理器 | |
CN110109527B (zh) | 动态电压裕度恢复 | |
CN107003710A (zh) | 包括多个相异的处理器核心的处理器 | |
JP5865931B2 (ja) | プラットフォーム非依存型パワー管理 | |
CN105144082B (zh) | 基于平台热以及功率预算约束,对于给定工作负荷的最佳逻辑处理器计数和类型选择 | |
CN102646446B (zh) | 硬件动态高速缓存电源管理 | |
TWI670602B (zh) | 電子器件及省電快取記憶體使用之方法 | |
CN106489108A (zh) | 控制***存储器的温度 | |
CN104115093A (zh) | 包括多个处理元件之间的功率和性能平衡的用于能效和节能的方法、装置和*** | |
US9329658B2 (en) | Block-level sleep logic | |
CN107077175A (zh) | 提供针对多芯片封装的热参数报告的装置和方法 | |
US8954771B2 (en) | Split deep power down of I/O module | |
EP2808758B1 (en) | Reduced Power Mode of a Cache Unit | |
US9575543B2 (en) | Providing an inter-arrival access timer in a processor | |
US20160320832A1 (en) | Controlling processor consumption using on-off keying having a maximum off time | |
US20140006831A1 (en) | Dynamic link scaling based on bandwidth utilization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |