CS93691A2

CS93691A2 - Method of instruction sequence processing and device for this method realization

Info

Publication number: CS93691A2
Application number: CS91936A
Authority: CS
Inventors: Bartholomew Blaner; Stamatis Vassiliadis
Original assignee: Ibm
Priority date: 1990-05-04
Filing date: 1991-04-04
Publication date: 1991-12-17
Also published as: ATE146611T1; PL165524B1; PL289722A1; EP0454985A2; JP2500082B2; DE69123629T2; CA2039640A1; DE69123629D1; HU911103D0; EP0454985A3; JPH04229326A; US5502826A; US5732234A; CA2039640C; EP0454985B1; HUT57455A

Description

ípVr» ÍCV O. Π I t/řifrl lúi^vx-i t-L ( s. 7?-VOřvil |nrCv vM £o^°ťc 2 ^xscLuschni ckých—j-ed-

Strojová—architektura způsobilá—k pínot ek—v—souboru—s ložených—i nst eu-ke i-

Analogické přihlášky to - ·» V Γ- fc)

• rnN ^sledující příbuzné přihlášky jsou"onictvi právnTbe-jTástupce a jsou začleněny."Technické vybavení potrvt-a_cu se podáno 4. 4. 1990, ser^-^#io7 07 technika s Lfri-erTTi ns t rukční ch úrovní para 'násTeeluj^:Fenou závislosti dat"20; a "Universální ích proceso- ÍN990019/ podáno 4. 5. 1990, ser. No. 07/519,. l^st_techniky

Vynález se týká obecně paralelního zpracováni instruk-cí počítačem a zejména se týká zpracováni toku instrukcípro identifikaci těch instrukcí, které lze vydávat a vyko-návat paralelně ve specifickém uspořádání systému počítače. adní._st av_t echni k^

Pojetí paralelního provádění instrukcí pomohlo zvět-šit výkon počítačových systému. Paralelní prováděni je za-loženo na existenci samostatných funkčních jednotek, kte-ré mohou vykonávat současně dvě nebo více stejných neborůzných instrukci.

Jinou používanou technikou pro zvýšení výkonu systé-mů počítače je zřetězené zpracování. Zřetězené zpracová-ní je obecně docíleno rozdělením funkce vykonávané počí-tačem na nezávislé dílčí funkce a zařazením samostatnéčásti technického vybavení nebo stupně k vykonávání kaž-dé dílčí funkce. Každý stupen je definován pro včasné za-bráni jednoho taktu. Zřetězené zpracováni poskytuje formuparalelního zpracování, nebof je možno vykonávat vícená-sobné instrukce současně. Ideálně lze vsunout jednu novou i\-ř47My>··- ·"·' - ..... ....... * - 2 - instrukci do zřetězeného vedeni v jednom cyklu, přičemžkaždá instrukce v zřetězeném vedeni je v různém stupni pro-vádění. Operace je analogická překládáni z jazyka symbo-lických adres, s řadou instanci zpracováni součinu v růz-ných stupních kompletace.

Mnohdy však úspěšnost paralelního provedeni a/nebozřetězeného zpracování není docíleno vlivem zpožděni způ-sobeným vzájemným blokováním během přenosu dat a vlivemvzájemného blokování v závislosti na přístrojové techni-ce. Příklad vzájemného blokováni v závislosti na datechje tak zvané blokováni "zápis-čtení", kde první instrukcemusí napsat svůj výsledek dříve než druhá instrukce můžebýt čtena a následně použita. Příklad vzájemného bloková-ni technickými prostředky je tam, kde musí první instrukcepoužit zvláštní složku technického vybavení a druhá instruk-ce musí rovněž použít tutéž zvláštní složku technickéhovybavení.

Jedním z dříve používaných technických postupů k vy-loučení vzájemného blokováni /někdy zvané zřetězené ha-zardy/ je dynamické rozvrhováni. Dynamické rozvrhovánije založeno na skutečnosti, že vsunutím speciálního tech-nického vybaveni je možno přeřadit instrukční posloup-nosti potom co byty vydány do zřetězeného provedení.

Bylo učiněno také několik pokusů o zvětšeni účinnostipomoci tak zvaného statického rozvrhováni, které je prove-deno dříve než instrukční tok je vyvolán z paměti k vý-počtu. Statické rozvrhováni je docíleno pohybem kódu atím přeřazením instrukčního sledu před výpočtem. Totopřeřazeni vytvoří ekvivalentní tok instrukcí, který mnohemvíce využije technického vybavení pomocí paralelního zpra-cování. Takové statické rozvrhování je typicky provedenov době kompilace. Přeřazené instrukce však zůstanou vesvém původním tvaru a běžné paralelní zpracováni stálevyžaduje nějaký tvar dynamického určení právě před pro- 3 vedením instrukcí za účelem rozhodnuti zda vykonat dvě nej-bližši instrukce sériově nebo paralelně.

Taková technika rozvrhování může zlepšit celkovouvýkonnost zřetězeného počítače, ale nemůže sama uspokojittrvalé stávající požadavky na zvětšení výkonnosti. V tom-to ohledu mnohé moderni návrhy na universální výpočet setýkají využiti instrukční úrovně mimo to, které bylo dosa-ženo zřetězením. Například další paralelnost instrukčníúrovně byla docílena explicitně vydáním vícenásobných in-strukci v jednom cyklu tak zvanými superskalárnimi stroji,spíše než implicitně dynamickým rozvrhováním jednotlivýchinstrukcí nebo vektorovými stroji. Název superskalárnípro stroje, které vydávají vícenásobné instrukce v jednomcyklu, je pro odlišeni od skalárních strojů, které vydá-vají jednu instrukci v jednom cyklu. V typickém superska lárním stroji operační kódy jsouve vyvolaném instrukčním toku dekódovány a analyzoványdynamicky instrukční vydanou logikou za účelem určeni zdainstrukce lze provésti paralelně. Kriteria pro takové dy-namické rozvrhování v posledni minutě jsou specificképro každou architekturu instrukčního souboru, jakož irealizaci podléhající této architektuře v jakékoliv danéjednotce zpracovávájici instrukce. Její účinnost je pro-to omezena složitostí logiky pro určení, které kombinaceinstrukcí lze provésti paralelně a doba cyklu jednotkypro zpracováni instrukce se spíše zvětšuje. Zvětšenétechnické vybaveni a doba cyklu těchto superska lárníchstrojů se stává dokonce velkým problémem v architekturách,které mají stovky různých instrukci. Při dynamickém rozvrhování, statickém rozvrhováninebo jejich kombinaci se vyskytují další nedostatky. Na-příklad je třeba přezkoumat každou skalární instrukcipokaždé znovu, jestliže je vyvolána k provedeni rozhodnutí i* zda je způsobilá pro paralelní provedení. K disposici ne-ní žádné opatřeni pro identifikaci a označeni předem těchskalárních instrukci/ které jsou způsobilé pro paralelníprovedeni. Neexistuje žádné opatřeni pro identifikaci avčasné označeni předem těch skalárních instrukci/ kteréjsou schopny paralelního provedení.

Jiným nedostatkem dynamického rozvrhováni v realiza-ci superskalárnich strojů je způsob jakým jsou skalárníinstrukce zkoušeny pro možné paralelní zpracování. Super-skalárni stroje zkoušejí skalární instrukce na základěpopisů jejich operačního kódu a neexistuje opatřeni/ abybyly vzaty v úvahu technické prostředky počítače. In-strukce jsou také vydávány metodou "první zařazen, prvnívybrán"/ čímž je eliminována možnost tvorby skupin, abyse zabránilo nebo omezil výskyt vzájemného blokování. V několika dosavadních technických řešeních jsouvzaty v úvahu požadavky technických vybavení pro paralel-ní zpracování instrukci. Jedním takovým řešením je strojna zpracováni velmi dlouhých instrukčních slov, ve kte-rých výkonný kompilárot přeřazuje instrukce tak, že jezjednodušeno rozvrhováni instrukci technickými prostředky.V tomto přiblíženi musí být kompilátor složitější než jsoustandardní kompilátory, takže je možno použít větší okén-ko pro vyhledání většího počtu paralelit v instrukčnímtoku. Výsledné instrukce nemohou být nutně cílovým kódemslučitelným s dosavadní stávající architekturou, čímžby byl jeden problém vyřešen, zatímco by vznikly další no-vé problémy. V podstatě vznikají také další problémyvzhledem k častému větvení, které omezuje jeho paralelitu. Žádný z dosavadních postupů se proto nepřibližujetakovému paralelnímu zpracování, aby bylo dostatečně sro-zumitelné za účelem minimalizování všech možných vzájem-ných blokování, zatímco současně by bylo zabráněno novému 5 hlavnímu návrhu stavby instrukčního souboru a odstraněnysložité logické obvody pro dynamické dekódování vyvola-ných instrukci.

To co je podle toho třeba je dokonalejší zpracováníčíselných dat, které usnadňuje paralelní provedeni stáva-jících strojních instrukcí za účelem zvýšeni účinnostiprocesoru. Poněvadž počet instrukcí provedených za vteři-nu je součinem základního časového cyklu procesoru a prů-měrného počtu požadovaných cyklů pro dokončeni instrukce,je třeba nalézt takové řešení, které bere v úvahu oba ty-to parametry. Mnohem specifičtěji je třeba mechanismu,který snižuje počet cyklů požadovaných k provedení instruk-ce pro danou architekturu. Kromě toho je třeba určitéhozdokonaleni, které by zredukovalo složitost technickéhovybaveni nutného k podpoře paralelního provedení instruk-ci, čímž je jakékoliv možné zvětšení časového cyklu zmen-šeno na minimum. Nejvýše žádoucí je ještě pro navrženézdokonalení zajištění slučitelnosti realizace s již defi-novanou stávající architekturou, přičemž by byla zavedenaparalelnost instrukční úrovně jak nového tak stávajícíhostrojového kódu.

Podst^ta_vxnálezu

Stručný obsah a předměty vynálezu

Se zřetelem ke shora uvedenému, je předmětem předlo-ženého vynálezu vytvořeni metody pro statickou analýzu,před dobou dekódování a provedení stávajících instrukci,posloupnosti stávajících instrukci pro generování slo-žených instrukcí tvořených sousedními skupinami stáva-jících instrukcí, způsobilých k paralelnímu provedení.Souběžným předmětem je přidání příslušné řídicí infor-mace do instrukčního toku včetně skupinové informace na-značující kde začíná složená instrukce, právě tak jako - 6 - oznámení počtu stávajících instrukcí, které jsou začleněnydo každé složené instrukce.

Jiným předmětem vynálezu je analýza velkého okénkainstrukčního slabikového toku před vyvoláním instrukce,přičemž okénko je nastavitelné do různých poloh v instrukč·ním slabikovém toku za účelem docíleni optimálního selek-tivního seskupeni jednotlivých sousedních instrukcí, kte-ré tvoří složenou instrukci.

Dalším předmětem vynálezu je opatření metody pro slo-žení instrukci o dříve zmíněných charakteristikách, kteráje aplikovatelná na architektury složitých instrukcí sproměnlivou délkou instrukci a s daty smíšenými s instruk-cemi, a která je rovněž aplikovatelná na architektury čí-tače přemístěných instrukcí, kde instrukce jsou obvyklekonstantní délky a data nejsou smíšena s instrukcemi.

Dalším předmětem je opatření způsobu předběžnéhozpracováni instrukčního toku pro vytvoření složených in-strukcí, kde způsob lze realizovat programovým a/nebotechnickým vybavením v různých bodech soustavy počítačepřed dekódováním a provedením instrukce. Souběžným před-mětem je vytvoření metody předběžného zpracování stáva-jících instrukcí, která zpracovává tok binárních instruk-cí jako část následného kompilátoru nebo část skladačevstupní paměti nebo jako část rychlé vyrovnávací paměti,jednotky pro složení instrukci, a která může zahájitskládáni instrukcí na začátku slabikového toku, aniž bybyly známy meze instrukcí.

Vynález se tak vztahuje na metodu předběžného zpra-cování instrukčního toku pro vytvoření složených instrukcísestavených ze skalárních instrukcí, které stále podržujísvoje originální obsahy. Složené instrukce jsou tvořenybeze změny předmětového kódu skalárních instrukcí, které 7 tvoří složenou instrukci, čimž je umožněno stávajícím pro-gramům uskutečnit zlepšení výkonnosti strojů pro skladbuinstrukci, přičemž je zachována slučitelnost s předchozí-mi realizovanými stroji skalárních instrukcí.

Mnohem specifičtěji vynálezem je vytvořen soubor pra-videl pro skládáni spočívající na analýze stávajících in-strukcí za účelem jejich rozdělení do různých tříd. Analý-za určuje, které instrukce se kvalifikuji, bučí s instruk-cemi v jejich vlastních třídách nebo s instrukcemi v jinýchtřídách, pro paralelní provedeni ve zvláštním uspořádánítechnických prostředků. Takováto pravidla pro skládáníjsou považována za normu pro předběžné zpracování in-strukčního toku za účelem vyhledáni skupin dvou nebo vícesousedních skalárních instrukcí, které lze provést paralel-ně. V některých případech určité druhy zablokovaných in-strukcí lze skládat paralelním provedením, kde blokováníje způsobilé sdružení ve speciální konfiguraci technickýchprostředků. V jiných uspořádáních kde blokování je ne-sdružitelné, instrukce, které mají blokování závislá nadatech nebo závislá na technických prostředcích, jsou vy-loučeny ze skupin tvořících složené instrukce.

Každá složená instrukce je identifikována řídicíinformaci jako je označení sdružené se složenou instrukcí,přičemž délka složené instrukce je způsobilá k převáděnítechnických jednotek v širokém rozsahu, počínaje souboremdvou skalárních instrukcí až do jakéhokoliv maximálníhopočtu, který lze provést paralelně specifickou realizacítechnického vybaveni. Poněvadž pravidla pro skládáni jsouzaložena na identifikaci tříd instrukcí spíše než na jed-notlivé instrukci, není žádná potřeba složitých matricukazujících všechny možné kombinace specifických jednotli-vých instrukci. Zatímco jejich vlastní posloupnost zůstá-vá nedotčena, jednotlivé instrukce jsou selektivně seskupe-ny a kombinovány s jednou nebo více ostatními sousedními 8 skalárními instrukcemi pro vytvoření složené instrukce,která obsahuje skalární instrukce, jež stále mají před-mětový kód slučitelnosti s nesloženými skalárními instruk-cemi. Řídicí informace je připojena pro identifikovániinformace týkající se provedení složených instrukcí.

Tyto a ostatní předměty, charakteristiky a výhodyvynálezu jsou zřejmé specialistům z oboru se zřetelem knásledujícímu podrobnému popisu a připojeným výkresům. Eřshigd_obrášků_na_výkrekech

Obr. 1 základní diagram vyšší úrovně vynálezu.

Obr. 2 časový diagram realizace sekvenčního procesoru ukazující paralelní provedení určitých neblokovanýchinstrukci, které byly selektivně seskupeny do tokusložených instrukcí.

Obr. 3 časový diagram realizace multiprocesoru ukazující paralelní provedení skalárních a složených instruk-cí, které nejsou vzájemně blokovány.

Obr. 4 /znázorněn jako obr. 4A a obr. 4B/ znázorňuje při-klad možného selektivního roztřídění části instruk-cí provedených stávajícím skalárním strojem.

Obr. 5 ukazuje typickou cestu programu vedenou od zdrojekódu ke skutečnému provedeni.

Obr. 6 vývojový diagram ukazující generaci programu sou-boru složených instrukci z programu v jazyceasembleru.

Obr. 7 vývojový diagram ukazující provedení programu sou- boru složených instrukcí. 9

Obr. 8 analytické schéma pro texty toku instrukci s iden-tifikovatelnými instrukčními referenčními body.

Obr. 9 analytické schéma pro texty toku instrukci s pro-měnlivou délkou instrukci bez referenčniho bodu,ukazující jejich souběžné soubory možných slože-ných identifikačních bitů.

Obr. 10 znázorňuje logickou realizaci schopnosti skládáníinstrukcí pro zpracování textu toku instrukcí po-dle obr. 9.

Obr. 11 vývojový diagram pro skládání toku instrukcí s re-ferenčními značkami pro identifikaci instrukčníchmezních referenčních bodů.

Obr. 12 ukazuje příklad řídicího pole složené instrukce.

Obr. 13 vývojové schéma pro odvození a použití pravidelpro skládání aplikovatelných na specifické uspo-řádání technických prostředků systému počítače ajeho zvláštní architektický instrukční soubor.

Obr. 14 ukazuje jak různá seskupeni platných neblokovanýchpárů instrukci tvoři vícenásobné složené instrukcepro sekvenční nebo větvené cílové provedení.

Obr. 15 ukazuje jak různá seskupení platných neblokovaných trojic instrukcí tvoří vícenásobné složené instruk-ce pro sekvenční nebo větvené cílové provedení.

Obr. 16 /znázorněn jako obr. 16A a obr. 16B/ je vývojovéschéma pro složeni instrukčního toku podobně jakov obr. 9, které obsahuje instrukce proměnlivé dél-ky bez mezních referenčních bodů. 10

Obr. 17 schéma ukazující typické složitelné páry instruk-čních kategorii pro část Systému/370 instrukčnísady v obr. 4.

Podstata předloženého vynálezu spočívá v předběžnémzpracováni souboru instrukcí nebo programu, které má pro-vést počítač za účelem statického určení, které neblokova-né instrukce mají být kombinovány do složených instrukci,přičemž je připojena řídicí informace pro identifikacitakových složených instrukcí. Takové určeni je založenona pravid^,lech pro skládáni, která jsou vypracována prosoubor instrukcí zvláštní architektury. Stávající skalár-ní instrukce jsou roztříděny na základě analýzy jejichoperand, použiti a funkce technického vybaveni, takže se-skupeni instrukci složením z důvodů vyloučeni blokovánívlivem nezpůsobilosti sdružování spočívá na porovnáníkategorií instrukcí spíše než na porovnání specifickýchinstrukcí .

Jak ukázáno v různých výkresech a dále podrobněji po-psáno, vynález o názvu "Počítač pro převod jednotek slože-ných instrukčních souborů" je určen pro tok skalárních in-strukcí, které je třeba složit nebo seskupit dohromady předdobou dekódováni instrukce tak, že jsou již označeny aidentifikovány pro současné paralelní provedení příslušný-mi základními jednotkami. Poněvadž takové složení neměnícílový kód, mohou stávající programy docílit zlepšeni vý-konnosti, přičemž je dodržena slučitelnost s předchozímirealizovanými systémy.

Jednotka 20 pro složeni instrukce v obr. 1 přejímá tok 21 binárních skalárních instrukcí /včetně nebo bez dat v nich obsažených/ a selektivně seskupuje některé soused- ní skalární instrukce pro vytvoření kódovaných složených - 11 - instrukcí. Výsledný instrukční tok 22 proto kombinuje ska-lární instrukce nezpůsobilé pro paralelní provedeni a sklá-dá instrukce tvořené skupinami skalárních instrukciz kteréjsou způsobilé pro paralelní provedení. Když je nabídnutaskalární instrukce instrukční základní jednotce 24, jepředána příslušné funkční jednotce pro sériové provedeni.

Když je složená instrukce nabídnuta instrukční základníjednotce 24, je každá z jejich skalárních složek předánapříslušné funkční jednotce nebo sdružovací jednotce prosoučasné paralelní provedení. Typické funkční jednotky ob-sahuji,ale nejsou omezeny na aritmetickou a logickou jed-notku 26, 28, jednotku pro aritmetiku s pohyblivou čárkou30 a jednotku pro generováni paměťových adres 3 2. Přikladjednotky sdružující závislá data je poprán v souběžné při-hlášce ser. No. 07/504,910 o názvu "Technické vybavenipřístrojů sdružující závislá data" podané 4. 4. 1990.

Je třeba si uvědomit, že technika podle vynálezu jerozšiřována s úmyslem zjednodušit paralelní vydávání a pro-vedení instrukcí ve všech architekturách počítačů, kterézpracovávají v jednom cyklu vícenásobné instrukce /ačkolivurčité instrukce mohou vyžadovat více než jeden cyklus kprovedení/.

Jak patrno z obr. 2 vynález lze realizovat v provede-ní sekvenčního procesoru, kde každá funkční provozní jednot-ka zpracovává skalární instrukci /S/ nebo alternativně slo-ženou skalární instrukci /CS/. Jak patrno z výkresu instrukč-ní tok 33 obsahující sekvenční skalární a složené skalár-ní instrukce je opatřen řídicím označením /T/ přiřazenýmkaždé složené instrukci. Tak první skalární 34 může býtvykonána jedině funkční jednotkou A v cyklu 1; trojitěsložená instrukce 36 identifikovaná označením T3 může mítsvé tři složené skalární instrukce vykonány paralelně funkč-ními jednotkami A, C a D vcyklu 2; jiná složená instrukce38 identifikovaná označením T2 může mít svůj pár složenýchskalárních instrukcí vykonán paralelně funkčními jednotkamiA a B v cyklu 3; druhá skalární instrukce 40 může být vy-konána ojediněle funkční jednotkou C v cyklu 4; velká sku- pina složených instrukci 42 může mit své čtyři skalárníinstrukce vykonány paralelně funkčními jednotkami A-D vcyklu 5; a třetí skalární instrukce 44 lze vykonat jed-notlivě funkční jednotkou A v cyklu 6.

Je důležité si uvědomit, že vícenásobné složeni in-strukce jsou způsobilé pro paralelní zpracováni v určitýcharchitekturách počítacích systémů. Například vynález lzepotenciálně realizovat vybaveností mu Itiprocesoru jakukazuje obr. 3, kde složená instrukce zpracovávaná jakojednotka pro paralelní vyvoláváni je jednou ze základníchjednotek. Jak znázorněno na výkrese, tentýž instrukčnítok 33 mohl by být zpracováván pouze ve dvou cyklech jaknásleduje. V prvním cyklu základní jednotka CPU # 1 prová-dí první skalární instrukci 34; funkční jednotky z CPU íř 2provedou trojitou složenou instrukci 36; a funkční jednot-ky z CPU 3 provedou dvě složené skalární instrukce vesložené instrukci 38. Ve druhém cyklu základní jednotkaCPU#1 provede druhou skalární instrukci 40; funkční jed-notky z CPU # 2 provedou čtyři složené skalární instrukceve složené instrukci 42; a funkční jednotka z CPU 3 pro-vede třetí skalární instrukci 44. Příkladem architektury počítače, který je možno adap-tovat na zpracování složených instrukcí je IBM systém/370architektury úrovně instrukcí, ve kterém mohou být vydá-ny vícenásobné skalární instrukce k vykonání v každém stro-jovém cyklu. V tomto pojetí strojový cyklus odpovídá všemzřetězeným krokům nebo stupňům potřebným k provedení ska-lární instrukce. Skalárni irstrukce pracuje s operandy oobsahu jednoznačných parametrů. Když je skalární tok slo-žen, jsou selektivně seskupeny sousední skalární instrukceza účelem současného nebo paralelního provedení.

Soubory instrukcí pro různé architektury IBM systé- mu/370 jako systém/370 s rozšířenou architekturou /370-XA/ a systém/370 architektury operačních systémů /370=ESA/ 13 jsou dobře známy. Z tohoto hlediska doporučujeme publika-ci "Principy činnosti IBM systému/370"/zverejněno #GA22-7000-10 1987/, a "Principy činnosti, architekturaoperačních systémů IBM/370" /zveřejněno £ SA22-7200-01988/. Všeobecně zařízení pro skládání instrukce bude vy-hledávat třídy instrukcí, které lze vykonávat paralelněa bude zajištovat, že mezi členy složené instrukce ne-vznikne žádné vzájemné blokování, které by nebylo mož-no zvládnout technickými prostředky. Jsou-li nalezenyslučitelné posloupnosti instrukcí, je složená instrukcevytvořena. Při podrobnější specifikaci je možno soubor instrukcíSystému/370 roztřídit na kategorie instrukcí, které mohoubýt provedeny paralelně ve speciální architektuře systémupočítače. Instrukce v určitých z těchto kategorii lze kom-binovat nebo skládat s instrukcemi těchže kategorií nebos instrukcemi určitých jiných kategorií, aby byla vytvoře-na složená instrukce. Například část souboru instrukcíSystému/370 může být rozdělena do kategorií jak znázorněnov obr. 4. Rozumné zdůvodnění této kategorizace spočíváve funkčních požadavcích instrukcí Systému/370 a v použitíjeho technického vybavení pro typickou architekturu počí-tačového systému. Zbytek instrukci Systému/370 není spe-cificky uvažován pro skládáni v tomto příkladovém spoje-ni. To nezabraňuje jejich skládáni pomoci metod a technikypředloženého a dále popsaného vynálezu. Je známo, že struktury technického vybavení potřebné k provádění složenýchinstrukcí je možno běžně řídit horizontálními mikrokódy,které umožňují využít paralelnosti ve zbývajících instruk-cích, které nebyly vybrány pro složení ani nebyly obsaže-ny v kategoriích podle obr. 4, čímž je zvýšena výkonnost. 14

Jednou z nej běžněj š í ch postoupnosti v programechSystému/370 je provedeni instrukce -test s maskou TM nebosrovnávací formáty / R X/ - srovnej C , srovnej polovinu C H,srovnej logicky CL, srovnej logicky ihned CLI, srovnejlogicky test s maskou CLH, přičemž výsledku je použitok řízeni vykonáni instrukce typu - podmíněný skok BC/RX-formát/z podmíněný skok /RR-forma/z která ihned ná-sleduje. Výkonnost lze zlepšit paralelním provedeníminstrukci - srovnej a skok - a to bývá někdy dynamickyuděláno vysoko výkonnými instrukčními procesory. Někdyvznikají obtíže v rychlém identifikování všech různýchčlenů instrukci třídy -srovnej- a všech členů instrukcitřídy -skok- v typické architektuře během dekódovacíhoprocesu. Je to jeden z důvodů proč superskalárni strojeobvykle berou v uvahu pouze malý počet specifických ska-lárních instrukcí pro možné paralelní zpracování. Takovéomezené dynamické rozvrhováni založené pouze na srovnánív poslední minutě dvou specifických instrukcí je naopakpodle vynálezu odstraněno, protože analyzování všech čle-nů tříd je předem splněné včas z důvodů dodržení přiměře-ných pravidel pro skládání při tvorbě složené instrukce,kterou je nutno vykonat. Při dynamickém rozvrhováni jednotlivých instrukcivzniká velký problém po vyvolání programu jak patrno zobr. 4, který ukazuje, že dvoucestným složením padesáti-sedmi instrukci je vytvořena matrice 57 x 57 více než třitisíce možných kombinací. To je v ostrém protikladu smatrici 10x10 v obr. 17 pro tentýž počet instrukcí sezřetelem k možným kategoriím kombinaci, které jsou k dis-pozici podle předloženého vynálezu.

Mnoho tříd instrukci lze provést paralelně v závislos ti na tom, jak je navrženo technické vybaveni. Kromě shora popsaných složitelných párů - srovnávat a větvit -, je možno paralelně provést mnoho jiných složitelných kombinaci /viz obr. 17/, jako zaváděni programu /kategorie 7/ slože-né s instrukcemi formátu RR /kategorie 1/, větveni /kate-gorie 3-5/ složené se zaváděči adresou /kategorie 8/ apod. V některých případech sekvenčni příkaz ovlivni mož-nosti paralelního provedeni a tim určí, zda lze složitdvě sousední instrukce. Se zřetelem k tomu řádkové hlavič-ky 45 identifikují kategorii první instrukce slabikovéhotoku a sloupcové hlavičky 47 identifikuji kategorii nej-bližši instrukce, která následuje po první instrukci. Na-příklad -větvení /kategorie 3-5/ následována určitými -po-suvy/kategorie 2/~ jsou vždy složitelné 49, zatímco posuvy/kategorie 2/ následována - větvením /kategorie 3-5/ jsoujenom "někdy" složitelné 51.

Stav "někdy" identifikovaný jako "S" ve schématu naobr. 17 může být často změněn na "vždy" identifikovaný ja-ko "A" ve schématu přidáním dalších funkčních jednotek těchnického vybavení v uspořádání soustavy počítače. Vezmeme--li v úvahu například sestavu, která zajištuje dvoucestnésložení a která nemá sdružovací jednotku pro sčitání-po-souvání, ale místo toho má běžnou aritmetickou a logickoujednotku a samostatný přeřaďovač.Jiným i slovy zde neexis-tuje vzájemné blokováni sdružovacím technickým vybavenímpro zpracováni blokovaných instrukcí "sčítat-posun". Uva-žujne následující instrukční sled: AR R1, R2 SRL R3 po D2

Je jasné, že tento pár instrukcí je složitelný pro para-lelní provedení. V některých případech však nebude složi-telný vzhledem k neslučitelnému vzájemnému blokování, jakpatrno z následujícího instrukčního sledu: AR R1 , R 2 SRL Rl po D2

Tak schéma ukazuje, že kategorie 1 instrukce /AR/ násle-dovaná kategorií 2 instrukce /SRL/ je někdy složitelná 53. 16 Při existenci aritmetické a logické jednotky, která sdru-žuje určitá vzájemná blokováni, tak jako blokováni sčítat/posunout, jak ukázáno shora, může ve schématu na obr. 17"$" se změnit v "A". Podle toho pravidla pro složení mu-sí být pohotová, aby reagovala na všechny změny provede-né zvláštním uspořádáním soustavy počítače. Jako dodateč-ný příklad uvažujme instrukce obsažené v kategorii 1 slo-žené s instrukcemi téže kategorie v'následuj 1 cín instrukč-ním sledu: AR R1, R2 SR R3, R4

Tento sled je bez vzájemných blokováni náhodnými údaji aposkytuje následující výsledky, které obsahují dvě nezá-vislé instrukce Systému/370: R1 = R1+R2 R3 = R3-R4

Provedeni takového sledu by vyžadovalo dvě nezávislé a pa-ralelní dvě až jednu aritmetickou a logickou jednotku, na-vrženou podle architektury instrukční úrovně. Tím se rozu-mí, že tyto dvě instrukce mohou být seskupeny do tvaru slo-žené instrukce v uspořádání soustavy počítače, který mádvě takové aritmetické a logické jednotky. Tento příkladsložení skalárních instiukcí je možno zevšeobecnit navšechny páry instrukčních posloupnosti, které jsou prostyblokování závislých dat a také blokováni závislém na tech-nickém vybavení. V kterémkoli skutečném instrukčním procesoru existu-je horní mez pro počet jednotlivých instrukci, která mužeobsahovat složenou instrukci. Tato horní mez musí být spe-cificky začleněna do technického a/nebo programové jednotky,která tvoří složené instrukce tak, že složené instrukcenebudou obsahovat více jednotlivých instrukci /napříkladpárových skupin, trojitých skupin, skupin čtyř/ než jemaximální způsobilost podléhající prováděcímu technickémuvybavení. Tato horní mez je přísným důsledkem realizacetechnického vybavení ve zvláštní konfiguraci počítačové soustavy a neomezuje ani celkový počet instrukcí, kterémohou přijít v úvahu pro složeni,ani délkou okénka sku-piny v dané kódové posloupnosti, která má být analyzová-na pro složení.

Obecně platí, že čím větší délka okénka skupiny ana-lyzované pro složení, tím větší paralelnost, kterou lzedocílit vzhledem k výhodnějším složeným kombinacím. Ztohoto hlediska uvažujme postoupnost instrukcí v násle-dující tabulce í:

Tabulka 1

Xí * z jakákoliv s loži telná instrukce X2 ž II ir f I LOAD Rí, /X/ ž zaveď Rí z paměti umístění X ADD R3, Rí ž R 3 = R 3 + Rí SUB Rí, R2 z R1 = Rí - R 2 COMP Rí, R3 z porovnej Rí s R3 X3 z jakákoliv složitelná inst rukce X4 II II H

Je-li horní mez pro složení vložená do technickéhovybavení rovna dvěma /nejvýše, dvě instrukce lze provéstparalelně v jednom cyklu/, potom existuje více způsobůsložení této posloupnosti instrukci závislých na rozsahuprogramového vybavení pro skládání.

Kdyby rozsah složení byl roven čtyřem, potom progra-mové vybavení pro složení by bralo v úvahu společně /XI, X2, LOAD, ADD/ a pak vysunulo dopředu jednu instrukci vdobě, aby byla vzata v úvahu dohromady /X2, LOAD, ADD, SUB/a /LOAD, ADD, SUB, COMP/ a /ADD, SUB, COMP, X3/ a /SUB, COHP, X3, X4/, čímž je vytvořeno následující optimálnípárování jako uchazečů na složenou instrukci: / — XV /X2 LOAD/ /ADD SUB/ /COMP X3/ / X4— /

Toto optimálni párování podle vynálezu úplně odleh-čuje vzájemná blokováni mezi LOAD a ADD a mezi SUB a COMPZpřičemž poskytuje dodatečné možnosti XI složené s jejípředcházející instrukci a X4 složené s její následujícíinstrukci.

Na druhé straně superskalárni počítač, který dynamickypáruje instrukce do jeho instrukčního vydání logiky nazákladě dodržováni metody "první zařazen, první vybrán",by vytvářel pouze následující párováni jako kandidáty naparalelní provedeni: /X1 X2/ /LOAD ADD/ /SUB COHP/ /X3 X4/

Toto nepružné párování přivodí úplnou sanaci určitýchblokujících instrukcí a docíleno je pouze částečných úspě-chů paralelního zpracování. Vývojový diagram na obr. 13 podává vysvětleni různýchkroků učiněných z důvodů rozhodnutí, které ze sousedníchstávajících instrukci ve slabikovém toku jsou kategorienebo třídy, podle čehož jsou kvalifikovány k vytvořenispolečných skupin ve formě složené instrukce pro zvláštníuspořádání soustavy počítače.

Podle obr. 5 existuje mnoho možných míst v soustavěpočítače, kde složeni může nastat af v programovém nebotechnickém vybaveni. Každé má svoje výhody a nevýhody.

Jak v obr. 5 ukázáno, existuji různé stupně, kterými pro-gram typicky prochází od zdroje kódu až po skutečné pro-vedení. Během kompilační fáze je výchozí program přeložendo strojového kódu a uložen na disk 46. Během prováděcífáze je program z disku 46 přečten a zaveden do hlavní pa-měti 48 speciálního uspořádání soustavy počítače 50, kdejsou instrukce provedeny příslušnými instrukčními základní-mi jednotkami 52, 54, 56. Složeni může nastat kdekoliv vprůběhu této cesty. Obecně čím blížeji je skladač umístěn 19 u instrukční základní jednotky nebo centrální základní jed-notky CPU tím více se stává doba omezení naléhavější. Je-liski adač umístěn dále od centrální základní jednotky C PU,muže být zkoušeno více instrukci v rozměrnějším okénku in-strukčního toku, aby se určilo nejlepši seskupeni pro slo-ženi při vzrůstající pracovní výkonnosti. Takové brzkésložení však přináší více než jeden dopad na zbytek systé-mové konstrukce podmiňující další vývoj a zvýšené náklady.

Jedním z důležitých předmětů vynálezu je opatřenitechniky pro stávající programy psané ve vyšších progra-movacích jazycích nebo stávajících asemb 1 erových jazyko-vých programech, aby byly zpracovány programovým vybavením,které může identifikovat posloupnosti sousedních instruk-cí způsobilých k paralelnímu provedení jednotlivými funkč-ními j ednot kami. Vývojový diagram v obr. 6 ukazuje generováni programusady složených instrukcí z asemblerového jazykového progra-mu v závislosti na sadě zakázkových skládacích pravidel 58,které nepříznivě se odrážejí jak na architektuře systému,tak technickém vybavení. Aseiablerový jazykový program jepřipraven na vstup do programového skládacího zařízení 59,které tvoří program složených instrukcí. Následující blo-ky instrukcí o předem stanovené délce jsou analyzoványprogramovým skládacím zařízením 59. Délka každého bloku60, ážz Šít ve slabikovém toku, která obsahuje skupinuinstrukcí, jež mají být dohromady složeny, je závislá nasložitosti zařízeni pro skládání.

Jak ukazuje obr. 6 toto speciální skládací zařízenije navrženo pro dvoucestné složeni instrukcí o počtu "m"a pevné délce v každém bloku. Primárním prvním krokem jestanovení zda první a druhá instrukce tvoří složitelnýpár, potom druhá a třetí tvoři složitelný pár, potom třetía čtvrtá tvoří složitelný pár a tak dále až do konce bloku. 20

Po identifikaci různých možných složitelných párůC1-C5 dalším velmi žádoucím krokem je určeni optimálníhovýběru složených instrukcí tvarovaných sousedními skalár-ními instrukcemi pro paralelní provedení. Na příkladu jeukázáno možné složení instrukcí z následujících různýchposloupností /nepředpokládá se větvení/: 11, C 2, 13,15,C3, C 5, 11 0; 11,C 2, 14, 15,16,C4, 19, 11 0; C1,I3, 14,I5,C3,C5,110; C1,13,14,15,16,C4,19,I10. Při základnímuspořádání speciálního technického vybaveni může zařízenípro složení vybrat preferovanou posloupnost složených in-strukcí a použit označeni nebo identifikační bity proidentifikaci optimální posloupnosti složených instrukci.

Neexistuje-li optimální posloupnost, mohou být iden-tifikovány všechny složitelné sousední skalární instrukcetak, že větvení k cíli umístěné mezi různými složenýmiinstrukcemi může využit kterýkoliv ze složených párů, sekterými se setká /viz obr. 14/. Kde jsou k dispozici více-násobné skládací jednotky je možno současně složit více-násobné následující bloky v toku instrukcí.

Specifická konstrukce programového skládacího zaříze-ní nebude dále zde probírána, protože podrobnosti jsouspecifické pro danou architekturu instrukčních sad a jsouzákladem realizace. Ačkoliv konstrukce takových složenýchprogramů je poněkud podobná koncepčně moderním kompiláto-rům, které vykonávají rozvrhováni instrukcí a jiné optima-lizace spočívající na specifických strojových architektu-rách, jsou použitá kriteria k dokončeni takových složenípodle tohoto vynálezu jednoznačná, jak nejlépe ukazujevývojové schéma na obr. 13. V obou případech pro daný vstupni program a popis instrukční sady a také architekturytechnického vybavení /to je strukturální hlediska prorealizaci/ je vytvořen výstupní program. V případě moderníhokompilátoru je na výstupu optimální nová posloupnost zestávajících instrukcí. V případě vynálezu výstupem je sériesložených instrukcí,z nichž každá je tvarována skupinou 21 sousedních skalárních Instrukci způsobilých paralelníhoprovedeni se složenými instrukcemi smíchanými s nes lož i -telnými skalárními instrukcemi a sjpot řebnými řídicími bi-ty k provedeni složených instrukci současně jako část vý-stupu.

Snadnější je samozřejmě předběžné zpracováni instrukč-ního toku za účelem vytvořeni složených instrukci, jestli-že existuji již známé referenční body pro označeni, kdeinstrukce začínají. Referenční bod jak je dále použitoznamená nějaké označené pole nebo jinou indikaci, kteráposkytuje informaci o umístěni instrukčních mezi. V mnohýchpočítačových systémech takový referenční bod je výhradněznám pouze z doby kompilace kompilátorem a jenom ze základ-ní jednotky při vyvoláváni instrukci. Takový referenčníbod není znám mezi dobou kompilace a vyvoláním instrukce,pokud je přijmuto speciální schéma referenčního značení.

Když je po době kompilace složeni hotovo, kompilátormůže označit referenčními značkami /viz obr. 11/, kteréslabiky obsahují první slabiku instrukce a které obsahujídata. Tato zvláštní informace přispívá k mnohem účinnější-mu složeni, ježto jsou známa přesná umístění instrukce.Samozřejmě kompilátor může identifikovat instrukce a roz-lišovat mezi instrukcemi a daty jinými způsoby za účelemposkytnuti specifické informace skládacímu zařízeni ozna-čením instrukčních mezí.

Je-li taková informace o instrukční mezi známa, po-kračuje generováni příslušných identifikačních bitů prosložení přímým postupem dopředu na základě pravidel prosložení stanovených pro speciální architekturu a uspořá-dání soustavy technického vybavení /viz obr. 8/. Neni-litaková informace o instrukční mezi známa a instrukce jsouproměnlivé délky, nastává mnohem složitější problém/viz obr. 9 a 16/. Tyto obrázky náhodou spočívají napreferovaném kódovacím schéma, které je podrobněji popsáno 22 v tabulce 2A dole, kde při dvoucestném složeni je k dispo-zici označeni bitem ”1”, je-li instrukce složena s dalšíinstrukci a označeni bitem "0", není-li složena s dalšíinstrukcí. Řídicí bity v řídicím poli přidané zařízením pro slo-žení obsahuji informaci, týkající se provedeni složenýchinstrukcí a mohou obsahovat tak malou nebo velkou informa-ci, jak je pokládáno za účelné pro zvláštní realizaci. Vobr. 12 je uveden přiklad osmibitového řídicího pole. Vnej jednodušším spojení v jeden celek je však žádán jenprvní řídicí bit pro označení začátku složené instrukce.Ostatní řídicí bity poskytuji dodatečnou volitelnou infor-maci týkající se provedení instrukcí. V alternativním kódovacím vzoru pro složené instrukcepoužitelném jak pro obě dvoucestná složeni, tak pro slože-ni velké skupiny, je stanoven první řídicí bit "1" prooznačeni, že odpovídající instrukce znamená začátek slože-né instrukce. Všechny ostatní členy složené instrukce budoumít svůj první řídicí bit stanoven "0". Nebude možno náho-dou kombinovat danou instrukci s ostatními instrukcemi,takže taková daná instrukce se objeví jako složená instruk-ce o délce jedna. To znamená, že první řídicí bit bude sta-noven "1", ale první řídicí bit následující instrukce budestanoven také "1". Podle tohoto alternativního kódovacíhoschéma budou dekódovací technické prostředky schopny zjistitkolik instrukcí obsahuje složená instrukce kontrolou všechidentifikačních bitů pro řady skalárních instrukci spíšenež toliko kontrolováním identifikačního bitu na začátkusložené instrukce jako v preferovaném kódovacím schématuuvedeném dole v tabulkách 2A-2C. Vývojový diagram v obr. 7 ukazuje typickou realizaci provedeni programu sady složených instrukcí, který je ge- nerován technickými prostředky preprocesoru 66 nebo progra- 23 mového proprocesoru 67. Slabikový tok složených instrukcivstupuje do rychlé vyrovnávací paměti 68 složených instrukcí, která slouží jako ukládaci vyrovnávací pamět poskytu-jící rychlý přistup ke složeným instrukcím. Výdej složenéinstrukce 69 vyvolá složené instrukce z rychlé vyrovnávacípaměti 68 a vyšle její jednotlivé složené instrukce dopříslušných funkčních jednotek k paralelnímu provedeni.

Je třeba zdůraznit, že jednotky /C i EU/ 71 k provede-ní složených instrukci, takové jako aritmetické a logickéjednotky ALUs v soustavě počítače složených instrukcí,jsou schopny provádět buó skalární instrukce jednu po dru-hé nebo alternativně složené skalární instrukce paralelněs ostatními složenými skalárními instrukcemi. Takové para-lelní provedeni může tedy být uděláno v různých typechprováděcích jednotek tak jako ALU * s, jednotek 75 s pohyblivou řádovou čárkou /FPZ, jednotek 75 pro generování pale-tových adres /AU/ nebo vícenásobně v jednotkách téhož typu/ F P1, FP 2, atd./ v souladu s architekturou počítače a uspořádáním specifického systému počítače. Konfigurace technických prostředků, kterými lze realizovat předložený vynálezjsou tedy dostupné až do vlastně neomezeného počtu prováděcích jednotek z důvodu dosažení maximální výkonnosti připaralelním zpracování. Kombinováním několika stávajícíchinstrukci do jediné složené instrukce dovoluje jedné nebovíce jednotkám pro zpracování instrukcí v soustavě počíta-če účinně dekódovat a provést paralelně tyto složené stá-vající instrukce bez zpožděni, které vzniká při běžnémparalelním zpracováni v soustavách počítače. V nejjednoduššich příkladových kódovacích schématechtéto přihlášky je přidána minimální informace ke složenído instrukčního toku jako jeden bit pro každé dvě slabikytextu /instrukce a data/. Ke každé instrukci ve složenémslabikovém toku lze obecně přidat označení obsahující ří-dicí informaci, což znamená ke každé nesložené skalární 24 instrukci právě tak jako ke každé složené skalární instrukci včetně páru, trojic, nebo větších složených skupin.Identifikační bity zde dále použité se týkají té částioznačení, které je specificky použito pro identifikacia roztříděni těch složených skalárních instrukcí tvoří-cích složenou skupinu ze zbytku nesložených skalárníchinstrukcí. Takové nesložené skalární instrukce zůstanouve složeném instrukčním programu a když jsou vyvolányjsou provedeny jednotlivě. V soustavě se všemi čtyřsLabikovými instrukcemi srov-nanými do čtyřslabikových mezi je přiřazeno jedno označe-ni každému čtyřslabičnému textu. Podobně, mohou-li býtsrovnány instrukce libovolně, je zapotřebí označení každéslabiky textu.

Ve znázorněném spojení v jeden celek jsou všechnyinstrukce Systému/370 zarovnány do mezí na půlslova /dvěslabiky/ s délkou buď dvě nebo čtyři nebo šest slabik,přičemž pro každé půlslovo je třeba označení s jednímidentifikačním bitem. Na příkladu malého seskupení slože-ných párů sousedních instrukcí označuje identifikačníbit "1", že instrukce začínající uvažovanou slabikou jesložena s následující instrukcí, zatímco "O” naznačuje,že instrukce začínající uvažovanou slabikou není složena.Identifikační bit přirazený půlslovům, které neobsahujíprvní slabiku instrukce je ignorován. Identifikační bitpro první slabiku druhé instrukce ve složeném páru je ta-ké ignorován. /V některých situacích větvení však tytoidentifikační bity nejsou ignorovány/. Výsledkem tohotokódovacího postupu pro identifikační bity je, že v ne j -jednodušším případě dvoucestného složení, je třeba jenomjeden bit informace pro základní jednotku během činnostipro identifikaci složené instrukce. 25

Kde je možno seskupit více než dvě skalární instruk-ce pro vytvořeni složené instrukce, mohou být požadoványdodatečné identifikační bity pro opatření adekvátní řídi-cí informace. Z důvodů sníženi počtu bitů požadovaných prominimální řídicí informaci, existuje však stále jiný al-ternativní formát k pokračování ve sledování složené in-formace. Například je možno i při skládáni velké skupinydocílit jeden bit pro instrukci při následujícím kódová-ní: hodnota "1" znamená složeni s následující instrukcía hodnota "0" znamená nesložit s následující instrukcí.Složená instrukce tvořená skupinou čtyř jednotlivých in-strukcí bude mít sled identifikačních bitů /1,1,1,0/ prosložení. Jako při provedení jiných zde popsaných složenýchinstrukci, jsou složené identifikační bity pro složenípřidružené půlslovúm, které nejsou instrukcemi a proto ne-mají žádné operační kódy, ignorovány v době provedeni.

Podle preferovaného dále popsaného kódovacího schémaminimální počet identifikačních bitů potřebný pro poskyt-nutí další informace udávající specifický počet skutečněsložených skalárních instrukci je logaritmus při základu2 /zaokrouhleno nahoru na nejbližší celé číslo/ maximální-ho počtu skalárních instrukci, které lze seskupit k vy-tvořeni složené instrukce. Například, je-li maximum dvě,pak je třeba jeden identifikační bit pro každou složenouinstrukci. Je-li maximum tři nebo čtyři, potom je zapotře-bí dvou identifikačních bitů pro každou složenou instruk-ci. Je-li maximum pět, šest, sedm nebo osm, potom je za-potřebí třech identifikačních bitů pro každou složenouinstrukci. Toto kódovací schéma je uvedeno dále v tabulkách2A, 28, 2C: 2ó

Tabulka 2A /maximum dvě/

Identifikační bity Zakódovaný význam Celkem # s loženo 0 Tato instrukce není slo-žena s následující instrukci žádné 1 Tato instrukce je slože-na s jednou následující instrukci dvě Tabulka 20 /maximum čtyři/ Identifikační bity Zakódovaný význam Celkem # s loženo 00 Tato instrukce není slože-na s následující instrukcí žádné 01 Tato instrukce je složena s jednou následující inst rukcí dvě 10 Tato instrukce je složenase dvěma následujícími instrukcemi tri 11 Tato instrukce je složena čtyři se třemi následujícímiinstrukcemi 27

Tabulka 2C /maximum osm/

Identifikační bity Zakódovaný význam Celkem s loženo 000 Tato instrukce není složena s následující instrukcí žádné 001 Tato instrukce je složena s následující instrukci dvě 010 Tato instrukce je složena se dvěma následujícími instrukcemi tri 011 Tato instrukce je složena se třemi následujícími instrukcemi čtyři 1 00 Tato instrukce je složena se čtyřmi následujícími instrukcemi pět 101 Tato instrukce je složena s pěti následujícími instrukcemi šest 110 Tato instrukce je složenase šesti následujícími instrukcemi sedm 111 Tato instrukce je složena se sedmi následujícími instrukcemi osm

Proto je z toho vyvozeno, že každé půlslovo potřebu- je označeni, ale podle tohoto preferovaného schéma základ- ní jednotka ignoruje všechny až na označení první instrukce - 28 - v prováděném instrukčním toku. Jinými slovy je zkoušenaslabika za účelem posouzeni zda je to složená instrukcetestováním, jejich identifikačních bitů. Není-li to začá-tek složené instrukce, jsou její identifikační bity nula.Je-li slabika začátkem složené instrukce obsahující dvěskalární instrukce, identifikační bity jsou ”1" pro prvniinstrukci a "0" pro druhou instrukci. Je-li slabika začát-kem složené instrukce obsahující tri skalární instrukce,identifikační bity jsou "2" pro první instrukci a "1" prodruhou instrukci a "0” pro třetí instrukci. Jinými slovyidentifikační bity identifikuji pro každé půlslovo zdatato zvláštní slabika je nebo není začátkem složené instruk·ce, zatímco v téže době oznamují počet instrukci, kterétvoři složenou skupinu.

Tyto příkladové metody kódováni složených instrukcipředpokládají, že tři instrukce jsou složeny k vytvořenitrojité skupiny a druhá s třetí instrukcí jsou také slože-ny k vytvořeni párové skupiny. Jinými slovy, jestliže sevyskytne v trojité skupině větvení k druhé instrukci, ozná-mí identifikační bit "1" pro druhou instrukci, že druháa třetí instrukce budou provedeny jako složený pár para-lelně, i kdyby první instrukce v trojité skupině nebylaprovedena.

Vynález ovšem není omezen na uvedené speciální kódo-vací preferované schéma. Různá jiná kódovací pravidla takjako dříve popsané alternativní kódovací schéma jsou mož-ná v oblasti a podle výkladu vynálezu.

Odborníkům z tohoto oboru je zřejmé, že předloženývynález požaduje jenom jedno složení instrukčního tokupro speciální uspořádání počítačové soustavy, načež jaké-koliv vyvolání složených instrukci způsobí také vyvolánis tím slučitelných identifikačních bitů. Následkem tohoodpadá neúčinné určováni v poslední minutě a výběr určitých 29 skalárních instrukci pro paralelní provedeni, k čemuž do-cház-i opakovaně při každém vyvoláni stejných nebo odliš-ných instrukci pro provedeni v tak zvaném super skalárnímstroj i.

Vzdor všem výhodám skládáni binárního instrukčníhotoku, stává se tento postup obtížným při určitých architek-turách počítače pokud není vyvinuta technika k určovániinstrukčních mezí ve slabikovém řetězci. Jsou-li povolenyproměnlivé délky instrukcí, je takové určování složité aještě složitější při vzájemném smíšení dat a instrukcí ne-bo je-li dovoleno upravovat přímo instrukční tok. V doběprovedení musí ovšem instrukční meze být známy s ohledemna správné provedeni. Jakmile je však složení dostatečněbrzo hotovo před provedením instrukce, byla vyvinuta jed-noznačná technika pro složeni instrukci bez znalosti, kdeinstrukce začínají a bez znalosti, které slabiky jsou da-ta. Tato technika je dále povšechně popsána a lze ji po-užít k tvorbě složených instrukci vytvořených ze soused-ních párů skalárních instrukcí právě tak jako k tvorbě slo-žených instrukcí vytvořených z větších skupin skalárníchinstrukcí. Tato technika je použitelná pro všechny instrukční soubory různých běžných typů architektur, včetně čítačepřemístěných instrukci RISC, v jehož architekturách in-strukce jsou obvykle konstantní délky a nej sou smíšeny sdaty. Další podrobnosti této techniky skládáni jsou popsá-ny v souběžné přihlášce ser. No. 07/519,382 s názvem"Universální technika pro složeni instrukčních úrovniparalelních procesorů" podaná 4«. 5. 1 990. Všeobecně vzato, technika složení je k dispozici prosloženi dvou nebo více skalárních instrukcí z instrukčníhotoku bez znalosti bodu rozběhu nebo délky každé jednotlivéinstrukce. Typické instrukce již obsahují operační kód vpředem určeném místě pole, které identifikuje instrukcia její délku. Ty sousední instrukce, které se kvalifikujipro paralelní provedení ve speciální konfiguraci počítačové 30 soustavy jsou opatřeny příslušnými značkami pro oznámeni,že jsou uchazeči na složení. V IBM Systému/370, v jehožarchitektuře jsou instrukce bud dvě, čtyři nebo šest sla-bik dlouhé, předpokládá se, že polohy pole operačníhokódu jsou založeny na odhadnuté instrukční délce kódu.Hodnota každého označení zatočená na předpokládanémoperačním kódu je zaznamenána a instrukční délka kódu vpředpokládaném operačnim kódu je použita k umístěni celéposloupnosti možných instrukcí. Jakmile jsou stanovenyinstrukční meze, jsou použity odpovídající správné hodno-ty označeni k identifikaci začátku složené instrukce aostatní nesprávně generovaná označeni jsou ignorována.

Tato jednoznačná technika složení je znázorněna jakopřiklad na výkresech obr. 8-9 a 14-15, kde jsou definová-na pravidla složení určující, že všechny instrukce o dél-ce dvou slabik nebo čtyř slabik jsou jedna s druhou složi-telné /to znamená, že dvouslabičná instrukce je schopnáparalelního provedeni v této speciální konfiguraci počí-tače s jinou dvous l abičnou nebo jinou čtyřs l abičnou in-strukcí/. Příkladná pravidla pro složení dále ukládají,že všechny instrukce dlouhé šest slabik nejsou vůbec slo-žitelná /to znamená, že v této speciální konfiguraci po-čítače šestislabičná instrukce je způsobilá sama o sobějediného provedeni/. Vynález neni samozřejmě omezen na ta-to pravidla pro příkladné složeni, ale je použitelný projakýkoliv soubor pravidel na složeni, která definuji kri-téria pro paralelní provedení stávajících instrukcí vespeciální konfiguraci pro danou architekturu počítače.

Sada instrukcí použitá jako příklad složeni v těchtotechnikách podle vynálezu je brána z architektury Systému/370^. Přezkoušením operačního kódu každé instrukce lzeurčit typ a délku každé instrukce a potom je generovánořídicí označení obsahující identifikační bity pro tutospecifickou instrukci jak dále podrobněji popsáno. Před- 31

Ložený vynález není ovšem omezen na jakoukoliv specific-kou architekturu nebo instrukční soubor a shora zmíněnápravidla jsou jenom příležitostným příkladem.

Preferované kódovací schéma slož^ených instrukcí bylojiž znázorněno dříve v celkovém přehledu na tabulkách2A - 2C. V prvém případě s pevnou délkou instrukcí bez smíšenýchdat a se známým umístěním referenčního bodu operačníhokódu, může složení pokračovat v souladu s aplikovatelnýmipravidly pro tuto speciální konfiguraci počítače. Poněvadžpole reservované pro operační kód také obsahuje délku in-strukce je běžně určena posloupnost skalárních instrukci,přičemž každá instrukce posloupnosti může se považovat zauchazeče pro paralelní provedeni s následující instrukci.První kódovaná hodnota v řídicím označeni oznamuje, žeinstrukce není složitelná s další instrukcí, zatímco druhá kódovaná hodnota řídicího označeni oznamuje, žeinstrukce je složitelná pro paralelní provedení s dalšíinstrukcí . V druhém případě instrukcí s proměnlivou délkou bezsmíšených dat a se známým umístěním referenčního bodu prooperační kód a také pro kód délky instrukce /který je vSystému/370 obsažen jako část operačního kódu/, složenimůže postupovat běžným způsobem. Operační kódy jak patr-no z obr. 8 oznamuji instrukční posloupnost 7Q jak násle-duje: první instrukce je dlouhá 6 slabik, druhá a třetíkaždá délky 2 slabik, čtvrtá je dlouhá 4 slabiky, pátá jedlouhá 2 slabiky, šestá je dlouhá 6 slabik a sedmá a osmákaždá délky 2 slabik. C-vektor 72 v obr. 8 ukazuje hodnoty identifikačníchbitů /na výkresech zvaných bity složení/ pro zvláštní po-sloupnost 70 instrukcí kde referenční bod oznamuje, že je 32 znám start první instrukce. Na základě hodnot těchto iden-tifikačních bitů druhá a třetí instrukce tvoří složený párjak označuje "V v identifikačním bitu pro druhou instruk-ci. Čtvrtá a pátá instrukce tvoři jiný složený pár jakoznačuje "1’* v identifikačním bitu čtvrté instrukce. Sed-má a osmá instrukce také tvoří složený pár jak označuje"1" identifikačního bitu pro sedmou instrukci. C-vektor 72 v obr. 8 je poměrně snadno generován,neboř neobsahuje žádné datové slabiky smíšené s instrukčními slabikami a instrukce jsou všechny stejné délky o zná-mých mezích.

Jiná situace nastává ve třetím případě, kde instrukcejsou smíšeny s neinstrukcemi a referenční bod poskytuje stále oznámeni začátku instrukce. Základní dia-gram v obr. 11 ukazuje jeden způsob značení instrukčníhoreferenčního bodu, kde každé půlslovo bylo označeno re-ferenčním označením pro indikaci, že obsahuje první slabi-ku instrukce nebo ji neobsahuje. Může tomu tak být jak uinstrukci s pevnou tak proměnlivou délkou. Stanovením re-ferenčního bodu je nezbytné ohodnotit část dat slabikové-ho toku pro možné složeni. Jednotka pro složeni podle tohomůže přeskočit a ignorovat všechny slabiky neinstrukční.

Mnohem složitější situace vzniká kde slabikový tokobsahuje instrukce proměnlivé délky /bez dat/, není všakznámo, kde začíná první instrukce. Poněvadž maximálnídélka instrukce je šest slabik a poněvadž instrukce jsouseřazeny do dvous l abikových mezi, existuji tři možnéstartovací body pro první instrukci toku. Technika podletoho dává na vybranou všechny možné startovací body proprvní instrukci v textu slabikového toku 79 jak patrnoz obr. 9.

Posloupnost i předpokládá, že první instrukce zahaju- je první slabikou a postupuje se složením dopředu podle 33 předpokladu. V tomto příkladovém spojeni v jeden celek dél-ka pole je také rozhodující pro hodnotu C-vektoru každémožné instrukce. Proto C-vektor 74 má jenom pro posloupnosti hodnotu "1" pro první instrukci možného složeného párutvořenou kombinacemi 2-sLabikových a 4-sLabikových instruk-c i.

Posloupnost 2 předpokládá, že první instrukce zaha-juje třetí slabikou /začátek druhého půlstova/ a postupujedopředu podle tohoto předpokladu. Hodnota délky pole protřetí slabiku je 2 oznamující, že další instrukce začínápátou slabikou. Procházením vpřed každou možnou instrukcizaloženou na délce pole předchozí instrukce, je celý poten-ciál instrukcí posloupnosti 2 generován podle možnýchidentifikačních bitů jak patrno z C-vektoru 76.

Posloupnost 3 předpokládá, že první instrukce začínápátou slabikou /počátek třetího půlslova/ a pokračuje jakpředesláno. Hodnota v délce pole pro pátou slabiku je 4znamenající, že příští instrukce začíná devátou slabikou.Pokračováním vpřed každou možnou instrukcí založenou nahodnotě délky pole předchozí instrukce, celý potenciálinstrukci posloupnosti 3 je generován podle možných iden-tifikačních bitů jak ukazuje C-vektor 78. V některých případech uvedeno tři posloupnosti poten-ciálních instrukcí se sbíhají do jediné posloupnosti. Vobr. 9 je věnována pozornost uvedeným třem posloupnostem,které se sbíhají do mezi instrukce osmé slabiky na konci80. Také je poznamenáno, že začínají-li další posloupnostina konci šesté, osmé a desáté slabiky, sbíhají se takérychle. Postoupnosti 2 a 3 při sbíháni do mezí instrukcena konci 82 čtvrté slabiky jsou mimo fázi při skládání aždo konce šestnácté slabiky. Jinými slovy tyto dvě posloup-nosti berou v úvahu různé páry instrukci založené na stej-né posloupnosti instrukci. Poněvadž sedmnáctá slabika za- 34 činá nes lož itelnou instrukci v 84, je mimo fázová sbíha-vost ukončena.

Nevznikne-li platná sbíhavost, je třeba, aby všechnytři možné posloupnosti instrukci pokračovaly do konceokénka. Kde však dojde k platné sbíhavosti a je zjištěna,sdruží se počet posloupnosti ze tří dock/ou /jedna z iden-tických posloupnosti se stane nezpůsobilá provozu/ a v ně-kterých případech ze dvou do jedné. Před sbíhavostí jsou tedy určeny pokusné meze instruk-ce pro každou možnou instrukční posloupnost a přidělenyidentifikační bity pro každou takovou instrukci označujícíumístěni potenciálních složených instrukci. Z obr. 9 jezřejmé, že tato technika generuje tři samostatné identi-fikační bity pro každé dvě slabiky textu. Za účelem vy-tvoření shody s předběžným zpracováním v případech A-D,je žádoucí zredukování tří možných posloupnosti do jedinéposloupnosti s identifikačními bity, kde je přidělen pou-ze jeden bit každému půlslovu. Poněvadž je zapotřebí jenjediná informace zda je běžná instrukce stožens s následu-jící instrukci, mohou být tři bity logicky čteny jako "0"k vytvoření jediné posloupnosti v CC-vektoru 86.

Pro účely paralelního provedení jsou sdružené identi-fikační bity sdruženého CC-vektoru rovnocenné jednotlivýmC-vektorúm jednotlivých tři posloupnosti 1-3. Jinými slovysdružené identifikační bity CC-vektoru umožňují kterékolivmožné posloupnosti správné paralelní provedeni složenýchinstrukci nebo jednotlivých nesložených instrukci. Sdruže-né identifikační bity také přispívají ke správnému větve-ní. Vznikne-li například větev na začátku deváté slabiky88, potom devátá slabika musí zahájit instrukci. Jinak vprogramu je chyba. Identifikační bit "1" přidružený k de-váté slabice je použit ke korekci paralelního provedení ta-kové instrukce s její příští postupující instrukci. 35 Různé kroky v metodě pro složení znázorněné na obr. 9jak shora popsáno jsou zobrazeny v obr. 16, který sám osobě přispívá k vysvětlení.

Nej lepši dobou pro poskytnutí informace referenčnímbodem pro instrukční meze je doba kompilace. Jak patrno zobr. 11 referenční označeni 1_01 mohlo by být připojeno vdobě kompilace k identifikaci zahájení každé instrukce. Tím je umožněno zařízeni pro složení postupovat zjednoduše-nou technikou ve shora zmíněném prvním, druhém a třetímpřípadě jak již dříve uvedeno. Kompilátor by ovšem mohlidentifikovat instrukční meze a rozlišovat mezi instrukce-mi a daty jinými způsoby z důvodu zjednodušení práce jed-notky pro složení a vyhnuti se komplikacím techniky tako-vé jak znázorněno na obr. 9.

Obr. 10 znázorňuje vývojový diagram možné realizaceskládající jednotky pro zpracování instrukčního toku, jakpatrno z obr. 9. Vícenásobný počet skládacích jednotek 204,206, 2tí§ by mohl být z důvodujúč i nnos t i tak velký jako jepočet půlslov v textu vyrovnávací paměti. Tři skládajícíjednotky v této verzi by začínaly zpracovávat posloupnostipříslušné první, třetí a páté slabiky. Po ukončeni možnéinstrukční posloupnosti, každá skládající jednotka zahájízkoušeni dalšího možného sledu přeloženého do šesti sla-bik z jejího předchozího sledu. Každá skládající jednotkatvoří složené identifikační bity /hodnoty C-vektoru/ prokaždé púlslovo textu. Tři posloupnosti ze tří skládajícíchjednotek jsou přečteny 110 a výsledné sdružené identifikač-ní bity /hodnoty CC-vektoru/ jsou uloženy do paměti a při-řazeny jejich odpovídajícím textovým slabikám.

Prospěšnou výhodou poskytovanou sdruženými identifi-kačními bity CC-vektoru je tvoření sledu vícenásobně plat-ných složených bitů založených na tom, která instrukce jeadresována cílem větvení. Jak nejlépe patrno z obr. 14-15 36 je možno z téhož slabikového toku složené instrukce růz-ně tvarovat.

Obr. 14 znázorňuje možné kombinace složených instrukcikdyž konfigurace počítače poskytuje paralelní vydáni a pro-vedení ne více než dvou instrukci. Kde je instrukční tok90 se složenými instrukcemi zpracován do jednoho normál-ního sledu, bude složená instrukce I vydána k paralelní-mu provedeni založenému na dekódováni identifikačního bituprvní slabiky CC-vektoru 92. Vyskytne-li se však větev kpáté slabice, bude vydána složená instrukce II k paralel-nímu provedení založená na dekódování identifikačního bitupro pátou slabiku.

Podobně normální sekvenční zpracováni jiného složené-ho slabikového toku 94 má za následek sekvenčně prováděnésložené instrukce IV, VI a VIII /instrukce složek v každésložené instrukci jsou přitom prováděny paralelně/. Větve-ní ve třetí slabice složeného slabikového toku má za násle-dek sekvenční provádění složených instrukcí V a VII, a in-strukce začínající patnáctou slabikou /tvoři druhou částsložené instrukce VIII/ bude vydána a provedena jednotlivě,přičemž vše spočívá na identifikačních bitech v CC-vekto-ru 96. Větveni v sedmé slabice má za následek sekvenční pro-vádění ve složených instrukcích VI a VIII, a větvení v jedenácté slabice má za následek sekvenční větveni ve složenéinstrukci VIII. Větvení v deváté slabice naopak má za následek sekvenční provádění ve složené instrukci VII /je tva-rována druhou částí složené instrukce VI a první části slo-žené instrukce VIII/.

Tak jsou zanedbány identifikační bity "1" v CC-vekto- ru 96 pro složené instrukce IV, VI a VIII, když je provádě- na některá ze složených instrukci V nebo VII. Alternativně 37 jsou zanedbány identifikační bity "I" v CC-vektoru 96 prosložené instrukce V a VII, když je prováděna kterákolivze složených instrukci IV, VI nebo VIII. V obr. 15 jsou znázorněny možné kombinace složenýchinstrukci, když uspořádáni počítače poskytuje paralelnívydávání a prováděni až do tři instrukcí. Kde instrukčnítok 98 obsahující složené instrukce je zpracováván do nor-mální posloupnosti, budou provedeny složené instrukce X/trojitá skupina/ a XIII /párová skupina/. Větveni v jede-nácté slabice naopak má za následek provedení složené in-strukce XI /trojitá skupina/, a větvení ve třinácté slabi-ce má za následek provedení složené instrukce XII /odlišnát roj itá skupina/.

Bity "2” identifikátoru v CC-vektoru 99 pro složenéinstrukce XI a XII jsou zanedbány, když jsou provedenysložené instrukce X a XIII. Na druhé straně, když je prove-dena složená instrukce XI, jsou zanedbány bity identifiká-toru pro ostatní tři složené instrukce X, XII, XII. Podob-ně, když je provedena složená instrukce XII, jsou zanedbá-ny bity identifikátoru pro ostatní tri složeno instrukceX, XI, XIII.

Existuje mnoho možných konstrukci jednotky pro slože-ní instrukce závisející na jejím umístěni a znalosti tex-tových obsahů. V nejjednodušší situaci bylo by žádoucí,aby kompilátor ukazoval pomoci označení, které slabikyobsahují první slabiku instrukce a které obsahují data.

Tato zvláštní informace má za následek mnohem účinnějšíjednotku pro složení, nebot jsou známa přesná umístěníinstrukce /viz obr. 13/. Znamená to, že složení lze vždyprovádět jako v situacích případu C za účelem generovániC-vektoru identifikačních bitů pro každou složenou instruk-ci /viz obr. 8/, Kompilátor mohl by tak přidat jinou infor-maci jako předpověď statického větvení nebo dokonce směr-nice do jednotky pro složení. 38

Pro rozlišení dat od instrukci lze použít jiných po-stupů kde instrukční tok má být složen je uložen do pamě-ti. Například jsou-li části dat řídké, vyžadoval by jednoduchý seznam adres obsahující data méně místa než označe-ni. Takové kombinace technických a programových prostřed-ků pro složení skýtají mnoho variant pro účinné vytvářenisložených instrukci.

Zatímco byla popsána příkladná preferovaná spojení vjeden celek podle vynálezu, bude na odbornících v tétooblasti techniky, aby posoudili různé modifikace a změny,které lze odvodit z myšlenky a obsahu vynálezu jak jedefinován v následujících nárocích.

Claims

♦«XMí-Ví... - 39 - PATENTOVÉ zfřv-xCce.n/ cíeA« 1 . |TeTeá?\^k~·"deci lení—ρ-a-ro l o ln para letního—provedeni N Á R 0

<ii ch instrukci—ve- spéci álni—konfiguraci—systému—k-a a při dot> vyznačuj lei se tím, že obsahuje přidělovániurčitých stávajících instrukci do vícenásobných katego-riíz porovnání kategorii sousedních stávajících instrukciv instrukčním toku k rozhodnutí zda jsou sousední stávají-cí instrukce způsobilé paralelního provedení ve speciál-ní konfiguraci systému ke zpracováni dat a identifikovánípomocí ukazatele složení těch sousedních stávajících in-strukcí, které jsou pomocí porovnávacích kroků uznány zazpůsobilé paralelního provedení. ~í- U , 2. í'4-e4-e-d-ei p o d l e nároku 1dělovací a porovnávací krokystávající instrukce vyvolány , vyznačující se tímz žejsou vykonány dříve, nežk proveden í. př i -jsou 3. fAe-t-oete/pod l e nároku í nebo 2, vyznačující se tím,že přidělovací krok obsahuje přidělení určitých instrukcído nejméně jedné kategorie tak, že zmíněný porovnávacíkrok přiměje identifikační krok k identifikaci nejménědvou sousedních stávajících instrukcí pomocí indikátorusložení u nejméně jedné kategorie pro paralelní provedení. V> / 4. ťat o-ďaí podle nároku 1 až 3, vyznačující se tím,že přidělovací krok obsahuje přidělení určitých instrukcído nejméně dvou různých nepřesahujících kategorií tak,že zmíněný porovnávací krok přiměje identifikační krokk identifikaci indikátorem sloeení nejméně dvou soused-ních stávajících instrukci ze zmíněných dvou kategorií,navzájem pro paralelní provedení. 5. f+et-o-d-a^pod l e nároků 1 až k, vyznačující se tím, že identifikační krok obsahuje upuštění od cílového kódu stávajících instrukci v jeho původním tvaru pro jednotli- vé provedení nebo pro paralelní provedeni s jinou instrukcí. 40 6. r^e-t-ocka podle nároku 1 až 5, vyznačující se tím, že přidělovací krok bere v úvahu vzájemné blokování závis-lých dat mezi instrukcemi právě tak jako existenci relativ-ního blokováni sdružených funkčních jednotek ve speciálníkonfiguraci systému zpracovávajícího data. 7. K-e-tod-a podle jednoho z nároku 1 až 6, vyznačujícíse tím, že přidělovací krok bere v úvahu vzájemné bloková-ní mezi instrukcemi závislé na technických prostředcíchprávě tak jako existenci relativního blokováni sdruženýchfunkčních jednotek ve speciální konfiguraci systému prozpracování dat. ~2. t 8. ?še+o-d-a podle jednoho z nároku 1 až 7, vyznačujícíse tím, že porovnávací krok obsahuje porovnávání prvnístávající instrukce s druhou sousední následující instruk-cí pro možné složeni s každou další, a potom porovnávánídruhé instrukce s třetí sousední následující instrukcí promožné složeni s každou další, k identifikováni vícenásob-ných složených instrukcí identifikovaných příslušnýmiindikátory pro vícenásobné složení. 9. M-etoda podle nároku 8, vyznačující se tím, žeobsahuje dodatečný krok pro určeni optimální posloupnostivícenásobných složených instrukcí pro danou část instrukč-ního toku. 10. H-e-tod-e podle jednoho z nároků 1 až 9, vyznačují-cí se tím, že porovnávací krok k určení zda sousední stá-vající instrukce jsou způsobilé paralelního provedeni jezaložen na použití technických prostředků spíše než popi-su operačního kódu. ~L zvH i 1 . *ys~té-m pro zpracování posloupnosti instrukcí ode- braných ze stávajícího sledu strojových instrukci za úče- lem přípravy postoupnosti pro paralelní provedení speciál- 41 ní konfigurací počítače, vyznačující se tím, že obsahujesoubor pravidel spočívající na speciální konfiguraci po-čítače indikující určité strojové instrukce, které jsouzpůsobilé k paralelnímu provedení s jinými strojovýmiinstrukcemi a prostředky složení pro předběžné zpracovánípřed vyvoláním binárního instrukčního toku s obsahem stá-vajících instrukcí, přičemž zmíněné prostředky složeni ma-jí přístup k souboru pravidel pro identifikaci sousedníchinstrukci způsobilých paralelního provedeni ve speciálníkonfiguraci počítače a pro vytvořeni složené posloupnostiinstrukcí mající řídicí pole k identifikování jednotli-vých sousedních instrukcí způsobilých pro paralelní prove-dení a které dohromady tvoři složenou instrukci. 12. 3ysléur podle nároku 11, vyznačující se tím, žeprostředkem ke složeni je program předběžného zpracováníprogramovými prostředky použitými jako část kompilátorunebo následného kompilátoru. 13. p o d l e nároku 11 nebo 12, vyznačující setím, že prostředek složení představuje jednotka pro před-běžné zpracování technickými prostředky, která zpracováváinstrukce před jejich vyvoláním z rychlé vyrovnávací pamě-ti. ien/
14. Sy-s-t-éflt' podle jednoho z nároků 11 až 13, vyznaču-jící se tím, že prostředek složení je způsobilý vytvářetsložené posloupnosti instrukci s řídicím polem k identi-fikování párů sousedních instrukcí způsobilých pro para-lelní provedení.
15. Sy-s-bé-m podle bodu 14, vyznačující se tím, že pro-středek složeni je způsobilý tvořit složené posloupnostiinstrukci s řídicím polem pro identifikování skupin třínebo více sousedních instrukcí způsobilých paralelníhoprovedení . - 42 - 2 λΜ ? c ίΆι Ίό. Sy s-t é-m podle jednoho z nároků 11 až 15, vyznaču-jící se tím, že řečene řídicí pole obsahuje nejméně jedenidentifikační bit sdružený s každou složenou instrukci. Z-Arl řňi 17. podle nároku 16, vyznačující se tím, žeřečené řídicí pole obsahuje identifikační část bitu a ří-dicí část bitu odlišnou od řečené identifikační částibitu. 18. podle jednoho z nároků 11 až 17, vyznačují-cí se tím, že řečené řídicí pole obsahuje nejméně jedenidentifikační bit přidružený ke každé jednotlivé instruk-ci tvořící složenou instrukci. Λ '* 19. 8-ystém podle nároku 18, vyznačující se tím, žeřídicí pole obsahuje nejméně jeden identifikační bit při-družený ke každé jednotlivé instrukci netvořící složenouinstrukci. 20. S-jrs-t-ém podle jednoho z nároků 11 až 19, vyznaču-jící se tím, že zmíněný soubor pravidel je založen napoužití technických prostředků spíše než na popisu operač-ního kódu. ?ar'ize/li’
21. Systém pro generování instrukčního toku pro para-lelní provedení ve speciální konfiguraci počítače, vyzna-čující se tím, že obsahuje seznam stávajících skalárníchinstrukci seskupených do vícenásobných kategorií založenýna způsobilosti stejných nebo různých kategorií instrukcí k paralelnímu provedení ve speciální konfiguraci počítače,prostředky pro předběžné zpracování k přijmu na vstupuskalárních instrukcí jako části binárního slabikového to-ku a pro rozhodnutí podle zmíněného seznamu, které soused-ní skalární instrukce jsou kandidáty pro paralelní prove-dení ve speciální konfiguraci počítače, a prostředky kesložení pro tvorbu označeni přidružených určitým skalárním 43 instrukcím v instrukčním toku indikujícím, které sousednískalární instrukce jsou částí složené instrukce způsobilépro paralelní provedeni, a které skalární instrukce vinstrukčním toku nejsou způsobilé pro paralelní provedeníve speciální konfiguraci počítače. 7(/ιι
22. Sy sH: ém podle nároku 21, vyznačující se tim, žeobsahuje dále řídicí prostředky pro kontrolování instrukčniho toku a pro vydáni vícenásobných složených instrukcipro paralelní provedení s každou jinou.