TW405093B

TW405093B - Data processor and data processing system

Info

Publication number: TW405093B
Application number: TW086115051A
Authority: TW
Inventors: Fumio Arakawa; Norio Nakagawa; Tetsuya Yamada; Yonetaro Totsuka
Original assignee: Hitachi Ltd
Priority date: 1996-10-16
Filing date: 1997-10-14
Publication date: 2000-09-11
Also published as: US6327605B2; KR100526315B1; JPH10124484A; US20010011291A1; KR19980032693A; US6243732B1; US6038582A; JP3790307B2

Description

經濟部中央標準局兵X消费合作社印裝 4050¾¾___ 五、發明説明q ) 本發明係有關於一種應用在內積演算以及行列演算之資料處理器。特別是有關於一種最適合於3次元圖形控制的資料處理系統，例如有關於一種執行4元以下之浮動小數點向量或行列之應甩之資料處理器的有效的技術。在3次元圖形中有關圖形的旋轉、放大、縮小、透視投影以及平行移動大多是利用一使用4 X 4之轉換行列的行列演算，又在決定受光面的亮度時則可以利用內積演算。而在如此之行列演算或是內積演算時必須要反覆地實施積和演算。又對於在3次圖形中所處理的資料，在高階（ high end)的系統中以往則利用浮動小數點數•即使是如遊戲機或攜帶情報終端般之對於成本限制嚴格的領域，所處理的資料也逐漸自整數移至浮動小數點數•而此是因爲利用浮動小數點數時程式設計較容易，且適合於高度的處理〇積和演算係一進行單一功能操作（A + B)+ C之演算者，例如在 Microprocessor Report，Vol.8，No.l5，November 14， 1944，ρρ.6·9，ΡΑ-80000 Combines Complexity and Speed中已揭露一備有稹和演算單元的處理器，而稹和演算單元的並列度爲2。又在日經電子（日經PB社）1 996 · 1 . 1 5(No .6 5 3). P P 1 6 — 1 7中則有關於將3次元描畫功能放入一個晶片內的半導體積體電路的記載。將在1個週期內執行8個固定小數點資料之演算的積和演算器組入到此，而可以在2個週期內執行利用4 X 4之行列的座標轉換本紙張尺度速用中國國家標準（CNS ) A4规格（210X297公釐） (請先閲讀背面之注意事項再填寫本頁) 訂岣、！ -4- 經濟部中央標準局負工消费合作社印箄 A7 _______B7_ 五、發明説明& ) 〇又在特開昭6 4 — 3 7 5 4中則記載有由4個乘法器以及可將該4個乘法器的輸出相加之加法器所構成的乘法電路。該乘法電路由於是一用於處理基本語長以及其2倍語長的乘法運算者，因此其位數對合功能則是一針對該處理將化而成的單純設計，而無法進行浮動小數點數的內積演算。又在特開平5 — 1 50944中則記載有一具有多個稹和演算器與用於連接該些之手段的數位信號處理器。該數位信號處理器則是以整數爲對象。又在特開平5—216657中則記載有用於數位信號處理的高速處理器，而記載了利用該高速處理器的浮動小數點積和演算來執行幾何（geometry)處理。又在特開平5-233228中則記載之浮動小數點演算裝置以及其演算方法，而且記載有縮小浮動小數點單元之尺寸的方法。由於係一將乘法陣列設成一半而使用2次的方式，除了性能會成爲一半外，乘法陣列以外並不會被縮小，因此會導致浮動小數點單元的面積對性能化降低。以上所述之所有的習知技術對於使利用浮動小數點數之4 X 4的行列演算或是內稹演算高速化則完全未加以考慮。本發明人等則針對使利用浮動小數點的行列演算或是內積演算高速化加以檢討•根據此，由於浮動小數點數之積和演算之電路規模大，因此在單純地予以並列時’則其 ---I--_— —，Γ ---11—訂 II----攻-------- . 一 . (請先聞讀背面之注$項再填寫本頁) 本紙張尺度適用中國國家橾準（CNS ) A4规格（210X297公釐} -5- 經濟部中央橾準局員工消费合作社印製 405093 a? B7 五、發明説明g ) 電路規模會顯著地增加，如在上述第1文獻中所記載般其並列度爲2左右*而顯然在高速化有其極限•又在上述第 2文獻中所記載的內容，雖然可以在2個週期內實施利用 4 X 4之行列的座標轉換，而可以實現某個程度的高速化，但是很明顯地由於利用位元數少的整數積和演算器之緣故，不得不犧牲掉演算精度。本發明之其他目的即在於提供一種可以儘量抑制電路的增大情形，而能夠高精度且高速地處理行列演算或是內積演算的資料處理器。本發明之目的在於提供一種能夠使利用浮動小數點數的行列演算或是內稹演算高速化的資料處理器。在本發明中所揭露之發明中之代表者若是簡單地說明其槪要內容則如下。亦即，耷料處理器，其中浮動小數點單元具備演算部，而該演算部包含有分別自不同的資料输入信號群供給浮動小數點數的虛數部，且將所供給之虛數部相互間予以相乘時多個乘法器、接受各乘法器的輸出而進行對位位移的分析器，根據上述浮動小數點數的指數部而產生上述分析器之對位位移數以及規格化前之指數的指數處理部，將上述分析器之輸出相加的输入加法器；以及將上述多輸入加法器之輸出與上述規格化前之指數予以規格化的規格化器· 藉由將多個乘法器的乘法運算以及各乘法器之乘法結果的加法運算同時執行，資料處理器能夠使根據浮動小數本紙張尺度適用中國國家標隼（CNS ) A4规格（210X297公釐） ϋ n -- -—^n I -f- I- (請先閲讀背面之注項再填寫本頁) 訂 405093 經濟部中央橾準局負工消費合作杜印裝五、發明説明ς ) 點的內積演算或是向量轉換演算得以高速化。又由於可以藉由，以同時的乘法以及加法運算來求取內稹’而不需要在針對2個輸入每次進行稹和演算時要進行捨入（round)處理，因此，內稹演算的等待時間（latency)短’演算精度變高，而如對2個輸入每次反覆進行稹和演算時，不會因爲演算順序不同即導致不同的演算結果·又由於資料處理器只需具備1個用於規格化的電路即可，因此可以儘量地抑制電路規模的增大情形，而能夠高速且高精度地根據浮動小數點進行內積演算或是向量轉換演算· 爲了要能夠有效率地對於在浮動小數點數之同時的乘法以及加法運算中之負數進行處理，上述演算部更包含可因應在各乘法器中被相乘之浮動小數點數的符號而產生與各乘法器之乘法結果呈對應之符號的符號處理部，上述分析器具有可將對位移位結果選擇性地以反轉或是非反轉之形態輸出的選擇器，當對於所對應之上述乘法結果的符號爲負時則選擇反轉輸出，而上述多輸入加法器則進行在對應於對上述乘法結果的符號爲負的分析器的輸出加1而產生進位，且針對負的乘法結果進行2的補數處理。 .根據演算部而來之演算對象資料以及演算結果資料則暫時、地儲存在暫存器檔案（register file)。此時，對於乘法器之並列運算爲必耍的全部資料則必須自暫存器檔案並列地供給到多個乘法器，此時，爲了要在不增加暫存器的埠（ port)數以及暫存器之指定段（field)之位元數的情況下能執行該處理，乃將暫存器檔案設成暫存器群組（register bank)構 (請先《讀背面之注意事項再填寫本頁) 十訂 ! 本纸張尺度適用中國國家標準（CNS ) Λ4規格（210X297公釐）經濟部中央揉準局貝工消费合作社印笨 405093 五、發明説明ς ) 造，而將多個暫存器群組或是單數的群組的暫存器呈並列地連接到上述乘法器之各輸入端子。當著眼於內稹演算時，則直接求取4元以下之內積的內稹演算命令可以包含在資料處理器的命令組（set)中’上述浮動小數點單元更具有可對用於規定分別由多個成分所示表示之資料間之內積演算的浮動小數點命令進行解碼的控制部，該控制部則對上述浮動小數點命令進行解碼，將暫存器檔案所保有之資料的成分經由上述信號線群供給到上述演算部，在上述演算部中對所給予的資料作內積演算，且將內積的演算結果寫入到上述暫存器植案內。當著眼於行列轉換演算時，則用於求取轉換行列與向量之稹的向量轉換演算命令可以包含在資料處理器的命令組中。上述浮動小數點單位更具有可對用於規定分別由多個成分所表示的資料與轉換行列之行列演算的浮動小數點命令進行解碼的控制部，該控制部則對上述浮動小數點命令進行解碼，而讀取暫存器檔案所保有之資料的成分與上述轉換行列的成分，且將該些經由上述信號線群供給到上述演算部，在上述演算部中對所給予的資料進行內積演算，且將內稹演算的結果寫入到上述暫存器槽案，將如此一連串演算循環連續地反覆執行多次，控制上述各演算循環的等待時間以使在連續多次被執行之最後的演算循環中的上述暫存器檔案的讀取動作較將在最初之演算循環中的內稹演算結果寫入到上述暫存器檔案的時間爲早•又，此時，若在上述各演算週期中針對雙方之群組呈並列地進行自本紙張尺度適用中國國家標率（CNS > Α4规格（210X297公釐） (請先Μ讀背面之注$項再填寫本頁) 訂 -^! -8- 經濟部中央標準局貝工消费合作社印製 405093 五、發明説明g ) 上述暫存器.樣篇的讀取動作或是只針對其中一個群組進行對上述暫存器群組的寫入動作’則可以彌補浮動小數點暫存器之數量的不足。亦即可以將多個操作數〇Perand(轉換行列、向量資料）個別地分別配到多個群組而利用暫存器檔案〇在利用該暫存器群組時，如1 6位元固定長度浮動小數點命令般，暫存器指定區（field)乃被限制，因此對於暫存器的數目被限制之體系結構（aVchitecture)有用，且對於資源被限制之體系構造（avchitecture)的資料處理器而言•可以根據浮動小數點來進行內稹演算以及向置轉換演算。又藉由在上述演算部追加係數表以及乘法器的回饋電路，可以根據區間分割與高次的多項式展開來求取三角函數的近似値。根據此，可以在不必大幅增加晶片面積的情況下即能夠得到在轉換行列等中所利用的正弦以及餘弦· 資料處理器更包含被連接到位址匯流排以及資料匯流排的C P U，而上述浮動小數點單元被連接到上述資料匯流排，且上述浮動小數點單元則利用1 6位元固定長度浮動小數點命令組來執行浮動小數點處理。上述C PU則進行對於上述浮動小數點單元要得到執行浮動小數點處理的命令與資料時爲必要的定址（addressing)處理•藉此，浮動小數點單元不需要支援與C P U相同之高性能的定钍模式，而就該點而言，浮動小數點命令可以得到1 6位元固定長度。本發明之上述以及其他的目的與新穎的特徵可以-由本本紙張尺度適用中國國家揉準（CNS ) A4规格（210X297公釐） (#先閱讀背面之注意事項再填寫本篾) 訂 -f. • 9 · 經濟部中央揉準局貝工消费合作社印裝 405093 五、發明説明& ) 說明書的記載以及所附的圖面而明白。資料處理器之構成第1圖係表本發明之一例之資料處理器的方塊圖•在同圖所示之資料處理器1具有32位元R I S C ( Reduced Instruction Set Computer)的體系結構，而執行1 6位元固定長度浮動小數點命令。該實施態樣對於應用到必須要充分地支援3次元圖面之機器組入控制（例如視頻遊戲）極爲有效。該資料處理器1具有浮動小數點單元2·而浮動小數點單元2進行演算之浮動小數點數則被設爲單精度。更者，資料處理器1具有中央處理裝置（CPU)3，該CPU3 則被設成具有可以處理整數之能力的整數單元。上述 C P U 3則經由3 2位元資料匯流排4而被結合到上述浮動小數點單元2。C P U 3以及浮動小數點單元2則經由命令匯流排5自命令快取單元6讀入命令。命令位址則自 CPU 3被供給到命令快取單元6。資料快取單元7則被連接到上述資料匯流排4，且經由資料位址匯流排8自 C P U 3被供給資料位址。上述資料快取單元7以及命令快取單元6則分別備有未圖示的快取控制器以及快取記億體。上述命令快取單元3以及資料快取單元7則經由包含資料信號以及控制信號的快取匯流排13被連接到匯流排控制器9。在命令快取單元6中之因爲快取失誤（cTache miss)等所引起之用於外部存取的命令位址則被供給到上述本紙張尺度適用中國國家揉準（CNS ) A4规格（210X297公釐） <請先《讀背面之注$項再填寫本頁) 訂 •10- 經濟部中央橾準局貝工消費合作社印製 A7 405093 B7___ 五、發明説明) 匯流排控制器9。又在資料快取單元7中之因爲快取失誤等所引起之用於外部存取的資料位址則被供給到上述匯流排控制器9。匯流排控制器9則根據該些命令位址或是資料位址，而爲了要對被連接到代表性被圖示之位址端子以及資料端子等的外部記憶體等進行存取，則起動外部匯流排週期。又，計時器或串列通訊介面控制器等的周邊電路 10則經由周邊匯流排11被連接到匯流排控制器9·第 1圖所示之資料處理器則被形成在如單晶矽般的1個半導體基板上。上述浮動小數點單元（以下只稱爲F P U)2則爲了要實施浮動小數點處理乃自記憶髅要求資料或命令。在本實施形態中，上述F P U 2並未具備將資料儲存在資料快取單元7之快取記憶體或是自該快取記憶體獲得資料之記憶體定址（memory addressing)能力。而此是因爲藉由去除F P U 2之記憶體定址電路的必要性可以節約晶片面積之故。取代此，CPU3則具有代替FPU2對快取記憶體等實施定址的功能。因此，FPU2或浮動小數點命令並不需要支援與C P U 3同樣之強力的定址模式，該功能全部由CPU3來負擔。CPU3不只爲了 FPU2要自記憶體取出（fetch)資料，CPU3也爲了 FPU2要自記憶體取出（fetch)包含浮動小數點命令在內的所有的命令。

命令則爲C P U 3與F P U 2兩方所讀取且被解碼。 CPU3，當經解碼的命令爲CPU命令時，則執行由其所指示的整數處理·又，CPU3，當經解碼的命令爲 FPU命令時，則取代FPU2而進行定址處理·FPU 本紙張尺度適用中國國家標準（CNS ) A4规格.（210X297公釐） {請先閲讀背面之注意事項再填寫本頁) 訂 ?、！ -11 - 經濟部中央標準局員工消費合作社印装 405093___B7____ 五、發明説明b ) 2，當經解碼的命令爲F P U命令時，則執行由其所指示的浮動小數點處理。又，FPU2，當經解碼的命令爲 C PU命令時，則忽視該命令。第2圖係表上述資料處理器之主要的暫存器構成* CPU暫存器具有1 6個通用暫存器r 〇〜r 1 5以及與此對應之卡聶爾群暫存器（Kernel bank register)kO〜k7 。例如卡聶爾群組暫存器k 0〜k 7，在例外發生時，會取代通用暫存器r 〇~r 7的保存動作（save)藉由群組切換控制而被利用· FPU暫存器係設成具有前群組（front bank在此bank 是指在主記憶體中，讀取以及寫入可獨立構成的部分）與後群組（back bank)的群組暫存器（bank register)。群組暫存器則具有與此對應的16個暫存器b 0〜b 1 5 »要利用那一個群組的暫存器則是由例如控制暫存器之控制位元的値來決定，當爲FPU暫存器時，在執行特定之浮動小數點命令時，可將兩方之群組的暫存器當作來源暫存器（source register)以及目的暫存器來使用。至於其詳細內容請容後述。前群組的暫存器f 0〜f 1 5則相對於單精度格式的浮動小數點數設成1 6個暫存器，而相對於倍精度格式的浮動小數點數設成8個暫存器（dO，d2，d4，d8， dlO，dl2，dl4)，且相對於各成分具有甴單精度格式所給予之4個成分的向量資料設成4個向量暫存器（ vO，v4，v8，vl2)。. 又具有由F P U 2與C PU 3所共有之通訊暫存器本紙張尺度適用中國國家標準（CNS ) A4規格（210X297公釐） {請先聞讀背面之注意Ϋ項再填寫本頁) f 訂 • 12- 經濟部中央標準局貝工消费合作社印装 405093 五、發明説明k ) FPUC。該暫存器FPUC係爲了使在CPU3與 F P U 2之間之資料的授受得以高速化而設的。此外，上述各暫存器係3 2位元的構造。 F P U的構造第3圖係表上述FPU2的方塊圖。FPU2係由轉送方塊2 0，暫存器棺案（register file)21，演算方塊2 2 以及控制部2 3所構成。演算方塊2 2的詳細內容如後所述具有用於實現行列演算或向量演算之高速化的積和演算電路的構造。暫存器檔案2 1包含第2圖中所述之F PU 2暫存器，針對演算方塊2 2具有8個讀取埠A[〇]， B[〇]， A[l]， B[l]， A[2]， B[2]， A[3]， B[3] ，具有可自演算方塊2 2接受資料的寫入埠X。轉送方塊 2 〇具有可將自暫存器檔案2 1的寫入埠C所輸出的資料供給到資料匯流排4的匯流排驅動器2 0 0，以及選擇來自資料匯流排4的輸入或是來自暫存器檔案21之輸出而供給到暫存器植案2 1之寫入淳Y的選擇器2 0 1。控制部2 3則對自命令匯流排5所供給的命令進行解碼，且根據該解碼結果來控制傳送方塊2 0，暫存器檔案2 1以及演算方塊2 2。匯流排驅動器2 0 0以及選擇器2 0 1的控制信號BusDrv以及LoadCnti也是囱控劁部2 3所形成。第4圚係演算方塊2 2的一例。演算方塊2 2具有分別地結合到暫存器植案之寫入埠A[0]，B[0]，A[l]， B[l]，A[2]，B[2]，A[3]，B[3](將該些寫入埠簡本紙張尺度適用中國國家揉準（CNS ) A4规格（2丨0X297公釐） (讀先閲讀背面之注意事項再填寫本頁) 订 -13- 405邮經濟部中央標準扃貝工消费合作社印製五、發明説明h ) 稱爲 A[n]，B[n]的信號線 La〇，Lb〇，La 1， Lbl，La 2，Lb2，La3，Lb3(將該些信號線群簡稱爲La i，Lb i)·經由各信號線群La i ， Lb i將浮動小數點數的虛數當作乘數以及被乘數供給到 4個乘法器220a〜220d·乘法器220a〜 2 2 0 d則將分別所供給的乘數以及被乘數相乘，且輸出其稹 M[〇]，M[l]，M[2]，M[3](以下簡稱爲 M[n])。積Μ [ 0 ]，Μ [ 1 ]，Μ [ 2 ]，Μ [ 3 ]則分別被供給到對應的對位器2 2 Γ a〜2 2 1 d。被供給到各信號線群La i ，Lb i之浮動小數點數的指數部則分別被供給到加法器2 2 2 a〜2 2 2 d ·又被供給到各信號線群La i，Lb i之浮動小數點數的符號部則分別被供給到排他性邏輯和閘E OR 1〜E OR 4 〇上述加法器222a〜222d、最大指數遘擇部. 2 2 3以及減法器2 2 4 a〜2 2 4 d則構成指數處理部 228。加法器222a〜222d則將與乘數和被乘數對應之浮動小數點數的指數部相加，且输出其和E[〇]， £[1]，£[2]，£[3]。最大指數選擇部2 2 3則自上述指數的和E[0]，E[l]，E[2]，E[3]中選出最大者作爲£11^-乂。減法器2243〜224(1則自£1112艾減去 E[〇]，E[l]，E[2]，E[3]，而得到差分Ediff[0]’ Ediff[ 1 ]，Ediff[ 2 ]，Ediff[ 3 ](以下簡稱爲 Ediff[n]。上述差分 Ediff[ 0 ]，Ediff[ 1 ]，Ediff[ 2 ]，Ediff[ 3 ]則藉由上述 (請先閲讀背面之注意事項再填寫本頁 Λ·. 訂成本紙張尺度適用中國國家標準（CNS ) A4規格（210X297公漦） 405093_^_ 五、發明説明h ) 對位器22 1 a〜22 1 d而控制對位位移數。因此’各對位器221a〜221d的输出Ma 1η[0]，

Ma 1 n[l]，Ma 1 n[2]，Ma 1 n[3]以下簡稱爲 Ma 1 n[n]則具有與最大指數Emax呈對應的位數位置。如此般，指數部2 28除了根據上述差分Ediff[ 0 ]， Ediff[ 1 】，Ediff[ 2 ]，Ediff[ 3]而決定上述對位器 2 2 1 a 〜2 2 1 d的對位位移數外，也根據浮動小數點數的指數部而產生在規格化前的指數Ema X。上述排他性邏輯和閘EOR1〜EOR4、排他性霪輯和閘EOR5〜EOR8以及符號選擇部2 2 5則構成符號處理部229，上述排他性邏輯和閘EOR1〜經濟部中央標準局舅工消费合作社印簟 {請先閱讀背面之注意事項再4寫本頁) E OR 4則輸入與乘數和被乘數對應之浮動小數點數的符號而判斷乘數與被乘數之積的符號。經判定的符號S[〇】， 8[1]，8[2]，8[3]則在符號選擇器2 2 5中將與上述與上述Emax對應的其中一者選作Sma X。上述符號S [0]，S[l]，S[2]，S[3]與代表符號 Smax 是否一致則是由排他性邏輯和閘EOR5〜EOR8來決定。該判定結果 Inv[〇]，Inv[l]，Inv[2]， I η v [3 ](以下簡稱爲I η ν [η ]))則被供給到所對應對位器221a〜22 1d，例如當判定結果Ιην[〇]， I η ν [ 1 I η ν [ 2 ]，I η ν [ 3 ]爲邏輯値、1，時，則對位器2 2 1 a〜2 2 1 d會使所對應的積Μ[η]反轉而形成輸出Ma In [η]。而此則設成將稹Μ[η]轉換成2的補數的前置處理·如此般，符號處理部2 2 9則會針對在本紙張尺度適用中國國家標準（CNS ) Α4洗格（2丨0X297公釐） -15- 經濟部中央標準局負工消费合作社印製 405093 A7 ____B7 五、發明説明b ) 各乘法器2 2 0 a〜2 2 0 d中被乘之浮動小數點數的符號而產生在規格化前的符號Sm a X以及與針對該符號 Sm a X之各乘法器的乘法結果對應的符號I η v[n]。 4輸入加法器2 2 6則並列地輸入上述對位器2 2 1 a〜22 1 d的輸出Ma 1 n[n]而予以相加。在進行4輸入的並列加法處理時則供給上述符號I η v[n]。至於詳細內容請容後述。4輸入加法器2 2 6則根據上述符號 1 η v[n]針對進行上述2之補數化之前置處理的輸出 Ma 1 η[ηί實施在其最下位加1的處理。 4輸入加法器2 2 6的輸出Ma cm則被供給到規格化，正數化以及捨入處理電路2 2 7。該電路2 2 7則根據規格化前的指數Ema X，加法輸出Ma cm與符號 Sm a X實施規格化以及正數化，且實施適合於單精度浮動小數點格式的捨入處理而得到浮動小數點數。由此所得到之浮動小數點數則設成A [ 0 ] · B [ 0 ] + A [ 1 ] · B [ 1 ] + A[2]· B[2]+A[3]· B[3]的積和演算結果。第5圖係表最大指數選擇部2 2 3的一例，藉由大小比較器2 2 3 0來比較上述E[l]與E[〇]，而由選擇器 2 2 3 1選擇較大者。同樣地藉由大小比較器2 2 3 2來比較E[3]與E[2]，而由選擇器2 2 3 3選擇較大者•而由2個選擇器所選岀者會進一步在大小比較器2 2 3 4中被比較，而由選擇器2 2 3 5選擇較大者·選擇器 2 2 3 5的输出則被設成上述規格化前的指數Em a X。第6圖係表符號選擇部2 2 5的一例•選擇器本纸張尺度適用中國國家揉準（CNS > A4规格（210X297公釐） (請先聞讀背面之注意事項再填寫本頁) 訂峡 j -16- 經濟部中央標準局負工消费合作社印掣 405093 ab；五、發明説明（j4 ) 2 2 5 0則選擇上述S [ 1 ]或s [ Ο ]，選擇器2 2 5 1則選擇上述S[3]或S[2]，選擇器2 2 5 2則選擇選擇器 2 2 5 0的輸出或是選擇器2 2 5 1的输出。選擇器 2 2 5 0〜2 2 5 2的選擇控制信號則設成上述大小比較器2230，2232，2234的比較判定結果信號 MaxCntl，藉此，與當作Em a X被選擇之指數有關之浮動小數點數的符號部則被選擇作爲上述規則化前的符號 .S m a X ° 第7圖係表對位器2 2 1 a(22 1 b〜2 2 1 d)的一例。移位器2210输入M[n]，而根據Edi f f[n]來控制對位位移數（位移位元數）。移位器2 2 1 0的输出則在反相器2 2 1 1中被反轉，而選擇器2 2 1 2會根據 1 η ν[η]而選擇反相器2 2 1 1的输出或是位移器 2 2 1 0的輸出，所選出的値則設成M a 1 η[ η ]。第8圖係表4輸入加法器2 2 6的一例。該4輸入加法器2 2 6則具有在進位儲存加法器陣列2 2 6 0中個別地求取進位淸除clear carry的和（和輸出）與進行carry(進位輸出），而在到達於進位傳播加法器2 2 6 1中得到最終的和的時刻以前讓進位之傳播延遲的電路形式•由該4輸入加法器2 2 6所得到的和Ma cm由於有相對於所輸入的位元數最大增加2泣元的情髟，因此，被輸入到4輸入如法器2 2 6的積Ma 1η[ η]則事先被實施2位元碼擴張而被供給到進位儲存加法器陣列2 2 6 0。在第8圖中，用於上述2之補數化的後績處理（+ 1)則本紙張尺度適用中國國家揉準（CNS ) A4规格.（210X297公漦） (婧先閲tt背面之注意事項再填寫本頁) 訂 -t' -17- A7 B7 五、發明説明（j5 ) 是由3位元的進位信號C i n[〇]，C i n[l】， C i n[2]’所進行•由上述的說明可知，由於符號選擇部 2 2 5會選擇S[n]中的其中一者，因此，在v n[n]中的至少一者必然會被設成邏輯値、〇*·因此，成爲2的補數化的對象只能在Ma i n[n]中的3個以下。而由OR閘 2 2 6 2, OR閘 2263、AND .OR閘 2 2 64 來檢測該情形。第9圓係表針對I nv[n]的値之C i n[〇]， C i η [ 1 ]，C i η [ 2 ]所能採得的値，由此可知， C i η[2]當I ην[2]與I ην[3]之至少其中一者爲邏輯値、1，時會被設成邏輯値、1·，而Cin[l]，當 I η v[l]與I nv[〇]的至少其中一者爲邏輯値、1·時會被設成邏輯値、1，，Cin[〇]，當Inv[l]與 I nv[〇]或是I nv[2]與I nv[3]均爲邏輯値，時會被設成邏輯値'^1"。第1 0圖係表上述進位儲存加法器陣列2 2 6 0與進位傳播加法器2 2 6 1之詳細的邏輯構成的一例。上述進位儲存加法器陣列2 2 6 0雖然未特別加以限制，但是是由多個4 — 2壓縮器（4 一 2 C 0MP)2 2 6 5所構成。各 4 — 2壓縮器2 2 6 5，如第1 1圇的（A)所示具有5輸入 [I 1〜I 4，C i]與3输入（S，C，Co)。進位輸出 C 〇，由於連接到鄰接之上位位元的進位输入C i，因此，4 一 2壓縮器2 265會將4個位元I 1〜14相加· S爲其加法輸出，C爲由該相加所產生之進位输出。在4 —2壓縮器2265中，由於Cq>與C i無關，因此進位本紙張尺度適用中國國家標準（CNS ) A4規格（210X297公釐） (請先閲請背面之注意事項再填寫本頁訂 -< 經濟部中央標準局貝工消费合作社印装 • 18 - 經濟部中央標準局員工消费合作社印製 4050U3 五、發明説明（j6 )

不會傳播。例如，1個4 一 2壓縮器2265，如第11 圖的（B)所示，可以藉由2個全加法器所構成。全加法器，雖然未特別加以限制，但是可以利用3個來構成（C)所示的多工器MUX。此外，對於4 一 2屋縮器所記載的文獻則有信學技報（電子情報通信學會）TECHNICAL REPORT OF IEICE ICD94-135 DSP 94-91(1994-10)的「應用路徑電晶體多工器（path transistor multiplexer)之校則 54 x 54位元乘法器j (第73頁〜79頁）· 在第1 0圖中，在上述對位器输出Ma ln[〇]〜

Ma ln[ 3]中之同一位數位置的位元則自下位側開始依序以4位元爲單位被供給到各4 一 2壓縮器2 2 6 5。

Ma 1η[0]0 〜Ma ln[3]0。則意味著在 Ma 1 n[〇] 〜M a 1 n[3]中之最下位的4個位元。上述進位信號 C i n[3]則被供給到最下位的4 一 2.壓縮器2 2 6 5的進位輸入端子C i。上述進位傳播加法器2 2 6 1係由多個全加法器2 2 6 1所構成，而進位輸出則被設成上位全加法器的進位輸入。全加法器之其中一個加法输入則被設成 4- 2壓縮器2 2 6 5的和輸出S，又另一個加法輸入則被設成配置在其中一個上位之4 一 2壓縮器2 2 6 5的進位输出C »上述進位信號C i n[2]則當作最下位之全加法器其中一個加法输入信號被供給，而上述進位信號本紙張尺度適用中國國家揉準（CNS ) Α4规格ί 2丨0X297公漦） --------卜·)------訂------焕、 - I ·ν {請先閲讀背面之注意Ϋ項再填寫本I ) -19- 經濟部中央標準局貝工消费合作社印褽 405093 A7 B7 五、發明説明（j7 ) c i n[l]則當作最下位的全加法器的進位輸入信號被供給〇第1 2圖係表暫存器植案之一例的方塊圖，第1 3圖係表構成暫存器槍案之各暫存器群的構成，第1 4圖係表暫存器群之各暫存電路的構成》暫存器植案，雖然未特別加以限制，但是如第1 2圖所示具有4個暫存器群FR-G r[〇]〜FR_G r[3]，各暫存器群R — G r[m]，如第1 3圖所示具有4個暫存電路 FR[m]，FR[m+4]，FR[m+8]，FR[m + 2] 。在第1 3圖中，m爲0〜3的整數。各暫存電路則如第 14圖所示具有構成前群組與後群組的一對的暫存器 FRJ[n]，FRK[n]。在第14圖中，η爲0〜15的整數。針對暫存器FRJ[n]，FRK[n]之寫入動作的指示則是由信號WriteU]所提供。設成寫入對象的暫存器則是根據信號Ba nk選擇其中一者。暫存器FRJ[n]， FRK[n]的輸出與端子P[n]，Q[n]的對應則根據信號 Bank而以選擇器SL1，SL2交互地切換。如第 1 3圖所示，在1個暫存器群中，4個暫存電路之端子 P[m]，P[m+4]，P[m+8]，P[m+12]則可藉由根據2位元的信號Read A由選擇器SL3選擇其中者連接到端子R [in]，同樣地則藉由根據2位元的信號本紙張尺度適用中國國家標牟（CNS ) A4规格（210X297公釐） ------·---ί -- (請先閱讀背面之注意事項再填寫本頁) 订 i. 經濟部中央標準局貝工消费合作社印簟 405093 五、發明説明（j8 )

Read B由選擇器SL4選擇其中的一者連接到端子 B[m]。暫存器群的端子Q[m]，Q[m + 4]，Q【m + 8] ，Q[m+l 2]則是由爲信號Re a d A所控制之選擇器 S L 5 — S L 8依暫存器群群爲單位被選擇•上述選擇器 SL5，SL6，SL7，SL8的输出與各暫存器群的输出R[3]，R[2]，R[l]，R[〇]則是由爲信號

Read Type所控制之選擇器SL9，SL10， S L 1 1，S. L 1 2所選擇，而所選出者則當作讀取埠 A[3]，A[2]，A[l]，A[0]的输出。因此，自讀取埠 A[3]，A[2]，A[l]，A[〇]’ 如第 1 5 圖所示，依暫存器群爲單位自4個浮動小數點暫存器並列地讀取資料，或是自各暫存器群一個一個地讀取資料。又，各暫存器群的輸出B[3]，B[2]，B[l]，B[〇]則直接設成讀取埠 B[3]，B[2]，B[l]，B[0]的輸出。因此，自讀取埠 B[3]，B[2]，B[l]，B[0]，如第 16 圖所示’自各暫存器群一個一個地並列地讀取資料。各暫存器群之输出 B[3]，B[2]，B[l]’ B[0]根據信號 Re a d C 而由選擇器S L 3所選擇者則被連接到上述讀取埠C »因此，如第1 7圖所示，根據信號Re a d B與Re a d C的狀態任意地選擇暫存器而可以自埠C讀取。來自上述寫入埠X，Y的輸入則爲由信號Wr i t e Type所控制的選擇器S L所選擇· 本紙張尺度適用中國國家標準（CNS ) A4規格（210XW7公釐） (請先閱讀背面之注意事項再填寫本頁) 訂 405093 b7__ 五、發明説明（j9 ) 內積演算針對利用上述F P U 2的內積演算加以說明。例如內稹，如第1 8圖所示，在3次空間可以利用在當光到達某個特定面時的亮度。FPU2可根據1個浮動小數點內積演算命令（簡稱爲內積演算命令）F t p r Vn，Vm來求向量 V1(=[X1，Y1，Z1，W1)]與 V2(=[X2， Y 2，Z 2，W 2 )]的內積 i e 上述內稹演算命令之處理的槪略內容則如第1 9圖所示。例如將[X 1，Y 1，Z 1，W 1 ]載入到暫存器檔案 2 1之向量暫存器v〇，而將[X2，Y2，Z2，W2]載入到V4。當上述內積演算命令爲控制部2 3所解碼時，則控制暫存器檔案2 1的讀取動作’而分剧別將X 1與 X2，Y1與Y2，Z1與Z2，以及W1與W2呈並列地供給到乘法器220a，乘法器220d，乘法器 220c，乘法器220d。在第19圖中，雖然是省略了上述指數處理部以及符號處理部等的圖示，但是並列的乘法結果則會經由上述對位器的位移以及反轉而在4輸入加法器2 2 6中相加，針對該加法結果實施規格化而得到內積。所得到的內稹則會經由埠X被覆寫在向置暫存器V 0中保有W1的値的暫存器•如此般，由於並列地進行浮動小數點的稹和演算，因此能夠使內稹演算變得高速· 第2 0圖係表與上述內稹演算命令中之暫存器檔案之利用有關之規格的一例。亦即，將向置V [m ]與V [η ]的內本紙張尺度適用中國國家揉準（CNS ) A4规格（210X297公釐） (請先閱讀背面之注意事項再填寫本買訂經濟部中央標準局貝工消费合作社印製 I— · -22- 經濟部中央標準局負工消费合作社印製 405093 五、發明説明) 稹演算結果儲存於浮動小數點暫存器F R[n + 3]·向量V [η]的成分則被載入到浮動小數點暫存器FR[n]，FR[ n + 1]，FR[n + 2]，FR[n + 3]。在此 η 可爲 0， 4，8，1 2中之任一者，又，FR[n]可以理解成與上述前群組之暫存器f η對應者，暫存器植案2 1在構成上，暫存器FR[n]，當控制信號B a n k = 〇時則被分配到暫存器FR J[n]，而當控制信號B a n k = 1時則被分配到暫存器F RK[n]。在此規格，若當在第1 5圖之B a n k =0，Re ad = A之情況下，將向量資料V[n]放入由來自埠A的輸出所指定之暫存器FRJ[〇]，FRJ[1】， FRJ[2]，FRJ[3]，而當在第 16 圖之 Bank = 〇，R e a d = 1之情形下將向量資料V[m]放入由來自埠B 的輸出所指定之暫存器FRJ[4]，FRJ[5]，FRJ[ 6]，FRJ[7]時，則可以將對於V[n]與V{m}之內積演算爲必要之8個成分資料並列地供給到演算方塊而能夠進行上述的內積演算。在演算時實際上則根據內稹演算命令的暫存器指定段（field)來指定要對那一個暫存器進行存取。在根據該暫存器指定段來指定暫存器時，則在指定來源暫存器與目的暫存器則利用4位元。向置轉換演算其次則針對利用上述F P U 2的向量轉換演算來加以說明。習知之4行4列的轉換行列可以表示並進、回轉、伸長以及透視等的轉換。根據該轉換行列與向量的積可以本紙張尺度適用中國國家搮準（CNS ) A4规格（210X297公釐） -23- I I 111— I--H1 n .«1-{ {請先聞讀背面之注意事項再填寫本頁) 經濟部中央標準局貝工消費合作社印製 405093 g 五、發明説明L ) 得到表示該轉換行列的向量轉換•向惫轉換演算一般而言可如第21圖所示。A爲轉換行列、P爲被成轉換對象的資料，P <爲轉換後的資料·該向置轉換可以根據1個浮動小數點向量轉換演算命令（簡稱爲向量轉換演算命令） ftrv back，Vn而求得》根據上述向量轉換演算命令之處理的槪略內容則表示在第22圖。例如，轉換行列被配置在後群組的16個暫存器。此外，向量資料[Xi，Yi，Zi ，Wi]則被儲存在構成前群組的暫存器內。根據該向量轉換演算命令的處理實質上則與反覆4次的內積演算相等。亦即，演算[Xi，Yi ，Zi，Wi]x [al 1，al2，al3，al4],且將其結果寫入Xi 的領域，之後演算[Xi，Yi，Zi，Wi]x[a21， a22，a23，a24]，且將其結果寫入到Yi的領域，之後則演算[Xi ，Yi ，Zi ，Wi]x(a31， a32，a33，a34]，且將其結果寫入到Ei的領域，之後則演算[Xi ，Yi ，Zi，Wi]x[a41， a42，a43，a44]，且將其結果寫入到Wi的領域。各處理實質上則與內稹演算處理相同β 當上述向量轉換演算命令在控制部2 3中被解碼時，則用於進行上述最初之內積演算處理的資料會自暫存器植案2 1分別呈並列地被供給到乘法器2 2 0 a〜2 2 0 d 等。在第2 3圔中同樣地省略上述指數處理部以及符號處理部等的圖示，而並列的乘法結果會經由上述對位器的位本紙張尺度適用中國國家標率（CNS ) A4規格（210X297公釐） ------.--UI ^------訂------均、.--U---r \\ • » (請先閱讀背面之注意事項再填寫本霣) -24- 經濟部中央標準局貝工消费合作社印製 405093 A7 ____B7 五、發明説明) 移以及反轉等而在4输入加法器2 2 6中被相加，針對該加法結果進行規格化而得到內稹。所得到的內稹則被寫入到保有X i的暫存器內》該處理則依序變更暫存器檔案之讀取對象暫存器與寫入對象暫存器而反覆地執行•如此般，藉由連績4次反覆地執行浮動小數點的內稹處理，可以高速地得到向量轉換的結果· 第2 3圔係表與在上述向量轉換演算命令中之暫存器槽案之利用有關的規格的一例·亦即，將向量V[n]與轉換行列Matrix的積覆寫到暫存器V[n]»向量V[n]的成分則被載入（load)到浮動小數點暫存器FR[n]，FR[n + l] ，FR[n + 2]，FR[n + 3]。在此，η 爲 0，4，8 * 1 2中之.任一者，又，FR[n]可以被理解成與上述前群組的暫存器f η對應者。轉換行列則被儲存在構成後群組之位址FB[0〜FB[1 5](與第2圖之b〇〜b 1 5對應的位址）內。至於暫存器檔案2 1的構成*暫存器F B[n]，當控制信號B a n k = 0時則被分配到暫存器FRK[n]，而當控制信號B a n k = 1時則被分配到暫存器FR J[n] 〇在該規格中，轉換行列Matrix，在第1 5圔中，在 Read Type=l的狀態下會自埠A被並列地输出，而向量V [ η ]則自埠B被筮列地輸出。例如在最初的內稹演算中，若參照第15圖，根據Read Type=l »Bank=l »Read A = 0，可自 FRJ[0]， FRJ[4]，FRJ[8]，FRJ[12]，自埠 A 輸出轉換本紙張尺度適用中國國家揉準（CNS ) A4规格.（210X297公釐） II Γ ^ 訂------Λ---- -l /.. (請先閲讀背面之注意i項再填寫本I ) -25- ^_ 五、發明説明b ) 行列Matrix的第1行，且與此並行地，根據B a nk = l ’ Read B = 〇，自 FRK[0]，FRK[1]，FRK[ 2]，FRK[3]，自埠B输出轉換對象向量[X i ’ Y i， Z i，，W i ]·接下來的3次的內積演算，可以讓根據 Read A的選擇依1，2，3般地變化·來自埠B的讀取對象暫存器，在4次的內積演算處理中皆設成相同。根據1個向量轉換命令的上述多次的內稹演算處理，如第2 4圖所示係依搛並列處理（pipeline)處理方式來進行。亦即，以1個命令可以執行4個並列處理處理·內積演算處理的1個並列處理係設成暫存器讀取階段RR、第1 演算階段F1、第2演算階段F2、第3演算階段F3、暫存器寫入階段RW、以及省略圖示之命令取得階段•命令取得階段當然被配置在暫存器讀取階段RR之前，又，經濟部中央標準局貝工消费合作社印裝 {請先閏讀背面之注意事項再填寫本買)

暫存器讀取階段RR也包含命令的解碼處理。在該例中，自來法’運算到規格化爲止的演算則經過3個演算階段•在第2 4圖之（1)之並列處理上所執行的處理，則是進行（F B[0]，FB[4]，FB[8]，FB[12]xV[n]的內稹演算，且將其結果寫入到暫存器F R[n]，而在（2)之並列處理上所執行的演算處理，則是進行）（F B[l]，F B[5】， FB[9]，FB[1 3])xV[n]的內積演算，且將其結果寫入到F R [ η + 1 ]，而在（3 )之並列處理上挢執行的演算處理，則是進行（FB[2]，FB[6]，FB[l〇]，FB[1 4])xV[n]的內稹處理，且將其結果寫入到FR[n + 2] ，而在（4)之並列處理上所執行的演算處理，則是進行（F 本紙張尺度適用中國國家輮準（CNS ) A4規格（210X297公釐） -26- 經濟部中央標準局貝工消费合作社印装 405093 五、發明説明&4 ) B[3]，FB[7]，FB[1 1]，FB[1 5])xV[n]的內積處理，且將其結果寫入到F R[n + 3]。目的暫存器F R [n]，FR[n + l]，FR[n + 2]，FR[n + 3]則爲 V[ n ]的來源暫存器。此時，一連串4次的內積演算處理，位在先頭之並列處理（1)中的暫存器寫入階段RW則是設在最後之並列處理 (4)中的暫存器讀取階段RR之後。換言之，自暫存器槍案 2 1讀取V[n]的成分與上述轉換行列的成分且進行內積演算，而將該內積演算的結果寫入到暫存器檔案之一連串的演算循環，當連續地反覆執行多次時，則控制各演算循環的延遲時間以使在連嫌被執行之最後的演算循環中之上述暫存器檔案的讀取動作能較將在最初之演算循環中的內積演算結果寫入到上述暫存器檔案的時間爲早•因此，即使來源暫存器與目的暫存器爲同一個暫存器，在自來源暫存器全部的資料未被讀取之前不會進行寫入動作，因此不會意外失去資料V[n]» 又即使是將向量轉換演算中之向量資料的來源暫存器與目的暫存器設爲同一個，也不會對動作造成阻礙由於可以將轉換前後的向量資料配置在同一個暫存器因此容易製作出大量利用向量轉換處理的程式•又，3次元圖形等中的向量轉換演算則針對多數的向量或是點來進行。此時，若是將轉換前後的資料配置於同一個暫存器，當將4個向量資料載入到構成16個前群組的浮動小數點暫存器時，則可以連績4次地執行向量轉換命令。亦即，本紙張尺度適用中國國家揉準（CNS ) A4规格（210X297公釐） (請先閲讀背面之注意事項再填寫本頁) 訂 -攻丨· -27- 經濟部中央標準局系工消費合作社印製 405093 A7 ______B7_ 五、發明説明& ) 演算對象資料對於16個浮動小數點暫存器的載入或是演算結果資料對記億體的儲存動作只需要很少即可。相對於此，若是將轉換前後的資料儲存到另一個暫存器時，則在執行1個向量轉換命令時需要8個浮動小數點暫存器，結果全導致演算對象的載入動作或是演算結果資料的儲存動作的頻率變多。而其意味著將在向置轉換演算中之向量資料的來源暫存器與目的暫存器設成相同，由於暫存器的數目被限制，因此對於使向量轉換演算變得髙速化極爲有用正弦餘弦演算在上述演算方塊2 2中，藉由在上述內積演算用的硬體追加係數表或是乘法器的回饋電路，可以根據區間分割與高次的多項式展開來求取三角函數或是平方根的近似値。如當上述轉換行列爲回轉轉換時則包含正弦以及餘弦。當針對所有必要的角度具有正弦以及餘弦的表時，則不能夠忽視因此所造成之晶片面稹增大的情形。在此則針對利用上述演算區塊2 2來求取正弦與餘弦的近似値來加以說明。附加了以下所述之構成的F P U則執行以1個命令並行地演算正弦與餘弦的正弦餘弦命令。該正弦餘弦命令的規格則如第2 5圖所示，將針對與铍載入到浮動小數點暫存器F R[〇]之角度資料對應的正弦的値演算的結果寫入到暫存器FR[n]，同樣地將針對與被載入到暫存器F R[0]之角度資料的餘弦的値演算的結果寫入到本紙張尺度適用中國國家揉準（CNS ) A4规格ί 210X297公釐） (讀先聞讀背面之注$項再填寫本筲) 訂峡 • 28 · 405093 a? B7 經濟部中央揉準局™ί工消费合作社印笨五、發明説明b ) 暫存器FR[n + l]。第2 6圖係表上述角度資料的格式•上述角度資料則根據以1個浮動小數點暫存器的上位16位元與下位16 位元的邊界作爲固定小數點位置的3 2位元固定小數點數來表示回轉數•以小數點位置爲邊界的上位16位元則給予回轉數（整數），而以小數點位置爲邊界的下位1 6位元則定義將1次的回轉以2的1 6次方來分割。特別是在下位 16位元中的上位2個位元則意味著由小數點以下16位元的資料所特定的角度所屬的象限•該角度格式，例如 360°表1 . 0，16進位的位元型式爲' 0 0 0 1 0 0 0 0 " · 正弦餘弦命令則可針對上述角度格式的角度資料，根據資料展開的多項近似而取得其正弦以及餘弦•第2 8圖係表其演算手法。上述多項近似係一將上述角度資料之小數點以下1 6 位元分成中心値X與相對於該中心値的差分値d X，而演算與上述角度資料對應的正弦與餘弦的値者。只有對於上述多項近似爲必要之針對上述中心値X的正弦或餘弦的値保有作表•上述中心値X則將暫存器F R[ 0 ]之小數點以下之7位元的最下位設成經0捨1入的値。而中心値與角度（徑度）的關係則表示在第2 7圓。差分d X則將自暫存器F R[0]的最下位開始1 0位元設作經編碼擴張的値·由於在多項近似中利用泰勒展開，因此在以徑度來表現角度時則給予各項的係數。第2 8圖所示的S 1〜S 2則是以公式 f請先聞讀背面之注##>項再填寫本頁) -訂. -f' —· -LI, 本紙張尺度適用中國國家揉準（CNS ) Α4规格（210X297公釐） -29 * 經濟部中央標準局負工消費合作社印製 ^05093__£_____ 五、發明説明心）來表示乘法器2 2 0 a(FMO)、乘法器2 2 O b(FMl) 、乘法器220c(FM2)、乘法器220d(FM3)以及利用4输入加法器2 2 6的演算處理的內容•在S 9中則是根據多項近似式來求取正弦的近似値（在第2 8圖中表示該多項近似式），在S 1 2中則是根據多項近似式來求取餘弦的近似値（在第2 8圖中表示該多項近似式）· 上述S 1〜S 1 2的演算則是在（1)〜（4)所示之並列處理（pipeline)中被處理》如上所述，角度資料之下位1 6 位元中的上位2，位元則意味著由小數點以下1 6位元的資料所特定的角度所屬的象限。因此，控制部會根據上述上位2位元的解碼結果（根據由該角度資料所特定的角度所屬的象限）來控制選擇對根據上述多項近似之S 1 0，S 1 2的演算結果實施符號反轉或是將其演算結果儲存在暫存器 FR[n]或是F R[n + 1]之其中那一個，而將與上述象限對應之正弦以及餘弦的値儲存到分別所分配到的暫存器 F R[n]或是F R[n + 1]。各象限之上述反轉動作與暫存器選擇動作則如第2 8圖所示· 第2 9圖係表用於執行上述正弦餘弦命令的係數表與附加乘法器之回饋系統的上述乘法器附近的方塊圖。第 2 9圖之電路的基本要素爲第4圖的演算方塊*而不同點只有針對第4圖的演算方塊2 2追加8位元以及6位元編碼擴張器300，係數表301，以及選擇器302〜 3 1 2。暫存器FR[〇]的角度資料則是由埠B[〇]來提供本紙張尺度適用中國國家標率（CNS ) A4规格（210X297公釐） <請先《讀背面之注意事項再填寫本頁) 訂 •HTUI—. -30 * 經濟部中央梂準局員工消费合作社印装 405093 五、發明説明b ) 。8位元以及6位元編碼擴張器3 0 0係一根據暫存器F R[0]的最下位1 0位元產生差分d X的電路。係數表 3 0 1則保有與第2 7圖所示之中心値對應之正弦或是餘弦之其中任何一者的資料，而输出由角度資料之下位1 6 位元中的下位5位元所指定之角度的正弦以及餘弦的資料。而角度資料之下位16位元的上位2位元則被供給到控制部》控制部則根據該2位元的値來控制選擇對上述4輸入加法器的加法輸出進行選擇性的反轉或是儲存加法結果之暫存器FR[n]或F R[n + 1]之選擇。此外，當係數表 3 0 1具有正弦資料時，則可以參照表以自中心値X的角度減去ττ/2所得的角度當作餘弦。係數表也可以同時具備正弦以及餘弦兩方的資料。第3 0圖係表以粗的資線來表示在第2 8之（1)所示之第1步驟中之資料的流向。第3 1圖係表以粗的實線來表示在第2 8圖之（2)所示之第2步驟中之資料的流向•在該圖中乘法器（FM〇)2 2 0 a的減法結果則被回饋到選擇器 308，311，而回饋（feed back)則只設在小數點以下（上位設爲0)而得到+ 1的效果。第3 2圖係表以粗的實線來表示在第2 8圖之（3)所示之第2步驟中的資料的流向，第3 3圖係以粗的實線來表示在第2步騍中的資料的流向。在第3 2圔以及第3 3圖中，當二度莉用演算結果時，則抑制乘法器之輸入鎖存（latch)的更新且保持其値》第30 圖至第32圖所示的演算控制則是由對正弦餘弦命令進行解碼的控制部來進行。本紙張尺度適用中國國家標準（CNS M4规格(210X297公釐） (請先閱讀背面之注$項再填寫本賨) 訂經濟部中央標準局貝工消费合作社印裂 405093 A7 B7 五、發明説明k ) 資料處理器1之優先性上述FPU2的演算方塊22，如上所述，當執行內積演算命令或向量轉換演算命令等1個命令時，則將8個浮動小數點數供給到4個乘法器2 2 0 a〜2 2 0 d而進行並列動作，而將由此所到的乘法結果在1個4输入加法器2 2 6中相加而得到演算結果。針對4輸入加法器 2 2 6之输出的實施之規格化，正數化以及捨入處理則是由1個電路來進行。第3 4面中爲了要易於了解在該演算處理中之資料流向乃表示演算方塊2 2的槪略內容。第3 5圖係表針對上述演算方塊2 2的比較例。而此係由設置2組針對一對的浮動小數點數的積和演算器與針對其結果實施規格化、正數化以及捨入處理的電路而構成。第3 6圖係針對上述演算方塊2 2的其他的比較例，係表由4組上述積和演算器與用於實施規格化、正數化以及捨入處理的電路所構成。不管是那個比較器，只不過是將多組積和演算器與用於實施規格化、正數化以及捨入處理的電路予以並列而已。因此當演算4 X 4的1個內積時，則不能只靠讓稂和演算、用於規格化、正數化以及捨入處理的多個電路並列地動作即能夠達成，而必須另外考慮到針對各演算結果之相關性的控制。一般靣a，則藉由譲一組的積和演算器與實施規格化、正數化以及捨入處理的電路反覆動作4次而求得內稹。當爲向量轉換演算時，則需要更多的演算循環。稹和演算、用於實施規格化、正數化本紙張尺度適用中國國家樣準（CNS ) A4规格（210X297公釐） ------.--h- ^------訂------珀、_--μ---l t - (請先聞讀背面之注$項再填寫本頁) -32· 經濟部中央標準局貝工消費合作社印製 405093 A7 B7 五、發明説明) 以及捨入處理的多組的電路，則根據如並列處理（pipeline) 般的命令執行手法而讓不同對象的內積演算與其他的浮動小數點命令並列地動作》在意義中，其特擞在於第3 5圖以及第3 6圖所示之電路構成可以平均地提高各種之浮動小數點命令的演算處理能力。當利用上述演算方塊2 2時，則可以減少用於內積演算以及向量轉換演算的實質的演算循環數。亦即，可以實現內稹演算以及向量轉換演算的高速化。如此般，演算方塊2 2的構成可以達成內積演算以及向量轉換演算的高速化。又由於根據1次並列的乘法以及加法運算可以求得內積，因此針對2輸入每次進行稹和演算時不需要進行捨入處理。藉此，內積演算的等待時間會變短，且演算精度也會提高，又當反覆地針對2输入每次進行稹和演算時不會產生當演算順序不同時，演算結果也會不同的情形。又，由於用於實施規格化、正數化以及捨入處理的電路具有與積和演算同等的電路規模，因此對於如第3 5圖以及第3 6圖所示般將多組用於積和演算、規格化、正數化以及捨入處理的電路予以並例配置的構成而言，與藉由並列所欲達成平均的演算能力的提升效果相比較*因爲並列化所導致晶片面積的增加情形會大幅地增加。其意義即在於芾於積和演算、規格化、正數化以及捨入處理之電路的並列數目最適當爲2 ·若只是整數演算，如第3 7圖所示，現實上雖然是可以將4個積和演算器並列，但是當爲整數演算時，由於資料的位數被限制，因此與浮動小數點本紙張尺度適用中國國家標準（CNS ) A4规格（2丨0><297公釐） (請先閏讀背面之注項再填寫本頁)

-.IT -33- 經濟部中央標準局貝工消费合作社印製 405093 A7 A7 —___^__B7___ 五、發明説明h ) 演算相比較，其演算精度會變化。第3 4圖的演算方塊 22也可以只具備1個用於實施規格化、正數化以及捨入處理之電路2 2 7。因此，資料處理器會極力抑制電路規模增加，而藉由浮動小數點可以實現內積演算以及向量轉換演算的高速化。資料處理器1的浮動小數點命令具有16位元固定長度，因此，在浮動小數點命令中的位址指定段（field)也會被限制，而將浮動小數點暫存器設或1 6個·在此一限制之下，浮動小數點數暫存器係由具有後群組與前群組之暫_存器群組（bank)構成的暫存器檔案2 1所構成。此時，由於儲存上述整個轉換行列需要1 6個暫存器，因此，向量轉換演算命令則被設成爲可利用前群組與後群組兩者的命令規格。如上所述，將轉換行列配置在後群組，而將向量資料配置在前群組。藉此，即使是在浮動小數點命令的位元數與暫存器數目之的限制下，也可以保證向量轉換篇算命令的高速執行· 又，在執行向量轉換演算命令時，如上所述，一連串的4次的內稹演算處理則如使在先頭之並列處理（1)中的暫存器寫入動作RW設成位在最後的並列處理（4)中之暫存器讀取動作RR之後而被並列處理（PIPELINE)化。因此，即使來源暂存器與目的暫存器是同一個暫存器，成爲演算對象的向量資料也不會意外地失去。藉此，當針對多數的向量或是點依序進行向量轉換時，若將轉換前後的資料配置在同一個暫存器時，若將4個向量資料載入到構成1 6個前本紙張尺度適用中國國家標準（CNS ) A4规格（210X297公釐） (請先閱讀背面之注$項再填寫本頁) 訂 -34- 經濟部中央標準局貝工消费合作社印製 405093 a? ____B7_ 五、發明説明k ) 群組的浮動小數點暫存器，則可以連續4次執行向量轉換命令，而可以減少演算對象資料對於1 6假浮動小數點暫存器的載入次數或是演算結果資料對於記憶體之儲存動作的次數，其意義在於可以將在向量轉換演算中之向量資料的來源暫存器與目的暫存器設成同一個暫存器，由於暫存器數目被限制，因此對於使向量轉換演算髙速化極爲有用〇又，上述轉換行列，當爲回轉轉換時，則包含正弦以及餘弦。當針對所有必要的角度具有正弦以及餘弦的資料表3 0 1時，則無法忽視由此所造成之晶片面稹的增加問題。此時，由於上述演算方塊2 2具有4個乘法器，因此藉由在此追加係數表3 0 1以及乘法器的回饋電路，可以根據區間分割與高次的多項或展開而求得三角函數以及平方根的近似値。藉此，可以在不增加晶片面積的情況下得到正弦與餘弦。特別是，由於正弦與餘弦之多項式的展開式具有近似性，而利用以一特性同時（並列地）演算正弦以及餘弦的値，因此與個別求取的情形相比較，可以高速地獲得正弦以及餘弦的値。第3 8圖係表應用該資料處理器之資料處理系統的方塊圖》在同一圖中：1爲上述資料處理器，4 0 1爲動態隨機存記億體（DRAM)、402爲針對DRAM401進行位址多工控制以及更新控制的DRAM控制部、403爲 SRAM。SRAM4 0 3則被應用在資料處理器1的作本紙張尺度適用中國國家標準（CNS > A4规格（210X297公釐） (請先聞讀背面之注意事項再填寫本頁) 訂

M -35- 經濟部中央樣準局貝工消費合作社印装 405093 a7 __B7_________ 五、發明説明) 業領域或是資料的暫時記憶領域等。4 0 4爲保有資料處理器 1 之 0 S (. Operating System)的 ROM，40 5 爲周邊裝置控制部，而被連接郵代表性所表示之外部記憶裝置 4 06以及鍵盤407。408爲圖框緩衝器409或是備有未圖示之描畫以及顯示控制邏輯電路的顯示控制器’ 而針對顯示器4 1 0進行描畫控制與顯示控制β 4 1 1爲電源電路，4 1 2爲代表性所表示之匯流排。資料處理器 1則根據浮動小數點高速地執行大多在3次元圖形處理中被應用之內積演算以及向量轉換演算。又，由於在浮動小數點命令的位元數以及暫存器數目被限制的情形下可以得到上述效果，因此可以降低資料處理器1的成本*因此，第3 8圖的資料處理系統可以抑制系統的成本，而能夠高精度且髙速地執行3次元圖形處理。因此，可以實現能夠應用在雖然成本的限制很嚴格，但是欲無法忽視髙以及髙速化之要求之遊戲機以及攜帶情報終端等上之優越之資料處理系統。第3 9圖係表在第3 8圖之資料處理系統上追加描畫處理器（rendering co-processor)4 1 3的3次元圖形處理系統· 3次元圖形處理係由幾何（geometry)處理與描畫處理（ rendering processing)所構成·資料處理器1由於可以高速地處理大多應届在幾问處理的內積演算以及肉量轉換演算等，因此藉由在第3 8圖之資料處理系統追加描畫處理器 4 1 3，可以進行高精度且高速地3次元圖形處理β此外，取代第3 9圖的3次元圖形處理中追加描畫處理器本紙張尺度適用中國國家標率（CNS ) Α4规格（210X297公釐） (請先Μ讀背面之注意事項再填寫本頁) 訂 -36- 經濟部中央標準局貞工消费合作社印製 405093 五、發明説明k ) 4 1 3，即使藉由資料處理器1中的C PU來進行描畫處理，當然也可以構成3次元圖形處理· 以上雖是根據實施形態具體地說明本發明人所提出之發明，但是本發明並不限於此，當然在不脫離其要旨的範圍內可進行各種的變更。例如，雖然在第1圖中未曾說明，但是資料處理器也可以包含記憶管理單元等之其他的功能方塊》又資料處理器可以採用超級體系結構（super scalar avchitecture) ·例如，當具有2條並列處理時，則其中一條並列處理執行向量轉換演算命令而另一條並列處理則自記憶體從暫存器檔案載入用於向量轉換演算命令的向置資料，且自暫存器植案將向量轉換演算的結果儲存到記憶體內。又，乘法器之並列配置個數也可以在4個以上。又指數處理部以及符號處理部的構成，4輸入加法器的構成並不限於上述實施例而可以適當地加以變更。又本發明之資料處理器並不限於用在遊戲機或是攜帶情報終端的控制上，也能夠廣泛地利用在各種機器之組入控制上》在本發明中所揭露之發明中，若簡單地說明代表者所得到的效果則如下。亦即，資料處理器能夠根據浮動士數點高速垲實現內積演算以及向量轉換演算。資料處理器，由於只需要1個用於規格化韵霉路即可，因此可以儘量地抑制電路規模的增大情形，而能夠根據本紙張尺度適用中國國家揉準（CNS > A4规格（210X297公釐） ^ I — III—訂 ------HJ--1.--Γ - - (請先閱讀背面之注意事項再填寫本萸) -37· 經濟部中央樣準局負工消费合作社印装 405093 J77 五、發明説明) 浮動小數點高速地實現內稹演算以及向暈轉換演算。向量轉換演算命令則被設成利用前群組（front bank)與後群組（back bank)等兩者的規格，藉由將轉換行列配置後群組，將向量資料配置在前群組，即使在浮動小數點之位元數與暫存器數目等之資源的限制下，也能夠保證向量轉換演算命令的高速執行· 又在執行向童轉換演算命令時，一連串4次的內積演算，由於控制各內積處理的等待時間之使在先頭之內積演算處理中的暫存器寫入動作位於在最後之內稹處理+ ;^暫存器讀取動作之後，因此即使來源暫存器與目的暫存器是同一個暫存器，成爲演算對象的向量資料也不會意外地失去。藉此，演算對象資料對於浮動小數點暫存器的載入或是將演算結果資料儲存到記億體內之儲存動作的次數可以減少，在暫存器數目被限制之情況下，可以有效地使向量轉換演算高速化。又藉由在上述演算部追加係數表以及乘法器的回饋電路，可以根據區間分割與高次的多項式展開而求得三角函數的近似値，在不大幅增加晶片面積的情況下可以得到在轉換行列等中所利用的正弦以及餘弦· 由於資料處理器在浮動小數點命令的位元數以及暫存器數目等之資源被限制的情形下，可以根據浮動小數點高速地執行在3次元圖形處理中大多被採用的內積演算以及向量轉換演算，因此應用上述資料處理器的資料處理系統本紙張尺度適用中國國家標準（CNS ) A4規格（210X297公嫠） (請先閱讀背面之注意事項再填窝本頁) 訂妗丨· -38 - 經濟部中央標準局貝工消费合作社印簟 A7 __ 4 一 B7 Z、發明説明k ) 40^〇^3 " 可以抑制系統的成本，而高精度且高速地進行3次元圖形處理•因此對於雖然成本的限制嚴格，但是也不能夠忽視高功能以及高速化之要求的遊戲機以及攜帶情報終端機器等而言可以實現優越之資料處理系統，3次元圖形處理系統。圖面之簡單說明第1圓係表本發明之一例之資料處理器的方塊圖。第2圖係表第1圖之資料處理器之主要之暫存器構造的說明圈。第3圖係表上述F P U之一例的方塊圖》第4圖係表演算方塊之一例的方塊圖。第5圔係表最大指數選擇部之一例的方塊圖· 第6圖係表符號選擇器之一例的方塊圖。第7圖係表對位器（aligner)之一例的方塊圖。第8圖係表4輸入加法器之一例的方塊圖。第9圖係表在4輸入加法器中，針對I η v[n]的値之 C i n[〇]，C i n[l]，C i[2]之採得値的說明圖》第10圖係表進位儲存加法器陣列與進位傳達加法器陣列之詳細的一例的方塊圖。第11圖係表4-2壓縮器之一例的說明圖。第12圖係表暫存器槽案之一例的方塊圖。第13圖係表構成暫存器檔案之各暫存器群的構成說明圖。本紙張尺度適用中國國家標準（CNS ) Α4規格（210Χ297公釐） (讀先W讀背面之注意事項再填寫本頁) 訂 • 39 · 經濟部中央標準局負工消费合作社印裂 405093 A7 .___B7 _ 五、發明説明& ) 第1 4.圖係表暫存器之各暫存，電路的—例的構成例〇第15圖係表暫存器檔案之讀取埠A的動作態樣說明第16圖係表暫存器檔案之讀取埠B的動作態樣說明圖。第17圖係表暫存器檔案之讀取埠C的動作態樣說明圖。第1 8暖係表內積之應用例的說明圖。第19圖係表根據內積演算命令之處理之槪略內容的方塊圖。第2 0圖係表與在內稹演算中之暫存器檔案之利用有關之規格的一例的說明圖。第21圖係表向量轉換演算之一般的說明圖· 第2 2圖係表根據向量轉換演算命令之處理之槪要內容的方塊圖。第2 3圖係表與右向量轉換演算命令中之暫存器檔案之利用相關的規格的一例的說明圖。第2 4圖係表根據1個向量轉換命令之多次內積演算處厘之並列處理（pipeline)的說明圖》第2 5圖係表正弦餘弦命令之規格說明圖》第2 6圖係表在正弦餘弦命令中所利用之角度資料的格式（format)說明圖。第2 7圖係表用於多項近似之中心値與角度之關係的本紙張尺度適用中國國家揉準（CNS ) Α4规格（2丨0X297公釐） (讀先Μ讀背面之注意Ϋ項再填寫本頁) 訂 • 40- 405093 405093 經濟部中央標準局員工消费合作社印製五、發明説明k ) 說明圖。第2 8圖係表藉由根據多項近似之正弦餘弦命令之演算處理的流程圖· 第2 9圖係表執行正弦餘弦命令的係數表與附加乘法器之回績系統之上述乘法器附近的方塊圖。第3 0圖係表以粗的實線來表示在第2 8圖之（1)中所示之第1步驟中之資料流向的說明圖。第3 1圖係表以粗的實線來表示在第2 8圖之（2)中所示之第1步驟中之資料流向的說明圖。第3 2圖係表以粗的實線來表示在第2 8圖之（3)中所示之第2步驟中之資料流向的說明圖· 第3 3圖係表以粗的實線來表示在第2 8圖之（4)中所示之第2步驟中之資料流向的說明圖。第3 4圖係表爲了要易於了解在執行內積演算以及向量轉換演算命令時之在演算處理中之資料流向而槪略地表示演算方塊2 2的方塊圖。第3 5圖係表將2組積和演算與用於規格化、正數化以及捨入處理的電路單純地並列配置的比較說明圖。第3 6圖係表將4組稹和演算與用於規格化、正數化以及圓角化的電路單純地並列配置的比較說明圖· 第3 7圖係表爲了要整數演算將4個稹和演算器並列之比較說明圖。第3 8圖係表應用資料處理器之資料處理系統之一例的說明圖。本紙張尺度適用中國國家揉準（CNS ) A4規格（210X297公釐） (請先聞讀背面之注意事項再填寫本頁) 訂 -41- 經濟部中央標準局貝工消費合作社印製 A7 405093 _ B7 五、發明説明k ) 第3 9圖係表應用資料處理器之3次元圖形處理系統之一例的方塊圖。主要元件對照表 1 資料處理器 2 浮動小數點數 3 中央處理裝置 4 32位元資料匯流排 5 命令匯流排 6 命令快取單元 7 資料快取單元 8 資料位址匯流排 9 匯流排控制器 10 周邊電路 11 周邊匯流排 20 轉送方塊 21 暫存器檔案 22 演算方塊 2 3 控制部 200 匯流排驅動器 2 0 1 , 2231、2233、2235、2 2 5 0 ,2251, 2252 選擇器 220a 乘法器 220b 乘法器本紙張尺度適用中國國家梂準（CNS ) A4规格（210X297公釐） (請先閲讀背面之注意事項再填寫本頁) 訂 Γ· -42- 405093 A7 B7 五、發明説明“）經濟部中央標準局貝工消费合作社印装 2 2 0 c 2 2 0 d 2 2 1a 2 2 1b 2 2 1c 2 2 1 d 2 2 3 2 2 4 a 2 2 4 b 2 2 4 c 2 2 4 d 2 2 8 2 2 5 2 2 6 2 2 7 2 2 3 0、 2 2 11 2 2 10 2 2 6 0 2 2 6 1、 2 2 6 4 2 2 6 5 乘法器乘法器對位器對位器對位器對位器最大指數選擇部減法器減法器減法器減法器指數處理部符號選擇部 4輸入加法器規格化、正數化以及捨入處理 2234 大小比較器反相器移位器進行儲存加法器 2263 或閘及或閘 4 一 2壓縮器 (請先W讀背面之注意事項再填寫本頁) 訂 -J H»= 1 本紙張尺度適用中國國家揉準（CNS ) A4規格.（210X297公釐） -43-

Claims

405093 A8 B8 C8 D8

規請.务.：：' 修ia'太有it'‘ ' -V 經濟部中央標準局負工消費合作社印«. 六、申請專利範圍第861 1 5051號專利申請案中文申請專利範圍修正本民國88年9月修正心运1 . 一種資料處理器，其主要特徵在於：浮動小數點單元具備演算部，而該演算部包含有分別自不同的資料輸入信號群供給浮動小數點數的虛數部，且將所供給之虛數部相互間予以相乘時多個乘法器、接受各乘法器的輸出而進行對位位移的分析器，根據上述浮動小數點數的指數部而產生上述分析器之對位位移數以及規格化前之指數的指數處理部，將上述分析器之輸出相加的輸入加法器，以及將上述多輸入加法器之輸出與上述規格化前之指數予以規格化的規格化器。 2 .如申請專利範圍第1項之資料處理器，上述浮動小數點單元則執行成分分別以浮動小數點數所給予之4 X 4的內積演算。 3 .如申請專利範圍第1項之資料處理器，上述演算部更包含可因應在各乘法器中被相乘之浮動小數點數的符號而產生與各乘法器之乘法結果呈對應之符號的符號處理部，上述分析器具有可將對位移位結果選擇性地以反轉或是非反轉之形態輸出的選擇器，當對於所對應之上述乘法結果的符號爲負時則選擇反轉輸出，而上述多輸入加法器則進行在對應於對上述乘法結果的符號爲負的分析器的輸出加1而產生進位，且針對負的乘法結果進行2 _的補數處理。本紙法尺度適用中國國家揉準（CNS ) A4現格（210X297公釐） n-rn I i 1 I - i I—- I 民-II I ^^1 .^ϋ si -~ (請先閱讀背面之注意事項再填寫本頁) 405093 AS B8 C8 D8 經濟部中央梂準局工消费合作社印策六、申請專利範圍 4 .如申請專利範圍第1項之資料處理器，上述浮動小數點單元更具有暫存器檔案’其具有連接到上述各乘法. 器之資料輸入信號群的讀取埠與連接到上述演算部之輸出的寫入埠，該暫存器檔案由具有呈並列地連接到上述讀取淳的多個群組（bank)所構成。 5 .如申請專利範圍第4項之資料處理器，上述浮動小數點單元更具有可對用於規定分別由多個成分所示表示之資料間之內積演算的浮動小數點數進行解碼的控制部’ 該控制部則對上述浮動小數點命令進行解碼’將暫存器檔案所保有之資料的成分經由上述信號線群供給到上述演算部，在上述演算部中對所給予的資料作內積演算’且將內積的演算結果寫入到上述暫存器檔案內。 6 .如申請專利範圍第4項之資料處理器，上述浮動小數點單位更具有可對用於規定分別由多個成分所表示的資料與轉換行列之行列演算的浮動小數點命令進行解碼的控制部，該控制部則對上述浮動小數點命令進行解碼，而讀取暫存器檔案所保有之資料的成分與上述轉換行列的成分，且將該些經由上述信號線群供給到上述演算部，在上述演算部中對所給予的資料進行內積演算，且將內積演算的結果寫入到上述暫存器檔案，將如此一連串演算循環連續地反覆執行多次，控制上述各演算循環的延遲量以使在連續多次被執行之最後的演算循環中的上述暫存器檔案的讀取動作較將在最初之演算循環中的內積演算結果寫入到上述暫存器檔案的時間爲早。 (請先閲讀背面之注$項再填寫本頁) 訂本紙張尺度適用中國國家揉準（CNS ) A4规格（210X297公釐） -2- 經濟部中央揉率局貝工消費合作社印製 405093 β| D8 六、申請專利範圍 7 .如申請專利範圍第6項之資料處理器，·上述控制部’在上述各演算循環中進行暫存器選擇控制，針對雙方之群組呈並列地自上述暫存器檔案讀取，而針對其中一個群組寫入到上述暫存器檔案內。 8 ·如申請專利範圍第7項之資料處理器，上述暫存器檔案’各群組具有1 6個暫存器，而設有4個上述乘法器’上述浮動小數點命令爲16位元固定長度命令。 9 .如申請專利範圍第4項之資料處理器，上述浮動小數點單元更具有用於對根據泰勒展開的多項近似而取得與角度資料呈對應的正弦以及餘弦之浮動小數點命令進行解碼的控制部，該控制部會根據對暫存器檔案進行讀取將角度資料供給到演算方塊，而根據上述多項近似在演算方塊中演算與角度資料呈對應的正弦以及餘弦，而將演算結果寫入到暫存器檔案，上述角度資料具有根據固定小數點數之小數點以下η個位元將1次回轉分割成2的η次方的格式，上述多項近似則是將上述角度資料之小數點以下的 η個位元分成中心値與相對於該中心値的差分値，而演算與上述角度資料對應之正弦和餘弦的値，更備有保有對上述多項近似爲必要之與上述中心値對應之正弦或餘弦之値的表。 1 0 .如申請專利範圍第9項之資料處理器，在上述小數點以下之η個位元中的上位2位元係指角度的象限，上述控制部會根據上述上位2位元的解碼結果來筚制根據上述多項近似之演算結果的符號反轉與用於儲存該演算結本紙張尺度適用中國國家梂準（CNS ) A4洗格（210X297公釐） -3 - (請先閱讀背面之注意事項再填寫本頁) •1T A8405093 | 經濟部中央樣率局貝工消费合作社印*. 六、申請專利範圍果之暫存器檔案之暫存器的選擇，而將與上述象限呈對應的正弦以及餘弦的値儲存到分別被分配到的暫存器內。 11種資料處理器，其特徵在於：包含成分分別由浮動小數點數所供給的4 X 4的內積演算可根據1個浮動小數點命令來執行的浮動小數點單元，該浮動小數點單元包含演算方塊，以及將演算對象資料供給到該演算方塊，且被供給有在演算方塊中經演算的演算結果資料的暫存器檔案，上述演算方塊則包含用於對浮動小數點數之虛部進行乘法運算的4個乘法器，接受各乘法器的輸出而進行對位位移的對位器，根據上述浮動小數點數的指數部而產生上述對位器的對位位移數與規格化前之指數處理部，將上述對位器的輸出相加的4輸入加法器，以及使上述4輸入加法器的輸出與上述規格化前的指數規格化的規格化器。 1 2 種資料處理器，其特徵在於：包含針對成分分別由浮動小數點數所供給的4 X 4的轉換行列與具有分別由浮動小數點數所供給之4元的成分之向量的積的演算連續執行4次4 X 4的內積演算的演算可以根據1個浮動小數點命令來執行'的浮動小數點單元，該浮動小數點數睪元包含演算方塊以及將演算對象資料供給到該演算方塊，且被供給有在演算方塊中經演算之演算結果資料的暫存器檔案’ _ 上述演算方塊包含用於對浮動小數點數之虛數部進行 '策— - (請先閱讀背面之注意事項再填寫本頁) 訂本紙張尺度逋用中國國家揉準（CNS ) A4规格（210X297公釐）_ 4 A8 B8 C8 D8 六、申請專利範圍乘法運算的4個乘法器，接受各乘法器的輸出而進行對位位移的對位器，根據上述浮動小數點數的指數部產生上述對位器之對位位移數與規格化前之指數的指數處理部，將上述對位器的輸出相加的4輸入加法器，以及使上述4輸入加法器的輸出與上述規格化前之指數規格化的規格化器上述暫存器檔案分別具有包含16個暫存器的2個暫存器群組’上述轉換行列被分配到其中一個群組，而另一個向量則被分配到另一個群組。 1 3 .如申請專利範圍第1項之資料處理器，更包含被連接到位址匯流排與資料匯流排的C P U，上述浮動小數點單元被連接到上述資料匯流排，上述浮動小數點單元則利用1 6位元固定長度浮動小數點命令組（set)來執行浮動小數點處理，上述C P U係一進行對於上述浮動小數點單元要得到執行浮動小數點處理的命令與資料時爲必要之定址（addressing)處理者，而被形成在1個半導體基板上。經濟部中央揉奉局tec工消费合作社印*. n ·1-- —-- I— I 1^1 «n I 11 tn I I 1- - —ΐ -·- (诗先閲讀背面之注意^項再填寫本頁) 1 4 . 一種資料處理系統，其主要特徵在於包含：在浮動小數點單元備有演算部，而上述演算部包含分別自不同的資料輸入信號群被供給浮動小數點數之虛數部，且對所供給的虛數部之間進行乘法運算的多個乘法器，接受各乘法器的輸出而進行對位位移的對位器，根據上述浮動小數點數的指數部而產生上述對位器之對位位移數與規格化前的指數的指數處理部，將上述對位器之輸出相加的多輸入加法器，以及使上述多輸入加法器的輸出與上述本纸張尺度適用中國國家揉率（CNS ) A4規格（210X297公釐）.5. 經濟部中央標準局貝工消费合作社印裂 A8405093 cl六、申請專利範圍規格化前的指數規格化的規格化器而構成的資料處理器：被連接到該資料處理器，而爲上述C P U所存取的資料R A Μ及；被連接到上述資料R AM與資料處理器的輸出入電路〇 1 5 . —種3次元電腦圖形處理系統，其特徵在於：在浮動小數點單元備有演算部，而上述演算部包含分別自不同的資料輸入信號群被供給浮動小數點數之虛數部，且對所供給的虛數部之間進行乘法運算的多個乘法器，接受各乘法器的輸出而進行對位位移的對位器，根據上述浮動小數點數的指數部而產生上述對位器之對位位移數與規格化前的指數的指數處理部，將上述對位器之輸出相加的多輸入加法器，以及使上述多輸入加法器的輸出與上述規格化前的指數規格化的規格化器而構成的資料處理部；被連接到該資料處理器描畫處理器，上述描畫處理器則進行3次元電腦圖形處理的描畫處理，上述資料處理器則進行用於3次元電腦圖形處理之幾何處理的內積演算以及向量轉換演算的至少其中一者。 1 6 . —種資料處理器，屬於具有中央處理裝置和浮點單元，執行命令組內之命令的資料處理器中，其特徵係於前述命令組內，在於前述浮點單元包含爲執行向量之內積演算的命令者。 1 7 ·如申請專利範圍第1 6項之資料處理器，其中，前述浮點單元係具有進行浮點數之虛數部乘算的複數乘 I— I»! -I I— - I - - I— I - 1 I - -1 I I I I I:I *- (請先閱讀背面之注意Ϋ項再填寫本頁) 本纸張尺度逋用中國國家揉未（CNS ) Α4规格（210X297公釐） -6 - A8 no <i05093 gi 六、申請專利範固法器’和接受前述乘法器之輸出，進行校正偏移的校準器 ’和根據前述浮點數之指數部，生成正規化前之指數的指數處理部’和加算前述校準器之輸出的多輸入加法器，和正規化前述多輸入加法器之輸出和前述正規化前之指數的正規化器者。 1 8 種資料處理系統’其特徵係使用如申請專利範圍第1 6項或第1 7項所述之資料處理器，進行3次元圖形虜理者。 1 9 . 一種資料處理器，屬於具有中央處理裝置和浮點單元’執行命令組內之命令的資料處理器中，其特徵係於前述命令組內，在於前述浮點單元包含爲執行4元向量和4兀向量之內積演算的命令者。 2 0 .如申請專利範圍第1 9項之資料處理器，其中，爲執行前述內積演算的命令係一個命令者。 2 1 . —種資料處理系統，其特徵係使用如申請專利範圍第第1 9項或第2 0項所述之資料處理器，進行3次 7C圖形處理者。 2 2 · —種資料處理器，屬於具有中央處理裝置和浮點單元，執行命令組內之命令的資料處理器中，其特徵係於前述命令組內，在於前述浮點單元包含爲執行向量之內積.演算的一個命令者。 2 3 ·如申請專利範圍第2 2項之資料處理器’其中，前述浮點單元係具有進行浮點數之虛數部乘算的複數乘法器，和接受前述乘法器之輸出’進行校正偏移的校準器本紙張尺度逋用中國國家橾率（CNS ) A4規格（210X297公釐） -----聋-- (請先閲讀背面之注意事項再填寫本頁) 、言- 經濟部智慧財產局員工消費合作社印製經濟部t夹標李局貝工消费合作社印装 A8 B8405093_dI_六、申請專利範圍，和根據前述浮點數之指數部，生成正規化前之指數的指數處理部，和加算前述校準器之輸出的多輸入加法器，和正規化前述多輸入加法器之輸出和前述正規化前之指數的正規化器者。 2 4 . —種資料處理系統，其特徵係使用如申請專利範圍第第2 2項或第2 3項所述之資料處理器，進行3次元圖形處理者。 2 5 · —種資料處理器，屬於具有中央處理裝置和浮點單元，執行命令組內之命令的資料處理器中，其特徵係於前述命令組內，在於前述浮點單元包含爲執行進行行列和向量之積算的向量變換演算的命令者。 2 6 ·如申請專利範圍第2 5項之資料處理器，其中，前述浮點單元係具有進行浮點數之虛數部乘算的複數乘法器，和接受前述乘法器之輸出，進行校正偏移的校準器，和根據前述浮點數之指數部，生成正規化前之指數的指數處理部，和加算前述校準器之輸出的多輸入加法器，和正規化前述多輸入加法器之輸出和前述正規化前之指數的正規化器者。 2 7 .—種資料處理系統，其特徵係使用如申請專利範圍第2 5項或第2 6項所述之資料處理器，進行3次元圖形處理者。 2 8 · —種資料處理器，屬於具有中央處理裝置和浮點單元，執行命令組內之命令的資料處理器中，甚特徵係於前述命令組內，在於前述浮點單元包含爲執行η列 (請先閱讀背面之注意事項再填寫本頁) 本紙張尺度逋用中國國家梂準（CNS ) A4规格（210X 297公釐）.g bS C8 D8 六、申請專利範圍之行列和η元向量之向量變換演算的命令者。- 2 9 ·如申請專利範圍第2 8項之資料處理器，其中 ’爲執行前述向量變換演算的命令係一個命令者。 3 0 · —種資料處理系統’其特徵係使用如申請專利範圍第2 7項或第2 9項所述之資料處理器，進行3次元圖形處理者。 3 1 . —種資料處理器’屬於具有中央處理裝置和浮點單元’執行命令組內之命令的資料處理器中，其特徵係於前述命令組內，在於前述浮點單元包含爲執行m行η列之行列和η元向量之向量變換演算的命令者。 3 2 ·如申請專利範圍第3 1項之資料處理器，其中 ’前述浮點單元係具有進行浮點數之虛數部乘算的複數乘法器，和接受前述乘法器之輸出，進行校正偏移的校準器，和根據前述浮點數之指數部，生成正規化前之指數的指數處理部，和加算前述校準器之輸出的多輸入加法器，和正規化前述多輸入加法器之輸出和前述正規化前之指數的正規化器者。 3 3 . —種資料處理系統，其特徵係使用如申請專利範圍第3 1項或第3 2項所述之資料處理器，進行3次元圖形處理者。本纸張尺度適用中國和家標準（CN$ ) A4规格（210X297公釐）_ 9 - (請先聞讀背面之注意Ϋ項再填寫本頁) 衣. 訂經濟部中央標準局員工消费合作社印氧