Monaseb

به دنبال مناسب ترین ها در سایت مناسب

امروز: شنبه, 30 ارديبهشت 1391

شما اینجا هستید: دانستنی ها سخت افزار مروری بر Nvidia GeForce GTX 480

مروری بر Nvidia GeForce GTX 480

ایمیل چاپ
فهرست مطلب
مروری بر Nvidia GeForce GTX 480
صفحه 2
همه صفحات

33-gtx-480.jpg

کارت گرافیک GTX 480 حدود سه ماه پیش توسط شرکت Nvidia معرفی شده و مدت زیادی از ورود آن به بازار نمی گذرد. این شرکت برای رقابت با چیپ 5970 شرکت ATI،

این کارت گرافیک را عرضه کرده است. اینجا داریم در مورد کارت گرافیک قدرتمندی صحبت می کنیم که سه میلیارد ترانزیستور دارد پس نباید چیزی از قلم بیافتد. بنابراین تمام کوشش خود را به کار گرفتیم تا بتوانیم این کارت را مو به مو بررسی کنیم. اگر دنبال بررسی تخصصی آن هستید، این مطلب برای شما است.

1-gtx-480.jpg

در چند ماه گذشته خبر های مختلفی در مورد این کارت به بیرون درز کرد که بعضی از آنها خوب و امیدوار کننده و برخی دیگر نا امید کننده بودند. همانطور که گفته شد انویدیا کاملا دیر تولید چیپ های مبتنی بر DirectX 11 را آغاز کرد و در همین فرصت رقیب Nvidia یعنی ATI توانست گزینه های زیادی از قدرت و قیمت را در اختیار کاربران بگذارد که از 100 دلار تا 700 دلار متغیر بود. شاید انویدیا در عرضه کارت های کلاس DX11 دیر کرده باشد، اما شروع این کار با به نمایش گذاشتن محصولاتی قدرتمند و سریع برای رقابت همراه بوده است. مدتی زیادی نیست که Nvidia رسما اقدام به پرده برداری از محصول جدیدش کرده، بنابراین ما فرصت را غنیمت شمردیم تا به تست این کارت به همراه نسل های دیگر GeForce و سری 5800 و 5900 بپردازیم.

2-gtx-480.jpg

مشخصات:

3-gtx-480.jpg

در جدول بالا می توانید مشخصات هر دو چیپ GTX470 و GTX480 را مشاهده نمایید. هر دو چیپ دارای 4 کلاستر (گروه) پردازش گرافیکی است و تعداد پردازنده های جریانی چندگانه این کارت به ترتیب به 14 و 15 عدد می رسد. تعداد هسته های CUDA نیز به ترتیب به 448 و 480 عدد می رسد (CUDA نام واحد های پردازشی ای هستند که چندی پیش توسط Nvidia ابداع شدند و توانستند که جای پردازنده های جریانی را تا حد زیادی پر کنند) در این کارت ها به ترتیب 56 و 60 واحد پردازش متریال و تکسچر نیز قرار دارند. با توجه به این اعداد و ارقام، کارت GTX 480 از نظر عملکرد پردازشی نسبتا قوی تر از GTX470 می باشد. اما در مورد سرعت پردازش، فرکانس کل بخش پردازش گرافیکی چیپ GTX 480 برابر با 700 مگاهرتز می باشد و فرکانس هسته های CUDA برابر با 1401 مگاهرتز است. فرکانس واقعی حافظه برابر با 924 مگاهرتز است و فرکانس موثر آن به 3696 مگاهرتز می رسد.

حجم حافظه نیز برابر با 1536 مگا بایت و اینترفیس آن برابر با 384 بیت است که البته چیپ های قبلی از 448 بیت اینترفیس بهره می بردند. پهنای باند حافظه نیز به 177.4 گیگابایت در ثانیه می رسد این چیپ از طراحی 40 نانو متری بهره می برد.

پورت های خروجی پشتیبانی شده توسط این چیپ عبارتند از 2 پورت Dual-link DVI-I و یک پورت mini HDMI با این تفاسیر این کارت در بخش حافظه و پورت های خروجی ضعیف تر از کارت های رقیب شرکت ATI (سری 5800 و سری 5900) می باشد. کانکتور های این کارت کمی عجیب به نظر می رسند. اگر چه GTX 470 از دو کانکتور شش پین استفاده می کند اما GTX 480 از ترکیب نامتداول 1 کانکتور 8 پین و 1 کانکتور 6 پین بهره می برد! آستانه دمای چیپ هم به 105 درجه سانتی گراد می رسد.

اما شرکت Nvidia از یک جهت توانسته اعداد و ارقام فرکانس حافظه را به ATI نزدیکتر کند و آن استفاده از حافظه های GDDR5 می باشد که پس از مدت زیادی انتظار، سرانجام از سوی Nvidia نیز به کار گرفته شد. اما اکنون وقت آن رسیده که به چند عکس از ظاهر این کارت (اولین کارت GTX 480 از سوی Nvidia) نگاهی بیاندازیم.

4-gtx-480.jpg

5-gtx-480.jpg

6-gtx-480.jpg

7-gtx-480.jpg

سیستم خنک سازی کارت به خوبی طراحی شده است و از Heat-pipe های بزرگی برای دفع گرما بهره می برد.

مشخصات معماری

8-gtx-480.jpg

این چیپ از معماری Fermi استفاده میکند. (Enrico Fermi نام یک فیزیک دان برجسته است که برای اولین بار موفق به کشف سلسله مراتب هسته ای شد. او برنده جایزه نوبل فیزیک در سال 1938 می باشد) شاید Nvidia به این دلیل از نام Fermi استفاده کرده که چیپ هایش برای پردازش از سلسله مراتب خاصی استفاده می کنند به هر حال Nvidia معمولا نام های جالبی را برای فناوری های خود انتخاب می کند.

چیپ GTX 480 از بیش از 3 میلیارد ترانزیستور در قالب معماری 40 نانومتری سود می برد. در حالی که رقیب اصلی این چیپ یعنی Radeon HD 5870 از حدود دو میلیارد و پانزده میلیون ترانزیستور استفاده می کند. معماری 40 نانومتری فِرمی توانسته این چیپ را به 480 CUDA Cores مجهز نماید. یعنی بیش از دو برابر تعدادی که در سری GT200 استفاده می شد. این تعداد به GTX 480 کمک می کنند که با قدرت گرافیکی بسیار بیشتر خود در راس قوی ترین ها قرار گیرد!

همچنین، فِرمی اولین GPU با قابلیت پشتیبانی از ECC خواهد بود. ECC به GPU این امکان را میدهد که نرخ خطا های نرم افزاری (SER: Soft Error Rate) را با تصحیح کردن آنها کاهش دهد. این خطا ها باعث می شوند که قسمت مخصوص ثبت اطلاعات حاشیه ای مدار های مجتمع (IC) نسبتا بزرگ و با اهمیت، مشکلاتی به وجود آید که می تواند سرعت پردازش را کاهش دهد. پس استفاده از ECC باعث عملکرد و پایداری بهتر نیز می شود. همچنین این GPU کد های ++C را به طور مستقیم اجرا خواهد کرد.

9-gtx-480.jpg

10-gtx-480.jpg

به نظر میرسد Nvidia قصد دارد معماری Fermi GF100 را جایگزین نسل های قبلی معماری خود نماید. همانطور که در تصویر Diagram معماری GTX 480 مشاهده می کنید، در این چیپ 4 عدد Graphic processing Cluster - GPC (گروه پردازش گرافیکی) قرار دارند و در این طراحی جدید هر GPC از چهار موتور پردازش اَشکال بهره می برد.

11-gtx-480.jpg

وجود این تعداد موتور در هر یک از بخش های این چیپ به GPC ها اجازه می دهد که هر یک به عنوان یک Graphic Processing Unit - GPU کامل فعالیت کنند. یعنی GTX 480 را می توان یک GPU چهار هسته ای نامید این طراحی همچنین باعث شده که GTX 480 بتواند هندسه اجسام را راحت تر از قبل پردازش کند و مقیاس پذیری آن در سرتاسر انجام عمل پردازش هندسه اجسام بیشتر شود. بنا بر ادعای Nvidia آخرین نتایج به دست آمده ، حکایت از این موضوع دارد که پردازش هندسه اجسام، در معماری Fermi GF100 ، نسبت به معماری GT200 ، 8 برابر بهبود یافته است . پردازش سگمنت ها نیز در این GPU نیز بهتر شده و مقیاس پذیری بالاتری دارد. در هر GPU Fermi GF100 ظرفیت گنجاندن 512 CUDA Cores ، 16 واحد پردازش هندسه اجسام، 4 موتور موقعیت دهی تصویر (raster Engine) و پشتیبانی حافظه GDDR5 با اینترفیس 384 بیت نیز صورت می گیرد. با این حال در GTX 480 فقط 480 CUDA Cores وجود دارد ولی بقیه مشخصات دقیقا همان چیزی است که در بالا ذکر شده. سوالی که در ذهن بعضی پیش می آید این است که چرا GTX 480 از اینترفیس حافظه 384 بیتی استفاده میکند، درحالی که سری GT200 از اینترفیس 448 بیتی بهره مند بودند؟ در پاسخ باید گفت که با توجه به حافظه GDDR 5 این کارت، مقدار موثر (Effective) فرکانس حافظه و پهنای باند بسیار بیشتر شده است و عملا نیازی به استفاده از اینترفیس 448 بیتی احساس نمی شود.

هر موتور Streaming Multiprocessor - SM از بخش هایی که در تصویر می بینید تشکیل شده است:

12-gtx-480.jpg

در هر SM ، 32 عدد CUDA Core وجود دارد که از این قسمت ها تشکیل شده است:

اطلاعات وارد حافظه نهان دستورالعمل ها می شوند و سپس در بخش Warp Scheduler، زمان بندی مشخصی برای هر یک از اجزای پردازشی صورت می گیرد. در ادامه اطلاعات وارد Dispatch Unit می شوند و عملکرد هر یک از اجزا تعیین می شود و سپس یک فایل اطلاعات مورد نیاز برای پردازش را در خود نگه می دارد و آنها را به CUDA Core ها اعمال می کند. اطلاعات در CUDA Coreها، ابتدا وارد Dispatch Port می شود و بدین وسیله عملی که از CUDA Core می خواهیم مشخص می شود سپس عملوندها (تعیین کننده های روش عملکرد CUDA Core) جمع آوری می شوند و پس از پردازش اطلاعات، هر هسته CUDA نتیجه عملکرد خود و همچنین اعمالی که برای ادامه ی فرایند پردازش باید اجرا شوند را به CUDA Core بعدی اطلاع می دهد و این فرایند تا پردازش کامل ادامه می یابد.

همزمان با این عملیات موتور پردازش اشکال (Polymorph Engine)، اطلاعات مربوط به شکل و هندسه جسم را پردازش می کند. برای این کار ابتدا راس ها را مشخص می کند سپس توسط Tessellator فواصل بین راس ها را پر می کند. در قسمت Viewport Transform اندازه اجسام و جای آنها روی صفحه تعیین می شود. در Attribute Setup، ویژگی های خاص اجسام پردازش شده، تنظیم می شوند و سپس در قسمت Stream Output، اطلاعات اجسام پردازش شده خارج می شوند.

اطلاعات پردازش شده در CUDA Coreها و Polymorph Engine در قسمت Interconnect Network (شبکه اتصالات داخلی) با یکدیگر ادغام می شوند. در جدول زیر مقدار Cache های به کار رفته در سری GT 200 و سری GF 100 با یکدیگر مقایسه شده اند:

13-gtx-480.jpg

میزان Cache L2 در این چیپ بسیار بیشتر از سری GT200 میباشد و این مزیت امکان پوشش دادن سطح وسیع تری از تکسچرها و پردازش راحت تر و قوی تر را به GTX480 می دهد. در تصویر زیر می توانید مراحل کار Raster Engine و Poly Morph Engine را مشاهده کنید:

14-gtx-480.jpg

وظیفه Raster Engine تنظیم اندازه و کیفیت اجسام پردازش شده و همچنین جایگاه آنها بر روی مونیتور است. بدین منظور ابتدا لبه های اجسام تنظیم می شوند، سپس Rasterizer مسئولیت اسکن خطی تصاویر را بر عهده می گیرد. نحوه کار Polymorph Engine هم در بالا شرح داده شده است اما برای این که عمل Tessellation (در لغت به معنای موزاییک کاری است اما در این مورد وظیفه پر کردن فواصل بین راس ها را بر عهده دارد) را بهتر درک کنید، به عکس های زیر توجه نمایید:

15-gtx-480.jpg



Share |