واحد پردازش گرافیکی
واحد پردازش گرافیکی (نماپردازنده یا نماپردازشگر) (به انگلیسی: Graphics Processing Unit) یا به اختصار GPU یک مدار الکترونیکی اختصاصیافته برای سرعت بخشیدن به گرافیک رایانهای، پردازش تصویر دیجیتال و رندر کردن گرافیکی در کامپیوترهای شخصی، تلفنهای همراه، ایستگاههای کاری و کنسولهای بازی است. این واحد گاهی واحد پردازش بصری یا (Vision processing unit) VPU نیز نامیده میشود. ویژگیهای واحدهای پردازش گرافیکی جدید برای پردازش و ارائه دادن کارهای دیداری (گرافیکی)، آنها را بسیار کارآمدتر از واحدهای پردازش مرکزی یا CPU در پردازش الگوریتمهای پیچیده کردهاست.[۱]
در واقع واحد پردازش گرافیکی همانند واحد پردازش مرکزی در کامپیوتر است ولی وظیفهٔ اصلی آن پردازش اطلاعات مرتبط با تصاویر است. یک GPU معمولاً بر روی کارتهای گرافیک قرار میگیرد اما کارتهای گرافیک غیر حرفهای مستقیماً بر روی مادربورد بهصورت (OnBoard) قرار میگیرند. GPU ابزاری است شامل تعدادی عملگر ابتدایی گرافیکی، که باعث میشود نسبت به CPU در خلق تصاویر بر صفحهٔ نمایشگر بسیار سریعتر عمل کنند.
رایجترین عملگرها برای گرافیک دوبعدی کامپیوترها شامل عملگر بیت بلیت است که معمولاً در سختافزارهای مخصوص یک "Biltter" نامیده میشود. این عملگرها برای کشیدن مستطیل، مثلث، دایره و قوس بهکار میروند. پردازندههای گرافیکی جدید، پردازش گرافیک کامپیوتری سهبعدی را نیز در رایانهها انجام میدهند.
تاریخچه
[ویرایش]دههٔ ۱۹۷۰
[ویرایش]تراشههای ANTIC و CTIA امکان کنترل سختافزاری حالات گرافیکی و متنی و سایر تأثیرات را بر روی آتاری ۸-بیتی را فراهم میکردند. تراشهٔ ANTIC پردازشگری مخصوص برای نگاشت (در حالت برنامهنویسی) متن و دادهٔ گرافیکی به خروجی تصویری بود. طراح تراشهٔ ANTIC جی مینر، طراحی تراشهٔ گرافیکی را برای کمودور آمیگا نیز بر عهده داشت.
دههٔ ۱۹۸۰
[ویرایش]شاید بتوان ایدهٔ اولیهٔ شکلگیری مفهوم GPU را به دههٔ ۱۹۸۰ و کومودور آمیگا[۲] نسبت داد. این کامپیوتر اولین دستگاهی بود که با یک واحد پردازش گرافیکی استاندارد ارائه میشد و از ویژگیهای گرافیکی قابل ملاحظهای در زمان خود بهره میبرد. در همین دهه و در سال ۱۹۸۷ کمپانی تگزاس اینسترومنتس اولین ریزپردازندهٔ دارای قابلیتهای گرافیکی را با نام TMS34010 ارائه کرد.
دههٔ ۱۹۹۰
[ویرایش]در دههٔ ۱۹۹۰ روند رشد کارتهای گرافیکی و پردازندههای دارای قابلیتهای گرافیکی به شکل روزافزونی پیش رفت و برای اولین بار پردازندهها و کارتهای گرافیکی با قابلیت رندر تصاویر و ویدیوهای سهبعدی ارائه شدند. ولی نقطهٔ آغاز آنچه که امروز آن را GPU مینامیم به سال ۱۹۹۹ و محصول متفاوت کمپانی انویدیا بازمیگردد.
Nvidia GeForce 256 (که به آن NV10 نیز میگویند) اولین کارت گرافیک تجاری بود که توانست قابلیتهای سهبعدی و انتقال و نوردهی را در یک سختافزار تجاری برای مصرفکننده ارائه دهد و از آنجا که بعدها قابلیت سایهزنی پیکسلی و برداری به آن اضافه شد، بسیار انعطافپذیرتر و قابلبرنامهریزیتر از کارتهای گرافیکی سهبعدی همدورهٔ خود بود.[۳]
سالهای ۲۰۰۰ تا ۲۰۰۵
[ویرایش]پس از ارائهٔ NV10 و با وجود رابط برنامهای چون اوپنجیال و قابلیتهای مشابه آن در دایرکتاکس، مسیر رشد پردازندههای گرافیکی به سمت قابلیتهای بیشتر برنامهپذیری پیش میرفت. پردازش هر پیکسل توسط یک برنامهٔ کوتاه که ورودیهای آن بافت تصویر را مشخص میکرد، امکانپذیر بود و هر شکل هندسی پیش از آنکه بر روی نمایشگر پدیدار شود، میتوانست توسط یک برنامهٔ کوتاه به شکل دلخواه پردازش گردد. انویدیا نسخهٔ جدیدتر GPU خود را با نام Geforce 3 یا NV20 وارد بازار کرد که اولین پردازندهٔ گرافیکی مجهز به قابلیت سایهزنی برنامهپذیر بود. اما در اکتبر ۲۰۰۲ کمپانی رقیب انویدیا یعنی ایتیآی محصول جدیدی به نام Radeon 9700 یا R300 را معرفی کرد که اولین پردازندهٔ گرافیکی مبتنی بر دایرکتتریدی ۹٫۰ در دنیا بود. سایهزنهای پیکسل و شکل این پردازندهٔ گرافیکی، قادر بودند محاسبات ممیز شناور طولانی و حلقوی را پیادهسازی نمایند و به سرعت، انعطافپذیری در حد یک CPU را پیدا کردند. سایهزنی پیکسل معمولاً در مواردی چون ایجاد پستی و بلندی بر روی سطح اجسام (Bump Mapping) کاربرد دارد که منجر به ایجاد یک بافت بر روی یک شکل میگردد تا آن جسم براق، کدر، زبر، صاف یا حتی کندهکاری شده به نظر برسد.
۲۰۰۶ تا ۲۰۱۰
[ویرایش]کارت گرافیک rx 580 با معرفی جیفورس سری ۸، پردازندههای گرافیکی به دستگاههای محاسباتی عمومیتری تبدیل شدند. امروزه GPUهای موازی در مقابل CPUها قد علم کردهاند و به همین دلیل یکی از زمینههای پژوهشی مهم کنونی، یعنی GPUهای همهمنظوره (GPGPU) (رایانش و محاسبات عمومی بر روی GPU) توانسته در بسیاری از حوزهها مثل فراگیری ماشین (یادگیری ماشین)،[۴] هوش مصنوعی، اکتشاف نفت، پردازش تصویر، جبر خطی، آمار،[۵] بازسازی سهبعدی و حتی تعیین قیمت در بازار سهام، به یکی از پرکاربردترین زمینههای تحقیقاتی و صنعتی تبدیل گردد.
پلتفرم کودا که شرکت انویدیا آن را توسعه دادهاست، یکی از قدیمیترین مدلهای رایانش موازی برای GPU است که از اوپنسیال نیز پشتیبانی میکند. اوپنسیال یک استاندارد آزاد است که توسط گروه کرونوس تعیین گردیدهاست. اوپنسیال توسط اینتل، ایامدی، انویدیا و ARM پشتیبانی میشود و پرطرفدارترین پلتفرمهای توسعهٔ GPGPU در ایالات متحده و منطقهٔ آسیا-اقیانوسیه است.[۶]
دههٔ ۲۰۱۰
[ویرایش]در سال ۲۰۱۰، انویدیا و آئودی با یکدیگر همکاری کرده و برای بهبود عملکرد سیستمهای ناوبری و سرگرمی خودروهای آئودی از پردازندهٔ گرافیکی تگرا استفاده کردند.[۷] پیشرفت در فناوری پردازندهٔ گرافیکی در خودروها به پیشرفت فناوری خودران کمک کرد.[۸] کارتهای سری اچدی ۶۰۰۰ رادئون ایامدی در سال ۲۰۱۰ منتشر شدند و ایامدی در سال ۲۰۱۱ پردازندههای گرافیکی سری 6000M خود را معرفی کرد.[۹] سری کارتهای گرافیک Kepler توسط انویدیا در سال ۲۰۱۲ عرضه شد و در کارتهای سری ۶۰۰ و ۷۰۰ انویدیا استفاده شد. یکی از ویژگیهای این ریزمعماری GPU شامل تقویت GPU است. این فناوری سرعت کلاک یک کارت گرافیک را تنظیم میکند تا سرعت آن را با توجه به مصرف انرژی آن افزایش یا کاهش دهد.[۱۰]
پلیاستیشن ۴ و ایکسباکس وان در سال ۲۰۱۳ منتشر شدند. هر دو دستگاه از پردازندههای گرافیکی مبتنی بر رادئون اچدی ۷۸۵۰ و ایامدی ۷۷۹۰ استفاده میکنند.[۱۱] خط تولید پردازندههای گرافیکی کپلر انویدیا توسط سری مکسول دنبال شد. تراشههای ۲۸ نانومتری انویدیا توسط تیاسامسی در تایوان با استفاده از فرایند ۲۸ نانومتری تولید شدند. این فناوری در مقایسه با فرایند ۴۰ نانومتری پیشین، با افزایش ۲۰ درصدی عملکرد و در عین حال کاهش مصرف انرژی همراه بود.[۱۲][۱۳] هدستهای واقعیت مجازی دارای مشخصات سیستم مورد نیاز بالایی هستند. سازندگان این هدستها در زمان عرضه، مدلهای کارت گرافیک جیتیایکس ۹۷۰ و R9 290X یا بالاتر از آنها را توصیه کردند.[۱۴][۱۵] کارتهای مبتنی بر ریزمعماری پاسکال در سال ۲۰۱۶ منتشر شدند. کارتهای سری ۱۰ جیفورس از این نسل از کارتهای گرافیک هستند. این سری با استفاده از فرایند تولید بهبودیافتهٔ ۱۶ نانومتری ساخته میشدند.[۱۶]
در سال ۲۰۱۸، انویدیا پردازندههای گرافیکی سری آرتیایکس ۲۰ (RTX 20) را تولید کرد که با افزودن هستههای ردیابی پرتو به پردازندههای گرافیکی، عملکرد آنها را در جلوههای نوری بهبود میبخشید.[۱۷] پردازندههای گرافیکی پُلاریس۱۰ و پُلاریس ۱۱ توسط ایامدی با فرایند ۱۴ نانومتری ساخته شدند. این کارتها افزایش قابل توجهی در «عملکرد به ازای مصرف هر وات» در مقایسه با مدلهای پیشین از خود نشان دادند.[۱۸] ایامدی همچنین سری وگا را بهعنوان رقیبی برای کارتهای پاسکال رده بالای انویدیا، عرضه کرد.
در سال ۲۰۱۹، ایامدی سری کارتهای گرافیک رادئون سری ۵۰۰۰ را معرفی کرد.[۱۹] این شرکت سپس سری رادئون آر ایکس ۶۰۰۰ خود را با پشتیبانی از ردیابی پرتو با شتاب سختافزاری رونمایی کرد.[۲۰] این سری محصولات که در اواخر سال ۲۰۲۰ عرضه شدند، شامل RX 6800، RX 6800 XT و RX 6900 XT بود.[۲۱][۲۲] RX 6700 XT که مبتنی بر Navi 22 است، در اوایل سال ۲۰۲۱ عرضه شد.[۲۳]
پلیاستیشن ۵ و ایکسباکس سری اکس و سری اس در سال ۲۰۲۰ عرضه شدند. هر دوی آنها از GPUهای مبتنی بر ریزمعماری RDNA 2 با پیشرفتهای تدریجی و پیکربندیهای مختلف استفاده میکنند.[۲۴][۲۵][۲۶]
اینتل نخستین بار در اواخر دههٔ ۱۹۹۰ وارد بازار پردازنده گرافیکی شد، اما شتابدهندههای سهبعدی ضعیفی را در مقایسه با رقبای آن زمان خود تولید کرد. اینتل بهجای تلاش برای رقابت با سازندگان رده بالای انویدیا و ایتیآی/ایامدی، ادغام پردازندههای گرافیکی تکنولوژی گرافیک اینتل در چیپستهای مادربرد را آغاز کرد. این راهبرد با چیپست اینتل ۸۱۰ برای پنتیوم ۳ آغاز شد و در CPUها ادامه یافت. اینتل این راهبرد را با معرفی پردازندهٔ لپتاپ Intel Atom 'Pineview' در سال ۲۰۰۹ و پردازندههای دسکتاپ نسل یک اینتل کور در سال ۲۰۱۰ و پنتیومها و سلرونها ادامه داد. این راهبرد، منجر به سهم اسمی زیادی از بازار پردازندههای گرافیکی برای اینتل شد، زیرا بیشتر رایانههای دارای سیپییوی اینتل نیز دارای این پردازندهٔ گرافیکی مجتمع بودند. این پردازندههای گرافیکی عموماً از نظر عملکرد از پردازندههای گرافیکی مستقل ضعیفتر بودند. اینتل در سال ۲۰۲۲ با معرفی پردازندههای گرافیکی مستقل سری آرک خود وارد رقابت با کارتهای کنونی جیفورس و سری رادئون شد و با ارائهٔ قیمتهای رقابتی، دوباره وارد بازار پردازندههای مستقل شد.
دههٔ ۲۰۲۰
[ویرایش]در دههٔ ۲۰۲۰، پردازندههای گرافیکی بهطور فزایندهای برای محاسبات مربوط به آموزش شبکههای عصبی بر روی مجموعه دادههای عظیمی که برای مدلهای زبانی بزرگ مورد نیاز هستند، استفاده شدهاند. هستههای پردازش تخصصی در برخی از پردازندههای گرافیکی ایستگاههای کاری مدرن برای یادگیری عمیق اختصاص داده شدهاند، زیرا با استفاده از ضرب و تقسیم ماتریس ۴×۴، عملکرد FLOPS قابلتوجهی افزایش مییابند که منجر به عملکرد سختافزار تا 128 TFLOPS در برخی از برنامهها میشود.[۲۷][۲۸]
شرکتهای تولیدکنندهٔ پردازندهٔ گرافیکی
[ویرایش]شرکتهای بسیاری در زمینهٔ تولید پردازندهٔ گرافیکی فعالند. در سال ۲۰۰۸، اینتل، انویدیا و ایامدی/ایتیآی به ترتیب با ۴۹٫۵٪ و ۲۷٫۸٪ و ۲۰٫۶٪ از سهم بازار در صدر تولیدکنندگان پردازندهٔ گرافیکی بودند. البته در این آمار، پردازندههای گرافیکی مجتمع با CPU اینتل نیز محاسبه شدهاند. اگر آنها را در نظر نگیریم، انویدیا و ATI تقریباً کل بازار را در اختیار دارند. دو شرکت کوچکتر اس۳ گرافیکس و متروکس[۲۹] نیز به تولید پردازندهٔ گرافیکی میپردازند.
تلفنهای هوشمند کنونی عموماً از پردازندههای گرافیکی آدرنو تولید شرکت کوالکام، پاور ویآر تولید شرکت ایمجینیشن تکنولوجیز و مالی تولید شرکت آرم استفاده میکنند.
توابع محاسباتی
[ویرایش]پردازندههای گرافیکی مدرن از بیشتر قدرت خود برای محاسبات مربوط به گرافیک سهبعدی در کامپیوتر بهره میبرند. پیشرفتهای اخیر در GPUها باعث شده تا بتوانند از سایهزنهای قابلبرنامهریزی بهره گیرند. بدین ترتیب با استفاده از این ویژگی میتوان تصاویر را در سطح هندسی و بافت دستکاری نمود. از آنجا که بیشتر این محاسبات نیاز به محاسبات ماتریسی و برداری دارند، مهندسین و دانشمندان مطالعات خود بر روی کاربردهای غیرگرافیکی GPU را افزایش دادهاند. یک نمونه از کاربردهای غیرگرافیکی پردازنده گرافیکی، تولید بیتکوین است، که برای حل معماها از یک واحد پردازش گرافیکی استفاده میگردد.
رمزگشایی ویدئویی با GPU
[ویرایش]بیشتر GPUهای تولید شده از سال ۱۹۹۵ تاکنون از فواصل رنگی YUV که برای پخش ویدئوهای دیجیتالی بسیار مهم است، پشتیبانی میکنند، و بسیاری از GPUهای تولید شده از سال ۲۰۰۰ نیز از فرمتهای MPEG پشتیبانی میکنند. این روند رمزگشایی ویدئو توسط سختافزار که از دوبخش رمزگشایی و پردازش ویدئو تشکیل شده و توسط یک GPU انجام میگیرد را «رمزگشایی ویدئو توسط GPU» یا «رمزگشایی سختافزاری ویدئو با GPU» مینامند.
کارتهای گرافیکی جدیدتر حتی میتوانند ویدئوهای کیفیت بالای HD را نیز به صورت سختافزاری بر روی خود کارت رمزگشایی نمایند، تا پردازنده درگیر آن نشود. مهمترین APIها برای رمزگشایی ویدئو با GPU عبارتند از DxVA برای سیستمعامل مایکروسافت ویندوز، VDPAU, VAAPI, XvMC و XvBA برای لینوکس و سیستمعاملهای مبتنی بر یونیکس. همه این رابطها به غیر از XvMC قادرند ویدئوهای رمزگذاری شده با فرمتهای MPEG-1، MPEG-2، MPEG-4 ASP, H.264 یا DivX 6، VC-1، WMV, Xvid و DivX 5 را رمزگشایی کنند.
روند رمزگشایی ویدئو توسط GPU
[ویرایش]روند رمزگشایی فرمتهای ویدئویی به وسیله GPU به صورت زیر است:
- تصحیح تصویر ویدئو (mocomp)
- تبدیل معکوس کسینوسی گسسته (iDCT)
- تلهسینه معکوس
- تبدیل معکوس کسینوسی گسسته اصلاحشده (iMDCT)
- فیلتر Deblocking
- محاسبات درونفریمی
- کوانتیزاسیون معکوس (IQ)
- رمزگشایی طول متغیر (VLD)
- تشخیص خودکار منایع خطاهای درهمتنش
- پردازش Bitstream و جانشانی نهایی پیکسلها
اشکال مختلف GPU
[ویرایش]کارتهای گرافیک اختصاصی
[ویرایش]پردازندههای گرافیکی بسیار قدرتمند معمولاً بهطور جداگانه تهیه شده و بوسیله یک درگاه اختصاصی مثل پیسیآی اکسپرس یا AGP یا HDMI به بورد اصلی متصل میشوند. بدین ترتیب به راحتی میتوان آنها را تعویض نموده یا در صورتی که مادربورد از مدلهای جدیدتر پشتیبانی کند آنها را ارتقا داد.
یک پردازنده گرافیکی اختصاصی لزوماً جداشدنی نیست و حتی میتواند از طریق درگاههای دیگری به غیر از موارد استاندارد مذکور به بورد اصلی متصل گردد. کلمه «اختصاصی» برای این استفاده میشود که در این نوع GPUها یک حافظه RAM اختصاصی برای استفاده کارت گرافیک در نظر گرفته شدهاست. البته اکثر پردازندههای گرافیکی اختصاصی جداشدنی و قابل تعویضند. در کامپیوترهای شخصی کوچکتر مثل لپتاپها معمولاً برای اتصال GPU اختصاصی به بورد اصلی از رابطهای غیر استاندارد استفاده میشود تا حجم کمتری اشغال کنند، ولی اغلب آنها با وجود تفاوتی که در شکل و اندازه دارند از همان منطق ارتباطی PCIe و AGP بهره میبرند.
فناوریهایی چون en:SLI انویدیا و en:CrossFire کمپانی ATI این امکان را فراهم میکنند که بتوان برای ترسیم یک تصویر از چند GPU بهره برد. این کار به معنای استفاده حداکثر از قدرت پردازشی GPU برای کارهای گرافیکی است.
پردازندههای گرافیکی مجتمع (integrated)
[ویرایش]پردازندههای گرافیکی مجتمع یا مشترک (IGP) از بخشی از حافظه RAM کامپیوتر برای محاسبات خود استفاده میکند و دیگر مثل پردازندههای گرافیکی اختصاصی به یک حافظه RAM جداگانه مجهز نیست. اکثر این نوع پردازندههای گرافیکی به صورت مجتمع با بورد اصلی ارائه میشوند. البته در APUها از این هم فراتر میروند و در داخل خود CPU ساخته میشوند. امروزه ۹۰٪ کامپیوترها مجهز به پردازنده گرافیکی مجتمع هستند. این نوع پردازندههای گرافیکی نسبت به نوع اختصاصی باعث کاهش هزینه سیستم میشوند ولی از سویی قابلیتهای آنها نیز کمتر است. سابقاً این نوع GPUها در اجرای بازیهای سهبعدی و ویدئوهای HD با مشکل مواجه میشدند ولی با رشد تکنولوژی و معرفی نسلهای جدیدتر، این پردازندههای گرافیکی نیز بهبود یافته و قدرتمندتر شدند. با این حال هنوز هم کاربران حرفهای گرافیک و علاقهمندان به بازیهای سنگین کامپیوتری باید یک پردازنده گرافیکی اختصاصی برای رایانه خود تهیه کنند.
از آنجا که GPUها میزان ارجاع به حافظه بالایی دارند، ممکن است نوع مجتمع آنها در مواقعی که فضای خالی حافظه رم کاهش مییابد، برای استفاده از آن با CPU وارد رقابت شود. IGPها میتوانند تا ۲۹٫۸۵۶ گیگابایت بر ثانیه از پهنای باند حافظه را به خود اختصاص دهند. این در حالی است که کارتهای گرافیکی اختصاصی میتوانند تا ۲۶۴ گیگابایت از پهنای باند حافظه اختصاصی خود بهره گیرند. در مدلهای قدیمی پردازندههای گرافیکی مجتمع امکان انتقال و نوردهی تصویر به صورت سختافزاری وجود نداشت، اما مدلهای جدیدتر این قابلیتها را دارا میباشند.
پردازندههای گرافیکی مرکب یا هیبریدی
[ویرایش]طبقه جدیدی از GPUها وجود دارد که مابین دو نوع قبلی قرار میگیرد. معمولترین روشهای پیادهسازی این نوع پردازندههای گرافیکی، روش HyperMemory کمپانی ATI و TurboCache انویدیا هستند. کارتهای گرافیک هیبریدی نسبت به IGPها قیمت بالاتری دارند و از کارتهای گرافیک اختصاصی ارزانتر هستند. این نوع GPUها از حافظه مشترک با سیستم استفاده میکنند و در کنار آن یک حافظه کش اختصاصی نیز برای خود دارند، تا با استفاده از آن تأخیر بالای ناشی از دسترسی به حافظه رم را جبران کنند. در تبلیغات این نوع محصولات گاهی گفته میشود که حجم حافظه رم آنها ۷۶۸ مگابایت است، ولی در واقع این میزان حجمی از رم سیستم است که این نوع پردازنده گرافیکی میتواند از حافظه اصلی رایانه اشغال کند.
پردازش جریانی و پردازندههای گرافیکی همهمنظوره
[ویرایش]استفاده از پردازندههای گرافیکی همهمنظوره (GPGPU) به عنوان پردازنده جریانی رشد روزافزونی دارد و هر روز فراگیرتر میشود. این نوع واحدهای پردازش گرافیکی، به جای آن که صرفاً برای عملیات گرافیکی طراحی شده باشند، قدرت محاسباتی یک سایهزن گرافیکی مدرن را برای محاسبات و رایانشهای عمومی به کار میگیرند. در برخی کاربردهای خاص که نیاز به عملیات برداری پیچیده دارند، این نوع پردازنده گرافیکی میتواند عملکرد بسیار بهتری نسبت به یک CPU داشته باشد. دو کمپانی مهم تولیدکننده GPU، یعنی ATI و انویدیا، برای پوشش کاربردهای بیشتر استفاده از GPGPU، وارد یک رقابت جدی شدهاند. هر دو کمپانی در پروژه ایجاد یک پردازشگر توزیعی برای محاسبات مربوط به تاشدگی پروتئین، به نام en:Folding@home با دانشگاه استنفورد همکاری میکنند. در برخی موارد ویژه پیش میآید که یک پردازنده گرافیکی، ۴۰ برابر سریعتر از یک پردازنده معمولی عمل میکند.
GPGPU میتواند در بسیاری از وظایف موازی مثل ردیابی اشعه، دینامیک سیال محاسباتی و مدلسازی آبوهوا مورد استفاده قرار گیرد. عموماً این ابزار برای رایانشهای نیازمند به قدرت محاسباتی بالا استفاده میشود، چرا که GPUها به خاطر معماری ویژهای که دارند، قابلیتهای موازیسازی بالایی دارند.
به علاوه امروزه کامپیوترهای قدرتمند مبتنی بر GPU نقش مهمی در مدلسازیهای بزرگ دارند. سه مورد از ۱۰ ابررایانه قدرتمند جهان از قدرت GPU استفاده میکنند.
کارتهای انویدیا از APIهای برنامهنویسی به زبان سی مثل کودا (معماری دستگاه محاسبه یکپارچه) و اوپنسیال پشتیبانی میکنند. کودا بهطور اختصاصی در پردازندههای گرافیکی انویدیا به کار میرود، در حالی که OpenCL طوری طراحی شده که در معماریهای متفاوتی مثل GPU, CPU و DSP مورد استفاده قرار گیرد. این فناوریها به شما این امکان را میدهند تا از توابع مشخص یک برنامه معمولی C برای اجرا در پردازندههای جریانی استفاده کنید. این موضوع باعث میشود که برنامههای C از قابلیتهای GPU استفاده کرده و بر روی ماتریسهای بزرگ به صورت موازی اجرا شوند، در حالی که هنوز هم میتوانند هنگام نیاز از CPU نیز استفاده نمایند. CUDA اولین API است که اجازه میدهد اپلیکیشنهای مبتنی بر CPU بهطور مستقیم از منابع یک GPU برای محاسبات عمومیتر، بدون محدودیتهای استفاده از API گرافیکی استفاده نمایند.
از سال ۲۰۰۵ علاقه به استفاده از GPU برای محاسبات عمومی به وجود آمد. در اکثر موارد، برنامههای خطی یا درختی بر روی رایانه میزبان کامپایل میشوند و فایل اجرایی برای اجرا در GPU ارسال میشود. ایده کلی استفاده از GPU در این موارد بدین شکل است که یک برنامه مشخص به چند بخش کوچک شکسته میشود و سپس با استفاده از معماری اسآیامدی پردازندههای گرافیکی به صورت موازی اجرا میگردد. روش دیگر آن است که عمل تفسیر و کامپایل برنامه نیز در خود GPU صورت گیرد. در این روش از همان ابتدا، پیش از کامپایل، برنامه به بخشهای کوچکتر تقسیم شده و بهطور موازی تفسیر میشوند. یک GPU مدرن میتواند بهطور همزمان هزاران برنامه کوچک را تفسیر نماید.
تست کارت گرافیک
[ویرایش]یکی از بهترین برنامه برای تست کارت گرافیک برنامه Dmark است که محصول شرکت feuturemark 2003 میباشد. این برنامه تمام جوانب کارت گرافیک را بررسی و تست میکند و به کارت گرافیک امتیاز میدهد.[۳۰]
هسته تنسور
[ویرایش]بهطور ساده میتوان گفت هستههای تنسور از قسمتهای کوچکی تشکیل شدهاند که برای انجام کار پردازشی سنگین به کارت گرافیک کمک میکنند.
کاربرد هسته تنسور، هسته تنسوردر فیزیک و مهندسی و در ریاضیات کاربرد فراوانی دارد یکی از کابرد مهم آن این است که میتواند کار پیچیده الکترومغناطیس و نجوم و مکانیک سیالات را حل کند.
هستهٔ کودا جزئی از کارت گرافیک است که مسئولیت پردازش تصاویر را بر عهده دارد با مقدار اندکی تفاوت دارای پیچیدگی معماری کمتری است اما در مقدار گستردهتری در کارت گرافیک قرار میگیرد بهطور طبیعی پردازندههای معمولی دارای ۲ الی ۱۶ هسته است اما این تعداد در هستههای کودا به عدد ۱۰۰ تا میرسد که عدد قابل توجهی برای یک هسته کارت گرافیک است.
پانویس
[ویرایش]- ↑ «واحد پردازش گرافیکی (GPU) چیست ؟». تبیان. ۲۰۱۲-۰۱-۲۵. دریافتشده در ۲۰۲۴-۰۳-۰۵.
- ↑ «Amiga History Guide». www.amigahistory.co.uk. دریافتشده در ۲۰۲۴-۰۳-۰۵.
- ↑ «NVIDIA: About Us». NVIDIA (به انگلیسی). دریافتشده در ۲۰۲۴-۰۳-۰۵.
- ↑ Raina, Rajat; Madhavan, Anand; Ng, Andrew Y. (2009-06-14). "Large-scale deep unsupervised learning using graphics processors". Proceedings of the 26th Annual International Conference on Machine Learning. ICML '09. New York, NY, USA: Association for Computing Machinery: 873–880. doi:10.1145/1553374.1553486. ISBN 978-1-60558-516-1.
- ↑ Liepe, Juliane; Barnes, Chris; Cule, Erika; Erguler, Kamil; Kirk, Paul; Toni, Tina; Stumpf, Michael P. H. (2010-07-15). "ABC-SysBio--approximate Bayesian computation in Python with GPU support". Bioinformatics (Oxford, England). 26 (14): 1797–1799. doi:10.1093/bioinformatics/btq278. ISSN 1367-4811. PMC 2894518. PMID 20591907.
- ↑ :en:Graphics processing unit, Wikipedia
- ↑ Teglet, Traian (8 January 2010). "NVIDIA Tegra Inside Every Audi 2010 Vehicle". Archived from the original on 2016-10-04. Retrieved 2016-08-03.
- ↑ "School's in session – Nvidia's driverless system learns by watching" (به انگلیسی). 2016-04-30. Archived from the original on 2016-05-01. Retrieved 2016-08-03.
- ↑ "AMD Radeon HD 6000M series – don't call it ATI!". CNET. Archived from the original on 2016-10-11. Retrieved 2016-08-03.
- ↑ "Nvidia GeForce GTX 680 2GB Review". Archived from the original on 2016-09-11. Retrieved 2016-08-03.
- ↑ "Xbox One vs. PlayStation 4: Which game console is best?". ExtremeTech. Retrieved 2019-05-13.
- ↑ "Kepler TM GK110" (PDF). NVIDIA Corporation. 2012. Archived from the original (PDF) on October 11, 2016. Retrieved August 3, 2016.
- ↑ "Taiwan Semiconductor Manufacturing Company Limited". www.tsmc.com. Archived from the original on 2016-08-10. Retrieved 2016-08-03.
- ↑ "Building a PC for the HTC Vive". 2016-06-16. Archived from the original on 2016-07-29. Retrieved 2016-08-03.
- ↑ "VIVE Ready Computers". Vive. Archived from the original on 2016-02-24. Retrieved 2021-07-30.
- ↑ "Nvidia's monstrous Pascal GPU is packed with cutting-edge tech and 15 billion transistors". 5 April 2016. Archived from the original on 2016-07-31. Retrieved 2016-08-03.
- ↑ Sarkar, Samit (20 August 2018). "Nvidia RTX 2070, RTX 2080, RTX 2080 Ti GPUs revealed: specs, price, release date". Polygon. Retrieved 11 September 2019.
- ↑ "AMD RX 480, 470 & 460 Polaris GPUs To Deliver The 'Most Revolutionary Jump In Performance' Yet" (به انگلیسی). 2016-01-16. Archived from the original on 2016-08-01. Retrieved 2016-08-03.
- ↑ AMD press release: "AMD Announces Next-Generation Leadership Products at Computex 2019 Keynote". AMD. Retrieved October 5, 2019.
- ↑ "AMD to Introduce New Next-Gen RDNA GPUs in 2020, Not a Typical 'Refresh' of Navi". Tom's Hardware. 2020-01-29. Retrieved 2020-02-08.
- ↑ "AMD Teases Radeon RX 6000 Card Performance Numbers: Aiming For 3080?". AnandTech. 2020-10-08. Retrieved 2020-10-25.
- ↑ Judd, Will (October 28, 2020). "AMD unveils three Radeon 6000 graphics cards with ray tracing and RTX-beating performance". Eurogamer. Retrieved October 28, 2020.
- ↑ Mujtaba, Hassan (2020-11-30). "AMD Radeon RX 6700 XT 'Navi 22 GPU' Custom Models Reportedly Boost Up To 2.95 GHz". Wccftech (به انگلیسی). Retrieved 2020-12-03.
- ↑ Funk, Ben (December 12, 2020). "Sony PS5 Gets A Full Teardown Detailing Its RDNA 2 Guts And Glory". Hot Hardware. Archived from the original on December 12, 2020. Retrieved January 3, 2021.
- ↑ Gartenberg, Chaim (March 18, 2020). "Sony reveals full PS5 hardware specifications". The Verge. Retrieved January 3, 2021.
- ↑ Smith, Ryan. "Microsoft Drops More Xbox Series X Tech Specs: Zen 2 + RDNA 2, 12 TFLOPs GPU, HDMI 2.1, & a Custom SSD". AnandTech. Retrieved 2020-03-19.
- ↑ Smith, Ryan. "NVIDIA Volta Unveiled: GV100 GPU and Tesla V100 Accelerator Announced". AnandTech. Retrieved 16 August 2018.
- ↑ Hill, Brandon (11 August 2017). "AMD's Navi 7nm GPU Architecture to Reportedly Feature Dedicated AI Circuitry". HotHardware. Archived from the original on 17 August 2018. Retrieved 16 August 2018.
- ↑ «Matrox Graphics - Products - Graphics Cards». web.archive.org. ۲۰۱۴-۰۲-۰۵. بایگانیشده از اصلی در ۵ فوریه ۲۰۱۴. دریافتشده در ۲۰۲۴-۰۳-۰۵.
- ↑ زیمابی بایگانیشده در ۱۶ اوت ۲۰۱۴ توسط Wayback Machine, نکاتی در رابطه با تهیه کارت گرافیک
- مشارکتکنندگان ویکیپدیا. «ANTIC». در دانشنامهٔ ویکیپدیای انگلیسی، بازبینیشده در ۸ ژانویه ۲۰۰۹.