شب گذشته، انویدیا در مراسم GTC 2021 کلاس جدیدی از قطعات سختافزاری را رونمایی کرد تا بهگفتهی خودش، هوش مصنوعی دردسترس سازمانهایی قرار گیرد که بر زیرساخت دیتاسنتر سازمانی استاندارد تیم سبز متکی هستند.
بهنوشتهی VideoCardz، محصولات انویدیا پردازندههای گرافیکی جدیدی را شامل میشوند که در سرورهای شرکتهای بزرگ حضور پیدا میکنند. انویدیا میگوید پردازندههای گرافیکی جدیدش مجوز لازم را برای اجرای مجموعهنرمافزار AI Enterprise این شرکت دریافت کردهاند که انحصارا دردسترس VMware vSphere 7، پرکاربردترین پلتفرم مجازیسازی، قرار دارد.
سیستمهای جدید انویدیا تراشهی گرافیکی A30 برای پردازشهای میناستریم هوش مصنوعی و تجزیهوتحلیل داده و A10 برای پردازشهای گرافیکی متکیبر هوش مصنوعی و ورکستیشنهای مجازی و پردازشهای ترکیبیِ عادی و گرافیکی را دربر میگیرند.
منیوویر داس، رئیس بخش رایانش سازمانی در انویدیا، میگوید هوش مصنوعی بهسرعت در حال تبدیل به فناوریای میناستریم است و همین موضوع تقاضا برای زیرساختها و نرمافزارهای مرتبط را افزایش میدهد. بهلطف Nvidia AI Enterprise و VMware vSphere 7 روی سیستمهای تأییدشدهی انویدیا مشتریان میتوانند اپلیکیشنهای هوش مصنوعی مجازیسازیشده را روی سرورهای استاندارد صنعت اجرا کنند تا صدهاهزار شرکت بتوانند سرویسهای هوش مصنوعی جدیدی را روی پلتفرم VMware میزبانی کنند.
Atos، دل، گیگابایت، H3C ،Inspur، لنوو، QCT و سوپرمیکرو نخستین شرکتهایی هستند که میخواهند سرورهای میناستریمی با پشتیبانی از پلتفرم EGX ارائه دهند. انویدیا میگوید بهلطف پلتفرم EGX سازمانها نخستینبار میتوانند پردازشهای هوش مصنوعی را روی همان زیرساختی اجرا کنند که برای پردازشهای مرسوم استفاده میشود. از بین نخستین شرکتهایی که میخواهند سیستمهای جدید را در دیتاسنترهایشان استفاده کنند، میتوانیم به لاکهید مارتین و Mass General Brigham نیز اشاره کنیم.
همکاری بین انویدیا و VMware پلتفرم سازمانی مجهز به هوش مصنوعی را بهمنظور شتابدهی به پردازشهای هوش مصنوعی و پردازشهای سازمانی کانتینرمحور و مرسوم دردسترس سازمانها قرار میدهد. کریش پراساد، قائممقام ارشد و مدیرکل واحد تجاری پلتفرم ابری در VMware، میگوید مشتریان سیلوی هوش مصنوعی نمیخواهند؛ بلکه برای مدیریت سادهتر و افزایش امنیت، بهدنبال اجرای پردازشهای هوش مصنوعی روی زیرساخت خودشان هستند. گفتنی است بهلطف همکاری انویدیا و VMware امکان تکامل زیرساختهای فعلی سازمانی فراهم میشود.
پردازندهی گرافیکی کلاس سازمانی A30 انویدیا برپایهی معماری گرافیکی امپر طراحی شده است و بهادعای انویدیا، میتواند عملکردی تطبیقپذیر و همهکاره در قیمت بهینه ارائه دهد. هر یک از تراشههای A30 به ۲۴ گیگابایت حافظهی گرافیکی HBM2 و رابط سریع PCIe Gen 4 مجهزند و بهلطف فناوری Multi-Instance، از اینستنسهای ۶ گیگابایتی GPU در سرور پشتیبانی میکنند. A30 پردازشهای هوش مصنوعی و سازمانی متنوعی را پوشش میدهد و مزایایی در حوزهی بینایی رایانهای دارد.
هستههای نسل سوم تنسور تراشهی A30 از محاسبات FP32 و حالت نوآورانهی جدیدی پشتیبانی میکنند که TensorFloat-32 نام دارد. انویدیا میگوید TensorFloat-32 قدرت پردازشی تراشه را درمقایسهبا نسل قبل، یعنی T4، حدودا ۲۰ برابر ارتقا میدهد. پردازندهی گرافیکی کلاس سازمانی A10 قدرت پردازشی موردنیاز برای پردازشهای گرافیکی، رندرگیری، هوش مصنوعی و پردازشهای عادی را در سیستمهای میناستریم تأییدشدهی انویدیا ارائه میدهد. همچنین، معماری امپر انویدیا امکان استفاده از ۲۴ گیگابایت حافظه را فراهم میکند.
شرکتهای بزرگ فعال در صنایع مختلف مثل مراقبتهای بهداشتی، خدمات حرفهای و تولیدی در حال پیادهسازی سیستمهای این شرکت و پلتفرم جدید انویدیا و VMware در زیرساخت خودشان هستند. درحالحاضر، بیش از ۲۰ سیستم تأییدشدهی انویدیا دردسترس هستند و سیستمهای مجهز به A30 و A10 نیز تا پیش از پایان سال جاری میلادی عرضه میشوند. پلتفرم Nvidia AI Enterprise با هزینهی ۳،۵۹۵ دلار بهازای هر سوکت CPU به مشتریان ارائه میشود.
مشخصات پردازندههای گرافیکی جدید انویدیا برای دیتاسنتر |
- |
Nvidia A10 |
Nvidia A30 |
تراشه |
GA102-890 |
GA100 |
قدرت پردازشی FP64 |
- |
۵٫۲ ترافلاپس |
قدرت پردازشی FP64 Tensor Core |
- |
۱۰٫۳ ترافلاپس |
قدرت پردازشی FP32 |
۳۱٫۲ ترافلاپس |
۱۰٫۳ ترافلاپس |
قدرت پردازشی TF32 Tensor Core |
۶۲٫۵ ترافلاپس | ۱۲۵ ترافلاپس |
۸۲ ترافلاپس | ۱۶۵ ترافلاپس |
قدرت پردازشی BFLOAT16 Tensor Core |
۱۲۵ ترافلاپس | ۲۵۰ ترافلاپس |
۱۶۵ ترافلاپس | ۳۳۰ ترافلاپس |
قدرت پردازشی FP16 Tensor Core |
۱۲۵ ترافلاپس | ۲۵۰ ترافلاپس |
۱۶۵ ترافلاپس | ۳۳۰ ترافلاپس |
قدرت پردازشی INT8 Tensor Core |
۲۵۰ تاپس | ۵۰۰ تاپس |
۳۳۰ تاپس | ۶۶۱ تاپس |
قدرت پردازشی INT4 Tensor Core |
۵۰۰ تاپس | ۱۰۰۰ تاپس |
۶۶۱ تاپس | ۱۳۲۱ تاپس |
هستهی RT |
۷۲ عدد |
- |
انکد / دیکد |
یک انکدر، دو دیکدر (+ دیکدر AV1) |
یک OFA، یک NVJPEG، چهار NVDEC |
حافظهی گرافیکی |
۲۴ گیگابایت GDDR6 |
۲۴ گیگابایت HBM2 |
پهنای باند حافظهی گرافیکی |
۶۰۰ گیگابایتبرثانیه |
۹۳۳ گیگابایتبرثانیه |
رابط |
PCIe Gen4 با سرعت ۶۴ گیگابایتبرثانیه |
PCIe Gen4 با سرعت ۶۴ گیگابایتبرثانیه
نسل سوم NVLINK با سرعت ۲۰۰ گیگابایتبرثانیه |
فرمفاکتور |
تک درگاهی FHFL |
دو درگاهی FHFL |
حداکثر توان طراحی حرارتی |
۱۵۰ وات |
۱۶۵ وات |
پشتیبانی از فناوری Multi-Instance |
- |
۴ اینستنس ۶ گیگابایتی GPU
۲ اینستنس ۱۲ گیگابایتی GPU
۱ اینستنس ۲۴ گیگابایتی GPU |
پشتیبانی از قابلیت vGPU |
بله |
بله |