
تعد ASICs المخصصة لمناطق محددة إحدى الطرق "لإعادة تشغيل" قانون مور والتغلب على قيود وحدات المعالجة المركزية للأغراض العامة. وهي الآن منطقة واعدة جدًا لتطوير الإلكترونيات الدقيقة. جوجل وأمازون وشركات أخرى لديها مشاريعها الخاصة. على سبيل المثال ، تصنع Google معالجات Google TPU Tensor ، وتقوم مراكز بيانات Amazon بتشغيل شرائح AWS Graviton على قلب ARM.
الأول هو ASICs للشبكات العصبية ، والأخير هو ARM للأغراض العامة 64 بت لتحسين نسبة السعر إلى الأداء في أعباء العمل كثيفة الحساب.
فئة أخرى من ASICs للأغراض العامة ، حيث كانت التجارب النشطة جارية مؤخرًا ، هي معالجات مشتركة متخصصة لمعالجة البيانات (وحدة معالجة البيانات ، DPU) ، وهي نوع من بطاقات الشبكة الذكية (SmartNIC). بعض الأمثلة على هذه الأنواع هي Nvidia BlueField 2 و Fungible و Pensando DSC-25.
ماذا يحبون؟ ما هي المهام المناسبة؟ دعنا نلقي نظرة.

ما هو SmartNIC
تم تصميم بطاقات الشبكة التقليدية (NIC) على دائرة متكاملة ذات غرض خاص (ASIC) ، والتي تم تصميمها لتعمل كوحدة تحكم Ethernet. غالبًا ما يتم تصميم هذه الدوائر الدقيقة لأداء وظائف ثانوية. على سبيل المثال ، تدعم وحدات تحكم Mellanox ConnectX بروتوكول Infiniband عالي السرعة. هذه رقائق متخصصة رائعة ، لكن لا يمكن تغيير وظائفها.
بخلاف بطاقات الشبكة البسيطة ، يتيح SmartNIC للمستخدم تنزيل برامج إضافية إلى وحدة التحكم ، أي بعد شراء الجهاز. هذا يوسع أو يغير وظائف ASIC. يشبه الإجراء إلى حد ما شراء هاتف ذكي وتثبيت العديد من التطبيقات عليه.
لجعل هذا ممكنًا ، تتطلب بطاقات SmartNIC طاقة معالجة وذاكرة إضافية أكثر من بطاقات NIC التقليدية. نحن نتحدث عن معالجات ARM متعددة النوى أكثر قوة ، وتركيب معالجات شبكات متخصصة (مراكز معالجة التدفق ، FPC) ومصفوفات بوابة قابلة للبرمجة (FPGA). غالبًا ما تحتوي
Xilinx Alveo
U25 Schematic SmartNIC على نواة ARM منفصلة لطبقة التحكم ، وتسمح بعض اللوحات بتحميل نواة Linux معدلة. توزع نوى ARM المخصصة الحمل عبر باقي وحدات الحساب ، وتجمع الإحصائيات والسجلات ، وتراقب حالة SmartNIC. حركة مرور الشبكة المباشرة لا تمر من خلالها.
ما هي المهام المناسبة لوحدات DPU؟
المعالجات المشتركة للبيانات (DPUs) هي امتداد نموذجي لوحدات SmartNIC التي تضيف NVMe أو NVMe عبر وظيفة الأقمشة (NVMe-oF). تسمح لك هذه اللوحة بتفريغ المعالج المركزي ، مع تولي جميع مهام الإدخال / الإخراج.
على سبيل المثال ، ضع في اعتبارك جهاز SmartNIC الخاص بالمتحكم الدقيق Broadcom NetXtreme-S BCM58800 . تعمل كبطاقة شبكة قابلة للبرمجة وتدعم (NVMe-oF).
بنية بطاقة Broadcom Stingray على أساس متحكم BCM58800
تحتوي Broadcom Stingray على ثمانية نوى ARM v8 A72 بتردد 3 جيجاهرتز ، وهي أعلى سرعة ساعة لأي ذراع ARM على أي جهاز SmartNIC. تأتي بطاقة الشبكة مع ذاكرة DDR4 تصل إلى 16 جيجا بايت. يتم دعم التشفير حتى 90 جيجابت في الثانية على مستوى الأجهزة ويتم دعم بعض وظائف معالجة البيانات: إزالة البيانات المكررة ، والتي تزيل الترميز من RAID 5 و RAID 6.
كما يوضح الرسم التخطيطي مسرع TruFlow. إنها تقنية مملوكة لشركة Broadcom لتسريع الأجهزة لعمليات الشبكة ، بما في ذلك Open vSwitch (OvS) والمزيد.
نفيديا بلوفيلد 2
تخصصت Nvidia تقليديًا في مسرعات الرسومات ، لكنها أكملت هذا العام عملية استحواذ بقيمة 7 مليارات دولار على شركة Mellanox المتخصصة في تصنيع الرقائق ، لذا فهي تستهدف الآن بجدية مجالًا جديدًا من الحوسبة عالية الأداء لمراكز البيانات.
Mellanox هي واحدة من الشركات الرائدة في تطوير بطاقات الشبكة الذكية ، وتعتبر لوحة BlueField 2 ، التي يتم تسويقها كوحدة معالجة البيانات (DPU) ، المنتج الرائد الآن .
تطبيقات Nvidia / Mellanox BlueField 2 Architecture
Key DPU:
- السحابات الافتراضية والأجهزة.
- تخزين NVMe في الأجهزة الافتراضية.
- تطبيقات الشبكة الافتراضية لوظيفة الشبكة (NFV).
- تطبيقات أمن المعلومات مثل الفحص العميق للحزم (DPI).
- الخوادم الدقيقة للحوسبة المتطورة
Nvidia / Mellanox BlueField 2
يتميز بمجموعة من ثمانية نوى ARM v8 A72 ووحدة تحكم في الذاكرة DDR4 ومحول شبكة إيثرنت ثنائي المنفذ أو محول شبكة InfiniBand (اثنان بسرعة 100 جيجابت في الثانية أو واحد بسرعة 200 جيجابت في الثانية) ، بالإضافة إلى ASICs المتخصصة لتسريع الوظائف المختلفة: التعبيرات العادية وتجزئة SHA-2 وما إلى ذلك.
بينساندو
إحدى الشركات الناشئة الجديدة في منطقة SmartNIC هي Pensando ، التي تقدم ما يسمى ببطاقة الخدمات الموزعة في السوق ، Pensando DSC-25 (لخوادم الشركات) و Pensando DSC-100 (لموفري الخدمات السحابية).
Pensando DSC-25 و Pensando DSC-100
المنتج الرئيسي هو Pensando DSC-25. إنها بطاقة تحتوي على وحدة DPU واحدة P4 (Capri) لمعالجة البيانات ، وأنوية ARM إضافية ومسرعات الأجهزة للوظائف المحددة.
دائرة Pensando DSC-25
يتم توصيل نوى DPU و ARM الرئيسية عبر ناقل ربط مشترك بوحدة تحكم PCIe ومجموعة من ذاكرة الوصول العشوائي (تصل إلى 4 جيجابايت).
يشار إلى مسرعات الأجهزة الفردية هنا باسم "إلغاء تحميل معالجة الخدمة". كما هو الحال مع بطاقة Mellanox ، فإنهم يتعاملون مع التشفير ومعالجة القرص والمهام الأخرى.
فطري
هندسة Fungible عالية المستوى تدعي شركة
ناشئة أخرى ، Fungible ، أنها صاغت مصطلح DPU في عام 2016. أعلنت الشركة عن معالج يسمى F1 DPU ، لكن البنية الفعلية لهذه الرقائق غير معروفة. يمكن لـ Fungible فقط إظهار المخططات العامة في الوقت الحالي ، كما في الرسم التوضيحي أعلاه. أعرب بعض الخبراء عن شكوكهم في أن Fungible تستخدم ببساطة مصطلح الضجيج DPU لجذب استثمارات رأس المال الاستثماري. بالمناسبة ، تم بالفعل استثمار 500 مليون دولار في جولات مختلفة.
ماذا بعد؟
كان هناك الكثير من الضجيج حول مفهوم DPU مؤخرًا. لم يتم ذكر جميع الشركات التي تحاول دخول هذا السوق (Intel و Xilinx وغيرها) في هذه المراجعة.
الحقيقة هي أن مفهوم SmartNIC كان موجودًا منذ فترة طويلة ، وأن الشركات الكبيرة مثل Google و Amazon طورت ونفذت حلولها الداخلية الخاصة بها. في الوقت نفسه ، تم تشكيل سوق تم ملؤه من قبل لاعبين آخرين.
الجيل الثاني من SmartNIC القائم على FPGA آخذ في الظهور الآن. لقد نضجت تقنية مصفوفة البوابة القابلة للبرمجة من قبل المستخدم لدرجة أنها يمكن أن تصبح الآن التقنية الأساسية لشبكات SmartNIC. قبل عقد من الزمان ، كان السوق مغمورًا فعليًا بمسرعات الرسومات - كانت هذه أول موجة مهمة في تقنية تسريع الأجهزة. الآن بعد أن تجاوزت FPGAs علامة الثلاثة ملايين كتلة منطقية ، تم دمج هذه الشرائح بإحكام مع وحدات بناء أخرى للتعامل مع حركة مرور الشبكة والذاكرة والتخزين ونواة الحساب. تكمل تقنيات SmartNIC و FPGA بعضهما البعض بشكل مثالي.
على هذه الخلفية ، يمكن توقع موجة ثانية من مسرعات الأجهزة. ثم سيتم إضافة العنصر الثالث ، DPU ، إلى مجموعة وحدة المعالجة المركزية + وحدة معالجة الرسومات. سيحرر معالج البيانات معالجات الخادم من مهام البنية التحتية. تظهر الأبحاث أنه في البيئات الافتراضية للغاية ، يمكن أن تستهلك عمليات الشبكة مثل معاملات OvS أكثر من 30٪ من وقت وحدة المعالجة المركزية على المضيف. تخيل أن عمليات القرص ، والتشفير ، و DPI ، والتوجيه المعقد تتم في وحدة منفصلة. من المحتمل أن يؤدي هذا إلى إزالة جزء كبير من حمل وحدة المعالجة المركزية.
واجهت الشركات الناشئة مثل Pensando و Fungible رواد التكنولوجيا مثل Xilinx و Intel و Broadcom و Nvidia مع ابتكاراتهم. هذه مسابقة تكنولوجية ممتعة دائمًا لمشاهدتها.