- Tesla ने HotChips 2024 में Tesla Transport Protocol over Ethernet (TTPoE) को open source के रूप में सार्वजनिक किया
- Tesla Ultra Ethernet Consortium (UEC) में शामिल हो गई है ताकि इस प्रोटोकॉल को साझा किया जा सके और AI/ML/डेटासेंटर के लिए एक नए high-speed/low-latency fabric को standardize करने पर काम किया जा सके
- TTPoE non-proprietary, low-cost है, और distributed congestion control, standard EthernetII frame, तथा decentralized interconnect protocol को लक्ष्य करता है
- TTPoE की विशेषताएँ
- TCP की तरह packet loss और retransmission की अनुमति है, लेकिन पूरा transmission सुनिश्चित किया जाता है
- TTPoE की शुरुआती deployment Tesla Dojo v1 project में की गई थी
- यह protocol पूरी तरह hardware में चलता है और इसे ऐसे विशाल multi-exaflops(fp16) supercomputer में deploy किया गया है जिसमें एक साथ दसियों हज़ार से अधिक endpoints हैं
- यह protocol CPU या OS के हस्तक्षेप के बिना link को establish और run कर सकता है
- यह protocol जटिल या अत्यधिक चालाक नहीं है, बल्कि बुनियादी सिद्धांतों पर आधारित है
- Ethernet transport का मूल काम A से B तक data को ले जाना है, और इसे केवल physical limits से ही सीमित होना चाहिए
- बहुत बड़े पैमाने के systems में centralized congestion management एक अव्यावहारिक प्रयास है, और हर endpoint को resilient तथा self-managed होना चाहिए
GN⁺ की राय
- TTPoE high-performance computing environment में मौजूदा TCP protocol की सीमाओं को पार करने की एक दिलचस्प कोशिश है
- Hardware offloading और simplified state machine के जरिए latency को न्यूनतम करना और throughput को अधिकतम करना इसका मुख्य लक्ष्य लगता है
- TTPoE में AI और ML क्षेत्र में data transfer speed और latency को बेहतर बनाने की क्षमता है
- Tesla द्वारा इस protocol को open source करना HPC क्षेत्र में innovation को तेज़ करने में मददगार हो सकता है
- हालांकि, TTPoE के लिए सामान्य-purpose network में TCP को पूरी तरह replace करना कठिन दिखता है; यह high-quality dedicated network के लिए optimized solution है. TTPoE के व्यापक adoption के लिए standardization और ecosystem निर्माण महत्वपूर्ण होगा
- समान कार्यक्षमता वाले protocols में RoCE (RDMA over Converged Ethernet) और NVLink शामिल हैं
1 टिप्पणियां
TTPoE के बारे में थोड़ा और विस्तार से बताने वाला एक और लेख है
Tesla’s TTPoE at Hot Chips 2024: Replacing TCP for Low Latency Applications
TTPoE का अवलोकन
TTPoE की आवश्यकता
TTPoE की विशेषताएँ
TTPoE का congestion control
TTPoE hardware implementation
Mojo NIC
सारांश