Nvidia, AMD และการแข่งขันด้านการประมวลผลครั้งใหม่
อุตสาหกรรมเทคโนโลยีทั่วโลกกำลังเผชิญกับการเปลี่ยนแปลงครั้งใหญ่ในเรื่องการกำหนดและกระจายพลังการประมวลผล หลายทศวรรษที่ผ่านมา CPU คือหัวใจหลักของทุกเครื่อง แต่ยุคนั้นได้จบลงแล้ว ปัจจุบันความสนใจได้เปลี่ยนไปสู่ซิลิคอนเฉพาะทางที่ออกแบบมาเพื่อรองรับงานคำนวณมหาศาลที่จำเป็นสำหรับ AI สมัยใหม่ นี่ไม่ใช่แค่การแข่งขันว่าใครจะผลิตชิ้นส่วนได้เร็วกว่ากัน แต่เป็นการต่อสู้เพื่อแย่งชิงความได้เปรียบในการประมวลผล Nvidia และ AMD คือตัวละครหลักในเรื่องราวที่มากกว่าแค่เรื่องฮาร์ดแวร์ แต่มันคือการควบคุมโครงสร้างพื้นฐานที่จะกำหนดทิศทางการพัฒนาซอฟต์แวร์ในทศวรรษหน้า เดิมพันครั้งนี้สูงมากเพราะผู้ชนะไม่ได้แค่ขายสินค้า แต่พวกเขากำลังสร้างแพลตฟอร์มที่คนอื่นต้องใช้งานเพื่อให้ยังคงอยู่ในเกมได้ การเปลี่ยนผ่านจากการประมวลผลทั่วไปไปสู่การประมวลผลแบบเร่งความเร็ว (Accelerated Computing) ถือเป็นการเปลี่ยนแปลงขั้นพื้นฐานในลำดับชั้นของโลกเทคโนโลยี
โค้ดล่องหนที่ล่ามโซ่ระบบ Cloud
เพื่อให้เข้าใจว่าทำไมบริษัทหนึ่งถึงครองพื้นที่นี้ได้ เราต้องมองให้ไกลกว่าแค่ตัวชิป คนส่วนใหญ่มักโฟกัสที่จำนวนทรานซิสเตอร์หรือความเร็ว Clock speed ของ GPU แต่ความแข็งแกร่งที่แท้จริงกลับอยู่ที่ชั้นซอฟต์แวร์ที่คั่นกลางระหว่างฮาร์ดแวร์กับนักพัฒนา Nvidia ใช้เวลาเกือบสองทศวรรษในการสร้างสภาพแวดล้อมเฉพาะตัวที่เรียกว่า CUDA ซึ่งช่วยให้นักเขียนโปรแกรมสามารถใช้พลังการประมวลผลแบบขนานของ GPU สำหรับงานที่ไม่เกี่ยวกับกราฟิกได้ เนื่องจากโค้ดที่มีอยู่จำนวนมหาศาลถูกเขียนขึ้นเพื่อสภาพแวดล้อมนี้โดยเฉพาะ การย้ายไปใช้คู่แข่งจึงไม่ใช่แค่การเปลี่ยนการ์ดจอ แต่มันต้องเขียนคำสั่งซับซ้อนใหม่หลายพันบรรทัด นี่คือ software moat หรือคูเมืองซอฟต์แวร์ที่ป้องกันไม่ให้คู่แข่งที่มีเงินทุนหนาเข้ามาแย่งส่วนแบ่งได้ง่ายๆ มันสร้างสถานการณ์ที่ฮาร์ดแวร์กลายเป็นเหมือนตั๋วเข้าสู่ระบบนิเวศซอฟต์แวร์เฉพาะทาง
AMD กำลังพยายามแก้เกมด้วยแนวทาง Open Source ที่เรียกว่า ROCm กลยุทธ์ของพวกเขาคือการเป็นทางเลือกที่ใช้งานได้จริงโดยไม่ผูกมัดนักพัฒนาไว้กับผู้ขายรายเดียว แม้ฮาร์ดแวร์รุ่นล่าสุดอย่างซีรีส์ MI300 จะมีประสิทธิภาพดิบที่น่าประทับใจ แต่ช่องว่างด้านซอฟต์แวร์ยังคงเป็นอุปสรรคสำคัญ นักพัฒนาหลายคนพบว่าเครื่องมือและไลบรารีล่าสุดมักถูกปรับแต่งให้รองรับ Nvidia ก่อน ทำให้แพลตฟอร์มอื่นต้องวิ่งไล่ตาม พลวัตนี้ยิ่งตอกย้ำความเหนือกว่าของเจ้าตลาด หากคุณเป็นวิศวกรที่ต้องการรันโมเดลในวันนี้ คุณย่อมเลือกที่ที่มีเอกสารครบถ้วนที่สุดและบั๊กถูกจัดการไปหมดแล้ว คุณสามารถดูรายละเอียดเพิ่มเติมเกี่ยวกับ ความก้าวหน้าในสถาปัตยกรรม GPU ได้ผ่านเอกสารทางเทคนิคอย่างเป็นทางการ การเข้าใจ โครงสร้างพื้นฐานสำหรับปัญญาประดิษฐ์ เป็นสิ่งจำเป็นสำหรับทุกคนที่ต้องการคาดการณ์ว่านวัตกรรมระลอกต่อไปจะมาจากไหน การแข่งขันในตอนนี้จึงเป็นเรื่องของประสบการณ์นักพัฒนาพอๆ กับเรื่องของซิลิคอนเลยทีเดียว
การผูกขาดทางภูมิรัฐศาสตร์ในโลกแห่งปัญญา
ผลกระทบของการแข่งขันด้านการประมวลผลนี้ไปไกลกว่างบการเงินใน Silicon Valley เรากำลังเห็นการกระจุกตัวของอำนาจที่เทียบได้กับการผูกขาดน้ำมันในศตวรรษที่ 20 กลุ่มบริษัท Hyperscalers ไม่ว่าจะเป็น Microsoft, Amazon และ Google คือผู้ซื้อรายใหญ่ของชิปประสิทธิภาพสูงเหล่านี้ สิ่งนี้สร้างวงจรป้อนกลับที่บริษัทใหญ่ที่สุดได้รับฮาร์ดแวร์ที่ดีที่สุดก่อน ทำให้พวกเขาสามารถสร้างโมเดลที่ทรงพลังยิ่งขึ้น ซึ่งก็นำไปสู่รายได้ที่มากขึ้นเพื่อกลับไปซื้อฮาร์ดแวร์เพิ่มขึ้นอีก การกระจุกตัวของทรัพยากรนี้หมายความว่าผู้เล่นรายย่อยและแม้แต่บางประเทศกำลังพบว่าตัวเองอยู่ผิดฝั่งของช่องว่างที่กว้างขึ้นเรื่อยๆ ผู้ที่มีสิทธิ์เข้าถึงคลัสเตอร์การประมวลผลขนาดใหญ่สามารถสร้างนวัตกรรมในอัตราที่คนไม่มีสิทธิ์เข้าถึงทำไม่ได้ นำไปสู่ระบบสองมาตรฐานในอุตสาหกรรมเทคโนโลยี: กลุ่มที่รวยการประมวลผลและกลุ่มที่จนการประมวลผล
รัฐบาลเริ่มตระหนักถึงความไม่สมดุลนี้ ซิลิคอนถูกมองว่าเป็นสินทรัพย์เชิงยุทธศาสตร์ที่มีความสำคัญระดับชาติ มีการใช้มาตรการจำกัดการส่งออกเพื่อป้องกันไม่ให้ชิปขั้นสูงเข้าถึงบางภูมิภาค โดยใช้ฮาร์ดแวร์เป็นเครื่องมือทางนโยบายต่างประเทศ ข้อจำกัดเหล่านี้ไม่ใช่แค่เรื่องการป้องกันการใช้งานทางทหาร แต่เป็นเรื่องของการรับประกันว่าผลประโยชน์ทางเศรษฐกิจจากซอฟต์แวร์ยุคหน้าจะยังคงอยู่ภายในพรมแดนที่กำหนด ห่วงโซ่อุปทานของชิปเหล่านี้ยังเปราะบางอย่างยิ่ง การผลิตขั้นสูงส่วนใหญ่เกิดขึ้นในสถานที่เดียวในไต้หวัน ซึ่งสร้างจุดเปราะบางจุดเดียว (Single point of failure) สำหรับเศรษฐกิจโลกทั้งหมด ในอดีตเราเห็นแล้วว่าข้อจำกัดด้านอุปทานสามารถหยุดการผลิตในหลายอุตสาหกรรมได้ หากการไหลเวียนของ GPU ระดับไฮเอนด์หยุดชะงัก การพัฒนาซอฟต์แวร์สมัยใหม่ก็จะหยุดชะงักตามไปด้วย การพึ่งพาบริษัทเพียงไม่กี่แห่งและพันธมิตรการผลิตเพียงรายเดียวเป็นความเสี่ยงที่นักวิเคราะห์หลายคนเชื่อว่าตลาดยังไม่ได้ประเมินราคาไว้อย่างครบถ้วน ตามรายงานจาก Reuters ช่องโหว่ในห่วงโซ่อุปทานเหล่านี้ถือเป็นลำดับความสำคัญสูงสุดสำหรับหน่วยงานกำกับดูแลการค้าโลก
ราคาที่ต้องจ่ายของความหิวกระหายการประมวลผล
ลองพิจารณาความเป็นจริงในแต่ละวันของผู้ก่อตั้ง Startup ในสภาพแวดล้อมปัจจุบัน ความกังวลหลักของพวกเขาไม่ใช่แค่การจ้างคนเก่งหรือการหา Product-market fit อีกต่อไป แต่พวกเขากลับใช้เวลาส่วนใหญ่ไปกับการเจรจาเพื่อขอเช่าเวลาเซิร์ฟเวอร์ ในวันปกติ ผู้ก่อตั้งอาจเริ่มจากการตรวจสอบอัตราการเผาผลาญเงิน (Burn rate) แล้วพบว่าเงินทุนส่วนใหญ่ไหลไปที่ผู้ให้บริการ Cloud เพื่อเช่าสิทธิ์เข้าถึงคลัสเตอร์ H100 พวกเขาไม่สามารถซื้อชิปโดยตรงได้เพราะต้องรอคิวนานหลายเดือน และพวกเขาไม่มีโครงสร้างพื้นฐานด้านความเย็นเพียงพอที่จะรันเครื่องเองได้ พวกเขาถูกบังคับให้รอในคิวแบบดิจิทัล โดยหวังว่าลูกค้าที่ใหญ่กว่าจะไม่ตัดหน้าแย่งสิทธิ์เข้าถึงไป นี่เป็นภาพที่ต่างจากยุคแรกของอินเทอร์เน็ตที่เซิร์ฟเวอร์ราคาถูกไม่กี่ตัวก็สามารถรองรับแพลตฟอร์มระดับโลกได้ ราคาเริ่มต้นสำหรับการพัฒนาจริงจังได้ขยับจากหลักพันดอลลาร์ไปเป็นหลักล้านแล้ว
วันเวลาผ่านไปพร้อมกับการต่อสู้กับหนี้ทางเทคนิค (Technical debt) เนื่องจากพวกเขาใช้ฮาร์ดแวร์เช่า พวกเขาจึงต้องปรับแต่งทุกวินาทีของเวลาในการเทรนโมเดล หากงานล้มเหลวเพราะข้อผิดพลาดเล็กน้อยในโค้ด มันอาจหมายถึงการสูญเสียเงินหลายพันดอลลาร์ไปกับการประมวลผลที่เสียเปล่า แรงกดดันนี้ขัดขวางการทดลอง นักพัฒนาจึงไม่ค่อยกล้าลองไอเดียใหม่ๆ ที่สุดโต่งเมื่อราคาของความล้มเหลวมันสูงเกินไป
BotNews.today ใช้เครื่องมือ AI ในการวิจัย เขียน แก้ไข และแปลเนื้อหา ทีมงานของเราตรวจสอบและดูแลกระบวนการเพื่อให้ข้อมูลมีประโยชน์ ชัดเจน และน่าเชื่อถือ
ภาษีแฝงของซิลิคอนเฉพาะทาง
เมื่อเราเข้าสู่ยุคของการประมวลผลแบบเร่งความเร็วมากขึ้น เราต้องตั้งคำถามที่ยากเกี่ยวกับผลกระทบในระยะยาว มันเป็นเรื่องดีหรือไม่ที่รากฐานของเทคโนโลยีสมัยใหม่ถูกควบคุมโดยองค์กรจำนวนน้อยขนาดนี้? เมื่อบริษัทหนึ่งจัดหาทั้งฮาร์ดแวร์ สภาพแวดล้อมซอฟต์แวร์ และระบบเชื่อมต่อเครือข่าย พวกเขาก็เป็นเจ้าของทั้ง Stack อย่างแท้จริง สิ่งนี้สร้างภาษีแฝงต่อนวัตกรรม นักพัฒนาทุกคนที่เขียนโค้ดสำหรับระบบปิดกำลังมีส่วนช่วยสร้างการผูกขาดที่ยากจะทำลายลงได้ในแต่ละวัน จะเกิดอะไรขึ้นกับความเป็นส่วนตัวของข้อมูลเมื่อต้องผ่านชิปเฉพาะทางเหล่านี้ในสภาพแวดล้อม Cloud ที่ใช้ร่วมกัน? แม้ผู้ให้บริการจะอ้างว่าข้อมูลถูกแยกส่วน แต่ความเป็นจริงทางกายภาพของซิลิคอนที่ใช้ร่วมกันชี้ให้เห็นว่าการโจมตีแบบ Side-channel รูปแบบใหม่ๆ อาจเกิดขึ้นได้ เรากำลังแลกความโปร่งใสกับประสิทธิภาพ และราคาที่แท้จริงของการแลกเปลี่ยนนั้นยังไม่มีใครรู้
นอกจากนี้ยังมีคำถามเรื่องความยั่งยืนด้านสิ่งแวดล้อม ความต้องการพลังงานสำหรับศูนย์ข้อมูลใหม่เหล่านี้สูงจนน่าตกใจ เรากำลังสร้างอาคารขนาดมหึมาที่ต้องการไฟฟ้าเท่ากับเมืองเล็กๆ เพียงเพื่อทำการคูณเมทริกซ์ นี่เป็นเส้นทางที่ยั่งยืนสำหรับโลกหรือไม่? หากความต้องการโมเดลเหล่านี้ยังคงเติบโตในอัตราปัจจุบัน เราจะถึงขีดจำกัดทางกายภาพของพลังงานที่เราสามารถจัดหาได้ในที่สุด ยิ่งไปกว่านั้น จะเกิดอะไรขึ้นหากความตื่นเต้นในปัจจุบันเกี่ยวกับเทคโนโลยีเหล่านี้ถึงจุดอิ่มตัว? เรากำลังอยู่ในช่วงของการสร้างขยายตัวครั้งใหญ่ แต่ถ้าผลตอบแทนทางเศรษฐกิจไม่เกิดขึ้นจริงสำหรับบริษัทที่ซื้อชิปเหล่านี้ เราอาจเห็นการปรับฐานที่ฉับพลันและรุนแรง หนี้ที่ก่อขึ้นเพื่อสร้างโครงสร้างพื้นฐานนี้ยังคงต้องได้รับการชำระ ไม่ว่าซอฟต์แวร์ที่รันอยู่จะทำกำไรหรือไม่ เราต้องพิจารณาว่าเรากำลังสร้างรากฐานบนผืนทรายหรือการเปลี่ยนแปลงถาวรในวิถีชีวิตของโลกกันแน่
เจาะลึกเครื่องยนต์ AI
สำหรับผู้ที่ต้องการเข้าใจข้อจำกัดทางเทคนิค เรื่องราวนี้เป็นมากกว่าแค่ GPU คอขวดในการประมวลผลสมัยใหม่ได้เปลี่ยนจากหน่วยประมวลผลไปสู่หน่วยความจำและระบบเชื่อมต่อ (Interconnect) หน่วยความจำแบนด์วิดท์สูง หรือ HBM3e คือส่วนประกอบที่เป็นที่ต้องการมากที่สุดในโลกขณะนี้ มันช่วยให้หน่วยประมวลผลเข้าถึงข้อมูลด้วยความเร็วที่ไม่เคยมีมาก่อน หากไม่มีหน่วยความจำนี้ GPU ที่เร็วที่สุดก็จะนั่งว่างรอข้อมูลมาถึง นี่คือเหตุผลว่าทำไมข้อจำกัดด้านอุปทานจึงยังคงอยู่ มันไม่ใช่แค่เรื่องการผลิตชิปให้มากขึ้น แต่เป็นเรื่องของการประสานงานการผลิตชิ้นส่วนที่ซับซ้อนหลายอย่างจากซัพพลายเออร์ที่แตกต่างกัน ในปีนี้ ความพร้อมใช้งานของหน่วยความจำนี้อาจเป็นตัวกำหนดผลผลิตรวมของทั้งอุตสาหกรรม นี่คือขีดจำกัดทางกายภาพที่ซอฟต์แวร์ไม่สามารถเอาชนะได้ง่ายๆ
ระบบเครือข่ายคืออีกชิ้นส่วนสำคัญของจิ๊กซอว์ เมื่อคุณกำลังเทรนโมเดลข้าม GPU หลายพันตัว ความเร็วที่ชิปเหล่านั้นสื่อสารกันได้จะกลายเป็นปัจจัยชี้ขาดประสิทธิภาพ Nvidia ใช้ระบบเชื่อมต่อเฉพาะที่เรียกว่า NVLink ซึ่งให้ Throughput สูงกว่า Ethernet มาตรฐาน นี่เป็นอีกชั้นของคูเมือง แม้คู่แข่งจะสร้างชิปที่เร็วกว่าได้ในเชิงเดี่ยว แต่พวกเขาก็ไม่สามารถเทียบประสิทธิภาพของคลัสเตอร์ได้หากระบบเครือข่ายช้ากว่า ผู้ใช้งานระดับสูง (Power users) ยังต้องรับมือกับข้อจำกัดของ API ที่เข้มงวดและความเป็นจริงของคอขวดในการจัดเก็บข้อมูลในเครื่อง แม้จะมีพลังประมวลผลที่เร็วที่สุด แต่การย้ายข้อมูลระดับ Terabytes เข้าสู่คลัสเตอร์ก็ยังเป็นกระบวนการที่ช้าและมีค่าใช้จ่ายสูง ปัจจัยต่อไปนี้คือข้อจำกัดทางเทคนิคหลักสำหรับผู้ใช้งานระดับไฮเอนด์ในปัจจุบัน:
- ความอิ่มตัวของแบนด์วิดท์หน่วยความจำระหว่างงาน Inference ขนาดใหญ่
- การลดความเร็วเนื่องจากความร้อน (Thermal throttling) ในการจัดวาง Rack ความหนาแน่นสูง
- ความหน่วงของระบบเชื่อมต่อ (Interconnect latency) เมื่อขยายขนาดเกินกว่าหนึ่ง Pod
- ต้นทุนสูงของที่เก็บข้อมูลแบบถาวรใกล้กับโหนดประมวลผล
องค์กรส่วนใหญ่พบว่าพวกเขาไม่สามารถรันภาระงานเหล่านี้ในเครื่องตัวเองได้ ความต้องการด้านพลังงานและการระบายความร้อนเฉพาะทางนั้นเกินขีดความสามารถของศูนย์ข้อมูลมาตรฐาน สิ่งนี้บังคับให้ต้องพึ่งพาผู้ให้บริการเฉพาะไม่กี่รายที่มีเงินทุนในการสร้างสภาพแวดล้อมแบบสั่งทำพิเศษเหล่านี้ ส่วนของ Geek ในตลาดไม่ใช่เรื่องของการประกอบเครื่องเองอีกต่อไป แต่เป็นเรื่องของการเข้าใจตัวเลือกการตั้งค่าของ Virtual machine ในสถานที่ห่างไกล การเปลี่ยนผ่านจากฮาร์ดแวร์ในเครื่องไปสู่ Cloud compute แบบนามธรรมเกือบจะสมบูรณ์แล้วสำหรับภาระงานระดับไฮเอนด์
บทสรุปของสงครามซิลิคอน
การแข่งขันระหว่าง Nvidia และ AMD ไม่ใช่การประลองความเร็วแบบง่ายๆ แต่มันคือการต่อสู้เพื่ออนาคตของแพลตฟอร์มการประมวลผล Nvidia มีความได้เปรียบมหาศาล ไม่ใช่แค่เพราะฮาร์ดแวร์ แต่เพราะพวกเขาประสบความสำเร็จในการผูกมัดชุมชนนักพัฒนาไว้กับระบบนิเวศซอฟต์แวร์ของตน AMD กำลังต่อสู้ในศึกที่ยากลำบากด้วยการส่งเสริมมาตรฐานเปิด แต่พวกเขาก็เผชิญกับความท้าทายสำคัญในการเอาชนะความเฉื่อยของฐานโค้ดที่มีอยู่ ผู้ชนะที่แท้จริงจนถึงตอนนี้คือกลุ่ม Hyperscalers ที่มีเงินทุนซื้อซิลิคอนเหล่านี้ในปริมาณมาก ซึ่งยิ่งรวมศูนย์อำนาจในอุตสาหกรรมเทคโนโลยีมากขึ้นไปอีก สำหรับผู้ใช้หรือนักพัฒนาทั่วไป เดิมพันนี้เป็นเรื่องที่จับต้องได้ เรากำลังเห็นต้นทุนของนวัตกรรมที่สูงขึ้นและการเกิดขึ้นของ Gatekeeper รูปแบบใหม่ สงครามซิลิคอนกำลังเขียนกฎใหม่ของเศรษฐกิจโลก และเราเพิ่งอยู่ในช่วงเริ่มต้นของการเห็นผลกระทบที่แท้จริงเท่านั้น ความสนใจต้องยังคงอยู่ที่ว่าการกระจุกตัวของอำนาจนี้ตอบสนองผลประโยชน์ในวงกว้างของสังคม หรือเพียงแค่ผลประโยชน์ของเจ้าของชิปเท่านั้น
หมายเหตุจากบรรณาธิการ: เราสร้างเว็บไซต์นี้ขึ้นมาเพื่อเป็นศูนย์กลางข่าวสารและคู่มือ AI หลายภาษาสำหรับผู้ที่ไม่ได้เป็นผู้เชี่ยวชาญคอมพิวเตอร์ แต่ยังคงต้องการทำความเข้าใจปัญญาประดิษฐ์ ใช้งานได้อย่างมั่นใจมากขึ้น และติดตามอนาคตที่กำลังจะมาถึงแล้ว
พบข้อผิดพลาดหรือสิ่งใดที่ต้องแก้ไขหรือไม่? แจ้งให้เราทราบ