DeepSeek, Perplexity והגל הבא של מאתגרי ה-AI
עידן המונופול היקר של הבינה המלאכותית מגיע לסיומו. בשנתיים האחרונות, התעשייה פעלה תחת ההנחה שביצועים ברמה הגבוהה ביותר דורשים מיליארדי דולרים בכוח מחשוב וצריכת אנרגיה מסיבית. DeepSeek ו-Perplexity מוכיחות כעת שיעילות יכולה לנצח קנה מידה גולמי. DeepSeek הדהימה את השוק כשהשיקה מודלים שמשתווים בביצועיהם למובילי התעשייה בשבריר מעלות האימון. בינתיים, Perplexity משנה מהיסוד את האופן שבו אנשים מתקשרים עם האינטרנט, כשהיא מחליפה את רשימת הקישורים המסורתית בתשובות ישירות ומגובות במקורות. השינוי הזה הוא לא רק על כלים חדשים, אלא על שינוי מהותי בכלכלה של הבינה המלאכותית. המיקוד עבר מהשאלה כמה גדול יכול להיות מודל, לשאלה כמה מעט הוא יכול לעלות להרצה. ככל שהמאתגרים הללו צוברים תאוצה, הענקיות המבוססות נאלצות להגן על המודלים העסקיים שלהן בעלי הרווח הגבוה מול גל של מתחרים רזים וממוקדים שמעדיפים תועלת על פני הייפ.
הלם היעילות בשוק הבינה המלאכותית
DeepSeek מייצגת שינוי במציאות המוצר של עולם ה-AI. בעוד חברות רבות מתמקדות בבניית רשתות נוירונים גדולות ככל האפשר, הצוות הזה התמקד באופטימיזציה ארכיטקטונית. מודל ה-DeepSeek-V3 שלהם משתמש בגישת Mixture of Experts שמפעילה רק חלק קטן מסך הפרמטרים עבור כל משימה נתונה. זה מאפשר למודל לשמור על ביצועים גבוהים תוך הפחתה דרסטית של כוח המחשוב הנדרש עבור כל מילה שהוא מייצר. הנרטיב סביב החברה הזו מתמקד לעיתים קרובות בתקציב האימון הנמוך שלה, שעל פי הדיווחים עומד על פחות משישה מיליון דולר. נתון זה מאתגר את הרעיון שרק המדינות והתאגידים העשירים ביותר יכולים לבנות מודלים פורצי דרך. הוא מציע שחסם הכניסה ללמידת מכונה ברמה גבוהה נמוך ממה שחשבנו קודם לכן.
Perplexity ניגשת לבעיה מנקודת המבט של ממשק המשתמש. זהו מנוע תשובות ולא מנוע חיפוש מסורתי. הוא משתמש במודלי שפה גדולים קיימים כדי לסרוק את הרשת החיה, לחלץ מידע רלוונטי ולהציג אותו בפסקה מגובשת עם הערות שוליים. בחירה עיצובית זו מטפלת בחולשה העיקרית של מודלי AI סטנדרטיים, שהיא הנטייה שלהם לקבוע עובדות שאינן מעודכנות או מומצאות לחלוטין. על ידי ביסוס כל תשובה בנתוני רשת בזמן אמת, Perplexity יצרה כלי שמרגיש אמין יותר למחקר מקצועי מאשר צ'אט בוט סטנדרטי. המוצר הוא לא רק המודל עצמו, אלא מערכת השליפה והציטוט שעוטפת אותו. גישה זו מפעילה לחץ עצום על ספקי חיפוש מסורתיים שמסתמכים על הכנסות מפרסום ממשתמשים שלוחצים על דפי תוצאות מרובים.
BotNews.today משתמש בכלי AI כדי לחקור, לכתוב, לערוך ולתרגם תוכן. הצוות שלנו בודק ומפקח על התהליך כדי לשמור על המידע שימושי, ברור ואמין.
הגיאופוליטיקה של מחשוב זול
ההשפעה הגלובלית של המאתגרים הללו נעוצה בדמוקרטיזציה של הסקה (inference) בעלת ביצועים גבוהים. כאשר עלות הרצת מודל יורדת בתשעים אחוז, הפוטנציאל לשילוב בתוכנה יומיומית מתרחב באופן אקספוננציאלי. מפתחים בשווקים מתעוררים, שבעבר תומחרו מחוץ לשימוש ב-APIs מובילים, יכולים כעת לבנות אפליקציות מתוחכמות. זה משנה את מרכז הכובד של התעשייה כולה. אם המודלים היעילים ביותר מגיעים מחוץ למרכזי הסיליקון ואלי המסורתיים, היתרון האסטרטגי של חוות שרתים מקומיות מסיביות מתחיל להצטמצם. זה מחייב שיחה על ריבונות מודלים והאם מדינות צריכות להיות תלויות בכמה ספקים מרכזיים או להשקיע בארכיטקטורות יעילות משלהן. זהו איתות שכדאי לעקוב אחריו כי הוא מסיט את התעשייה מדינמיקה של