DeepSeek היא חברת בינה מלאכותית (AI) סינית שהציע חלופה זולה ואפקטיבית ל-ChatGPT ומודלי בינה מלאכותית של גוגל, מטא וחברות אחרות. בתוך כמה ימים מהשקת המודל DeepSeek-R1, האפליקציה החינמית נעשתה לפופולרית ביותר בחנות האפליקציות של אפל. השקת המודל השפיעה גם על הבורסה בארצות הברית והובילה למחיקה של כטריליון דולר ממדד הטכנולוגיה ולנפילה של המניות של חברת נבידיה, יצרנית השבבים המובילה למודלי AI. זאת ועוד, בעקבות חשד למתקפת סייבר בהיקף עצום, DeepSeek עצרה זמנית הרשמה של משתמשים חדשים.
בכתבה הזאת ננסה להסביר מה זה Deep Seek, במה הוא שונה מכלי בינה מלאכותית אחרים, ולמה השקתו יצרה תגובת שרשרת כזו.
רקע כללי – מה זה DeepSeek?
DeepSeek-R1הוא מודל AI Reasoning, כלומר, הוא תוכנת לפתור בעיות מורכבות במתמטיקה, לוגיקה ותכנות. לפי הדיווחים, הושקעו רק 6 מיליון דולר בפיתוחו, סכום זניח בהשוואה למאות מיליוני הדולרים שהושקעו בפיתוח של מודלים דומים בחברות מתחרות. אף על פי כן, הביצועים של דיפסיק משתווים לאלה של OpenAI o1, מודל ה-AI המתקדם ביותר עד כה של חברת OpenAI, ואף עוברים אותם. למשל, שיעורי ההצלחה של דיפסיק במענה על 20 השאלות בהארץ היו גבוהים יותר מאלו של ChatGPT ואחרים.
המאפיינים של DeepSeek
דיפסיק מבוסס על שיטה המכונה Chain of Thoughts (CoT), שבה המודל מחלק כל בעיה לשלבים קצרים ולמעשה מפרט את רצף המחשבות או הצעדים המובילים לפתרון. המודל גם יכול להתאים ולשנות את התשובות בזמן אמת ולהגיע לתובנות תוך כדי מחשבה, קצת בדומה לצורת החשיבה של בני אדם.
DeepSeek-R1 הוא מודל בקוד פתוח לחלוטין. המשמעות היא שכל אחד יכול להשתמש בו ולשנות את הקוד. בזכות התכונה הזאת, המודל מעורר עניין בקרב עסקים, חברות סטארט-אפ ומפתחים המחפשים פתרונות מבוססי AI במחירים סבירים.
המחיר הוא גורם נוסף המשפיע על העלייה בפופולריות של DeepSeek. נכון לעכשיו הוא זמין בחינם בקישור chat.deepseek.com או בחנויות האפליקציות. כמו כן, אפשר להריץ אותו על המחשב ללא עלות, וגם יש API מבוסס ענן במחירים נמוכים מהמקובל בענף.
לסיכום, ההשקה של DeepSeek-R1 היא אבן דרך נוספת במירוץ לבינה המלאכותית. אומנם המודל עדיין לא מתחרה ב-ChatGPT ודומיו בכל היבט, אבל הוא מציע חלופה חסכונית ויעילה לכלי בינה מלאכותית ותיקים אחרים. ומכיוון שהמודל הוא בקוד פתוח, הוא עוד צפוי להשתנות ולהשתפר.