Nvidia, פנים מחבקות ו שירות עכשיו דוחפים את הרף ב-AI ליצירת קוד עם StarCoder2, משפחה חדשה של דגמי שפות גדולות בגישה פתוחה (LLM).
המודלים זמינים היום בשלושה גדלים שונים, הוכשרו ביותר מ-600 שפות תכנות, כולל שפות בעלות משאבים נמוכים, כדי לסייע לארגונים להאיץ משימות שונות הקשורות לקוד בתהליכי העבודה שלהם בפיתוח. הם פותחו מתחת לשטח הפתוח פרויקט BigCode, מאמץ משותף של ServiceNow ו-Huging Face כדי להבטיח פיתוח אחראי ושימוש במודלים שפות גדולים לקוד. הם זמינים ללא תמלוגים תחת רישיונות בינה מלאכותית פתוחה (OpenRAIL).
"StarCoder2 מהווה עדות לכוח המשולב של שיתוף פעולה מדעי פתוח ופרקטיקות בינה מלאכותית אחראית עם שרשרת אספקת נתונים אתית. מודל הגישה הפתוחה המתקדם משפר את ביצועי הבינה המלאכותית הקודמים כדי להגדיל את פרודוקטיביות המפתחים ומספק למפתחים גישה שווה ליתרונות של יצירת קוד בינה מלאכותית, מה שבתורו מאפשר לארגונים בכל גודל לעמוד ביתר קלות בעסק המלא שלהם פוטנציאל", אמר Harm de Vries, ראש צוות הפיתוח StarCoder2 של ServiceNow ושותף של BigCode, בהצהרה.
StarCoder2: שלושה דגמים לשלושה צרכים שונים
בעוד שה-StarCoder LLM המקורי של BigCode הופיע לראשונה בגודל אחד של פרמטרים של 15B והוכשר בכ-80 שפות תכנות, הדור האחרון הוא צעד מעבר לו עם דגמים בשלושה גדלים שונים – 3B, 7B ו-15B – והדרכה על 619 שפות תכנות. על פי BigCode, נתוני ההדרכה של הדגמים החדשים, הידועים בשם המחסניתהיה גדול יותר משבעה מזה שהיה בשימוש בפעם הקודמת.
אירוע VB
סיור AI Impact – ניו יורק
אנחנו נהיה בניו יורק ב-29 בפברואר בשיתוף עם מיקרוסופט כדי לדון כיצד לאזן את הסיכונים והתגמולים של יישומי בינה מלאכותית. בקש הזמנה לאירוע הבלעדי למטה.
לבקש הזמנה
חשוב מכך, קהילת BigCode השתמשה בטכניקות אימון חדשות עבור הדור האחרון כדי להבטיח שהמודלים יוכלו להבין וליצור שפות תכנות בעלות משאבים נמוכים כמו COBOL, מתמטיקה ודיונים בקוד המקור של התוכניות.
הדגם הקטן ביותר של 3 מיליארד פרמטרים הוכשר באמצעות המסגרת של Fast LLM של ServiceNow, בעוד שהדגם 7B פותח עם מסגרת הננוטרון של Hugging Face. שניהם שואפים לספק ביצועים גבוהים של טקסט לקוד וטקסט לזרימת עבודה תוך צורך בפחות מחשוב.
בינתיים, הדגם הגדול ביותר…