הצטרפו למנהיגים בבוסטון ב-27 במרץ ללילה בלעדי של נטוורקינג, תובנות ושיחה. בקש הזמנה כאן.
היום, Databricks הודיעה על רכישת לִילָך, סטארט-אפ מחקר יישומי מבוסס בוסטון המציע כלים להבנת נתונים ולמניפולציה. תנאי העסקה לא נחשפו.
ענקית הנתונים בהובלת עלי גודסי מתכננת להביא את הצוות והטכנולוגיה של לילך לפלטפורמת בינת המידע שלה, הידועה בעבר כ-data lakehouse, לתת למשתמשים בדומיינים דרך חלקה יותר לשפר את איכות מערכי הנתונים שלהם לפיתוח מודל שפה גדול באיכות ייצור. (LLM) יישומים.
העסקה באה כמאמץ האחרון של Databricks להפוך לחנות האחת לא רק לנתונים אלא גם לכל מה שנוגע לבינה מלאכותית. רק לאחרונה, היא גם השקיעה סכום לא ידוע ב-Mistral, סטארט-אפ ה-AI הגנרטיבי שהעלה את סבב ה-Seed הגדול באירופה בשנה שעברה והפך לשחקן חזק בתחום ה-Gen AI.
איך לילך תקל על חקר הנתונים
כאשר Databricks רכשה את Mosaic AI בעסקה ענקית בשנה שעברה, החברה העבירה הילוך לעבר עתיד מונע בינה מלאכותית, שבו משתמשים ישתמשו בנתונים המאוחסנים בצורה מאובטחת בפלטפורמה שלה כדי לבנות יישומי בינה מלאכותית. מאז, החברה ביצעה מספר פיתוחים בתחום ואף הפיקה מספר מודלים פתוחים כדי לתת ללקוחות את כל מה שהם צריכים ללקוחות לבנות, לפרוס ולתחזק אפליקציות מודל שפה גדול (LLM) באיכות גבוהה המיועדות למקרי שימוש עסקי שונים.
אירוע VB
סיור האימפקט של AI – אטלנטה
לבקש הזמנה
עם זאת, כפי שנאמר בהרחבה בתעשייה, הנתונים נותרים קריטיים לכל מאמצי הבינה המלאכותית, כולל מערכות LLM. הצוותים צריכים לוודא שיש להם נתונים באיכות גבוהה לאימון המודלים, כמו גם לבחון את ביצועיהם בעולם האמיתי – המכסים היבטים כמו הטיות והזיות. זה מה שלילך עוזרת ותתמודד עם Databricks.
באופן מסורתי, צוותים נאלצו להשתמש בשיטות ידניות גוזלות זמן כדי לחקור נתונים לא מובנים ולטפל בפערים שבהם. לילך, שהוקמה על ידי מהנדסי גוגל לשעבר דניאל סמילקוב וניכיל ת'וראט ב-2023, נותנת מענה לאתגר זה עם פתרון קוד פתוח שניתן להרחבה המציע ממשק משתמש אינטואיטיבי ותכונות מונעות בינה מלאכותית לניתוח, הבנה ושינוי של נתוני טקסט לא מובנים, בקנה מידה.
לפי אתר האינטרנט של החברה, מדעני נתונים וחוקרי בינה מלאכותית יכלו לעשות הרבה עם לילך בטיפול בנתונים לא מובנים, החל מקיבוץ והקצאת קטגוריות למסמכים, ביצוע חיפושים סמנטיים ומילות מפתח ועד זיהוי מידע אישי או כפילויות וביצוע עריכות נדרשות להסרתם ( עם תצוגת השוואה) ולהתאים את מערך הנתונים.
"הצוות שמאחורי לילך בנה במיוחד את המוצר שלהם כדי לאפשר ניתוח של תפוקות מודל עבור הטיה או רעילות, והכנת נתונים עבור RAG וכוונון עדין או הדרכה מוקדמת של LLMs", מנהלי Databricks Matei Zaharia, Naveen Rao, Jonathan Frankle, Hanlin טאנג ואקהיל גופטה כתבו ב פוסט משותף בבלוג.
הם הוסיפו שכל ערימת הטכנולוגיה של לילך תהיה תחת כלי ה- Mosaic AI של Databricks כדי לתת למפתחים דרך לאצור טוב יותר מערכי נתונים עבור מערכות AI מותאמות אישית. אף על פי שהפרטים של האינטגרציה נותרו בלתי נחשפים בשלב זה, היא תעשה את אותה עבודה: תפשט את התאמת הנתונים כדי להקל על צוותים להעריך ולנטר את התפוקות של ה-LLMs שלהם, כמו גם להכין מערכי נתונים עבור RAG, כוונון עדין וקדם -הַדְרָכָה.
"אנו מאמינים שהבאת חווית איסוף הנתונים בזמן אמת והאינטראקטיבית של לילך לפלטפורמה בקנה מידה ארגוני של Databricks תאפשר לעסקים לקבל הרבה יותר נראות ושליטה על הנתונים הלא מובנים שלהם. זה יאפשר מוצרי AI ברמה עולמית הניתנים להתאמה אישית המשרתים את משתמשי הקצה. איחוד כוחות עם Databricks יאפשר למעמד חדש לגמרי של מפתחים ארגוניים לנ