קול קורא להקמת והנגשת מעבדה לאימון מודלים גדולים להאצת מחקרי בינה מלאכותית (AI)
מועד אחרון להגשה
04/03/2025 12:00חטיבות
תשתיות חדשנותתמצית הקול קורא
רשות החדשנות מודיעה על פתיחת הליך להגשת בקשות לקבלת מענק לצורך הקמת והנגשת מעבדת מו”פ להאצת מחקרי בינה מלאכותית (AI) באמצעות אימון מודלים גדולים. המעבדה תשמש להאצת תהליכי מחקר ופיתוח בתחום הבינה המלאכותית, ותספק שירותי מחקר ופיתוח עבור תאגידים ישראליים ו/או מוסדות מחקר ישראליים.
המבקש/ים אשר בקשתו/ם תאושר במסגרת ההליך יפעל/ו מכוח מסלול הטבה מס’ 10 של רשות החדשנות – הקמה והנגשת מעבדות מו”פ ומאגרי מידע לתעשייה (להלן: “מסלול ההטבה“).
תיאור הקול הקורא
קול קורא זה מזמין להגיש בקשות להקמת מעבדת מו”פ להאצת מחקרי בינה מלאכותית (AI), באמצעות אימון מודלים גדולים, וכן למתן שירותים מסייעים למשתמשי המעבדה. המעבדה המוצעת תתמקד באימון מודלים גדולים, והשירותים המסייעים יוכוונו לאפשר שימוש מיטבי בתשתית כחלק מתהליכי מחקר ופיתוח בתחום הבינה המלאכותית. שירותים אלו יכולים לכלול, בין היתר, סיוע בהכנה טיוב והנגשה של נתונים, תכנון תהליכי אימון המודלים ושיטות ניתוח התוצאות. השירותים יינתנו על ידי עובדי מעבדת המו”פ, אשר יהיו בעלי מומחיות בלמידת מכונה, סטטיסטיקה, תכנות ומערכות מידע ובמטרה ליצור פתרונות בתחום הבינה המלאכותית.
מטרת הקול הקורא
הקמה ו/או הנגשה של מעבדת מו”פ במדינת ישראל, אשר תשמש לאימון מודלים גדולים בהיקף של לפחות 2,000 מאיצים או 4,000 Petaflops ברמת דיוק של FP16 כאשר ביצועי המאיץ הבודד המינימליים הינם 2 Petaflops ברמת דיוק של 16FP , זיכרון מאיץ של 80GB, רוחב פס של 2 Tbit/s ומהירות אפקטיבית (Effective Clock Speed) של MHz 1,500 (או יכולת עיבוד כוללת של המחשב בהרכב מאיצים אקוויוולנטי מבחינת חוזק העיבוד, קצב העיבוד, רוחב הפס והזיכרון) בביצוע אימון מודל גדול במהלך כל תקופת התוכנית.
מחצית מכוח העיבוד/מס’ המאיצים הנ”ל יידרש להיות זמינים עבור הלקוחות הזכאים לכל המאוחר עם תום תקופת ההקמה (12 חודשים), זאת תוך מתן הנחה ללקוחות הזכאים. יתרת כוח העיבוד/מס’ המאיצים תידרש להיות זמינה תוך 6 חודשים, לכל המאוחר, מתום תקופת ההקמה. הכל כמפורט להלן.
דוגמאות למאיצים אפשריים הקיימים כיום בשוק, אשר עומדים בדרישות אלה:
- חברת AMD:
MI300X OAM - חברת INTEL:
Intel Gaudi 3 AI - חברת NVIDIA:
Blackwell B100
מובהר, כי הדוגמאות הנ”ל אינן מהוות רשימה סגורה או ממצה של המאיצים האפשריים, אשר יכולים לעמוד בדרישות המפורטות לעיל, והן נועדו לנוחות הקוראים בלבד.
על תשתית זו לכלול את החומרה, התוכנה והשירות הנדרשים ובכלל זה פתרונות תקשורת, תשתיות אחסון, תשתיות קירור, תוכנות scheduler וכלי ניהול ובקרה למשתמשים אשר יפנו למעבדת המו”פ על מנת לבצע בעזרתה אימון של מודל גדול חדש או התאמה של מודל גדול קיים וזאת כשירות יחיד או כחלק מחבילת שירותים. בנוסף, השימוש במאיצים האמורים יינתן ללקוחות הזכאים בהנחה ממחיר השוק, הכל כמפורט להלן.
קהלי יעד
- תאגיד תעשייתי, למשך תקופת הפעילות כמפורט בהוראות מסלול ההטבה.
- קבוצת משתמשים, למשך תקופת הפעילות כמפורט בהוראות מסלול ההטבה.
גובה המענק
סך המענק לבקשה שתאושר במסגרת הליך זה יהא עד 160 מיליון ש”ח לתקופת התוכנית המאושרת, כאשר שיעור המענק המאושר יהא 55% או 66% מתוך התקציב המאושר, כמפורט במסלול ההטבה.
תנאי סף
תנאי הסף כמוגדר בתנאי המסלול:
- התוכנית תתבצע בישראל
- התוכנית המאושרת תעשה בידי המבקש או בידי מי שהמבקש ציין בתכנית
- אין למגיש הבקשה בקשה למימון תכנית זהה במלואה/בחלקה באחד ממסלולי ההטבה של הרשות האחרים
- לא התקבל, לשם ביצוע התכנית, סיוע מימוני מגורם ממשלתי או מרשות החדשנות, במישרין או בעקיפין
- המבקש אינו בעל חשבונות מוגבלים ואינו נמצא בתהליך כינוס נכסים
- המבקש ובעלי השליטה בו עומדים בדרישות תקנות לעידוד מחקר ופיתוח בתעשייה )התניית אישורים – שכר מינימום(, התשע”א.2011
- כל האמור בעמוד זה, לרבות לעניין הגשת הבקשות, בחינתן, ההחלטה בדבר אישור או דחיה של בקשות, מתן הטבות והחובות והזכויות של מקבל הטבה, כגון בקשר לידע וקניין רוחני, דיווח ותשלום תמלוגים, יהיו בהתאם לאמור בנהלים, בחוק החדשנות, מסלול ההטבה הרלוונטי והכללים והנהלים שנקבעו מכוחם (לרבות אלו המופיעים באזור נהלי המסלול).
- התוכנית לא תתבצע על פי הזמנה של אחר שאינו המבקש
- המבקש התחייב כי יהיה הבעלים בידע שנובע ממחקר ופיתוח
אמות המידה להערכת הבקשה
כמוגדר בתנאי המסלול:
- קיים צורך טכנולוגי משמעותי עבור ציוד התשתית לתהליכי המו”פ של התאגידים והתעשייה ככלל – כולל בחינת הצורך באמצעות ביצוע סקר שוק מקדים עבור ציוד המו”פ המבוקש, טרם הגשת הבקשה תוך הוכחת הצורך ותרומתו המשמעותית למו”פ התעשייה הישראלית
- קיום כשל שוק או מגבלה בנגישות המונעת רכישה ושימוש בתשתית המו”פ ללא סיוע הרשות.
- החדשנות הטכנולוגית שתתאפשר לתעשייה בישראל באמצעות הנגישות לתשתית המו”פ, ובכלל זה היותה משמעותית ביחס לחדשנות הטכנולוגית הקיימת בתעשייה כיום.
- הוכחת יכולות ניהול והשלמת התוכנית העסקית של מגישי הבקשה.
- התרומה הטכנולוגית והתעסוקתית של התוכנית מושא הבקשה לכלכלה הישראלית
- הפוטנציאל העסקי הגלום בתיק בדג על הצמיחה הכלכלית של המבקש בעקבות בקשה זו.
- תנאי השימוש בציוד התשתית לתאגידים התעשייתיים, ובכללם המחיר וזמינות השירותים.
דרישות בנוגע להקמת והפעלת המעבדה:
בהתאם לאמור בהוראות מסלול ההטבה, על המעבדה יהא לעמוד בדרישות המפורטות להלן:
- מפרט טכני של התשתית:
- התשתית, שתוקם במדינת ישראל, תאפשר אימון מודלים גדולים בביצועי מאיץ בודד מינימליים 2 Petaflops ברמת דיוק של FP16, זיכרון מאיץ של 80GB, רוחב פס של 2 Tbit/s ומהירות אפקטיבית (Effective Clock Speed) של MHz 1,500 (או יכולת עיבוד כוללת של המחשב בהרכב מאיצים אקוויוולנטי מבחינת חוזק העיבוד, קצב העיבוד, רוחב הפס והזיכרון) במהלך כל תקופת התוכנית. דוגמאות למאיצים אפשריים הקיימים כיום בשוק, אשר עומדים בדרישות הנ”ל:
- חברת AMD – MI300X OAM
- חברת INTEL – Intel Gaudi 3 AI
- חברת NVIDIA – Blackwell B100
מובהר, כי הדוגמאות הנ”ל אינן מהוות רשימה סגורה או ממצה של המאיצים האפשריים, אשר יכולים לעמוד בדרישות המפורטות לעיל, והן נועדו לנוחות הקוראים בלבד.
- תשתית התקשורת בין שרתי העיבוד תאפשר שימוש מקבילי אפקטיבי בכלל המאיצים לטובת משימת אימון מודל אחת, במידת הצורך, כך שתתאפשר הקצאה מלאה של כלל המאיצים מכלל השרתים ללא עיכוב אשר יפגע באורך או ביצועי האימון.
- תמיכה בריבוי משתמשים (Tenants) תוך שמירה על הפרדה בין השימושים, בדומה לתשתיות ענן ציבוריות.
- קיום אתר “ניטראלי” אשר יאפשר מתן שירות לכלל הגופים, כך שיתאפשר שיתוף פעולה במחקר ופיתוח בין תאגידים ישראליים או בין תאגידים ישראליים לבין מוסדות מחקר ישראליים ואינטגרציה בין נתונים שונים.
- מתן שירות של צוות מומחים (Professional Services) המהווה מקור ידע ובעל מומחיות בעולם התוכן המאפשר הנגשת ידע/מתן שירותים ויכולות ייחודיים הנבנים בתשתית אימון מודלים לטובת המשתמשים.
- התשתית, שתוקם במדינת ישראל, תאפשר אימון מודלים גדולים בביצועי מאיץ בודד מינימליים 2 Petaflops ברמת דיוק של FP16, זיכרון מאיץ של 80GB, רוחב פס של 2 Tbit/s ומהירות אפקטיבית (Effective Clock Speed) של MHz 1,500 (או יכולת עיבוד כוללת של המחשב בהרכב מאיצים אקוויוולנטי מבחינת חוזק העיבוד, קצב העיבוד, רוחב הפס והזיכרון) במהלך כל תקופת התוכנית. דוגמאות למאיצים אפשריים הקיימים כיום בשוק, אשר עומדים בדרישות הנ”ל:
- תקופת ההקמה של מעבדת המו”פ לא תעלה על 12 חודשים ותחל, לכל המאוחר, במועד קבלת כתב האישור מטעם רשות החדשנות. עם תום תקופת ההקמה הנ”ל תידרש מעבדת המו”פ לספק שירות בפועל ללקוחות הזכאים בהיקף של לפחות 2000 Petaflop או מחצית ממספר המעבדים ברמת דיוק של FP16. יתרת כוח החישוב למתן שירות בפועל תושלם בתוך תקופה של 6 חודשים נוספים לאחר תקופת ההקמה הנ”ל, לכל המאוחר.
- פרסום מחירון מלא של עלויות עיבוד המאיצים לפי מודלים שונים של יחידות הקצאה באתר האינטרנט של התשתית. על מחיר יחידת ההקצאה להיות בנוי באופן שישקף את כלל העלות החזויה למשתמשי הקצה בעבור השימוש במעבדת המו”פ עצמה (בלא השירותים הנלווים). התמחור יכלול, בין היתר, את השימוש ביחידות העיבוד, רכיבי התקשורת, הניהול, אחסון נתונים עד היקף שיוגדר ולמשך תקופת השימוש בתשתית, העלאת נתונים אל תשתית האימון, גיבוי, הגנה בסייבר וכדומה. מבנה המחירון יכלול את היקף תקופת השימוש וכן את הפרמטרים הטכניים לתמחור המפורטים להלן:
- סוג המאיץ.
- נפח זיכרון העבודה של המאיץ
- נפח אחסון (Storage) עבור נתוני אימון ותוצאות הכלול בעלות.
- סוגי המעבדים (CPUs) הזמינים לטובת ניהול תהליכי האימון ומשימות שונות.
- נפח זיכרון העבודה של שרתי החישוב RAM (GiB).
- פרסום מחירון עבור שירותים נוספים שיינתנו על-ידי מעבדת המו”פ, לרבות עלות שעת תמיכה מקסימלית לסיוע טכני אנושי וסיוע טכנולוגי בהתאם למחירי השוק המקובלים בעולם.
- פרסום המחירונים המפורטים בסעיף א’ ו-ב’ לעיל, ייעשה למשך כל תקופת התוכנית ובמשך שנתיים נוספות (24 חודשים) מתום תקופת התוכנית, לכל הפחות.
- שירותי עיבוד המאיצים עבור אימון מודל גדול שיינתנו בהנחה: מתן הנחה קבועה מינימאלית כפי שתוגדר במסגרת הבקשה מהמחירון שיפורסם באתר האינטרנט של התשתית ללקוחות הזכאים, כמפורט להלן. ההנחה האמורה תינתן ביחס להיקף מספר שעות מאיצי AI כפי שיוגדר במסגרת הבקשה. מובהר, כי עבור שירותי עיבוד נוספים (מעבר ל-2000 Petaflop ברמת דיוק של FP16), ניתן יהיה להציע הנחה בשיעור שונה.
- המאיצים יוקצו ללקוחות הזכאיים, בהנחה ממחיר השוק, כאשר העלות שתגבה מכל אחד מהלקוחות הזכאים להנחה, תהיה נמוכה בלפחות 30% ממחיר השוק המקובל, זאת בעת החתימה על הסכם בין לקוח זכאי למעבדה.
- הלקוחות אשר יהיו זכאים לשירותי עיבוד המאיצים שיינתנו בהנחה הינם תאגידים תעשייתיים ישראליים ומוסדות מחקר ישראליים (לעיל ולהלן: “הלקוחות הזכאים“). ההנחה ללקוחות הזכאים תינתן החל ממועד תחילת מתן השירותים על-ידי המעבדה ולמשך כל תקופת התוכנית, בכפוף לאמור בסעיף הבא.
- אופן הקצאת שירותי עיבוד המאיצים ללקוחות הזכאים: יבוצע מעקב חודשי של היקפי הביקוש של הלקוחות הזכאים אל מול ההיצע שהמעבדה תספק בהתאם להתחייבותה . במידה והיקפי הביקוש יעלו על ההיצע כאמור במהלך חודש מסוים, ההנחה תינתן ללקוחות אשר יקבע על-ידי ועדת המחקר של רשות החדשנות כי הם בעלי הזכאות לקבלת השירותים בהנחה האמורה.
- רמת השירות של המעבדה:
- פרסום מדדי שירות (SLA) ומתן מענה ללקוחות הזכאים, אשר לא יחרוג מזמן המענה לכלל המשתמשים במעבדה.
- מתן כלל שירותי המעבדה גם באופן מקוון באותם מחירים שהוגדרו במחירונים לעיל.
- השירותים שיינתנו על-ידי המעבדה יהיו זמינים לכלל המשתמשים בשיעור של 99% בממוצע בשנה (בהתאם לתחשיב של: 24 שעות * 365 ימים).
חובות מקבל האישור
כמפורט בהוראות מסלול ההטבה ובהתאם לאמור לעיל בעניין הדרישות ביחס להקמת והפעלת המעבדה.
דגשים
כל האמור כאן, לרבות לעניין הגשת הבקשות, בחינתן, ההחלטה בדבר אישור או דחיה של בקשות, מתן הטבות והחובות והזכויות של מקבל הטבה, כגון בקשר לידע וקניין רוחני, דיווח ותשלום תמלוגים, יהיו בהתאם לאמור בהוראות חוק החדשנות, מסלול ההטבה הרלוונטי, וכן הנהלים שנקבעו מכוחם (לרבות אלו המופיעים באזור נהלי מסלול ההטבה).
אופן הגשת הבקשה
- ניתן להגיש בקשות עד לתאריך 4/03/2025 בשעה 12:00 בצהריים. מובהר, כי לא תתקבלנה בקשות אשר תוגשנה לאחר מועד זה.
- יש לקרוא בעיון את מסלול ההטבה, וכן את הנהלים הרלוונטיים, ולוודא עמידה בתנאי הסף המפורטים בנוסחם המלא.
- יש למלא אחר ההנחיות המפורטות במסלול ההטבה, הנהלים הרלוונטיים והודעה זו.
- יש להגיש את הבקשה באזור האישי , על גבי טופס הבקשה של מסלול ההטבה.
- יש לעקוב אחר דף קול קורא זה, אשר בו יפורסמו עדכונים בנוגע להליך, אם יהיו.
- אין באמור בהודעה זו משום התחייבות לאישור בקשה כלשהי אשר תוגש במסגרת ההליך.
לשאלות ויצירת קשר
ניתן לשלוח שאלות לדוא”ל yael.h@innovationisrael.org.il עד למועד הוובינר, אשר יתקיים בתאריך ה 4.2.2025 בשעה 10:00 , לשאלות כלליות ושאלות על אופן הגשה הבקשה באזור האישי, ניתן ליצור קשר עם מערך הלקוחות של רשות החדשנות בדוא”ל: contactus@innovationisrael.org.il או בטלפון 03-7157900 בימים א’-ה’ בשעות 9:00-17:00.
תכולת הבקשה
הבקשה, על נספחיה, תכלול התייחסות ומענה, בין היתר, להיבטים המפורטים מטה. אין מדובר ברשימה סגורה והיא מהווה רק חלק מהנדרש במסגרת טופס הבקשה. ניתן להרחיב ולהתייחס לסוגיות נוספות שאינן כלולות ברשימה זו.
- היבטים מדעיים-טכנולוגיים – מענה לאמור בסעיף זה יינתן בסעיפים 3, 4 ו-8 לטופס הבקשה.
- ייעוד מעבדת אימון מודלים (סעיף 3): יש לפרט את ייעודה של מעבדת המו”פ, לרבות בהיבטים הנוגעים לשירותים שיינתנו וכן לקהל היעד של המשתמשים הפוטנציאליים, זאת בשים לב לניתוח שנערך על-ידו בכל הנוגע להוכחת הצורך ולתרומת מעבדת המו”פ לתעשייה הישראלית.מפרט טכנולוגי מינימלי שיעמיד המבקש:
- אופי והיקף החומרה המינימאלי ובכלל זה כמות ומפרט כרטיסי המאיץ.סך פרויקטי אימון המודלים הגדולים במקביל שהמעבדה תוכל להריץ.מפרט התקשורת בין המאיצים וצמתי החישוב (Cluster Nodes).מערכת/סביבת ההפעלה המוצעת (כלי תכנה, שימוש ב-containers, ספריות צד שלישי וכדומה).מערכות הגנה בסייבר.רמות רציפות וזמינות מינימליות.
- יש לפרט את שירותי המחקר והפיתוח הנוספים שהמבקש ייתן למשתמשים (סוגי השירות, תחומי השירות) ובפרט, דגש על שירותים שלא ניתן כיום לקבל באופן אפקטיבי (פיננסית ותפעולית) מספקי ענן ציבורי ופרטי.פירוט השירותים יכלול מידע הנוגע לתאריך תחילת מתן השירות, עלויות שימוש צפויות וכן השוואה לשירותים אחרים קיימים בעולם.
- תיאור המעבדה (סעיף 8) – תיאור הארכיטקטורה הנדרשת למתן השירותים המוגדרים הכוללת, בין היתר, התייחסות לנושאים הבאים:
- החומרה והתוכנה הנדרשות למתן השירותים המוצעים.
- כלים לניהול משאבים (אופטימיזציה בחלוקה, כלים לניהול תהליכי אימון, מעקב אחר ההתקדמות וניהול קונפיגורציות הניסוי השונות).
- אפשרות השימוש בשירותים למספר משתמשים תוך הפרדה ביניהם, עם/ללא דרישות שונות ובמקביל תוך שמירה על פרטיות הנתונים.
- תיאור הקישוריות המקוונת של התשתית, והאופן בו יכולים המשתמשים להעלות מאגרי נתונים גדולים הנדרשים בתהליך האימון (לרבות העלאת נתונים דרך רשת האינטרנט, וכן העלאת נתונים תוך שימוש במדיה פיזית).
- ממשקים לתשתיות נוספות – לדוגמא: היבטי חיבור וממשק לתשתיות ענן ציבוריות ופרטיות, ושילוב הענן בתהליך העיבוד שמורץ בתשתית.
- תיאור הביצועים הצפויים ותבניות pre-configured מומלצות.
- תיאור אופן שדרוג תשתיות התוכנה והחומרה והממשקים של שירותי תשתית אימון מודלים בהתאם להתפתחויות הטכנולוגיות החדישות ביותר במהלך תקופת התכנית המאושרת, לרבות שימור יכולות התשתית בהשוואה לחזית הטכנולוגיה העולמית.
- ייעוד מעבדת אימון מודלים (סעיף 3): יש לפרט את ייעודה של מעבדת המו”פ, לרבות בהיבטים הנוגעים לשירותים שיינתנו וכן לקהל היעד של המשתמשים הפוטנציאליים, זאת בשים לב לניתוח שנערך על-ידו בכל הנוגע להוכחת הצורך ולתרומת מעבדת המו”פ לתעשייה הישראלית.מפרט טכנולוגי מינימלי שיעמיד המבקש:
- היבטים ניהוליים-תפעוליים – מענה לאמור בסעיף זה יינתן בסעיפים 5 ו-6 לטופס הבקשה:
- פירוט השותפים האסטרטגיים של המבקש.
- פירוט קשרים ושותפויות נוספים עם התעשייה עתירת הידע והאקדמיה.
- פירוט תהליכי הפיתוח עסקי/שיווקי והנגשת התשתית למשתמשים השונים.
- פירוט המעטפת התשתיתית הנדרשת לטובת ההקמה והתפעול השוטף (לרבות שירותים, תשתית פיזית וציוד), זאת בשים לב לניתוח שנערך על-ידי המבקש אודות קיומו של כשל שוק או מגבלה אחרת המונעים את רכישת ציוד זה שלא במסגרת מענק רשות החדשנות.
- פירוט היקף כוח האדם הניהולי והטכנולוגי, בעל אוריינטציה תעשייתית, שיועסק בהפעלת הציוד וכן ניסיונו המקצועי בתחום זה (יש לצרף את קורות החיים של המנכ”ל וכוח האדם המוצע).
- פירוט תהליך ואופן הכשרת כוח אדם למחקר, פיתוח, תמיכה, תפעול וכדומה בתחום פעילות מעבדת המו”פ בכלל ואימון מודלים גדולים בפרט.
- פירוט אופן מתן השירות לתאגידים תעשייתיים ולמוסדות מחקר, לרבות בהיבטים של הבעלות על הקניין הרוחני.
- לו”ז להקמה:
- פירוט הלו”ז להקמת התשתית ותחילת מתן השירות. יש לתאר את שלבי בניית היכולות הטכנולוגיות ושירותי המו”פ שהתשתית תספק.
- תיאור תכנון הטווח הקצר והטווח הארוך במסגרת שלבי בניית הידע הטכנולוגי ויכולת מתן השירותים של התשתית. במסגרת הטווח הארוך יש לתאר אילו יכולות ושירותי מו”פ נוספים ניתן יהיה לספק לאחר התבססות וצבירת יכולות והתנסות בתפעול התשתית.
- היבטים תקציביים/כלכליים – מענה לאמור בסעיף זה יינתן בסעיפים 9 , 10, 12 ו-17 לטופס הבקשה ובקובץ האקסל המהווה נספח שלו.
- תכנית עסקית – פירוט תפיסת ההפעלה לטווח הקרוב (הכוללת את מענק רשות החדשנות) וכן את הטווח ההמשכי (קיום עצמאי של מעבדת המו”פ).
- תמחור מתן השירותים (מחיר צפוי לשירות) – פירוט התהליך הצפוי לקביעת גובה התמורה שמעבדת המו”פ תדרוש מהמשתמשים הפוטנציאליים, בשים לב לתחרות הקיימת בעולם במתן שירותים מסוג זה, וזאת בשים לב לאמור לעיל במסגרת הדרישות להקמת והפעלת התשתית.
- פירוט עלויות כוח האדם הניהולי והטכנולוגי, לרבות בהיבטים של הצורך בהכשרתו טרם תחילת מתן השירות על-ידי מעבדת המו”פ.
- מענה לשלושת התרחישים המפורטים להלן בעניין עבודות אימון AI. יש לצרף את המענה כנספח נפרד לטופס הבקשה.
- יש לפרט עבור כל אחד מהתרחישים את כלל הרכיבים הנדרשים על מנת לתת מענה מלא לדרישה, לרבות רכיבים שלא נדרשו במפורש, אשר בלעדיהם לא ניתן לממש את הצורך המפורט בצורה טובה. על המחיר הכולל עבור כל תרחיש לכלול את כלל העלויות המפורטות לצורך ההרצה.
- על המענה לכלול את המק”ט של הפריט כפי שמפורסם במחירון/מחשבון הפומבי של המציע, את מחיר המחירון, הנכון ליום הגשת ההצעה, ואת הכמות הנדרשת לצורך מימוש התרחיש.
- על כלל העלויות להיות לפי שעה במודל של “Pay As You Go”
- יש לפרט כלים נוספים שיכולים לעזור ולתת מענה לצרכים הנגזרים מתרחישים אלו, ולציין את מחירם, אולם אין לכלול אותם בחישוב העלות.
תרחיש 1 – אימון מודל ענקי (70B)
אימון מחדש של מודל LLM בקוד פתוח, כגון Llama 3 ו יצירת Tokens חדשים. בקשה זו היא על Training בלבד.
על המענה לכלול את הרכיבים הבאים (יש לפרט, בגיליון המצורף, עבור כל פריט את כלל המק”טים הנדרשים על מנת לתת מענה מלא לדרישה ואת מחיר המחירון שלהם):
שם הרכיב | פירוט | כמות |
---|---|---|
אחסון אובייקטים | 70 טרהבייט | |
מערכת SQL או Clustered File system | פתרון שיאפשר לכל Node להגיע למידע בדרך מהירה מבלי לקרוא שוב ושוב מאחסון אובייקטים | בהתאם לגודל המידע |
שרתים מואצים לאימון | ראו מפרט בעמוד האחרון | 100 שרתים |
פלטפורמה מרכזית לניהול וביצוע כל פעולות האורקסטרציה | שרתים מתאימים לצורך הניהול בתצורה שרידה | 1 |
תשתיות תכנה נדרשות | כלל השירותים והתוכנות הנדרשות לצורך מתן השירות | 1 |
תרחיש 2 – אימון טקסט גדול (7B)
אימון מחדש של מודל LLM בקוד פתוח, (כגון Llama 3) ויצירת Tokens חדשים. בקשה זו היא על Training בלבד.
על המענה לכלול את הרכיבים הבאים (יש לפרט, בגיליון המצורף, עבור כל פריט את כלל המק”טים הנדרשים על מנת לתת מענה מלא לדרישה ואת מחיר המחירון שלהם):
שם הרכיב | פירוט | כמות |
---|---|---|
אחסון אובייקטים | 7 טרהבייט | |
מערכת SQL או Clustered File system | פתרון שיאפשר לכל Node להגיע למידע בדרך מהירה מבלי לקרוא שוב ושוב מאחסון אובייקטים | בהתאם לגודל המידע |
שרתים מואצים לאימון | ראו מפרט בעמוד האחרון | 20 שרתים |
פלטפורמה מרכזית לניהול וביצוע כל פעולות האורקסטרציה | שרתים מתאימים לצורך הניהול בתצורה שרידה | 1 |
תשתיות תכנה נדרשות | כלל השירותים והתוכנות הנדרשות לצורך מתן השירות | 1 |
תרחיש 3 – אימון Images – גודל מאגר 100,000 תמונות
קיים מאגר של 100,000 תמונות בגודל ממוצע של 10MB (נפח כולל של כולל של 1TB), שיוזנו למודל מסוג LDM – Large Diffusion Model על מנת לבצע טיוב (Fine Tuning) על מודל כגון Stable Diffusion וזאת לצורך יצירת תמונות מתאימות יותר, בהתבסס על הטיוב.
על המענה לכלול את הרכיבים הבאים (יש לפרט, בגיליון המצורף, עבור כל פריט את כלל המק”טים הנדרשים על מנת לתת מענה מלא לדרישה ואת מחיר המחירון שלהם):
שם הרכיב | פירוט | כמות |
---|---|---|
אחסון אובייקטים | 1 טרהבייט | |
שרתים מואצים לאימון | ראו מפרט בעמוד זה | 4 שרתים |
פלטפורמה מרכזית לניהול וביצוע כל פעולות האורקסטרציה | שרתים מתאימים לצורך ניהול תצורה שרידה | 1 |
תשתיות תוכנה נדרשות | כלל השירותים והתוכנות הנדרשות לצורך מתן השירות | 1 |
שרתים מואצים לאימון– נתונים אודות תצורת שרתי העיבוד (אשר תקפים לשלושת התרחישים):
- כל שרת יכלול כרטיסי מאיצי AI מהמפרט שנדרש לעיל תחת דרישות מפרט טכני, כאשר כרטיס יהיה מקושר ל-מאיצי AI האחרים בערוץ מהיר.
- מהירות הקישור בין השרתים תהיה לפחות 300 ג’יגהביט לשנייה.
- כל שרת יכלול לפחות שני מעבדים, כאשר כל מעבד יהיה בעל 16 ליבות לפחות ו- 256GB זיכרון מסוג DDR5.
- כל שרת יכלול אחסון מקומי בנפח של 4TB בטכנולוגיית SSD בקישור PCIe/U.2, לצורך האצת תהליך העיבוד.
רקע
אחד מתחומי הפעילות המרכזיים של התכנית הלאומית לבינה מלאכותית הינו יצירה והנגשה של תשתיות מחשוב לטובת קהילת המחקר והפיתוח בישראל. במסגרת זו הופצה בחודש אוקטובר 2021, בקשה לקבלת מידע (RFI) אשר נערכה במשותף על ידי רשות החדשנות ומנהלת פיתוח אמצעים ותשתיות טכנולוגיות במשרד הביטחון (מפא”ת). מתוך התגובות שנאספו ובהמשך לעבודת מטה רחבה הוחלט על הקמתן של שלוש תשתיות חישוב משלימות זו לצד זו:
- מעבדה להאצת מחקרי בינה מלאכותית (AI), באמצעות אימון מודלים גדולים;
- מעבדת לבחינה ופיתוח של טכנולוגיות חישוב על;
- תשתית מחקרית בתחום החישוב המדעי.
קול קורא זה מיועד כאמור להקמת והנגשת מעבדת מו”פ להאצת מחקרי בינה מלאכותית (AI), באמצעות אימון מודלים גדולים.
מובהר, כי מטרת מעבדת המו”פ אינה להחליף תשתיות ושירותי ענן קיימים בישראל, אלא להוסיף ערך ויכולות חדשות שאינן ניתנות לביצוע כיום בתשתיות מו”פ קיימות בעלות כספית רלוונטית למשתמשים וביצועים העונים על הצורך, הכל כמפורט להלן.
הגדרות רלוונטיות:
- אימון מודל גדול – תהליך יצירה או שיפור של מודל בינה מלאכותית, כחלק מפעילות מחקר ופיתוח, ובכלל זה יצירה או שכלול של אלגוריתם המנתח נתונים ולומד דפוסים לשם ביצוע תחזיות או החלטות, הדורש שימוש בלפחות 100 Petaflops ברמת דיוק של FP16 , במשך חודש אחד.
- מחיר השוק – המחיר הממוצע המבוסס על המחירונים המפורסמים בשלושת אתרי האינטרנט הבאים: https://lambdalabs.com ,https://cloud.digitalocean.com ו https://nebius.ai/prices