לימודי מדעי הנתונים

מדעי הנתונים עוסקים בעקרונות ובפיתוח שיטות לאיסוף, לאחסון ולניתוח של נתונים, ליצירת ידע מהם, להסקת מסקנות מתוכם ולחיזוי טכנולוגי, תוך כדי התייחסות להיבטים אנושיים וחברתיים. תוכנית הלימודים לתואר ראשון במדעי הנתונים נועדה להכשיר בוגרות ובוגרים לעיסוק בתחום; התוכנית מתמקדת בהקניית ידע וכלים להתמודדות עם נתוני ענק, התמודדות שמצריכה שילוב של ידע וכישורים במתמטיקה, בסטטיסטיקה ובתוכנה.

בלימודי תואר ראשון במדעי הנתונים נכללים קורסים המעניקים לסטודנטים ולסטודנטיות את הבסיס המוצק, הרקע והיסודות הנדרשים להם בתפקידם כמדעני נתונים, כדי להעמיק בליבה של עשייתם העתידית: מתמטיקה, סטטיסטיקה ואלגוריתמיקה. תוכנית הלימודים מקנה ידע על האלגוריתמים העדכניים שבהם משתמשים במדעי הנתונים והבנה שלהם, על הבסיס המדעי של אלגוריתמים אלה ועל האופנים שבהם משמשים האלגוריתמים ביישומים שונים. בין השאר נלמדים בה קורסים בנושאי למידת מכונה והיבטים סטטיסטיים שלה, רשתות נירונים ולמידה עמוקה, עיבוד שפה טבעית וניתוח רשתות חברתיות.

ייחודיות תואר ראשון במדעי הנתונים

תואר ראשון במדעי הנתונים הוא אומנם חדש יחסית, אבל הוא מבוסס על צורך אמיתי שהגיע מהתעשייה; הוא מורכב מקורסים שנלמדים באפקה במשך שנים רבות במקצועות ההנדסה השונים, ונארזו לתואר הרלוונטי והמבוקש ביותר כיום בתעשיית ההיי-טק.

  • התואר מתמקד בטכנולוגיות חדשניות ו-AI (בינה מלאכותית);
  • לימודי התואר מקנים הבנה מעמיקה בכלי AI, כזו המאפשרת פיתוחים עתידיים של כלים כאלה;
  • בתואר נכללים קורסי בחירה מעשיים, המקנים ניסיון המשמש את התעשייה, כגון עיבוד שפה טבעית לצורך בוטים ו- ChatGPT, ראייה ממוחשבת ועוד;
  • פרויקט גמר המעניק התנסות אמיתית בבניית מודלים הנדרשים מ Data Scientist בתעשייה;
  • "סקילבוס" – תוכנית לימודים שמשולבת בה הקניית כישורים חיוניים לשוק העבודה, כגון עבודה בצוות רב-תחומי, למידה עצמית ויכולת תקשורת אפקטיבית;
  • לימודים בחברת סטודנטים וסטודנטיות להנדסה;
  • סגל מרצים שהם מומחים בעלי שם מהתעשייה והאקדמיה;
  • למידה בקבוצות קטנות וקבלת ליווי אישי של חברי הסגל. 
chat gpt

תקצירי הקורסים בתואר ראשון במדעי הנתונים

המספרים הממשיים. פונקציות. סדרות. גבול של סדרה. גבולות ורציפות. משפט ערכי הביניים ומשפט Weierstrass . הנגזרת וחשבון נגזרות. משפט Fermat, משפט Rolle, משפט Lagrange, כלל l'Hopital. שימושים: עליה וירידה, קודות קיצון, קמירות, קעירות ונקודת פיתול. נוסחת Taylor עם שארית Lagrange. חקירת פונקציות. אינטגרל לא מסוים ואינטגרל מסוים ׁׁ(אינטגרל Riemann). המשפט היסודי של החשבון האינטגרלי ונוסחת Newton-Leibniz. שיטות אינטגרציה. אינטגרל לא אמיתי, קריטריוני השוואה.
נושאים מרכזיים: מרחבי מכפלה פנימית, אופרטורים ליניאריים, תבניות ריבועיות וביליניאריות, מבוא לתורת החבורות ותורת המספרים.
בקורס ילמדו הנושאים הבאים: קלט ופלט, ביטויים אריתמטיים ולוגיים משפטי תנאי, לולאות, פונקציות, רשימות, מילונים, מיונים וחיפושים ורקורסיות. הנושאים ילמדו תוך יישומם בשפת פייתון שתלמד במהלך הקורס.
הקורס מקנה לסטודנטים הבנה של הקשר בין מערכות המידע וביצועי הארגון. במסגרת הקורס, ילמדו הסטודנטים את מטרות הארגון בשימוש במערכות המידע, הסביבות השונות בהן פועלת מערכת המידע, טכנולוגיות המחשוב, השגת מצוינות תפעולית בארגון תוך ניצול מערכות המידע, פיתוח מוצרים ושירותים חדשים בארגון, פיתוח קשרי הלקוחות וספקי הארגון באמצעות טכנולוגיות המידע, שיפור בתהליכי קבלת החלטות בארגון והשגת יתרונות תחרותיים. הקורס כולל דוגמאות של ארגונים והשימוש במערכים וכלים אלו. מתכונת הלימודים כוללת הרצאות פרונטליות וכן הצגת דוגמאות מעולם המחשוב. במסגרת הקורס ידרשו הסטודנטים לקרוא פרקים ומאמרים רלוונטיים שיציגו אירועי אמת של ארגונים. בנוסף, הסטודנטים יידרשו להגיש במהלך הקורס מטלות תרגול. הגשת המטלות תבוצע במודל ולא במיילים. מטלה שתוגש באיחור או במיילים לא תיבדק. כל מפגש יימשך 2 שעות ויינתן כהרצאה פרונטאלית. הסטודנטים יתבקשו לעיתים לעבור על חומרי קריאה (או צפייה) שבסילבוס הקורס לקראת מפגשי ההרצאה, בהם ייכללו הצגה וניתוח דוגמאות ממאמרים או מקרים.
טורים. טורי חזקות. פונקציות של מס' משתנים. גבולות ורציפות. נגזרת חלקית ומכוונת. קירובים ליניאריים. גרדיאנט. כלל השרשרת. נגזרות חלקיות מסדר שני, קירוב ריבועי ופולינום Taylor של פונקציות של מס' משתנים. נקודות קיצון מקומיים/מוחלטים. כופלי Lagrange. אינטגרלים מרובים. משפט Fubini. החלפת משתנים ויעקוביאן (Jacobi). אינטגרלים קווים ומשטחיים. אי-תלות אינטגרל קווי במסילה ומשפט Green. משפט Gauss-Ostrogradski ומשפט Stokes.
מושגים בסיסיים בהסתברות: מרחב מדגם ומשפטים בסיסיים, חישובים קומבינטוריים, הסתברויות מותנות ואי תלות, משתנים מקריים בדידים ורציפים, תוחלת ושונות של משתנה מקרי, משתנים בעלי התפלגויות מיוחדות, משתנים רב ממדיים ומשפט הגבול המרכזי. מושגים בסיסיים בסטטיסטיקה: בעיות עמידה ובדיקת השערות במודלים הסתברותיים בדידים ורציפים.
לוגיקה - מושגים בסיסיים, תחשיב הפסוקים. תורת הקבוצות - מושג הקבוצה, יחסים, יחסי סדר חלקיים, אינדוקציה מתמטית, פונקציות, עוצמות. קומבינטוריקה: קומבינטוריקה בסיסית, בינום ניוטון, עקרון ההכלה וההפרדה, עקרון שובך היונים, רקורסיה, פונקציות יוצרות. גרפים: מושגים יסודיים, משפט אויילר.
ניתוח אלגוריתמים ושיעור הגידול, גידול של פונקציות וסכומים, משפט האב לרקוסיות. חיפוש איבר ברשימה ממוינת ולא ממוינת, מיזוג סדרות ממוינות, ניתוח סיבוכיות זמני הריצה שלהם. שיטות מיון שונות טיפוסי נתונים, ייצוגם ושימושיהם. רשימה כטיפוס נתון מופשט ,ורשימות דו-כיווניות, מחסנית, תור. עץ בינארי, יישומים בעזרת עצים.סריקות שונות של עצים ועץ חיפוש בינארי , עצים כלליים ועצים מאוזנים. ערמה, מיון באמצעות ערימה, מיון מהיר, מיון מנייה, מיון בסיס, מיון דלי, ניתוח סיבוכיות זמני הריצה שלהם. טבלאות גיבוב - Hashing.
המספרים הממשיים. פונקציות. סדרות. גבול של סדרה. גבולות ורציפות. משפט ערכי הביניים ומשפט Weierstrass . הנגזרת וחשבון נגזרות. משפט Fermat, משפט Rolle, משפט Lagrange, כלל l'Hopital. שימושים: עליה וירידה, קודות קיצון, קמירות, קעירות ונקודת פיתול. נוסחת Taylor עם שארית Lagrange. חקירת פונקציות. אינטגרל לא מסוים ואינטגרל מסוים ׁׁ(אינטגרל Riemann). המשפט היסודי של החשבון האינטגרלי ונוסחת Newton-Leibniz. שיטות אינטגרציה. אינטגרל לא אמיתי, קריטריוני השוואה.
טורים. טורי חזקות. פונקציות של מס' משתנים. גבולות ורציפות. נגזרת חלקית ומכוונת. קירובים ליניאריים. גרדיאנט. כלל השרשרת. נגזרות חלקיות מסדר שני, קירוב ריבועי ופולינום Taylor של פונקציות של מס' משתנים. נקודות קיצון מקומיים/מוחלטים. כופלי Lagrange. אינטגרלים מרובים. משפט Fubini. החלפת משתנים ויעקוביאן (Jacobi). אינטגרלים קווים ומשטחיים. אי-תלות אינטגרל קווי במסילה ומשפט Green. משפט Gauss-Ostrogradski ומשפט Stokes.
מושגים בסיסיים בהסתברות: מרחב מדגם ומשפטים בסיסיים, חישובים קומבינטוריים, הסתברויות מותנות ואי תלות, משתנים מקריים בדידים ורציפים, תוחלת ושונות של משתנה מקרי, משתנים בעלי התפלגויות מיוחדות, משתנים רב ממדיים ומשפט הגבול המרכזי. מושגים בסיסיים בסטטיסטיקה: בעיות עמידה ובדיקת השערות במודלים הסתברותיים בדידים ורציפים.
לוגיקה - מושגים בסיסיים, תחשיב הפסוקים. תורת הקבוצות - מושג הקבוצה, יחסים, יחסי סדר חלקיים, אינדוקציה מתמטית, פונקציות, עוצמות. קומבינטוריקה: קומבינטוריקה בסיסית, בינום ניוטון, עקרון ההכלה וההפרדה, עקרון שובך היונים, רקורסיה, פונקציות יוצרות. גרפים: מושגים יסודיים, משפט אויילר.
נושאים מרכזיים: מרחבי מכפלה פנימית, אופרטורים ליניאריים, תבניות ריבועיות וביליניאריות, מבוא לתורת החבורות ותורת המספרים.
בקורס ילמדו הנושאים הבאים: קלט ופלט, ביטויים אריתמטיים ולוגיים משפטי תנאי, לולאות, פונקציות, רשימות, מילונים, מיונים וחיפושים ורקורסיות. הנושאים ילמדו תוך יישומם בשפת פייתון שתלמד במהלך הקורס.
ניתוח אלגוריתמים ושיעור הגידול, גידול של פונקציות וסכומים, משפט האב לרקוסיות. חיפוש איבר ברשימה ממוינת ולא ממוינת, מיזוג סדרות ממוינות, ניתוח סיבוכיות זמני הריצה שלהם. שיטות מיון שונות טיפוסי נתונים, ייצוגם ושימושיהם. רשימה כטיפוס נתון מופשט ,ורשימות דו-כיווניות, מחסנית, תור. עץ בינארי, יישומים בעזרת עצים.סריקות שונות של עצים ועץ חיפוש בינארי , עצים כלליים ועצים מאוזנים. ערמה, מיון באמצעות ערימה, מיון מהיר, מיון מנייה, מיון בסיס, מיון דלי, ניתוח סיבוכיות זמני הריצה שלהם. טבלאות גיבוב - Hashing.
הקורס מקנה לסטודנטים הבנה של הקשר בין מערכות המידע וביצועי הארגון. במסגרת הקורס, ילמדו הסטודנטים את מטרות הארגון בשימוש במערכות המידע, הסביבות השונות בהן פועלת מערכת המידע, טכנולוגיות המחשוב, השגת מצוינות תפעולית בארגון תוך ניצול מערכות המידע, פיתוח מוצרים ושירותים חדשים בארגון, פיתוח קשרי הלקוחות וספקי הארגון באמצעות טכנולוגיות המידע, שיפור בתהליכי קבלת החלטות בארגון והשגת יתרונות תחרותיים. הקורס כולל דוגמאות של ארגונים והשימוש במערכים וכלים אלו. מתכונת הלימודים כוללת הרצאות פרונטליות וכן הצגת דוגמאות מעולם המחשוב. במסגרת הקורס ידרשו הסטודנטים לקרוא פרקים ומאמרים רלוונטיים שיציגו אירועי אמת של ארגונים. בנוסף, הסטודנטים יידרשו להגיש במהלך הקורס מטלות תרגול. הגשת המטלות תבוצע במודל ולא במיילים. מטלה שתוגש באיחור או במיילים לא תיבדק. כל מפגש יימשך 2 שעות ויינתן כהרצאה פרונטאלית. הסטודנטים יתבקשו לעיתים לעבור על חומרי קריאה (או צפייה) שבסילבוס הקורס לקראת מפגשי ההרצאה, בהם ייכללו הצגה וניתוח דוגמאות ממאמרים או מקרים.
שפת תחשיב הפסוקים: תחביר וסמנטיקה , שקילות לוגית וגרירה לוגית. תורת ההיסק של תחשיב הפסוקים מערכת לוקשביץ, משפט הדדוקציה, נאותות ושלמות של מערכת ההיסק. מערכות נוספות. שפת תחשיב הפרדיקטים: תחביר פורמלי. שמות עצם ותבניות. סמנטיקה בסיסית: מבנים והשמות תבניות אמיתיות במבנה והשמה. תבניות אמיתיות לוגית. תורת ההיסק מסדר ראשון: אקסיומות, כללי היסק, הוכחות. משפט הנאותות, משפט הדדוקציה ומשפטי השלמות והקומפקטיות. משפטי אי השלמות של Godel. אימות תוכנה.
תקציר נושאי הקורס: מבוא לתכנון לינארי. סימפלכס , בעיה פרימלית ודואלית. בעיית התובלה ובעיית ההשמה. תכנות דינאמי .טיפוס נתונים גרף, ייצוגים שונים של גרפים. ואלגוריתמים בסיסיים עליהם. אלגוריתמים למציאת סגור טרנזיטיבי: באמצעות כפל מטריצות ולפי האלגוריתם של וורשל. מסלולי אוילר והמילטון. חיפוש לרוחב - BFS, חיפוש לעומק - DFS. רכיבים קשירים היטב(רק"חים) וגרף על . מיון טופולוגי , מסלולים קריטיים, מסלולים קצרים בגרף – DAG. מסלולים קצרים ביותר ממקור יחיד – מסלולים קצרים ביותר. האלגוריתמים של דייקסטרה ושל בלמן-פורד. מסלולים קצרים ביותר בין כל הזוגות. האלגוריתם: פלויד-וורשאל. אלגוריתמים חמדניים קידוד ועצי הופמן. עץ פורש מינימלי – "הצמחת" עץ פורש מינימלי, האלגוריתמים של קרוסקל ושל פרים. מסלולי אוילר והמילטון.
למידת מכונה (Machine Learning) לעיתים מכונה גם למידה חישובית היא תת-תחום במדעי המחשב ובבינה מלאכותית המשיק לתחומי הסטטיסטיקה והאופטימיזציה. התחום עוסק בפיתוח אלגוריתמים המיועדים לאפשר למחשב ללמוד מתוך דוגמאות, ופועל במגוון משימות חישוביות בהן התכנות הקלאסי אינו אפשרי או אינו כדאי. למידת מכונה היינו תחום חדש באופן יחסי ולאחרונה אחראי לפריצות דרך משמעותיות בעולמות הבינה המלאכותית, כריית המידע וגילוי אוטומטי של ידע מתוך נתונים. בבסיס תחום זה עומדת היכולת לגרום למחשבים לפעול ״עצמאית״ מבלי לתכנת אותם, וזאת ע״י אנליזה וניתוח כמויות גדולות של מידע מהעבר שיאפשר לזהות תבניות ולחזות התנהגותיות בעתיד. התרגולים: מפגשי התרגול ישלימו את החומר התיאורטי בעזרת תרגילים, הדגמות ועבודות תכנות.
סטטיסטיקה תיאורית, אמידה, תכונות אומדים ושיטות אמידה, רווחי סמך, בדיקת השערות על פרמטרים שונים (מבחני Z, מבחני T, מבחן חי-בריבוע, מבחן F) מבחני טיב התאמה ואי תלות, רגרסיה לינארית פשוטה (אם יישאר זמן), שיטות א-פרמטריות. שימוש בתוכנת R לצורך הרצת חישובים.
שימוש במודלים מתמטיים לתכנון ולתפעול מערכות, תכנון לינארי כולל פתרון גרפי, ניסוח מודלים לינראיים לאופטימיזציה, שיטת הסימפלקס, דואליות וניתוח רגישות, בעיות תובלה, בעיית ההשמה, תכנון דינמי, מבוא לתורת ההחלטות.
פונקציות מרוכבות כולל חישוב אינטגרלים קוויים, שימוש שיטות "מרוכבות" לחישוב אינטגרלים ממשיים. שימושים בהתמרות אינטגרליות – של Fourier, Laplace.
שפות פורמליות, מכונות מצבים סופיות דטרמיניסטיות ולא דטרמיניסטיות, שפות רגולריות, ביטויים רגולריים, דקדוקים חסרי הקשר, מכונות מחסנית, מכונות טיורינג ושפות כריעות וכריעות למחצה.
במסגרת הקורס ינתן בסיס מקיף ליסודות של בינה מלאכותית. חלקו הראשון של הקורס יתמקד במושגי בינה מלאכותית של Search & Planning. החלק השני יתמקד בשיטות של Probabilistic reasoning. החומר התאורטי ילווה בדוגמאות
נושאים מרכזיים כוללים: היכרות עם מערכות ניהול בסיסי נתונים, המודל הרלציוני, מודל ישויות קשרים (Entity-Relationship Model), SQL, תכנון בסיס הנתונים, פיתוח בסביבת בסיסי נתונים. נשתמש בתוכנה לניהול בסיס נתונים רלציוני כדי לקבל ניסיון מעשי בשימוש בבסיס נתונים.
אתגר מרכזי בארגון הינו הפיכת הנתונים הרבים הנצברים במערכות המחשוב ובמחסן הנתונים הארגוני לתובנות ולידע (Knowledge) עסקי אינטגרטיבי בעל ערך למקבלי החלטות, מתוך מטרה למנף את תשואות הארגון ולהשיג יתרון אסטרטגי בתחרות העסקית. נושאים כגון: ניתוח נטישת לקוחות, חיזוי הצלחת מוצרים חדשים, חוקים אסוציאטיביים בין רכישות ושימוש בטכנולוגיות מתקדמות ל-BI ו-Big Data נידונים בקורס באופן מעשי ותיאורטי. תחקור אנליטי ויזואלי בסביבה רב ממדית וכן הליכי כריית נתונים ו- BIG DATA נמצאים בפסגת הטכנולוגיות האנליטיות בארגון (BI), ומהווים את הנושאים החמים ביותר כיום בתחום זה. בקורס יילמדו ארכיטקטורות לעיצוב מחסן נתונים אפקטיבי וכן ארכיטקטורות של מוצרי BI. כמו כן יילמדו בקורס מתודולוגיות לאיתור המוטיבציה העסקית בעזרת ניתוח מושכל של הנתונים ומציאת קשרים ביניהם, וכן אלגוריתמים ומודלים אנליטיים מתחום הסטטיסטיקה והאינטליגנציה המלאכותית והעסקית.
פונקציות מרוכבות כולל חישוב אינטגרלים קוויים, שימוש שיטות "מרוכבות" לחישוב אינטגרלים ממשיים. שימושים בהתמרות אינטגרליות – של Fourier, Laplace.
שפת תחשיב הפסוקים: תחביר וסמנטיקה , שקילות לוגית וגרירה לוגית. תורת ההיסק של תחשיב הפסוקים מערכת לוקשביץ, משפט הדדוקציה, נאותות ושלמות של מערכת ההיסק. מערכות נוספות. שפת תחשיב הפרדיקטים: תחביר פורמלי. שמות עצם ותבניות. סמנטיקה בסיסית: מבנים והשמות תבניות אמיתיות במבנה והשמה. תבניות אמיתיות לוגית. תורת ההיסק מסדר ראשון: אקסיומות, כללי היסק, הוכחות. משפט הנאותות, משפט הדדוקציה ומשפטי השלמות והקומפקטיות. משפטי אי השלמות של Godel. אימות תוכנה.
תקציר נושאי הקורס: מבוא לתכנון לינארי. סימפלכס , בעיה פרימלית ודואלית. בעיית התובלה ובעיית ההשמה. תכנות דינאמי .טיפוס נתונים גרף, ייצוגים שונים של גרפים. ואלגוריתמים בסיסיים עליהם. אלגוריתמים למציאת סגור טרנזיטיבי: באמצעות כפל מטריצות ולפי האלגוריתם של וורשל. מסלולי אוילר והמילטון. חיפוש לרוחב - BFS, חיפוש לעומק - DFS. רכיבים קשירים היטב(רק"חים) וגרף על . מיון טופולוגי , מסלולים קריטיים, מסלולים קצרים בגרף – DAG. מסלולים קצרים ביותר ממקור יחיד – מסלולים קצרים ביותר. האלגוריתמים של דייקסטרה ושל בלמן-פורד. מסלולים קצרים ביותר בין כל הזוגות. האלגוריתם: פלויד-וורשאל. אלגוריתמים חמדניים קידוד ועצי הופמן. עץ פורש מינימלי – "הצמחת" עץ פורש מינימלי, האלגוריתמים של קרוסקל ושל פרים. מסלולי אוילר והמילטון.
שפות פורמליות, מכונות מצבים סופיות דטרמיניסטיות ולא דטרמיניסטיות, שפות רגולריות, ביטויים רגולריים, דקדוקים חסרי הקשר, מכונות מחסנית, מכונות טיורינג ושפות כריעות וכריעות למחצה.
למידת מכונה (Machine Learning) לעיתים מכונה גם למידה חישובית היא תת-תחום במדעי המחשב ובבינה מלאכותית המשיק לתחומי הסטטיסטיקה והאופטימיזציה. התחום עוסק בפיתוח אלגוריתמים המיועדים לאפשר למחשב ללמוד מתוך דוגמאות, ופועל במגוון משימות חישוביות בהן התכנות הקלאסי אינו אפשרי או אינו כדאי. למידת מכונה היינו תחום חדש באופן יחסי ולאחרונה אחראי לפריצות דרך משמעותיות בעולמות הבינה המלאכותית, כריית המידע וגילוי אוטומטי של ידע מתוך נתונים. בבסיס תחום זה עומדת היכולת לגרום למחשבים לפעול ״עצמאית״ מבלי לתכנת אותם, וזאת ע״י אנליזה וניתוח כמויות גדולות של מידע מהעבר שיאפשר לזהות תבניות ולחזות התנהגותיות בעתיד. התרגולים: מפגשי התרגול ישלימו את החומר התיאורטי בעזרת תרגילים, הדגמות ועבודות תכנות.
במסגרת הקורס ינתן בסיס מקיף ליסודות של בינה מלאכותית. חלקו הראשון של הקורס יתמקד במושגי בינה מלאכותית של Search & Planning. החלק השני יתמקד בשיטות של Probabilistic reasoning. החומר התאורטי ילווה בדוגמאות
סטטיסטיקה תיאורית, אמידה, תכונות אומדים ושיטות אמידה, רווחי סמך, בדיקת השערות על פרמטרים שונים (מבחני Z, מבחני T, מבחן חי-בריבוע, מבחן F) מבחני טיב התאמה ואי תלות, רגרסיה לינארית פשוטה (אם יישאר זמן), שיטות א-פרמטריות. שימוש בתוכנת R לצורך הרצת חישובים.
נושאים מרכזיים כוללים: היכרות עם מערכות ניהול בסיסי נתונים, המודל הרלציוני, מודל ישויות קשרים (Entity-Relationship Model), SQL, תכנון בסיס הנתונים, פיתוח בסביבת בסיסי נתונים. נשתמש בתוכנה לניהול בסיס נתונים רלציוני כדי לקבל ניסיון מעשי בשימוש בבסיס נתונים.
שימוש במודלים מתמטיים לתכנון ולתפעול מערכות, תכנון לינארי כולל פתרון גרפי, ניסוח מודלים לינראיים לאופטימיזציה, שיטת הסימפלקס, דואליות וניתוח רגישות, בעיות תובלה, בעיית ההשמה, תכנון דינמי, מבוא לתורת ההחלטות.
אתגר מרכזי בארגון הינו הפיכת הנתונים הרבים הנצברים במערכות המחשוב ובמחסן הנתונים הארגוני לתובנות ולידע (Knowledge) עסקי אינטגרטיבי בעל ערך למקבלי החלטות, מתוך מטרה למנף את תשואות הארגון ולהשיג יתרון אסטרטגי בתחרות העסקית. נושאים כגון: ניתוח נטישת לקוחות, חיזוי הצלחת מוצרים חדשים, חוקים אסוציאטיביים בין רכישות ושימוש בטכנולוגיות מתקדמות ל-BI ו-Big Data נידונים בקורס באופן מעשי ותיאורטי. תחקור אנליטי ויזואלי בסביבה רב ממדית וכן הליכי כריית נתונים ו- BIG DATA נמצאים בפסגת הטכנולוגיות האנליטיות בארגון (BI), ומהווים את הנושאים החמים ביותר כיום בתחום זה. בקורס יילמדו ארכיטקטורות לעיצוב מחסן נתונים אפקטיבי וכן ארכיטקטורות של מוצרי BI. כמו כן יילמדו בקורס מתודולוגיות לאיתור המוטיבציה העסקית בעזרת ניתוח מושכל של הנתונים ומציאת קשרים ביניהם, וכן אלגוריתמים ומודלים אנליטיים מתחום הסטטיסטיקה והאינטליגנציה המלאכותית והעסקית.
חומר הקורס כולל: זרימה ברשתות ושימושים בה; התאמת מחרוזות; אלגוריתמי קירוב; מחלקות סיבוכיות וסיווג בעיות לפי השתייכות למחלקות האלו.
מחזור חיים של פיתוח יישומים המבוססים על ניתוח נתוני עתק, כתיבת קוד מקבילי יעיל בסביבות SPARK ו-KAFKA
זהו קורס המשך אשר במסגרתו ייחשף הסטודנט לכל שלבי הפיתוח של אפליקציה או חבילת תוכנה כולל: עיצוב ופיתוח היישום, עיצוב הממשק, יישום אלגוריתם, בחירת ארכיטקטורה ושילוב מסדי נתונים, יישום מתודולגיה, חשיבה ביקורתית, פיתוח ובדיקות מקצה לקצה, תיעוד ומצגת, עבודת צוות וניהול פרויקטים.
במהלך הקורס יוצגו מספר בעיות מעשיות לניתוח ודיון משותף בכיתה. בעיות דומות יינתנו בעבודות בית כמשימה לניתוח ופתרון עצמאי. הנושאים העיקריים הם אופטימיזציה במרחב רציף: בעיות אופטימיזציה ללא אילוצים, נלמד שיטות חיפוש שונות כגון שיטת ניוטון, חיפוש קואורדינטות מחזורי, שיטת המורד התלול, מושגי יסוד באנליזה קמורה (בעיות אופטימיזציה תחת אילוצים) שיטות אנליטיות כגון לגרנז', ותנאי KKT, ושיטות נומריות כגון קנס ומחסום. נלמד על בעיות אופטימיזציה במרחב בדיד וכן נאפיין את הסיבוכיות של שיטות שונות לפתרון בעיות במרחב בדיד כגון תכנון דינמי, תכנון בשלמים לעומת שיטות היוריסטיות לפתרון בעיות גדולות.
בקורס זה נסתכל על למידת מכונה מנקודת מבט הסתברותית. ההנחה הבסיסית היא שהנתונים מגיעים מאיזושהי התפלגות (לעיתים לא ידועה). נלמד שיטות סטטיסטיות בייזיאניות לאמידת פרמטרים לא ידועים של התפלגויות שונות, נשתמש בשיטות קירוב כגון MCMC כדי לאמוד צפיפויות, נסתכל על למידת מכונה מנקודת מבט של תורת ההחלטות וכן נדון במספר בעיות סיווג. נלמד שיטות clustering ואת אלגוריתם EM. נושאים אופציוניליים נוספים הם מודלים הסתברותיים כגון רשתות בייזיאניות ושרשראות מרקוב חבויות. חלק מהחומר הנלמד ניישם באמצעות תוכנת R.
היכולת לעבד מידע ולהסיק מסקנות ממנו ביעילות הינה קריטית בהתמודדות עם כמויות המידע הענקיות של מהפכת האינפורמציה (Big Data). מכונות לומדות לצורך חיזוי ומציאת תבניות כבר הוכיחו את חשיבותם בתחומים כמו זיהוי דיבור, NLP, ראיה ממוחשבת, זהוי הונאות, ועוד. מכונות לומדות הם גם הטכנולוגיה בעלת הפוטנציאל הגדול ביותר לחזון יצירת רובוטים או סוכנים אשר מתנהלים בעולם האמיתי ובדומה ליצורים מבוססי פחמן, מתאימים עצמם ולומדים כדי להשיג מטרתם. בעזרת רשתות נוירונים מלאכותיות שהינן מודלים אדפטיביים המקבלים את השראתם מהמוח וממערכת העצבים המרכזית. רשתות נוירונים עמוקות הינן היום בחזית הטכנולוגיה של למידת מכונה ומשמשות במערכות מסחריות רבות כמו זיהוי ספרות בצ'קים או מיקוד על מעטפות דואר, זיהוי רגש בקול או בתמונה, ראיה ממוחשבת ומכוניות אוטונומיות, תירגום אוטומטי ועוד.... בקורס זה נלמד את היסודות האלגוריתמיים והסטטיסטיים של רשתות נוירונים ונלמד סוגי למידה שונים, כגון למידה מונחית, ולמידה שאינה מונחית (unsupervised). נראה כיצד רשתות נוירונים עמוקות ומייצרים היררכיה של features "טובים", המאפשרים למידה מונחית מדויקת יותר. נלמד את אלגוריתם חלחול השגיאה אחורה ומגוון ארכיטקטורות המאפשרות להתגבר על בעיות באלגוריתם הבסיסי. נסקור רשתות קונוולוציה עמוקות המשמשות בראיה ממוחשבת, רשתות Recurrent ומנגנוני Attention, , לעיבוד שפה טבעית. נלמד גם מודלים שאינם מונחים כמו: autoencoders. self-supervised, ויצירת Embeddings.
במסגרת הקורס, ייחשף הסטודנט לכל שלבי הפיתוח של אפליקציה או חבילת תוכנה כולל: עיצוב ופיתוח היישום, עיצוב הממשק, יישום אלגוריתם, בחירת ארכיטקטורה ושילוב מסדי נתונים, יישום מתודולגיה, חשיבה ביקורתית, פיתוח ובדיקות מקצה לקצה, תיעוד ומצגת, עבודת צוות וניהול פרויקטים
בינה מלאכותית (AI) מתפתחת בקצב מהיר במיוחד. אנו צריכים לצפות לראות שינויים משמעותיים בחברה שלנו כאשר מערכות בינה מלאכותית מוטבעות בהיבטים רבים של חיינו. קורס זה יכסה סוגיות פילוסופיות ופרקטיות שונות שהוצפו בעקבות שימוש במערכות AI נוכחיות ועתידיות. השאלות שנעסוק בהן יבחנו זוויות אתיות שונות דרך מגוון עדשות: כיצד אנו מיישרים את המטרות של מערכות AI אוטונומיות עם המטרות שלנו? האם עתיד הבינה המלאכותית מהווה איום קיומי על האנושות? כיצד אנו מונעים מאלגוריתמי למידה לרכוש הטיות מעוררות התנגדות מוסרית? האם יש להשתמש בבינה מלאכותית אוטונומית כדי להרוג בלחימה? באילו כללים אתיים צריך להשתמש בבינה מלאכותית כמו מכונית בנהיגה עצמית? האם מערכות בינה מלאכותיות יכולות לסבול מנזקים מוסריים? ואם כן, מאילו סוגים? האם מערכות בינה מלאכותית יכולות להיות סוכנים מוסריים? אם כן, כיצד עלינו להטיל עליהם דין וחשבון?
מבוא – חזרה על מושגים ושיטות בהסקה סטטיסטית, רגרסיה ליניארית פשוטה ורבת משתנים, בחירת משתנים ברגרסיה ליניארית, ניתוח שונות חד כיווני (מודל קבוע ומודל אקראי), קונטרסטים וטרנספורמציות על נתונים, ניתוח שונות דו כיווני מצטלב (מודל קבוע ומודל אקראי), תכנון ניסויים, בלוקים אקראיים, ניתוח שונות דו כיווני היררכי (מודל קבוע ומודל אקראי), מודלים א-פרמטריים לניתוח מחקרים.
חומר הקורס כולל: זרימה ברשתות ושימושים בה; התאמת מחרוזות; אלגוריתמי קירוב; מחלקות סיבוכיות וסיווג בעיות לפי השתייכות למחלקות האלו.
היכולת לעבד מידע ולהסיק מסקנות ממנו ביעילות הינה קריטית בהתמודדות עם כמויות המידע הענקיות של מהפכת האינפורמציה (Big Data). מכונות לומדות לצורך חיזוי ומציאת תבניות כבר הוכיחו את חשיבותם בתחומים כמו זיהוי דיבור, NLP, ראיה ממוחשבת, זהוי הונאות, ועוד. מכונות לומדות הם גם הטכנולוגיה בעלת הפוטנציאל הגדול ביותר לחזון יצירת רובוטים או סוכנים אשר מתנהלים בעולם האמיתי ובדומה ליצורים מבוססי פחמן, מתאימים עצמם ולומדים כדי להשיג מטרתם. בעזרת רשתות נוירונים מלאכותיות שהינן מודלים אדפטיביים המקבלים את השראתם מהמוח וממערכת העצבים המרכזית. רשתות נוירונים עמוקות הינן היום בחזית הטכנולוגיה של למידת מכונה ומשמשות במערכות מסחריות רבות כמו זיהוי ספרות בצ'קים או מיקוד על מעטפות דואר, זיהוי רגש בקול או בתמונה, ראיה ממוחשבת ומכוניות אוטונומיות, תירגום אוטומטי ועוד.... בקורס זה נלמד את היסודות האלגוריתמיים והסטטיסטיים של רשתות נוירונים ונלמד סוגי למידה שונים, כגון למידה מונחית, ולמידה שאינה מונחית (unsupervised). נראה כיצד רשתות נוירונים עמוקות ומייצרים היררכיה של features "טובים", המאפשרים למידה מונחית מדויקת יותר. נלמד את אלגוריתם חלחול השגיאה אחורה ומגוון ארכיטקטורות המאפשרות להתגבר על בעיות באלגוריתם הבסיסי. נסקור רשתות קונוולוציה עמוקות המשמשות בראיה ממוחשבת, רשתות Recurrent ומנגנוני Attention, , לעיבוד שפה טבעית. נלמד גם מודלים שאינם מונחים כמו: autoencoders. self-supervised, ויצירת Embeddings.
מחזור חיים של פיתוח יישומים המבוססים על ניתוח נתוני עתק, כתיבת קוד מקבילי יעיל בסביבות SPARK ו-KAFKA
במסגרת הקורס, ייחשף הסטודנט לכל שלבי הפיתוח של אפליקציה או חבילת תוכנה כולל: עיצוב ופיתוח היישום, עיצוב הממשק, יישום אלגוריתם, בחירת ארכיטקטורה ושילוב מסדי נתונים, יישום מתודולגיה, חשיבה ביקורתית, פיתוח ובדיקות מקצה לקצה, תיעוד ומצגת, עבודת צוות וניהול פרויקטים
זהו קורס המשך אשר במסגרתו ייחשף הסטודנט לכל שלבי הפיתוח של אפליקציה או חבילת תוכנה כולל: עיצוב ופיתוח היישום, עיצוב הממשק, יישום אלגוריתם, בחירת ארכיטקטורה ושילוב מסדי נתונים, יישום מתודולגיה, חשיבה ביקורתית, פיתוח ובדיקות מקצה לקצה, תיעוד ומצגת, עבודת צוות וניהול פרויקטים.
בינה מלאכותית (AI) מתפתחת בקצב מהיר במיוחד. אנו צריכים לצפות לראות שינויים משמעותיים בחברה שלנו כאשר מערכות בינה מלאכותית מוטבעות בהיבטים רבים של חיינו. קורס זה יכסה סוגיות פילוסופיות ופרקטיות שונות שהוצפו בעקבות שימוש במערכות AI נוכחיות ועתידיות. השאלות שנעסוק בהן יבחנו זוויות אתיות שונות דרך מגוון עדשות: כיצד אנו מיישרים את המטרות של מערכות AI אוטונומיות עם המטרות שלנו? האם עתיד הבינה המלאכותית מהווה איום קיומי על האנושות? כיצד אנו מונעים מאלגוריתמי למידה לרכוש הטיות מעוררות התנגדות מוסרית? האם יש להשתמש בבינה מלאכותית אוטונומית כדי להרוג בלחימה? באילו כללים אתיים צריך להשתמש בבינה מלאכותית כמו מכונית בנהיגה עצמית? האם מערכות בינה מלאכותיות יכולות לסבול מנזקים מוסריים? ואם כן, מאילו סוגים? האם מערכות בינה מלאכותית יכולות להיות סוכנים מוסריים? אם כן, כיצד עלינו להטיל עליהם דין וחשבון?
במהלך הקורס יוצגו מספר בעיות מעשיות לניתוח ודיון משותף בכיתה. בעיות דומות יינתנו בעבודות בית כמשימה לניתוח ופתרון עצמאי. הנושאים העיקריים הם אופטימיזציה במרחב רציף: בעיות אופטימיזציה ללא אילוצים, נלמד שיטות חיפוש שונות כגון שיטת ניוטון, חיפוש קואורדינטות מחזורי, שיטת המורד התלול, מושגי יסוד באנליזה קמורה (בעיות אופטימיזציה תחת אילוצים) שיטות אנליטיות כגון לגרנז', ותנאי KKT, ושיטות נומריות כגון קנס ומחסום. נלמד על בעיות אופטימיזציה במרחב בדיד וכן נאפיין את הסיבוכיות של שיטות שונות לפתרון בעיות במרחב בדיד כגון תכנון דינמי, תכנון בשלמים לעומת שיטות היוריסטיות לפתרון בעיות גדולות.
מבוא – חזרה על מושגים ושיטות בהסקה סטטיסטית, רגרסיה ליניארית פשוטה ורבת משתנים, בחירת משתנים ברגרסיה ליניארית, ניתוח שונות חד כיווני (מודל קבוע ומודל אקראי), קונטרסטים וטרנספורמציות על נתונים, ניתוח שונות דו כיווני מצטלב (מודל קבוע ומודל אקראי), תכנון ניסויים, בלוקים אקראיים, ניתוח שונות דו כיווני היררכי (מודל קבוע ומודל אקראי), מודלים א-פרמטריים לניתוח מחקרים.
בקורס זה נסתכל על למידת מכונה מנקודת מבט הסתברותית. ההנחה הבסיסית היא שהנתונים מגיעים מאיזושהי התפלגות (לעיתים לא ידועה). נלמד שיטות סטטיסטיות בייזיאניות לאמידת פרמטרים לא ידועים של התפלגויות שונות, נשתמש בשיטות קירוב כגון MCMC כדי לאמוד צפיפויות, נסתכל על למידת מכונה מנקודת מבט של תורת ההחלטות וכן נדון במספר בעיות סיווג. נלמד שיטות clustering ואת אלגוריתם EM. נושאים אופציוניליים נוספים הם מודלים הסתברותיים כגון רשתות בייזיאניות ושרשראות מרקוב חבויות. חלק מהחומר הנלמד ניישם באמצעות תוכנת R.

שאלות ותשובות על תואר ראשון במדעי הנתונים

הלימודים אורכים כ-3 שנים.

הלימודים באפקה מועברים על ידי סגל מרצים מנוסה ומיומן בעל ניסיון אקדמי עשיר לצד ניסיון מעשי וקשרים בתעשייה. הלימודים מתקיימים בכיתות קטנות מה שמאפשר לכל סטודנט לקבל יחס אישי וליווי צמוד של הסגל.

הסטודנטיות והסטודנטים לומדים קורסים במתמטיקה וסטטיסטיקה, למידת מכונה, רשתות נוירונים ולמידה עמוקה, עיבוד שפה טבעית, ניתוח רשתות חברתיות וראייה ממוחשבת.

בוגרי התואר משתלבים בחברות הייטק, תעשיות ביטחוניות, בנקים, חברות פיננסיות, חברות ייעוץ, סטארט-אפים, מרכזי מחקר ופיתוח ועוד.

חברות כמו גוגל, מיקרוסופט, אמזון, Waze, בנקים, חברות ביטוח, גופי מחקר, סטארט-אפים בתחום הבינה המלאכותית ועוד.

כן, ניתן להמשיך לתואר שני בתחומים כמו מדעי הנתונים, בינה מלאכותית, סטטיסטיקה, מדעי המחשב והנדסה.

בפני הסטודנטים הלומדים מדעי הנתונים באפקה יש אפשרות לבחור מבין לא פחות מחמישה קורסים: ניתוח רשתות חברתיות, עיבוד זיהוי ותמונה, רשתות נוירונים לראייה ממוחשבת, עיבוד שפה טבעית, מודלים ניהוליים מבוססי נתונים.

מדעי הנתונים עוסקים בניתוח כמויות גדולות של נתונים, פיתוח אלגוריתמים ולמידת מכונה, במטרה להפיק תובנות, לחזות מגמות ולתמוך בהחלטות עסקיות וטכנולוגיות.

 כן, במהלך התואר משולבים פרויקטים מעשיים, כולל פרויקט גמר שבו מפתחים מודלים יישומיים, בדומה לעבודה של Data Scientist בתעשייה.

השכר ההתחלתי גבוה מהממוצע במשק, אך משתנה בהתאם לניסיון, תחום ההתמחות וגודל החברה.

תוכנית חדשנית עם דגש על  AI , קורסי בחירה מעשיים, מרצים מובילים מהתעשייה והאקדמיה, ליווי אישי ולמידה בקבוצות קטנות.

חשיבה אנליטית, פתרון בעיות, שליטה במתמטיקה וסטטיסטיקה, תכנות, יכולת למידה עצמאית ועבודה עם נתונים בהיקפים גדולים.

סגל אקדמי

ד"ר ליאור רוזנצוייג

מילה מראש התוכנית למדעי הנתונים:

ד"ר ליאור רוזנצויג

ד"ר ליאור רוזנצוייג

מילה מראש התוכנית למדעי הנתונים:

בעידן הנוכחי, בו חלה עלייה משמעותית במאגרי המידע הזמינים והנאספים על ידי ארגונים וחברות שונות, היכולת והאפשרות לעבד ולנתח נתונים אלה ולהסיק מהם מסקנות שיכולות להשפיע כמעט על כל פן בחיינו, הפכו להיות חלק מהותי במגוון רחב של תחומי עיסוק במשק. בעולם ההייטק, במחקר הרפואי, בעולם העסקי, בעולם השיווקי ובתחומים רבים אחרים, הדרישה לבעלי ידע בניתוח נתוני עתקוהסקת מסקנות מתוחכמת הולכת וגדלה בשנים האחרונות, והביקוש הפך למשימה לאומית תוכנית הלימודים במדעי הנתונים מעניקה לסטודנטים ידע מקיף ומעמיק בתחום. היא מתמקדת בהענקת ידע מעמיק בתחומי המתמטיקה, סטטיסטיקה, תכנות ואלגוריתמיקה.

לכל חברות וחברי הסגל

צרו קשר

לשכת הנהלה אקדמית

טלפון: 03-7688691/744
פקס: 03-7688692
דוא"ל: AcademicHeadsBox@afeka.ac.il

מחלקת ייעוץ לימודים 

ימים א'-ה': 09:00-19:00 | יום ו': 09:00-13:00
חייגו: 1-800-37-37-10 (שלוחה 1)
פקס: 03-7688679
מייל להרשמה: mirsham@afeka.ac.il