שיעור 0.3 - Prompt Engineering: כתיבת פרומפטים אפקטיביים

שלום וברוכים הבאים לשיעור 0.3, השיעור האחרון במודול הבסיס. היום נלמד את אחד הנושאים הכי חשובים בכל הקורס – Prompt Engineering, או בעברית: אומנות כתיבת ההנחיות.

למה אני אומר "הכי חשוב"? כי כל מה שנלמד מכאן והלאה – אוטומציות, בוטים, אפליקציות, שיווק – הכל מבוסס על פרומפטים. פרומפט טוב שווה תוצאה טובה. פרומפט גרוע שווה תוצאה גרועה. זה פשוט כזה.

[מעבר שקף]

השיעור הזה הוא ארבע שעות, הכי ארוך במודול, כי יש המון חומר מעשי. נתחיל מהבסיס, מה זה פרומפט ולמה הוא חשוב. אחר כך נלמד שש טכניקות מרכזיות בסדר עולה. נדבר על System Prompts, איך בונים הוראות קבועות ל-AI. נכיר את Extended Thinking ומצבי Reasoning. נדבר על Context Engineering, הרמה הבאה. ובסוף נבנה ספריית פרומפטים, הפרויקט של המודול.

[מעבר שקף]

בואו נתחיל עם דוגמה. שני אנשים שואלים את Claude אותה שאלה.

אדם א' כותב: "תכתוב לי מייל"

אדם ב' כותב: "אתה מנהל שיווק בחברת SaaS ישראלית. כתוב מייל follow-up ללקוח פוטנציאלי שנפגשנו איתו לפני שבוע בכנס. הטון מקצועי אבל חם. אורך חמישה עד שבעה שורות. כלול CTA אחד ברור."

מי יקבל תוצאה טובה יותר? ברור שאדם ב'. ההבדל הוא לא ב-AI, הוא בפרומפט.

ומחקר עדכני משנת אלפיים ועשרים ושש מראה שרוב הכשלונות עם AI נובעים מעמימות בפרומפט, לא ממגבלות המודל. מבנה ברור עובד טוב יותר מניסוח "חכם".

[מעבר שקף]

יש נוסחה פשוטה שעובדת כמעט תמיד. ארבעה רכיבים שנקראים RTCF.

ה-R הוא Role, כלומר מי ה-AI. לדוגמה: "אתה מומחה שיווק דיגיטלי עם עשר שנות ניסיון".

ה-T הוא Task, כלומר מה לעשות. לדוגמה: "כתוב שלוש גרסאות של מייל שיווקי".

ה-C הוא Context, כלומר ההקשר. לדוגמה: "עבור חנות אונליין של תכשיטים, קהל יעד נשים בין עשרים וחמש לארבעים וחמש".

ה-F הוא Format, כלומר איך להציג. לדוגמה: "כל גרסה עד חמש שורות, כלול נושא למייל".

זה מה שנקרא RTCF. חלק מהאנשים קוראים לזה בשמות אחרים, אבל העיקרון אותו עיקרון.

נקודה חשובה משנת אלפיים ועשרים ושש: מחקרים מראים שהנקודה המתוקה לאורך פרומפט היא בין מאה וחמישים לשלוש מאות מילים. מעל שלושת אלפים טוקנים, יכולת ה-Reasoning של המודל מתחילה לרדת. אז יותר לא תמיד טוב יותר.

ונקודה נוספת: שפה אגרסיבית כמו "חובה!", "אסור בשום פנים!", "קריטי!!!" דווקא פוגעת בביצועים, במיוחד בדגמים החדשים של Claude Sonnet ארבע נקודה שש. הוראות רגועות וברורות עובדות טוב יותר.

ועוד משהו שחשוב לדעת על Claude ארבע נקודה שש בפרט: הוא מבצע הוראות מילולית. אם לא ביקשתם משהו במפורש, לא תקבלו אותו. הגרסאות הקודמות היו יוזמות ומוסיפות מעצמן. Claude ארבע הוא מדויק יותר אבל פחות "יצירתי" בלי בקשה. לכן חשוב לכתוב פרומפטים ספציפיים ומלאים יותר.

[מעבר שקף]

לפני שנמשיך לטכניקות, יש הבחנה חשובה שכל AI Engineer חייב להכיר: ההפרדה בין Casual Prompting לבין Production Prompting.

Casual Prompting הוא מה שרוב האנשים עושים. פותחים את ChatGPT או Claude, כותבים שאלה, מקבלים תשובה. אפשר לתקן, אפשר לנסות שוב, לא נורא אם התוצאה לא מושלמת בדיוק.

Production Prompting הוא עולם אחר לגמרי. הפרומפט הוא חלק ממערכת, API, בוט, אוטומציה, ורץ אלפי פעמים ביום בלי שאנחנו שם לפקח. אחריות אחרת לגמרי.

אז מה שונה בפרומפטים לפרודקשן? שישה כללים.

ראשית, ניהול גרסאות. פרומפטים בפרודקשן הם קוד לכל דבר. שמרו גרסאות, כתבו Changelog. לדוגמה: System Prompt גרסה אחת נקודה שלוש, תיקון הטיה בסיווג פניות.

שנית, Testing לפני Deploy. בדקו על עשרים עד חמישים דוגמאות נציגות לפני שמשלבים במערכת. שינוי קטן בפרומפט יכול לשנות תוצאות בצורה לא צפויה.

שלישית, פורמט פלט מוגדר. פרומפטים בפרודקשן מחזירים JSON, לא טקסט חופשי. כך המערכת יכולה לפרס את התשובה.

רביעית, Error Handling. מה קורה כש-AI מחזיר תשובה שלא עומדת בפורמט? כתבו Fallback.

חמישית, ניטור עלויות. כמות טוקנים כפול מחיר כפול נפח קריאות שווה עלות חודשית. חשבו את זה לפני שמשיקים.

שישית, מוניטורינג איכות לאורך זמן. מודלים מתעדכנים. מה שעבד לפני חצי שנה עלול להתנהג אחרת היום.

מי שרוצה לבנות מוצר AI ולא רק להשתמש ב-AI, חייב לחשוב ב-Production Mindset.

[מעבר שקף]

הטכניקה הראשונה והפשוטה ביותר נקראת Zero-Shot. זה אומר שאנחנו שולחים בקשה ל-AI בלי שום דוגמה. פשוט מבקשים ומקבלים.

דוגמה: "סווג את הטקסט הבא כחיובי, שלילי או ניטרלי: הפיצה הייתה טעימה אבל השירות איטי"

מודלי AI מספיק חכמים בשנת אלפיים ועשרים ושש להבין הרבה משימות בלי דוגמאות. ההמלצה היא: תמיד תנסו Zero-Shot קודם. אם התוצאה טובה, מצוין, חסכתם טוקנים ועלויות. רק אם Zero-Shot לא מספיק, עברו לטכניקות מתקדמות יותר.

מתי Zero-Shot עובד? למשימות סטנדרטיות: סיכום, תרגום, סיווג, כתיבה כללית, שאלות ותשובות. אלה הם שמונים אחוז מהמקרים שתפגשו בעבודה האמיתית.

[מעבר שקף]

הטכניקה השנייה נקראת Few-Shot, ומשמעותה לתת ל-AI דוגמאות לפני הבקשה. זו אחת הטכניקות עם ה-ROI הכי גבוה. שלוש עד חמש דוגמאות מגוונות יכולות לשפר דרמטית את איכות התוצאה.

דוגמה: אם רוצים ש-AI יסווג פניות לקוחות, נותנים לו שלוש עד חמש דוגמאות קודם.

פנייה ראשונה: "המוצר הגיע שבור", קטגוריה: תלונה, דחיפות: גבוהה.
פנייה שנייה: "מתי תהיה הנחה?", קטגוריה: שאלה, דחיפות: נמוכה.
פנייה שלישית: "רוצה לבטל הזמנה", קטגוריה: ביטול, דחיפות: בינונית.

ואז שולחים פנייה חדשה: "לא קיבלתי את החבילה", ושואלים מה הקטגוריה.

טיפ חשוב ל-Claude Sonnet ארבע נקודה שש: עטפו דוגמאות בתגיות XML. Claude עובד הכי טוב עם תגיות כמו example ו-examples. זה עושה הבדל מדיד בביצועים. לעומת זאת, ChatGPT-5 עובד טוב יותר עם Markdown.

[מעבר שקף]

הטכניקה השלישית נקראת Chain of Thought, או בקיצור CoT. זו אחת הטכניקות הכי חזקות ל-Reasoning, ומחקרים מראים שיפור של עד תשע עשרה נקודות אחוז במשימות מורכבות.

הרעיון פשוט: במקום לבקש תשובה ישירה, מבקשים מ-AI לחשוב שלב אחרי שלב.

הגרסה הכי פשוטה נקראת Zero-Shot CoT, והיא פשוט להוסיף "בוא נחשוב על זה שלב אחרי שלב" לפרומפט. זה נשמע טריוויאלי, אבל זה עובד.

דוגמה: "חנות מוכרת מוצר במאה שקל. עלות המוצר שישים שקל. עלות משלוח חמישה עשר שקל. עמלת כרטיס שלושה אחוז. מה הרווח הנקי? חשוב שלב אחרי שלב."

AI יפרט: מאה שקל מחיר מכירה, פחות שישים עלות, פחות חמישה עשר משלוח, פחות שלושה שקל עמלה, שווה עשרים ושניים שקל רווח נקי.

בלי CoT, AI עלול לדלג על שלבים ולטעות.

אבל יש נקודה חשובה בשנת אלפיים ועשרים ושש: מודלים עם Reasoning מובנה, כמו GPT-5.4 Thinking ו-Claude עם Extended Thinking, כבר עושים Chain of Thought בפנים. אז אם אתם משתמשים במצב Thinking, אל תוסיפו "חשוב שלב אחרי שלב", זה מיותר ואפילו יכול להזיק.

[מעבר שקף]

הטכניקה הרביעית נקראת Tree of Thought, או ToT. זו גרסה מתקדמת של Chain of Thought שבה AI בוחן מספר נתיבי חשיבה במקביל, כמו עץ עם ענפים.

דוגמה: "אני רוצה לפתוח עסק חדש. חשוב על שלושה כיוונים שונים. לכל כיוון, נתח יתרונות, חסרונות וסיכויי הצלחה. ואז המלץ על הכיוון הכי טוב."

AI ייצור שלושה ענפים, ינתח כל אחד, ואז יבחר את הטוב ביותר.

אבל בשנת אלפיים ועשרים ושש ההמלצה היא: אל תשתמשו ב-Tree of Thought בשגרה. זה צורך הרבה טוקנים ובהתאם עולה יותר. בתשעים ותשעה אחוז מהמקרים, Chain of Thought רגיל מספיק. Tree of Thought שווה רק למשימות high-stakes שבהן חשוב לבחון מספר אפשרויות לפני החלטה.

[מעבר שקף]

הטכניקה החמישית נקראת Role Prompting. כבר הזכרנו אותה כחלק מ-RTCF, אבל היא שווה העמקה.

כשנותנים ל-AI תפקיד, הוא מתנהג אחרת. "אתה מומחה SEO" ייתן תשובה שונה מ"אתה מנכ"ל". "אתה כותב קופי ישראלי מנוסה" ייתן טון שונה מ"אתה כותב אקדמי".

כלל אצבע: ככל שהתפקיד ספציפי יותר, התוצאה טובה יותר.

גרוע: "אתה עוזר".
בינוני: "אתה מומחה שיווק".
מצוין: "אתה מנהל שיווק דיגיטלי בחברת SaaS ישראלית עם חמש שנות ניסיון, מתמחה ב-B2B. הלקוחות שלך הם בעלי עסקים קטנים-בינוניים."

בשנת אלפיים ועשרים ושש, Role Prompting הוא חלק בלתי נפרד מכל System Prompt טוב.

[מעבר שקף]

הטכניקה השישית נקראת Self-Consistency. הרעיון: מבקשים מ-AI לייצר כמה תשובות שונות לאותה שאלה, ואז לבחור את התשובה שמופיעה הכי הרבה, או לסנתז את הטובה מביניהן.

דוגמה: "תן שלוש תשובות שונות לשאלה הזו, ואז בחר את התשובה הכי טובה ונמק."

זה שימושי במיוחד כשיש אי-ודאות: ניתוח משפטי, קבלת החלטות עסקיות, אבחון בעיות טכניות.

טיפ מעשי: אם התשובות מאוד שונות זו מזו, זה סימן שהשאלה לא מספיק ברורה, או שה-AI לא בטוח בתשובה. וזה בעצמו מידע שימושי.

[מעבר שקף]

בואו נסכם את שש הטכניקות.

Zero-Shot הוא פשוט ומהיר, עבור משימות סטנדרטיות. תנסו תמיד קודם.
Few-Shot מבוסס על דוגמאות, עם ROI גבוה. שלוש עד חמש דוגמאות מגוונות.
Chain of Thought הוא שלב אחרי שלב, למשימות מורכבות. מיותר עם Thinking mode.
Tree of Thought הוא ענפים מקבילים, רק למשימות high-stakes.
Role Prompting מבוסס על תפקיד ספציפי, חלק מכל פרומפט טוב.
Self-Consistency נותן כמה תשובות לבחירה מושכלת.

Zero-Shot עם RTCF מכסה שמונים אחוז מהמקרים בעבודה האמיתית. שמרו את הטכניקות המתקדמות לאותם עשרים אחוז שדורשים יותר.

[מעבר שקף]

System Prompt הוא הנחיה קבועה שמגדירה את ההתנהגות של AI לאורך כל השיחה. בממשק של ChatGPT-5 זה נקרא Custom Instructions. ב-Claude זה ה-System Prompt ב-API.

כשאתם בונים בוט או אוטומציה, ה-System Prompt הוא הלב. הוא קובע מי ה-AI, מה הוא עושה, מה הוא לא עושה, ובאיזה פורמט.

מבנה מומלץ, כמו חוזה, כולל ארבעה חלקים.

ראשית, Role, כלומר מי אתה. לדוגמה: "אתה נציג שירות של חברת טכנולוגיה ישראלית".
שנית, Success Criteria, כלומר מה נחשב הצלחה. לדוגמה: "תשובה מועילה תוך שני משפטים".
שלישית, Constraints, כלומר מה אסור. לדוגמה: "לעולם אל תמציא מידע. אם אתה לא בטוח, אמור שאתה לא בטוח".
רביעית, Output Format, כלומר איך לענות. לדוגמה: "JSON עם שדות: answer, confidence, source".

טיפ ל-Claude Sonnet ארבע נקודה שש: השתמשו בתגיות XML למבנה, כמו instructions, context, rules. Claude עובד עם תגיות XML הרבה יותר טוב מ-Markdown.

טיפ ל-ChatGPT-5: Markdown עם headers עובד מצוין.

ונקודה קריטית: תנו ל-AI רשות לומר "אני לא בטוח" או "אני לא יודע". זה מפחית הזיות בצורה משמעותית.

[מעבר שקף]

אחד השינויים הגדולים בשנת אלפיים ועשרים ושש הוא ש-Reasoning מובנה כבר בתוך המודלים המובילים.

ב-Claude, יש מצב שנקרא Extended Thinking שנותן למודל יותר זמן לחשוב לפני שעונה. אפשר להפעיל אותו בממשק עם כפתור, או ב-API עם פרמטר. אפשר אפילו להגדיר "תקציב חשיבה", כלומר כמה טוקנים AI יכול לצרוך על חשיבה.

הגרסה החדשה נקראת Adaptive Thinking והיא ההמלצה הנוכחית: במקום להגדיר תקציב ידנית, Claude מחליט לבד כמה לחשוב בהתאם למורכבות השאלה.

ב-GPT, מצב ה-Thinking מראה תוכנית חשיבה מראש, ואפשר לכוון תוך כדי.

גם ל-Gemini 3.1 Pro של גוגל יש מצב דומה, עם חלון הקשר של מיליון טוקנים.

מתי להשתמש? משימות מתמטיות, קוד מורכב, ניתוח לוגי, קבלת החלטות רב-שלבית.

מתי לא? משימות פשוטות כמו כתיבת מייל או סיכום טקסט. שם Thinking mode רק מבזבז טוקנים ועולה יותר.

וכלל זהב: אם אתם משתמשים ב-Thinking mode, אל תוסיפו "חשוב שלב אחרי שלב" בפרומפט. המודל כבר עושה את זה בפנים.

[מעבר שקף]

ועכשיו נדבר על המושג החם ביותר בשנת אלפיים ועשרים ושש: Context Engineering. מה זה?

Prompt Engineering הוא לכתוב הנחיה טובה. Context Engineering הוא לבנות את כל הסביבה שבה ה-AI עובד.

זה כולל חמישה רכיבים.

ראשית, System Prompt, שהן ההוראות הקבועות.
שנית, היסטוריית שיחה, כלומר מה דובר קודם.
שלישית, מסמכים מצורפים, קבצים ונתונים.
רביעית, כלים זמינים, כלומר מה AI יכול לעשות, כמו לשלוח מייל או לקרוא ממסד נתונים.
חמישית, Memory ו-RAG, כלומר מה AI זוכר מפגישות קודמות ומידע שנשלף ממאגר ידע.

כש-AI Engineer בונה סוכן AI, הוא לא רק כותב פרומפט. הוא מעצב את כל ההקשר שבו הסוכן פועל. לזה קוראים Context Engineering.

דוגמה מעשית: כשתבנו בוט לוואטסאפ לחנות, ה-Context יכלול: System Prompt עם ההוראות, קטלוג המוצרים דרך RAG, היסטוריית הזמנות של הלקוח דרך Tool call ל-CRM, Memory של שיחות קודמות, וכלים לשליחת הצעת מחיר ולקביעת פגישה.

זה הרבה מעבר ל"כתיבת פרומפט". גארטנר, אחת מחברות המחקר המובילות בעולם, פרסמה בשנת אלפיים ועשרים ושש שעד שנת אלפיים ועשרים ושבע, שמונים אחוז מכשלות ה-AI בארגונים ינבעו מניהול הקשר גרוע, לא מבעיות במודל עצמו. זה מראה כמה Context Engineering הפך למרכזי. ונלמד את זה לעומק במודולים שניים וחמישה.

[מעבר שקף]

ועכשיו נדבר על נושא שקשור ישירות ל-Context Engineering: ניהול הקשר בפרומפטים.

המודלים המובילים בשנת אלפיים ועשרים ושש, Claude ו-Gemini 3.1 Pro, תומכים בחלון הקשר של מיליון טוקנים. זה נשמע ענק. אבל יש שלוש מלכודות שחייבים להכיר.

המלכודת הראשונה נקראת Lost in the Middle. מחקרים מראים שמודלים זוכרים טוב יותר את תחילת הפרומפט ואת הסוף שלו. מה שנמצא באמצע נוטה להישכח. לכן כלל זהב: שימו הוראות קריטיות בתחילת ה-System Prompt. שימו דוגמאות Few-Shot בסוף, ממש לפני הבקשה.

המלכודת השנייה נקראת Context Rot. ככל שהשיחה ארוכה יותר וממלאת את חלון ההקשר, דיוק ה-AI יורד בהדרגה. הפתרון: Compaction, כלומר סיכום אוטומטי של שיחות קודמות. ב-Claude, auto-compaction מופעל כשמגיעים לשמונים אחוז מהחלון.

המלכודת השלישית היא עלות. כל טוקן עולה כסף. System Prompt ארוך, היסטוריית שיחה, מסמכי RAG, הכל מצטבר. בפרודקשן, ניהול טוקנים שווה ניהול עלויות. כתבו System Prompts קומפקטיים, נקו היסטוריה לא רלוונטית.

לסיכום כללי הזהב לניהול הקשר: הוראות חשובות בתחילת הפרומפט. דוגמאות בסוף. שיחות ארוכות מקבלות Compaction. ותמיד בדקו כמה טוקנים השיחה שלכם שוקלת.

[מעבר שקף]

עכשיו בואו נדבר על הפרויקט של מודול אפס: בניית ספריית פרומפטים אישית.

כל סטודנט יבנה ספרייה של לפחות עשרה פרומפטים מותאמים אישית לעסק או לתחום שלו. כל פרומפט צריך לכלול שישה רכיבים.

אחד: שם הפרומפט.
שניים: מטרה, כלומר מה הוא עושה.
שלושה: הפרומפט עצמו, מלא, עם RTCF.
ארבעה: טכניקה, באיזו טכניקה השתמשתם.
חמישה: מודל מומלץ, כלומר ChatGPT-5.4 Thinking, Claude Sonnet ארבע נקודה שש, או Gemini 3.1 Pro.
שישה: דוגמה לתוצאה.

אפשר להשתמש ב-Google Docs, Notion, או אפילו קובץ טקסט פשוט.

[מעבר שקף]

הנה כמה דוגמאות לסוגי פרומפטים שכדאי לכלול בספרייה: פרומפט לכתיבת מייל מכירות, פרומפט לסיכום פגישה, פרומפט לניתוח מתחרים, פרומפט ליצירת פוסטים לרשתות חברתיות, פרומפט לסיווג פניות לקוחות, פרומפט לכתיבת הצעת מחיר, פרומפט ליצירת תוכן SEO, פרומפט לניתוח ביקורות לקוחות, System Prompt לבוט שירות לקוחות, ופרומפט ליצירת תמונות מוצר.

אלה רק דוגמאות. תתאימו לתחום שלכם. ככל שהפרומפטים יהיו מותאמים יותר לצרכים האמיתיים שלכם, כך הם יהיו שימושיים יותר.

[מעבר שקף]

בואו נסכם. למדנו היום את הנוסחה הבסיסית לכל פרומפט: RTCF, שמשמעותה Role, Task, Context, Format. זה אחד הכלים הפרקטיים ביותר שתקחו מהשיעור הזה.

למדנו את ההבדל בין Casual Prompting לבין Production Prompting. מי שבונה מוצרי AI חייב לחשוב ב-Production Mindset: גרסאות, Testing, JSON output, ניטור עלויות ומוניטורינג איכות.

למדנו שש טכניקות. Zero-Shot כנקודת התחלה לכל משימה. Few-Shot עם שלוש עד חמש דוגמאות כשצריך שיפור. Chain of Thought לחשיבה שלב אחרי שלב. Tree of Thought רק למשימות high-stakes. Role Prompting לספציפיות ועומק. ו-Self-Consistency לקבלת החלטות בתנאי אי-ודאות.

למדנו ש-System Prompts הם הלב של כל בוט ואוטומציה, ושמבנה ברור עם Role, Success Criteria, Constraints ו-Output Format עושה הבדל עצום.

למדנו על Extended Thinking ו-Adaptive Thinking ב-Claude, ועל מצבי Reasoning ב-GPT-5.4 Thinking וב-Gemini 3.1 Pro. כשמשתמשים ב-Thinking mode, לא צריך Chain of Thought ידני.

ולמדנו שני מושגים מרכזיים: Context Engineering, שהוא עיצוב כל הסביבה שבה ה-AI פועל, ו-Context Management, שכולל את Lost in the Middle, Context Rot, וניהול עלויות טוקנים. AI Engineer טוב מבין ששני אלה הם הבסיס לכל מערכת AI בפרודקשן.

[מעבר שקף]

בשיעור הבא נתחיל את מודול אחד: אוטומציות עסקיות. ניכנס ישר לעבודה מעשית עם Make.com. נבנה את האוטומציה הראשונה שלנו, ותראו איך כל מה שלמדנו היום על פרומפטים משתלב ישירות בבניית אוטומציות חכמות.

תודה רבה, עשיתם עבודה מעולה. קחו את הזמן לבנות את ספריית הפרומפטים שלכם, זה ההשקעה הכי משתלמת שתעשו בשלב הזה של הקורס. ונתראה בשיעור הבא.
