Mashav.AI
לכל הפוסטים

נתתי לסוכן AI לבנות מערכת תורים בזמן שישנתי. הנה מה שבאמת קרה.

claudeagentsautomation

התשובה הקצרה: כן, סוכן AI יכול לבנות מוצר עובד בלילה אחד, אבל רק אם משקיעים את הערב שלפני בהנדסת המשימה במקום בקוד.

לילה אחד נתתי ל-Claude משימה אוטונומית: לבנות את Tor.AI, מערכת תורים וקופה למספרות, עברית קודם. FastAPI, SQLite, HTMX, ממשק מלא מימין לשמאל. הלכתי לישון. בבוקר חיכתה מערכת רצה: יומן תורים, מאגר לקוחות, מסך תשלום, ועברית שנקראת טבעי.

מה גרם לזה לעבוד

ההצלחה כמעט לא קשורה ללילה עצמו. היא הגיעה משלוש החלטות שקיבלתי לפני שסגרתי את המחשב:

משימה כתובה, לא הודעת צ'אט. הסוכן קיבל קובץ אפיון: מה המוצר, מי משתמש בו, מה נחשב "גמור", ובמה אסור לגעת. מטרות מעורפלות מייצרות תוכנה מעורפלת.

לולאות בדיקה שהוא מריץ לבד. לכל פיצ'ר הייתה דרך לבדוק את עצמו: להרים שרת, לקרוא ל-endpoint, לקרוא את השגיאה. סוכן שלא יכול לבדוק את העבודה של עצמו רק צובר טעויות בביטחון מלא.

טכנולוגיה קטנה ומשעממת. FastAPI ועוד SQLite ועוד HTMX אומר בלי build, בלי קלאסטר, בלי מה להגדיר בשלוש בלילה. פחות תשתית, יותר רחוק הסוכן מגיע.

מה נשבר

פרטי ימין-לשמאל היו צריכים עין אנושית בבוקר: יישור מספרים, פורמט תאריכים, וכמה ניסוחים שהיו עברית תקינה טכנית אבל לא איך שספר מדבר. הסוכן גם בנה יותר מדי במקום אחד, והוסיף מסך הגדרות שאף אחד לא ביקש. אוטונומיה מגבירה גם את הבהירות שלכם וגם את העמימות שלכם.

שאלות ששואלים אותי על זה

הקוד היה ברמה של פרודקשן? הוא היה ברמת פיילוט טובה: מבנה נקי, בדיקות עובדות על הזרימות המרכזיות. עברתי על הכל לפני שהראיתי למישהו.

כמה כתבתי בעצמי? בערך כלום במהלך הלילה. בבוקר השקעתי שעה בליטוש ובתיקוני RTL.

שווה לנסות? כן, על פרויקט עם גבולות ברורים וסטאק שאתם כבר מכירים. הריצה הלילית היא החלק הקל. לכתוב משימה שסוכן לא יכול להבין לא נכון, זו המיומנות.

רוצים לדבר על משהו שקראתם כאן?

דברו איתי