צ׳יטוט בינה מלאכותית ועתיד האות העברית – ירונימוס, מתי מריאנסקי ואבירן רווח

בחודשים האחרונים לא יכולתי שלא לחוות את השינויים בעולם הטכנולוגיה, העיצוב והיצירה האנושית – עם כניסתן של טכנולוגיות בינה מלאכותית (AI) חדשות ומושגים כמו ״למידת מכונה״. לכן החלטתי להזמין שני יוצרים לשיחה ספקולטיבית על האפשרויות החדשות ועל ההשפעה האפשרית שלהן על עולם הטיפוגרפיה העברי. אני ירונימוס (אתם יכולים לראות את התמונה שלי בקאבר, יושב מימין), ארט דירקטור ויוצר עולמות, לפני כמה שנים הקמתי את ״הלשכה לטיפוגרפיה עברית״, ומדי פעם אני גם כותב במגזין אות־אות־אות.

Ē לינק להאזנה לפודקאסט

היוצר הראשון הוא אבירן רווח (יושב במרכז), ראש עיצוב בחברת ״סולוטו״ בעבר, והיום בחברת ביט העולמית, ומרצה לעיצוב מוצר (product design) בשנקר. היוצר השני הוא מתי מריאנסקי (יושב משמאל בתמונת הקאבר למעלה) – אמן ויזם העוסק בתחום למידת מכונה, מדיה סינתטית ואמנות גנרטיבית, מייסד קבוצת הפייסבוק ״עליית המכונות״.

היי חברים, נראה לי שאחרי כל ההקדמות אפשר להתחיל עם השאלה הראשונה - מה זה בעצם אומר להיות מעצב עכשווי עם כל ה־AI מסביבנו, ולמה לדעתכם עדיין נצטרך מעצבים ונגישות בעתיד הקרוב?
יש משהו שהרבה אנשים מפספסים לגבי כלים של AI: המחיר של לעשות טעות וליצור ניסיון נוסף הוא אפסי, וזו אחת המתנות הכי גדולות שאנחנו מקבלים מהכלים האלה. תחשבו על זה שלפעמים אתם מגישים את הסקיצות ללקוח והוא רוצה עוד שלוש סקיצות אבל לכם כבר נגמר הכח.

פה המקרה פשוט הפוך! אם כל מה שצריך כדי לקבל עוד גרסה זה פשוט ללחוץ refresh, כשאתה מגיע לסוף העבודה אתה הרבה יותר בטוח בעצמך כי עשית סיבוב שלם, ראית את כל הכיוונים ובדקת הכל. כמובן שמצד שני זה גורם לך ל־FOMO מטורף, כי תמיד תרצה ללחוץ עוד פעם.

אני חושב שאולי הרף של להיות מעצב ירד, אבל מה ההבדל בין מעצב לבין מי שלא מעצב? למעצב יש יכולת לבחור את המסרים ולארוז אסטרטגיה יותר רוחבית. כשעבדתי עם לקוחות בעבר, הם תמיד אמרו מה הם רוצים בצורה מאוד מפורשת, וזה יכול להיראות בהתחלה סתמי ולא מקצועי, אבל תמיד יש בבקשות שלהם מסר חבוי, תוכן או ידע שרק הם יודעים.

אחד היתרונות שלי בתור מעצב, זה לזקק ללקוחות את מה שהם ביקשו באופן שהם לא יכלו לעשות לבד, גם אם היה להם איזה כלי AI שיודע לייצר סקיצות. הם לא ידעו בדיוק איך להתנסח, ויכול להיות שהתוצאה תהיה מה שהם רצו, אבל לא בטוח שזה מה שהם צריכים. אם אני לא מעצב ואצטרך להחליט בעצמי, אני לא אדע אם אם מה שיצא לי זה נכון, ואני אצטרך מישהו שיגיד לי אם זה טוב או לא טוב. אחרת - האחריות על ההצלחה של העיצוב היא עלי.

אני הייתי קורא לזה פשוט ״טעם״. אני כמעצב מגיע עם איזשהו טעם שרכשתי במסע שלי, בין אם בלימודים או איזה סטייל מטורף שיש לי מלידה.
נראה לי שמה שהוא מתכוון זה שכשאני בוחר את מָתִי, אני בוחר אותו כי אני מכיר את האופי שלו, הוא כזה שובב, והוא יביא לי משהו שהוא מָתִי. אבל לפעמים יש גם עניין של אחריות של בעל מקצוע בנישה מסוימת, שיודעים איך להתמצא בה.
מעצב טוב מביא משהו מאוד ספציפי, או שאתה פשוט יכול לסמוך עליו. זו הסיבה שבחרת את המעצב הזה על פני מעצבים אחרים. מנכ״ל יוניליוור לא יפנה זמן כדי לעצב את האריזה הבאה של הגלידות שלהם. הוא יודע שהוא מבין בלהיות מנכ"ל, לנהל עובדים ולדרבן אותם, לא באופנה האחרונה של צילומי הגלידות. עם זאת הכלים משתנים באופן דרסטי. הצלם אולי לא צריך יותר מצלמה, והמעצב לא צריך יותר אילוסטריטור, והסיבה שאעסיק אותו היא הטעם שעושה אותו למעצב שהוא.
הדבר ש־AI לא יכול להחליף כרגע, זה שה־AI לא חווה כלום, לא יוזם, ולא מבין בחוויה האנושית. למשל אם צריך לתכנן מוצר חדש לקהל יעד מסוים, הוא לא יודע להביט פנימה, להסיק מסקנות רלוונטיות עבורם, או להזדהות איתם בצורה אמיתית. הוא יודע לשאוב השראה מדברים שכבר קיימים. כשעושים אמנות יש תמיד משהו שמגיע מתוך חוויה אנושית נטו שאנחנו מנסים לעשות באופן חדשני. לדוגמה כשנכנסים לאתר דריבל, רואים עיצובים שנראים משוכפלים, מעין גילוי עריות דריבלי כזה. מה ש־AI עושה עכשיו זה ליצור עוד מאותו דבר - רק פי אלף.
ממה שאמרתם אני מסיק שה־AI מאפשר לנו את הפריבילגיה לעשות טעויות ולקבל אינסוף סקיצות, אבל גם הגורם האנושי בעולם הנורא מתקדם הזה הוא עדיין נורא נורא חשוב.
אני אוסיף על עניין הכלים המשתכללים: למה כל אחד יכול להיות מעצב? כי רף הכניסה יותר נמוך. פעם כשעיצבנו בפוטושופ, היו מעט מאוד אנשים שיכולים לעשות את העבודה הזו כי היא היתה מסורבלת וקשה. היום – אמא שלי יכולה לעבוד על Figma, תוכנה סופר פשוטה וקלה, ובאמת רואים נהירה של אנשים למקצוע הזה.

מימין: אבירן רווח, ירונימוס ומתי מריאנסקי. צילום: רוני כנעני

ומה למעשה ישתנה בעתיד עם ה־AI? אפליקציה כמו Google Translate מתרגמת טקסט שאתה מצלם ומציגה לך בזמן אמיתי את התרגום על גבי הוידאו בטכנולוגית מציאות רבודה (AR). אולי זה משנה קצת את איך שאתה רואה את העולם? האם יכול להיות מצב שאנשים יראו רק את מה שהם רוצים? רק את הפונטים שהם רוצים? אולי למשל נראה סוג של תנועת No Logo חדשה, וטכנולוגיה שתאפשר לאנשים למחוק פרסומות ולוגואים מסחריים מן הראיה שלהם?
כמו אוזניות עם אופציה לביטול רעשים.
אני לא יודע אם אנשים יטרחו לעשות את זה כמו שאתה אומר. אנחנו כמעצבים מאוד רגישים לפונטים. החוויה של אדם שהוא לא־מעצב לרוב תהיה שונה. ייתכן שהוא לא יסתדר עם יותר מדי פונטים, והריבוי הזה יגרום לו למצוקה. יש סיבה שיש כמות מוגבלת של פונטים בסטורי של אינסטגרם, לדוגמה.

ככל שאנחנו רואים יותר טכנולוגיה ומכשירים חדשים, אנחנו נראה יותר ויותר הפרדה בין התוכן (מה שכתוב) לבין הצורה שלו. זה כמו שבאמזון אתה קונה משהו אבל אתה לא תמיד מקבל אותו באריזה המקורית שלו, אלא כל הדברים נכנסו לאותו ארגז קרטון גנרי של אמזון, ואתה מדלג על כל החוויה היפה הזאת של לפתוח אריזה. אתה קורע את הקרטון, מעיף את הניילונים, ורק רוצה את המוצר שלך שבפנים.

כך גם כשאתה חמוש במשקפי AR ואתה רואה את העולם דרך שכבה מתווכת. יכול להיות שיום אחד תתעורר במצב רוח מסוים, ותרצה שהכל ייראה עכשיו כמו בפוסטר בסגנון הבינלאומי/השוויצרי משנות החמישים, ויכול להיות שתרצה להזריק רעש מטורף לכל מה שתראה.

הסגנון השוויצרי הבינלאומי. עיצוב: ארמין הופמן.

זה לא רק עניין של טעם אישי. תחשבו על נגישות. המשתמשים של Google Translate משתמשים בה לא כי הם רוצים להחליף פונט, אלא כי הם לא מבינים מה הם קוראים. וזו הצורה שבה טכנולוגיות חדשות יכולות לעזור לי בזה.

אולי שמעתם על ה־Bionic Reading שהתפרסם לאחרונה, זה מעין מוצר שמקל את הקריאה של טקסטים ארוכים לאנשים עם הפרעות קשב (ADHD), או טכנולוגיה אחרת, כמו תרגום, שמאפשרת לתרגם טקסט לקול שמקריא לך את הטקסט. אם אתה כרגע במצב שבו פשוט אתה לא מסוגל לחוות את מה שאחרים חווים בגלל מגבלה, תוכל להתחיל לחבור. לפני עניין הטעם יש חשיבות לפיתוח חוויה אינקלוסיבית, כי יש קבוצה מאוד מאוד גדולה של אנשים שפשוט לא יכולה ליהנות ממה שאתה עושה.

אם אתה הולך לכיוון הפונקציונלי, אז אפשר לדמיין דברים כמו טכנולוגיה למשקפי AR שתסמן לי באדום כל מוצר במקרר שהתוקף שלו עבר, צבע ירוק למה שבטוח לאכילה, ותוויות שמסמנות סוכר וחומרים אחרים.
יכול להיות שזה רלוונטי גם לזמן הקניות, או לזמן הבישול שבו ה־AR יוכל לסמן לך את המוצרים שאתה צריך כרגע בשביל המתכון שאתה מבשל. אבל לדעתי ברגע שהתוכן הוירטואלי הופך להיות תוכן עם סטנדרטים, זה מקום שהקולקטיב משתלט על זה לאט. כמו שמתי אומר - יותר הפרדה בין תוכן לצורה.
אפשר לקרוא למה שהיה לפני הטכנולוגיות האלו כ״עיצוב מונוליטי״: יש מעצב/ת שמחליט על עיצוב מסוים. בשלושים השנים האחרונות מעצבים מוצרים דיגיטליים (UX/UI) המתאימים לפלטפורמות שונות. האם בעתיד נגיע למצב שבו ההחלטה על העיצוב כבר מתנתקת מהמעצב? ומה זה אומר על העיצוב הגרפי כתחום?
בתסריט של מתי שבו מופיעה אזהרה כשפג תוקפו של המוצר, מי שהחליט על זה הוא מעצב. בעתיד כזה הרבה מהמעצבים יהיו מעצבי חוויה, ואולי המעצבים המסורתיים שרגילים לעצב אובייקטים סטטיים לא יאהבו שימהלו לעיצובים שלהם היבטים וירטואליים.
ירונימוס אתה בעצם מצביע על תרחיש שבו כל אחד ירצה לעצב לעצמו את הכל וליצור לעצמו את כל התכנים. הדברים האלה לא יקרו משתי סיבות:

את הסיבה הראשונה אסביר עם דוגמה: באתר גלובס (לפני הרבה זמן) המשתמש יכל לקבוע בעמוד הראשי מה יהיו שש הכתבות הראשיות, והתוצאה היא שהמשתמש היה צריך לדפדף ולסדר את הכתבות. זה היה אסון. אני קורא את העיתון בגלל העורך שלו שקרא את כל החדשות, שבר את הראש ובחר להציג את החדשות על פי המומחיות שלו. אז הסיבה הראשונה היא שאנחנו לא רוצים לעשות הרבה דברים בעצמנו, אלא שמישהו יערוך ויאצור עבורנו. לא כל אחד רוצה לעצב את הסניקר שלו. אני סומך על המעצב של נייקי שיביא לי עיצובים יפים. יש דברים שבהם אני מאוד טוב, אבל ב־90% מהדברים אתה יודע שיש אנשים טובים יותר כמו סטיב ג׳ובס שאני אוהב את ההחלטות שלהם.

הסיבה השניה היא שאנחנו זקוקים לאיזו מדורת שבט. תמיד אומרים על AI שיום אחד כל אחד יוכל לעשות לעצמו איזו סדרה שהוא רוצה, אבל כל ההנאה שלי בלראות ״יורשים״ היא שאני יכול לבוא מחר לחברים שלי ולדבר על ״ראית מה הוא עשה? אני לא מאמין שזה הפרק האחרון! אני לא מאמין שזה נגמר ככה״. זה נושא שיחה משותף.

היום מעצבי פונטים משתמשים באלגוריתמים מתמטיים, למשל מזינים משקל דק, משקל עבה, והתוכנה עושה פעולה מתמטית שדומה ל־Blend ב־illustrator אבל יותר מתוחכמת, ומציעה לך משקלי ביניים. אבל בשנתיים האחרונות טכנולוגיות כמו MidJourney מאפשרת לנו ליצור תמונות על בסיס מאגר ענק של תמונות שה־AI למד. מתי – תוכל להסביר על למידת מכונה?
תוכנות עיצוב הפונטים שהזכרת הם כלים שהם מבוססי חוקים שכתבו מפתחים עם ידע מקצועי. ההבדל בין המצב הזה ללמידת מכונה, (״אינטליגנציה מלאכותית״), זה שאני לא יודע בהכרח מה החוקים.

אפשרות אחת היא שאני בא למכונה ואני נותן לה המון דוגמאות ואומר לה תשברי את הראש לבד ותביני מה החוקים, ואחרי שהבנת אותם תייצרי לי עוד דוגמאות. באפשרות השניה אני גם לא יודע מה החוקים, אבל אני אתן לך ציון ואת צריכה למצוא את הדרך שלך כדי שתוכלי להגיע לניקוד מסוים.

דמיין מצב תיאורטי שבו אתה יכול להעסיק כמות מאוד גדולה של מעצבי פונטים שהתפקיד שלהם היה לתת ציון מסוים לכל דוגמה של אות א׳ שהמכונה היתה שולחת להם, והם היו עושים את זה מליון פעם, אז המכונה היתה מתחילה מאיזה קשקוש או כתם, ולאט לאט היתה מצליחה לעשות משהו שהוא יותר ויותר טוב ומגיעה למצב שהיא יודעת איך לצייר את האות א׳.

וזה זמן טוב לדבר על פרויקט ״אברא״.
אייל גרוס ואני בנינו תוכנת AI שמורכב משתי תוכנות:
תוכנה A היא OCR (זיהוי תווים אופטי - המרת תמונה, טקסט מודפס וכתב יד שנסרקו למסמך תמליל ממוחשב) שזה יחסית משהו טריוויאלי. התוכנה רואה אותיות, היא רואה ומזהה אותיות עבריות. אז היא למעשה בתפקיד השופט הטיפוגרפי. מהצד השני, פיתחנו את תוכנה B שמותר לה לעשות אך ורק שלושה קווים ישרים. היא זורקת את שלושת הקווים על הדף, ואז תוכנה A מציינת לה אם זו אות אל״ף או לא. ואז B צריכה למצוא איזה פתרון יצירתי לסדר שלושה קווים.

הסיפור קצת מסתבך באותיות כמו מ״ם־סופית, כי איך מציירים אותה רק עם שלושה קווים ושהיא תהיה מבודלת עם האות סמ"ך? לכן באות מ״ם־סופית חסר הקו הימני. היא פתוחה לכיוון ימין.

ההכרח הוא אבי ההמצאה.
כן, אז בעצם, כשאתה מגביל אותה, אתה מכריח אותה להיות יצירתית באמת, וליצור איזשהו אלפבית חדש, ואז המכונה הזאת מתחילה מכלום בעבודה קשה, ובסוף היא מצליחה ליצור אלפבית שכולו עשוי משלושה קווים ישרים.
כמה זמן אורכת ה״עבודה הקשה״ הזאת?
זה יכול להיות לילה, אבל זה לקח כמה חודשים להגיע למצב שהיא יודעת לתת את הציון הזה כמו שצריך, וגם זה מאוד קשה בהתחלה, כי שום דבר שהיא עושה לא דומה לאלף בכלל. היא היתה צריכה איכשהו לפגוע במשהו שמתחיל להזכיר את האות אל״ף, כדי שיהיה לה על מה להתאפס ולהתקדם ממנו. ואז נוצר איזה ״כתב יתדות״ חדש בשלושה קווים שלא ראינו בעצם אף פעם, כי אף אחד לא חשב על זה, או לא חשב שזה רעיון טוב אולי.
ֿזו דוגמה מאוד מאוד יצירתית, ואני מציע שנרדד את זה קצת. מה שמעצב רוצה בדרך כלל באופן סטנדרטי זה לא בהכרח משהו מטורף וחדשני, אלא פשוט פונטים שיתאימו לסיטואציה של מה שהוא צריך.
למשל, משהו כמו אלמוני אבל טיפה יותר מעוגל.
כן. אם תיקח לדוגמה את כל הפונטים הלטיניים. יש מבחר עצום, יש מלא פונטים שכמעט אין ביניהם הבדל, וצריך לאמץ ממש את העיניים כדי למצוא את ההבדלים ביניהם. אתה יכול להזין אותם לתוכנת למידת מכונה והיא תלמד את החוקים והניואנסים של מה שצריך, ואז אפשר בקלות לייצר גרסאות ״חדשות״ שלהם.

אבל, ומעבר לזה, הבעיה העיקרית שלנו היום עם יצירת פונטים היא כי קשה לעשות את זה, ולרוב רק אנשים עם סבלנות ברזל מצליחים, ולכן גם כרגע אין לנו מבחר גדול של גופנים בעברית. אוליזה ישתפר בעתיד וזה יעזור לנו ללמד את המכונה, אבל בתור התחלה אני הייתי רוצה שיהיה יותר קל לעשות פונטים.

בשיחה קודמת דיברת על היכולת של מעצבי פונטים להבין את התנועה הקליגרפית של הקולמוס ולעצב לפיה, ושאלת האם המכונה צריכה לדעת את החוקיות הזו. זו דוגמה מצוינת לחוקיות שהיא לא חלק מהלמידה הרגילה של ה־AI (כלומר למידה מתוך מאגר של פונטים קיימים). זו חוקיות שתוכל ללמד את המכונה. יכול להיות שהלמידה תהיה תגובה לאיזו תנועה שאתה מייצר או רוצה שתהיה, והתגובה הזו אליך תעזור לעצב פונטים יותר מיוחדים. אולי אני ארצה גם משהו שהוא באנימציה. הפונטים היום הם פורמט מאוד מיושן ויכול להיות שיהיה איזה פורמט אחר שיצור כיווניות שאין כרגע.

גם הפונטים הוריאבילים יוצרים בעצם אפשרויות שאין בפונט רגיל, אז תנסה לדמיין מה יהיה מעבר למה שמוכר לנו כיום, כי כרגע המחשבים לא יכולים לסחוב את זה. למשל – פונטים שמתאימים את עצמם לחלל שהם נמצאים בו באמצעות AI, או פונטים שמותאמים למרחק שבו שאתה נמצא ביחס אליהם.

התנועה של הקולמוס, השלד של האות, ההיסטוריה של הסגנון, הם כל מיני התייחסויות אנושיות, ידע אנושי, בעוד ששיטת הלמידה של ה־AI היא ללמוד מהסוף – מהתוצאות.

אני מכיר אמן גרפיטי בשם Colormotor שהוא גם פיזיקאי, והגרפיטי שהוא עושה נובע ממשוואות של מישהו שמחזיק פחית צבע ביד: הוא לא יכול להזיז את היד שלו בעקומה שחורגת מהטווח של היד, המרפק והזרוע. אבל יש לו מין עקומות נהדרות כי הוא חושב על העקרונות הראשוניים של הגוף שלו. הבסיס להבנת האותיות טמון בתנועת היד של האדם שיצר אותן.


בדיוק, וגם החומר חשוב, למשך בחציבת אותיות באבן. בכל מיני תרבויות, למשל הרומית, היו צריכים להמעיט במכות חזקות עם פטיש ואזמל כי הן יפוררו את האבן.

המדיום מכתיב את הצורה
כל פורמט מגביל אותך בצורה וזה מה שמייצר אופי ייחודי. פיקסל ארט הוא פורמט שמוגבל למספר מסוים של קוביות. היכולת לייצר הגבלות מלאכותיות היא גם האפשרות של יצירת אופי ייחודי עם AI בעתיד (בדיוק כמו בפרויקט של מתי). ה־AI יכול לעבוד תחת חוקים מוזרים ולייצר אינספור נסיונות בלי להתייאש. האנשים שימציאו את החוקים המשוגעים האלה הם אולי לא האנשים שעושים פונטים.
האם יכול להיות מצב שניצור סוג של מידג׳רני של פונטים עבריים? האם יש מספיק פרמטרים, כלומר דוגמאות של טיפוגרפיה עברית (ואני בכוונה אומר טיפוגרפיה ולא פונטים) בשביל ללמד AI איך פונט עברי נראה?
אולי הסיבה שאנחנו לא רואים כרגע פונטים מוצלחים שנוצרו על ידי AI היא שבהרבה פרויקטים שכאלה מזינים לתוכנה תמונות של פונטים ולא פונטים וקטוריים, מה שמסביר את האיכות הירודה. הייצוג הנכון לאות הוא בעקומות (וקטורים). סיבה נוספת היא עקרונית: אין הרבה טיפוגרפים שמבינים בבינה מלאכותית, אין מספיק אנשי בינה מלאכותית שמבינים בטיפוגרפיה, ואין מישהו שיחבר את שני הדברים האלה. אם אתה רוצה באמת ללמד מכונה לעצב פונטים אתה צריך לחזור איתה לעקרונות הראשוניים של הטיפוגרפיה, כמו למשל תנועת הקולמוס.

כמו שאמרנו קודם – הצורה של האות היא רק ההתחלה בטיפוגרפיה. יש עוד שאלות שקשורות לחלל פנימי, טקסטורה, צבע טיפוגרפי, ריווחים וכיוצא בזה. יש כל כך הרבה חוקים שצריך או ללמד או להסיק או לתת למכונה מספיק דוגמאות כדי שהמכונה תדע מה נכון ומה לא.

במילה אחרת – אפשר לעשות מידג׳רני לאותיות ממש גרוע ומהר, אבל אם אתה רוצה משהו ברמת טיפוגרף מקצוען כמו עודד עזר או אברהם קורנפלד, כנראה שיש לנו כמה שנים. באופן כללי בתרבות העברית אנחנו תמיד באיחור, אז אפשר להיות רגועים קצת. אני מקווה שהטכנולוגיה תתן ליותר אנשים כלים עם ידע וחוקיות טיפוגרפיים כדי שיותר אנשים יוכלו ליצור יותר פונטים.
נגיד שהיה כלי כזה, והייתי מבקש פונט שיתאים בדיוק להזמנה לחתונה קלאסית באולמי בון־בון למשפחה מסורתית ממוצא ספרדי. במצב כזה תצטרך להטעין את המכונה בכל כך הרבה קונטקסט וסאבטקסט תרבותי כדי שהיא תדע איזה פונט הוא ספרדי ואיזה הוא לא, מה מתאים להזמנה קלאסית לחתונה, להסביר מה זה  מסורת אבל גם שיתאים לזוג צעיר.
יש איזה עננה מופשטת של מילות תיאור לפונטים שקשה יותר לתאר מאשר בתמונות. פונט יכול להיות שובב ושמן וספרדי, וכשאתה אומר ספרדי זה כבר בעיה כי יש פונט שנקרא ספרדי והוא לא מ״מוצא״ ספרדי, אלא ״אשכנזי״, כנראה מאזור וילנה של המאה ה־19... ועוד.

איך זה שאנחנו מצליחים לתאר למידג'רני מה אנחנו רוצים בתמונה, אבל אנחנו (וגם מעצבי פונטים) מאוד מאוד מתקשים להסביר איך אנחנו רוצים שיהיה הפונט.

הרבה אנשים מסתובבים עם התחושה של ״אני לא יודע להגיד לך מה אני רוצה, אבל כשאני אראה את זה אני יודע שזה מה שרציתי״. היה פעם תוסף כזה לפוטושופ שנקרא Kai's Power Tools (KPT) שאפשר לך ליצור פאטרנים והיית יכול לשנות אותם ל״כיוונים״ מסויימים – יותר ירוק או עם קשקשים או להבות וכיוב׳. לא היית מבקש משהו שאין, כי הממשק הציג כל הזמן 9-10 דוגמאות נוספות מסביב לפאטרן שלך, ולכן יכולת לראות בעיניים לאיזה כיוון אתה משנה את התוצאה.

כשאתה הולך לפלאפל נותנים לך כדור. זה גם בשביל שתוכל להבין איך אתה רוצה את הפלאפל שלך. אתה מתחיל עם ברירת מחדל מצומצמת ומבין – אה, אני רוצה גם טחינה וסלט אבל בלי ככה וככה. אתה צריך משהו גירוי ראשוני בשביל להתחיל.
יש עדיין מרחק מטורף בין האדם למכונה. אם אנחנו כל כך מתקשים בלהסביר את עצמנו, והמכונה עדיין צריכה דברים שהם ברורים מאוד, עדיין אנחנו מאוד רחוקים. אבל עדיין יש היבטים שה־AI מצליח יותר ויותר לפתור דרך למידה. AI לימד את עצמו לשחק Go (המשחק הסיני), ובסופו של דבר, הצליח לנצח את אלופי העולם. האם יש איזשהי דרך לגרום ל־AI ללמוד על ידי אינטראקציה עם אנשים, איך להתממשק אלינו בתחום הזה של טיפוגרפיה?
כדי לשחק Go ולהבין אם היא מנצחת או משתפרת, המכונה צריכה מישהו או מכונה אחרת שתיתן לו לו ציון.
תן לזה כמה שנים וזה יגיע. זה יכול להגיע מסטודנטים מתארים שונים כי יש להם זמן, אינטרס ומישהו שילווה אותם בתהליך גילוי שכזה. הם יוכלו לשאוב מידע וללמוד מטכנולוגיות ומודלים שיהיו חשופים באינטרנט. עיקר העניין הוא איזה מידע דיגיטלי אפשר לשאוב.
ההבדל בין גרסאת ה־ChatGPT הקודמת ל־ChatGPT גרסה 4 הוא מטורף. לפני כן היא היתה מכונה שנותנת תשובות כלליות, ואז העבירו אותה תהליך נוסף שבו היא קיבלה פידבק מאנשים אמיתיים: התשובה הזאת לא טובה וזאת כן טובה. אז אפשר ליצור מכונה שתצייר שתי אותיות כל הזמן, ותחבר אותה לכיתה של סטודנטים שיש להם זמן פנוי ניכר וסבלנות, וכל אחד צריך לתת 150 ציונים עד לשבוע הבא.
Swipe left or right
ברגע שיש לך סליידר בין אל״ף מסוג אחד לאל״ף מסוג שני מ־0 ל־1, אתה יכול לקחת אותו ל־2 ותקבל משהו שלא חשבת עליו בחיים.
הלואי שהקוראים שלנו יפתחו טכנולוגיה כזו. כשפיתחתם את פרויקט ״אברא״, הכנסתם כמות מסוימת של פונטים. הבעיה היא שבטיפוגרפיה עברית, רוב הדוגמאות הן לא בהכרח דיגיטליות – עיצובים היסטוריים בתקופות שלפני הדיגיטציה, שהם חשובים לא פחות. איך המכונה תהיה מסוגלת ״לעכל״ וללמוד מן המאגרים האלה, אם התמונות לא מתאימות לקריטריונים של מה שיכול להכנס למכונה – אם התמונה לא בפורמט נכון, אם האות חורגת מהבייסליין וכו׳.
ב״אברא״ השתמשנו בכמה מאות פונטים, השתמשתי בכל הטובות שהייתי יכול לבקש והתקשרתי לעודד עזר ולבן נתן. השתמשתי בכל הפונטים שאני או אשתי אי־פעם קנינו, וגם זה לא הספיק. היינו צריכים עוד פונטים ולכן היינו צריכים לסובב, לעקם, ולקלקל קצת את האותיות רק בשביל להוסיף גיוון כדי שהתוכנה תוכל למצוא מה משותף לכל האלפים, ולהבין שכשאתה מזיז איזה ״פיקסל״ וזה כבר לא אלף, מתי זה סמך ומתי זה סופית. אלה דברים שהמכונה למדה, אבל היא לא אומרת לי את החוקים האלה, ואני לא יכול לקרוא אותם כי אלה מליון חוקים בשפת קוד. חלק מהם טובים, חלק לא.
אז אתה אומר בגדול שאין מספיק דוגמאות במאגר הדיגיטלי.
ככל שהטכנולוגיה מתפתחת, אנחנו נראה שצריכים פחות ופחות דוגמאות. פעם היית צריך כמות מסוימת של דאטה ועכשיו המודלים משתכללים. ChatGPT עבר על כל הטקסטים באינטרנט, אבל כדי לעבור לשלב הבא הוא היה צריך אולי אלפי דוגמאות כדי ליישר אותו שידבר כמו בנאדם.
אבל בשלב הבא הוא מתחיל מאפס או שהוא ממשיך עם המידע שצבר?
ממשיך עם המידע. כל הפרויקטים שיצא לך לראות של StyleGAN שהזינו לתוכם פרצופים, או כאלה שהזינו פונטים מתמונות מפיקסלים, מתחילים מתוכנה שהיא כבר מאומנת. היא כבר יודעת לזהות קווים אלכסוניים, ריבועים, עיגולים. יש לה כבר ידע מובנה שאנבידיה פיתחו במיליוני דולרים. אתה מפתח תוכנה שמשתמשת בידע הזה אבל אתה מסיר לו את השכבה האחרונה של הידע ומאמן אותו מחדש אבל על אותיות.
זה משהו שחד משמעית הולך לקרות. אנחנו מדברים על אות עברית, אבל זה יקרה קודם בעולם הלועזי. אז אנחנו לא בהכרח נתחיל את הטכנולוגיה הזו, זה יבוא ממקומות אחרים, ואנחנו נוכל ללמוד מהם. לדוגמה פרויקט הפונטים של גוגל ובמיוחד הפונט נוטו סנס שיש לו גם גרסה עברית. זה מסוג הפרויקטים שהם חובקי עולם, גם בתחום ה־AI והפונטים. יכול להיות שחברה כמו גוגל או IBM שרוצות להכריז שהן אינקלוסיביות, יפתחו טכנולוגיה כזו.

פונט נוטו סנס. עיצוב עברית: בן נתן.

נתקלתי באיזושהי כתבה מעניינת על מפתח AI בניו־יורק שהשתמש בלמידת מכונה כדי לג׳נרט פונטים לטיניים. הוא אימן את ה־AI על 50,000 תמונות של פונטים מהאינטרנט. בנוסף, הוא גם הצליח לגרום ל־AI ליצור מפה טיפולוגית של פונטים - כלומר מפה שבה פונטים ממוקמים אחד ליד השני לפי הדמיון הצורני ביניהם.
המכונות האלה מאוד טובות ב־clustering – בלסדר דברים בקבוצות. גם מידג׳רני שיש בבסיס שלו מנוע של שפה, יודע שקוף, קופיף, גורילה, שימפנזה, הן כולן מילים ליונק ממשפחת הקופים. למרות שהאותיות שלהם שונות לגמרי, הוא כן יודע לקבץ את כל הדברים האלה ביחד. אז גם מכונת האותיות שאתה מציע תדע לקבץ את כל האלפים, בנפרד מהבתים, ובתוך האלפים את אלה שיש להם לדוגמה פסיעה ברגל השמאלית.
יש כאן פוטנציאל לתאונות יצירתיות. מפת הפונטים יכולה להיות דוגמה לאיך שימוש בטכנולוגיה חדשה יכול לשנות את עצם הצורה שבה אנחנו רואים ומנתחים דברים. הרי יש לנו כל מיני צורות של קיטלוג ומיון של פונטים (למשל סריף וסנס). אבל השאלה הספקולטיבית והפתוחה שאני זורק עליכם, היא אילו עוד צורות של מודעות, awareness, יכולות לעלות בתחום הטיפוגרפיה העברית, מתוך האפשרויות האלה של למידת מכונה וג'נרייטינג?
נגיד שאתה מצייר את המפה הזאת עם האיים, נכון? יש לנו את אי הסריפים ואי הסנס, מה שקורה בין האיים האלה – זה יכול להיות משהו שאתה יכול לדמיין. זה משהו בין לבין. ממוצע כזה, אולי פחות מעניין.

אבל מה קורה אם אתה לוקח את האי הכי קיצוני, וממשיך ממנו עוד צפונה, למקום שבו אף אחד לא דרך בגלל שחשבו שזה יצא מכוער או יהיה בזבוז זמן?

ואם הייתי – מי ישתמש בזה בכלל, למה זה טוב?
מאותה סיבה שהמכונה ששיחקה Go פיתחה מהלכים שאף פעם לא הכרנו. יכול להיות שבמשך שנים, כשתלמיד היה מנסה מהלך מוזר, היו אומרים לו המאסטרים של הגו ״עזוב, אל תלך לשם בכלל, לא תצליח לנצח עם זה״. אבל המכונה כן תעשה את זה, כי היא חרוצה מאוד.
אז נמצא צורות חדשות של אלפבית שאולי חלק מהן יכולות לעבוד, ולא חשבנו עליהם.
אני אקח אותך יותר רחוק. אלף בית זה עדיין שיטה ששייכת לתקופה הזו, שמבוססת על תוים. אולי כל המילה בכלל צריכה להיות ״להתכוונן״ לפי האותיות כולן. כלומר שתרשום לדוגמה את המילה ״שלום״, והתוצאה היא שהמילה מצויירת אחרת – לא רק חיבור (ליגטורה) של שתי אותיות.
קצת כמו בקליגרפיה.
כמו לוגו. בקליגרפיה יש משהו המשכי מאות לאות לאות. אולי נוכל לג׳נרט טיפוגרפיה לפי החלל שאתה רוצה לכתוב אותה בתוכו. למשל אם אני מעצב פוסטר ויש לי מקום פנוי, נגיד ריבוע. אני מסתכל על יצירות של חן מכבי שעושה דברים מדהימים, ואולי אוכל להוסיף אותיות שמשתחלות הצידה פתאום. כל הדבר הזה יכול לקרות בגלל התאמה לקומפוזיציה ולשפה וכו׳. יכול להיות שזה הכיוון אולי בכלל לא לעצב אלפבית או פונט, אלא זה הרבה יותר מאפשר דמיון על בסיס העיצוב שלך, זה קצת יותר מידג׳רני שמנסה לייצר את התוצר הסופי ולא רק אותיות.
יכול להיות שרוב מה שיצא לך בעיצוב משעמם, או שאי־אפשר יהיה לקרוא את זה בכלל, ויכול להיות שפתאום זה יפתח לך את הראש למשהו אחר. תחשוב על דברים שעודד עזר עושה. מה אם האות הזו היא משטח שגידלתי עליו פטריות, האם הצורה שלה כאות היתה מתפתחת מהשלד שלה באותה צורה שאצה גדלה בה. אולי תגלה את אות אלף יותר נכונה מזו שאנחנו משתמשים בה, כי היא מחוברת למשהו יותר בסיסי בטבע.
זה לא צחוק. למשל, גילו שיש אמבה שנקראת Slime mold, שמצליחה לפתור מבוכים בצורה יותר טובה מבני אדם. אנחנו יכולים להגיע למצב שבו הילדים שירשו את העולם אחרינו יחליטו לעשות פרויקט גמור בסגנון עודד עזר שבו ישלבו גנום אמיתי של פטרייה או אמבה עם כל הבסיס של האלפבית.
כל הבסיס של התוצרים של מידג׳רני שאתה רואה בפיד הוא what if. לקחת לפחות שני סטנדרטים שונים ולנסות לשלב אותם ביחד. מה אם באטמן היה אבטיח. אלה שני דברים שלא קשורים אחד לשני אבל אתה רוצה ויכול לבדוק את זה.
וואו איזה עולם מרגש ומדהים (ויש אנשים שחושבים שקצת מפחיד) שהולך להתגלות מול העיניים שלנו. אני חושב שאנחנו מתקדמים לאיזה עתיד שבו אדם ישאל את עצמו What should i do, והתשובה שלי היא You do you. כלומר לך עם עצמך עד הסוף ותמצא את הקהילה שלך.
יש כאלה שאומרים, "וואי, זה ייחסל את כולם", ואני כל הזמן מאוד אופטימי בגלל שכל מה שנעשה לא יוכל להיות פחות מבינוני או עצלני, שזה כבר שיפור. גם אם אתה הכי עצלן ורוצה תמונה של כלב על דשא, רק לחצת על הכפתור וכבר יצא לך אחלה כלב על אחלה דשא, בלי שעשית כלום. ואז הקו של הטובים צריך להיות עוד יותר טוב.
אני אומר הפוך. מידג׳רני ודומיהם – זו לא היצירה. היצירה היא מה שאתה עושה עם זה. בקורס בעיצוב בפרודקט דיזיין אני אומר לסטודנטים שלי שאם לדוגמה מפתחים אפליקציה של מתכונים, כל מפתח יכול לג׳נרט תמונות של תבשילים עם צילחות וצילום ברמה מקצועית, בעוד שפעם היית צריך לחפש תמונות עקביות. אז אני חושב שאתם תראו יצירות שלמות ועקביות ולא רק מה שכרגע רואים במידג׳רני.

אותי מעניינות היצירות שאפשר לייצר במצב שבו יצירת assets (משאבים) היא משימה קלה ולא משהו שתוקע אותך. מה אם היו לך כל המשאבים שאתה צריך? זה הדבר שמדליק אותי, כי אז לאנשים תהיה העמקה בכל מה שהם עושים. הם מתפנים ליצור את הנקסט הנקסט ג'נריישן.

 

 

הפודקאסט של אאא – פרק #1: בינה מלאכותית ועתיד האות העברית



תגובה אחת