טיפו־טיפ ״כתב בבל״ – מחולל אותיות שנראות כמו עברית (אבל הן לא)

שעות של נבירה במערכי אותיות של שפות שונות הניבו שני מערכי אלפבית עבריים חדשים שהם מעין כתב סתרים חדש ושימושי. למה זה טוב ואיך משתמשים בזה? כנסו לקרוא

הנה כמה מילים נחמדות שבכלל לא כתובות בעברית:

‏‮ᘓ‮𐑓‮𐑸‮ ‮𐋉‮I‮ᕈ‮𐑸
‏‮𐐣‮ᕄ‮ᑊ‮ユ‮𐑸‮ ‮I‮∩‮ᕄ‮ᑊ‮ᘞ‮𐑸‮ ‮𐋉‮I‮ᕈ‮𐑸
‏‮ⴿ‮J‮ᑊ‮ ‮𐨲‮I‮𐑸‮ユ‮ ‮メ‮I‮ᕄ‮ๅ
‏‮ꗪ‮𐐈‮ᑊ‮ ‮c‮I‮I‮𐑸‮ᕈ‮ɲ‮ ‮꒟‮꒐‮I‮ᕄ‮𐑜
‏‮N‮ᗱ‮I‮"‮|
‏‮ກ‮I‮ጓ‮𐑸‮ ‮𐨬‮ꇜ‮𐑸
‏‮ユ‮I‮ㄗ‮𐐑‮ ‮๒‮I‮그
‏‮ᑊ‮I‮p‮ ‮𐑸‮I‮ᘕ‮ਕ‮ᕄ‮ ‮ᘓ‮N‮ꓵ
‏‮𐨭‮ス‮ ‮ᕫ‮ᘞ‮∩

זה טקסט חי, צריך רק ללחוץ על מילה כדי להעתיק, ואז לעשות לעשות ״הדבק״ בוואטסאפ, למשל.

קסם!

אז מה הן האותיות האלה?

שנים שאני נתקל באותיות משפות אחרות שנראות כמו עברית, ותמיד סקרן אותי לבדוק אם אפשר למצוא את כל אותיות האלפבית העבריות – אבל בתווים של שפות אחרות. לאחרונה הקדשתי כמה (המון) שעות כדי לנסות לענות על השאלה הזאת. זאת הייתה מלאכה סיזיפית של נבירה באינספור מערכות כתב שונות ואני שמח לדווח על הצלחה, פחות או יותר, במשימה.

האם מדובר בתגלית השנה? לא בטוח. אבל זה כן מדליק ומשעשע, ואפילו שימושי למדי – תוכלו למשל לשלוח בוואטסאפ הודעת ‏‮ᕫ‮𐑓‮𐑸‮ ‮ᝏ‮I‮ユ‮𐑸 או ״אוהבת אותך מאמי שלי״ או "בייבי תדליקי בוילר אני בדרך הביתה" שהיא קצת יותר אישית; תוכלו לגוון את צורות האותיות של טקסט הביו שלכם ברשתות החברתיות באופן שיגרום לכולם לגרד בראש ולתהות איך לעזאזל השגתם את הכתב המגניב הזה; ותוכלו לכתוב בכתב סתרים שאף מחשב, גוגל או בינה מלאכותית לא יצליחו לפענח.

״כתב בבל״

החלטתי לקרוא לתגלית הנחמדה על־שם מגדל בבל – רק שבמקום שפה אחת שמתבלבלת ומתפזרת להמון שפות, כתב בבל אוסף ומייצר משמעות חדשה לאותיות שאין כל קשר קודם ביניהן. כתב בבל כולל שני מערכי אותיות עבריות: כתב מרובע (דפוס) וכתב רהוט (כתב־יד), וגם סט מספרים תואם. לרוב האותיות יש גם אותיות חלופיות שאפשר להשתמש ולערבב למיקסום הכיף.

כתב בבל רהוט:
‏‮ꗪ‮ᕈ‮𐑒‮ਕ‮𐑸‮I‮ᘤ‮ꓵ‮𐋉‮ᑊ‮𐐣‮ๅ‮ᘕ‮N‮p‮𐑓‮|‮O‮𐑣‮ට‮𝄞‮ᗱ‮𐐐‮Ꭾ‮ᘃ‮ᘓ‮ᕄ

כתב בבל מרובע:
‏‮ⴿ‮ユ‮𐰳‮ℸ‮𐑸‮I‮⊺‮∩‮๒‮ᑊ‮コ‮ๅ‮ᔭ‮ᘞ‮ロ‮⅃‮|‮ꓳ‮y‮១‮ຖ‮ݎ‮Ⴤ‮ㄗ‮𐐑‮ᕫ‮ᕄ

מספרים:
‭ⵔ‭I‭೩‭Յ‭Ч‭ち‭ꕃ‭ヲ‭৪‭વ

טבלת התווים של כתב בבל – גרסה 1.0

כתב בבל כולל שני מערכי אותיות עבריות: כתב מרובע (דפוס) וכתב רהוט (כתב־יד), וגם סט מספרים תואם. בטבלה מוצגות האותיות הראשיות של כל כתב וגם אותיות חלופיות, שנבדקו על מערכות הפעלה שונות. לחיצה על כל תו תוסיף אותו לשדה שבתחתית האתר. מוזמנים/ות לערבב בין השפות והחלופות השונות. בתווים שמופיעים בעמודת ה״תמיכה מועטה״ עדיף לא להשתמש כרגע כי הם לרוב עובדים רק על מכשירי OS של Apple.

כתב בבל רהוט:
תו יוניקוד ושפה כתובה חלופות תמיכה מועטה
‮ꗪ Vai U+A5EA ‮c‮I‮𐑤‮I‮꒟‮꒐ ‮𞣃‮𞠢‮𞣈‮𞠢‮⊃‮𞠢
‮ᕈ Canadian Syllabics U+1548 ‮ꇜ‮ꃀ
‮𐑒 Ugaritic U+10492 ‮߄‮ꊐ‮᱑ ‮𞠔‮𑂗‮𖩎
‮ਕ Gurmukhi U+0A15 ‮ጓ‮༢ ‮𑫱‮𑋙‮ꛫ‮𖩡‮𑫣
‮𐑸 Ugaritic U+10478 ‮𐨬‮. ‮ᯄ
‮I Latin U+0049 ‮ⵏ‮꒐
‮ᘤ Canadian Syllabics U+1624 ‮𐒑‮ᱩ ‮𞠞‮𐢐‮ꚽ
‮ꓵ Fraser U+A4F5 ‮∩‮⋂‮𐨭‮౧ ‮𑫡
‮𐋉 Carian U+102C9 ‮𐡨‮𑚂
‮ᑊ Canadian Syllabics U+144A ‮ˡ‮ᴵ‮Ꞌ‮ꜜ
‮𐐣 Ugaritic U+10423 ‮ᦱ‮ᑐ ‮ࠐ‮𖩀
‮ๅ Thai U+0E45 ‮𐑜
‮ᘕ Canadian Syllabics U+1615 ‮ꁐ‮δ ‮𖩑
‮N Latin U+004E ‮𝓝‮𝙽‮ℕ‮ᴺ‮ᶰ
‮p Latin U+0070 ‮ᕵ‮ᱞ‮𐐟 ‮ꛄ
‮𐑓 Ugaritic U+10493 ‮𐐈‮ꓙ ‮𐢕‮𖩁
‮| Basic Latin U+007C ‮꧊
‮O Latin U+004F ‮ꓳ ‮ᝪ
‮𐑣 Shavian U+10463 ‮ჾ‮𐒀‮ర ‮𑛄‮𑫕‮𐔁‮𑛄
‮ට Sinhala U+0DA7 ‮ᘐ‮𐑔 ‮𞠈‮𞠉‮𞣎
‮𝄞 Musical Symbols U+1D11E ‮β ‮ꝭ
‮ᗱ Canadian Syllabics U+15F1 ‮𐦯 ‮𑚡‮ᜂ‮𑚙‮𑋊
‮𐐐 Deseret U+10410 ‮ꗌ ‮𞡇‮ᜣ‮ꚪ‮ᝎ‮𐡣
‮Ꭾ Cherokee U+13AE ‮ア‮7‮ₗ‮𐤐‮ₗ ‮ꚹ
‮ᘃ Canadian Syllabics U+1603 ‮𐨬‮𐤐‮𐐓
‮ᘓ Canadian Syllabics U+1613 ‮ᧉ‮𐑞‮Ҽ‮୧‮౿ ‮ꤕ
‮ᕄ Canadian Syllabics U+1544 ‮ກ‮Ꮑ‮ɲ
ליגטורות: ‮𑚅‮𑫠‮𖩞‮I‮ꛓ
כתב בבל מרובע:
תו יוניקוד ושפה כתובה חלופות תמיכה מועטה
‮ⴿ Tifinagh U+2D3F ‮𐨲‮メ‮౫ ‮𐍥‮𐡠
‮ユ Katakana U+30E6 ‮그
‮𐰳 Glagolitic U+1C73 ‮𐰴‮𐐇‮𐒚‮ス‮ⱹ ‮𐪍‮ꚧ
‮ℸ Letterlike Symbols U+2138
‮𐑸 Ugaritic U+104B8 ‮ܕ‮𐨬‮. ‮ᯄ
‮I Latin U+0049 ‮ⵂ‮1‮ⵏ‮꒐
‮⊺ Mathematical Symbols U+22BA ‮τ‮ኘ‮𐨝‮T‮ⴶ ‮𖩋
‮∩ Mathematical Symbols U+2229 ‮∏‮𐨭 ‮ꛛ‮𑫡‮𐔗
‮๒ Thai U+0E52 ‮ଏ ‮ꚩ‮ᝏ‮𑫜
‮ᑊ Canadian Syllabics U+144A ‮ˡ‮ᴵ‮Ꞌ‮ꞌ
‮コ Katakana U+30B3 ‮ߏ ‮ࠐ
‮ๅ Thai U+0E45
‮ᔭ Canadian Syllabics U+152D ‮߆ ‮𞡣‮𞢥‮ࠍ‮𐡫
‮ᘞ Canadian Syllabics U+161E ‮⺆ ‮𐡬
‮ロ Katakana U+30ED ‮□‮⼝‮ㇿ
‮⅃ Latin U+2163 ‮J‮ܠ‮𐐈‮𐑓‮꒑ ‮𖩁‮𐢕
‮| Basic Latin U+007C
‮ꓳ Lisu U+A4F3 ‮⛉ ‮𐢒‮Ꝺ‮𐢖
‮y Latin U+0079 ‮ມ ‮𐢗
‮១ Khmer U+17E1 ‮⅁‮੭‮୭‮ワ ‮𐡱
‮ຖ Lao U+0E96 ‮ฤ‮໗‮ߣ‮ᘃ ‮𖩓‮ꚿ‮ꛀ
‮ݎ Arabic U+076E ‮ឫ
‮Ⴤ Georgian U+10C4 ‮߂‮μ‮ⵖ‮ㆩ
‮ㄗ Chinese U+3107 ‮고‮卩‮Ꭾ‮ア‮ㆡ ‮ꚹ
‮𐐑 Ugaritic U+103D1 ‮𐨬‮⅂‮ヿ‮า‮ㄱ‮ꓶ ‮𖼦
‮ᕫ Canadian Syllabics U+156B ‮𐊙‮🝢‮ᗐ‮ш ‮𐡵‮𐍦
‮ᕄ Canadian Syllabics U+1444 ‮Ꮑ‮ɲ ‮ꛮ‮𐡶‮𐢊
ליגטורות: ‮"
מספרים:
תו יוניקוד ושפה כתובה חלופות תמיכה מועטה
‭I Latin U+0049 ‭↿‭亻
‭೩ Kannada Numerals U+0CE9 ‭ㄹ ‮𖩒
‭Յ Armenian U+0545 ‭ろ‭𐦯‭ⴺ‭꒱ ‮𑚡‮ᜂ‮𑚙‮𑋊
‭Ч Cyrillic U+0427 ‭ч‭ц‭ㄐ‭丩‭ㆢ ‮𑛅‮𑚦‮𑛅
‭ち Hiragana U+3061 ‭ら
‭ꕃ Chakma U+AA83 ‭б‭ნ ‮𐡨‮𑛉
‭ヲ Katakana U+30F2 ‮𞠀‮𞡳
‭৪ Bengali Numerals U+09EA ‭ꗚ‭ꖉ ‮𞢦‮𞣋
‭વ Gujarati U+0AB5 ‭ዖ‭ፆ ‮𑛇‮𖩥‮𞡽‮𞠆
‭ⵔ Tifinagh U+2D14 ‭〇 ‮ᝪ‮𞢡
ליגטורות: ‭ꕑ

קצת מידע טכני

רובוט יוניקוד, איור אולג מילשטיין

איור: אולג מילשטיין

לכל תו בעולם יש קוד שמייצג אותו – לדוגמא האות א׳ מיוצגת ע״י הקוד 05D0, וכך בכל פעם שתקלידו א׳ ותשלחו במייל או וואטסאפ, לדוגמה, מי שיקבל את ההודעה יראה את האות א׳. גם אם זה יהיה בפונט שונה זה עדיין יהיה תו של האות א׳. יוניקוד הוא תקן חשוב וחיוני לעיבוד יעיל ואפקטיבי של טקסט ומסייע להפיכתו של העולם לכפר גלובלי קטן.

כתב בבל הוא אוסף של תווי יוניקוד ממערכות כתיבה שונות – בעלי כיווני כתיבה שונים, ולכן עלולים להיווצר שיבושים והיפוכים בין אותיות. כדי לפתור את הבעיה הזו הוספנו כאן במחוללים תווי יוניקוד מיוחדים ובלתי־נראים המיועדים לשנות את התנהגות האות או המילה שבאה אחריהם. לדוגמה, התו Right-to-Left Override U+202E הופך את כיוון הכתיבה של התו שבא אחריו ל־RTL. אם אתם משתמשים בקוד CSS תוכלו גם להשתמש בפקודה: unicode-bidi: plaintext או unicode-bidi: bidi-override כדי לאחד בין כיווני הכתיבה.

מגבלות

הטקסט מתרנדר בצורה שונה בין כל מערכת הפעלה. בנוסף גם כל אתר/אפליקציה וכו׳ מעביר את הטקסטים עיבודים שונים לפני שהם מתפרסמים כדי להתמודד מול ניסיונות הקינג וספאם. וואטסאפ ואינסטגרם הן שתי אפליקציות שמציגות את ״כתב בבל״ בצורה טובה. מבדיקה שעשינו, אלה רשתות חברתיות שלא תומכות ב״כתב בבל״: פייסבוק, טוויטר ולינקדאין. במייל בינתיים נראה שעובד בג׳ימייל, נמשיך לבדוק בעוד פלטפורמות.

חשוב להבין זה שמסנני ספאם לא אוהבים ״ג׳יבריש״, ובשבילם כתב בבל הוא ג׳יבריש שהם לא מצליחים לקרוא. אבל בד״כ אין להם בעיה עם קצת ג׳יבריש, לכן כדאי להשתמש בכתב בבל בצורה מדודה ולא לכתוב איתו משפטים שלמים, אלא פה ושם.

קרדיטים

בהכנת ״כתב בבל״ סייעו לי אנשים טובים ביניהם: אלעד יאנה, תום לוז, שפרה קורנפלד והגר ברנע.

...וגם אולי אתם: אם נדמה לכםן שמצאתםן באג או תו מוצלח יותר ממה שמצאתי – ספרו בתגובות ונבדוק ונשפר בהתאם.

אז למה אתם מחכים? חוללו לכם מילים ושתהיה ‮‏‮𐐣‮ᕄ‮ᑊ‮ユ‮𐑸‮ ‮I‮∩‮ᕄ‮ᑊ‮ᘞ‮𐑸‮ ‮𐋉‮I‮ᕈ‮𐑸 מכולנו ב־אאא. ותדליקו בוילר, היה לנו שבוע ארוך בסטודיו.

ענן של צירופי מילים להעתקה

לסיום, קבלו שי לחג – רשימה מתעדכנת של צירופי מילים שאפשר להעתיק בלחיצה: (מוזמנים להציע עוד בתגובות)

‏‮ᘓ‮𐑓‮𐑸‮ ‮𐋉‮I‮ᕈ‮𐑸
‏‮𐊙‮ܠ‮𐑸‮ ‮ଏ‮I‮ユ‮𐑸
‏‏‮コ‮Ꮑ‮ᑊ‮ユ‮𐑸‮ ‮I‮∩‮ᕄ‮ᑊ‮ᘞ‮𐑸‮ ‮๒‮I‮ユ‮𐑸
‏‮ⴿ‮J‮ᑊ‮ ‮𐨲‮I‮𐑸‮ユ‮ ‮メ‮I‮ᕄ‮ๅ
‏‮ꗪ‮𐐈‮ᑊ‮ ‮c‮I‮I‮𐑸‮ᕈ‮ɲ‮ ‮꒟‮꒐‮I‮ᕄ‮𐑜
‏‮N‮ᗱ‮I‮"‮|
‏‮ກ‮I‮ጓ‮𐑸‮ ‮𐨬‮ꇜ‮𐑸
‏‮ユ‮I‮ㄗ‮𐐑‮ ‮๒‮I‮그
‏‮‏‮𐒀‮𐤐‮𐑸?
‏‮⛉‮ユ‮그‮ܕ
‏‮ᑊ‮I‮ロ‮ ‮𐑸‮I‮ᔭ‮ℸ‮Ꮑ‮ ‮ᕫ‮ᘞ‮∏
‏‮ᑊ‮I‮p‮ ‮𐑸‮I‮ᘕ‮ਕ‮ᕄ‮ ‮ᘓ‮N‮ꓵ
‏‮𐨲‮メ‮౫
‏‮𐨭‮ス‮ ‮ᕫ‮ᘞ‮∩
‏‮ᕄ‮ኘ‮ᑐ‮ᑊ‮ ‮ᘕ‮N‮ᗱ‮I‮I‮ɲ
‏‮ᗱ‮I‮p‮ ‮Ꭾ‮ᘕ
‏‮𐐣‮ට‮ᘃ‮𐑸‮ ‮𐒀‮ᘕ‮ᑊ‮ๅ
‏‮𐑸‮ᑊ‮I‮ᘓ
‏‮ᔭ‮ᑊ‮ᔭ‮ܕ‮ ‮๒‮I‮ユ
‏‮𐑸‮ᑊ‮O‮𐋉‮ᘃ‮ᑊ
‏‮‏‮𐨲‮∩‮ᔭ‮𐑸
‏‮ᑊ‮I‮ᗱ‮c‮I‮ ‮ᴺ‮I‮ ‮𐑸‮𐐣‮ᘕ‮δ
‏‮𝓝‮𐑣‮𐐈‮"‮|
‏‮ᘞ‮⊺‮ᔭ‮ ‮๒‮I‮ユ
‏‮ꗪ‮ᘓ‮𐐣‮ᘃ‮𐑸
‏‮O‮ᘕ‮ᑊ‮ꓵ‮𐑸
‏‮ᗐ‮ユ‮ᕄ‮ ‮ᕫ‮ᔭ‮I‮ロ
‏‮ᘓ‮ᕈ‮ᕄ‮ ‮୧‮ᘕ‮I‮p
‏‮ᘞ‮𐑸‮ ‮ㄗ‮I‮ᘃ‮𐑸‮ ‮ꗪ‮ꓵ‮ᑊ?
‏‮‏‮𐑸‮∩‮"‮p‮ ‮ᘓ‮ᘕ‮𐑓‮I‮ ‮ɲ‮I‮ᕄ‮ᑊ‮p
‏‮‏‮c‮I‮ᕄ‮𐑸‮ ‮ɲ‮I‮ᕄ‮ꓵ
‏‮𐑓‮ᘓ‮N‮𐑸‮ ‮ᧉ‮ᘕ‮ᴵ
‏‮𐋉‮ᑊ‮O‮𐑸‮ ‮𐑓‮𐒀‮ᑊ‮N‮𐑸
‏‮ꁐ‮ꃀ‮𐨬‮ᑊ‮ꗪ‮I‮ɲ
‏‮‏‮ꓵ‮ᘓ‮N‮ᘕ
‏‮‏‮ਕ‮ᑊ‮ ‮ᘕ‮𐑸‮𐋉‮ᘃ‮ᑊ‮ᘕ
‏‮∩‮"‮ロ‮ ‮𐊙‮ᔭ‮ᑊ
‏‮ユ‮ᕫ‮I‮𐐑‮I‮ᕄ‮ ‮๒‮I‮ユ‮I‮ᕄ
‏‮ꇜ‮ਕ‮I‮·‮ㄗ
‏‮ᘞ‮𐑸‮ ‮ⴿ‮I‮コ‮ᔭ‮ᑊ‮ロ?
‏‏‮ᕈ‮ᘓ‮𐑣‮𐑸‮ ‮𐋉‮I‮ᕈ‮𐑸
‏‮ᑊ‮ꗪ‮δ‮ᘕ‮𐑸‮ ‮ᕈ‮ᘕ‮c‮I‮𐑒‮|

הוסף/י תגובה

18 תגובות

05
רחל וירצבורג

הכותב משתמש בביטוי מלאכה סיזיפית. אילו מחאכתו הייתה אכן כזו, הוא לא היה מםרסם את הכתבה, כי במלאכה סיזיםית אין מגיעים לתוצאה ואין זוכים לברך על המוגמר. הכותב עמל רבות, הקדיש שעות ואכן ראה ברכה בעמלו. בלאכה סיזיפית זה לא קורה.

    06
    יניב

    לא מדוייק. סיזיפוס גילגל את הסלע עד לפסגת ההר ומשם הוא היה מתגלגל למטה. משמע, הגיע לסוף התהליך, אך נגזר לחזור עליו שוב ושוב.
    כל עוד יש עוד מלאכת חיפוש, ואני מאמין שיש כי זו גירסה 1.0, הפונט הגיע למיצוי, הסלע הגיע לראש ההר, אך יש להמשיך ולחפש, מלאכת החיפוש לא תסתיים, אך גירסה זמנית יש גם יש.

15
אנקטי

‏‮ꗪ‮ᕈ‮ᘃ‮𐑸‮p‮ ‮ᕄ‮I‮ਕ‮𐑸‮ ‮ᘕ‮ๅ‮ ‮𐑣‮ᘕ‮ ‮𐑓‮ට‮ᘕ‮ꗪ‮I‮ᕄ‮ᑊ‮I‮ᕄ‮ ‮ᕈ‮ᕈ‮ᘕ‮ᑊ‮I‮ᕄ‮ ‮ᘓ‮ᑊ‮ᘃ‮I‮I‮ ‮𐑸‮N‮I‮|‮ ‮ᘕ‮ᕈ‮ᕈ‮I‮ᕄ

18
ליאור

יש כמה וכמה תווי יוניקוד שכן נראים כמו כתבים מרובע ו/או עגול עבריים, שלא דורשים תו התאמה לכיוון הקריאה. כמו כתבים נבטי וכו.

בעצמי נברתי וראיתי כמה תווים שנראו לי כמו הומוגרפים לאותיות עבריות. תווים שלא הועלו כאן. ואפשר גם להרכיב אותיות על ידי שימוש בתוי קומביינינג

מה עם סולטראו...