Hebrew support in Free Software

From: Nadav Har'El (nyh_at_nonexisting.hamakor.org.il)
Date: Mon 11 Jul 2005 - 09:08:48 IDT


תמיכה בעברית בתכנה חופשית - היכן אנחנו, ולאן אנו הולכים?
========================================================

שלום חברים,

לפני קצת יותר משש שנים, יצאתי בתרועה רמה [1] להתריע בפני קהילת התכנה החופשית
הישראלית על מצב בעייתי: בעוד התכנה החופשית בעולם התקדמה בקצב אדיר, תמיכה
בעברית כמעט ולא הייתה קיימת. אנשים שרצו לכתוב, לקרוא ולהשתמש בעברית נאלצו
לעבוד במערכת הפעלה ובתכנות קנייניות של חברה מסוימת, שהייתה מבין הבודדות בעולם
שטרחו להשקיע בשפה הקטנה שלנו.

מהפכת העברית התקדמה בדרך מאורגנת פחות מכפי שניסיתי ליזום, ובקצב אטי יותר ממה
שקיוויתי, אך דבר אחד ברור: מצב התמיכה בעברית בתכנה חופשית היום טוב לעין ערוך
מזה שהיה לפני שש שנים. עבודה קשה ומשותפת של עשרות ישראלים ומפתחים בן-לאומיים
הביאו למצב שניתן לקרוא ולכתוב עברית במרבית היישומים החשובים למשתמש הממוצע -
מעבדי תמלילים, תכנות ציור, דפדפני אינטרנט, מסרים מידיים, ומה לא. יש לנו היום
פונטים עבריים חופשיים (שזיכו את כותבם ב"פרס המקור"), בודק איות עברי חופשי,
ותשתית נרחבת ברוב התכנות החדשות לתמיכה בריבוי שפות (למשל, UTF8) ובדו כיווניות.
הפצות לינוקס חדשות מכילות תכנות רבות שכבר תומכות בעברית, והפצות מיוחדות
לעברית כבר קיימות. דואר אלקטרוני בעברית הוא כבר עובדה קיימת, ומכתב זה מעיד
על כך.

אך האם זה אומר שאנחנו יכולים לנוח על זרי הדפנה? האם סיימנו את העבודה?
כנראה שלא, לצערי.

במכתב זה אנסה לסקור את מה שלדעתי עדיין חסר לנו. אשים דגש על חוסרים שלדעתי
עשויים למנוע מתכנה חופשית להפוך לתחליף מלא לתכנה קניינית אצל המשתמש הישראלי
הממוצע (ולא אתעכב על חוסרים שיפריעו רק לחובב יוניקס מושבע).
כל הרעיונות שאכתוב, מלבד אולי האחרון, אינם חלומות באספמיה, והם ניתנים ליישום
תוך זמן לא רב על-ידי מתנדבים. במהרה בימינו אמן.

עברית בהפצה נפוצה
-----------------

ה"משתמש הממוצע" אינו מסוגל לגשת לעשרות אתרים ולאסוף תכנות כדי להפוך את המערכת
שלו לתומכת בעברית. הוא גם אינו רוצה לעקוב אחרי דף הוראות שאורכו כאורך הגלות
עם עשרות שלבים לקינפוג המערכת שלו לתמיכה מיטבית בעברית. הוא זקוק ל"הפצה" -
מערכת הפעלה חופשית מלאה, שכוללת את כל התכנות לו הוא עשוי להיות זקוק, וכוללת
תמיכה מלאה בעברית - ללא צורך בתיקונים או "קינפוגים".

למרות שזיהיתי את הצורך הזה כבר ב- [1], לדעתי המצב הנוכחי עדיין אינו משביע רצון.
מספר הפצות עבריות נוצרו, כגון [2], [3], אך הן מבוססות על הפצות נדירות,
אזוטריות, קטנות, או שנועדו לקהל-יעד מאוד מסוים (כגון ילדי בית-ספר). אנשים אחרים
בנו חבילות לתמיכה עברית בהפצות פופולריות הרבה יותר, כמו [4], [5], [6], ועוד.
אבל מה שבאמת צריך הוא ללכת עם רעיון זה עד הסוף: הפצה המבוססת על הפצה פופולרית
מלאה וכללית, כמו למשל פדורה או דביאן, ושהתמיכה בעברית בה מלאה מאל"ף ועד תי"ו.
הוראות התקנה בעברית, יישומים שעובדים בעברית ללא שינוי, קבצי עזרה בעברית, וכד'.

טוב אף מכך יהיה המצב שבו משתמש ישראלי יוכל לקחת הפצה פופולרית רגילה - ללא כל
צורך בגרסה ישראלית מיוחדת - ואחרי בחירת "עברית" בזמן ההתקנה יקבל תמיכה עברית
מלאה.

תרגום לעברית של תיעוד
---------------------

משתמשים ישראלים "רגילים" מצפים לראות רק עברית על המחשב שלהם, ולא אוהבים
להזדקק לקריאת אנגלית, כמעט בשום מצב. לכן חשוב לתרגם לעברית את *כל* התיעוד,
הוראות התקנה, מדריכי משתמש, קבצי עזרה וכד', הנחוצים למשתמש הממוצע - ובעיקר
למשתמש המתחיל.

תרגום לעברית של יישומים
-----------------------

מאותה סיבה, חשוב גם לתרגם לעברית את מנשק המשתמש של כל היישומים להם נזקק משתמש
ממוצע (מובן שתרגום זה יהיה ניתן לבחירה, והמשתמש יוכל גם לבחור את השפות האנגלית,
ערבית, רוסית, ואחרות). התרגום חייב לכלול את מנהל החלונות, את מקנפג המערכת,
מעבדי תמלילים, דפדפן אינטרנט, תכנות ציור ועוד - שמנשק המשתמש של כולם בעברית
טהורה ועקבית. התרגום לעברית חייב לעקוב במהירות אחרי שינויים בגרסאות המקוריות של
התכנה, כשהמצב האופטימלי יהיה שתרגום עברי יהיה קיים כבר ביום יציאת גרסה חדשה
של התכנה המקורית.
המצב בתחום זה לא רע כפי שהיה לפני שש שנים, אך עדיין לא מספק.

תמיכה עברית ביישומי אינטרנט
---------------------------

לאחרונה, רבים "יישומי האינטרנט" - יישומים שאין צורך שכל משתמש יתקין אותם,
אלא מספיק להתקינם בשרת מרכזי ומשתמשים רבים מתחברים אליהם בעזרת דפדפן
מדובר לדוגמה, על שרתי דואר-ווב, שרתי ויקי, שרתים למעקב אחרי באגים, בלוגים,
פורומים, ועוד. הרבה מיישומי אינטרנט אלו עדיין לא תומכים בעברית, או שנדרשים
"תיקונים" שונים ומשונים כדי שיתמכו כראוי בעברית ובכתיבה מימין לשמאל. לכן יש
צורך בשיפורם לתמיכה בכתיבה עברית, ובתרגום המנשק שלהם לעברית.

זיהוי כתב עברי
--------------

תכנת OCR (זיהוי כתב) עברית חשובה לא רק עבור משתמשים, אלא גם עבור פרויקטים
חופשיים שעניינם העלאת ספרים עבריים ישנים (חסרי זכויות יוצרים) על הרשת [8].
מימוש אחד של OCR עברי כבר התבצע [7], אך דרושים שיפורים רבים, וכנראה גם שילוב
בתוך תכנת OCR רב-לשונית נפוצה, כדי להפוך אותו ליותר שימושי. נדרשת גם תמיכה
בטקסטים מנוקדים ובלתי-מנוקדים.

בעיות "ישראליות" נוספות
-----------------------

תמיכה במשתמש הישראלי לא יכולה להסתכם רק בתמיכה בעברית. מובן שיש צורך גם לתמוך
בשפות נוספות הנפוצות בישראל, כמו ערבית רוסית, ואיך לא - אנגלית. אך יש בעיות
נוספות מלבד השפה. צריך לתמוך בחמרה שמשום-מה נפוצה דווקא בישראל (בעבר זה היה
נכון עבור מודמים ADSL). לתמוך בשיטות קישור לאינטרנט הנפוצות בישראל, בסטנדרטים
ישראלים (גודל נייר, אזור DVD, יחידות מידה, לוח עברי, כתוביות בעברית על סרטים,
שיטות שידור טלוויזיה ומדריכי טלוויזיה בישראל, וכו'), בעיות אופייניות באתרי
וב ישראלים "מקולקלים" ועוד ועוד.

מנשק משתמש, הדור הבא
--------------------

הסכנה הגדולה ביותר שאורבת לתכנה החופשית היא "מעבר פזה" - שינוי כיוון - בעולם
התכנה המסחרית, בעוד התכנה החופשית עדיין "עוקבת" אחר הכיוון הישן. המדובר הוא
בשינוי גדול שהושקע בו כסף ומשאבים לרוב ושישאיר את התכנה החופשית מאחור וללא
מענה למשך שנים.
דוגמה אחת מעברנו הייתה המעבר מעורכי טקסט בסגנון יוניקסי למעבדי תמלילים גרפיים
בסגנון WYSIWYG: המחסור במעבד תמלילים עברי חופשי מנע שימוש בתכנה חופשית בישראל
למספר רב של שנים.
הבעיה אותה אני צופה בעתיד הוא מעבר למנשק משתמש (UI) מסוג חדש: דיבור. אני
צופה שבעתיד "מחשב" יהיה לאו דווקא מכשיר עם מקלדת - הוא יהיה אולי מחשב במכונית,
מכשב כף יד, מחשב בקיר הבית, וכד'. אחת הצורות לתקשר עם מחשבים כאלו יהיה כנראה
בעזרת דיבור.

לכן לדעתי בשנים הבאות יהיה חשוב לפתח תכנה חופשית להשמעת דיבור וזיהוי דיבור
בעברית. ניתן יהיה לבנות על בסיס תכנות קיימות, כמו תכנת הדיבור festival והמילון
של hspell, אך יידרש כאן פיתוח חדש - ארוך טווח, קשה, אך מאוד מעניין.

אגב, למרות שקראתי למנשק הקולי "הדור הבא", הוא משמש כבר היום משתמשים רבים, בעלי
ליקויי ראייה. משתמשים אלו נאלצים היום לקנות תכנות הקראה יקרות, בהיעדר חלופה
חופשית. בנוסף, מנשק קולי משמש כבר היום (שוב, בעיקר בכיוון ההקראה) ביישומים
טלפונים, כמו מענים קוליים.

קישורים
-------

[1] http://ivrix.org.il/announcements/1.html
[2] http://kinneret.berlios.de/main/
[3] http://kazit.berlios.de/
[4] http://www.ivrix.org.il/redhat/
[5] http://qa.debian.org/developer.php?login=baruch@debian.org
[6] http://sourceforge.net/projects/cygwin-ports/
[7] http://www.math.tau.ac.il/~didi/ocr/
[8] http://benyehuda.org/h_faq.html

-- 
Nadav Har'El                        |       Monday, Jul 11 2005, 4 Tammuz 5765
nyh_at_math.technion.ac.il             |-----------------------------------------
Phone +972-523-790466, ICQ 13349191 |The socks in my drawer are like
http://nadav.harel.org.il           |snowflakes: No two are alike.


This archive was generated by hypermail 2.1.7 : Sat 08 Oct 2005 - 15:41:59 IST