Anonim

תצוגה מקדימה של Windows 10 Insider Build 18875 (20H1)

בפרק 9 של העונה השנייה של Log Horizon, כאשר ...

שירו נפטרה והופיעה בשרת הלא-רשמי ה -14 של אלדר טייל, שרת הבדיקה, שהיה אמור להיות על הירח במקום על כדור הארץ,

... הוא בדק את המיקום ודיאלוג היה בעיקר מבולבל, נשמר לשם המיקום סוסה Tranquillitatis.

האם ניתן לפענח את הטקסט המעורפל, או שהם פשוט זבל?

כן, הטקסט המעורפל הוא תוצאה של mojibake, שבו הטקסט המקורי ביפנית, המקודד בקידוד Shift-JIS, מפוענח על ידי קידוד Windows-1256.

אם אי פעם תפתח דף אינטרנט יפני או קובץ טקסט המקודד בקידוד Shift-JIS (ערכת תווים של 2 בתים) תחת קידוד מערבי כלשהו ב- Windows (ערכת תווים של 1 בתים), תראה תדירות גבוהה של �� בשילוב עם דמות אחרת בתצוגה המתקבלת. מכיוון שאני מתבונן שיש תווים בערבית בתמונה, השתמשתי באחד מקובץ הטקסט הקיים שלי שמקודד ב- Shift-JIS וניסיתי לפתוח אותו בקידוד ערבית (Windows) בדפדפן, וגיליתי שערבית (Windows) או קידוד מערבי מכיל את אותה המיפוי �� ו �� (שהוא עוד דמות נפוצה בטקסט המעורפל).

לאחר השוואה לחלון סטטוס המיקום שניתנו כראוי ולניחושים מסוימים, הצלחתי לפענח את הטקסט המעורפל לטקסט יפני תקין (הסוגריים ו- מתווספים לשם הבהרה ולא מפוענחים מטקסט מעוגל):

������������������ ��������������� ��������������� ��������������� ������������ ���������������/��������������������������� ��������������� ������������������������ ������������������������ ���������������/������������ ���������������/������������ 

תִרגוּם:

 Moon Server  Moon Server  Isolated zone/No monster  PVP allowed Special skills allowed Entry restriction/Restricted Exit restriction/Restricted 

נִספָּח

כדי לבדוק את התוצאה, תוכלו להשתמש בחתיכה הבאה של קוד Python 3:

garbled = '��T��[��o��[\n������T��[��o��[\n��]��[�����\n������T��[��o��[\n����������\n�����������]��[�����/������������X��^��[��o��������������\n���������������\n�����������s������������\\���������\n��@���S��������Z��g���p��������\\\n��@��i����������������/�����������\xa0�����\n��@�������o�����������/�����������\xa0�����' print(garbled.encode('Windows-1256').decode('Shift-JIS')) 

להלן ה- צפייה בלבד מָקוֹר1 של mojibake להשוואה עם התמונה:

1 הטקסט שלהלן מכיל סימן U + 200E משמאל לימין כדי למנוע מדמויות ערביות להציג מימין לשמאל ולשנות את צורותיהן בהתאם למיקומן. בעיה נוספת המונעת העתקה ישירה נובעת מהימצאותו של U + 00A0 No-Break Space, המומר לחלל בעת העתקתו מהדפדפן.

�����T��������[��������o��������[��� ���������������T��������[��������o��������[��� �����]��������[�������������� ���������������T��������[��������o��������[��� ���������������������� ��������������������������]��������[��������������/������������������������������X��������^��������[��������o����������������������������������� ��������������������������������� ��������������������������s������������������������������\������������������������ �����@���������S��������������������Z��������g���������p��������������������\��� �����@��������i�������������������������������������/��������������������������������������������� �����@�������������������o��������������������������/��������������������������������������������� 
1
  • "PvP מותר": הא. תוהה אם זה בסופו של דבר יהיה חשוב.