文字化け
含义
乱码——由于编码不匹配导致的文字显示错误,当日语字符因使用了错误的字符编码而显示为无意义的符号。
文字化け(mojibake)描述的是用一种字符集编码的文本以另一种字符集读取时出现的乱象,产生一堆无意义的符号。这一现象深深植根于日本计算机历史:日本复杂的书写系统需要自己的编码标准(Shift-JIS、EUC-JP),这些标准与西方系统不兼容,使得mojibake在1990年代和2000年代成为普遍的头痛问题。虽然Unicode已大体解决了这个问题,但在旧文件、某些邮件客户端和跨平台数据传输中仍然会出现乱码。这个词既作为技术名词使用,也作为日常动词使用——文字化けする(变成乱码)。
例句
- メールを開いたら全部文字化けしてて何も読めなかった。 打开邮件发现全都乱码了,什么都看不了。
- 文字化けしてる古いテキストファイル、エンコーディング変えたら直った。 乱码的旧文本文件,改了编码就修好了。
- このサイト、たまに文字化けするんだよね。スマホだと特に。 这个网站偶尔会乱码,用手机的时候尤其容易。
用法指南
语境: tech discussions, casual conversation, workplace, online help forums
语气: frustrated, matter-of-fact
正确说法
- 这个CSV文件乱码了,请用UTF-8重新保存一下。
- 打开以前的网站有时候会出现乱码呢。
错误说法
- 不要把「文字化け」和普通的打字错误或误选汉字搞混——文字化け特指编码问题,和打字错误是两码事
常见错误
- Learners sometimes write 文字バケ with katakana バケ — the correct form uses hiragana け throughout: 文字化け
- Thinking the problem is purely historical — mojibake still occurs regularly with legacy systems, CSV exports, and email in Japanese business environments
起源与历史
文字化け comes from 文字 (character/letter) + 化け (transformation, as in becoming something else — e.g. お化け, ghost). The combination vividly describes characters 'transforming' into unrecognisable symbols. The phenomenon became acutely common in Japan due to competing character encoding standards (Shift-JIS vs EUC-JP vs ISO-2022-JP) that coexisted through the 1990s and 2000s before UTF-8 standardisation.
文化背景
时代: 1980s–present; peak prevalence 1990s–2000s
世代: All ages; older users have strong nostalgic frustration with it
社会背景: Universal among computer users
地区说明: Uniquely significant in Japan due to the historical complexity of Japanese character encoding. The word mojibake itself has been adopted into English-language tech writing as the standard term for this phenomenon.
相关短语
闪卡、测验、音频发音和间隔重复