|
---|
以灰色標註者尚未正式啟用 |
一般 | |
---|
條目與內容 | |
---|
頁面處理 | |
---|
用戶行為 | |
---|
其他 | |
---|
|
本頁面為維基百科:字詞轉換下屬子頁面,用於處理各維基計劃全域轉換和中文維基百科本地全局轉換中的所有繁簡與地區詞錯誤轉換修復的請求。
由於簡體中文、繁體中文之間存在一對多現象,即以單一簡化字或繁體字來對應多個繁體字或簡化字[1][2],因此必須有額外的數據來補足原先丟失的資訊。例如,繁體中的「髮」或「發」,在簡體下都是「发」。在程式裏,我們有一個預設的對應,比如說「發」。那麼一般情況下要從簡體轉換成繁體時,程式遇到「发」就會先將其轉換成「發」。那麼什麼時候對應成「髮」呢?這就要看詞庫而定。比如詞庫中有「头发=>頭髮」的關係,這樣「头发」就會被轉換成「頭髮」。如果沒有這一關聯,那「头发」就會被錯誤地轉換成「頭發」。
那詞庫是如何建立的呢?我們先有每個字的預設對應,比如「发」轉換成「發」。然後我們在一個現有的繁體詞庫中尋找包含繁體「發」的詞,再轉換成簡體。這樣得到一個從簡體到繁體的詞彙對應關係。所以,我們先要確定一個多對應字的預設對應關係。同樣,修復過度轉換也是由上述的方法來處理。
|
- 字詞轉換不是糾正錯別字的工具。如果你發現了錯別字,請在原文中直接修正。
- 提報前請使用搜尋工具(Google搜尋[區分繁體簡體]、本站內建的搜尋)尋找維基百科裏的字詞轉換錯誤,只影響一兩篇條目的罕見錯誤請直接在條目中手動轉換進行修復。另外地區詞過度轉換可能是公共轉換組的副作用,此時也請直接手動修復。
|