跳至內容

維基百科:字詞轉換/修復請求

維基百科,自由的百科全書
字詞轉換
主頁 討論
轉換請求
錯誤修復請求
地區詞候選
轉換介紹
字詞轉換處理 討論
  繁簡處理 討論
  地區詞處理 討論
  公共轉換組 討論
幫助文件
繁簡與地區詞處理 討論
  轉換原理 討論
  手工轉換 討論
  進階語法 討論
  用字模式選擇說明
相關模板
NoteTA 全文字詞轉換
CGroup 公共轉換組列表
Lan 介面文字轉換
地區用詞 地區詞模板
地區用詞2 進階地區詞模板
各地中文名 地區用詞資訊框
檢視 - 討論 - 編輯 - 變動

本頁面為維基百科:字詞轉換下屬子頁面,用於處理各維基計劃全域轉換和中文維基百科本地全局轉換中的所有繁簡地區詞錯誤轉換修復的請求。

返回字詞轉換主頁 提交錯誤轉換修復新請求

轉換與修復原理

由於簡體中文、繁體中文之間存在一對多現象,即以單一簡化字或繁體字來對應多個繁體字或簡化字[1][2],因此必須有額外的數據來補足原先丟失的資訊。例如,繁體中的「髮」或「發」,在簡體下都是「发」。在程式裏,我們有一個預設的對應,比如說「發」。那麼一般情況下要從簡體轉換成繁體時,程式遇到「发」就會先將其轉換成「發」。那麼什麼時候對應成「髮」呢?這就要看詞庫而定。比如詞庫中有「头发=>頭髮」的關係,這樣「头发」就會被轉換成「頭髮」。如果沒有這一關聯,那「头发」就會被錯誤地轉換成「頭發」。

那詞庫是如何建立的呢?我們先有每個字的預設對應,比如「发」轉換成「發」。然後我們在一個現有的繁體詞庫中尋找包含繁體「發」的詞,再轉換成簡體。這樣得到一個從簡體到繁體的詞彙對應關係。所以,我們先要確定一個多對應字的預設對應關係。同樣,修復過度轉換也是由上述的方法來處理。

外部連結

錯誤轉換修復請求

狀態:   等待中

請修復簡體模式下錯誤轉換:「峯」,正確轉換應為「峰」。出錯頁面:金峯山寺。其他說明:峯在《通用規範漢字表》作為峰的異體字,同羣和群。--Kethyga留言2024年4月7日 (日) 09:56 (UTC)[回覆]

異體字是相互的,不等同於繁體字。雖然有些異體關係中存在正體字,但是「峯」並不罕見於簡體中文環境的人名地名專名,不宜統統被「峰」取代。--— Gohan 2024年4月28日 (日) 07:49 (UTC)[回覆]
簡體中文環境常見「峯」?「峯」在《通用規範漢字表》中就是「峰」的異體字,繁體字和異體字在《中華人民共和國國家通用語言文字法》的地位是完全一致的,都是限定在一些場合使用(見第十七條),在中維的轉換規則自然也應視同繁體字(既是規範漢字又作為另一個字異體字的情況除外,如「喆」「昇」等,但繁體字同有這種情況如「乾」,仍進一步說明它們地位是一致的)。既然異體字「棄」轉換為了「弃」,「峯」當然也應轉換,正式場合中國大陸也用「林峰」而不用「林峯」([1])。--自由雨日留言2024年6月9日 (日) 16:06 (UTC)[回覆]
維基的轉換規則不會完全拘泥於《通用規範漢字表》規定,因為規定往往是滯後的,當前媒體與社會的用字傾向隨時有可能突破(近年甚至出現了黄霄雲這樣的極端人名用字,但目前只是孤例)。不過對於本案,仍可繼續討論。—Chiefwei - 2024年6月10日 (一) 03:08 (UTC)[回覆]
感謝閣下提醒!您的回覆給了我很大啟發。不過……《通用規範漢字表》雖可能滯後,但卻是強符合「可供查證」的(以及相對滯後也意味着相對穩定),根據媒體社會用字傾向來決定轉換,是否會有原創研究/總結之嫌?比如黃霄雲,在今年(2024年)文聯旗下中國文藝網中的人名還是「云」而非「雲」([2]),在看不到當事人身份證的情況下,不同可靠來源中有不同用字,該如何定奪呢?--自由雨日留言2024年6月10日 (一) 03:24 (UTC)[回覆]
文聯既不代表在可靠來源中常用,亦非黃霄雲的主人或本人。在簡體中文環境的主流媒體中,「黃霄雲」並不比「黃霄雲」常用。--— Gohan 2024年6月29日 (六) 08:37 (UTC)[回覆]
在簡體中文環境的主流媒體中,「黃霄雲」並不比「黃霄雲」常用。[來源請求]--自由雨日留言2024年6月29日 (六) 08:43 (UTC)[回覆]
請閣下留意簡體字在維基百科並非只有中國大陸使用——也會影響星馬用字,並區分「應然」與「實然」。維基百科的「應然」取決於現實的「實然」,而不由中國大陸的「應然」決定。另外,對於中國大陸,仍有不少人「名」中違法使用異體字,也曾鬧出不少交通站名借字改地名引發爭議、甚或最終改回異體字原名的新聞。--— Gohan 2024年6月13日 (四) 07:29 (UTC)[回覆]

狀態:   等待中

請修復大陸簡體模式下錯誤轉換:「鳽」,正確轉換應為「𫛚」。出錯頁面:小葦鳽。其他說明:疑似在中日韓統一表意文字擴展區內的部分簡化字有數個並未被順利轉換成對應的繁體,並導致小葦𫛚小葦鳽不被視作同等詞彙。另外可能一些同樣以鳥部類推簡化的字,如F區「𮭥」也有有類似情況。(但與𫛚字同區的「鵟」就有成功轉換。)--WiTo🐤💬 2024年4月24日 (三) 08:37 (UTC)[回覆]

@T45614631「𫛚」和「𮭥」屬於通用規範漢字表以外的漢字(簡稱「表外字」)而「鵟」屬於表內字。表內字肯定是得到簡化了的,但表外字是否需要類推簡化具有爭議性,因為中國政府態度模糊並未明言表外字需要或不需要簡化(多數實際操作中類推簡化了)。我不是要說上述兩個字不可以簡化,但可能需要更多討論。可以看這裏關於應不應該無限類推簡化的一堆文章。另外我想到了植物也有一個「苦蘵」,當中的「蘵」要不要簡化也可以討論一下。--微腫頭龍留言2024年5月6日 (一) 09:58 (UTC)[回覆]
好,我去客棧開個話題。--WiTo🐤💬 2024年5月6日 (一) 15:30 (UTC)[回覆]
等待共識,暫不處理。—Chiefwei - 2024年6月9日 (日) 11:35 (UTC)[回覆]

打印尼

狀態:   待修復

請修復大陸簡體模式下錯誤轉換:「打印尼」,正確轉換應為「列印尼」。出錯頁面:Viu。其他說明:「列印-打印」。常見組合「位列印尼」、「一列印尼」、「名列印尼」。舉例,營多麵的「系列印尼」,印度尼西亞駐泰國大使館的「並列印尼」,桑迪亞加·烏諾的「名列印尼」。可能需要排除「列印尼龍」。--Kethyga留言2024年8月12日 (一) 06:20 (UTC)[回覆]

這個問題貌似在各個出問題的條目中直接用-{}-打斷比較好?--竹林下小徑月光映一葉 2024年8月21日 (三) 03:48 (UTC)[回覆]

马哈迪

狀態:   完成

請修復臺灣正體、香港繁體模式下錯誤轉換:「马哈迪」,正確轉換應為「馬哈迪」。出錯頁面:多個頁面。其他說明:如無使用{{noteTA}}模板,在繁體模式下會顯示「马哈迪」(即無論在任何模式下均顯示為大馬簡體模式。)--~Mahogany~留言2024年8月13日 (二) 03:25 (UTC)[回覆]

之前提報過,Wikipedia:字詞轉換/修復請求/存檔/2024年8月,等待維基伺服器更新。--Kethyga留言2024年8月14日 (三) 01:12 (UTC)[回覆]
伺服器已更新。--屠麟傲血留言2024年8月22日 (四) 15:00 (UTC)[回覆]

吉他們

狀態:   待修復

請修復所有簡體、台灣繁體模式下錯誤轉換:「吉他們」,正確轉換應為「結他們」。其他說明:建議是全轉換直接改成加入這個詞組就好,其他的可以考慮拿掉,因為維基百科可能還會有其他的「x結他們」這樣的描述,這樣做可以徹底修復這個詞的轉換錯誤,用google搜尋了一下,還是有一些:「site:zh.wikipedia.org "結他們"」--maki有事請留言 2024年8月14日 (三) 12:25 (UTC)[回覆]

餘力生

狀態:   待修復

請修復繁體模式下錯誤轉換:「餘力生」,正確轉換應為「余力生」。出錯頁面:餘力生。其他說明:其個人印章作余(見 [3][4]),且餘姓遠比余姓罕見。--RcAlex36留言2024年8月15日 (四) 11:17 (UTC)[回覆]

野蠻告白

狀態:   完成

請修復臺灣正體模式下錯誤轉換:「野蠻告白」,正確轉換應為「野蠻人」。出錯頁面:猩球崛起:王國誕生。--Bolsrb463留言2024年8月16日 (五) 13:07 (UTC)[回覆]

 已修復--— Gohan 2024年8月20日 (二) 09:51 (UTC)[回覆]

散無線電子

狀態:   待修復

請修復繁體模式下錯誤轉換:「散無線電子」,正確轉換應為「散射电子」。出錯頁面:低能電子繞射、電子微探針、原子序數襯度像技術、掃描電子顯微鏡、電子束誘導沉積。其他說明:多個相關物理條目出現,簡體的“散射电子”或“背散射电子”在繁體模式下觸發「射电」—「無線電」機械轉換,導致繁體模式下相關專有名詞被轉換成錯誤詞語--Sufangxi留言2024年8月18日 (日) 16:27 (UTC)[回覆]

補充條目:埃弗哈特-索恩利探測器電子能量損失譜。類似地還包括含有「透射电子」,「透射电子显微镜」,「衍射电子」等專有名詞的條目--Sufangxi留言2024年8月18日 (日) 16:41 (UTC)[回覆]

麵臨

狀態:   待修復

請修復繁體模式下錯誤轉換:「麵臨」,正確轉換應為「面臨」。出錯頁面:艾米琳·潘克斯特。其他說明:面字前面匹配到了「食面」(原文「允許對因絕食面臨健康不良的女權運動者進行釋放」),另外有阿卜杜勒-麥立克·本·麥爾萬的「哈里發麵臨」,丹那美拉的「窮人和麵臨處決的被告的捍衛者」,約阿希姆·馮·里賓特洛甫的「蒂索面臨著一個選擇」(Google搜尋結果,現已隨「索面」更正)等。--Kethyga留言2024年8月20日 (二) 00:34 (UTC)[回覆]

鬍子春

狀態:   待修復

請修復繁體模式下錯誤轉換:「鬍子春」,正確轉換應為「胡子春」。出錯頁面:佛香閣。其他說明:姓氏作胡不作鬍。--RcAlex36留言2024年8月23日 (五) 05:23 (UTC)[回覆]