维基百科:字词转换/修复请求

字词转换
主页 讨论
轉換請求
错误修复请求
地区词候选
轉換介紹
字詞轉換處理 讨论
  繁简处理 讨论
  地区词处理 讨论
  公共轉換組 讨论
帮助文档
繁简与地区词处理 讨论
  转换原理 讨论
  手工轉換 讨论
  高级语法 讨论
  用字模式选择说明
相關模板
NoteTA 全文字詞轉換
CGroup 公共轉換組列表
Lan 界面文字轉換
地区用词 地區詞模板
地区用词2 進階地區詞模板
各地中文名 地區用詞資訊框
查看 - 讨论 - 编辑 - 变动

本页面为维基百科:字词转换下属子页面,用于处理各维基计划全域转换和中文维基百科本地全局转换中的所有繁简地区词错误转换修复的请求。

返回字词转换主页 提交错误转换修复新请求

轉換与修复原理

由於简体中文、繁体中文之间存在一对多现象,即以單一简化字或繁体字來对应多個繁體字或简化字[1][2],因此必須有額外的数据來補足原先丟失的信息。例如,繁體中的“髮”或“發”,在简体下都是“发”。在程序裡,我們有一個默认的對應,比如說“發”。那麼一般情況下要從簡體轉換成繁體時,程序遇到“发”就會先將其轉換成“發”。那麼什麼時候對應成“髮”呢?這就要看詞庫而定。比如詞庫中有“头发=>頭髮”的關係,這樣“头发”就會被轉換成“頭髮”。如果沒有這一關聯,那“头发”就會被錯誤地轉換成“頭發”。

那詞庫是如何创建的呢?我們先有每個字的默认對應,比如“发”轉換成“發”。然後我們在一個現有的繁體詞庫中尋找包含繁體“發”的词,再轉換成简体。這樣得到一個從简体到繁體的詞彙對應關係。所以,我們先要確定一個多對應字的默认對應關係。同样,修復過度轉換也是由上述的方法來處理。

外部連結

错误转换修复请求

狀態:   等待中

请修复简体模式下错误转换:「峯」,正确转换应为「峰」。出错页面:金峯山寺。其他說明:峯在《通用规范汉字表》作为峰的异体字,同羣和群。--Kethyga留言2024年4月7日 (日) 09:56 (UTC)[回复]

異體字是相互的,不等同於繁體字。雖然有些異體關係中存在正體字,但是「峯」並不罕見於簡體中文環境的人名地名專名,不宜統統被「峰」取代。--— Gohan 2024年4月28日 (日) 07:49 (UTC)[回复]
简体中文环境常见“峯”?“峯”在《通用规范汉字表》中就是“峰”的异体字,繁体字和异体字在《中华人民共和国国家通用语言文字法》的地位是完全一致的,都是限定在一些场合使用(见第十七条),在中维的转换规则自然也应视同繁体字(既是规范汉字又作为另一个字异体字的情况除外,如“喆”“昇”等,但繁体字同有这种情况如“乾”,仍进一步说明它们地位是一致的)。既然异体字“棄”转换为了“弃”,“峯”当然也应转换,正式场合中国大陆也用“林峰”而不用“林峯”([1])。--自由雨日留言2024年6月9日 (日) 16:06 (UTC)[回复]
维基的转换规则不会完全拘泥于《通用规范汉字表》规定,因为规定往往是滞后的,当前媒体与社会的用字倾向随时有可能突破(近年甚至出现了黄霄雲这样的极端人名用字,但目前只是孤例)。不过对于本案,仍可继续讨论。—Chiefwei - 2024年6月10日 (一) 03:08 (UTC)[回复]
感谢阁下提醒!您的回复给了我很大启发。不过……《通用规范汉字表》虽可能滞后,但却是强符合“可供查证”的(以及相对滞后也意味着相对稳定),根据媒体社会用字倾向来决定转换,是否会有原创研究/总结之嫌?比如黄霄云,在今年(2024年)文联旗下中国文艺网中的人名还是“云”而非“雲”([2]),在看不到当事人身份证的情况下,不同可靠来源中有不同用字,该如何定夺呢?--自由雨日留言2024年6月10日 (一) 03:24 (UTC)[回复]
文联既不代表在可靠來源中常用,亦非黄霄雲的主人或本人。在簡體中文環境的主流媒體中,「黄霄云」並不比「黄霄雲」常用。--— Gohan 2024年6月29日 (六) 08:37 (UTC)[回复]
在简体中文环境的主流媒体中,“黄霄云”并不比“黄霄雲”常用。[來源請求]--自由雨日留言2024年6月29日 (六) 08:43 (UTC)[回复]
請閣下留意簡體字在維基百科並非只有中國大陸使用——也會影響星馬用字,並區分「應然」與「實然」。維基百科的「應然」取決於現實的「實然」,而不由中國大陸的「應然」決定。另外,對於中國大陸,仍有不少人「名」中違法使用異體字,也曾鬧出不少交通站名借字改地名引發爭議、甚或最終改回異體字原名的新聞。--— Gohan 2024年6月13日 (四) 07:29 (UTC)[回复]

狀態:   等待中

请修复大陆简体模式下错误转换:「鳽」,正确转换应为「𫛚」。出错页面:小葦鳽。其他說明:疑似在中日韓統一表意文字擴展區內的部分簡化字有數個並未被順利轉換成對應的繁體,並導致小苇𫛚小葦鳽不被視作同等詞彙。另外可能一些同樣以鳥部類推簡化的字,如F區「𮭥」也有有類似情況。(但與𫛚字同區的「𫛭」就有成功轉換。)--WiTo🐤💬 2024年4月24日 (三) 08:37 (UTC)[回复]

@T45614631“𫛚”和“𮭥”属于通用规范汉字表以外的汉字(简称“表外字”)而“𫛭”属于表内字。表内字肯定是得到简化了的,但表外字是否需要类推简化具有争议性,因为中国政府态度模糊并未明言表外字需要或不需要简化(多数实际操作中类推简化了)。我不是要说上述两个字不可以简化,但可能需要更多讨论。可以看这里关于应不应该无限类推简化的一堆文章。另外我想到了植物也有一个“苦蘵”,当中的“蘵”要不要简化也可以讨论一下。--微肿头龙留言2024年5月6日 (一) 09:58 (UTC)[回复]
好,我去客棧開個話題。--WiTo🐤💬 2024年5月6日 (一) 15:30 (UTC)[回复]
等待共识,暂不处理。—Chiefwei - 2024年6月9日 (日) 11:35 (UTC)[回复]

打印尼

狀態:   待修复

请修复大陆简体模式下错误转换:「打印尼」,正确转换应为「列印尼」。出错页面:Viu。其他說明:“列印-打印”。常见组合“位列印尼”、“一列印尼”、“名列印尼”。举例,營多麵的“系列印尼”,印度尼西亞駐泰國大使館的“并列印尼”,桑迪亞加·烏諾的“名列印尼”。可能需要排除“列印尼龍”。--Kethyga留言2024年8月12日 (一) 06:20 (UTC)[回复]

這個問題貌似在各個出問題的條目中直接用-{}-打斷比較好?--竹林下小徑月光映一葉 2024年8月21日 (三) 03:48 (UTC)[回复]

吉他們

狀態:   待修复

请修复所有簡體、台灣繁體模式下错误转换:「吉他們」,正确转换应为「結他們」。其他說明:建議是全轉換直接改成加入這個詞組就好,其他的可以考慮拿掉,因為維基百科可能還會有其他的「x結他們」這樣的描述,這樣做可以徹底修復這個詞的轉換錯誤,用google搜尋了一下,還是有一些:「site:zh.wikipedia.org "結他們"」--maki有事請留言 2024年8月14日 (三) 12:25 (UTC)[回复]

似乎可以,Google中有不少「吉他們」,但是很少「結他們」--Kethyga留言2024年9月8日 (日) 12:56 (UTC)[回复]

散無線電子

狀態:   待修复

请修复繁體模式下错误转换:「散無線電子」,正确转换应为「散射电子」。出错页面:低能电子衍射电子微探针原子序数衬度像技术扫描电子显微镜电子束诱导沉积。其他說明:多个相关物理条目出现,简体的“散射电子”或“背散射电子”在繁体模式下触发“射电”—“無線電”机械转换,导致繁体模式下相关专有名词被转换成错误词语--Sufangxi留言2024年8月18日 (日) 16:27 (UTC)[回复]

补充条目:埃弗哈特-索恩利探测器電子能量損失譜。类似地还包括含有“透射电子”,“透射电子显微镜”,“衍射电子”等专有名词的条目--Sufangxi留言2024年8月18日 (日) 16:41 (UTC)[回复]

麵臨

狀態:   待修复

请修复繁體模式下错误转换:「麵臨」,正确转换应为「面臨」。出错页面:艾米琳·潘克斯特。其他說明:面字前面匹配到了“食面”(原文“允許對因絕食面臨健康不良的女權運動者進行釋放”),另外有阿卜杜勒-麥立克·本·麥爾萬的“哈里發麵臨”,丹那美拉的“窮人和麵臨處決的被告的捍衛者”,约阿希姆·冯·里宾特洛甫的“蒂索面臨著一個選擇”(Google搜索结果,现已随“索面”更正)等。--Kethyga留言2024年8月20日 (二) 00:34 (UTC)[回复]

上述條目已手動修復,但感覺不太好找到下一個有出錯的條目啊😅
  • 另外,丹那美拉的那個問題,好像是原始碼就是寫成"麵臨"的XP
--竹林下小徑月光映一葉 2024年9月4日 (三) 02:25 (UTC)[回复]

向量-H

狀態:   待修复

请修复香港繁体模式下错误转换:「向量-H」,正确转换应为「矢量-H」。出错页面:矢量-H。其他說明:查阅香港教育局公布《中學物理科常用英漢辭彙》"Vector"存在多处译作“矢量”,应该不用全局转换。--Kethyga留言2024年8月28日 (三) 07:18 (UTC)[回复]

文件给出的是在理工科领域“vector”两种译法均可,倒不是根据出现次数多少来判定何者为正统。(顺便在大陆理工科领域矢量和向量均可等同使用,没有正统一说)。倒不如讨论该页面中的“vector heaven”这个非数学和物理领域的专有名词有没有香港媒体或官方机构对其命名。--Sufangxi留言2024年8月28日 (三) 07:37 (UTC)[回复]
上面没有强调正统,只是说至少在物理领域用“矢量”没问题,不需要强制转换。上面只是给出一个例子,物理中不止此一处。该公司名称可能没有特别常用名称,香港估计没有介绍,也不可能事事都有地区译名。--Kethyga留言2024年8月28日 (三) 09:46 (UTC)[回复]
或者其制造公司“Vector Launch”在香港官方名字是什么,毕竟该条目中的“vector”大概率源自其制造公司的名字中“vector”。--Sufangxi留言2024年8月28日 (三) 07:53 (UTC)[回复]

石樑

狀態:   待修复

请修复繁體模式下错误转换:「石樑」,正确转换应为「石梁」。出错页面:石梁镇。其他說明:樑爲俗梁字,臺灣標準視之爲梁的異體字,不屬於繁簡轉換之列,建議移除該轉換。--SteveLLL留言2024年8月29日 (四) 11:09 (UTC)[回复]

全局转换中存在zh2hant/zh2hk中「'木梁' => '木樑'」、「'石梁' => '石樑'」,覆蓋到了臺灣變體,「樑」字現在好像主要用在香港中文环境中。之前提报是手动修复条目,Wikipedia:字词转换/修复请求/存档/2022年5月。感觉石梁不需要转换,用在地名「石梁」的似乎不少。--Kethyga留言2024年8月29日 (四) 13:21 (UTC)[回复]

裏約

狀態:   待修复

请修复zh-hk, zh-tw, zh-hant模式下错误转换:「裏約」,正确转换应为「里約」。出错页面:n:中國奧運金牌運動員訪港 政治議題無法迴避。--Kitabc12345 海南 2024年8月30日 (五) 17:46 (UTC)[回复]

可能比較容易誤轉換。譬如「他們私下裏約定」云云。 ——魔琴身份声明 留言 贡献 新手2023 2024年9月3日 (二) 10:11 (UTC)[回复]
「里約」明顯常用,應予優先轉換。「私下裡」似乎亦常用,可直接一併提交除外。—— Eric Liu 創造は生命(留言留名學生會 2024年9月3日 (二) 20:32 (UTC)[回复]
还有背地里约见、心里约算等等。--Neux-Neux留言2024年9月6日 (五) 04:04 (UTC)[回复]

雪梨·

狀態:   待修复

请修复zh-tw模式下错误转换:「雪梨·」,正确转换应为「悉尼·」。出错页面:常識 (小冊子)。其他說明:Sidney/Sydney 译作"雪梨",常指澳大利亚的城市,用作人名中不太合适,查台湾乐词网中,人名中有译作“西德尼”、"西尼"、“席德尼”,见樂詞網SidneySydney。可以加入“悉尼· => 悉尼·”或取消转换。--Kethyga留言2024年9月6日 (五) 03:26 (UTC)[回复]

有關聯不应该转换成有关系

狀態:   待修复

请修复大陆简体模式下错误转换:「有关系」,正确转换应为「有关联」。其他說明:我发现简繁转换自动把繁体的有關聯转换成简体的有关系,就好像大陆没有“有关联”这个词一样。建议取消这一转换。--Neux-Neux留言2024年9月6日 (五) 04:18 (UTC)[回复]

@Neux-Neux 出错页面是音义兼译?查了下,应该是Module:CGroup/IT引入的。条目主要内容和ICT关系不大的话,感觉不需要使用该转换组。个别用词需要转换的话,手动添加就好了。如果更改IT转换组的话,可能会导致相关专业用词上不一致。--Kethyga留言2024年9月6日 (五) 04:43 (UTC)[回复]
应该就是这个问题。那就不用取消了吧。--Neux-Neux留言2024年9月6日 (五) 05:16 (UTC)[回复]
(难怪《MOS:外语名称》有这个问题……)--自由雨日🌧️留言贡献 2024年9月6日 (五) 05:51 (UTC)[回复]

升平署

狀態:   待修复

请修复大陆简体模式下错误转换:「升平署」,正确转换应为「昇平署」。出错页面:昇平署。其他說明:“昇”字已在专有名词中恢复使用,另有昇平戲院昇平公主昇平村昇平社學舊址可能在简体中保留了“升”字[3]?),似为“昇平”一词的过度转换。另外,我还没查到三个“升平镇”的繁体写法。--杰里毛斯留言2024年9月9日 (一) 02:32 (UTC)[回复]

“昇”字已在专有名词中恢复使用[來源請求]?--自由雨日🌧️留言贡献 2024年9月9日 (一) 02:37 (UTC)[回复]
征求意见时期:“为尊重社会习惯,方便人们用字需要,字表将《第一批异体字整理表》中的51个异体字收入表中,主要用作人名地名”[4]。《通用规范汉字表》:“本表在以往相关规范文件对异体字调整的基础上,又将《第一批异体字整理表》中‘皙、喆、淼、昇、邨’等45个异体字调整为规范字。”。“昇平署”的用例见[5][6][7]。——杰里毛斯留言2024年9月9日 (一) 02:51 (UTC)[回复]
突然发现是“姓氏人名”  囧rz……,那只有“昇平公主”符合规定。。。但实际操作中似乎并不局限于“姓氏人名”,如上文用例。——杰里毛斯留言2024年9月9日 (一) 03:03 (UTC)[回复]
是啊,《通用规范汉字表》以“昇”字为代表的大部分恢复的繁/异体字范围一直都只有姓氏人名 至于维基百科要不要超出《字表》在非人名处使用“昇”字,其实我有个更激进的想法,就是全盘引入《中国大百科全书》有关古代人名地名的规定,将“晏幾道”“高適”等統統设置为繁/异体字。--自由雨日🌧️留言贡献 2024年9月9日 (一) 03:07 (UTC)[回复]
单看着“晏幾道”还好,但“刘知幾”对我来说太难受了。——杰里毛斯留言2024年9月9日 (一) 03:58 (UTC)[回复]
是“繁简混用”的难受,还是“不熟悉这个人物将‘几’字写成‘幾’字”而难受?--自由雨日🌧️留言贡献 2024年9月9日 (一) 04:47 (UTC)[回复]
繁简混用感到难受。——杰里毛斯留言2024年9月9日 (一) 11:07 (UTC)[回复]
这样看来,上述用法(“昇平公主”不确定)都符合《通用规范汉字表》,但本站大陆简体模式仍保留了“昇元”、“昇龍皇城”这些非姓氏人名用法,是否应该将上述用法与这些用法统一作“升”或“昇”?——杰里毛斯留言2024年9月9日 (一) 03:58 (UTC)[回复]
“昇元”我觉得应该是符合《字表》的?因为“昇”来自于人名(另外,中百也是用“昇”字)。“昇龙皇城”我不确定是不是符合《字表》,但中百使用“昇”字。因而我认为均暂时不用改成“升”。--自由雨日🌧️留言贡献 2024年9月9日 (一) 04:04 (UTC)[回复]
咦,有“昇元”来自人名的资料吗?——杰里毛斯留言2024年9月9日 (一) 11:07 (UTC)[回复]
猜的()刚刚翻了下《现代汉语词典·我国历代纪元表》竟然没有收录南唐年号……没法参考大陆规范写法…… ——自由雨日🌧️留言贡献 2024年9月9日 (一) 11:41 (UTC)[回复]
可以帮忙看一下南朝宋年号“昇明”是怎么写的吗?——杰里毛斯留言2024年9月10日 (二) 06:35 (UTC)[回复]
写的是“昇明”!--自由雨日🌧️留言贡献 2024年9月10日 (二) 06:38 (UTC)[回复]
@杰里毛斯:而且皇帝名写的是“(刘)準”!我不明白为什么?!--自由雨日🌧️留言贡献 2024年9月10日 (二) 06:39 (UTC)[回复]
或许也用了《中百》的相关处理,合并字、字形差距过大的字仍保留繁/异体?--自由雨日🌧️留言贡献 2024年9月10日 (二) 06:41 (UTC)[回复]
“拓跋濬”也是吧?“濬”字是不是还单立了一个字头。这样来看,连权威字典的编者都没有遵守“昇”仅用于“姓氏人名”的规定,那本讨论又回到了原点。不过在“升平署”等词上可能还是用“升”比较好?既符合规定,又有多个可靠来源使用。——杰里毛斯留言2024年9月10日 (二) 07:01 (UTC)[回复]
是的!“濬”在《字表》中仅作为“浚”的异体字,但《现汉》中却直接用于了人名。“昇平署”,我个人倾向中百的处理,使用“昇”字。--自由雨日🌧️留言贡献 2024年9月10日 (二) 07:59 (UTC)[回复]
彭州之昇平鎮應該可以確定作「昇平」,另外兩個確實不太好找。--SteveLLL留言2024年9月9日 (一) 11:28 (UTC)[回复]

杆状

狀態:   待修复

请修复繁体模式下错误转换:「杆状」,正确转换应为「桿狀」。其他說明:虽然我并未找到任何来源支持“杆状”的“杆”念gǎn,但这应该没有异议吧。(杆和桿在繁体是不同的字,前者为gān,后者为gǎn)--魔方2024年9月9日 (一) 13:43 (UTC)[回复]