Wikipedia:字詞轉換處理:修订间差异
小 調整格式、排版 |
修飾語句 标签:2017年版源代码编辑 |
||
第10行: | 第10行: | ||
== 歷史 == |
== 歷史 == |
||
中文维基百科建立时,虽然只 |
中文维基百科建立时,虽然只用一个域名“zh.wikipedia.org”,但不少条目都写了两種版本,如-{[[法国]]和[[法國]]}-(-{国↔國}-)就曾经是两條不同条目;繁简名称没有区别的条目(如[[日本]])也分成两條条目(日本/-{简}-,日本/-{繁}-)。这方法的好处在于:条目内部沒有繁简问题,繁体条目使用繁体字、港台詞彙;简体条目使用简体字、大陆词汇,两者互不-{干}-擾。但这种方法却大大增加了大家的工作量,因为繁简版本间很快就不同步,只能人手整合繁简版之差异。 |
||
最早的中文維基每 |
最早的中文維基每條條目都可能有繁简分立的兩種版本。如何处理繁体简体并存,中文维基百科必须采取特殊方法,不然就只能面临繁简分家的命运,這是中文维基百科自创立以来的迫切问题。 |
||
繁简体之间的对应关系,不是简单的一对一,而是复杂的多对多。而维基百科所面临的问题 |
繁简体之间的对应关系,不是简单的一对一,而是复杂的多对多。而维基百科所面临的问题已超出繁简之间的字体转换问题。由于[[中國|大陆]]、[[香港|港]][[澳門|澳]]、[[台湾]]、[[马来西亚]]、[[新加坡]]等地多年来資訊文化獨樹一幟,许多外国译名以及新生词语也有非常大的分歧。如台湾所说的“-{帛琉}-”,在大陆却是“-{帕劳}-”;大陆使用“-{打印机}-”,台湾用的却是“-{印表機}-”。如此案例,屡见不鲜,且大大地超出了英语维基百科上英美词语之间的分歧。 |
||
中文維基百科的繁简体地區詞问题在[[User:Zhengzhu|Zhengzhu]]、[[User:Shinjiman|Shinjiman]]和许多用户的努力下,已经得到了初步解决。取消了過去的繁简分立体系,每 |
中文維基百科的繁简体地區詞问题在[[User:Zhengzhu|Zhengzhu]]、[[User:Shinjiman|Shinjiman]]和许多用户的努力下,已经得到了初步解决。取消了過去的繁简分立体系,每條条目只保留一種版本,并通过电脑程序自动转换繁简体和地區詞。即不仅仅要处理繁体字和简体字的问题,还要处理大陆和港台之间词汇分歧问题,如“-{帕劳}-”和“-{帛琉}-”也应自动转换。在以前有繁简两版本的文章现在仍然需要人手合并,但目前已經大致完成。具体请参看[[Help:中文维基百科的繁简、地区词处理#編輯一般文章時的注意事項]]。 |
||
== 基本要求 == |
== 基本要求 == |
||
第23行: | 第23行: | ||
== 转换技术 == |
== 转换技术 == |
||
技术上,维基百科的字词转换有四层:其一是MediaWiki内置的转换表<span class="plainlinks">[//github.com/wikimedia/mediawiki/blob/master/includes/languages/data/ZhConversion.php ZhConversion.php]</span>,供各维基计划全域转换;其二是[[Special:前缀索引/MediaWiki:Conversiontable/|[MediaWiki:Conversiontable]]]定义的简繁和地区词转换表,供中文维基百科本地全域转换;其三是各[[Wikipedia:字詞轉換處理/公共轉換組|公共转换组]],供主题领域相同和相似的条目统一转换;其四是各条目内设置[[Help:手工字词转换|人手转换]],供该条目单独使用。其中,公共转换组和条目内人手转换人人均可编辑,而修改本地转换表则需管理员权限,修改全域转换表需要向MediaWiki版本库提交代码。因此,如欲新增或修复全域及本地全域转换,一般用户需在[[维基百科:字词转换]]申请,交由管理员协助处理。 |
|||
=== 繁簡與地區詞轉換分開 === |
=== 繁簡與地區詞轉換分開 === |
||
「繁簡轉換」的意義應只是字體 |
「繁簡轉換」的意義應只是轉換字體(如簡體「-{打斗}-」會正確轉成繁體「-{打鬥}-」),而地區詞转换旨在为中国大陆、台湾、新加坡、马来西亚、香港、澳门地区的中文用户提供贴近其语言习惯的转换模式。其中,中国大陆(zh-cn)、新加坡(zh-sg)与马来西亚(zh-my)的地區詞为简体中文;台湾(zh-tw)、香港(zh-hk)与澳门(zh-mo)的地區詞为繁体(正体)中文。 |
||
目前維基系統用[[MediaWiki:Conversiontable/zh-hans|簡體轉換表]]、[[MediaWiki:Conversiontable/zh-hant|繁體轉換表]]來處理繁簡全 |
目前維基系統用[[MediaWiki:Conversiontable/zh-hans|簡體轉換表]]、[[MediaWiki:Conversiontable/zh-hant|繁體轉換表]]來處理繁簡全域轉換,用[[MediaWiki:Conversiontable/zh-cn|中國大陸轉換表]]、[[MediaWiki:Conversiontable/zh-hk|港澳轉換表]]、[[MediaWiki:Conversiontable/zh-sg|新馬轉換表]]、[[MediaWiki:Conversiontable/zh-tw|臺灣轉換表]]來處理地區詞全域轉換。 |
||
原先地區詞的分歧,納入簡繁轉換全 |
原先地區詞的分歧,納入簡繁轉換全域系統處理,但其後發現這做法產生不少問題: |
||
#地區詞與繁/簡體並無必然關係,正如「香港繁體區」的人一樣能以繁體書寫「大陸簡體區」常用的詞彙。 |
#地區詞與繁/簡體並無必然關係,正如「香港繁體區」的人一樣能以繁體書寫「大陸簡體區」常用的詞彙。 |
||
#維基百科的簡繁轉換系統,與其他維基姊妹計劃共用,如果簡繁轉換系統包含地區詞彙替換,可能會使其他維基的轉換不準確,例如不需要地區詞轉換的[[維基文庫]]。 |
#維基百科的簡繁轉換系統,與其他維基姊妹計劃共用,如果簡繁轉換系統包含地區詞彙替換,可能會使其他維基的轉換不準確,例如不需要地區詞轉換的[[維基文庫]]。 |
||
#自動轉換過程會出現 |
#自動轉換過程會出現「失誤」,如繁體「-{數位}-人士」,轉簡體會變「-{数码}-人士」,要以其他技術解決,難以編輯。 |
||
全 |
全域转换是最方便快速的转换处理方式,但也较易过度转换,基於以上各項理由: |
||
*繁簡轉換除了一些轉換後出錯的詞彙外,都應當進入全 |
*繁簡轉換除了一些轉換後出錯的詞彙外,都應當進入全域轉換中,盡可能不要人手轉換繁簡; |
||
*而地區詞 |
*而地區詞轉換可能會對全域轉換造成失誤,應儘可能人手轉換,除了穩定和使用廣泛的地區對應詞彙,儘可能不要進入全域地區轉換。 |
||
即:對手動轉換,應當主要用於地區轉換,對全 |
即:對手動轉換,應當主要用於地區轉換,對全域轉換,應當主要用於繁簡轉換。 |
||
== 繁简处理 == |
== 繁简处理 == |
||
{{main|Wikipedia:繁简处理}} |
{{main|Wikipedia:繁简处理}} |
||
用繁体或简体创建的文章,标题必须是全部为简体或繁体字,如果标题繁简混杂, |
用繁体或简体创建的文章,标题必须是全部为简体或繁体字,如果标题繁简混杂,如“-{中國历史}-”,則无法自动转换。 |
||
所有的簡繁轉換應當納入 |
所有的簡繁轉換應當納入全域轉換管理(zh-hans↔zh-hant),遇到有繁簡體的轉換出現問題,應到[[Wikipedia:繁简体转换请求]]反映。 |
||
對於進入全 |
對於進入全域轉換後出錯的詞彙,可用以下地區詞人手轉換方式,用{{tl|NoteTA}}或相關模板在出錯頁面改正。 |
||
== 地區詞处理 == |
== 地區詞处理 == |
||
第52行: | 第52行: | ||
== 公共转换组== |
== 公共转换组== |
||
{{main|Wikipedia:字詞轉換處理/公共轉換組}} |
{{main|Wikipedia:字詞轉換處理/公共轉換組}} |
||
在主题、领域相同和相似的条目,須转换的内容大同小异,可以為这些多條条目要用的共同转换字词单独建立转换组。在页面{{NoteTA}}模板指定组名,以共用規則转换地区词,所有应用该公共转换组的页面都不用单独维护,達致同步维护的目的。公共转换组的方便程度处于全域转换与全文转换之间,而过度转换程度也处于两者之间。 |
|||
{{維基百科方針與指引}} |
{{維基百科方針與指引}} |
2022年11月21日 (一) 14:17的版本
| ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
|
字詞轉換處理即對繁简字、地区词的轉換处理,本頁面闡述中文維基在字詞轉換使用中的一些基本要求。
歷史
中文维基百科建立时,虽然只用一个域名“zh.wikipedia.org”,但不少条目都写了两種版本,如法国和法國(国↔國)就曾经是两條不同条目;繁简名称没有区别的条目(如日本)也分成两條条目(日本/简,日本/繁)。这方法的好处在于:条目内部沒有繁简问题,繁体条目使用繁体字、港台詞彙;简体条目使用简体字、大陆词汇,两者互不干擾。但这种方法却大大增加了大家的工作量,因为繁简版本间很快就不同步,只能人手整合繁简版之差异。
最早的中文維基每條條目都可能有繁简分立的兩種版本。如何处理繁体简体并存,中文维基百科必须采取特殊方法,不然就只能面临繁简分家的命运,這是中文维基百科自创立以来的迫切问题。
繁简体之间的对应关系,不是简单的一对一,而是复杂的多对多。而维基百科所面临的问题已超出繁简之间的字体转换问题。由于大陆、港澳、台湾、马来西亚、新加坡等地多年来資訊文化獨樹一幟,许多外国译名以及新生词语也有非常大的分歧。如台湾所说的“帛琉”,在大陆却是“帕劳”;大陆使用“打印机”,台湾用的却是“印表機”。如此案例,屡见不鲜,且大大地超出了英语维基百科上英美词语之间的分歧。
中文維基百科的繁简体地區詞问题在Zhengzhu、Shinjiman和许多用户的努力下,已经得到了初步解决。取消了過去的繁简分立体系,每條条目只保留一種版本,并通过电脑程序自动转换繁简体和地區詞。即不仅仅要处理繁体字和简体字的问题,还要处理大陆和港台之间词汇分歧问题,如“帕劳”和“帛琉”也应自动转换。在以前有繁简两版本的文章现在仍然需要人手合并,但目前已經大致完成。具体请参看Help:中文维基百科的繁简、地区词处理#編輯一般文章時的注意事項。
基本要求
編者請不要將含有各種用字的源碼全部轉換成同一種用字,尤其不要用本百科自動轉換的結果。但是,我們鼓勵用戶在擴充簡體頁面或與中國大陸有關的頁面時,盡量也使用簡體;擴充繁體頁面或與香港、臺灣有關的頁面時,盡量也使用繁體。注意:自動轉換程式可能會輸出很多錯誤結果。
转换技术
技术上,维基百科的字词转换有四层:其一是MediaWiki内置的转换表ZhConversion.php,供各维基计划全域转换;其二是[MediaWiki:Conversiontable]定义的简繁和地区词转换表,供中文维基百科本地全域转换;其三是各公共转换组,供主题领域相同和相似的条目统一转换;其四是各条目内设置人手转换,供该条目单独使用。其中,公共转换组和条目内人手转换人人均可编辑,而修改本地转换表则需管理员权限,修改全域转换表需要向MediaWiki版本库提交代码。因此,如欲新增或修复全域及本地全域转换,一般用户需在维基百科:字词转换申请,交由管理员协助处理。
繁簡與地區詞轉換分開
「繁簡轉換」的意義應只是轉換字體(如簡體「打斗」會正確轉成繁體「打鬥」),而地區詞转换旨在为中国大陆、台湾、新加坡、马来西亚、香港、澳门地区的中文用户提供贴近其语言习惯的转换模式。其中,中国大陆(zh-cn)、新加坡(zh-sg)与马来西亚(zh-my)的地區詞为简体中文;台湾(zh-tw)、香港(zh-hk)与澳门(zh-mo)的地區詞为繁体(正体)中文。
目前維基系統用簡體轉換表、繁體轉換表來處理繁簡全域轉換,用中國大陸轉換表、港澳轉換表、新馬轉換表、臺灣轉換表來處理地區詞全域轉換。
原先地區詞的分歧,納入簡繁轉換全域系統處理,但其後發現這做法產生不少問題:
- 地區詞與繁/簡體並無必然關係,正如「香港繁體區」的人一樣能以繁體書寫「大陸簡體區」常用的詞彙。
- 維基百科的簡繁轉換系統,與其他維基姊妹計劃共用,如果簡繁轉換系統包含地區詞彙替換,可能會使其他維基的轉換不準確,例如不需要地區詞轉換的維基文庫。
- 自動轉換過程會出現「失誤」,如繁體「數位人士」,轉簡體會變「数码人士」,要以其他技術解決,難以編輯。
全域转换是最方便快速的转换处理方式,但也较易过度转换,基於以上各項理由:
- 繁簡轉換除了一些轉換後出錯的詞彙外,都應當進入全域轉換中,盡可能不要人手轉換繁簡;
- 而地區詞轉換可能會對全域轉換造成失誤,應儘可能人手轉換,除了穩定和使用廣泛的地區對應詞彙,儘可能不要進入全域地區轉換。
即:對手動轉換,應當主要用於地區轉換,對全域轉換,應當主要用於繁簡轉換。
繁简处理
用繁体或简体创建的文章,标题必须是全部为简体或繁体字,如果标题繁简混杂,如“中國历史”,則无法自动转换。
所有的簡繁轉換應當納入全域轉換管理(zh-hans↔zh-hant),遇到有繁簡體的轉換出現問題,應到Wikipedia:繁简体转换请求反映。
對於進入全域轉換後出錯的詞彙,可用以下地區詞人手轉換方式,用{{NoteTA}}或相關模板在出錯頁面改正。
地區詞处理
公共转换组
在主题、领域相同和相似的条目,須转换的内容大同小异,可以為这些多條条目要用的共同转换字词单独建立转换组。在页面模板指定组名,以共用規則转换地区词,所有应用该公共转换组的页面都不用单独维护,達致同步维护的目的。公共转换组的方便程度处于全域转换与全文转换之间,而过度转换程度也处于两者之间。