维基百科:机器人建立条目小组/中华人民共和国行政区划/整体说明

由于武铁辆玻找到了国家统计局的含编码数据库[失效链接],我们得以系统地利用机器人进行区划维护工作。

编码方式

不做详细说明。编码的利用请见下一节。对于基本编码模式,结合具体例子说明如下:

第一位 第二位 第三位 第四位 第五位 生成编码
河北省 13 00 00 000 000 13/00/00/000/000
大庆市 23 06 00 000 000 23/06/00/000/000
沙县 35 04 27 000 000 35/04/27/000/000
大寨镇 14 07 24 104 000 14/07/24/104/000
华西新市村 32 02 81 107 200 32/02/81/107/200
省级代码 地级代码 县级代码 乡级代码 村级代码 生成编码

对于例外,仅举几例说明:

第一位 第二位 第三位 第四位 第五位 生成编码 情况说明
浦东新区 31 01 15 000 000 31/01/15/000/000 直辖市辖区县,第二位01为市辖区、02为县。
东城街道 (东莞市) 44 19 00 003 000 44/19/00/003/000 地级直管乡级,无县级。
石河子市 65 90 01 000 000 65/90/01/000/000 省级直管县级,地级一栏添了一个90。
省级代码 地级代码 县级代码 乡级代码 村级代码 生成编码

形成机制

数据形成机制:以甘井子区(代码:21/02/11/000/000)为例。

(条目形成机制尚未完善)

消歧义

消歧义主要由系统生成。但是由于已撤销的行政区很多(当然还有和大陆以外行政区重名的情况),所以还有大量的手工消歧义。

形成消歧义的手段是:

效果如下:

  • 甘井子区,中华人民共和国辽宁省大连市下辖的市辖区
  • 杨浦区,中华人民共和国上海市下辖的市辖区

这样可以确保上级行政区名称更改之后,消歧义页面无需改动。但是下级行政区的消歧义名称可能仍然要修正。另外此方法不支持PopUp,可能不支持AutoWikiBrowser

变动和维护

这个数据库每年都会更新,所以我们可以每年读一次数据库,找出变化并进行更新,这样可以确保时效性。我们仍然欢迎手动维护。

由于撤销的行政区的代码不会被再次使用,被撤销的行政区的维护非常方便,无需删除原有数据页面。

可能会参照过去的数据进行测试性运行,查找被撤销的行政区划条目。

其他