维基百科:机器人/申请/WhitePhosphorus-bot/2

维基百科,自由的百科全书

WhitePhosphorus-bot 2

  • 狀態 已批准
  • 操作者: 砜中嘌呤的白磷萃取 打谱
  • 提請時間: 2017年2月5日 (日) 18:04 (UTC)
  • 自動化程度:全自动
  • 程式語言Python
  • 用途:清理Category:引文格式1维护:未识别语文类型
  • 源代碼連結: 部分代码见下
  • 編輯時段及頻率:不定期运行,编辑频率最大60/min
  • 受影響頁面:上述分类中的条目数,截至申请时为14,818。
  • 遵守機器人規範不相关
  • 已有機器人權限:
  • 其他信息
    • 只替换“Cite ”(注意空格)开头的模版中的language参数。
    • 测试编辑见此,其中有些问题:
    • 重要代码如下(整个字典的key是将被替换的正则表达式,value是替换成的字符串,按顺序替换)(最后更新于2017年2月6日 (一) 09:21 (UTC))
sub_dict = {
r'中文\s*[((](简体?|簡體?)[))]|[简簡]体(中文|[汉漢][语語])': 'zh-hans',
r'中文\s*[((]繁[体體]?[))]|繁体(中文|[汉漢][语語])': 'zh-hant',
# r'中文|[汉漢][语語]|[Cc]hinese': 'zh', 这句会有问题(不符合上面两句的都只会把“中文”替换成“zh”),第一轮先不用
r'英[语語文]|[Ee]nglish': 'en',
r'日[语語文]|[Jj]apanese|ja-JP': 'ja',
r'法[语語文]|[Ff]rench': 'fr',
r'荷[兰蘭]?[语語文]|[Dd]utch|[Nn]ederlands': 'nl',
r'德[语語文]|[Gg]erman|[Dd]eutsch': 'de',
r'俄[语語文]|[Rr]ussian': 'ru',
r'(韩|朝鲜?|韓國?)[语語文]|[Kk]orean': 'ko',
r'意(大利)?[语語文]|[Ii]talian': 'it',
r'希伯来[语文]|希伯來[語文]|[Hh]ebrew': 'he',
r'塞尔维亚[语文]|塞爾維亞[語文]|[Ss]erbian': 'sr',
r'立陶宛[语語文]|[Ll]ithuanian': 'lt',
r'乌克兰[语文]|烏克蘭[語文]|[Uu]krainian': 'uk',
r'土耳其[语語文]|[Tt]urkish': 'tr',
r'西班牙[语語文]|[Ss]panish': 'es',
r'拉丁[语語文]|[Ll]atin': 'la',
r'[及与與和、]|and': ',' # 放在最后比较安全
}
我建议最好是把字典打散,每次执行只替换一个正则内容,然后手工抽查没啥问题后,再执行下一条替换。以上建议只是为防止bot出错,如果正则已经基本穷尽了各种可能性,那么一次过执行也未尝不可--百無一用是書生 () 2017年2月10日 (五) 07:32 (UTC)[回复]
确实有道理,毕竟这个也不急。那几个小语种(上文意大利语到拉丁语)我想放一起执行,应该一共也没多少。 --砜中嘌呤的白磷萃取 打谱 2017年2月10日 (五) 14:30 (UTC)[回复]
 正式批准運作--百無一用是書生 () 2017年2月13日 (一) 09:15 (UTC)[回复]