维基百科:机器人/申请/Cewbot/18

维基百科,自由的百科全书

Cewbot 18

最近因為規範變嚴格了,所以有些頁面也出現問題,必須清理。基本上這邊會從高優先度的開始嘗試,然後再往低優先度的去處理。這個維基語法清理任務已經在中文以及日文維基上跑了好一段時間了,這次擴展到對於Special:LintErrors的清理。記錄見User:Cewbot/log/20151002。 --Kanashimi留言2017年10月11日 (三) 09:43 (UTC)[回复]

您要先清理哪一個?我覺得應該一項一項分別來審核會比較方便。--A2093064#Talk 2017年10月15日 (日) 07:04 (UTC)[回复]
先清理Special:LintErrors/bogus-image-options吧。 --Kanashimi留言2017年10月19日 (四) 09:06 (UTC)[回复]
所提供的紀錄應該還沒有執行清理LintErrors的紀錄吧?那說明一下有問題的檔案選項要怎麼處理,是全部移除、還是有特別處理方式?--A2093064#Talk 2017年10月19日 (四) 11:03 (UTC)[回复]
這邊只會針對有問題的部分,刪除重複的檔案選項,嘗試修復檔案選項(如130轉成130px),略過不能處置的。 --Kanashimi留言2017年10月19日 (四) 13:02 (UTC)[回复]
我希望了解對於不同的錯誤個別的處理方式,您可以展示code或是列於這裡,或者在測試編輯展示,看您要哪種方式。--A2093064#Talk 2017年10月20日 (五) 12:42 (UTC)[回复]
請見Special:Diff/46639754, Special:Diff/46639667, Special:Diff/46639664, Special:Diff/46639637, Special:Diff/46639626。這幾筆原先都在Special:LintErrors/bogus-image-options中,經過修正後就消除了。 --Kanashimi留言2017年10月20日 (五) 13:01 (UTC)[回复]
這筆是屬於「刪除重複的檔案選項」對吧?那麼這筆呢?--A2093064#Talk 2017年10月20日 (五) 13:15 (UTC)[回复]
Special:Diff/46639626這一筆屬於刪除無效選項,有效選項請參見en:Help:Files, en:Wikipedia:Extended image syntax。 --Kanashimi留言2017年10月20日 (五) 13:28 (UTC)[回复]
其實硬要說全部都是無效選項,不過交給機器人清理就需要想到所有修正案例,例如纳西族中有個thrumb參數,我想應該是thumb,因此我不建議把無法判斷的移除,建議留給人類判斷;另外我在想機器人修改之後會不會讓版面改變(雖然可能不是個大問題),如果不希望動到版面,反而是不做判斷一律移除LintErrors列出的所有選項。--A2093064#Talk 2017年10月20日 (五) 13:37 (UTC)[回复]
其實"LintErrors"的意思就是說系統不能夠解析判別,就算指定了也當作是錯誤選項,有跟沒有展現的效果相同,因此刪掉也不會造成版面改變。但是像數字的部分,因為可以猜測得出來原先編輯者的意思,因此這邊就可以幫忙修正。因為過去曾經有類似作業的經驗,這邊不會一下子就馬上把所有的東西都改變或者刪掉,而是會一個一個嘗試,程式碼會不斷測試修改,確認可行再繼續作業下去。 --Kanashimi留言2017年10月20日 (五) 13:43 (UTC)[回复]
批准測試運作(3項各20次編輯):「刪除重複的檔案選項」、「只有數值的選項加上"px"」、「刪除空的檔案選項」各批准測試20次,其餘的請先不要改。建議編輯摘要能夠分別,好方便複查。其他的修復方式請再個別列出來。--A2093064#Talk 2017年10月27日 (五) 11:36 (UTC)[回复]
@A2093064 測試已完成 Special:LintErrors/bogus-image-options把所有種類的錯誤都列在一起了,因此比較不好甄別。請在編輯記錄找尋關鍵字"bot test",謝謝。 --Kanashimi留言2017年10月29日 (日) 11:34 (UTC)[回复]
Special:Diff/46760966,缩略图是無效選項嗎?而且此編輯反而產生重複選項了。
Special:Diff/46760841Special:Diff/46760471,刪除重複的檔案選項有誤。
Special:Diff/46760553,最後面那個也是空的吧。
Special:Diff/46760308,解釋一下。
Special:Diff/46760841,有框也是有效選項吧?
您也編輯太多筆了吧 囧rz……--A2093064#Talk 2017年10月29日 (日) 12:39 (UTC)[回复]
@A2093064感謝您的核驗。多測試一點比較能看出問題所在。上面列的這些已經都修正了,再麻煩您看看了。 --Kanashimi留言2017年10月29日 (日) 16:19 (UTC)[回复]
我只有看到您撤銷編輯,應該再讓機器人把這幾個頁面跑一次?--A2093064#Talk 2017年11月3日 (五) 11:48 (UTC)[回复]
@A2093064這個任務需要倚賴LintErrors API,因此已經編輯過的頁面就沒有辦法簡單的指定頁面後再重新編輯。這邊另外做了一些編輯給您參考,請在編輯記錄中找尋關鍵字"修正維基語法:",謝謝。 --Kanashimi留言2017年11月3日 (五) 12:44 (UTC)[回复]
已檢查,都沒有錯誤。下面列出的看看我有沒有漏掉什麼,我是根據Code列出的。--A2093064Xiplus 2017年11月5日 (日) 11:44 (UTC)[回复]
另外一些疑問,有些看起來是重複的caption,是否其中一個做為alt會比較好,對於 未規範且無效的檔案選項 和 與檔名重複且無作用的檔案選項()。--A2093064Xiplus 2017年11月5日 (日) 11:44 (UTC)[回复]
@A2093064非常感謝您用心的檢查。關於您提到"是否其中一個做為alt會比較好","未規範且無效的檔案選項"這一項所列出的為長度極短、非有意義文字,抑或絕不可被拿來當作caption描述者。至於"與檔名重複且無作用的檔案選項",或許可列為caption,但也有很大機會誤判(例如有"|.jpg|"這類的)。既然與檔名重複,則刪除此無效選項亦不會減損資訊量。至於此task,未知您認為是否已可,或者尚須測試。 --Kanashimi留言2017年11月5日 (日) 13:04 (UTC)[回复]
好吧,caption這就算了,反正原本也不會顯示。至於下方黃色勾勾的我只是覺得測試較少,想再多看幾個,反正您測試每個修正規則都會跑到吧?那就請再繼續跑一些測試囉。--A2093064Xiplus 2017年11月8日 (三) 05:11 (UTC)[回复]
@A2093064 測試已完成 又做了一些測試。有些項目是邏輯上應該存在的,但是看起來實際上出現這種問題的並不多。 --Kanashimi留言2017年11月8日 (三) 07:13 (UTC)[回复]
您也可以參考在日文維基的編輯。 --Kanashimi留言2017年11月9日 (四) 08:36 (UTC)[回复]
已檢查,我只看需要再檢查的部分,這筆替換沒跟需要指定值的移除配合到。下方綠色勾的就 正式批准運作。不過我想有辦法單獨執行已批准部分嗎?要不然就還是一樣繼續測試囉。--A2093064Xiplus 2017年11月9日 (四) 11:37 (UTC)[回复]
非常感謝您幫忙檢查。這一筆替換已經修正了,其他的就再測試一下好了,正在執行。 --Kanashimi留言2017年11月9日 (四) 11:51 (UTC)[回复]
已經把所有能判別的都完整跑完了,其他留下來的都是無法判別的。 --Kanashimi留言2017年11月9日 (四) 22:34 (UTC)[回复]
Special:diff/46940317,本地也可以用「左」吧?其餘的沒有問題。正式批准「刪除同類別之其他語系的檔案選項」。--A2093064Xiplus 2017年11月13日 (一) 07:51 (UTC)[回复]
@A2093064謝謝您的檢查,已更新。"刪除同類別之別名"可以參考在日文維基的編輯。另外當前6,874個錯誤中發生於User:,User Talk:等File, Template, Category外的有4000+,不知是否亦可作業。 --Kanashimi留言2017年11月13日 (一) 09:29 (UTC)[回复]
不修正應該不會有什麼問題吧?另,正式批准「將其他語系的檔案選項改為本wiki相對應的檔案選項」「刪除同類別之別名」--XiplusA2093064 2017年11月19日 (日) 01:41 (UTC)[回复]
@Xiplus現在僅將作業限制於 main, File, Template, Category。 --Kanashimi留言2017年12月2日 (六) 12:35 (UTC)[回复]
@Kanashimi根據Tech News: 2017-49,看起來修正錯誤是必須的?--XiplusA2093064 2017年12月12日 (二) 16:25 (UTC)[回复]
那這邊就申請對所有可判別的頁面,包過討論頁以及使用者頁也做變更? --Kanashimi留言2017年12月12日 (二) 22:44 (UTC)[回复]
@Kanashimi 正式批准運作於所有名字空間。--Xiplus#Talk 2017年12月30日 (六) 10:37 (UTC)[回复]
  1. “刪除與檔名重複且無作用的檔案選項”,这样做未必合理。文件名包含文件选项的内容,可能有其他原因,比如“[[File:徐家汇观象台的历史照片.jpg|徐家汇观象台|建于1872年]]”
  2. “修正尺寸選項為px單位”也可能导致问题,比如“[[File:一款Nexus手机.jpg|5x|外观]]”

--Antigng留言2017年12月15日 (五) 13:02 (UTC)[回复]

的確是這樣。上面列舉出的例子,可能得要讀得懂文章,然後才能夠做出正確的判別。不過現在的問題是假如人工來處理的話,可能得要花極長的時間才能夠大幅降低錯誤數量…… --Kanashimi留言2017年12月15日 (五) 13:34 (UTC)[回复]
一共几千个,可以先收紧范围,比如把\d{1,3} -> \d{2,3},跑完看剩下多少。--Antigng留言2017年12月15日 (五) 13:37 (UTC)[回复]
感謝提醒。"\d{1,3}"這個部份之前有發現,已經修改了。若還有發現問題請再提出。 --Kanashimi留言2017年12月15日 (五) 15:02 (UTC)[回复]
@Antigng“刪除與檔名重複且無作用的檔案選項”仍然是機器人直接刪除嗎?不給人工判斷了?--Xiplus#Talk 2017年12月24日 (日) 13:26 (UTC)[回复]

簡要修正規則

  • 刪除空檔案選項,Code已檢查
  • 刪除未規範且無效的檔案選項,Code已檢查
  • 刪除需要指定值但未指定值的檔案選項,Code已檢查
  • 刪除與檔名重複且無作用的檔案選項,Code已檢查
  • 修正尺寸選項為px單位,Code已檢查
  • 將尺寸選項改為正規形式,Code已檢查
  • 刪除同類別之其他語系的檔案選項,Code已檢查
  • 將其他語系的檔案選項改為本wiki相對應的檔案選項,Code已檢查
  • 刪除同類別之別名,Code已檢查
  • 修正誤植,Code已檢查
  • 修正錯誤的圖片替代文字用法,Code已檢查
  • 刪除重複的檔案選項,Code已檢查
  • 去掉相同類別的無效檔案選項,Code已檢查
  • 更新時間:2017年12月30日 (六) 10:37 (UTC)
謝謝您 --Kanashimi留言2017年12月30日 (六) 10:47 (UTC)[回复]