Module:PatternedCandidateUtils2
外观
模块文档[创建]
您可能想要创建本Scribunto模块的文档。 编者可以在本模块的沙盒 (创建 | 镜像)和测试样例 (创建)页面进行实验。 请在/doc子页面中添加分类。 本模块的子页面。 |
--[[
已知以下幾種情況會導致錯誤,但是我們可以善意地認為沒有人會故意這樣做:
1. 只有一個標題,後面沒有文字(或者是緊接著下一個標題)
2. <nowiki>
...
== aaa ==
...
</nowiki>
3. 放一個大小寫混用的HTML標籤 // Special:Redirect/revision/43073725 真的有人故意这么做
4. 在標題中使用<ref>
5. 標題沒有文字
]]--
local z = {}
local HTMLTAGS = {'b', '[Bb][Ii][Gg]', 'blockquote', 'br', 'caption', 'center', 'code', 'del', 'div', 'em', 'font', 'i', 'kbd', 'mark', 'p', 'q', 'rp', 'rt', 'ruby', 's', 'small', 'span', 'strong', 'sub', 'sup', 'time', 'tt',
'B', 'BLOCKQUOTE', 'BR', 'CAPTION', 'CENTER', 'CODE', 'DEL', 'DIV', 'EM', 'FONT', 'I', 'KBD', 'MARK', 'P', 'Q', 'RP', 'RT', 'RUBY', 'S', 'SMALL', 'SPAN', 'STRONG', 'SUB', 'SUP', 'TIME', 'TT'
}
function getCandidates( frame )
local page = mw.title.new( frame.args.title ):getContent() or ''
local matches = {}
local black = {}
if frame.args.black then
for b in mw.text.gsplit( frame.args.black, '|', true ) do
black[b] = true
end
end
for m in mw.ustring.gmatch( page, frame.args.pattern ) do
if not black[m] then
table.insert( matches, m )
end
end
return matches
end
function z.count( frame )
return #getCandidates( frame )
end
local function encodetitle( frame, text )
local r = text
-- 提取<nowiki>和<pre>內容
local nowikis = {}
local extract = function (s)
nowikis[#nowikis+1] = s
return '__NOWIKI_UNIT_' .. #nowikis
end
r = string.gsub(r, '<[Nn][Oo][Ww][Ii][Kk][Ii]>(.-)</[Nn][Oo][Ww][Ii][Kk][Ii]>', extract)
r = string.gsub(r, '<pre>(.-)</pre>', extract)
-- 解析wikitext
r = frame:preprocess(r)
-- 粗體與斜體
r = string.gsub(r, "'''''(.-)'''''", '%1')
r = string.gsub(r, "'''(.-)'''", '%1')
r = string.gsub(r, "''(.-)''", '%1')
-- 去除圖片
r = string.gsub(r, '%[%[[Ff]ile:(.-)%]%]', '')
r = string.gsub(r, '%[%[[Ii]mage:(.-)%]%]', '')
r = string.gsub(r, '%[%[文件:(.-)%]%]', '')
r = string.gsub(r, '%[%[檔案:(.-)%]%]', '')
-- 去除ref和math等標籤
r = mw.text.killMarkers(r)
-- 展開連結
r = string.gsub(r, '%[%[[^%]]-%|(.-)%]%]', '%1')
r = string.gsub(r, '%[%[:?(.-)%]%]', '%1')
r = string.gsub(r, '%[[^%]]-% (.-)%]', '%1')
-- 去除HTML標籤
for i, t in ipairs(HTMLTAGS) do
r = string.gsub(r, '</?' .. t.. '.->', '')
end
-- 將pre與nowiki內容放回文字之中
for i, t in ipairs(nowikis) do
local u = mw.text.encode(t)
r = string.gsub(r, '__NOWIKI_UNIT_' .. i, u)
end
-- 更換特殊字元
r = mw.text.encode(r, '%[%]%|{}')
return mw.text.trim(r)
end
function z.list( frame )
local list = getCandidates( frame )
local linkprefix = mw.text.trim(frame.args.linkprefix)
local anchorno = {}
for i = 1, #list do
if linkprefix then
local title = encodetitle(frame, list[i])
-- 記錄標題文字,如果重複,那麼在後面附加「_2」、「_3」……
anchorno[title] = (anchorno[title] or 0) + 1
local postfix = (anchorno[title] > 1 and '_' .. anchorno[title]) or ''
list[i] = '[[:' .. linkprefix .. string.gsub(title, '&', '&') .. postfix .. '|' .. title .. ']]'
else
list[i] = '[[:' .. list[i] .. ']]'
end
end
if #list > 0 then
return table.concat( list, '-' )
else
return '暂无'
end
end
function z.listtalk( frame )
frame.args.pattern = '[^=]==%s*([^=]+)%s*==[^=]'
if frame.args[1] and not frame.args.title then
frame.args.title = frame.args[1]
end
frame.args.linkprefix = mw.text.trim(frame.args.title or '') .. '#'
return z.list(frame)
end
return z