跳转到内容

User:P-bot/fxdcd.py

維基文庫,自由的圖書館
# -*- coding: utf-8 -*-
import re,codecs
import wikipedia

def char_replace(text):
	text = text.replace(u'[麵-面+少]', u'麨')
	text = text.replace(u'[(拔-手)/皿]', u'盋')
	text = text.replace(u'[門@(人/(人*人))]', u'閦')
	text = text.replace(u'[巾*((空-工)/登)]', u'㡧')
	text = text.replace(u'[言*我]', u'誐')
	text = text.replace(u'[木*密]', u'樒')
	text = text.replace(u'[少/免]', u'少/免')
	text = text.replace(u'[和/心]', u'惒')
	text = text.replace(u'[路-各+束]', u'踈')
	text = text.replace(u'[弓*贊]', u'𢑊')
	text = text.replace(u'[怯-去+麼]', u'懡')
	text = text.replace(u'[自/死]', u'臰')
	text = text.replace(u'[口*歇]', u'𠿒')
	text = text.replace(u'[糸*(媟-女)]', u'緤')
	text = text.replace(u'[防-方]', u'阝')
	text = text.replace(u'[束*辛]', u'辢')
	text = text.replace(u'[衣+昆]', u'裩')
	text = text.replace(u'[卄/閬]', u'䕞')
	text = text.replace(u'[木*宛]', u'椀')
	text = text.replace(u'[(拱-共)*(謯-言)]', u'摣')
	text = text.replace(u'[口*陵]', u'𠻱')
	text = text.replace(u'[木*(追-走)]', u'桘')
	text = text.replace(u'[捎-肖+突]', u'揬')
	text = text.replace(u'[目*侯]', u'睺')
	text = text.replace(u'[弓/一]', u'弖')
	text = text.replace(u'[卄/高/禾]', u'藳')
	text = text.replace(u'[口*栗]', u'㗚')
	text = text.replace(u'[女*貝]', u'㛝')
	text = text.replace(u'[藹-言+月]', u'﨟')
	text = text.replace(u'[漸/耳]', u'聻')
	text = text.replace(u'[口*后]', u'㖃')
	text = text.replace(u'[斬/耳]', u'𦗚')
	text = text.replace(u'[多*頁]', u'䫂')
	text = text.replace(u'[毛@(鞠-革)]', u'毱')
	text = text.replace(u'[口*尸]', u'㕧')
	text = text.replace(u'[口*摩]', u'嚤')
	text = text.replace(u'[芽*(郝-赤)]', u'䓉')
	text = text.replace(u'[卄/幹]', u'𦼮')
	text = text.replace(u'[禾*犀]', u'穉')
	text = text.replace(u'[金*巢]', u'鏁')
	text = text.replace(u'[木+(姊-女)]', u'柹')
	text = text.replace(u'[風@(軷-車)]', u'颰')
	text = text.replace(u'[火*(堛-土)]', u'煏')
	text = text.replace(u'[口*爾]', u'𡁠')
	text = text.replace(u'[翔-羽+兒]', u'䍲')
	text = text.replace(u'[食*夌]', u'')
	text = text.replace(u'[戔*(到-至)]', u'剗')
	text = text.replace(u'[糸*任]', u'絍')
	text = text.replace(u'[(回-口)@(欒-木)]', u'圝')
	text = text.replace(u'[一/旦]', u'亘')
	text = text.replace(u'[糸*(軋-車)]', u'糺')
	text = text.replace(u'[酉*且]', u'䣯')
	text = text.replace(u'[打-丁+羅]', u'攞')
	text = text.replace(u'[口*留]', u'𠺕')
	text = text.replace(u'[口*(一/巾)]', u'𠯗')
	text = text.replace(u'[卄/別]', u'莂')
	text = text.replace(u'[木*霸]', u'欛')
	text = text.replace(u'[(仔-子)*(託-言)]', u'仛')
	text = text.replace(u'[悄-肖+吳]', u'悞')
	text = text.replace(u'[彊-弓]', u'畺')
	text = text.replace(u'[月*葛]', u'臈')
	text = text.replace(u'[奇*(敲-高)]', u'敧')
	text = text.replace(u'[食*人]', u'飤')
	text = text.replace(u'[口*叔]', u'𠴫')
	text = text.replace(u'[口/可]', u'呵')
	text = text.replace(u'[立*令]', u'竛')
	text = text.replace(u'[禾*末]', u'秣')
	text = text.replace(u'[(苑-卄)/皿]', u'盌')
	text = text.replace(u'[口*路]', u'𡀔')
	text = text.replace(u'[口*縛]', u'嚩')
	text = text.replace(u'[路-各+荼]', u'')
	text = text.replace(u'[貝*親]', u'䞋')
	text = text.replace(u'[(遯-豚)+(嗽-口)]', u'遬')
	text = text.replace(u'[何-可+者]', u'偖')
	text = text.replace(u'[路-各+(合/羽)]', u'蹹')
	text = text.replace(u'[怖-布+羅]', u'㦬')
	text = text.replace(u'[立*立]', u'竝')
	text = text.replace(u'[馬*太]', u'駄')
	text = text.replace(u'[(纏-糸)*(郊-交)]', u'鄽')
	text = text.replace(u'[雨/注]', u'霔')
	text = text.replace(u'[口*耶]', u'㖿')
	text = text.replace(u'[食*(汴-水)]', u'飰')
	text = text.replace(u'[(病-丙)@陰]', u'癊')
	text = text.replace(u'[四/弟]', u'罤')
	text = text.replace(u'[木*致]', u'㮹')
	text = text.replace(u'[沐-木]', u'氵')
	text = text.replace(u'[竹/扈]', u'簄')
	text = text.replace(u'[虫*各]', u'蛒')
	text = text.replace(u'[月*耑]', u'腨')
	text = text.replace(u'[(拱-共)*(穴/八/夕)]', u'摉')
	text = text.replace(u'[金*咨]', u'𨩲')
	text = text.replace(u'[敦/土]', u'墪')
	text = text.replace(u'[囗@力]', u'㘞')
	text = text.replace(u'[身*(耽-耳)]', u'躭')
	text = text.replace(u'[卄/爰-(妥-女))]', u'𦭞')
	text = text.replace(u'[疊*毛]', u'㲲')
	text = text.replace(u'[口*和]', u'啝')
	text = text.replace(u'[僽-秋+(夫*夫)]', u'𠎝')
	text = text.replace(u'[竹/冊]', u'笧')
	text = text.replace(u'[木*(淂-水)]', u'棏')
	text = text.replace(u'[木*患]', u'槵')
	text = text.replace(u'[卄/忽]', u'䓤')
	text = text.replace(u'[帝/心]', u'𢝃')
	text = text.replace(u'[木*埋]', u'榸')
	text = text.replace(u'[口*童]', u'噇')
	text = text.replace(u'[(市-巾)/桀]', u'')
	text = text.replace(u'[裡-里+戒]', u'裓')
	text = text.replace(u'[麻-林]', u'广')
	text = text.replace(u'[(阿-可)*肖]', u'陗')
	text = text.replace(u'[厂@乇]', u'厇')
	text = text.replace(u'[車*度]', u'𨍏')
	text = text.replace(u'[衣*聶]', u'襵')
	text = text.replace(u'[栝-舌+忝]', u'㮇')
	text = text.replace(u'[(扣-口)*主]', u'拄')
	text = text.replace(u'[何-可+爾]', u'儞')
	text = text.replace(u'[竹/耑]', u'篅')
	text = text.replace(u'[(乏-之)/友]', u'叐')
	text = text.replace(u'[(挈-手)/石]', u'䂮')
	text = text.replace(u'[何-可+動]', u'働')
	text = text.replace(u'[病-丙+包]', u'疱')
	text = text.replace(u'[虫*昆]', u'蜫')
	text = text.replace(u'[河-可+靜]', u'瀞')
	text = text.replace(u'[(扣-口)*它]', u'拕')
	text = text.replace(u'[轂-車+卵]', u'㲉')
	text = text.replace(u'[怖-布+追]', u'𢟋')
	text = text.replace(u'[食*善]', u'饍')
	text = text.replace(u'[泄-世+位]', u'涖')
	text = text.replace(u'[(窸-采)@(私-禾)]', u'窓')
	text = text.replace(u'[木*百]', u'栢')
	text = text.replace(u'[(阻-且)*(施-方)]', u'陁')
	text = text.replace(u'[拱-共+桀]', u'搩')
	text = text.replace(u'[卄/(鍐-金)]', u'葼')
	text = text.replace(u'[合*牛]', u'𤙖')
	text = text.replace(u'[火*(而/大)]', u'煗')
	text = text.replace(u'[韋*(備-人)]', u'韛')
	text = text.replace(u'[扣-口+沙]', u'挱')
	text = text.replace(u'[陝-夾+(區-品+夾)]', u'陿')
	text = re.sub(u'<img.*?[Jj][Pp][Gg].*?>', '', text) #處理jpg文件
	text = text.replace(u'<img src="qz/8141.gif" border=0>', u'卐')
	text = text.replace(u'<img src="qz/8145.gif" border=0>', u'☲')
	text = text.replace(u'<img src="qz/8147.gif" border=0>', u'☴')
	text = text.replace(u'<img src="qz/8166.gif" border=0>', u'䷛')
	text = text.replace(u'<img src="qz/8168.gif" border=0>', u'䷝')
	text = text.replace(u'<img src="qz/81A9.gif" border=0>', u'䷼')
	text = text.replace(u'<img src="qz/8EA4.gif" border=0>', u'㘞')
	text = text.replace(u'<img src="qz/8EE5.gif" border=0>', u'㡯')
	text = text.replace(u'<img src="qz/8EE6.gif" border=0>', u'㕧')
	text = text.replace(u'<img src="qz/8F63.gif" border=0>', u'䀏')
	text = text.replace(u'<img src="qz/8F6F.gif" border=0>', u'㳂')
	text = text.replace(u'<img src="qz/8FC2.gif" border=0>', u'𢂁')
	text = text.replace(u'<img src="qz/8FC6.gif" border=0>', u'𠰢')
	text = text.replace(u'<img src="qz/8FC7.gif" border=0>', u'𠱥')
	text = text.replace(u'<img src="qz/8FC8.gif" border=0>', u'𠰘')
	text = text.replace(u'<img src="qz/8FD4.gif" border=0>', u'[冉寸]')
	text = text.replace(u'<img src="qz/90A1.gif" border=0>', u'䏥')
	text = text.replace(u'<img src="qz/90A2.gif" border=0>', u'[月古]')
	text = text.replace(u'<img src="qz/90A3.gif" border=0>', u'𦙽')
	text = text.replace(u'<img src="qz/90A5.gif" border=0>', u'𥫥')
	text = text.replace(u'<img src="qz/90AA.gif" border=0>', u'㖃')
	text = text.replace(u'<img src="qz/90AB.gif" border=0>', u'𦭞')
	text = text.replace(u'<img src="qz/90AC.gif" border=0>', u'䓉')
	text = text.replace(u'<img src="qz/90AE.gif" border=0>', u'𦭽')
	text = text.replace(u'<img src="qz/90B1.gif" border=0>', u'𪥾')
	text = text.replace(u'<img src="qz/9162.gif" border=0>', u'㛝')
	text = text.replace(u'<img src="qz/9166.gif" border=0>', u'[冉冉]')
	text = text.replace(u'<img src="qz/9167.gif" border=0>', u'䞘')
	text = text.replace(u'<img src="qz/9168.gif" border=0>', u'[宀/幺/牛]')
	text = text.replace(u'<img src="qz/916B.gif" border=0>', u'㼜')
	text = text.replace(u'<img src="qz/916C.gif" border=0>', u'𠴊')
	text = text.replace(u'<img src="qz/916D.gif" border=0>', u'𤙖')
	text = text.replace(u'<img src="qz/9171.gif" border=0>', u'𠳞')
	text = text.replace(u'<img src="qz/9173.gif" border=0>', u'𥫱')
	text = text.replace(u'<img src="qz/9174.gif" border=0>', u'𡋯')
	text = text.replace(u'<img src="qz/9176.gif" border=0>', u'[疒@卡]')
	text = text.replace(u'<img src="qz/9261.gif" border=0>', u'䏶')
	text = text.replace(u'<img src="qz/9262.gif" border=0>', u'䏺')
	text = text.replace(u'<img src="qz/9263.gif" border=0>', u'𫓅')
	text = text.replace(u'<img src="qz/9266.gif" border=0>', u'㲀')
	text = text.replace(u'<img src="qz/9267.gif" border=0>', u'𥒞')
	text = text.replace(u'<img src="qz/926B.gif" border=0>', u'[忄阜]')
	text = text.replace(u'<img src="qz/926E.gif" border=0>', u'䂮')
	text = text.replace(u'<img src="qz/926F.gif" border=0>', u'𠴫')
	text = text.replace(u'<img src="qz/9276.gif" border=0>', u'𠩺')
	text = text.replace(u'<img src="qz/927E.gif" border=0>', u'㹀')
	text = text.replace(u'<img src="qz/92AB.gif" border=0>', u'[牙攵/刀]')
	text = text.replace(u'<img src="qz/9361.gif" border=0>', u'[木/夭小丶]')
	text = text.replace(u'<img src="qz/9364.gif" border=0>', u'卑也')
	text = text.replace(u'<img src="qz/936F.gif" border=0>', u'?')
	text = text.replace(u'<img src="qz/9370.gif" border=0>', u'𠌥')
	text = text.replace(u'<img src="qz/9371.gif" border=0>', u'飰')
	text = text.replace(u'<img src="qz/9373.gif" border=0>', u'𠷐')
	text = text.replace(u'<img src="qz/9374.gif" border=0>', u'[口/西土]')
	text = text.replace(u'<img src="qz/9375.gif" border=0>', u'䟡')
	text = text.replace(u'<img src="qz/9377.gif" border=0>', u'𦳥')
	text = text.replace(u'<img src="qz/937A.gif" border=0>', u'[糹邪]')
	text = text.replace(u'<img src="qz/937C.gif" border=0>', u'[田弟]')
	text = text.replace(u'<img src="qz/937D.gif" border=0>', u'㓺')
	text = text.replace(u'<img src="qz/937E.gif" border=0>', u'𡺐')
	text = text.replace(u'<img src="qz/93A1.gif" border=0>', u'[亭也]')
	text = text.replace(u'<img src="qz/93A5.gif" border=0>', u'䣯')
	text = text.replace(u'<img src="qz/93AC.gif" border=0>', u'-{葱}-')
	text = text.replace(u'<img src="qz/93AD.gif" border=0>', u'𥬳')
	text = text.replace(u'<img src="qz/93AE.gif" border=0>', u'𤦏')
	text = text.replace(u'<img src="qz/94A5.gif" border=0>', u'𣔻')
	text = text.replace(u'<img src="qz/94A6.gif" border=0>', u'㮈')
	text = text.replace(u'<img src="qz/94A8.gif" border=0>', u'㮙')
	text = text.replace(u'<img src="qz/94A9.gif" border=0>', u'[少/免]')
	text = text.replace(u'<img src="qz/94AB.gif" border=0>', u'𦵧')
	text = text.replace(u'<img src="qz/94AE.gif" border=0>', u'𤚥')
	text = text.replace(u'<img src="qz/94B1.gif" border=0>', u'𢟋')
	text = text.replace(u'<img src="qz/94B2.gif" border=0>', u'䓽')
	text = text.replace(u'<img src="qz/94B4.gif" border=0>', u'𠻱')
	text = text.replace(u'<img src="qz/94B5.gif" border=0>', u'𠺕')
	text = text.replace(u'<img src="qz/94B6.gif" border=0>', u'𠻬')
	text = text.replace(u'<img src="qz/94B7.gif" border=0>', u'𦶇')
	text = text.replace(u'<img src="qz/94B8.gif" border=0>', u'𩊅')
	text = text.replace(u'<img src="qz/94B9.gif" border=0>', u'㗚')
	text = text.replace(u'<img src="qz/94BB.gif" border=0>', u'摉')
	text = text.replace(u'<img src="qz/94BC.gif" border=0>', u'[沙/米]')
	text = text.replace(u'<img src="qz/94C3.gif" border=0>', u'㨜')
	text = text.replace(u'<img src="qz/94D1.gif" border=0>', u'𣪬')
	text = text.replace(u'<img src="qz/94D3.gif" border=0>', u'[口狸]')
	text = text.replace(u'<img src="qz/95C1.gif" border=0>', u'[目匍]')
	text = text.replace(u'<img src="qz/95C4.gif" border=0>', u'㮹')
	text = text.replace(u'<img src="qz/95C7.gif" border=0>', u'墖')
	text = text.replace(u'<img src="qz/95CA.gif" border=0>', u'[亻/大韭]')
	text = text.replace(u'<img src="qz/95CD.gif" border=0>', u'𨁝')
	text = text.replace(u'<img src="qz/95D1.gif" border=0>', u'䍲')
	text = text.replace(u'<img src="qz/95D4.gif" border=0>', u'䩙')
	text = text.replace(u'<img src="qz/95D5.gif" border=0>', u'𧛔')
	text = text.replace(u'<img src="qz/95D6.gif" border=0>', u'𠎝')
	text = text.replace(u'<img src="qz/95DC.gif" border=0>', u'[口菴]')
	text = text.replace(u'<img src="qz/95E1.gif" border=0>', u'[口梵]')
	text = text.replace(u'<img src="qz/96E2.gif" border=0>', u'[月庸]')
	text = text.replace(u'<img src="qz/96E5.gif" border=0>', u'𡑝')
	text = text.replace(u'<img src="qz/96E6.gif" border=0>', u'㼐')
	text = text.replace(u'<img src="qz/96EA.gif" border=0>', u'𪧴')
	text = text.replace(u'<img src="qz/96EE.gif" border=0>', u'[囗@(王/王王)]')
	text = text.replace(u'<img src="qz/96EF.gif" border=0>', u'[王密]')
	text = text.replace(u'<img src="qz/96F2.gif" border=0>', u'[(匕/禾)籴]')
	text = text.replace(u'<img src="qz/9840.gif" border=0>', u'𥊚')
	text = text.replace(u'<img src="qz/9842.gif" border=0>', u'㲉')
	text = text.replace(u'<img src="qz/9843.gif" border=0>', u'𥱴')
	text = text.replace(u'<img src="qz/9846.gif" border=0>', u'[艹/夌玉]')
	text = text.replace(u'<img src="qz/9849.gif" border=0>', u'䤄')
	text = text.replace(u'<img src="qz/984A.gif" border=0>', u'[飠夌]')
	text = text.replace(u'<img src="qz/984D.gif" border=0>', u'𡀔')
	text = text.replace(u'<img src="qz/984E.gif" border=0>', u'[尺鳥]')
	text = text.replace(u'<img src="qz/984F.gif" border=0>', u'𠿒')
	text = text.replace(u'<img src="qz/9851.gif" border=0>', u'䕞')
	text = text.replace(u'<img src="qz/9852.gif" border=0>', u'𨍏')
	text = text.replace(u'<img src="qz/9853.gif" border=0>', u'[疒@帶]')
	text = text.replace(u'<img src="qz/9854.gif" border=0>', u'𦿆')
	text = text.replace(u'<img src="qz/9856.gif" border=0>', u'[山蓋]')
	text = text.replace(u'<img src="qz/9857.gif" border=0>', u'㦗')
	text = text.replace(u'<img src="qz/986A.gif" border=0>', u'[艹/阝(𨐌/一)]')
	text = text.replace(u'<img src="qz/9940.gif" border=0>', u'𥋧')
	text = text.replace(u'<img src="qz/9941.gif" border=0>', u'[此鳥]')
	text = text.replace(u'<img src="qz/9942.gif" border=0>', u'𨨲')
	text = text.replace(u'<img src="qz/9947.gif" border=0>', u'[奢多]')
	text = text.replace(u'<img src="qz/994B.gif" border=0>', u'[足荼]')
	text = text.replace(u'<img src="qz/994D.gif" border=0>', u'[𧾷尃]')
	text = text.replace(u'<img src="qz/9950.gif" border=0>', u'𡁠')
	text = text.replace(u'<img src="qz/9952.gif" border=0>', u'[門@人/者]')
	text = text.replace(u'<img src="qz/9953.gif" border=0>', u'[扌丽/木]')
	text = text.replace(u'<img src="qz/9954.gif" border=0>', u'[扌𤘆/米]')
	text = text.replace(u'<img src="qz/9955.gif" border=0>', u'𦗚')
	text = text.replace(u'<img src="qz/9957.gif" border=0>', u'[滌心]')
	text = text.replace(u'<img src="qz/9959.gif" border=0>', u'𩜶')
	text = text.replace(u'<img src="qz/995A.gif" border=0>', u'𡒨')
	text = text.replace(u'<img src="qz/9960.gif" border=0>', u'𩓪')
	text = text.replace(u'<img src="qz/9A40.gif" border=0>', u'[骨委]')
	text = text.replace(u'<img src="qz/9A41.gif" border=0>', u'𨩲')
	text = text.replace(u'<img src="qz/9A43.gif" border=0>', u'[口履]')
	text = text.replace(u'<img src="qz/9A44.gif" border=0>', u'𡂡')
	text = text.replace(u'<img src="qz/9A47.gif" border=0>', u'䠠')
	text = text.replace(u'<img src="qz/9A48.gif" border=0>', u'𢹌')
	text = text.replace(u'<img src="qz/9A49.gif" border=0>', u'𩋡')
	text = text.replace(u'<img src="qz/9A4C.gif" border=0>', u'𧫦')
	text = text.replace(u'<img src="qz/9A51.gif" border=0>', u'䮚')
	text = text.replace(u'<img src="qz/9A55.gif" border=0>', u'[金夏]')
	text = text.replace(u'<img src="qz/9AE0.gif" border=0>', u'[門視]')
	text = text.replace(u'<img src="qz/9AE1.gif" border=0>', u'𥌛')
	text = text.replace(u'<img src="qz/9AE3.gif" border=0>', u'[氵頤]')
	text = text.replace(u'<img src="qz/9AE5.gif" border=0>', u'𧝴')
	text = text.replace(u'<img src="qz/9AE7.gif" border=0>', u'𢤁')
	text = text.replace(u'<img src="qz/9AEA.gif" border=0>', u'𡃤')
	text = text.replace(u'<img src="qz/9AEB.gif" border=0>', u'𧂐')
	text = text.replace(u'<img src="qz/9AEE.gif" border=0>', u'𩌈')
	text = text.replace(u'<img src="qz/9BC0.gif" border=0>', u'[薜/女]')
	text = text.replace(u'<img src="qz/9BC3.gif" border=0>', u'𡄦')
	text = text.replace(u'<img src="qz/9BC7.gif" border=0>', u'[口藍]')
	text = text.replace(u'<img src="qz/9BC9.gif" border=0>', u'[口隸]')
	text = text.replace(u'<img src="qz/9CA1.gif" border=0>', u'𪴾')
	text = text.replace(u'<img src="qz/9CA4.gif" border=0>', u'𧞶')
	text = text.replace(u'<img src="qz/9CA6.gif" border=0>', u'𧔆')
	text = text.replace(u'<img src="qz/9CA7.gif" border=0>', u'𡅏')
	text = text.replace(u'<img src="qz/9CA9.gif" border=0>', u'[山聶]')
	text = text.replace(u'<img src="qz/9CAA.gif" border=0>', u'㡧')
	text = text.replace(u'<img src="qz/9D60.gif" border=0>', u'[目襄]')
	text = text.replace(u'<img src="qz/9D65.gif" border=0>', u'㦬')
	text = text.replace(u'<img src="qz/9D66.gif" border=0>', u'𩍜')
	text = text.replace(u'<img src="qz/9DE0.gif" border=0>', u'䞋')
	text = text.replace(u'<img src="qz/9DE3.gif" border=0>', u'𪘨')
	text = text.replace(u'<img src="qz/9DE5.gif" border=0>', u'𨘧')
	text = text.replace(u'<img src="qz/9EA1.gif" border=0>', u'[目羅]')
	text = text.replace(u'<img src="qz/9EA2.gif" border=0>', u'𩕳')
	text = text.replace(u'<img src="qz/9EA3.gif" border=0>', u'𪙁')
	text = text.replace(u'<img src="qz/9EE1.gif" border=0>', u'𪍿')
	text = text.replace(u'<img src="qz/9EE2.gif" border=0>', u'䪊')
	text = text.replace(u'<img src="qz/9F60.gif" border=0>', u'𡆗')
	text = text.replace(u'<img src="qz/9F61.gif" border=0>', u'㲲')
	text = text.replace(u'<img src="qz/A0A1.gif" border=0>', u'[𡧳/土]')
	return text

def getElements(filepath, start = '\n'):
	sfile = codecs.open(filepath, 'r', 'utf-8')
	stext = sfile.read()
	try:
		title = re.findall(ur'\u3010(.*?)\s*\u3011',stext)[0] # 标题
		title = char_replace(title)
		if not title == start and not start == '\n':
			title = None
	except IndexError:
		title = None
	try:
		text = re.findall(u'(\u3010.*?\n\u3011[\s\S]*?<hr>[\s\S]*?<hr>)',stext)[0] # 正文
		text = re.sub(u'\s*】',u'】', text) #处理回车
		text = text.replace(u' ',u'') #处理空格
		text = text.replace(u'(',u'(') #处理半角括号
		text = text.replace(u')',u')') #处理半角括号
		text = text.replace(u'<hr>',u'') #处理<hr>
		text = char_replace(text)
		text = re.sub(u'<a href.*?>(.*?)</a>', u'[[佛學大辭典/\g<1>|\g<1>]]',text) #链接
		text = re.sub(u'(<BR>)+',u'\n\n',text) #处理回车
		text = re.sub(u'(\n)+',u'\n',text) #处理回车
	except IndexError:
		text = None
	
	return (title, text)

def creatWikiPage(pre_elements, elements, next_elements):
	if not elements[0]:
		return False
	cmt = u'机器人:创建新页面(佛学大辞典)'
	text = u'{{DingFuBao Dict-begin}}\n'
	text +=u'{{DingFuBao Dict|' + pre_elements[0] + u'|' + next_elements[0] + u'}}\n'
	text +=u'{{DingFuBao Dict-wiktionary|' + elements[0] + '}}\n'
	text +=u'{{DingFuBao Dict-end}}\n'
	text +=elements[1]
	wikipage = wikipedia.Page(wikipedia.getSite(), u'佛學大辭典/' + elements[0])
	#if not wikipage.exists():
	wikipage.put(newtext=text, comment=cmt, minorEdit=False)
	return True
	#else:
	#	print u'[[' + elements[0] + u']]' + u'already exist. Skipped.'

def main():
	for arg in wikipedia.handleArgs():
		if arg.startswith('-start:'):
			title = arg[7:]
	for i in range(276,31587):
		pre_elements = getElements('E:\\fxdcd\\' + str(i-1) + '.txt')
		elements = getElements('E:\\fxdcd\\' + str(i) + '.txt')
		next_elements = getElements('E:\\fxdcd\\' + str(i+1) + '.txt')
		creatWikiPage(pre_elements, elements, next_elements)

if __name__ == "__main__":
    try:
        main()
    finally:
        wikipedia.stopme()