Wikisource:写字间

維基文庫,自由的圖書館
跳转至: 导航搜索
社區 写字间 存檔
申請機器人,請在Wikisource:机器人提出。申請成爲或者提名管理員、行政員,請在Wikisource:管理员提出。申請更改用戶名,請洽m:Steward requests/Username changes。本wiki已經沒有任何行政員。


维基文库项目
维基文库是什么
维基文库与维基教科书
投票
版权信息
侵犯版权
删除投票

两项JavaScript小工具 帮助编者校对[编辑]

维基文库使用MediaWiki的校对插件对照扫描图片核对文本。从英文维基文库的最近更改可以看出其广泛使用校对页面录入页面。但是中文维基文库使用此功能的页面少得可怜,大多数是没有扫描版直接录入的。这阻碍了中文维基文库文本质量的提升。

维基文库的中文版本与西文版本收录内容的一大不同之处在于,西文版的扫描版主要是印刷版,可以使用OCR软件自动将图片识别为文本,本站收录古文,古文是手写,没有可用的OCR软件(数据库公司应该研发过,但显然不会公开)。但幸运之处是,古文的转录文本版本已经在网上存在了。中文维基文库的录入者可以通过分割全文到各个校对页面替代OCR过程。为此在没有人回应编程请求的情况下,我(在LiangentThis, that and the other的帮助下)借助morebits.js写了分割页面的脚本。

中文与西文校对的一大区别是,西文OCR如果识别出错误的字母,会使单词拼写错误,人工可以轻松看出来。但是中文古文很多情况下一个字就是一个词,校对起来较为麻烦。而且网上的原文不少是简体字,转换回繁体会出现一些问题,比如“云”字会转回“雲”,但表示“说话”时就应该是“云”;不少异体字的信息也失去了。因此,我引入jQuery的highlightTextarea插件,将包括第一批异体字整理表的易错字符高亮出来,让校对者注意这些字符。易错字表还可以继续添加,请留言添加。

分割页面脚本[编辑]

安装:在special:我的用户页/common.js加入:

if(wgCanonicalNamespace=="Page"&&wgAction=="edit"){
mw.util.addPortletLink('p-tb', 'javascript:importScript("User:維基小霸王/split-for-proofreading.js");void(0)', '分割文本');
}

使用Firefox 32和IE 11测试有效。

先打开要开始录入的page页面。点击编辑模式的左边栏工具节的“分割文本”按钮,之后将包括此页面的文本按Ctrl+V粘贴(一定不要用右键菜单!),用左键点击本页图像结束的位置,点击右键,此页就保存下来了。这个时候,保存过的文本会消失,右边会显示下一页的图像,即开始下一页的分割。

标识字符脚本[编辑]

安装:在special:我的用户页/common.js加入:

if(wgCanonicalNamespace=="Page"&&(wgAction=="edit"||wgAction=="submit")){
importScript("User:維基小霸王/characters-highlight.js")
}

使用Firefox 32和IE 11测试有效。

在page页面下编辑就会高亮出定义的易错字。


希望各位编者参与复查、改善脚本。之后请管理员设定为维基文库的小工具,并默认开启。--維基小霸王讨论) 2014年10月25日 (六) 12:53 (UTC)

這小工具是用於文字與書的掃瞄圖片左右對照以作校對嗎?我晚點試用看看,如果能以此校對就真方便並有效率得多了,可惜自己不懂程式。謝謝 -- Hin讨论) 2014年11月6日 (四) 09:05 (UTC)
這個工具是用於分隔文本的,需要已有的文本分隔到djvu/pdf頁面上。--維基小霸王讨论) 2014年11月20日 (四) 11:36 (UTC)
正苦於沒有這兩項功能。分頁其實可以透過某些瀏覽器實現(不過邊距的空間就浪費掉了,所以自帶分頁確實有必要),但繁簡錯字就無法指望第三方了,剛想自製一個就發現已經有人領先一步。不過……為甚麼我添加了代碼還是不能使用呢?瀏覽器是IE11和Maxthon3,系統是繁體Windows7。--H2NCH2COOH討論) 2014年12月6日 (六) 12:16 (UTC)
我明白了!維基小霸王用了Page頁面,而我是直接開啟維基文本+影印本兩個分頁校對的,因此沒有看到相關插件。另希望繁簡體錯字標記的顏色能夠加深,現在的幾乎看不到。--H2NCH2COOH討論) 2014年12月6日 (六) 12:51 (UTC)
補充:在普通頁面中啟用後發現文字與高亮悉數錯位,我還是另想辦法吧……--H2NCH2COOH討論) 2014年12月6日 (六) 13:04 (UTC)
我没有错位?是在哪个页面错位了?现在把颜色改成了#ffcccc,不知能否看到。--維基小霸王讨论) 2014年12月7日 (日) 11:27 (UTC)
普通名字空間。那些文章一般都很長,因瀏覽器的設計差異,難免錯位,所以highlightTextarea還是有缺陷。希望有小工具能加個按鈕,(在閱讀狀態下)按一下就高亮易錯字(設計可參考粵語維基百科的繁簡轉換鍵)。--H2NCH2COOH討論) 2014年12月9日 (二) 15:32 (UTC)

关于 Template:![编辑]

最近发现 {{!}} 如果不输入任何参数就会通过魔术字生成竖线符号,建议管理员在模板说明里面补充下。--Great Brightstar讨论) 2014年11月2日 (日) 09:02 (UTC)

我建议本地的模板换个名字。 --达师 - 277 - 465 2014年11月4日 (二) 04:27 (UTC)
中文维基同样功能的模板名叫Template:僻字,但就Special:链入页面/Template:!来看,移动这个不是一件容易的事情。--Liuxinyu970226讨论) 2014年11月5日 (三) 09:23 (UTC)
我在维基数据那边改了,把 d:Q5400303 的链接改到了 d:Q14449108。--Great Brightstar讨论) 2014年11月6日 (四) 14:17 (UTC)
在我看来我们还是得改,跑个bot刷掉{{!}}?--Liuxinyu970226讨论) 2014年12月11日 (四) 04:02 (UTC)
不反对。拿AWB就可以跑。编者习惯上是不是还要做个通知什么的? --达师 - 277 - 465 2014年12月11日 (四) 07:53 (UTC)

關於 Template:*Template:annotate[编辑]

最近一個用戶親切地幫助我們通過使用{{*}}以改善《日本書紀》的風格。但有一個問題:如果複製和粘貼彩色文字,它們不能與其他部分分離。我知道這是根據規範,但如果你可以考慮採用以下格式,我將非常感激:

…號國常立尊。〈至貴曰尊,自餘曰命,並訓美擧等也。下皆效此。〉

所以我想建議修改Template:*如下:

<small style="color:#996666">〈{{{1}}}〉</small>

出於同樣的原因,Template:annotate也應進行修改。

謝謝您的考慮。--CES1596讨论) 2014年12月2日 (二) 15:03 (UTC)

以上文字原本為英式中文,本人已予以修改。另由於正常情況下並不需要顯示括號,建議考慮在正常情況下隱藏括號,僅在複製貼上後、在某些低端瀏覽器中將其展開。--H2NCH2COOH討論) 2014年12月6日 (六) 12:37 (UTC)
感谢您的指正。儘管這種修改可能會影響外觀,相信括號將改善文本的可讀性,就像其他標點符號,如引號。--CES1596讨论) 2014年12月6日 (六) 14:11 (UTC)
本人手裏有少許橫排的新印古籍,註釋均是單行夾註,除字號稍小外並無任何符號將其與正文隔開,甚至連顏色都是清一色的黑色。可見註釋不加符號是出版界的慣例,維基文庫沒必要求新。但正如CES1596提到的一樣,複製貼上時註釋和正文無法分開,因此想到了隱藏註釋首尾的括號(現時暫未添加)的方法。然而隱藏的括號應該可以在複製時被選中,以便在轉化成純文本時保留括號。經查找,發現overflow:hidden似乎可以實現該功能,無奈數次嘗試沒有成功,希望有專業人士幫忙。--H2NCH2COOH討論) 2014年12月7日 (日) 03:18 (UTC)
在我看來,外觀不必是相同的印刷書籍,因為我們已經改變了它的色彩,以改善可讀性。為了改善電子文本的可用性,我想推薦給使用括號,即使它不是隱藏。--CES1596讨论) 2014年12月7日 (日) 10:32 (UTC)
color:transparent;font-size:0px怎么样?
…號國常立尊。至貴曰尊,自餘曰命,並訓美擧等也。下皆效此。
应该用()还是〈〉?--維基小霸王讨论) 2014年12月7日 (日) 11:55 (UTC)
尖頭括號吧。括弧()和方頭的〖〗都另有它用。-H2NCH2COOH討論) 2014年12月9日 (二) 15:20 (UTC)

简体字改革后、文革前文献的简繁问题[编辑]

五月三日,泰政府宣,将派出海和空部队进入越南南方作是泰派公开参加美帝侵略越南战爭的一个严重步骤。

--达师 - 277 - 465 2014年12月14日 (日) 13:27 (UTC)

應修改政策,尊重原文用字。不過有必要考慮文本同時存在簡體、繁體版時的取捨。--H2NCH2COOH討論) 2014年12月18日 (四) 04:45 (UTC)