讨论:倭使日记
添加话题外观
DuckSoft在话题“原文格式清理脚本”中的最新留言:2年前
原文
[编辑]- 藏书阁版本:https://jsg.aks.ac.kr/dir/view?catePath=&dataId=JSG_K2-3492
- 奎章个版本:https://kyudb.snu.ac.kr/book/view.do?book_cd=GK16034_00
Blahhmosh(留言) 2022年6月28日 (二) 22:33 (UTC)
https://jsg.aks.ac.kr/viewer/viewTxt?dataId=K2-3492%7C001#node?dataId=ARC_23492_001_0001 (感谢 User:Blahhmosh) DuckSoft(留言) 2022年7月2日 (六) 13:49 (UTC)
原文格式清理脚本
[编辑]因原文格式复杂,直接复制浏览器网页内容会引起内容错位,故制此脚本,用时贴于浏览器之控制台即可。
document.querySelectorAll("span[data-xsl-tag='page']").forEach(i => i.parentNode.remove());
[".xsl_para", "span"].forEach(selector => document.querySelectorAll(selector).forEach(para => {
[].filter.call(para.childNodes, node => node.nodeName === "#text").forEach(node => {
let trimmed = node.textContent.trim();
if (trimmed.length === 0) node.remove();
else node.textContent = trimmed;
});
[].filter.call(para.childNodes, node => node.nodeName === "BR").forEach(node => node.remove());
}));
document.querySelectorAll("span[data-xsl-tag='kspace']").forEach(i => i.innerHTML = ' ');
document.querySelectorAll(".xsl_para_tit").forEach(i => {if (!/^== /.test(i.innerText)) i.innerText = `== ${i.innerText.trim()} ==`});
document.body.appendChild(document.createTextNode(`<!-- ${window.location} -->`))
能力有限,抛砖引玉,请多指教。 DuckSoft(留言) 2022年7月2日 (六) 14:55 (UTC)
- 这是什么code?哪一个PROGRAM的? Blahhmosh(留言) 2022年7月2日 (六) 21:03 (UTC)
- 此为 JavaScript,浏览器有调试控制台(F12 或右键——审查元素可唤出),贴代码按回车执行即可。 DuckSoft(留言) 2022年7月2日 (六) 21:09 (UTC)
- 附加更新:自动处理原文注解:
document.querySelectorAll("span[data-xsl-tag='note']").forEach(e => e.innerText = e.innerText.replace(/\s+/g, '').replace(/\[주:(.+)\]/g, '{{*|$1}}'))
- 需在上述代码基础上运行。 DuckSoft(留言) 2022年7月2日 (六) 22:07 (UTC)