位於使用者討論:Midleading的話題

Wmr-bot (留言貢獻)

Midleading你好!请问如何上传大文件而不会停止?

Midleading (留言貢獻)

使用MediaWiki的分块上传,分块大小设小,我分900KB一块,上传开始后把filekey保存起来,上传中断凭此可恢复进度。当然,我用的不是pywikibot,是自己制作的上传工具。如果filekey失效了,去Special:上传藏匿看看最新的filekey是多少。当然,总有少数时候上传会失败,特别是MediaWiki正在更新到新版本的时候。有时filekey失效了,等一天再看又好了,可以继续上传。

Wmr-bot (留言貢獻)

我学校的服务器被勒索软件黑了,10tb的内容都加密打不开了。还好要上传的内容在网盘里,但我不会自己上传了。

Midleading (留言貢獻)

没关系,辛苦您了,即使没有办法自己上传,帮助帮助整理上传列表让其它人上传也可以。

維基小霸王 (留言貢獻)

您有空吗?我把专用网盘的账号密码发给您。

Midleading (留言貢獻)

郵件已發送

維基小霸王 (留言貢獻)

沒有收到。您還使用的以前的郵箱嗎?

Midleading (留言貢獻)

是的,我還使用以前的郵箱

Midleading (留言貢獻)

郵件已重新發送

維基小霸王 (留言貢獻)

我没有收到您发的邮件。我已经向您发了邮件。您收到了吗?

Midleading (留言貢獻)

收到了,真是奇怪。

維基小霸王 (留言貢獻)

另外有信息文件,这就发给您。

維基小霸王 (留言貢獻)

发给您的文件的目的是从一个网站找到对应的信息,以在上传时加入。

excel表格中,sheet1是用来对应文件名和信息的,通过id。信息在另一个sheet里。

我本来是准备对应好全部再上传,可是用于电脑被勒索软件攻击,文件打不开也没心情这么做了。我已经做了对应的很多工作,上传时请充分使用。对于没有找到id的文件,您可以先不上传,也可以继续我的寻找对应的工作。有的标红的代表还需要再确认,您可以自行确认或者跳过。

强烈建议上传的标题用繁体原文。

維基小霸王 (留言貢獻)

您好,我上传了一本,作为参考。之所以把年作为标题,是因为一个纪年有多个县志的情况。还会有地点重名的情况。上传前请注意查重。

Midleading (留言貢獻)

這些地方志中有沒有某些分冊版權沒有過期?

維基小霸王 (留言貢獻)

似乎有,但是数量极少。我只找到了两个,在表格中用XXXXX标记了。

Midleading (留言貢獻)

授權协議全採用{{PD-old}}似乎不妥。

Wmr-bot (留言貢獻)

我给您的excel文件里面有日期,可以根据此信息判断。建议将所有的excel信息都加入information。

Midleading (留言貢獻)

类别好像有问题,比如“通州志”的类别被归到江苏了,只好忽略这个属性,把所有文件先扔进“中国”分类里面。我的上传系统使用MySQL数据库管理,还需要进行一下转换。文件描述页的内容可能还需要与更多人讨论。

維基小霸王 (留言貢獻)

抱歉是我搞错了,就应该是江苏省。江苏省南通市和北京市都有通州。excel表格里可以看到两个省份信息,其中有一个会把海南等归到广州省,另一个不会。

对于您在邮件里提到的来源问题,网盘上说是中国国家图书馆,那么写成中国国家图书馆可以吗?我已经建好了模板,直接应用就行了。 https://commons.wikimedia.org/wiki/Institution:National_Library_of_China

Midleading (留言貢獻)

我正在下载来自gdcloud189-person.oos-gz.ctyunapi.cn的文件

北京、上海、天津、臺灣、河北、河南、甘肅、湖南、山东、青海、蒙古、辽宁、安徽、福建、黑龙江、吉林、陕西、湖北、山西、新彊已全部下载。江西已中止至201册,后面无法下载。江苏已下载332册及之后。广东3-87/121册

无法下载浙江、江苏、广西、贵州

下午停止下载

Midleading (留言貢獻)

经过估计,我以6MB/s的速度再下载,每天下载10小时,再下载4天能下载0.82TB,还有一定缺口,所以需要协助。

維基小霸王 (留言貢獻)

您收到Martin的邮件没有?他可以直接从服务器上传。

Midleading (留言貢獻)

把文件从网盘下载回来才是问题,而Martin现在无法下载文件。只要下载回来了,上传不是问题,我多开连接同时上传能够达到很快的速度。

Midleading (留言貢獻)

我制作了无人自动下载的程序,晚上也能继续下载了,不过仍然不确定能否赶在截止日期前全部下载。

Midleading (留言貢獻)

由于网络原因,今日上传计划取消,同时今日总完成量约500GB,会员截止日期前无法全部下载确定无疑。有的文件来自cloud189-shzh-person.oos-gdsz.ctyunapi.cn且该机房未完成IPv6改造所以无法下载。

維基小霸王 (留言貢獻)

我今晚給您發去對照文件,請收到後按上面的內容上傳。

維基小霸王 (留言貢獻)

已發送。

Midleading (留言貢獻)

現在上傳程式已準備就緒並上傳了兩本書,請檢查。

Midleading (留言貢獻)
維基小霸王 (留言貢獻)
Wmr-bot (留言貢獻)

反正在中国已经没有版权,要不先上传,若有偏执的管理员非要删除再说?

維基小霸王 (留言貢獻)
Midleading (留言貢獻)

今日上傳完成蒙古、西藏、黑龙江、吉林後結束今日上傳,明日更新上傳軟體。

Wmr-bot (留言貢獻)

辛苦您了!上传好后,以后出去旅游,想看哪里的历史就都能看了。

Midleading (留言貢獻)

最后冲刺 江苏

Midleading (留言貢獻)

停止下載,剩下的絶大部分我都無法下載,以後有機會再上傳吧。

維基小霸王 (留言貢獻)

如果我再開通一個月会员,閣下能否下載完?

Midleading (留言貢獻)

剩下的文件我無法下載,開通了會員也無法下載,要拎着電腦去咖啡廳才能下載,而且坐一天也下載不完。

維基小霸王 (留言貢獻)

請問哪些不能下載?

Midleading (留言貢獻)

浙江,廣西,貴州,江蘇(部分),雲南, 四川,廣東(部分),江西(部分),我現在整理一個文件列表,檢查電腦上現在有什麼文件。

Midleading (留言貢獻)

最終維基共享資源現在有11GB,還有939GB待上傳,一共完成了950GB。

Midleading (留言貢獻)
維基小霸王 (留言貢獻)

有遺漏很麻煩,再上傳時還要挑。建議先不上傳有遺漏的,補全後再上傳。

維基小霸王 (留言貢獻)

建議將註釋文件裡沒有的文件放到一個文件夾裡,上傳到網盤(未加工的版本,上傳應該會是瞬間的),最後識別後統一上傳。

Midleading (留言貢獻)

现在只上传了下载完整的文件夹。现在上传不稳定,filekey经常莫名其妙地失效。那个列表还是有点小问题,北京应该是下载完整的,有的文件内容完全重复了应该删除。

Midleading (留言貢獻)

我已上傳安徽、北京、福建、甘肅、河北、黑龍江、湖北、湖南、吉林、遼寧、蒙古、青海、陕西、山东、山西、上海、臺灣、天津、新疆、西藏。

正在上傳河南。

Wmr-bot (留言貢獻)

👍👍👍

Midleading (留言貢獻)

河南220册“0220汤阴精忠庙志(清).pdf”文件名含有敏感词被禁止下载,重命名后正常下载,河南已经完整可上传。

Midleading (留言貢獻)

完整的文件夾除寧夏(用于測試)外已全部上傳,現正補傳上傳失敗的文件,約20GB。

維基小霸王 (留言貢獻)

感谢上传!

Midleading (留言貢獻)

上海15冊「0015光绪南汇县志.pdf」可正常打開,刪除最後一頁時pdftk卡死,改用Acrobat刪除最後一頁,提示「文檔無法保存,讀取本文檔時出現問題(109)」。重新下載後仍有問題。

維基小霸王 (留言貢獻)

等过几天回家再说。

Midleading (留言貢獻)

除示例263册外江苏已经全部下载,正在上传。

Midleading (留言貢獻)
Midleading (留言貢獻)

今日上午10:30左右,Google的所有数据中心从教育网无法访问,无法通过Google Drive将超大文件送出墙。

Google又解封了。

維基小霸王 (留言貢獻)

你好,已发送邮件,以后可考虑上传。

Midleading (留言貢獻)

收到了邮件,以后考虑上传,不过我从百度云下载的能力非常有限,进度会很慢。

維基小霸王 (留言貢獻)

有些掃描包括很多書籍,如果加上分類可便於用戶注意到。能否參與討論

Midleading (留言貢獻)

我觉得能通过搜索找到书籍就行了,没必要新建大量分类。

維基小霸王 (留言貢獻)
維基小霸王 (留言貢獻)
Midleading (留言貢獻)

江西已经完成,正在上传,现在还有云南、贵州、四川和浙江未完成,最后处理浙江。

維基小霸王 (留言貢獻)

牛!

Midleading (留言貢獻)

今天教育网也部署了针对维基百科的SNI检测,谷歌数据中心前几天就屏蔽了443端口。大陆离全体VPN越来越近了。

維基小霸王 (留言貢獻)

请问有没有办法使用境外linux服务器下载网盘的可能?

Midleading (留言貢獻)

只要有境外服务器,就可以设置VPN把文件送出国,没必要在境外下载。而且通过境外IP使用中国大陆的网络产品不仅速度慢而且在网站后台查水表时显得很可疑,可能会被要求进行手机认证。

維基小霸王 (留言貢獻)
Midleading (留言貢獻)

只要IP没黑洞,没必要绕VPN。现在主要的工作是将剩余未识别的文件识别后上传。

維基小霸王 (留言貢獻)

请问电脑算力是否够,能否将剩余未识别的文件识别文件前后10页提取并压缩后上传发送给我,一起识别?

Midleading (留言貢獻)

我發送了一封郵件,請回复。

維基小霸王 (留言貢獻)

请问现在上传的主要问题是什么?就差那600册没有信息的了吗?

維基小霸王 (留言貢獻)

我正在用维基linux服务器下载哈佛文献图片,之后转成pdf再上传。请问您觉得哪种上传方法最好用?

Midleading (留言貢獻)

现在还有四川和浙江没有下载,我最近比较忙,等我有空了会尽快去下载,没有信息的那些我会尽快使用邮箱将摘要发送给您。如果您的服务器位于境外,可以直接使用url2commons等方式,在国内的话上传一般需要使用上传脚本或者上传程序。

URL2Commons single item
維基小霸王 (留言貢獻)

感觉一个一个地下载很麻烦,以后还是探索别的方式吧。我看到您有file mover权限,是否可以先以临时文件名命名,之后我和其他用户在commons做标记,您再批量移动?

維基小霸王 (留言貢獻)

谢谢!

Midleading (留言貢獻)

有种方式可以在我们之间轻松地传输许多文件,就是使用自由网,虽然有点慢,不过这个支持批量上传下载,只需要一直开着电脑最后都能传输完毕,安全性也很好,以我们目前的进展速度来看,这个方式应该还不错,而且在国内外都可以使用。

Midleading (留言貢獻)

今天上传四川84GB,还剩浙江134GB需要下载。

維基小霸王 (留言貢獻)

您好,请问能否将上传脚本传给我用一用?谢谢!

Midleading (留言貢獻)

剛剛已通過Google雲端硬碟分享了文件,請檢查。

維基小霸王 (留言貢獻)

谢谢!

維基小霸王 (留言貢獻)

请问如何操作?我在\UploadBot\bin\Release将info.txt更改为本地文件名☁上传文件名☁描述信息,之后打开UploadBot.exe选择文件夹。为什么在显示已选择C:\Users\*\*之后,没有反应呢?

Midleading (留言貢獻)

這個程式會自動使用C:\Program Files (x86)\PDFtk\bin\PDFtk.exe把PDF文件的最後一頁去掉,然後再上傳,請檢查是否安裝了PDFtk。

維基小霸王 (留言貢獻)

您好,有禁止此功能的方法吗?我准备传些别的文件,不需要去最后一页。

Midleading (留言貢獻)

如果不修改原始碼,可以在本地文件名前面都加上“pdftk”,這樣程式就會認為這個文件已經去掉過最後一頁。您也可以修改原始碼。

維基小霸王 (留言貢獻)

C:\Program Files (x86)\PDFtk\bin\PDFtk.exe早已安装,不论加不加pdftk都无法上传。请问是否需要key?

Midleading (留言貢獻)

您需要重命名本地文件,info.txt不用修改,因為這個程式把pdf文件的最後一頁去掉後保存至前面有“pdftk”的文件,如果發生錯誤下次重新啟動時不用人工進行任何處理。

維基小霸王 (留言貢獻)

我就是这么做的。文件名:pdftk08011455.djvu。info.txt内容:08011455.djvu☁CADAL08011455_清代学术丛书·第一集·颜氏学记:卷七至卷八.djvu☁test。程序显示 登录成功1 登录成功0 登录成功2 已选择C:\Users\× 任务管理器看不到该程序任何网络交换。

Midleading (留言貢獻)

好吧,這個程式只能上傳PDF文件(528行)。

維基小霸王 (留言貢獻)

以后有空还请阁下修改,我想上传CADAL数十万册的内容(有缺)。

Midleading (留言貢獻)

試試把後綴改為PDF,info.txt中本地文件名的後綴也要改為PDF,但是維基共享資源文件名不要變,這樣傳上去以後在維基共享資源的文件後綴還是正確的。另外,程式上傳成功後會自動刪除本地文件。

維基小霸王 (留言貢獻)

好。已經成功了!

Midleading (留言貢獻)
維基小霸王 (留言貢獻)
Midleading (留言貢獻)
維基小霸王 (留言貢獻)

很奇怪,瀏覽器測試上傳了一本就能預覽了。

維基小霸王 (留言貢獻)

谢谢您的脚本!已经上传19049册。

維基小霸王 (留言貢獻)

midleading你好,感谢你的软件,现在已经上传了六万个文件了。

很多破损的文件在duxiu网站上都有。但是下载需要付费。我之前同这种方法成功下载过不少我自己阅读的书籍。我看到有人说“我在淘宝买了一个账户密码,还有全套的软件,一套有4个,再加上别人免费给我的软件,总共5个,还有软件注册码,这么多东西加起来19.8元,按卖家说法,可以下载180万本书,还是很划算的。”https://www.zhihu.com/question/23378996 不知道是不是真的。反正看到网上有很多骗子。不过我们也可以留心一下。

Midleading (留言貢獻)

真是太感谢您了,最近不好的事情频频发生,腾讯微云又宣布要对以前遗留下来的非会员资源号进行清理封号了,防火墙也动作频频,我的带宽又不是很多,最近真是头疼。浙江间断了这么久今天又去下载了一次,目前已经下载442册,再来三次浙江就能完成了。

維基小霸王 (留言貢獻)

能让全世界的人都能更容易地访问中国古文献,我感到很棒。

请问您的腾讯微云有没有可以上传到维基共享资源的内容?

Midleading (留言貢獻)

腾讯微云的事情我会自己处理,不用您担心了。现在维基共享资源已经乱成一锅粥了,需要好好整理,目前维基共享资源上面的文件组织方式连网盘目录都不如。

維基小霸王 (留言貢獻)

是呀,我正在想系统地建立分类,还得加上朝代。不过这样很麻烦,而且还有语言的问题。

Midleading (留言貢獻)

现在我知道的丛书,比较有价值的还有故宮珍本叢刊、中华再造善本、古小說叢刊、民国丛书、中国宗教历史文献集成没有导入,哈佛大学图书馆藏书有人人工导入了几本,InternetArchive里面的四库全书当初我没有导入,有人自己上传了几本,现在也挺混乱。

維基小霸王 (留言貢獻)

我准备下一个项目导入哈佛大学图书馆。我写了一个脚本,把高清晰度jpg从官网下载,在本地无损转换成pdf。在速度很快的维基toolserver已经下载了600G,但是由于同时用户太多,转换pdf失败,我已经将这些图片都删除了。我希望能有一个境外高速服务器,可是自己买挺贵的。

Midleading (留言貢獻)

即日起.NET机器人程序需要在程序开始加入System.Net.ServicePointManager.SecurityProtocol = Net.SecurityProtocolType.Tls12才可以继续使用。

維基小霸王 (留言貢獻)

請問怎麼加?現在沒法登陸了。

Midleading (留言貢獻)

已發送郵件

Midleading (留言貢獻)

所有文件已全部下载,您可以用这个账号干别的事情了。

維基小霸王 (留言貢獻)

您好,我想问一下,国内哪里可以免费或以较少的费用获得最快的外国网速连接?我使用北京移动家庭宽带,虽然国内下载很快,外国下载很慢。如果改用电信的4G,外国网速就快了。但是,我的流量包有限,无法下载TB级的文件。

維基小霸王 (留言貢獻)

我在营业厅办理了20元/月的公网IP叠加包,速度快了。