Endless Fight

 找回密碼
 立即註冊
搜索
熱搜: 活動 交友 discuz
查看: 3929|回復: 11

整理數位文物的方法

[複製鏈接]

59

主題

447

回帖

4951

積分

論壇元老

Rank: 8Rank: 8

積分
4951
發表於 2023-9-21 01:04:07 | 顯示全部樓層 |閱讀模式
網路上的資源很多,但因為來源各不相同,每個分享的人都有一套自己的規則
要把這些不同來源的電子書整理到一起,相信大家或多或少都有一些自己慣用的方式
好奇想聽聽看大家都是怎樣整理分類的?



我先拋磚引玉,講一個我自己整理時會用的方式
就是把收到的 ZIP 檔案改副檔名為 CBZ
RAR 檔案改副檔名為 CBR

CBZ, CBR 的意思是 Comic Book Zip, 跟 Comic Book RAR
同樣規則的還有 CB7 (.7z), 但是用 7z 格式分享的遊戲文物不多,至少我還沒看過

話說回來,CBZ 跟 Zip 其實是同樣格式內容,兩者只有附檔名不同
可別小看這副檔名不同,不同的副檔名可以用來關聯不一樣的應用程式
這樣我就可以讓 zip, rar 維持用 WinRAR 之類的軟體打開
然後把 .cbz .cbr 的檔案關聯到專門用來看 漫畫/壓縮圖檔包 的軟體了
好處就是不需要另外解壓縮,而且專門看漫畫的軟體也有各種左翻右翻、單頁雙頁顯示、放大縮小等功能
比用作業系統功能看圖片來得方便

Windows 上我以前習慣用 MangaMeeya 這一套

https://www.azofreeware.com/search?q=mangameeya

MangaMeeya 已經是很多年前的軟體了,介面也顯得陳舊過時,好處是速度快
如果想要介面符合現代風格,可以試試 GonVisor
GonVisor 中文介紹
GonVisor 英文官網



另外 GonVisor 針對個人的電子書籍收藏還有基本的管理功能,
可以打分或標記是否看過,詳細可看下面影片示範
https://www.youtube.com/watch?v=02hk3WE1ZPo


而我目前主要是使用 Mac 居多,上述的 GonVisor 就摸的不深
說回 Mac, Mac 上的 Xee 也是很好的看漫畫軟體,當然也支援壓縮檔格式的 CBZ, CBR
開啟速度快,幾百 M 的壓縮文件也可以很快打開立刻翻頁瀏覽
https://theunarchiver.com/xee


對了,上面介紹的軟體都是免費軟體,不用特別去找破解




大家還有什麼整理的心得或方法呢?
我蠻好奇大家都是怎麼幫檔案命名的,或是資料夾如何分類存放
希望能夠交流交流~

本帖子中包含更多資源

您需要 登錄 才可以下載或查看,沒有賬號?立即註冊

x

點評

我也是用MangaMeeya來看  發表於 2023-9-22 16:37
回復

使用道具 舉報

0

主題

418

回帖

6621

積分

論壇元老

Rank: 8Rank: 8

積分
6621
發表於 2023-9-21 11:49:35 | 顯示全部樓層
一般情况下,我用两层文件夹,来管理电脑上的文件
层数太多或太少,都会造成查看费力
举例如下:
├─电子书
│├─游戏类
│├─娱乐类
│├─......
├─游戏
│├─电脑游戏
│├─模拟器游戏
│├─......
├─软件
│├─操作系统
│├─文档编辑
│├─......
视频,音乐,图片类资源,我不喜欢也不收

本地和网盘资源,都是按照这个方法分类存放的
定期给资料做目录,不要随意修改文件名和扩展名,因为修改后以后在目录中搜索就找不到了

點評

我有些資料太多了,光兩層文件夾也不夠分。例如模擬器遊戲下,我可能還會分成不同的平台, FC, SFC, MD...之類的  發表於 2023-9-27 11:06
回復

使用道具 舉報

59

主題

447

回帖

4951

積分

論壇元老

Rank: 8Rank: 8

積分
4951
 樓主| 發表於 2023-9-27 11:45:18 | 顯示全部樓層
本帖最後由 tzengyuxio 於 2023-9-27 13:49 編輯

另外再分享下個人檔案命名的一些習慣/規則:

  • 有數字需要做排序的話,一律用固定位數。例如 001, 002...010, 011...而不是 1, 2...10, 11...99, 100

    用固定位數的缺點是有上限,超過上限就得全部重新命名,而不固定位數則反之。
    但固定位數的優點是排列整齊,且方便程式批次處理
    可以把檔名的字串直接比大小,而不用先把字串轉為數字再做排列


  • 盡可能不使用空白或標點符號,如果遇到原檔名有空白或標點,用 `_` (底線) 替代

    雖然現在的作業系統都可以接受空白與部分標點符號作為檔名,
    但有時候在不同軟體或是環境中就會遇到不相容的問題
    而且在終端機或命令列模式處理這種有特殊字元的檔名時,還要多加上反斜線
    所以我會把需要空白或標點的地方都替換成底線
    可以接受的標點符號有這些:
    _ (底線), - (減號), ➡️ 這兩個也是 DOS 檔名中唯二可使用的符號
    + (加號), & (and), @ (at), #(井字號) $ (錢字號), %(百分號) ➡️ 有些作品名稱中會用到這些記號,除此之外不做其他使用
    () (圓括號), [] (方括號) ➡️ 特別標示時偶爾用到,例如用圓括號標示年份或日期,或是用方括號標記特殊標籤


  • 要斷句或區分概念時,以 `_`(底線) 或 `-`(減號, 連字號) 分開

    底線可以視為空白,所以分開的是不同概念的單字或短句
    連字號是把兩個不同的概念連在一起,但又不想接太近去掉間隔造成混淆
    這樣講有點抽象,我舉幾個例子:
    ・ "軟體世界_第000期_創刊號":「軟體世界」「第000期」「創刊號」是分開的三個概念:雜誌名、流水號、該期特定名稱
    ・ "軟體世界_第002期_1989-5月號":「1989 5月號」是單獨的一個概念,所以這邊不用底線隔開,但年份與月份中間有空白,故用連字號連接
    ・ "軟體世界_第070+071期_1995-春節特別號":這一期兩本合訂,因此期數用加號連接
    ・ "軟體世界_第069期_1994-12月號"
    ・ "軟體世界_第072期_1995-3月號":因為像上面「12月號」與「3月號」這些詞不用來排序,因此就保留原樣,前面不補 0
    ・ "軟體世界_第200期_2005-紀念號":與前面相同,「2005 紀念號」是一個概念,所以用連字號連接,而非用底線區隔。
                    當然這邊也可以中間不留空白「2005紀念號」,但這樣會跟「1995-3月號」的慣例不一致,因此年份後一律加連字號


回復

使用道具 舉報

0

主題

418

回帖

6621

積分

論壇元老

Rank: 8Rank: 8

積分
6621
發表於 2023-9-27 20:54:35 | 顯示全部樓層
tzengyuxio 發表於 2023-9-27 11:45
另外再分享下個人檔案命名的一些習慣/規則:

以下,是我整理电子书时,使用的命名规则,提供给你参考:

UCG杂志dat制作

大致思路是,做一个dat文件,大家可以拿去用cmp整理自己收集的ucg电子书
整理后,就知道自己拥有和缺失的部分,给补档提供方便

首先,从乱七八糟的文件名下手
将文件名规范,并做成dat,方便用cmp整理

详细的命名规则如下:(也适用于其它杂志或书籍)

我就用一个例子来解释:
最终整理后的文件名为:
【UCG_CN_018_200005_100-2_B.pdf】

关于此命名各组成部分的详细解释:
【UCG】
杂志的全称或简称,在不至于造成误会的情况下,尽量使用名称较短的简称

【_】
连接符,用来分隔名称的各个组成部分
为什么不用空格?
因为部分操作系统,比如dos,部分Windows平台上的软件,不能支持有空格的文件名
还有就是,【_】作为连接符,可以很方便的导入到电子表格中,将其作为分隔符使用

【CN】
杂志使用的语言,用两个大写字母表示,比如英文用EN,日文用JP,等

【018】
总期数,用三位数表示,也有些杂志需要四位数,比如法米通,就出到了1700期以上
任何不确定的元素,都用字符x代替,比如:不确定是第18期还是第19期,可以记作:01x
以下出版日期和页数等信息,不确定因素,也可以用x代替,不再特别指出

【200005】
出版日期,用六位数字或八位数字,表示年月日
其中年用四位数,月用两位数,日用两位数,部分月刊,可以省略日期,只用年和月标记
(为什么月和日要用两位数表示?比如一月一日,用0101表示。因为:如果一月一日用11表示,会造成误会,误认为是11月,或者是11日)

【100-2】
表示书的页数,它不是实体书页面上的页码编号总数,因为部分书封面封底和广告页无编号
也不是pdf文件的页数,因为部分pdf会将两页或多页扫描做成一页
它是指书籍实际的印刷纸张数量,很大一页或很小一页,也视同一页
后面的-2,表示这个pdf文件缺少两页
有时候,书籍发布者会给书籍增加额外的页面,用于宣传自己的网站或博客等
这种情况,页面信息这部分就记录为:100-2+1,表示书籍有一页是额外增加的

【B】
表示书籍质量的整体评价,这并不是评价书籍的内容,评价的是电子版书籍的制作质量
分三种情况:
B:(bad,质量糟糕,有必要重制)有缺页,扫描质量差,部分页面模糊不清,有大量影响阅读体验的水印,等情况,都可以“荣获”B级称号
N:(normal,质量一般,可以接受)
G:(good,高质量)制作精美的扫描版,官方电子版,等

【pdf】
电子书的格式,pdf,epub,rar,zip,7Z,exe,cbz,cbr...等格式都可以
但是,压缩包不允许出现二次嵌套和多次嵌套的压缩(就是压缩包里再有压缩包,甚至多次嵌套,无穷无尽)
压缩包或pdf等文件,不允许添加解压密码或文档开启密码

如果某一本有多个版本,如何处理?
原则上,挑选质量最好的那本,收入dat,其它版本放弃
但是,有时候会出现两个或多个版本都需要收入dat的情况
比如一本扫描质量差,页面完整,另一本扫描质量较好,却有水印或有缺页
这种情况,暂时两本都收入dat

回復

使用道具 舉報

59

主題

447

回帖

4951

積分

論壇元老

Rank: 8Rank: 8

積分
4951
 樓主| 發表於 2023-9-28 00:12:21 | 顯示全部樓層
wyw 發表於 2023-9-27 20:54
以下,是我整理电子书时,使用的命名规则,提供给你参考:

感謝分享,覺得內容很詳細,而且也都會把考慮的因素條列出來,很有幫助

我蠻喜歡看這樣子的規範文件,除了可以看出一件事情做事的準則外,
也能發現到一些不一樣的角度,例如上面 “UCG杂志dat制作“ 中的【B】,有把書籍質量也考慮進去
甚至後面也設想了遇到多個版本的處理方式
這個切入點我覺得就蠻棒的
我好像曾經在紅白機模擬器的 rom 檔命名中看過相類似的機制

另外我覺得各種命名規則本身沒有絕對的優劣
只要有命名規則都是好事,
這代表其他人可以用同樣的風格貢獻資料,
又或是拿到資料的人可以很方便的批次處理資料或尋找資料

像是 EF 論壇骨灰集散地的各個子板塊內,就都有按照一定格式訂定標題,
規則雖然簡單,但是找資料就很方便,看起來也整齊舒服!
回復

使用道具 舉報

0

主題

418

回帖

6621

積分

論壇元老

Rank: 8Rank: 8

積分
6621
發表於 2023-10-31 23:03:57 | 顯示全部樓層
https://www.zhihu.com/question/34633472?sort=created&utm_id=0
刚才随便翻看,忽然看到这篇,感觉对整理资料,也有帮助。
回復

使用道具 舉報

331

主題

1567

回帖

1萬

積分

版主

Rank: 7Rank: 7Rank: 7

積分
14701
發表於 2023-11-8 22:16:57 | 顯示全部樓層
tzengyuxio 發表於 2023-9-27 11:45
另外再分享下個人檔案命名的一些習慣/規則:

請問MangaMeeya、GonVisor這2個軟體,
是否可以同時開多張圖片?
感覺看漫畫軟體都是一張圖接著一張圖看下去的模式。
而我仍是使用Windows內建的相片檢視器來看攻略本圖片,
畢竟用電腦一張一張看圖片沒有手動翻實體書查資料快,
所以我會同時會開2、3張圖片來查資料。
回復

使用道具 舉報

59

主題

447

回帖

4951

積分

論壇元老

Rank: 8Rank: 8

積分
4951
 樓主| 發表於 2023-11-9 18:05:23 | 顯示全部樓層
guanin 發表於 2023-11-8 22:16
請問MangaMeeya、GonVisor這2個軟體,
是否可以同時開多張圖片?
感覺看漫畫軟體都是一張圖接著一張圖看 ...

這兩個在概念上是看「漫畫電子書」的軟體,不是「看圖軟體」
所以不是同時開多張圖檔,但是可以同時打開多本書(即便是同一本書的壓縮檔)
然後分別翻到不同的頁面做檢視

舉例來說,假設有一本三國志攻略本
那麼可以開三個 MangaMeeya 打開同一份攻略本,
一個翻到目錄頁,一個翻到指令說明頁,另外一個翻到最後的武將能力頁面做查找

除此之外,由於是看電子書用的,所以通常也有「雙頁模式顯示」這種一般看圖軟體沒有的效果。
回復

使用道具 舉報

48

主題

253

回帖

1950

積分

金牌會員

Rank: 6Rank: 6

積分
1950
發表於 2024-2-10 22:48:39 | 顯示全部樓層
本帖最後由 h25891016 於 2024-2-10 23:22 編輯

我現在利用遊戲的前端來整理書籍,感覺還不錯
用HoneyviewPortable開啟圖片,勾選淡化+銳化的濾鏡
圖片會顯得比較清晰





本帖子中包含更多資源

您需要 登錄 才可以下載或查看,沒有賬號?立即註冊

x
回復

使用道具 舉報

171

主題

760

回帖

4815

積分

管理員

Rank: 9Rank: 9Rank: 9

積分
4815
發表於 2024-2-18 10:55:18 | 顯示全部樓層
謝謝 tzengyuxio 兄的分享,這篇文章讓我回想到我大學時代的個人願景  ^^

1992年,那個用Modem上網的年代,學校計中開始有光纖以及初代的BBS (例如台大電機麥斯威爾, 台大椰林、灰姑娘..etc),每天都和同學蹲在計中, 除了努力閱讀BBS的文章,還花了不少時間在討論區下載 美女圖 (幾個文字檔合併成 binary的圖片檔)

那時信長roach的野望,是希望以後發達了,能夠蓋個很大的計中+圖書館,讓人人能上網,人人能開心的閱讀~ 後來就如同大家知道的,1999年 EF開始收集格鬥遊戲招式表,以及 2008年的華泰大全集,然後就沒有然後了...

網路資源隨手可得的今日,大部分人應該很難了解,當年為什麼會有這樣願景的人呀 XD

這幾年停下來,也許是早有人完成了這個任務 (例如: archive.org),也許東西太多,在HD裏已經10幾年沒整理,也許是沒整理時HD就壞掉,也許是免費空間的資料就下載不了.. 太多的也許

那麼接下來要怎麼把 EF 區域性的遊戲攻略圖書館建立起來呢?

Microsoft Notes ?
One drive ?
Google share ?

可能我還停留在上古的FTP年代,近十年的檔案分享潮流已跟不上了,除了空間保存檔案的時間,也要考慮版權吧


回復

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 立即註冊

本版積分規則

手機版|Endless Fight

GMT+8, 2024-11-1 10:22 , Processed in 0.048045 second(s), 25 queries .

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回復 返回頂部 返回列表