聊聊VSCode中的歷史儲存策略

?vscode增加了保留文件本地歷史功能,本篇文章就來帶大家聊聊vscode中的歷史儲存策略,希望對大家有所幫助!

聊聊VSCode中的歷史儲存策略

昨天更新 vscode,發現 VSCode 也增加了保留文件本地歷史功能。回想起前不久為了給 Yank Note 增加歷史記錄功能,摳破了腦袋,構思了好久歷史記錄儲存策略。感嘆要是 VSCode 早發布幾個月,我還能有個參考。【推薦學習:《vscode》】

不過當我看了 VSCode 的歷史儲存策略后:這么粗暴?

VSCode 的策略

VSCode 1.66 版本的時間軸中可以展示文件本地歷史了,效果是這樣

聊聊VSCode中的歷史儲存策略

針對這個功能,VSCode 也增加了一些配置:

There are also new settings to work with local history:workbench.localHistory.enabled – Enable or disable local history (default: true).workbench.localHistory.maxFileSize – File size limit when creating a local history entry (default: 256 KB).workbench.localHistory.maxFileEntries – Local history entries limit per file (default: 50).workbench.localHistory.exclude – Glob patterns for excluding certain files from local history.workbench.localHistory.mergeWindow – Interval in seconds during which further changes are added to the last entry in local file history (default 10s).

右鍵點擊歷史條目,有菜單可以直接在系統管理器中找到文件某個歷史記錄的副本。

因此可以推斷出,VSCode 為每一個保存/撤銷等操作,在一定時間窗口(默認10s)內,保存一個文件到文件夾。通過特殊的文件命名(保留時間信息)來定位歷史記錄。

這也太粗暴了,一個文件就是一個版本唄。

Typora 的策略

然后說下當時調研的 Typora 的策略。Typora 在 macos 上有非常精美的文件歷史回溯界面

聊聊VSCode中的歷史儲存策略

看樣子它應該是用的系統的“時間機器”來實現版本回溯的。所以這個功能在 windows 上也就沒有了。

Yank Note 的策略

我設想中的歷史版本,有幾個目標:

  • 最重要的目標是盡量避免數據丟失。

  • 歷史記錄不要占用太多體積,最好能增量記錄。

  • 極端情況下要方便用戶還原數據。

  • 歷史記錄應該可以標記和備注

針對第一個目標,我希望能保留用戶最近的編輯版本,不要舍棄。而 Yank Note 有自動保存功能,也就有了第二個目標,不要占用太多空間,也不要生成太多文件。所以最開始想的類似 VSCode 那種,時間窗口+文件保存的策略,就不行了。

針對第三個目標,我不想引入自定義的格式,如 git,或者數據庫。因為如果用戶丟失了數據,在軟件也不方便找到歷史記錄的情況(軟件損壞,文件誤刪等),用戶要可以進入歷史目錄,把文件找回來。

后續:有個用戶誤刪了一個文檔,回收站也找不到了,就通過這種方法恢復的。

再考慮第四個目標,最終我選擇了使用 zip 文件的方式來保存文件歷史版本,雖然在寫入和讀取歷史上會消耗一點計算性能(10多兆大文件歷史記錄也基本沒感知),但最終效果還是很好的。

最終方案:

  • 每個文檔由文件名和路徑 Hash 拼出一個 zip 包文件名

  • 每次寫入文件,同時往這個 zip 文件中寫入一個新版本文件

  • 移動和重命名文件時候同步更改 zip 文件的名字

  • 最大歷史版本數可以做一個限制。

  • 版本備注和標記信息可以存在壓縮的備注字段中。

通常編輯一個文件的時候,由于自動保存的機制,當前版本和上一個版本之間的差異很小,因此理論上往壓縮文件中添加一個新的版本文件,壓縮文件整體大小增加應該很小才對。不過后來發現并非如此,這時我才意識到 Zip 文件壓縮的特性:每個文件分別壓縮,再合起來打包。也即是說往壓縮包新增文件的時候,并不會和其他文件一起壓縮。

針對這種情況,我采取兩次壓縮的策略:第一次把壓縮率設置為 0,僅僅打包,這樣 zip 包內都是文件的原始信息。第二次將整個打包文件壓縮一次,這下壓縮程序就可以考慮整體的信息來做壓縮了,這就實現了“增量更新”的目的。

后面編寫腳本測試,一個普通長度的文件,保存 1000 個版本,也才占用 50KB。

使用了幾個月下來,我的歷史文件目錄也才占用 700 多 KB 的空間,里面大部分歷史記錄文件只有幾 KB 大小。反觀 VSCode,使用這兩天歷史目錄就占用了 2M。

聊聊VSCode中的歷史儲存策略

進一步

針對歷史儲存,我還進一步想了一些保存策略

相對于最后一次保存時間,保留:

  • 過去10分鐘內的每一個版本
  • 過去1小時內每分鐘一個版本
  • 過去24小時每小時一個版本
  • 每日保留一個版本
  • 已標記的備份

不過目前看來是不需要了,目前的策略簡單,各方面也達到我的預期了。

更多關于VSCode的相關知識,請訪問:vscode??!

? 版權聲明
THE END
喜歡就支持一下吧
點贊5 分享