做了一个 Chrome 插件,自动把访问过的网页全文保存到自己的 WebDAV 上

查看 103|回复 7
作者:greensea   
先丢插件地址:
https://chrome.google.com/webstore/detail/page-auto-archiver/inbfhpapklekaajibkklfjieklbbmmke/related
做这个东西起源于我自己的一个很实际的需求:有时候我想找前几天刚刚看过的网页的资料,但是网页标题已经不记得了,所以没办法通过历史记录去搜索,但是我记得网页上的文字内容,如果可以根据网页内容搜索历史记录就好了。
于是就做了这个插件,安装之后,日常浏览的时候会默默地把网页全文保存到自己的 WebDAV 上,等到想搜索的时候,直接去插件里搜索就好了。(当然更极端也更快的方法是去服务器上 grep )
反正做都做了,干脆就完善一下丢出来,万一有和我一样收集癖的人呢。

网页, 插件, webDAV, 搜索

mhqschen   
我的密码里也有"@"……懵逼了~
tool2d   
我也做了一个插件,只不过是保存所有历史 URL 到本地 indexdb 里。
原因是 chrome 默认会清空三个月前的历史记录!而且无法设置。
这点完全没办法忍,凭什么动我数据啊?
eaststarpen   
"有时候我想找前几天刚刚看过的网页的资料,但是网页标题已经不记得了" 同样的情况遇到很多次了。
实际上几天前的内容在历史记录里翻一翻还是能找到的,只不过效率太低。 几个月甚至半年那种就麻烦了。
不知道 op 数据保留 /清理的策略是什么。如果把几个月所有浏览记录全文保留感觉存储代价太大,查询效率可能也不高。
我的做法是利用简悦的稍候读功能,遇到觉得可能以后会复读的 post 就 dd 保持下来,固定时间整理。
这样做虽然麻烦了点但能让我保持内容敏感度和养成定期回顾的习惯
greensea
OP
  
@mhqshen 这是一个笔误,你不说我都还没发现,捂脸……
@eaststarpen 没有清理功能,手动清理,反正会用 WebDAV 的都会……其实我自己是保存到 NAS 上的,纯文本再多还能给我撑爆了不成。话说历史记录……我一天几百个网页的浏览量,想找一天的都难,别说几天了
HeyWeGo   
整个网页直接离线下来?显示效果如何呢?目前自己 nas 上弄了个 linkding ,当收藏夹用
TrembleBeforeMe   
保存的是网页而不是纯文本吗
caomu   
类似项目:
WorldBrain's Memex https://sspai.com/post/44088 这个据说现在只能索引书签的正文了
/t/888303
https://meta.appinn.net/t/topic/36432
还是很期待类似的项目的,个人觉得未来趋势或许就是 ChatGPT 类应用本地化,可以支持语义搜索,那就完全相当于外置大脑了。
您需要登录后才可以回帖 登录 | 立即注册

返回顶部