丑搜·中文独立博客全文搜索引擎(收录有 1K+ 博客)

查看 53|回复 2
作者:yzqzss   
丑搜:https://uglysearch.othing.xyz

demo 性质,不保可用性

刚糊出来的灵车中文独立博客全文搜索引擎。
11 万篇中文独立博客文章,1.4k+ 独立博客(另有少量中文独立播客)。
搜索结果以匹配度排序,没有时间权重,这样更容易找到真正有价值的文章。如果你需要更精准的搜索结果,请发动你的小脑瓜。可以用 ";作者" 来筛选同作者的文章。数据库月度更新,如果你需要实时信息,请使用其他优美的搜索引擎。希望你能在这十几万篇文章里找到有用的东西。
键盘左右键可以翻页。可以展开显示 MarkDown 全文。
  • 博客列表: https://github.com/saveweb/rss-list (README.md 半年没更新了,我找个时间更新一下)
  • 数据源: https://box.othing.xyz (用 FreshRSS 搭的)

    主要是这三年时间里,我的 RSS 订阅器慢慢积累到 11 万篇文章,所以自然而然蹦出了这个想法。试着把数据全导入到 MeiliSearch ,发现搜索结果还不错。于是昨天用 flask 无脑糊了个后端,然后如你所见,这就是成品 demo 了……
    数据源是历年的 RSS 订阅积累,所以你会搜到一些已经消失的博客文章。
    代码就不开源了,毕竟整个实现非常灵车,大部分东西都是现成的,没啥技术量。大概就是:
    [ol]
  • 一个 Python 脚本从 FreshRSS 用的数据库里读文章的 HTML ;
  • 随便找个现成的 HTML 转 MarkDown 的库,把 HTML 转成 MarkDown ;
  • 把 MarkDown 喂给 MeiliSearch ;
  • 用 flask 立个无脑后端对接 MeiliSearch ;
  • 这个 demo 非常好看,且是无脑使用的 MeiliSearch ,故起名:丑搜。完。
    [/ol]
    弄完这个 demo ,我想到了这篇博文: 「软件工程是个面包机」。感谢前人的大量工作,咱才能在几十分钟内糊出这个能 work 的“搜索引擎包装”。当然,还不能忘了中文互联网上还是有很多一直保持内容输出的独立博客博主们。


    Markdown, 丑搜, 博客, 文章

  • sunshower   
    不错 挺好的
    leedarmau   
    界面的确需要优化一下。
    其实我博客也接了 meilisearch ,功能都写好了,就是样式实在麻烦
    您需要登录后才可以回帖 登录 | 立即注册

    返回顶部