项目简介
Glean (拾灵)是一个自托管的 RSS 阅读器和个人知识管理工具。名字取自英文动词 glean ,意为“从大量信息中拾取精华”,中文名“拾灵”寓意“拾取灵感”。
作为一个信息重度消费者,我一直希望有一个工具能够帮助我高效地管理每天需要阅读的大量内容。我之前一直在使用 folo ,自从前段时间它变成了「正式版」,并且加入了怎么都关不掉的 AI 面板,我就很少再打开它,然后就传出了它裁员的消息。于是我着手开始 vibe 了一个我自己的 RSS 阅读器,搭配上我构思了很久的个人偏好系统。
项目地址: https://github.com/LeslieLeung/glean

目前已实现的功能
- RSS 订阅管理
- 支持 RSS/Atom 订阅
- OPML 导入导出,方便从其他阅读器迁移
- 内容组织
- 多层级文件夹管理订阅源
- 标签系统,灵活分类内容
- 稍后阅读队列,支持自动清理
- 收藏系统
- 收藏订阅文章或外部 URL
- 用文件夹和标签组织收藏
- 优雅的 UI/UX
- 响应式设计,支持各种屏幕尺寸
- 文章阅读体验友好
- 自托管 & 隐私优先
- Docker 一键部署,数据完全掌握在自己手中
关于偏好系统
- 文章向量化:每篇文章入库时,使用 Embedding 模型(如 OpenAI text-embedding-3-small 或本地部署的 qwen3-embedding-8b )将文章内容转换为向量,存储在 Milvus 向量数据库中。
- 用户偏好信号:用户可以对文章进行「喜欢」「不喜欢」或「收藏」操作,这些操作会触发偏好模型更新:
- 喜欢:权重 +1.0
- 不喜欢:权重 -1.0
- 收藏:权重 +0.7
- 偏好向量计算:系统为每个用户维护两个偏好向量(正向偏好和负向偏好),使用加权移动平均的方式,将用户反馈过的文章向量融入偏好向量中。
- 推荐分数计算:当用户查看文章列表时,系统计算每篇文章的推荐分数:
- 计算文章向量与用户正向/负向偏好向量的余弦相似度
- 结合置信度因子(样本数越多置信度越高)
- 叠加来源(订阅源)和作者的亲和度加成
- 最终输出一个 0-100 的分数
- 智能排序:根据分数对未读文章进行排序,让用户更容易找到感兴趣的内容。
《Glean 拾灵 – 一个自托管的 RSS 阅读器和个人知识管理工具》留言数:0