Horizon:开源AI新闻资讯聚合智能雷达,全自动抓取筛选双语推送

原创 发布日期:
64

一、Horizon 是什么

Horizon 是由一款开源的轻量化 AI 新闻资讯智能雷达系统,基于 Python 技术栈开发,主打多平台资讯源自动抓取、AI 智能内容筛选去重、双语摘要生成、多渠道一键推送全链路能力。

项目核心解决互联网资讯信息碎片化、冗余信息过多、优质内容筛选成本高的痛点,无需人工逐平台浏览,即可自动聚合全网科技、开源、行业热点资讯,依托大模型完成内容打分、降噪、提炼总结,最终生成标准化可读简报,并支持自动化定时运行与多平台分发,是个人开发者、行业从业者、资讯爱好者专属的全自动 AI 资讯管家

项目采用 MIT 开源协议,支持本地部署、Docker 容器部署、GitHub Actions 云端定时部署三种运行模式,兼容主流大模型接口,配置简单、低代码门槛,普通用户也可快速搭建专属私人资讯订阅系统。

二、功能特色

1. 多源资讯全覆盖抓取

  • 主流技术社区:Hacker News、Reddit 细分板块、GitHub 项目动态与版本发布

  • 通用资讯渠道:标准 RSS 订阅源、Telegram 频道、Twitter/X 社交平台

  • 支持自定义添加私有 RSS 源、第三方资讯接口,扩展性极强

2. AI 智能内容处理核心能力

  • 智能评分过滤:内置 0-10 分内容打分机制,自动筛选高价值资讯,过滤低质、营销、重复内容

  • 全自动去重降噪:跨平台识别相似资讯,合并同源内容,避免信息冗余

  • 多维度内容加工:自动补充事件背景知识、汇总社区网友评论与观点

  • 双语结构化生成:一键生成中文+英文双语资讯简报,格式规整可读性强

  • 全模型兼容:适配 GPT、Claude、Gemini、DeepSeek、豆包等主流大模型 API 接口

3. 多格式输出与全渠道推送

  • 原生生成 Markdown 格式资讯日报,适配笔记、文档归档场景

  • 支持自动部署发布至 GitHub Pages,生成在线可访问资讯页面

  • 邮件订阅推送:兼容 SMTP/IMAP 协议,定时发送资讯简报至邮箱

  • 办公社群适配:飞书、钉钉、Slack、Discord 官方机器人推送

  • 自定义 Webhook:可对接自有系统、个人公众号、第三方推送平台

  • 内置 MCP 服务,支持第三方 AI 助手调用 Horizon 资讯处理流程

4. 极简部署与自动化运维

  • 提供 uv / pip 两种依赖管理方式,本地环境快速搭建

  • 完整 Docker 及 docker-compose 容器化方案,开箱即用无需配置环境

  • 内置交互式配置向导,可视化完成资讯源、模型接口、推送规则设置

  • 深度适配 GitHub Actions,配置定时任务实现每日自动抓取、处理、推送,全程无人值守

Horizon:开源AI新闻资讯聚合智能雷达,全自动抓取筛选双语推送

三、技术细节

1. 基础技术栈

  • 开发语言:Python 3.10+,语法简洁生态丰富,适配各类爬虫与 AI 接口开发

  • 依赖管理:优先采用 uv 高性能依赖工具,替代传统 pip,安装速度快、环境隔离干净;兼容 pip 常规安装方式

  • 部署容器:Docker + docker-compose,标准化容器打包,跨 Windows / Mac / Linux 无缝运行

  • 配置文件:采用 JSON / .env 配置文件格式,结构化管理接口密钥、资讯源、推送参数,易修改易备份

2. 核心模块架构

  1. 爬虫采集模块
    异步并发爬虫架构,支持多源并行抓取,限制请求频率避免封禁,内置反爬基础适配,兼容动态页面与静态 RSS 源解析。

  2. AI 调度模块
    统一大模型接口封装,适配多家模型请求格式,内置请求重试、超时处理、令牌限流机制,保障内容生成稳定性。

  3. 内容处理模块
    文本相似度算法实现跨平台去重,自定义评分规则引擎,搭配大模型语义理解完成内容提炼、背景补充、双语翻译。

  4. 输出分发模块
    Markdown 模板引擎自动排版,集成各类社群机器人、邮件协议、Webhook 通用请求封装,一键多渠道同步推送。

  5. 自动化调度模块
    兼容本地定时任务、GitHub Actions 云端定时,支持自定义执行周期(每日/每半日/每周)。

3. 项目运行核心命令

# 克隆项目源码
git clone https://github.com/Thysrael/Horizon.git
cd Horizon

# uv 环境安装依赖
uv sync

# 启动运行项目
uv run horizon
# Docker 部署启动
docker-compose up -d

4. 项目优势技术特性

  • 低资源占用:轻量化设计,低配服务器、个人电脑均可稳定运行

  • 模块化解耦:采集、AI、处理、推送模块相互独立,可单独二次开发改造

  • 隐私本地化:所有资讯采集与处理在本地/私有服务器完成,无需第三方中转,保护订阅源隐私

  • 可定制化程度高:支持自定义评分规则、简报模板、推送文案,满足个性化需求

四、应用场景

  1. 开发者技术资讯订阅
    自动聚合 GitHub 开源项目动态、Hacker News 技术热点、行业 RSS 博客,每日生成技术简报,省去逐平台刷资讯时间。

  2. 行业从业者热点监控
    互联网、人工智能、跨境、金融等行业人员,自定义添加行业资讯源,AI 筛选高价值行业动态,及时掌握赛道趋势。

  3. 个人知识归档与日报
    自动生成 Markdown 资讯日报,归档至本地或 GitHub Pages,搭建个人专属知识库,长期沉淀行业信息。

  4. 社群/团队资讯同步
    配置飞书、钉钉、Discord 推送,每日自动向团队社群推送精选资讯,统一团队信息获取渠道。

  5. 自媒体内容素材采集
    自媒体创作者利用多源抓取+AI 摘要,快速获取热点事件原文与观点,降低素材整理和文案创作成本。

  6. 私人定制资讯订阅
    屏蔽营销软文、低质八卦,仅保留高评分优质内容,打造无广告、无冗余的纯净资讯阅读体验。

五、使用方法

1. 前置准备

  • 准备任意一款主流大模型 API 密钥(DeepSeek、GPT、Gemini 等均可)

  • 本地安装 Git、Python3.10+ 或 Docker 环境

  • 准备推送渠道配置(邮箱 SMTP、飞书/钉钉机器人 Webhook 可选)

2. 源码部署步骤

  1. 克隆项目仓库到本地

git clone https://github.com/Thysrael/Horizon.git
cd Horizon
  1. 安装项目依赖
    优先使用 uv:

uv sync

无 uv 环境可使用 pip:

pip install -r requirements.txt
  1. 初始化配置
    复制默认配置文件,编辑 .envconfig.json,填入大模型 API 地址、密钥、资讯源列表、推送渠道参数

  2. 启动运行

uv run horizon

按照交互式向导完成基础设置,即可手动执行首次资讯采集与生成。

3. Docker 部署步骤

  1. 克隆项目后,修改 .env 配置文件,填入模型密钥、资讯源、推送信息

  2. 执行容器后台启动

docker-compose up -d
  1. 容器自动完成依赖安装与初始化,无需额外配置环境。

4. 自动化定时配置

进入项目 .github/workflows 配置 GitHub Actions 定时任务,设置每日固定时间自动运行,实现无人值守全自动资讯更新与推送

六、竞品对比

选取 3 款同类型 AI 资讯聚合工具进行横向对比,从部署方式、模型兼容、推送渠道、本地化、自定义能力多维度对比:

对比维度 Horizon NewsAI Aggregator RSS AI Reader
开源属性 完全开源 MIT 协议 部分开源,核心模块闭源 免费开源,功能精简
部署方式 本地 / Docker / GitHub Actions 仅云端网页部署 本地部署为主,无容器方案
大模型兼容性 兼容全品类主流大模型 仅内置自有模型,不支持第三方 API 仅适配 OpenAI 系列
资讯源支持 GitHub、HN、Reddit、RSS、社交平台 仅 RSS 通用源 只支持标准 RSS 订阅
多渠道推送 邮件/飞书/钉钉/Discord/Webhook 仅邮件与站内推送 仅邮件推送
本地化隐私 全流程本地处理,隐私性强 云端处理,数据上传第三方 本地处理,无额外云端依赖
自定义程度 自定义评分、模板、资讯源 固定模板,无自定义规则 仅可添加 RSS 源,无规则定制

对比总结:Horizon 在部署灵活性、模型兼容性、资讯源广度、推送渠道丰富度上优势明显,同时保持完全开源和本地化隐私,兼顾个人自用与二次开发;竞品多存在模型受限、部署单一、功能固化的问题,而 Horizon 更适合技术用户、团队私有化部署与个性化定制场景。

七、常见问题解答

Q:部署 Horizon 必须使用 uv 工具吗?

A:不是必须,uv 只是项目推荐的高性能依赖管理工具,若未安装 uv,可直接使用传统 pip 安装 requirements.txt 依赖,不影响项目正常运行。

Q:支持本地私有化部署不联网使用吗?

A:基础资讯抓取需要联网获取源内容,AI 摘要生成依赖大模型 API 联网请求;若使用本地私有大模型部署接口,可实现全程内网私有化运行。

Q:可以自定义添加非官方小众 RSS 资讯源吗?

A:完全支持,在配置文件中按照格式添加自定义 RSS 链接即可,系统会自动解析抓取并纳入 AI 筛选流程。

Q:生成的双语简报可以修改排版样式吗?

A:支持,项目内置 Markdown 模板文件,用户可自行修改模板布局、文案格式、字段展示逻辑,自定义专属简报样式。

Q:GitHub Actions 定时部署会不会有运行时长限制?

A:GitHub 免费版 Actions 有每月免费时长额度,日常每日一次资讯采集完全够用,额度耗尽可切换本地服务器定时任务替代。

Q:支持 Windows 系统本地运行吗?

A:支持,Windows 安装 Python3.10+、Git 环境后,按照常规源码部署步骤即可正常运行,也可直接使用 Docker Desktop 容器部署,适配性良好。

Q:更换大模型需要修改大量代码吗?

A:不需要,项目已做模型接口统一封装,仅需在配置文件中修改模型接口地址、密钥、模型名称即可,零代码修改切换 AI 模型。

八、相关链接

九、总结

Horizon 作为一款开源 AI 新闻资讯聚合智能雷达工具,依托成熟的 Python 技术架构,整合了多源资讯抓取、大模型智能筛选降噪、双语简报生成、多渠道自动化推送核心能力,同时提供本地、Docker、GitHub Actions 多种部署方案,适配普通用户、开发者、企业团队等不同使用人群。项目兼具轻量化、高兼容性、强自定义与隐私本地化优势,相较于同类资讯聚合工具,在资讯源覆盖、模型适配、推送生态和二次开发空间上表现更为突出,无需复杂技术门槛即可搭建专属全自动资讯订阅系统,能够有效帮助用户降低信息筛选成本,高效沉淀行业与技术优质内容。

打赏
THE END
作者头像
97ai
我不是在训练模型,而是在与未来的自己对话。