https://jina.ai/reader/

- 有一个免费的 API 可以实现 HTML 到 Markdown 的转换,但不完美,有些网站无法处理
- 该 API 并非完全无限制,免费使用有令牌限制,且不能用于商业目的
- 项目作者提供了一个 REST API,但需要通过 GitHub 注册获取 API 密钥
- 项目作者曾因未实施速率限制而遭受滥用,导致带宽费用激增
项目作者已将服务迁移到 VPS,并使用 Cloudflare 进行额外控制
项目作者建议结合他库与文章内容识别库使用,以提高转换质量
有人正在开发一个 API,可以基于文本流提取 HTML 页面的主要内容
- 该项目对于将网页数据输入 LLM 非常有用,因为 LLM 通常能很好地理解 Markdown
- 有人使用该项目的库将书签内容转换为 Markdown 存储,方便后续导入 Obsidian 等应用
- 有人建议可以结合嵌入式技术提高书签的搜索质量
- 有人提到 Elixir 社区也有类似的项目,但功能较为有限 Reader API
 
 
Back to Top