编辑
2025-03-15
AI News
00
请注意,本文编写于 126 天前,最后修改于 126 天前,其中某些信息可能已经过时。

目录

AI Repos
AI News

AI Repos

1、deep-searcher
在私有数据上进行智能搜索和分析的工具,可用于企业知识管理、智能问答系统和信息检索等场景。支持Milvus等向量数据库,支持数据分区以提高检索效率。支持DeepSeek、OpenAI和其他LLM和嵌入模型。返回搜索结果,并生成包括相关文档的摘要、关键信息提取等信息的报告。 deep-searcher.png

2、chitu
清华团队刚刚放出了模型推理引擎:赤兔Chitu,DeepSeek推理成本降一半,性能翻番。在A800 集群上,用赤兔引擎部署DeepSeek-671B满血版推理服务,比vLLM部署方案,GPU数量不仅减少了50%,输出速度提升了3.15倍。支持NVIDIA最新旗舰到旧款的多系列产品,也支持国产芯片优化。 纯CPU部署、单GPU部署、大规模集群部署,都提供可扩展的解决方案。可应用于实际生产环境,稳定性可承载并发业务流量。 chitu.png

3、tools
国外一名 Simon 开发者,几乎全靠 AI 的帮助下构建的这套实用的 HTML + JavaScript 工具集,同时 Simon 详细记录了其如何利用 LLM 快速构建这些小工具的过程。 tools.png

4、llm-engineer-toolkit
一份专为 LLM 工程师精心整理的资源工具集,包含 120+ 个按类别分类的 LLM 相关工具,涵盖了从训练微调、应用开发、推理服务到安全评估等 LLM 开发全流程所需的工具。对于刚接触 LLM 开发或需寻找特定工具的开发者来说,这份工具清单,值得收藏。 llm-engineer-toolkit.png

5、Scrapegraph-ai
ScrapeGraphAI 是一个网络爬虫 Python 库,使用大型语言模型和直接图逻辑为网站和本地文档(XML,HTML,JSON 等)创建爬取管道。只需告诉库您想提取哪些信息,它将为您完成! Scrapegraph-ai.png

AI News

1、OLMo 2 32B开源模型超越GPT-3.5与GPT-4o Mini
OLMo 2 32B作为首款全面开源且性能超GPT-3.5和GPT-4o Mini的模型,公开了训练数据、代码、权重及指导,助推AI研究创新。其高效训练结合高质量数据与RLVR技术,成本仅为Qwen 2.5 32B的三分之一,却表现卓越。采用OLMo-core框架并在谷歌云Augusta超算上优化,展现训练效率与硬件适配性。此模型不仅技术突破,更通过透明性树立协作标杆,预示AI未来更开放、高效与影响深远。

2、港大90后开源AI-Researcher,打造博士级科研智能体
香港大学数据科学研究院三位90后研究者推出开源AI-Researcher框架,基于Claude-3.5-sonnet模型,兼容DeepSeek等生态,实现从文献检索到论文撰写的科研全流程自动化。该系统经大规模优化,在图像生成、压缩及生成式建模领域产出顶会级成果,打破OpenAI高价壁垒(2万美元/月),为科研人员提供低成本、高效工具,助推科研智能化发展。

如果对你有用的话,可以打赏哦
打赏
ali pay
wechat pay

本文作者:junglehxj

本文链接:

版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!