词
历GitHub
GitHub 是代码托管平台
- datasette 1.0a30
- datasette-agent 0.1a4
- 引用 Armin Ronacher
- BitCPM-CANN-1B
- BitCPM-CANN-3B
- BitCPM-CANN-8B
- BitCPM-CANN-0.5B
- BitCPM-CANN-1B-gguf
- BitCPM-CANN-0.5B-gguf
- BitCPM-CANN-3B-gguf
- BitCPM-CANN-0.5B-unquantized
- BitCPM-CANN-1B-未量化
- BitCPM-CANN-3B-unquantized
- BitCPM-CANN-8B-gguf
- BitCPM-CANN-8B-未量化
- walkinglabs/learn-harness-engineering
- Nemotron-Labs 扩散语言模型实现光速级文本生成
- GitHub 连续第三年获评 Gartner® 企业 AI 编码代理魔力象限™ 领导者
- BitCPM4-CANN-0.5B-gguf
- BitCPM4-CANN-1B-gguf
- BitCPM4-CANN-3B-gguf
- BitCPM4-CANN-8B-gguf
- TransitLM:无地图公交路线生成的大规模数据集与基准
- Karpathy 的 CLAUDE.md 以 65 行规则将 AI 编码准确率从 65% 提升至 94%
- 微软因 token 计费成本过高取消 Claude Code 许可,Uber 四个月烧光 2026 年 AI 预算
- MagenticLite、MagenticBrain、Fara1.5:为小模型优化的智能体体验
- datasette-agent 0.1a2
- datasette-agent-charts 0.1a1
- datasette-agent 0.1a3
- 用一条 curl 命令调用 Gemini API 构建 GitHub Issue 分类 Agent
- Vega:AI时代数字身份的零知识证明
- 增强无训练无限帧生成以实现一致长视频
- 10 tokens每秒到底有多快?
- transformers v5.9.0
- ERNIE-Image-Aes
- vLLM x Novita AI:PegaFlow 实现生产级外部 KV 缓存
- vLLM 中的弹性专家并行
- Google 推出 Gemini API 托管代理,支持代码执行与网页浏览
- 推出带 Modal 沙箱的 Claude 托管 Agent
- 发现可对抗肝纤维化的老药新用
- 让内容创建与编辑过程更易理解
- 开辟衰老研究新路径
- 整合生物工具包,探索ALS新疗法
- 发现新型传染病背后的分子开关
- 加速发现肝病机制
- 快速追踪遗传线索逆转细胞衰老
- OlmoEarth v1.1:更高效的模型系列
- OlmoEarth v1.1:更高效的模型系列 | Ai2
- 可扩展语音代理设计:Amazon Nova Sonic 的多代理、工具与会话分割
- 推出 Ettin Reranker 系列
- AgriciDaniel/claude-obsidian
- Import AI 457:AI 震网;诅咒的 Muon 优化器;与正向对齐
- 五分钟看懂LLM过去六个月
- 使用 LoRA/DoRA 微调 NVIDIA Cosmos Predict 2.5 生成机器人视频
- PaddleOCR 3.5:使用 Transformers 后端运行 OCR 与文档解析任务
- 将本地 GitHub 会话带到任何地方
- 开放Agent排行榜
- VeRL-Omni 发布:扩散与全模态模型的简易、快速、稳定 RL 训练
- BitCPM4-CANN-0.5B
- BitCPM4-CANN-1B
- BitCPM4-CANN-3B
- BitCPM4-CANN-0.5B-未量化
- BitCPM4-CANN-1B-未量化
- BitCPM4-CANN-3B-未量化
- BitCPM4-CANN-8B-未量化
- BitCPM4-CANN-8B
- CiteVQA:面向可信文档智能的证据归因基准测试
- Imbad0202/学术研究技能
- AISI 高级 AI 评估:五月更新
- neilsonnn/image-blaster
- sglang v0.5.12
- 第四次进展报告
- 评估前沿AI系统的早期经验
- 新型评估与Agent脚手架赏金计划
- 发布 Inspect Evals
- datasette-llm-limits 0.1a0
- iNaturalist-clumper 0.1
- LLM 裁判受审:评估自动评分器的新统计框架
- RepliBench:衡量AI系统中的自主复制能力
- 如何评估AI agent的控制措施?
- Causal Forcing++:面向实时交互视频生成的可扩展少步自回归扩散蒸馏
- 构建通用无障碍代理——过程中的经验教训
- vllm v0.21.0
- HiBayES:用分层贝叶斯建模改进LLM评估
- Inspect Cyber:Agentic网络评估新标准
- esengine/DeepSeek-Reasonix
- op7418/guizang-ppt-skill
- Intern-S2-Preview
- Intern-S2-Preview-FP8
- Inspect 沙箱工具包:可扩展且安全的 AI agent 评估
- 管理日益强大的开放权重AI系统的风险
- 压力测试AI编码代理的异步监控
- 智能体异步大规模协作研究:GitHub 分支模式原型设计
- Granite Embedding Multilingual R2:Apache 2.0 开源多语言嵌入,32K 上下文 — 最佳 Sub-100M 检索质量
- Stream Vision Agents 与 Amazon Nova 2 Sonic 实时语音代理
- Qwen3-TTS:低成本、高性能文本转语音
- 解锁连续批处理中的异步性
- vLLM x Mooncake 规模化服务 Agent 工作负载
- vLLM 登顶 Artificial Analysis 排行榜
- AI与工作的未来:衡量AI驱动的工作任务生产力提升
- AI Agent 如何使用?来自 17.7 万 AI Agent 工具的证据
- 我们的2025年度回顾
- mimalloc:面向现代的高性能可扩展内存分配器
- GridSFM:一种新型小型电网基础模型
- 欢迎来到 Datasette 博客
- 使用Inspect Scout进行转录分析的工作流
- AI agent 能逃出沙箱吗?容器逃逸能力安全基准测试
- 使用 Amazon Nova Sonic 和 WebRTC 构建实时语音流应用
- 我们如何使用 Sourcegraph 和 Slack 机器人快速检测漏洞并响应
- AIMIP 发布:AI 天气与气候模型比对项目 | Ai2
- 红队测试Anthropic内部Agent监控系统
- Anthropic 风险报告(2026年2月)中“自动化研发风险”章节评述
- CSP 允许列表实验
- 参数高尔夫教给我们的AI辅助研究经验
- 地牢与桌面:用 GitHub Copilot CLI 构建程序化生成 Roguelike
- 如何实现真正的无服务器GPU
- 开发者不满CapCut锁功能并训练AI,开源克隆OpenCut获4.58万星标
- 开发者用22,000小时在Claude Code上构建个人AI操作系统并开源
- TanStack npm 攻击细节:攻击者通过 PR 窃取 CI 令牌植入缓存,致 84 个恶意包版本发布
- npm 供应链攻击:42 个 TanStack 包被植入死亡开关,恶意版本获有效签名
- sglang v0.5.11
- transformers v5.6.2
- transformers v5.8.0
- transformers v5.7.0
- 解读今日开放-封闭性能差距
- Import AI 455:AI系统即将开始自我构建
- SocialReasoning-Bench:衡量AI智能体是否以用户最佳利益行事
- AWS 上基础模型训练与推理的构建模块
- vLLM 登顶 Artificial Analysis 排行榜
- MiniCPM-V-4.6-gguf
- 用 Amazon Nova 多模态嵌入实现制造智能
- MiniCPM-V-4.6-Thinking-gguf
- MiniCPM-V-4.6-Thinking
- MiniCPM-V-4.6-AWQ
- MiniCPM-V-4.6-BNB
- MiniCPM-V-4.6-GPTQ
- MiniCPM-V-4.6-Thinking-AWQ
- MiniCPM-V-4.6-Thinking-GPTQ
- MiniCPM-V-4.6-Thinking-BNB
- MACE-Dance:用于音乐驱动舞蹈视频生成的运动-外观级联专家
- MachinaCheck:基于 AMD MI300X 构建 Multi-Agent CNC 可制造性系统
- open-multi-agent/open-multi-agent
- OncoAgent:用于隐私保护肿瘤学临床决策支持的双层 Multi-Agent 框架
- Claude Code 团队成员分享用 HTML 替代 Markdown 的场景
- Claude Code 源码快照泄露,展示 repo context 与 subagent 设计
- 提出两种 MCP servers 使用模式以避免 context 膨胀
- 部署并推理 HuggingFace 上的任意模型
- Harness 是一切:如何优化你的 Harness
- 用一个 Python 字典将多模态推理性能提升 >10%
- 在 Modal 上构建 RL 定理证明工作流
- 自动扩缩 Autoresearch:在 Modal 上为你的 agents 提供弹性 GPU
- 用 Modal 和 OpenAI Agents SDK 构建
- Butter 加入 Modal
- 如何在 AI Agents 中正确使用 MCP servers
- Agent 如何管理其他 Agent:2026 年四种 Subagent 模式
- 立即报名 OpenClaw: After Hours @ GitHub
- Agent pull request 无处不在,如何 review 它们
- 当“正确”并非确定性时验证 agentic 行为
- 面向初学者的 GitHub Copilot CLI:交互模式与非交互模式
- 提升 GitHub Agentic Workflows 中的 token 效率
- Narcooo/inkos
- 大规模构建真实输电网数据集:基于开放数据集的流程
- CyberSecQwen-4B:为什么防御性网络安全需要小型、专用、可本地运行的模型
- EMO:为涌现模块化预训练 Mixture of Experts | Ai2
- EMO:为涌现模块化预训练混合专家
- MiniCPM-V-4_5-GPTQ
- MedQA:在 AMD ROCm 上微调临床 AI,无需 CUDA
- Arthur-Ficial/apfel
- holaboss-ai/holaOS
- nidhinjs/prompt-master
- rohitg00/从零开始的 AI 工程
- wanshuiyin/睡眠中自动 Claude Code 研究
- 克服奖励信号挑战:在 SageMaker AI 上使用 GRPO 进行基于可验证奖励的强化学习
- 用 GPT-5.5 和 GPT-5.5-Cyber 扩展网络安全可信访问
- 自然语言 Autoencoders
- 捐赠我们的开源对齐工具
- llm-gemini 0.31
- 大词
- GitHub Repo 统计
- 通过 API 中的新模型推进语音智能
- AlphaEvolve:我们的 Gemini 驱动 coding agent 如何在各领域扩大影响
- SciCore-Mol
- LLM 蒸馏 Ch08 Notebook 在 GitHub 发布
- 作者以 gist 分享可由 agent 构建的 LLM wiki 想法
- 提出两种 MCP servers 使用模式以避免臃肿
- HERMES++:迈向用于 3D 场景理解与生成的统一驾驶世界模型
- ConardLi/garden-skills
- EKKOLearnAI/hermes-web-ui
- HKUDS/Vibe-Trading
- JackChen-me/open-multi-agent
- nesquena/hermes-webui
- 用 vLLM x Mooncake 大规模服务 Agentic 工作负载
- vLLM V0 到 V1:RL 中纠错前先确保正确性
- Vibe coding 和 agentic engineering 比我希望的更接近了
- ESARBench:用于 Agentic UAV 具身搜索与救援的 Benchmark
- 为 Open ASR Leaderboard 添加 Benchmaxxer Repellant
- 证据链:用于迭代式 RAG 的像素级视觉归因
- SplAttN:用 Gaussian Soft Splatting 和 Attention 连接 2D 与 3D 以实现点云补全
- 基于编排轨迹的 LLM multi-agent 系统强化学习
- 超越 SFT-to-RL:通过 Black-Box On-Policy Distillation 进行多模态 RL 的预对齐
- llm-echo 0.5a0
- datasette-llm 0.1a7
- BlenderRAG:通过检索增强代码合成实现高保真 3D 对象生成
- GPT-5.5 Instant:更智能、更清晰、更个性化
- GPT-5.5 Instant 系统卡
- 用于跨文档 RAG 的层次化摘要树
- 用于高效自回归视频生成的运动感知缓存
- AcademiClaw:当学生为 AI agent 设定挑战
- T^2PO:用于稳定多轮 Agentic 强化学习的不确定性引导探索控制
- ComboStoc:用于 Diffusion 生成模型的组合随机性
- 更好的模型,更快的训练:用于单细胞基础模型的 Sigmoid Attention
- Web2BigTable:用于互联网规模信息搜索与抽取的双层多 agent LLM 系统
- UniVidX:基于 Diffusion Priors 的通用视频生成统一多模态框架
- Vibe 中的远程 agent,由 Mistral Medium 3.5 驱动
- Qwen3.6-27B-FP8
- Qwen3.6-27B
- 用于编排的开源规范:Symphony
- Claude Code 最佳实践 - Claude Code 文档
- vLLM 中的 DeepSeek V4:高效长上下文 Attention
- 揭秘 AI agents 的 evals
- 介绍 GPT-5.5
- vLLM 中 FP8 KV-Cache 与 Attention 量化的现状
- NVIDIA Nemotron 3 Nano Omni:面向文档、音频和视频 agent 的长上下文多模态智能
- deepseek-ai/DeepSeek-V4-Pro
- vLLM 中混合 SSM 模型的分离式 Serving
- deepseek-ai/DeepSeek-V4-Flash
- 用 vLLM 运行基于 NVIDIA Nemotron 3 Nano Omni 的高效多模态 agentic AI
- 面向 LLM 的大规模交互识别
- Coding Agent 的组成部分
- SWE-Check:Bug 检测快 10 倍
- Bugbot 学习规则与 MCP 支持
- 对agent网络进行红队测试:理解AI agent大规模交互时会出什么问题
- iNaturalist 目击记录
- FlashRT:面向 Prompt Injection 和 Knowledge Corruption 的计算与内存高效 Red-Teaming
- 从噪声偏好中学习:一种面向 Direct Preference Optimization 的半监督学习方法
- 阿拉伯语及其方言的指令引导诗歌生成
- World2Minecraft:占用驱动的模拟场景构建
- MoCapAnything V2:面向任意骨架的端到端动作捕捉
- Length Value Model:面向 Token 级长度建模的可扩展 Value 预训练
- 近期 Claude Code 质量报告更新
- 近期三个问题的复盘
- Claude Developer Platform 推出高级工具使用
- Claude Desktop Extensions:为 Claude Desktop 一键安装 MCP server
- 用 Agent Skills 让 agent 适应真实世界
- 用 sandboxing 让 Claude Code 更安全、更自主
- 使用 MCP 执行代码:构建更高效的 AI agents
- Claude Opus 4.6 在 BrowseComp 表现中的 eval awareness
- Claude Code auto 模式:更安全地跳过权限确认
- RADIO-ViPE:面向动态环境中开放词汇语义 SLAM 的在线紧耦合多模态融合
- LLM 通过 Latent Distilling 进行探索
- ClawGym:用于构建有效 Claw agent 的可扩展框架