实録译稿 社区 24h

术语频次

封存归档

GitHub

▃█▆▅ · 1511 次 · 收录于 251 篇

GitHub 是代码托管平台

  1. datasette 1.0a30 工程 · Simon Willison · 05-25
  2. datasette-agent 0.1a4 工程 · Simon Willison · 05-25
  3. 引用 Armin Ronacher 工程 · Simon Willison · 05-25
  4. BitCPM-CANN-1B 工程 · OpenBMB · 05-24
  5. BitCPM-CANN-3B 工程 · OpenBMB · 05-24
  6. BitCPM-CANN-8B 研究 · OpenBMB · 05-24
  7. BitCPM-CANN-0.5B 工程 · OpenBMB · 05-24
  8. BitCPM-CANN-1B-gguf 研究 · OpenBMB · 05-24
  9. BitCPM-CANN-0.5B-gguf 研究 · OpenBMB · 05-24
  10. BitCPM-CANN-3B-gguf 研究 · OpenBMB · 05-24
  11. BitCPM-CANN-0.5B-unquantized 工程 · OpenBMB · 05-24
  12. BitCPM-CANN-1B-未量化 工程 · OpenBMB · 05-24
  13. BitCPM-CANN-3B-unquantized 工程 · OpenBMB · 05-24
  14. BitCPM-CANN-8B-gguf 研究 · OpenBMB · 05-24
  15. BitCPM-CANN-8B-未量化 工程 · OpenBMB · 05-24
  16. walkinglabs/learn-harness-engineering 工程 · GitHub · 05-23
  17. Nemotron-Labs 扩散语言模型实现光速级文本生成 产品 · HF Blog · 05-23
  18. GitHub 连续第三年获评 Gartner® 企业 AI 编码代理魔力象限™ 领导者 产品 · GitHub AI/ML · 05-23
  19. BitCPM4-CANN-0.5B-gguf 研究 · OpenBMB · 05-22
  20. BitCPM4-CANN-1B-gguf 研究 · OpenBMB · 05-22
  21. BitCPM4-CANN-3B-gguf 研究 · OpenBMB · 05-22
  22. BitCPM4-CANN-8B-gguf 研究 · OpenBMB · 05-22
  23. TransitLM:无地图公交路线生成的大规模数据集与基准 研究 · HF Papers · 05-22
  24. Karpathy 的 CLAUDE.md 以 65 行规则将 AI 编码准确率从 65% 提升至 94% 工程 · X Trending · 05-22
  25. 微软因 token 计费成本过高取消 Claude Code 许可,Uber 四个月烧光 2026 年 AI 预算 评测 · X Trending · 05-22
  26. MagenticLite、MagenticBrain、Fara1.5:为小模型优化的智能体体验 研究 · MS Research · 05-22
  27. datasette-agent 0.1a2 工程 · Simon Willison · 05-22
  28. datasette-agent-charts 0.1a1 工程 · Simon Willison · 05-22
  29. datasette-agent 0.1a3 工程 · Simon Willison · 05-22
  30. 用一条 curl 命令调用 Gemini API 构建 GitHub Issue 分类 Agent 工程 · X · 05-22
  31. Vega:AI时代数字身份的零知识证明 研究 · MS Research · 05-22
  32. 增强无训练无限帧生成以实现一致长视频 研究 · HF Papers · 05-21
  33. 10 tokens每秒到底有多快? 工程 · Simon Willison · 05-21
  34. transformers v5.9.0 工程 · GitHub Release · 05-20
  35. ERNIE-Image-Aes 研究 · Baidu · 05-20
  36. vLLM x Novita AI:PegaFlow 实现生产级外部 KV 缓存 工程 · vLLM · 05-20
  37. vLLM 中的弹性专家并行 工程 · vLLM · 05-20
  38. Google 推出 Gemini API 托管代理,支持代码执行与网页浏览 产品 · X · 05-20
  39. 推出带 Modal 沙箱的 Claude 托管 Agent 产品 · Modal · 05-20
  40. 发现可对抗肝纤维化的老药新用 研究 · DeepMind · 05-20
  41. 让内容创建与编辑过程更易理解 产品 · DeepMind · 05-20
  42. 开辟衰老研究新路径 研究 · DeepMind · 05-20
  43. 整合生物工具包,探索ALS新疗法 研究 · DeepMind · 05-20
  44. 发现新型传染病背后的分子开关 研究 · DeepMind · 05-20
  45. 加速发现肝病机制 研究 · DeepMind · 05-20
  46. 快速追踪遗传线索逆转细胞衰老 研究 · DeepMind · 05-20
  47. OlmoEarth v1.1:更高效的模型系列 产品 · HF Blog · 05-20
  48. OlmoEarth v1.1:更高效的模型系列 | Ai2 产品 · Allen AI · 05-20
  49. 可扩展语音代理设计:Amazon Nova Sonic 的多代理、工具与会话分割 工程 · AWS ML · 05-20
  50. 推出 Ettin Reranker 系列 产品 · HF Blog · 05-19
  51. AgriciDaniel/claude-obsidian 工程 · GitHub · 05-19
  52. Import AI 457:AI 震网;诅咒的 Muon 优化器;与正向对齐 研究 · Import AI · 05-19
  53. 五分钟看懂LLM过去六个月 评测 · Simon Willison · 05-19
  54. 使用 LoRA/DoRA 微调 NVIDIA Cosmos Predict 2.5 生成机器人视频 工程 · HF Blog · 05-19
  55. PaddleOCR 3.5:使用 Transformers 后端运行 OCR 与文档解析任务 工程 · HF Blog · 05-19
  56. 将本地 GitHub 会话带到任何地方 产品 · GitHub AI/ML · 05-19
  57. 开放Agent排行榜 评测 · HF Blog · 05-18
  58. VeRL-Omni 发布:扩散与全模态模型的简易、快速、稳定 RL 训练 工程 · vLLM · 05-18
  59. BitCPM4-CANN-0.5B 工程 · OpenBMB · 05-18
  60. BitCPM4-CANN-1B 工程 · OpenBMB · 05-18
  61. BitCPM4-CANN-3B 工程 · OpenBMB · 05-18
  62. BitCPM4-CANN-0.5B-未量化 产品 · OpenBMB · 05-18
  63. BitCPM4-CANN-1B-未量化 产品 · OpenBMB · 05-18
  64. BitCPM4-CANN-3B-未量化 工程 · OpenBMB · 05-18
  65. BitCPM4-CANN-8B-未量化 工程 · OpenBMB · 05-18
  66. BitCPM4-CANN-8B 研究 · OpenBMB · 05-18
  67. CiteVQA:面向可信文档智能的证据归因基准测试 研究 · HF Papers · 05-18
  68. Imbad0202/学术研究技能 工程 · GitHub · 05-18
  69. AISI 高级 AI 评估:五月更新 评测 · UK AISI · 05-17
  70. neilsonnn/image-blaster 工程 · GitHub · 05-17
  71. sglang v0.5.12 工程 · GitHub Release · 05-17
  72. 第四次进展报告 评测 · UK AISI · 05-17
  73. 评估前沿AI系统的早期经验 评测 · UK AISI · 05-16
  74. 新型评估与Agent脚手架赏金计划 研究 · UK AISI · 05-16
  75. 发布 Inspect Evals 工程 · UK AISI · 05-16
  76. datasette-llm-limits 0.1a0 工程 · Simon Willison · 05-16
  77. iNaturalist-clumper 0.1 工程 · Simon Willison · 05-16
  78. LLM 裁判受审:评估自动评分器的新统计框架 研究 · UK AISI · 05-16
  79. RepliBench:衡量AI系统中的自主复制能力 研究 · UK AISI · 05-16
  80. 如何评估AI agent的控制措施? 研究 · UK AISI · 05-16
  81. Causal Forcing++:面向实时交互视频生成的可扩展少步自回归扩散蒸馏 研究 · HF Papers · 05-16
  82. 构建通用无障碍代理——过程中的经验教训 工程 · GitHub AI/ML · 05-16
  83. vllm v0.21.0 工程 · GitHub Release · 05-15
  84. HiBayES:用分层贝叶斯建模改进LLM评估 研究 · UK AISI · 05-15
  85. Inspect Cyber:Agentic网络评估新标准 工程 · UK AISI · 05-15
  86. esengine/DeepSeek-Reasonix 工程 · GitHub · 05-15
  87. op7418/guizang-ppt-skill 工程 · GitHub · 05-15
  88. Intern-S2-Preview 研究 · InternLM · 05-15
  89. Intern-S2-Preview-FP8 研究 · InternLM · 05-15
  90. Inspect 沙箱工具包:可扩展且安全的 AI agent 评估 工程 · UK AISI · 05-15
  91. 管理日益强大的开放权重AI系统的风险 研究 · UK AISI · 05-15
  92. 压力测试AI编码代理的异步监控 研究 · UK AISI · 05-15
  93. 智能体异步大规模协作研究:GitHub 分支模式原型设计 研究 · X · 05-15
  94. Granite Embedding Multilingual R2:Apache 2.0 开源多语言嵌入,32K 上下文 — 最佳 Sub-100M 检索质量 产品 · HF Blog · 05-15
  95. Stream Vision Agents 与 Amazon Nova 2 Sonic 实时语音代理 工程 · AWS ML · 05-15
  96. Qwen3-TTS:低成本、高性能文本转语音 工程 · Baseten · 05-15
  97. 解锁连续批处理中的异步性 工程 · HF Blog · 05-15
  98. vLLM x Mooncake 规模化服务 Agent 工作负载 工程 · vLLM · 05-15
  99. vLLM 登顶 Artificial Analysis 排行榜 工程 · vLLM · 05-15
  100. AI与工作的未来:衡量AI驱动的工作任务生产力提升 研究 · UK AISI · 05-14
  101. AI Agent 如何使用?来自 17.7 万 AI Agent 工具的证据 研究 · UK AISI · 05-14
  102. 我们的2025年度回顾 评测 · UK AISI · 05-14
  103. mimalloc:面向现代的高性能可扩展内存分配器 工程 · MS Research · 05-14
  104. GridSFM:一种新型小型电网基础模型 研究 · MS Research · 05-14
  105. 欢迎来到 Datasette 博客 工程 · Simon Willison · 05-14
  106. 使用Inspect Scout进行转录分析的工作流 工程 · UK AISI · 05-14
  107. AI agent 能逃出沙箱吗?容器逃逸能力安全基准测试 研究 · UK AISI · 05-14
  108. 使用 Amazon Nova Sonic 和 WebRTC 构建实时语音流应用 工程 · AWS ML · 05-14
  109. 我们如何使用 Sourcegraph 和 Slack 机器人快速检测漏洞并响应 工程 · Sourcegraph · 05-14
  110. AIMIP 发布:AI 天气与气候模型比对项目 | Ai2 评测 · Allen AI · 05-14
  111. 红队测试Anthropic内部Agent监控系统 研究 · METR · 05-13
  112. Anthropic 风险报告(2026年2月)中“自动化研发风险”章节评述 评测 · METR · 05-13
  113. CSP 允许列表实验 工程 · Simon Willison · 05-13
  114. 参数高尔夫教给我们的AI辅助研究经验 产品 · OpenAI · 05-13
  115. 地牢与桌面:用 GitHub Copilot CLI 构建程序化生成 Roguelike 工程 · GitHub AI/ML · 05-12
  116. 如何实现真正的无服务器GPU 工程 · Modal · 05-12
  117. 开发者不满CapCut锁功能并训练AI,开源克隆OpenCut获4.58万星标 产品 · X Trending · 05-12
  118. 开发者用22,000小时在Claude Code上构建个人AI操作系统并开源 工程 · X Trending · 05-12
  119. TanStack npm 攻击细节:攻击者通过 PR 窃取 CI 令牌植入缓存,致 84 个恶意包版本发布 工程 · X Trending · 05-12
  120. npm 供应链攻击:42 个 TanStack 包被植入死亡开关,恶意版本获有效签名 研究 · X Trending · 05-12
  121. sglang v0.5.11 工程 · GitHub Release · 05-12
  122. transformers v5.6.2 工程 · GitHub Release · 05-12
  123. transformers v5.8.0 工程 · GitHub Release · 05-12
  124. transformers v5.7.0 工程 · GitHub Release · 05-12
  125. 解读今日开放-封闭性能差距 研究 · Interconnects · 05-12
  126. Import AI 455:AI系统即将开始自我构建 研究 · Import AI · 05-12
  127. SocialReasoning-Bench:衡量AI智能体是否以用户最佳利益行事 研究 · MS Research · 05-12
  128. AWS 上基础模型训练与推理的构建模块 工程 · HF Blog · 05-12
  129. vLLM 登顶 Artificial Analysis 排行榜 工程 · vLLM · 05-12
  130. MiniCPM-V-4.6-gguf 工程 · OpenBMB · 05-12
  131. 用 Amazon Nova 多模态嵌入实现制造智能 工程 · AWS ML · 05-12
  132. MiniCPM-V-4.6-Thinking-gguf 产品 · OpenBMB · 05-11
  133. MiniCPM-V-4.6-Thinking 产品 · OpenBMB · 05-11
  134. MiniCPM-V-4.6-AWQ 产品 · OpenBMB · 05-11
  135. MiniCPM-V-4.6-BNB 产品 · OpenBMB · 05-11
  136. MiniCPM-V-4.6-GPTQ 产品 · OpenBMB · 05-11
  137. MiniCPM-V-4.6-Thinking-AWQ 产品 · OpenBMB · 05-11
  138. MiniCPM-V-4.6-Thinking-GPTQ 产品 · OpenBMB · 05-11
  139. MiniCPM-V-4.6-Thinking-BNB 产品 · OpenBMB · 05-11
  140. MACE-Dance:用于音乐驱动舞蹈视频生成的运动-外观级联专家 研究 · HF Papers · 05-11
  141. MachinaCheck:基于 AMD MI300X 构建 Multi-Agent CNC 可制造性系统 工程 · HF Blog · 05-11
  142. open-multi-agent/open-multi-agent 工程 · GitHub · 05-10
  143. OncoAgent:用于隐私保护肿瘤学临床决策支持的双层 Multi-Agent 框架 研究 · HF Blog · 05-10
  144. Claude Code 团队成员分享用 HTML 替代 Markdown 的场景 工程 · X · 05-09
  145. Claude Code 源码快照泄露,展示 repo context 与 subagent 设计 工程 · X · 05-09
  146. 提出两种 MCP servers 使用模式以避免 context 膨胀 工程 · X · 05-09
  147. 部署并推理 HuggingFace 上的任意模型 工程 · Together AI · 05-09
  148. Harness 是一切:如何优化你的 Harness 工程 · Baseten · 05-09
  149. 用一个 Python 字典将多模态推理性能提升 >10% 工程 · Modal · 05-09
  150. 在 Modal 上构建 RL 定理证明工作流 工程 · Modal · 05-09
  151. 自动扩缩 Autoresearch:在 Modal 上为你的 agents 提供弹性 GPU 工程 · Modal · 05-09
  152. 用 Modal 和 OpenAI Agents SDK 构建 工程 · Modal · 05-09
  153. Butter 加入 Modal 产品 · Modal · 05-09
  154. 如何在 AI Agents 中正确使用 MCP servers 工程 · Phil Schmid · 05-09
  155. Agent 如何管理其他 Agent:2026 年四种 Subagent 模式 工程 · Phil Schmid · 05-09
  156. 立即报名 OpenClaw: After Hours @ GitHub 产品 · GitHub AI/ML · 05-09
  157. Agent pull request 无处不在,如何 review 它们 工程 · GitHub AI/ML · 05-09
  158. 当“正确”并非确定性时验证 agentic 行为 研究 · GitHub AI/ML · 05-09
  159. 面向初学者的 GitHub Copilot CLI:交互模式与非交互模式 工程 · GitHub AI/ML · 05-09
  160. 提升 GitHub Agentic Workflows 中的 token 效率 工程 · GitHub AI/ML · 05-09
  161. Narcooo/inkos 工程 · GitHub · 05-09
  162. 大规模构建真实输电网数据集:基于开放数据集的流程 研究 · MS Research · 05-09
  163. CyberSecQwen-4B:为什么防御性网络安全需要小型、专用、可本地运行的模型 产品 · HF Blog · 05-09
  164. EMO:为涌现模块化预训练 Mixture of Experts | Ai2 研究 · Allen AI · 05-09
  165. EMO:为涌现模块化预训练混合专家 研究 · HF Blog · 05-09
  166. MiniCPM-V-4_5-GPTQ 产品 · OpenBMB · 05-08
  167. MedQA:在 AMD ROCm 上微调临床 AI,无需 CUDA 工程 · HF Blog · 05-08
  168. Arthur-Ficial/apfel 工程 · GitHub · 05-08
  169. holaboss-ai/holaOS 工程 · GitHub · 05-08
  170. nidhinjs/prompt-master 工程 · GitHub · 05-08
  171. rohitg00/从零开始的 AI 工程 工程 · GitHub · 05-08
  172. wanshuiyin/睡眠中自动 Claude Code 研究 工程 · GitHub · 05-08
  173. 克服奖励信号挑战:在 SageMaker AI 上使用 GRPO 进行基于可验证奖励的强化学习 工程 · AWS ML · 05-08
  174. 用 GPT-5.5 和 GPT-5.5-Cyber 扩展网络安全可信访问 产品 · OpenAI · 05-08
  175. 自然语言 Autoencoders 研究 · Anthropic Research · 05-08
  176. 捐赠我们的开源对齐工具 工程 · Anthropic Research · 05-08
  177. llm-gemini 0.31 工程 · Simon Willison · 05-08
  178. 大词 工程 · Simon Willison · 05-08
  179. GitHub Repo 统计 工程 · Simon Willison · 05-08
  180. 通过 API 中的新模型推进语音智能 产品 · OpenAI · 05-08
  181. AlphaEvolve:我们的 Gemini 驱动 coding agent 如何在各领域扩大影响 研究 · DeepMind · 05-08
  182. SciCore-Mol 研究 · OpenBMB · 05-07
  183. LLM 蒸馏 Ch08 Notebook 在 GitHub 发布 工程 · X · 05-07
  184. 作者以 gist 分享可由 agent 构建的 LLM wiki 想法 工程 · X · 05-07
  185. 提出两种 MCP servers 使用模式以避免臃肿 工程 · X · 05-07
  186. HERMES++:迈向用于 3D 场景理解与生成的统一驾驶世界模型 研究 · HF Papers · 05-07
  187. ConardLi/garden-skills 工程 · GitHub · 05-07
  188. EKKOLearnAI/hermes-web-ui 工程 · GitHub · 05-07
  189. HKUDS/Vibe-Trading 工程 · GitHub · 05-07
  190. JackChen-me/open-multi-agent 工程 · GitHub · 05-07
  191. nesquena/hermes-webui 工程 · GitHub · 05-07
  192. 用 vLLM x Mooncake 大规模服务 Agentic 工作负载 工程 · vLLM · 05-07
  193. vLLM V0 到 V1:RL 中纠错前先确保正确性 工程 · HF Blog · 05-07
  194. Vibe coding 和 agentic engineering 比我希望的更接近了 对话 · Simon Willison · 05-06
  195. ESARBench:用于 Agentic UAV 具身搜索与救援的 Benchmark 研究 · HF Papers · 05-06
  196. 为 Open ASR Leaderboard 添加 Benchmaxxer Repellant 研究 · HF Blog · 05-06
  197. 证据链:用于迭代式 RAG 的像素级视觉归因 HF Papers · 05-06
  198. SplAttN:用 Gaussian Soft Splatting 和 Attention 连接 2D 与 3D 以实现点云补全 HF Papers · 05-06
  199. 基于编排轨迹的 LLM multi-agent 系统强化学习 HF Papers · 05-06
  200. 超越 SFT-to-RL:通过 Black-Box On-Policy Distillation 进行多模态 RL 的预对齐 HF Papers · 05-06
  201. llm-echo 0.5a0 工程 · Simon Willison · 05-06
  202. datasette-llm 0.1a7 工程 · Simon Willison · 05-06
  203. BlenderRAG:通过检索增强代码合成实现高保真 3D 对象生成 HF Papers · 05-06
  204. GPT-5.5 Instant:更智能、更清晰、更个性化 OpenAI · 05-06
  205. GPT-5.5 Instant 系统卡 OpenAI · 05-06
  206. 用于跨文档 RAG 的层次化摘要树 HF Papers · 05-05
  207. 用于高效自回归视频生成的运动感知缓存 HF Papers · 05-05
  208. AcademiClaw:当学生为 AI agent 设定挑战 HF Papers · 05-05
  209. T^2PO:用于稳定多轮 Agentic 强化学习的不确定性引导探索控制 HF Papers · 05-05
  210. ComboStoc:用于 Diffusion 生成模型的组合随机性 HF Papers · 05-05
  211. 更好的模型,更快的训练:用于单细胞基础模型的 Sigmoid Attention HF Papers · 05-05
  212. Web2BigTable:用于互联网规模信息搜索与抽取的双层多 agent LLM 系统 HF Papers · 05-04
  213. UniVidX:基于 Diffusion Priors 的通用视频生成统一多模态框架 HF Papers · 05-04
  214. Vibe 中的远程 agent,由 Mistral Medium 3.5 驱动 Mistral · 05-04
  215. Qwen3.6-27B-FP8 产品 · Qwen · 05-03
  216. Qwen3.6-27B 产品 · Qwen · 05-03
  217. 用于编排的开源规范:Symphony OpenAI · 05-03
  218. Claude Code 最佳实践 - Claude Code 文档 Anthropic Engineering · 05-03
  219. vLLM 中的 DeepSeek V4:高效长上下文 Attention vLLM · 05-03
  220. 揭秘 AI agents 的 evals Anthropic Engineering · 05-03
  221. 介绍 GPT-5.5 OpenAI · 05-03
  222. vLLM 中 FP8 KV-Cache 与 Attention 量化的现状 工程 · vLLM · 05-03
  223. NVIDIA Nemotron 3 Nano Omni:面向文档、音频和视频 agent 的长上下文多模态智能 HF Blog · 05-03
  224. deepseek-ai/DeepSeek-V4-Pro 产品 · DeepSeek · 05-03
  225. vLLM 中混合 SSM 模型的分离式 Serving vLLM · 05-03
  226. deepseek-ai/DeepSeek-V4-Flash 产品 · DeepSeek · 05-03
  227. 用 vLLM 运行基于 NVIDIA Nemotron 3 Nano Omni 的高效多模态 agentic AI vLLM · 05-03
  228. 面向 LLM 的大规模交互识别 BAIR · 05-03
  229. Coding Agent 的组成部分 Sebastian Raschka · 05-03
  230. SWE-Check:Bug 检测快 10 倍 Cognition · 05-03
  231. Bugbot 学习规则与 MCP 支持 Cursor · 05-03
  232. 对agent网络进行红队测试:理解AI agent大规模交互时会出什么问题 MS Research · 05-03
  233. iNaturalist 目击记录 Simon Willison · 05-03
  234. FlashRT:面向 Prompt Injection 和 Knowledge Corruption 的计算与内存高效 Red-Teaming HF Papers · 05-02
  235. 从噪声偏好中学习:一种面向 Direct Preference Optimization 的半监督学习方法 HF Papers · 05-02
  236. 阿拉伯语及其方言的指令引导诗歌生成 HF Papers · 05-02
  237. World2Minecraft:占用驱动的模拟场景构建 HF Papers · 05-01
  238. MoCapAnything V2:面向任意骨架的端到端动作捕捉 HF Papers · 05-01
  239. Length Value Model:面向 Token 级长度建模的可扩展 Value 预训练 HF Papers · 05-01
  240. 近期 Claude Code 质量报告更新 Anthropic Engineering · 05-01
  241. 近期三个问题的复盘 Anthropic Engineering · 05-01
  242. Claude Developer Platform 推出高级工具使用 Anthropic Engineering · 05-01
  243. Claude Desktop Extensions:为 Claude Desktop 一键安装 MCP server Anthropic Engineering · 05-01
  244. 用 Agent Skills 让 agent 适应真实世界 Anthropic Engineering · 05-01
  245. 用 sandboxing 让 Claude Code 更安全、更自主 Anthropic Engineering · 05-01
  246. 使用 MCP 执行代码:构建更高效的 AI agents Anthropic Engineering · 05-01
  247. Claude Opus 4.6 在 BrowseComp 表现中的 eval awareness Anthropic Engineering · 05-01
  248. Claude Code auto 模式:更安全地跳过权限确认 Anthropic Engineering · 05-01
  249. RADIO-ViPE:面向动态环境中开放词汇语义 SLAM 的在线紧耦合多模态融合 HF Papers · 05-01
  250. LLM 通过 Latent Distilling 进行探索 HF Papers · 04-30
  251. ClawGym:用于构建有效 Claw agent 的可扩展框架 HF Papers · 04-30