録实録译稿议社区 24h

词术语频次

历封存归档

GitHub

▃█▆▅ · 1511 次 · 收录于 251 篇

GitHub 是代码托管平台

datasette 1.0a30 工程 · Simon Willison · 05-25
datasette-agent 0.1a4 工程 · Simon Willison · 05-25
引用 Armin Ronacher 工程 · Simon Willison · 05-25
BitCPM-CANN-1B 工程 · OpenBMB · 05-24
BitCPM-CANN-3B 工程 · OpenBMB · 05-24
BitCPM-CANN-8B 研究 · OpenBMB · 05-24
BitCPM-CANN-0.5B 工程 · OpenBMB · 05-24
BitCPM-CANN-1B-gguf 研究 · OpenBMB · 05-24
BitCPM-CANN-0.5B-gguf 研究 · OpenBMB · 05-24
BitCPM-CANN-3B-gguf 研究 · OpenBMB · 05-24
BitCPM-CANN-0.5B-unquantized 工程 · OpenBMB · 05-24
BitCPM-CANN-1B-未量化工程 · OpenBMB · 05-24
BitCPM-CANN-3B-unquantized 工程 · OpenBMB · 05-24
BitCPM-CANN-8B-gguf 研究 · OpenBMB · 05-24
BitCPM-CANN-8B-未量化工程 · OpenBMB · 05-24
walkinglabs/learn-harness-engineering 工程 · GitHub · 05-23
Nemotron-Labs 扩散语言模型实现光速级文本生成产品 · HF Blog · 05-23
GitHub 连续第三年获评 Gartner® 企业 AI 编码代理魔力象限™ 领导者产品 · GitHub AI/ML · 05-23
BitCPM4-CANN-0.5B-gguf 研究 · OpenBMB · 05-22
BitCPM4-CANN-1B-gguf 研究 · OpenBMB · 05-22
BitCPM4-CANN-3B-gguf 研究 · OpenBMB · 05-22
BitCPM4-CANN-8B-gguf 研究 · OpenBMB · 05-22
TransitLM：无地图公交路线生成的大规模数据集与基准研究 · HF Papers · 05-22
Karpathy 的 CLAUDE.md 以 65 行规则将 AI 编码准确率从 65% 提升至 94% 工程 · X Trending · 05-22
微软因 token 计费成本过高取消 Claude Code 许可，Uber 四个月烧光 2026 年 AI 预算评测 · X Trending · 05-22
MagenticLite、MagenticBrain、Fara1.5：为小模型优化的智能体体验研究 · MS Research · 05-22
datasette-agent 0.1a2 工程 · Simon Willison · 05-22
datasette-agent-charts 0.1a1 工程 · Simon Willison · 05-22
datasette-agent 0.1a3 工程 · Simon Willison · 05-22
用一条 curl 命令调用 Gemini API 构建 GitHub Issue 分类 Agent 工程 · X · 05-22
Vega：AI时代数字身份的零知识证明研究 · MS Research · 05-22
增强无训练无限帧生成以实现一致长视频研究 · HF Papers · 05-21
10 tokens每秒到底有多快？工程 · Simon Willison · 05-21
transformers v5.9.0 工程 · GitHub Release · 05-20
ERNIE-Image-Aes 研究 · Baidu · 05-20
vLLM x Novita AI：PegaFlow 实现生产级外部 KV 缓存工程 · vLLM · 05-20
vLLM 中的弹性专家并行工程 · vLLM · 05-20
Google 推出 Gemini API 托管代理，支持代码执行与网页浏览产品 · X · 05-20
推出带 Modal 沙箱的 Claude 托管 Agent 产品 · Modal · 05-20
发现可对抗肝纤维化的老药新用研究 · DeepMind · 05-20
让内容创建与编辑过程更易理解产品 · DeepMind · 05-20
开辟衰老研究新路径研究 · DeepMind · 05-20
整合生物工具包，探索ALS新疗法研究 · DeepMind · 05-20
发现新型传染病背后的分子开关研究 · DeepMind · 05-20
加速发现肝病机制研究 · DeepMind · 05-20
快速追踪遗传线索逆转细胞衰老研究 · DeepMind · 05-20
OlmoEarth v1.1：更高效的模型系列产品 · HF Blog · 05-20
OlmoEarth v1.1：更高效的模型系列 | Ai2 产品 · Allen AI · 05-20
可扩展语音代理设计：Amazon Nova Sonic 的多代理、工具与会话分割工程 · AWS ML · 05-20
推出 Ettin Reranker 系列产品 · HF Blog · 05-19
AgriciDaniel/claude-obsidian 工程 · GitHub · 05-19
Import AI 457：AI 震网；诅咒的 Muon 优化器；与正向对齐研究 · Import AI · 05-19
五分钟看懂LLM过去六个月评测 · Simon Willison · 05-19
使用 LoRA/DoRA 微调 NVIDIA Cosmos Predict 2.5 生成机器人视频工程 · HF Blog · 05-19
PaddleOCR 3.5：使用 Transformers 后端运行 OCR 与文档解析任务工程 · HF Blog · 05-19
将本地 GitHub 会话带到任何地方产品 · GitHub AI/ML · 05-19
开放Agent排行榜评测 · HF Blog · 05-18
VeRL-Omni 发布：扩散与全模态模型的简易、快速、稳定 RL 训练工程 · vLLM · 05-18
BitCPM4-CANN-0.5B 工程 · OpenBMB · 05-18
BitCPM4-CANN-1B 工程 · OpenBMB · 05-18
BitCPM4-CANN-3B 工程 · OpenBMB · 05-18
BitCPM4-CANN-0.5B-未量化产品 · OpenBMB · 05-18
BitCPM4-CANN-1B-未量化产品 · OpenBMB · 05-18
BitCPM4-CANN-3B-未量化工程 · OpenBMB · 05-18
BitCPM4-CANN-8B-未量化工程 · OpenBMB · 05-18
BitCPM4-CANN-8B 研究 · OpenBMB · 05-18
CiteVQA：面向可信文档智能的证据归因基准测试研究 · HF Papers · 05-18
Imbad0202/学术研究技能工程 · GitHub · 05-18
AISI 高级 AI 评估：五月更新评测 · UK AISI · 05-17
neilsonnn/image-blaster 工程 · GitHub · 05-17
sglang v0.5.12 工程 · GitHub Release · 05-17
第四次进展报告评测 · UK AISI · 05-17
评估前沿AI系统的早期经验评测 · UK AISI · 05-16
新型评估与Agent脚手架赏金计划研究 · UK AISI · 05-16
发布 Inspect Evals 工程 · UK AISI · 05-16
datasette-llm-limits 0.1a0 工程 · Simon Willison · 05-16
iNaturalist-clumper 0.1 工程 · Simon Willison · 05-16
LLM 裁判受审：评估自动评分器的新统计框架研究 · UK AISI · 05-16
RepliBench：衡量AI系统中的自主复制能力研究 · UK AISI · 05-16
如何评估AI agent的控制措施？研究 · UK AISI · 05-16
Causal Forcing++：面向实时交互视频生成的可扩展少步自回归扩散蒸馏研究 · HF Papers · 05-16
构建通用无障碍代理——过程中的经验教训工程 · GitHub AI/ML · 05-16
vllm v0.21.0 工程 · GitHub Release · 05-15
HiBayES：用分层贝叶斯建模改进LLM评估研究 · UK AISI · 05-15
Inspect Cyber：Agentic网络评估新标准工程 · UK AISI · 05-15
esengine/DeepSeek-Reasonix 工程 · GitHub · 05-15
op7418/guizang-ppt-skill 工程 · GitHub · 05-15
Intern-S2-Preview 研究 · InternLM · 05-15
Intern-S2-Preview-FP8 研究 · InternLM · 05-15
Inspect 沙箱工具包：可扩展且安全的 AI agent 评估工程 · UK AISI · 05-15
管理日益强大的开放权重AI系统的风险研究 · UK AISI · 05-15
压力测试AI编码代理的异步监控研究 · UK AISI · 05-15
智能体异步大规模协作研究：GitHub 分支模式原型设计研究 · X · 05-15
Granite Embedding Multilingual R2：Apache 2.0 开源多语言嵌入，32K 上下文 — 最佳 Sub-100M 检索质量产品 · HF Blog · 05-15
Stream Vision Agents 与 Amazon Nova 2 Sonic 实时语音代理工程 · AWS ML · 05-15
Qwen3-TTS：低成本、高性能文本转语音工程 · Baseten · 05-15
解锁连续批处理中的异步性工程 · HF Blog · 05-15
vLLM x Mooncake 规模化服务 Agent 工作负载工程 · vLLM · 05-15
vLLM 登顶 Artificial Analysis 排行榜工程 · vLLM · 05-15
AI与工作的未来：衡量AI驱动的工作任务生产力提升研究 · UK AISI · 05-14
AI Agent 如何使用？来自 17.7 万 AI Agent 工具的证据研究 · UK AISI · 05-14
我们的2025年度回顾评测 · UK AISI · 05-14
mimalloc：面向现代的高性能可扩展内存分配器工程 · MS Research · 05-14
GridSFM：一种新型小型电网基础模型研究 · MS Research · 05-14
欢迎来到 Datasette 博客工程 · Simon Willison · 05-14
使用Inspect Scout进行转录分析的工作流工程 · UK AISI · 05-14
AI agent 能逃出沙箱吗？容器逃逸能力安全基准测试研究 · UK AISI · 05-14
使用 Amazon Nova Sonic 和 WebRTC 构建实时语音流应用工程 · AWS ML · 05-14
我们如何使用 Sourcegraph 和 Slack 机器人快速检测漏洞并响应工程 · Sourcegraph · 05-14
AIMIP 发布：AI 天气与气候模型比对项目 | Ai2 评测 · Allen AI · 05-14
红队测试Anthropic内部Agent监控系统研究 · METR · 05-13
Anthropic 风险报告（2026年2月）中“自动化研发风险”章节评述评测 · METR · 05-13
CSP 允许列表实验工程 · Simon Willison · 05-13
参数高尔夫教给我们的AI辅助研究经验产品 · OpenAI · 05-13
地牢与桌面：用 GitHub Copilot CLI 构建程序化生成 Roguelike 工程 · GitHub AI/ML · 05-12
如何实现真正的无服务器GPU 工程 · Modal · 05-12
开发者不满CapCut锁功能并训练AI，开源克隆OpenCut获4.58万星标产品 · X Trending · 05-12
开发者用22,000小时在Claude Code上构建个人AI操作系统并开源工程 · X Trending · 05-12
TanStack npm 攻击细节：攻击者通过 PR 窃取 CI 令牌植入缓存，致 84 个恶意包版本发布工程 · X Trending · 05-12
npm 供应链攻击：42 个 TanStack 包被植入死亡开关，恶意版本获有效签名研究 · X Trending · 05-12
sglang v0.5.11 工程 · GitHub Release · 05-12
transformers v5.6.2 工程 · GitHub Release · 05-12
transformers v5.8.0 工程 · GitHub Release · 05-12
transformers v5.7.0 工程 · GitHub Release · 05-12
解读今日开放-封闭性能差距研究 · Interconnects · 05-12
Import AI 455：AI系统即将开始自我构建研究 · Import AI · 05-12
SocialReasoning-Bench：衡量AI智能体是否以用户最佳利益行事研究 · MS Research · 05-12
AWS 上基础模型训练与推理的构建模块工程 · HF Blog · 05-12
vLLM 登顶 Artificial Analysis 排行榜工程 · vLLM · 05-12
MiniCPM-V-4.6-gguf 工程 · OpenBMB · 05-12
用 Amazon Nova 多模态嵌入实现制造智能工程 · AWS ML · 05-12
MiniCPM-V-4.6-Thinking-gguf 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-Thinking 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-AWQ 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-BNB 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-GPTQ 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-Thinking-AWQ 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-Thinking-GPTQ 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-Thinking-BNB 产品 · OpenBMB · 05-11
MACE-Dance：用于音乐驱动舞蹈视频生成的运动-外观级联专家研究 · HF Papers · 05-11
MachinaCheck：基于 AMD MI300X 构建 Multi-Agent CNC 可制造性系统工程 · HF Blog · 05-11
open-multi-agent/open-multi-agent 工程 · GitHub · 05-10
OncoAgent：用于隐私保护肿瘤学临床决策支持的双层 Multi-Agent 框架研究 · HF Blog · 05-10
Claude Code 团队成员分享用 HTML 替代 Markdown 的场景工程 · X · 05-09
Claude Code 源码快照泄露，展示 repo context 与 subagent 设计工程 · X · 05-09
提出两种 MCP servers 使用模式以避免 context 膨胀工程 · X · 05-09
部署并推理 HuggingFace 上的任意模型工程 · Together AI · 05-09
Harness 是一切：如何优化你的 Harness 工程 · Baseten · 05-09
用一个 Python 字典将多模态推理性能提升 >10% 工程 · Modal · 05-09
在 Modal 上构建 RL 定理证明工作流工程 · Modal · 05-09
自动扩缩 Autoresearch：在 Modal 上为你的 agents 提供弹性 GPU 工程 · Modal · 05-09
用 Modal 和 OpenAI Agents SDK 构建工程 · Modal · 05-09
Butter 加入 Modal 产品 · Modal · 05-09
如何在 AI Agents 中正确使用 MCP servers 工程 · Phil Schmid · 05-09
Agent 如何管理其他 Agent：2026 年四种 Subagent 模式工程 · Phil Schmid · 05-09
立即报名 OpenClaw: After Hours @ GitHub 产品 · GitHub AI/ML · 05-09
Agent pull request 无处不在，如何 review 它们工程 · GitHub AI/ML · 05-09
当“正确”并非确定性时验证 agentic 行为研究 · GitHub AI/ML · 05-09
面向初学者的 GitHub Copilot CLI：交互模式与非交互模式工程 · GitHub AI/ML · 05-09
提升 GitHub Agentic Workflows 中的 token 效率工程 · GitHub AI/ML · 05-09
Narcooo/inkos 工程 · GitHub · 05-09
大规模构建真实输电网数据集：基于开放数据集的流程研究 · MS Research · 05-09
CyberSecQwen-4B：为什么防御性网络安全需要小型、专用、可本地运行的模型产品 · HF Blog · 05-09
EMO：为涌现模块化预训练 Mixture of Experts | Ai2 研究 · Allen AI · 05-09
EMO：为涌现模块化预训练混合专家研究 · HF Blog · 05-09
MiniCPM-V-4_5-GPTQ 产品 · OpenBMB · 05-08
MedQA：在 AMD ROCm 上微调临床 AI，无需 CUDA 工程 · HF Blog · 05-08
Arthur-Ficial/apfel 工程 · GitHub · 05-08
holaboss-ai/holaOS 工程 · GitHub · 05-08
nidhinjs/prompt-master 工程 · GitHub · 05-08
rohitg00/从零开始的 AI 工程工程 · GitHub · 05-08
wanshuiyin/睡眠中自动 Claude Code 研究工程 · GitHub · 05-08
克服奖励信号挑战：在 SageMaker AI 上使用 GRPO 进行基于可验证奖励的强化学习工程 · AWS ML · 05-08
用 GPT-5.5 和 GPT-5.5-Cyber 扩展网络安全可信访问产品 · OpenAI · 05-08
自然语言 Autoencoders 研究 · Anthropic Research · 05-08
捐赠我们的开源对齐工具工程 · Anthropic Research · 05-08
llm-gemini 0.31 工程 · Simon Willison · 05-08
大词工程 · Simon Willison · 05-08
GitHub Repo 统计工程 · Simon Willison · 05-08
通过 API 中的新模型推进语音智能产品 · OpenAI · 05-08
AlphaEvolve：我们的 Gemini 驱动 coding agent 如何在各领域扩大影响研究 · DeepMind · 05-08
SciCore-Mol 研究 · OpenBMB · 05-07
LLM 蒸馏 Ch08 Notebook 在 GitHub 发布工程 · X · 05-07
作者以 gist 分享可由 agent 构建的 LLM wiki 想法工程 · X · 05-07
提出两种 MCP servers 使用模式以避免臃肿工程 · X · 05-07
HERMES++：迈向用于 3D 场景理解与生成的统一驾驶世界模型研究 · HF Papers · 05-07
ConardLi/garden-skills 工程 · GitHub · 05-07
EKKOLearnAI/hermes-web-ui 工程 · GitHub · 05-07
HKUDS/Vibe-Trading 工程 · GitHub · 05-07
JackChen-me/open-multi-agent 工程 · GitHub · 05-07
nesquena/hermes-webui 工程 · GitHub · 05-07
用 vLLM x Mooncake 大规模服务 Agentic 工作负载工程 · vLLM · 05-07
vLLM V0 到 V1：RL 中纠错前先确保正确性工程 · HF Blog · 05-07
Vibe coding 和 agentic engineering 比我希望的更接近了对话 · Simon Willison · 05-06
ESARBench：用于 Agentic UAV 具身搜索与救援的 Benchmark 研究 · HF Papers · 05-06
为 Open ASR Leaderboard 添加 Benchmaxxer Repellant 研究 · HF Blog · 05-06
证据链：用于迭代式 RAG 的像素级视觉归因 HF Papers · 05-06
SplAttN：用 Gaussian Soft Splatting 和 Attention 连接 2D 与 3D 以实现点云补全 HF Papers · 05-06
基于编排轨迹的 LLM multi-agent 系统强化学习 HF Papers · 05-06
超越 SFT-to-RL：通过 Black-Box On-Policy Distillation 进行多模态 RL 的预对齐 HF Papers · 05-06
llm-echo 0.5a0 工程 · Simon Willison · 05-06
datasette-llm 0.1a7 工程 · Simon Willison · 05-06
BlenderRAG：通过检索增强代码合成实现高保真 3D 对象生成 HF Papers · 05-06
GPT-5.5 Instant：更智能、更清晰、更个性化 OpenAI · 05-06
GPT-5.5 Instant 系统卡 OpenAI · 05-06
用于跨文档 RAG 的层次化摘要树 HF Papers · 05-05
用于高效自回归视频生成的运动感知缓存 HF Papers · 05-05
AcademiClaw：当学生为 AI agent 设定挑战 HF Papers · 05-05
T^2PO：用于稳定多轮 Agentic 强化学习的不确定性引导探索控制 HF Papers · 05-05
ComboStoc：用于 Diffusion 生成模型的组合随机性 HF Papers · 05-05
更好的模型，更快的训练：用于单细胞基础模型的 Sigmoid Attention HF Papers · 05-05
Web2BigTable：用于互联网规模信息搜索与抽取的双层多 agent LLM 系统 HF Papers · 05-04
UniVidX：基于 Diffusion Priors 的通用视频生成统一多模态框架 HF Papers · 05-04
Vibe 中的远程 agent，由 Mistral Medium 3.5 驱动 Mistral · 05-04
Qwen3.6-27B-FP8 产品 · Qwen · 05-03
Qwen3.6-27B 产品 · Qwen · 05-03
用于编排的开源规范：Symphony OpenAI · 05-03
Claude Code 最佳实践 - Claude Code 文档 Anthropic Engineering · 05-03
vLLM 中的 DeepSeek V4：高效长上下文 Attention vLLM · 05-03
揭秘 AI agents 的 evals Anthropic Engineering · 05-03
介绍 GPT-5.5 OpenAI · 05-03
vLLM 中 FP8 KV-Cache 与 Attention 量化的现状工程 · vLLM · 05-03
NVIDIA Nemotron 3 Nano Omni：面向文档、音频和视频 agent 的长上下文多模态智能 HF Blog · 05-03
deepseek-ai/DeepSeek-V4-Pro 产品 · DeepSeek · 05-03
vLLM 中混合 SSM 模型的分离式 Serving vLLM · 05-03
deepseek-ai/DeepSeek-V4-Flash 产品 · DeepSeek · 05-03
用 vLLM 运行基于 NVIDIA Nemotron 3 Nano Omni 的高效多模态 agentic AI vLLM · 05-03
面向 LLM 的大规模交互识别 BAIR · 05-03
Coding Agent 的组成部分 Sebastian Raschka · 05-03
SWE-Check：Bug 检测快 10 倍 Cognition · 05-03
Bugbot 学习规则与 MCP 支持 Cursor · 05-03
对agent网络进行红队测试：理解AI agent大规模交互时会出什么问题 MS Research · 05-03
iNaturalist 目击记录 Simon Willison · 05-03
FlashRT：面向 Prompt Injection 和 Knowledge Corruption 的计算与内存高效 Red-Teaming HF Papers · 05-02
从噪声偏好中学习：一种面向 Direct Preference Optimization 的半监督学习方法 HF Papers · 05-02
阿拉伯语及其方言的指令引导诗歌生成 HF Papers · 05-02
World2Minecraft：占用驱动的模拟场景构建 HF Papers · 05-01
MoCapAnything V2：面向任意骨架的端到端动作捕捉 HF Papers · 05-01
Length Value Model：面向 Token 级长度建模的可扩展 Value 预训练 HF Papers · 05-01
近期 Claude Code 质量报告更新 Anthropic Engineering · 05-01
近期三个问题的复盘 Anthropic Engineering · 05-01
Claude Developer Platform 推出高级工具使用 Anthropic Engineering · 05-01
Claude Desktop Extensions：为 Claude Desktop 一键安装 MCP server Anthropic Engineering · 05-01
用 Agent Skills 让 agent 适应真实世界 Anthropic Engineering · 05-01
用 sandboxing 让 Claude Code 更安全、更自主 Anthropic Engineering · 05-01
使用 MCP 执行代码：构建更高效的 AI agents Anthropic Engineering · 05-01
Claude Opus 4.6 在 BrowseComp 表现中的 eval awareness Anthropic Engineering · 05-01
Claude Code auto 模式：更安全地跳过权限确认 Anthropic Engineering · 05-01
RADIO-ViPE：面向动态环境中开放词汇语义 SLAM 的在线紧耦合多模态融合 HF Papers · 05-01
LLM 通过 Latent Distilling 进行探索 HF Papers · 04-30
ClawGym：用于构建有效 Claw agent 的可扩展框架 HF Papers · 04-30