全部 未讀 (12207) ★ 收藏 (0) 🤖 人工智能 (7774) 📊 商业科技 (1914) 💻 软件编程 (1214) 📁 个人成长 (761) 🎨 产品设计 (214) 📁 生活文化 (130) 📁 媒体资讯 (80) 📁 投资财经 (76) 📁 AI 产品 (39) 📁 AI (5)
篩選中: 🏷️ 数据集 共 20 篇 ✕ 清除篩選
12209
全部文章
12207
未讀
79
今日新增
0
收藏
📡 Poller 最後抓取: 1 小時前 (04-18 16:01)
BestBlogs 精選 (12188)

🏷️ 熱門標籤

AI Agent 1367 AI 智能体 737 Claude Code 655 Anthropic 647 LLM 564 AI 编程 534 OpenClaw 501 开源 444 AI 安全 408 Claude 400 AI 398 OpenAI 371 软件工程 359 开发者工具 348 生产力 308 GitHub 254 自动化 241 AI 基础设施 229 AI 开发 226 MCP 225
ACL 2026 | OPeRA Dataset: LLM 真的能模仿人类行为了吗?首次系统评估 LLM 的人类行为模拟能力
📌 一句话摘要 本文介绍了 ACL 2026 收录的 OPeRA 数据集,这是一个通过记录真实用户在线购物行为轨迹来系统评估大语言模型模拟人类决策能力的数据集与评测框架,揭示了当前 LLM 在细粒度、个性化行为预测上的显著不足。 📝 详细摘要 文章报道了 ACL 2026 会议上的一项研究,该研
📅 2026-04-17 11:03 (1 天前) 机器之心 人工智能 2 分鐘 ★ 88
LLM 人类行为模拟 评测数据集 OPeRA
ARC Prize 开源 ARC-AGI-3 人类基准数据集
📌 一句话摘要 ARC Prize 正式开源了迄今为止最全面的 ARC-AGI-3 人类基准数据集,引入了新的度量标准并改进了评分规则。 📝 详细摘要 这条推文转述了 ARC Prize 组织的一个重要动态:开源 ARC-AGI-3 人类基准数据集。该数据集是 ARC-AGI 系列中迄今为止最全
📅 2026-04-15 08:50 (3 天前) Berryxia.AI 人工智能 1 分鐘 ★ 79
ARC Prize AGI 基准测试 数据集
36.4 万超声图文对!中国团队构建首个大规模超声专属数据集,让 AI 真正读懂临床诊断语义
📌 一句话摘要 中国多机构联合团队构建了首个大规模、100% 专用于超声影像的图文数据集 US-365K,并提出了语义感知对比学习框架 Ultrasound-CLIP,旨在解决超声 AI 领域的数据稀缺和语义对齐难题,相关成果被 CVPR 2026 接收。 📝 详细摘要 本文介绍了一项由浙大城市
📅 2026-04-12 15:21 (6 天前) 西风 人工智能 2 分鐘 ★ 89
医疗AI 超声影像 多模态大模型 数据集
中国具身模型狂揽全球第一!机器人的人类数据时代来了
📌 一句话摘要 灵初智能发布首个大规模人类手部操作数据集(10 万小时)及 Psi 双系统架构,其模型 Psi-R2 在权威评测 MolmoSpace 中登顶,为具身智能的落地提供了一条基于人类数据的新路径。 📝 详细摘要 文章报道了灵初智能在具身智能领域的最新突破。该公司构建了首个可用于预训练
📅 2026-04-11 10:07 (7 天前) 鹭羽 人工智能 2 分鐘 ★ 88
具身智能 机器人 人类数据 数据集
Hugging Face CEO 分享 1.5 亿条开源智能体推理轨迹
📌 一句话摘要 Clement Delangue 重点介绍了来自 Lambda 和 Nous Research 的全新开源数据集,包含 1.5 亿个 Token 的智能体推理轨迹,旨在支持开源智能体的发展。 📝 详细摘要 这条推文推广了 AI 智能体生态系统中一项重要的开源贡献。Clement
📅 2026-04-08 01:57 (10 天前) clem 🤗 人工智能 1 分鐘 ★ 86
开源 AI 智能体 推理轨迹 Hugging Face
众包开源智能体数据集
📌 一句话摘要 Clément Delangue 呼吁社区通过分享智能体轨迹,为前沿智能体构建开源数据集。 📝 详细摘要 Hugging Face 首席执行官 Clément Delangue 指出,数据获取是开发开源智能体模型的主要瓶颈。他提出了一个社区驱动的解决方案:众包智能体轨迹。通过分享
📅 2026-04-06 23:28 (11 天前) clem 🤗 人工智能 1 分鐘 ★ 82
AI 智能体 开源 Hugging Face 数据集
Hugging Face CEO 呼吁构建众包开源智能体数据集
📌 一句话摘要 Clement Delangue 发起了一项社区行动,旨在构建最大的众包开源智能体数据集,以解决开源 AI 领域严峻的数据瓶颈问题。 📝 详细摘要 Hugging Face 首席执行官 Clement Delangue 指出,开源智能体模型目前极度缺乏数据。他以身作则,分享了自己
📅 2026-04-07 00:22 (11 天前) clem 🤗 人工智能 1 分鐘 ★ 90
HuggingFace 开源 AI 智能体 数据集
发布完整的 Arena 排行榜数据集
📌 一句话摘要 LMArena 发布了三年的历史排行榜数据作为公共数据集,旨在赋能社区研究与分析。 📝 详细摘要 LMArena 发布了一份综合数据集,涵盖了 10 个 Arena、数十个类别和数百个模型长达三年的排行榜排名。此举旨在让研究人员和社区能够对模型随时间变化的性能趋势进行深入分析。
📅 2026-04-03 04:06 (15 天前) Arena.ai 人工智能 2 分鐘 ★ 87
LMSYS 数据集 开放数据 AI 基准测试
2700GB 高质量数据,训出空间智能 SOTA,背后秘诀全栈开源
📌 一句话摘要 蚂蚁灵波开源 2.71TB 高质量空间智能数据集 LingBot-Depth-Dataset,通过 300 万对 RGB-D 数据解决机器人感知透明与反光物体的难题。 📝 详细摘要 本文介绍了蚂蚁灵波(Ant LingBot)最新开源的 LingBot-Depth-Dataset
📅 2026-03-31 13:53 (18 天前) 一凡 人工智能 1 分鐘 ★ 87
具身智能 空间智能 RGB-D 数据集 蚂蚁灵波
呼吁开源智能体轨迹数据集
📌 一句话摘要 Hugging Face CEO Clement Delangue 呼吁社区协作,共同创建更多开源的智能体轨迹数据集。 📝 详细摘要 Clement Delangue 指出了当前 AI 生态系统中的一个关键缺口:缺乏开源的智能体轨迹(agent traces)数据集。通过积极向社
📅 2026-03-27 22:00 (21 天前) clem 🤗 人工智能 1 分鐘 ★ 86
AI 智能体 开源 数据集 Hugging Face
浙大&腾讯打破图像编辑「规模-质量」魔咒:1000 万数据+统一验证框架,让开源模型追上闭源 SOTA | CVPR 2026
📌 一句话摘要 浙大与腾讯联合发布 CVPR 2026 论文,推出 1000 万样本的 UnicEdit-10M 数据集和 UnicBench 评估基准,通过「质检+改题」双系统解决开源图像编辑模型与闭源模型之间的规模-质量差距问题。 📝 详细摘要 本文介绍了浙江大学与腾讯在 CVPR 2026
📅 2026-03-20 18:12 (28 天前) AI科技评论 人工智能 8 分鐘 ★ 82
计算机视觉 图像编辑 数据集构建 CVPR 2026
Perplexity 推出“健康计算机”功能
📌 一句话摘要 Perplexity 推出“健康计算机”功能,该功能可整合来自各类应用、可穿戴设备和医疗记录的个人健康数据,助力个性化健康追踪与工具开发。 📝 详细摘要 Perplexity 首席执行官 Aravind Srinivas 宣布推出“Perplexity 健康计算机”功能。此次更新
📅 2026-03-20 02:04 (29 天前) Aravind Srinivas 人工智能 1 分鐘 ★ 82
Perplexity 健康科技 AI 可穿戴设备
大禹平台:流批一体离线 Dump 平台的设计与应用|得物技术
📌 一句话摘要 得物技术自研的大禹平台通过流批一体架构、统一 DAG 编排和 HBase 镜像表技术,解决了搜推广场景下离线 Dump 的逻辑一致性、源库压力及开发效率问题。 📝 详细摘要 文章详细介绍了得物技术构建的“大禹”离线 Dump 平台。该平台针对搜索、推荐、广告场景中多源异构数据处理
📅 2026-03-18 18:30 (03-18 18:30) 得物技术 软件编程 10 分鐘 ★ 82
流批一体 数据集成 搜索引擎 HBase
Lenny Rachitsky 开放全部 Newsletter 和播客数据,鼓励 AI 项目开发
📌 一句话摘要 知名 Newsletter 作者 Lenny Rachitsky 开放了其全部 350+ 篇 Newsletter 文章和 300+ 期播客转录数据,并以 AI 友好的 Markdown 格式提供,同时发起挑战鼓励开发者基于这些数据构建 AI 项目。 📝 详细摘要 这条推文宣布了
📅 2026-03-18 05:43 (03-18 05:43) Berryxia.AI 人工智能 5 分鐘 ★ 85
Lenny Rachitsky Newsletter 播客转录 AI 数据集
Ropedia Xperience-10M:大规模第一视角多模态具身 AI 数据集
📌 一句话摘要 Ropedia Xperience-10M,一个全新的大规模第一视角多模态数据集,已在 Hugging Face 发布,它为具身 AI、机器人学、世界模型和空间智能研究提供了 1000 万条经验数据。 📝 详细摘要 这则推文宣布了 Ropedia Xperience-10M 的发
📅 2026-03-18 00:28 (03-18 00:28) AK 人工智能 3 分鐘 ★ 83
Ropedia Xperience-10M 多模态数据集 第一视角 AI 具身 AI
托马斯·沃尔夫关注海量开源计算机使用数据集
📌 一句话摘要 Hugging Face 联合创始人托马斯·沃尔夫对一个超过 10,000 小时的开源计算机使用自动化数据集的发布表示惊叹。 📝 详细摘要 托马斯·沃尔夫重点介绍了 DevvMandal 和 Markov AI 联合发布的一项重大开源成果:全球最大的计算机使用记录数据集。该数据集
📅 2026-03-15 01:05 (03-15 01:05) Thomas Wolf 人工智能 1 分鐘 ★ 82
开源 数据集 计算机使用 AI 自动化
Hugging Face Hub 推出 Parquet 数据集编辑功能
📌 一句话摘要 Hugging Face 推出新功能,允许用户直接在 Hub 上编辑 Parquet 数据集。 📝 详细摘要 Hugging Face 首席技术官 Julien Chaumond 宣布推出一项“数据集编辑”功能,专门针对托管在 Hugging Face Hub 上的 Parque
📅 2026-03-13 19:28 (03-13 19:28) Julien Chaumond 人工智能 1 分鐘 ★ 82
Hugging Face 数据集编辑 Parquet 机器学习
技术提示词:面向全栈架构师的数据集成规划器
📌 一句话摘要 一个高度结构化的提示词,用于设计全面的数据集成计划,涵盖数据架构、API 和错误处理。 📝 详细摘要 这条推文提供了一个详细且结构化的提示词,旨在让 AI 扮演“全栈架构师”的角色。它指导 AI 创建一个完整的数据集成计划,涵盖数据模型、API 映射、认证策略、实时行为、缓存和错
📅 2026-03-13 19:07 (03-13 19:07) God of Prompt 人工智能 2 分鐘 ★ 84
提示工程 系统架构 数据集成 Web 开发
Google 宣布推出 AI 驱动的城市山洪预报系统,并开源 Groundsource 数据集
📌 一句话摘要 Google 推出了一款新的 AI 模型,用于 24 小时城市山洪预测,并开源了包含由 Gemini 识别的 260 多万个历史事件的“Groundsource”数据集。 📝 详细摘要 桑达尔·皮查伊宣布 Google 在气候 AI 计划方面取得了重大进展。该公司开发了一款专门为
📅 2026-03-13 00:51 (03-13 00:51) Sundar Pichai 人工智能 1 分鐘 ★ 88
Google AI 洪水预报 Gemini 开源数据集
QVeris:为 OpenClaw 接入万级数据源的 AI 助手工具
📌 一句话摘要 QVeris 接入 13000+ 数据源,助力 OpenClaw 升级为涵盖金融、科研等多领域的全能 AI 数字助手。 📝 详细摘要 该推文介绍了一款名为 QVeris 的工具,其核心价值在于集成了超过 13,000 个真实工具和数据源。通过与 OpenClaw 结合,用户可以利
📅 2026-03-11 17:02 (03-11 17:02) AIGCLINK 人工智能 1 分鐘 ★ 83
QVeris OpenClaw AI数字助手 数据集成